Você está na página 1de 1304

Universidade de S

ao Paulo
Instituto de Fsica
Departamento de Fsica Matematica
2005

Curso de Fsica-Matem
atica
Joao Carlos Alves Barata

Versao de 29 de setembro de 2005

Estas notas ou sua versao mais recente podem ser encontradas no seguinte endereco WWW:
http://denebola.if.usp.br/jbarata/Notas de aula

Pref
acio

15

Nota
c
ao e Advert
encias

17

Indice
I

Captulos Introdut
orios

20

1 No
co
es B
asicas

21

1.1 Conjuntos, Relacoes e Funcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

22

1.1.1

Relacoes e Funcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

1.1.2

Relacoes de Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

1.1.3

Cardinalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Infimos e Supremos de Famlias de Conjuntos . . . . . . . . . . . . . . . . . . .

37
43

1.2 Estruturas Algebricas Basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

45

1.1.4
1.2.1

Semi-grupos, Monoides e Grupos . . . . . . . . . . . . . . . . . . . . . . . . . .

46

1.2.2

Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

1.2.3

55

1.2.4

Espacos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Aneis, Algebras
e Modulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.5

Mais sobre Aneis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

1.2.6

Acoes e Representacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

1.2.7

Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Automorfismos . . . . . . . . . . . . . . . . . . . . . . . . . . . .

65

1.3 Cosets, Sub-Grupos Normais e o Grupo Quociente. O Centro de um Grupo . . . . . . .

67

56

1.3.1

Cosets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

1.3.2

Subgrupos Normais e o Grupo Quociente . . . . . . . . . . . . . . . . . . . . . .

69

1.3.3

O Centro de um Grupo. Centralizadores e Normalizadores . . . . . . . . . . . .

71

1.4 O Produto Direto e o Produto Semi-Direto de Grupos . . . . . . . . . . . . . . . . . . .

73

1.5 Somas Diretas e Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

1.5.1

Discussao Informal Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . .

76

1.5.2

Grupos Gerados por Conjuntos. Grupos Gerados por Relacoes . . . . . . . . . .

79

1.5.3

Somas Diretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

1.5.4

Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

1.5.5

Produtos Diretos e Somas Diretas Arbitrarios . . . . . . . . . . . . . . . . . . .

83

1.5.6

Modulos e Derivacoes

84

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
2

3/1304

1.6 Topicos Especiais

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

1.6.1

O Grupo de Grothendieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

1.6.2

Grupoides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

1.6.3

Quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

2 Espa
cos Vetoriais

94

2.1 Espacos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.1

Sub-Espacos e Espacos Quocientes . . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.2

Bases Algebricas de um Espaco Vetorial . . . . . . . . . . . . . . . . . . . . . .

95

2.1.3

O Dual Algebrico de um Espaco Vetorial

. . . . . . . . . . . . . . . . . . . . . 101

2.2 Formas Lineares, Sesquilineares e Produtos Escalares em Espacos Vetoriais . . . . . . . 108


2.2.1

Formas Multilineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

2.2.2

Formas Sesquilineares e as Desigualdades de Cauchy-Schwarz e Minkowski . . . 113

2.2.3

Produtos Escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

2.2.4

Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.3 Normas em Espacos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121


2.4 Formas Bilineares e Sesquilineares em Espacos de Dimensao Finita

. . . . . . . . . . . 128

2.5 Estruturas Complexas sobre Espacos Vetoriais Reais . . . . . . . . . . . . . . . . . . . . 132

II

T
opicos de Algebra
Linear

3 T
opicos de Algebra
Linear I

141
142

3.1 Rudimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143


3.2 Nocoes Basicas sobre o Espectro de uma Matriz . . . . . . . . . . . . . . . . . . . . . . 147
3.2.1

O Traco de uma Matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

3.3 Polinomios de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155


3.3.1

O Teorema de Hamilton-Cayley . . . . . . . . . . . . . . . . . . . . . . . . . . . 157

3.4 Matrizes Diagonalizaveis e o Teorema Espectral . . . . . . . . . . . . . . . . . . . . . . 162


3.4.1

Diagonalizacao Simultanea de Matrizes . . . . . . . . . . . . . . . . . . . . . . . 176

3.5 Matrizes Auto-adjuntas, Normais e Unitarias . . . . . . . . . . . . . . . . . . . . . . . . 180


3.5.1

Matrizes Positivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

3.6 Matrizes Triangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190


3.7 O Teorema de Decomposicao de Jordan e a Forma Canonica de Matrizes . . . . . . . . 191
3.7.1

Resultados Preparatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

4/1304

3.7.2

O Teorema da Decomposicao de Jordan

. . . . . . . . . . . . . . . . . . . . . . 198

3.7.3

Matrizes Nilpotentes e sua Representacao Canonica . . . . . . . . . . . . . . . . 201

3.7.4

A Forma Canonica de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . 205

3.8 Algumas Representacoes Especiais de Matrizes . . . . . . . . . . . . . . . . . . . . . . . 207


3.8.1

A Decomposicao Polar de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . 207

3.8.2

O Teorema da Triangularizacao de Schur . . . . . . . . . . . . . . . . . . . . . . 210

3.8.3

A Decomposicao QR e a Decomposicao de Iwasawa (KAN) . . . . . . . . . . 212

3.9 Propriedades Especiais de Determinantes . . . . . . . . . . . . . . . . . . . . . . . . . . 215


3.9.1

Expansao do Polinomio Caracterstico . . . . . . . . . . . . . . . . . . . . . . . 215

3.9.2

A Desigualdade de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

3.10 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

4 T
opicos de Algebra
Linear II

222

4.1 Uma Topologia Metrica em Mat ( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . 223


4.2 Exponenciais, Logaritmos e Funcoes Analticas de Matrizes . . . . . . . . . . . . . . . . 228
4.2.1

A Exponenciacao de Matrizes e os Grupos GL( , n) e GL( , n) . . . . . . . . 236




4.3 A Formula de Lie-Trotter e a Formula do Comutador . . . . . . . . . . . . . . . . . . . 239


4.4 Aplicacoes Lineares em Mat ( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
4.5 A Formula de Baker, Campbell e Hausdorff . . . . . . . . . . . . . . . . . . . . . . . . 248
4.6 A Formula de Duhamel e Algumas de suas Conseq
uencias . . . . . . . . . . . . . . . . 254

III

Equa
co
es Diferenciais

259

5 Equa
co
es Diferenciais Ordin
arias. Uma Introdu
c
ao

260

5.1 Definicao e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261


5.1.1

Equacoes Diferenciais Ordinarias Lineares . . . . . . . . . . . . . . . . . . . . . 263

5.1.2

Equacoes Ordinarias de Segunda Ordem. Exemplos de Interesse . . . . . . . . . 267

5.2 Sistemas de Equacoes Diferenciais Ordinarias

. . . . . . . . . . . . . . . . . . . . . . . 269

5.3 Discussao sobre Problemas de Valor Inicial . . . . . . . . . . . . . . . . . . . . . . . . . 274


5.3.1

Problemas de Valor Inicial. Patologias e Exemplos a se Ter em Mente . . . . . . 276

5.3.2

Teoremas de Existencia e Unicidade de Solucoes . . . . . . . . . . . . . . . . . . 280

5.3.3

Solucoes Globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

5.3.4

Dependencia Contnua de Condicoes Iniciais e de Parametros . . . . . . . . . . . 284

5/1304

6 Alguns M
etodos de Resolu
c
ao de Equa
co
es Diferenciais Ordin
arias

286

6.1 Solucao de Equacoes Ordinarias Lineares de Primeira Ordem . . . . . . . . . . . . . . . 286


6.2 As Equacoes de Bernoulli e de Riccati . . . . . . . . . . . . . . . . . . . . . . . . . . . . 287
6.3 Integracao de Equacoes Separaveis

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . 290

6.4 O Metodo de Variacao de Constantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291


6.5 O Metodo de Substituicao de Pr
ufer . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
6.6 O Metodo de Inversao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
6.7 Solucao de Equacoes Exatas e o Metodo dos Fatores Integrantes . . . . . . . . . . . . . 296
6.8 Solucoes das Equacoes de DAlembert-Lagrange e Clairaut . . . . . . . . . . . . . . . . 301
7 Sistemas de Equa
co
es Diferenciais Ordin
arias Lineares

306

7.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307


7.2 Unicidade e Existencia de Solucoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308
7.2.1

Unicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

7.2.2

Existencia. A Serie de Dyson . . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

7.2.3

Propriedades de D(s, t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

7.3 Equacoes com Coeficientes Constantes . . . . . . . . . . . . . . . . . . . . . . . . . . . 320


7.3.1

Alguns Exemplos e Aplicacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . 322

7.4 Teoria de Perturbacoes de Sistemas Lineares . . . . . . . . . . . . . . . . . . . . . . . . 327


7.5 Mais sobre a Serie de Dyson. Produtos de Tempo Ordenado . . . . . . . . . . . . . . . 330
7.6 Sistemas de Equacoes Diferenciais Lineares no Plano Complexo . . . . . . . . . . . . . 333
7.6.1

O Caso Analtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334

7.6.2

Resolucao por Series de Potencias . . . . . . . . . . . . . . . . . . . . . . . . . . 340

7.6.3

Sistemas com Pontos Singulares. Monodromia . . . . . . . . . . . . . . . . . . . 342

7.6.4

Sistemas com Pontos Singulares Simples . . . . . . . . . . . . . . . . . . . . . . 352

7.7 Sistemas Provenientes de EDOs de Ordem m . . . . . . . . . . . . . . . . . . . . . . . . 357


7.7.1

Pontos Singulares Simples em EDOs de Ordem m . . . . . . . . . . . . . . . . . 358

7.7.2

Singularidades no Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

7.7.3

Alguns Exemplos de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . . 364

7.8 Equacoes Fuchsianas. Smbolos de Riemann . . . . . . . . . . . . . . . . . . . . . . . . 370


7.8.1

Equacoes Fuchsianas de Primeira Ordem . . . . . . . . . . . . . . . . . . . . . . 370

7.8.2

Equacoes Fuchsianas de Segunda Ordem . . . . . . . . . . . . . . . . . . . . . . 375

7.8.3

Smbolos de Riemann. Simetrias de Equacoes Fuchsianas de Segunda Ordem . . 382

7.9 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

6/1304

8 Solu
co
es de Equa
co
es Diferenciais Ordin
arias Lineares no Plano Complexo

394

8.1 Solucoes em Series de Potencias para Equacoes Regulares . . . . . . . . . . . . . . . . . 395


8.1.1

A Equacao do Oscilador Harmonico Simples . . . . . . . . . . . . . . . . . . . . 396

8.1.2

A Equacao de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

8.1.3

A Equacao de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

8.1.4

A Equacao de Airy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404

8.1.5

A Equacao de Chebyshev

8.1.6

O Caso de Equacoes Regulares Gerais . . . . . . . . . . . . . . . . . . . . . . . . 409

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406

8.2 Solucao de Equacoes Singulares Regulares. O Metodo de Frobenius . . . . . . . . . . . 411


8.2.1

Equacoes Singulares Regulares. O Caso Geral . . . . . . . . . . . . . . . . . . . 415

8.2.2

A Equacao de Euler Revisitada . . . . . . . . . . . . . . . . . . . . . . . . . . . 424

8.2.3

A Equacao de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427

8.2.4

Equacoes Relacionadas a` de Bessel. A Equacao de Bessel Esferica . . . . . . . . 438

8.2.5

A Equacao de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

8.2.6

A Equacao Hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443

8.2.7

A Equacao Hipergeometrica Confluente . . . . . . . . . . . . . . . . . . . . . . . 447

8.3 Algumas Equacoes Associadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 450


8.3.1

A Equacao de Legendre Associada

. . . . . . . . . . . . . . . . . . . . . . . . . 450

8.3.2

A Equacao de Laguerre Associada . . . . . . . . . . . . . . . . . . . . . . . . . . 452

8.4 A Funcao Gama. Definicao e Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . 453


8.A Prova da Proposicao 8.1. Justificando os Polinomios de Legendre

. . . . . . . . . . . . 470

8.B Provando (8.14) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472


8.C Justificando os Polinomios de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . 474
8.D Provando (8.20) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476
8.E Porque deve ser um Inteiro Positivo na Equacao de Laguerre . . . . . . . . . . . . . . 477
8.6 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480
9 Propriedades de Algumas Fun
co
es Especiais

483

9.1 Discussao Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483


9.1.1

Definicoes e Consideracoes Preliminares . . . . . . . . . . . . . . . . . . . . . . . 484

9.1.2

Relacoes de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486

9.1.3

Formulas de Rodrigues . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488

9.1.4

Funcoes Geratrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491

9.2 Propriedades de Algumas Funcoes Especiais . . . . . . . . . . . . . . . . . . . . . . . . 495

7/1304

9.2.1

Propriedades dos Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . . . 495

9.2.2

Propriedades dos Polinomios de Legendre Associados. Harmonicos Esfericos . . 501

9.2.3

Propriedades dos Polinomios de Hermite . . . . . . . . . . . . . . . . . . . . . . 511

9.2.4

Propriedades dos Polinomios de Laguerre . . . . . . . . . . . . . . . . . . . . . . 515

9.2.5

Propriedades dos Polinomios de Laguerre Associados . . . . . . . . . . . . . . . 519

9.2.6

Propriedades das Funcoes de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . 522

9.2.7

Propriedades das Funcoes de Bessel Esfericas . . . . . . . . . . . . . . . . . . . . 537

9.A Provando (9.44) a` Forca Bruta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 541


9.2 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543
10 Alguns Problemas Selecionados de Interesse Fsico

544

10.1 As Equacoes de Helmholtz e de Laplace . . . . . . . . . . . . . . . . . . . . . . . . . . . 544


10.1.1 Problemas em Duas Dimensoes em Coordenadas Polares . . . . . . . . . . . . . 546
10.1.2 Problemas em Tres Dimensoes em Coordenadas Esfericas . . . . . . . . . . . . . 549
10.2 O Problema da Corda Vibrante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
10.2.1 Corda Vibrante Homogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
10.2.2 O Problema da Corda Homogenea Pendurada . . . . . . . . . . . . . . . . . . . 556
10.2.3 Corda Vibrante Nao-Homogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . 560
10.3 O Problema da Membrana Circular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 564
10.4 O Oscilador Harmonico na Mecanica Quantica e a Equacao de Hermite . . . . . . . . . 567

10.5 O Atomo
de Hidrogenio e a Equacao de Laguerre Associada . . . . . . . . . . . . . . . 568
10.6 Propagacao de Ondas em Tanques Cilndricos . . . . . . . . . . . . . . . . . . . . . . . 571
10.7 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582
11 Rudimentos da Teoria das Equa
co
es Diferenciais Parciais

586

11.1 Definicao e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 586


11.2 O Metodo de Separacao de Variaveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 587
11.3 Unicidade de Solucoes de Equacoes Diferenciais Parciais

. . . . . . . . . . . . . . . . . 590

11.3.1 Casos Simples. Discussao Preliminar . . . . . . . . . . . . . . . . . . . . . . . . 590


11.3.2 Unicidade de Solucoes. Generalizacoes . . . . . . . . . . . . . . . . . . . . . . . 597
12 Introdu
c
ao ao Problema de Sturm-Liouville

606

12.1 Introducao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607


12.2 O Problema de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611

8/1304

12.2.1 Resolvendo o Problema de Sturm. A Funcao de Green . . . . . . . . . . . . . . 612


12.2.2 O Teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615
12.3 O Problema de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 617
12.4 Propriedades Basicas dos Autovalores e das Autofuncoes de Problemas de Sturm-Liouville619
12.4.1 Realidade dos Autovalores. Ortogonalidade de Autofuncoes . . . . . . . . . . . . 619
12.4.2 A Simplicidade dos Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . . 622
12.4.3 Condicoes Suficientes para a Positividade dos Autovalores . . . . . . . . . . . . 623
12.5 A Equacao Integral de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627
12.6 Uma Aplicacao do Problema de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . 630
12.7 O Metodo dos Determinantes de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . . 634
12.7.1 A Equacao Integral de Fredholm Linear Nao-Homogenea . . . . . . . . . . . . . 634
12.7.2 A Equacao Integral de Fredholm Linear Homogenea . . . . . . . . . . . . . . . . 638
12.8 Comentarios Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 640
12.8.1 O Problema de Sturm-Liouville Singular . . . . . . . . . . . . . . . . . . . . . . 640
12.A Prova do Teorema 12.1. Existencia e Unicidade . . . . . . . . . . . . . . . . . . . . . . 643
12.B Prova da Proposicao 12.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644
12.C Comentario Sobre o Determinante Wronskiano . . . . . . . . . . . . . . . . . . . . . . . 646
12.D Ausencia de Autovalores em um Problema Singular . . . . . . . . . . . . . . . . . . . . 647
12.E Demonstracao do Teorema 12.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 648
12.F Prova da Desigualdade (12.E.22) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 652
12.G Obtendo os Determinantes de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . . . . 654
12.8 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661

IV

Grupos

665

13 Grupos. Alguns Exemplos

666

13.1 O Grupo de Permutacoes

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 667

13.1.1 Ciclos, Transposicoes e Transposicoes Elementares . . . . . . . . . . . . . . . . . 668


13.2 Alguns Grupos Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673
13.2.1 Os Grupos GL(n) e SL(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673
13.2.2 O Grupo de Borel e o Grupo de Heisenberg . . . . . . . . . . . . . . . . . . . . 676
13.2.3 Grupos Associados a Formas Bilineares e Sesquilineares . . . . . . . . . . . . . . 682
13.2.4 Os Grupos Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684

9/1304

13.2.5 Os Grupos Unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685


13.3 Os Grupos SO(2), SO(3), SU(2) e SL( , 2)

. . . . . . . . . . . . . . . . . . . . . . . . 686

13.3.1 Os Grupos SO(2), O(2), SO(1, 1) e O(1, 1) . . . . . . . . . . . . . . . . . . . . . 686


13.3.2 O Grupo SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 690
13.3.3 O Grupo SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698
13.3.4 A Relacao entre SO(3) e SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . 701
13.3.5 O Grupo SL( , 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 704
13.4 Generalidades sobre os grupos SU(n) e SO(n) . . . . . . . . . . . . . . . . . . . . . . . 705
13.4.1 Os Grupos SU(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 706
13.4.2 O Grupo SU(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709
13.4.3 Os Grupos SO(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 710
13.5 O Grupo Afim e o Grupo Euclidiano . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715
13.6 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 719
13.6.1 O Espaco-Tempo, a Nocao de Intervalo e a Estrutura Causal . . . . . . . . . . . 720
13.6.2 A Invariancia do Intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 726
13.6.3 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729
13.6.4 Alguns Sub-Grupos do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . 730
13.6.5 A Estrutura do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . 734
13.6.6 Os Geradores do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . 738
13.7 O Grupo de Poincare . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 742
13.8 SL( , 2) e o Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 745
13.A Prova do Teorema 13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 754
13.B Um Isomorfismo entre SL( , 2)/{ , } e L+ . . . . . . . . . . . . . . . . . . . . . . . 764

14 Grupos de Lie e Algebras


de Lie. Uma Breve Introdu
c
ao

772

14.1 Variedades e Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 773


14.2 Breves Consideracoes sobre Grupos Topologicos . . . . . . . . . . . . . . . . . . . . . . 775
14.3 Grupos de Lie Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 778
14.3.1 Uma Topologia Metrica em GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . 778
14.3.2 O Grupo de Lie GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779
14.3.3 Sub-Grupos Uniparametricos e seus Geradores . . . . . . . . . . . . . . . . . . . 782

14.3.4 Sub-Grupos Uniparametricos e Algebras


de Lie . . . . . . . . . . . . . . . . . . 785
14.3.5 Subgrupos Fechados de GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . 790

14.4 A Relacao entre Grupos de Lie Matriciais e suas Algebras


de Lie . . . . . . . . . . . . . 794

10/1304

14.4.1 Algebras
de Lie Nilpotentes, Sol
uveis, Simples e Semi-Simples . . . . . . . . . . 795

14.4.2 Questoes sobre a Exponenciacao de Algebras


de Lie . . . . . . . . . . . . . . . . 799
14.4.3 Alguns Exemplos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802
15 Uma Breve Introdu
c
ao `
a Teoria das Representa
co
es de Grupos

808

15.1 Representacoes de Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 808


15.2 Representacoes Irredutveis de SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 815
15.3 A Medida de Haar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819
15.4 Representacoes de Grupos Compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 821
15.5 O Teorema de Peter-Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822

Topologia Geral, Teoria da Medida e Integra


c
ao

16 Espa
cos M
etricos

828
829

16.1 Metricas e Espacos Metricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 831


16.2 Topologia de Espacos Metricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 845
16.3 Pseudo-Metricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 848
16.4 Espacos de Banach e de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 850
16.4.1 Espacos de Seq
uencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852
16.A Algumas Desigualdades Basicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 866
16.B N
umeros reais e p-adicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 868
16.C Aproximacoes para . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875
17 O Teorema do Ponto Fixo de Banach e Algumas de Suas Conseq
u
encias

881

17.1 O Teorema de Ponto Fixo de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . 882


17.1.1 Aplicacao a Equacoes Numericas. O Metodo de Newton . . . . . . . . . . . . . 884
17.1.2 Uma Generalizacao do Teorema de Ponto Fixo de Banach . . . . . . . . . . . . 888
17.2 As Equacoes Integrais de Fredholm e de Volterra

. . . . . . . . . . . . . . . . . . . . . 889

17.3 Aplicacoes a` Teoria das Equacoes Diferenciais Ordinarias . . . . . . . . . . . . . . . . . 897


17.3.1 O Teorema de Picard-Lindelof . . . . . . . . . . . . . . . . . . . . . . . . . . . . 897
17.3.2 Generalizando o Teorema de Picard-Lindelof. Solucoes Globais . . . . . . . . . . 902
17.3.3 Um Teorema de Comparacao de Solucoes de EDOs . . . . . . . . . . . . . . . . 903
17.4 O Teorema da Funcao Implcita e o Teorema da Funcao Inversa . . . . . . . . . . . . . 907
17.4.1 O Teorema da Funcao Implcita . . . . . . . . . . . . . . . . . . . . . . . . . . . 907

11/1304

17.4.2 O Teorema da Funcao Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 912


17.A O Lema de Gronwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913
18 Espa
cos Topol
ogicos e Espa
cos Mensur
aveis. Defini
co
es e Propriedades B
asicas

914

18.1 Definicoes, Propriedades Elementares e Exemplos . . . . . . . . . . . . . . . . . . . . . 915


18.2 Algumas Construcoes Especiais e Exemplos

. . . . . . . . . . . . . . . . . . . . . . . . 920

18.2.1 Topologias e -algebras Geradas . . . . . . . . . . . . . . . . . . . . . . . . . . . 920


18.2.2 Bases de Espacos Topologicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 924
18.2.3 Topologias e -algebras Induzidas . . . . . . . . . . . . . . . . . . . . . . . . . . 930
18.2.4 Topologias e -algebras Produto . . . . . . . . . . . . . . . . . . . . . . . . . . . 932
18.3 Interior e Fecho de Conjuntos em Espacos Topologicos . . . . . . . . . . . . . . . . . . 932
18.3.1 Fecho de Conjuntos em Espacos Metricos . . . . . . . . . . . . . . . . . . . . . . 936
19 Medidas

938

19.1 O Problema da Teoria da Medida . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 938


19.2 Medidas de Conjuntos. Definicao, Exemplos e Propriedades Basicas . . . . . . . . . . . 941
19.3 Construindo Medidas. A Medida Exterior e o Teorema de Caratheodory . . . . . . . . 945
20 A Medida de Lebesgue

954

20.1 A Construcao da Medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . 954


20.1.1 A -algebra de Borel em


e a Medida de Borel-Lebesgue . . . . . . . . . . . . 957

20.1.2 A Medida Produto e a Medida de Lebesgue em

n


. . . . . . . . . . . . . . . . 960

20.2 Conjuntos de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 961


20.3 Bases de Hamel e a Medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . 973
21 Converg
encia, Pontos Limite e Pontos de Acumula
c
ao em Espa
cos Topol
ogicos

978

21.1 Primeiras Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 978


21.2 Espacos Hausdorff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 980
21.3 O Limite do Infimo e o Limite do Supremo . . . . . . . . . . . . . . . . . . . . . . . . . 981
21.4 Redes e o Caso de Espacos Topologicos Gerais . . . . . . . . . . . . . . . . . . . . . . . 986
21.4.1 Redes em Espacos Metricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 988
22 Continuidade de Fun
co
es em Espa
cos Topol
ogicos

990

22.1 Funcoes Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 990


22.2 Outras Caracterizacoes do Conceito de Continuidade em Espacos Topologicos . . . . . . 993

12/1304

22.2.1 Continuidade e Convergencia

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 994

23 Elementos da Teoria da Integra


c
ao

997

23.1 Comentarios Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 998


23.2 A Integracao no Sentido de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1000
23.2.1 A Integral de Riemann Impropria . . . . . . . . . . . . . . . . . . . . . . . . . . 1009
23.2.2 Diferenciacao e Integracao em Espacos de Banach . . . . . . . . . . . . . . . . . 1011
23.3 A Integracao no Sentido de Lebesgue . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1016
23.3.1 Funcoes Mensuraveis e Funcoes Simples . . . . . . . . . . . . . . . . . . . . . . . 1017
23.3.2 A Integral de Lebesgue. Integracao em Espacos Mensuraveis . . . . . . . . . . . 1023
23.3.3 A Integral de Lebesgue e sua Relacao com a de Riemann . . . . . . . . . . . . . 1032
23.3.4 Teoremas Basicos sobre Integracao e Convergencia . . . . . . . . . . . . . . . . . 1035
23.3.5 Alguns Resultados de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . 1038
23.4 Os Espacos Lp e Lp . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1040
23.4.1 As Desigualdades de Holder e de Minkowski . . . . . . . . . . . . . . . . . . . . 1043
23.4.2 O Teorema de Riesz-Fischer. Completeza . . . . . . . . . . . . . . . . . . . . . . 1047
23.A Demonstracao da Proposicao 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1048
23.B Caracterizacoes e Propriedades de Funcoes Mensuraveis . . . . . . . . . . . . . . . . . . 1049
23.C Prova do Lema 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055
23.D Demonstracao de (23.22) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1056
23.E A Equivalencia das Definicoes (23.23) e (23.24)

. . . . . . . . . . . . . . . . . . . . . . 1057

23.F Prova do Teorema da Convergencia Monotona . . . . . . . . . . . . . . . . . . . . . . . 1059


23.G Prova do Lema de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1060
23.H Prova do Teorema da Convergencia Dominada . . . . . . . . . . . . . . . . . . . . . . . 1061
23.I Prova dos Teoremas 23.2 e 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1062
23.J Prova das Desigualdades de Holder e Minkowski . . . . . . . . . . . . . . . . . . . . . . 1065
23.K Prova do Teorema de Riesz-Fischer . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1067
24 Alguns T
opicos Especiais em Topologia e An
alise

1070

24.1 Uma Coletanea de Definicoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1070


24.2 A Nocao de Topologia Fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1076
24.3 A Topologia Produto de Espacos Topologicos

. . . . . . . . . . . . . . . . . . . . . . . 1077

24.4 O Teorema da Categoria de Baire . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1079


24.5 Aproximacao de Funcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1080

13/1304

24.5.1 Aproximacao de Funcoes Contnuas por Polinomios . . . . . . . . . . . . . . . . 1080

VI

An
alise Funcional

1087

25 No
co
es B
asicas Sobre Espa
cos de Hilbert

1088

25.1 Aspectos Topologicos Basicos de Espacos de Hilbert . . . . . . . . . . . . . . . . . . . . 1088


25.2 Aspectos Geometricos Basicos de Espacos de Hilbert . . . . . . . . . . . . . . . . . . . 1090
25.2.1 Bases Ortonormais Completas em Espacos de Hilbert . . . . . . . . . . . . . . . 1095
25.3 Funcionais Lineares e o Dual Topologico de um Espaco de Hilbert . . . . . . . . . . . . 1109
25.3.1 O Teorema da Representacao de Riesz . . . . . . . . . . . . . . . . . . . . . . . 1110
26 Operadores Lineares Limitados em Espa
cos de Banach e de Hilbert

1113

26.1 Operadores Lineares em Espacos Vetoriais Normados . . . . . . . . . . . . . . . . . . . 1115


26.1.1 Espacos de Banach de Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . 1119
26.1.2 O Dual Topologico de um Espaco de Banach . . . . . . . . . . . . . . . . . . . . 1123
26.1.3 O Teorema de Hahn-Banach e Algumas Conseq
uencias do Mesmo . . . . . . . . 1127
26.1.4 O Teorema de Banach-Steinhaus ou Princpio de Limitacao Uniforme . . . . . . 1133
26.1.5 O Teorema da Aplicacao Aberta e o Teorema do Grafico Fechado . . . . . . . . 1134
26.2 Operadores Limitados em Espacos de Hilbert

. . . . . . . . . . . . . . . . . . . . . . . 1142

26.2.1 O Adjunto de um Operador em um Espaco de Hilbert . . . . . . . . . . . . . . . 1144

26.3 Algebras
de Banach e Algebras
C . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1152

26.3.1 Algebras
de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1152
26.3.2 A Inversa de Operadores Limitados . . . . . . . . . . . .

26.3.3 O Espectro de Operadores em Algebras


de Banach . . .

26.3.4 O Homomorfismo de Gelfand em Algebras


C . . . . . .

26.3.5 Razes Quadradas de Operadores em Algebras


de Banach

. . . . . . . . . . . . . 1155
. . . . . . . . . . . . . 1161
. . . . . . . . . . . . . 1171
. . . . . . . . . . . . . 1174

26.3.6 Elementos Positivos de Algebras


C . . . . . . . . . . . . . . . . . . . . . . . . . 1175
26.3.7 O Lema da Raiz Quadrada em espacos de Hilbert. A Decomposicao Polar . . . 1179

26.4 Um Pouco sobre Estados e Representacoes de Algebras


C . . . . . . . . . . . . . . . . 1183
26.5 O Espectro de Operadores em Espacos de Banach . . . . . . . . . . . . . . . . . . . . . 1193
26.6 Operadores Compactos em Espacos de Banach e de Hilbert . . . . . . . . . . . . . . . . 1202
26.6.1 O Teorema Espectral para Operadores Compactos Auto-adjuntos . . . . . . . . 1215
26.7 O Teorema Espectral para Operadores Limitados Auto-adjuntos em Espacos de Hilbert 1223
26.7.1 O Calculo Funcional Contnuo e o Homomorfismo de Gelfand

. . . . . . . . . . 1223

14/1304

26.7.2 Generalizando o Calculo Funcional Contnuo. As Medidas Espectrais . . . . . . 1225


26.7.3 Medidas com Valores em Projecoes Ortogonais . . . . . . . . . . . . . . . . . . . 1235
26.7.4 Os Projetores Espectrais e o Teorema Espectral . . . . . . . . . . . . . . . . . . 1240
26.7.5 A Relevancia do Teorema Espectral para a Fsica Quantica (um pouco de Fsica,
finalmente) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1244
26.A Prova do Teorema 26.18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1253
27 No
co
es de Estruturas Alg
ebricas
1257

27.1 Algebras
Universais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1258

27.2 Acao de Uma Algebra


Universal sobre uma Outra Algebra
Universal (*) . . . . . . . . 1265

28 O Limite Indutivo de Algebras

1270

15/1304

Pref
acio
intencao basica destas Notas e fornecer a estudantes de Fsica nocoes matematicas importantes para uma melhor compreensao de desenvolvimentos modernos da Fsica Teorica e da
Matematica.
De modo geral o texto e de leitura auto-suficiente, mas vez por outra algum estudo complementar
e sugerido. Estas Notas, porem, nao sao substituto a` leitura dos bons livros sobre os assuntos aqui
tratados. Entretanto, procuramos apresentar (muitas vezes em exerccios!) o maior n
umero possvel
de exemplos e contra-exemplos para as varias situacoes tratadas de modo a motivar melhor definicoes
e resultados, o que e menos comum em textos com tratamentos mais sistematicos. Parte do material
pode ser encontrada em diversas fontes, citadas na bibliografia, mas a apresentacao e sua ordem sao
proprias. Ha tambem nestas Notas demonstracoes do proprio autor de resultados conhecidos que sao,
por alguma razao, dificilmente encontradas na literatura.
Fazemos notar que estas notas estao ainda sendo trabalhadas e alguns captulos e secoes podem
vir a ser alterados, corrigidos ou acrescidos de material. Alem disso, novos captulos serao escritos. O
material ja presente e, porem, u
til a todos aqueles que queiram iniciar-se nos assuntos aqui expostos.
Versoes atualizadas serao colocadas na rede (no endereco acima indicado) sempre que possvel.
O autor agradece a todos os que apresentarem sugestoes. Fabulosas somas em dinheiro sao oferecidas a todos aqueles que encontrarem erros no texto. Entre os ja aquinhoados encontram-se os Srs.
Matheus Grasselli, Alexandre T. Baraviera, Marcos V. Travaglia, Daniel Augusto Cortez, Djogo F. C.
Patrao, Cleber de Mico Muramoto, Kati
uscia Nadyne Cassemiro, Urbano Lopes Franca Junior, Gustavo Barbagallo de Oliveira, Priscila Vieira Franco Gondeck, Darielder Jesus Ribeiro, Daniel Augusto
Turolla Vanzella, Leonardo Fernandes Dias da Motta, Krishnamurti Jose de Andrade, Pedro Tavares
Paes Lopes, Diego Cortegoso Assencio, Fleury Jose de Oliveira Filho, Paulo Henrique Reimberg, Fabola
Diacenco Xavier e Marcio Andre Prieto Aparcio Lopez aos quais somos muito gratos por correcoes e
sugestoes.
As Secoes 13.B, pagina 764, e 17.3.1, pagina 897, foram originalmente escritas por Daniel Augusto
Cortez. A Secao 10.6, pagina 571, foi originalmente escrita por Andre M. Timpanaro, Fleury J. Oliveira
e Paulo H. Reimberg. A eles dedicamos agradecimentos especiais.

Joao Carlos Alves Barata

Sao Paulo, 29 de setembro de 2005.


Departamento de Fsica Matematica do IFUSP

16/1304

O comportamento de um fsico em relaca


o a
` Matem
atica e similar a de um ladr
ao inteligente em
relaca
o ao c
odigo penal: ele estuda apenas o suficiente para evitar punico
es.
I. M. Gelfand (1913-).

A mente n
ao e um vaso a ser repleto, mas uma tocha a ser acesa.
Plutarco (46?-120).

Talvez eu n
ao tenha tido exito em fazer as coisas difceis tornarem-se f
aceis, mas pelo menos eu nunca
fiz um assunto f
acil tornar-se difcil.
F. G. Tricomi (1897-1978).

In science, self-satisfaction is death. Personal self-satisfaction is the death of the scientist. Collective
self-satisfaction is the death of the research. It is restlessness, anxiety, dissatisfaction, agony of mind
that nourish science.
Jacques Lucien Monod (1910-1976), in New Scientist, 1976.

N
ao existe nenhuma categoria da Ciencia a
` qual se possa dar o nome de Ciencia Aplicada. O que
existe s
ao a Ciencia e as aplicaco
es da Ciencia, intimamente ligadas, como frutos a
` a
rvore que os
gerou.
Louis Pasteur (1822-1895), in Pourquoi la France na pas trouve dhommes superieurs au moment du
peril, Revue Scientifique (Paris, 1871).

17/1304

Notac
ao e Advert
encias
Para facilitar a consulta e a leitura, listamos aqui sem muitos comentarios um pouco da notacao
que empregaremos nestas Notas.
Se z e um n
umero complexo denotaremos seu complexo conjugado por z. A notacao z (mais
comum em textos de Fsica) pode ocorrer mais raramente.
O smbolo A := B ou B =: A denota que A e definido pela expressao B. O smbolo A B indica
que A e B sao duas notacoes distintas para o mesmo objeto.
Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) sao vetores reais com n componentes (ou seja, elementos
de n ) entao definimos
hx, yi := x1 y1 + + xn yn .


Trata-se do produto escalar usual em

Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) sao vetores complexos com n componentes (ou seja,


elementos de n ) entao definimos
hx, yi

:= x1 y1 + + xn yn .


Trata-se do produto escalar usual em

Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ) sao vetores complexos com n componentes (ou seja,


elementos de n ) entao definimos
hx, yi
Trata-se de uma forma bilinear em

:= x1 y1 + + xn yn .

Mat( , n) ou Mat(n, ) designa o conjunto de todas as matrizes reais n n. Mat( , n) ou


Mat(n, ) designa o conjunto de todas as matrizes complexas n n.


T
Se A e um elemento de Mat( , n) ou de Mat( , n), ent
ao A designa a matriz transposta de
T
A, ou seja, a matriz cujos elementos de matriz ij sao A ij = Aji .


Se A e um operador linear em um espaco vetorial complexo (com um certo produto escalar),


seu adjunto e denotado por A . Em textos de Fsica e mais comum denota-lo por A , mas nao
usaremos isso aqui.
Assim, se A Mat( , n), entao A sera a adjunta de A (em relacao ao produto escalar usual,
acima). O elemento de matriz ij de A sera (A )ij = Aji .

Denotaremos o operador identidade agindo em um espaco vetorial (a matriz identidade, agindo


em um espaco vetorial de dimensao finita) pelo smbolo . Esse smbolo tambem representara a
unidade de uma algebra.

18/1304

Designaremos um produto escalar entre dois vetores u e v sempre por hu, vi e nunca por (u, v),
para nao causar confusao com a notacao para par ordenado. Outra notacao possvel e aquela
empregada freq
uentemente em textos de Mecanica Quantica: hu | vi, mas faremos raramente uso
dessa notacao.
Ainda sobre produtos escalares, seguiremos sempre a convencao dos textos de Fsica: um produto
escalar em um espaco vetorial sobre os complexos e linear em relacao ao segundo argumento e
antilinear em relacao ao primeiro. Assim, se e sao n
umeros complexos, teremos hu, vi =
hu, vi. Textos de Matematica adotam por vezes a convencao oposta (ou mesmo ambas!).
Sobre o emprego das palavras funca
o, aplicaca
o, mapeamento, mapa, funcional, operador, operaca
o,
produto e forma, que por vezes causam perplexidade em estudantes, remetemos ao comentario a`
pagina 23.
Dado um conjunto X 6= , denota-se por (X) a colecao de todos os sub-conjuntos de X.
e denominado o conjunto das partes de X.
A topologia usual da reta real
A -algebra de Borel de

(X)

sera denotada aqui por .




sera (quase sempre) denotada aqui por M[ ].




A -algebra dos sub-conjuntos de


aqui por ML .


mensuraveis por Lebesgue sera (quase sempre) denotada

Para x , o smbolo bxc designa o maior inteiro menor ou igual a x. O smbolo dxe designa o
menor inteiro maior ou igual a x.


Ha ainda nestas Notas um problema nao totalmente sanado quando ao conjunto dos n
umeros
naturais . Em algumas secoes adotou-se 0 , ou seja,
= {0, 1, 2, 3, . . .} em outras,
adotou-se 0 6 , ou seja, = {1, 2, 3, . . .}. Esperamos que isso seja definitivamente corrigido
futuramente. Por ora, pedimos atencao ao leitor.


O smbolo 2 indica o fim de um enunciado. O smbolo indica o fim de uma demonstracao. O


smbolo 6 indica o fim do enunciado de um exerccio. O smbolo indica o fim do enunciado de
um exemplo.
B(X) designa o conjunto de operadores limitados agindo em um espaco de Banach X. B(H)
designa o conjunto de operadores limitados agindo em um espaco de Hilbert H.
C(L) designa o conjunto de todas as funcoes contnuas (reais ou complexas, dependendo do caso),
definidas em L (na topologia que se estiver considerando em L).
B(L) designa a colecao de todos os conjuntos Borelianos de L (em relacao a` topologia que se
estiver considerando em L). Bl (L) designa a colecao de todas as funcoes Borelianas (reais ou
complexas, dependendo do caso), definidas em L.
O domnio de um operador T (agindo em um espaco de Banach ou de Hilbert) sera denotado
por D(T ) ou por Dom(T ). A imagem (range) de T sera denotada por R(T ) ou por Ran (T )
ou, mais raramente, por Im (T ), mas essa u
ltima notacao pode causar confusao com a da parte

19/1304

imaginaria de um n
umero complexo ou mesmo com a da parte imaginaria de um operador agindo
em um espaco de Hilbert: Im (T ) := 2i1 (T T ).
As nocoes de propriedade v
alida quase em toda parte e de propriedade generica sao definidas nas
paginas 960 e 1072, respectivamente.

Intervalos
Ainda nao introduzimos os n
umeros reais nem a relacao de ordem entre eles mas, como essas nocoes
sao conhecidas, vamos colocar aqui uma palavra sobre a nomenclatura usada para descrever intervalos
da reta real. Para a < b o conjunto


(a, b) = {x
e dito ser um intervalo aberto. Para a b

, com a < x < b}

o conjunto


[a, b] = {x
e dito ser um intervalo fechado. Para a < b

, com a x b}


os conjuntos


[a, b) = {x

, com a x < b}


e
(a, b] = {x


, com a < x b}

sao ditos ser intervalos semi-abertos (ou semi-fechados).


importante dizer que a nomenclatura aberto ou fechado acima e usada independentemente
E
da topologia usada em (a nocao de topologia sera introduzida adiante).


Parte I
Captulos Introdut
orios

20

Captulo 1
Noco
es B
asicas
Conte
udo
1.1

Conjuntos, Rela
co
es e Fun
co
es . . . . . . . . . . . . . . . . . . . . . . . . .
1.1.1

Relacoes e Funcoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

23

1.1.2

Relacoes de Ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

30

1.1.3

Cardinalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
Infimos e Supremos de Famlias de Conjuntos . . . . . . . . . . . . . . . . . .

37

1.1.4
1.2

1.3

22

Estruturas Alg
ebricas B
asicas

43

. . . . . . . . . . . . . . . . . . . . . . . . .

45

1.2.1

Semi-grupos, Monoides e Grupos . . . . . . . . . . . . . . . . . . . . . . . . .

46

1.2.2

Corpos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

51

1.2.3

55

1.2.4

Espacos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

Aneis, Algebras
e Modulos . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

1.2.5

Mais sobre Aneis

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

60

1.2.6

Acoes e Representacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

62

1.2.7

Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Automorfismos . . . . . . . . . . . . . . . . . . . . . . . . . .

65

Cosets, Sub-Grupos Normais e o Grupo Quociente. O Centro de um


Grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

56

67

1.3.1

Cosets . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

67

1.3.2

Subgrupos Normais e o Grupo Quociente . . . . . . . . . . . . . . . . . . . .

69

1.3.3

O Centro de um Grupo. Centralizadores e Normalizadores . . . . . . . . . . .

71

1.4

O Produto Direto e o Produto Semi-Direto de Grupos . . . . . . . . . . .

73

1.5

Somas Diretas e Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . .

76

1.6

1.5.1

Discussao Informal Preliminar

. . . . . . . . . . . . . . . . . . . . . . . . . .

76

1.5.2

Grupos Gerados por Conjuntos. Grupos Gerados por Relacoes . . . . . . . .

79

1.5.3

Somas Diretas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

80

1.5.4

Produtos Tensoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

81

1.5.5

Produtos Diretos e Somas Diretas Arbitrarios . . . . . . . . . . . . . . . . . .

83

1.5.6

Modulos e Derivacoes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

T
opicos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

84

1.6.1

O Grupo de Grothendieck . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

85

1.6.2

Grupoides . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

87

1.6.3

Quaternions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

88

21

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

22/1304

ste captulo introdutorio pretende (re)apresentar ao leitor uma serie de nocoes matematicas
basicas abrangendo rudimentos da teoria dos conjuntos e algumas estruturas algebricas. O
objetivo nao e um tratamento extensivo dos diversos assuntos, ja que varios deles serao desenvolvidos em captulos futuros. Trata-se quase de um guia de consulta onde sao apresentadas,
junto com exemplos simples, varias nocoes e definicoes basicas que utilizaremos. O estudante deve
retornar a este captulo sempre que necessario.

1.1

Conjuntos, Rela
co
es e Fun
co
es

Partiremos do pressuposto de serem familiares as nocoes basicas envolvendo conjuntos, como a nocao
de pertinencia x C, de uniao de dois conjuntos A B e de intersecao de dois conjuntos A B.
Para A, B X denotamos por A \ B a chamada diferenca entre os conjuntos A e B, a saber
A \ B := {x X tal que x A mas x 6 B}.

(1.1)

Por vezes usa-se a notacao A B para A \ B. Para A X denota-se por A c o chamado complemento
de A em relaca
o a X: Ac := X \ A. Note-se que ao usar-se o smbolo Ac deve estar subentendido qual
facil ver que se A, B X entao A \ B = B c A.
o conjunto X ao qual o complemento se refere. E
Dizemos que um conjunto B A e um subconjunto pr
oprio de A se A \ B 6= , ou seja, se houver
elementos em A que nao estao em B.
Se A e B sao conjuntos e A B = entao A B e dita ser uma uni
ao disjunta de A e B.

Se X e um conjunto denota-se por (X) a colecao de todos os subconjuntos de X. (X) e por


vezes chamado de conjunto das partes de X. Por convencao adota-se sempre que (X). Assim,
dizer que A X equivale a dizer A (X).
Por A4B denota-se a chamada diferenca simetrica entre A e B:
A4B := (A B) \ (A B).
E. 1.1 Exerccio. Mostre que A4B = B4A e que (A4B)4C = A4(B4C).

(1.2)
6

Pares Ordenados
Um conceito basico importante em Matematica e o de par ordenado. O conceito de par ordenado
(a, b) formado por dois elementos genericos a, b X e intuitivo. A intuicao e que entende-se como par
ordenado uma lista de dois elementos sendo que um deles assume a posicao de primeiro elemento
da lista (no caso, a) e o outro a de segundo (no caso, b). Formalmente define-se (a, b) como sendo
o conjunto {a, {b}}. Esta definicao formal corresponde a` intuicao pois, no conjunto C = {a, {b}}, ha
uma distincao entre o papel de a e de b, dado que a e um elemento do conjunto C, enquanto que b
e um elemento de um subconjunto de C, a saber do conjunto C \ {a}. Apesar de existir a definicao
formal acima, recomenda-se ao estudante fiar-se inicialmente na intuicao por tras do conceito.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

23/1304

Dados dois conjuntos A e B definimos por A B o conjunto de todos os pares ordenados (a, b)
sendo a A e b B. O conjunto A B e chamado de produto Cartesiano1 de A e B. Note que, em
geral, A B 6= B A. Por que?
Mais adiante apresentaremos uma generalizacao da nocao de produto Cartesiano de conjuntos.

1.1.1

Rela
co
es e Fun
co
es

Rela
co
es
Sejam A e B conjuntos e seja o produto Cartesiano A B. Um subconjunto de A B e dito ser
uma relacao binaria, ou simplesmente relacao entre A e B.
Exemplo. Seja A o conjunto de homens vivos e B o conjunto de mulheres vivas e seja R A B
o conjunto R := {(a, b), a e irmao de b}. R representa uma relacao (de irmandade) entre homens e
mulheres.
Outros exemplos virao abaixo.
Dada uma relacao G A B entre conjuntos A e B ha duas nocoes importantes associadas: a de
domnio da relacao e a de imagem da relacao. Define-se por domnio de G o conjunto
Dom(G) := {a A tal que (a, b) G para algum b B}.

(1.3)

Define-se por imagem de G o conjunto


Im(G) := {b B tal que (a, b) G para algum a A}.

(1.4)

Note-se que Dom(G) A e que Im(G) B.


Fun
co
es
Este e talvez o mais importante exemplo de relacao. Sejam A e B conjuntos e F uma relacao entre
A e B. Entao, a relacao F e dita ser uma funcao de A em B se Dom(F ) = A e se (a, b) F e
(a, b0 ) F so for possvel caso b = b0 . Em outras palavras, a cada elemento a de A a funcao associa um
e apenas um elemento b de B que faz o papel de segundo elemento do par ordenado (a, b). Este segundo
elemento associado pela funcao F ao elemento a, e mais conveniente denota-lo por F (a). Assim, uma
funcao e o conjunto de pares {(a, F (a)) A B, a A}. Freq
uentemente denotamos uma funcao F
de A em B por F : A B.
Aplica
co
es, Mapeamentos, Mapas, Funcionais, Operadores, Opera
co
es, Produtos etc.
Muito freq
uentemente usam-se as palavras aplicaca
o, mapeamento, mapa, funcional, operador,
operaca
o, produto, transformaca
o, forma, e talvez ainda outras, para designar certos tipos de funcoes
entre conjuntos. Essa abundancia de palavras causa freq
uentemente confusao e mesmo perplexidade
1

Assim chamado em honra a Rene Descartes (1596-1650). O adjetivo Cartesiano provem da latinizaca
o de seu nome
como Cartesius.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

24/1304

em estudantes recem-iniciados mas, em essencia, todos esses objetos sao funcoes, no sentido abstrato
que definimos acima.
O que difere seu uso e por vezes a tradicao de certas areas e os tipos de conjuntos que as funcoes
tem como domnio e imagem. A palavra funcao, propriamente, e mais freq
uentemente empregada
quando se trata de funcoes numericas, por exemplo de em ou de em . A palavra funcional 2
e freq
uentemente empregada quando se trata de funcoes que levam vetores ou funcoes numericas em
n
umeros. Um exemplo deR funcional e a funcao que leva funcoes reais contnuas f nas suas integrais
1
no intervalo [0, 1]: f 7 0 f (x)dx. A palavra operador tipicamente designa funcoes lineares entre
espacos vetoriais (como, por exemplo, as matrizes, que sao funcoes lineares entre espacos vetoriais de
dimensao finita). Produtos ou operacoes freq
uentemente designam funcoes de C C em C, para
um conjunto C nao-vazio qualquer, ou seja, funcoes de duas variaveis em um conjunto C, assumindo
valores no proprio conjunto C. A palavra forma por vezez designa certas funcoes bi-lineares de
V V em ou , sendo V um espaco vetorial. As palavras aplicacao, mapa e mapeamento sao
freq
uentemente empregadas para designar funcoes em areas como Topologia, Geometria Diferencial ou
Sistemas Dinamicos.


Certas palavras sao empregadas para designar certas funcoes com propriedades especiais. Um
homeomorfismo, por exemplo, e uma funcao bijetora entre dois espacos topologicos que seja contnua
e cuja inversa seja tambem contnua. Um difeomorfismo e um homeomorfismo entre duas variedades
diferenciaveis que seja infinitamente diferenciavel. Ha ainda varios outros morfismos, como discutido
na Secao 1.2.7, a` pagina 65.
Em verdade, e conveniente dispormos por vezes de uma certa variedade de palavras diferentes
simplesmente para evitarmos o emprego monotono e descolorido da palavra funcao. Com um pouco
de ironia, lembremos por fim a definicao circular de Edward Teller: An intelectual is someone who
thinks the same things and uses the same words as other intelectuals.
Imagens e pr
e-imagens de fun
co
es
Seja f : X Y uma funcao. Se A X, definimos
f (A) := {y Y | y = f (x) para algum x A}.
Se B Y , definimos

f 1 (B) := {x X| f (x) B}.

f (A) e dita ser a imagem de A por f e f 1 (B) e dita ser a pre-imagem de B por f .
O uso do smbolo f 1 para designar pre-imagem f 1 (B) de um conjunto B e uma escolha infeliz
(mas universalmente aceita), pois pode causar confusao com a nocao de funcao inversa de f , que pode
nao estar definida. O estudante deve estar atento.
Fun
co
es Sobrejetoras, Injetoras e Bijetoras
Uma funcao F : A B e dita ser sobrejetora se Im(F ) = B. Uma funcao F : A B e dita
ser injetora ou injetiva se a cada b Im(F ) existir um e somente um elemento a Dom(F ) tal que
(a, b) F . Uma funcao que for sobrejetora e injetora e dita ser bijetora.
2

A palavra funcional foi empregada pela primeira vez na Matem


atica por Jacques Salomon Hadamard (1865-1963).

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

25/1304

Seja uma funcao bijetora F A B. Entao, a relacao F 1 B A dada por


F 1 = {(b, a) tal que (a, b) F }
claro que (F 1 )1 = F .
e, em verdade, uma funcao denominada funca
o inversa de F . E
Famlias de Conjuntos
Seja X um conjunto nao-vazio. Uma colecao F nao-vazia de sub-conjuntos de X e por vezes dita
ser uma famlia de conjuntos (que sao sub-conjuntos de algum X fica subentendito). Se F for uma
famlia de conjuntos e existirem um conjunto nao-vazio I e uma funcao bijetora f : I F, entao
dizemos que a famlia F e indexada por I e os elementos de I sao denominados ndices. Se e um
ndice, designaremos sua imagem pela funcao f simplesmente por A F.
Uma indexacao de uma colecao F nao-vazia de sub-conjuntos de X sempre existe: podemos tomar
I = F e f a funcao identidade.
Opera
co
es b
asicas com famlias de conjuntos
Sejam X e I conjuntos arbitrarios nao-vazios e seja associado a cada I um sub-conjunto A de
X. O conjunto I sera freq
uentemente denominado conjunto ou famlia de ndices. Vamos introduzir
alguma notacao a ser usada em todas estas Notas. Definimos
[
A := {x X tal que x A para algum I}
(1.5)
I

A := {x X tal que x A para todo I}.

(1.6)

As definicoes acima implicam as importantes propriedades descritas na proposicao que segue, cuja
demonstracao deixamos como exerccio.
Proposi
c
ao 1.1 Sejam B X, X n
ao-vazio, e {A X, I} uma coleca
o arbitr
aria de subconjuntos de X. Ent
ao valem as seguintes relaco
es:
!
!
[
\
\
[
B\
A
=
(B \ A ) ,
B\
A
=
(B \ A ) ,
(1.7)
I

B
B

\B =

(A \ B) ,

(B A ) ,

(B A ) ,

B
B

\B =

(A \ B) ,

(1.8)

(B A ) ,

(1.9)

(B A ) .

(1.10)

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

26/1304

As relaco
es, (1.7) implicam
[

!c

(A )c ,

!c

(A )c .

(1.11)

2
Propriedades elementares de fun
co
es
As seguintes proposicoes sao importantes e freq
uentemente usadas:
Proposi
c
ao 1.2 Seja f : X Y uma funca
o e seja um conjunto de ndices. Se A X para todo
, ent
ao
!
[
[
A
=
f (A ) ,
(1.12)
f

mas

Se B Y para todo , ent


ao
f 1

e
f 1

f (A ) .

(1.13)

f 1 (B ) ,

(1.14)

f 1 (B ) .

(1.15)

A demonstracao e elementar e e deixada como exerccio.


 T
T
EmT(1.13) nao se pode provar a igualdade entre f
A
e f (A ) e a razao e a seguinte:

se y f (A ) entao y T
f (A ) para todo . Assim, em cada A existe um x com y = f (x ).
Mas pode ocorrer que em A nao exista nenhum elemento x com y = f (x). O seguinte exemplo
ilustra isso. Seja f (x) = x2 definida em [1, 1]. Tomemos A1 = [1, 0], A2 = [0, 1]. Entao,
f (A1 ) = [0, 1] e f (A2 ) = [0, 1]. Portanto, f (A1 ) f (A2 ) = [0, 1]. Porem, f (A1 A2 ) = f ({0}) = {0}.
apesar disso, vale o seguinte:
Proposi
c
ao 1.3 Se f : X Y e injetora ent
ao, se A X para todo , vale
!
\
\
f
A
=
f (A ) .

(1.16)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

27/1304

A demonstracao e elementar e e deixada como exerccio.


Em relacao a`s operacoes de complemento e diferenca de conjuntos temos o seguinte:
Proposi
c
ao 1.4 Se f : X Y e uma funca
o e B, C Y , ent
ao

c
f 1 (B c ) = f 1 (B) ,

f 1 (B \ C) = f 1 (B) \ f 1 (C) .

Aqui, B c = Y \ B. Fora isso, se f : X Y e uma funca


o injetora e sobrejetora e A, B X, ent
ao
f (Ac ) = (f (A))c ,

Aqui, Ac = X \ A.

f (A \ B) = f (A) \ f (B) .

A demonstracao e elementar e e deixada como exerccio.


A Uni
ao Disjunta de uma Famlia Arbitr
aria de Conjuntos
Sejam, como acima, um conjunto I (nao necessariamente finito ou contavel) e Ai , i I, conjuntos
indexados por elementos de I. Os conjuntos Ai podem eventualmente possuir elementos comuns, ou
seja, pode haver elementos x que comparecem
em varios conjuntos Ai . Porem, quando formamos a
S
uniao usual dos conjuntos Ai , ou seja, iI Ai , cada elemento x comparece apenas uma vez, mesmo que
pertenca a varios Ai s. Por vezes estamos interessados em formar um outro tipo de uniao de conjuntos
onde essa possvel multiplicidade de cada elemento x possa ser levada em conta. A definicao abaixo e,
para tal, das mais adequadas.
G
Definimos a uni
ao disjunta da famlia de conjuntos Ai como sendo o conjunto, denotado por
Ai ,
iI

dado pela uniao de todos os pares ordenados (a, i) com i I, a Ai , ou seja,


G
[ [
Ai :=
(a, i) .
iI

iI aAi

Unioes disjuntas desempenham um papel em varias areas da Matematica. Na Geometria Diferencial,


por exemplo, o chamado fibrado tangente de uma variedade diferenciavel e definido como a uniao
disjunta dos espacos tangentes a` variedade.
Extens
oes de Fun
co
es
Seja F : A B uma funcao e suponha que A seja subconjunto de um outro conjunto A0 . Uma
funcao G : A0 B e dita ser uma extens
ao de F se F e G coincidirem na parte comum de seus
domnios, que vem a ser o conjunto A, ou seja, se G(a) = F (a) para todo a A.

Se lembrarmos que uma funcao F : A B e um subconjunto de AB e que uma funcao G : A0 B


e um subconjunto de A0 B e se notarmos que A B A0 B caso A A0 , entao uma definicao
alternativa de extensao seria seguinte: uma funcao G e uma extensao de uma funcao F se F G,
ambas entendidas como subconjuntos de A0 B.

JCABarata. Curso de Fsica-Matem


atica

E. 1.2 Exerccio.
6

Vers
ao de 29 de setembro de 2005.

Captulo 1

28/1304

Verifique a equivalencia dessas duas definicoes do conceito de extensao de funcoes.

Como veremos, o conceito de extensao de funcoes e freq


uentemente empregado na teoria dos operadores lineares em espacos de Hilbert.
O Produto Cartesiano de uma Famlia Arbitr
aria de Conjuntos
Ja discutimos o conceito de produto Cartesiano de dois conjuntos A e B: A B e com ele introduzimos a nocao de funcao. De posse dessa nocao podemos, com vistas a uma generalizacao, apresentar
uma outra visao do conceito de produto Cartesiano de dois conjuntos, a saber, podemos dizer que AB
e o conjunto de todas as funcoes f : {1, 2} A B tais que f (1) A e f (2) B. A ideia e dizer que
cada par ordenado (a, b) com a A e b B e uma funcao onde o primeiro membro do par e a imagem
de 1 (por ser o primeiro) e o segundo a imagem de 2 (por ser o segundo). Essa ideia permite definir produtos Cartesianos de um n
umero finito n de conjuntos A1 , A2 , . . . , An denotado por A1 A2 . . . An
n
[
como sendo o conjunto de todas as funcoes f : {1, 2, . . . , n}
Aj satisfazendo f (j) Aj para todo
j=1

j {1, . . . , n}. A funcao f tem, por assim dizer, o papel de ordenar os elementos de

n
[

Aj tomando-se

j=1

sucessivamente um elemento de cada Ai por vez. O produto Cartesiano A1 A2 . . . An e assim


entendido como o conjunto formado por todas as enuplas ordenadas (a1 , . . . , an ) com ai Ai .

Essa ideia pode ser generalizada ainda mais. Sejam I um conjunto nao-vazio (nao necessariamente
finito ou contavel) e Ai , i I, conjuntos nao-vazios indexados por elementos de I. Definimos entao o
produto Cartesiano da famlia de conjuntos {Ai , i I}, denotado por
Y
Ai
iI

como sendo o conjunto de todas as funcoes f : I

jI

Aj tais que f (x) Ax para todo x I. O

Axioma da Escolha (p
Qagina 28) consiste na afirmacao (ou melhor dizendo, na suposicao, ja que se trata
de um axioma) que iI Ai e nao-vazio.

Se por ventura todos os conjuntos Ai forem identicos entao denota-se o produto Cartesiano acima
por AI . Assim, AI denota o conjunto de todas as funcoes de I em A.

e
Desta forma
denotado simplesmente por


{1, 2}

sao duas notacoes distintas para o mesmo objeto, que tambem e


, como se sabe. Genericamente d designa {1,...,d} para d , d > 0.


O Axioma da Escolha
O Axioma da Escolha consiste na seguinte afirmativa:
Seja As , s I, uma famlia de conjuntos n
ao-vazios, onde I e um conjunto arbitr
ario (n
ao-vazio)
de ndices. Ent
ao, podemos construir um conjunto A tomando (escolhendo)[
um elemento a s de cada
conjunto As . Em termos mais tecnicos, o axioma diz que h
a funco
es F : I
As tais que F (s) As
sI

JCABarata. Curso de Fsica-Matem


atica

para todo s I, ou seja, o produto Cartesiano

Vers
ao de 29 de setembro de 2005.

sI

Captulo 1

29/1304

As e n
ao vazio3 .

A primeira vista esse axioma parece constituir-se de uma obviedade. Sucede, porem, que, sobretudo
pelo fato de o conjunto I de ndices ser arbitrario (podendo ser ate um conjunto infinito e nao-contavel),
a afirmativa que o mesmo contem nao pode ser derivada de princpios mais basicos. O axioma faz uma
afirmacao de existencia (de uma funcao como a F , ou de um conjunto como A formado por elementos
escolhidos de cada As ) que, geralmente, nao pode ser demonstrada construtivamente, ou seja, por
exibicao explcita de uma tal funcao F ou de um conjunto A.
Faremos uso explcito do Axioma da Escolha adiante quando exibirmos exemplos de conjuntos naomensuraveis. O Axioma da Escolha foi originalmente formulado por Zermelo4 em 1904 como parte da
sua demonstracao do chamado Princpo do Bom-Ordenamento, Teorema 1.1, pagina 35. Vide [52].
Uma tpica situacao na qual se faz uso do Axioma da Escolha ocorre quando sao dados um conjunto
X e uma uma relacao de equivalencia E em X e constroi-se um conjunto A X tomando-se um
representante de cada classe de equivalencia de X por E.
Nem sempre e possvel exibir explicitamente os elementos de A, mas assumimos (via Axioma da
Escolha) que um tal conjunto existe. Para ter-se em mente um caso onde uma tal situacao ocorre,
tome-se o exemplo dado em (1.18), pagina 30.
Rela
co
es de Equival
encia

Outro tipo importante de relacao e formado pelas chamadas relacoes de equivalencia. Uma relacao
E A A e dita ser uma relaca
o de equivalencia em um conjunto nao-vazio A se os seguintes quesitos
forem satisfeitos:
1. (a, a) E para todo a A.
2. (a, b) E implica que (b, a) E.
3. (a, b) E e (b, c) E implicam que (a, c) E.
Se o par (a, b) pertence a uma relacao de equivalencia E entao a e b sao ditos serem equivalentes
E
segundo E. Quase sempre usa-se a notacao a b, ou simplesmente a b, para indicar que dois
elementos sao equivalentes segundo uma relacao de equivalencia dada.
Seja A um conjunto e E A A uma relacao de equivalencia em A. Para cada a A podemos
definir o conjunto
E(a) := {a0 A tal que (a, a0 ) E}.
(1.17)
Esse conjunto e chamado de classe de equivalencia de a (pela relacao de equivalencia E).

E. 1.3 Exerccio. Seja A um conjunto e E A A e uma relacao de equivalencia em A. Suponha que


a, b A e que a b segundo E. Prove que E(a) = E(b).
6
E. 1.4 Exerccio importante. Prove que se A e um conjunto e E A A e uma relacao de equivalencia
em A entao A e a uniao disjunta de classes de equivalencia de seus elementos.
6
Q
agina 28.
Para a definica
o do produto Cartesiano sI As , vide p
4
Ernst Friedrich Ferdinand Zermelo (1871-1953).
3

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

E. 1.5 Exerccio. Seja o conjunto dos numeros reais


W := {(x, y)
onde

Captulo 1

e seja a relacao W

tal que x y

30/1304

definida por

},

e o conjunto dos numeros racionais. Prove que W e uma relacao de equivalencia.

(1.18)
6

Rela
co
es de Compatibilidade
Seja P um conjunto. Uma relaca
o de compatibilidade em P e um conjunto C P P com as
seguintes propriedades:
1. Se e 0 sao tais que (, 0 ) C, entao ( 0 , ) C.
2. Para todo P vale (, ) 6 C.
Para uma dada relacao de compatibilidade C denotamos C 0 caso (, 0 ) C e dizemos que
e 0 sao C-compatveis. Caso contrario, denotamos 6C 0 se (, 0 ) 6 C e dizemos que e 0 sao
C-incompatveis.
Se uma dada relacao C e subentendida, denotamos simplesmente 0 caso (, 0 ) C e dizemos
simplesmente que e 0 sao compatveis.
Relacoes de compatibilidade sao importantes na Mecanica Estatstica, especialmente nas chamadas
expansoes de polmeros e de clusters.
Exemplo. Seja X um conjunto nao-vazio e P = (X) \ {}, a colecao de todos os subconjuntos
nao-vazios de X. Uma relacao de compatibilidade em P e a seguinte: A B A B = .
Verifique.

1.1.2

Rela
co
es de Ordem

Seja X um conjunto nao-vazio. Uma relacao R X X e dita ser uma relaca


o de ordem parcial em
X, ou simplesmente uma relaca
o de ordem em X, se as seguintes condicoes forem satisfeitas:
1. Para todo a X tem-se que (a, a) R.
2. Se (a, b) R e (b, a) R entao forcosamente a = b.
3. Se (a, b) R e (b, c) R entao (a, c) R.
Se X possui uma ordem parcial R, X e chamado de conjunto parcialmente ordenado por R. Em
textos matematicos em lngua inglesa, conjuntos parcialmente ordenados sao freq
uentemente denominados posets (de partially ordered sets). A nocao de conjunto parcialmente ordenado foi introduzida
por Hausdorff5
5

Felix Hausdorff (1868-1942). Hausdorff foi um dos criadores da Topologia e da moderna Teoria dos Conjuntos.
Perseguido pelo nacional-socialismo, suicidou-se em 1942 para evitar ser enviado a um campo de concentraca
o.

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

31/1304

Exemplo. Seja X um conjunto e (X) a colecao de todos os sub-conjuntos de X. Podemos estabelecer em (X) uma relacao R do seguinte tipo: para A, B X tem-se (A, B) R se A B. Como
exerccio deixamos ao estudante mostrar que esta e uma relacao de ordem parcial de acordo com a
definicao acima. Este exemplo ilustra tambem por que chamar tal relacao de ordem de parcial. A
razao e que nem todo par (A, B) e elemento de R pois, para dois conjuntos A e B arbitrarios, nem
sempre vale que A B ou que B A (por exemplo se A B = ).
Em funcao da analogia com essa relacao de ordem usual dos n
umeros reais e costume, dada uma
relacao de ordem R qualquer, indicar que (a, b) R atraves da notacao a  b. Por vezes, o smbolo
e tambem usado, mas tentaremos emprega-lo apenas para denotar a relacao de ordem usual entre
n
umeros reais.
Rela
co
es de Ordem Total
Outro conceito importante e o de relacao de ordem total. Uma ordem parcial R em um conjunto X
e dita ser uma relaca
o de ordem total se para todo a, b X tem-se que (a, b) R ou que (b, a) R.
Se X possui uma relacao de ordem total R entao X e dito ser totalmente ordenado ou linearmente
ordenado. Assim, se X e um conjunto dotado de uma relacao de ordem parcial, dizemos que um
sub-conjunto A X e linearmente ordenado se a  b ou b  a para todo a, b A.
Exemplos
Exemplo. Seja
o conjunto de n
umeros reais e a relacao de ordem (x, y) R se x y for um
n
umero negativo ou nulo (ou seja, se x y). Mostre que essa e uma relacao de ordem total em .


Contra-exemplo. Seja C um conjunto nao-vazio qualquer. Entao, (C) e ordenado pela inclusao de
conjuntos: A  B se e somente se A B. Porem (C) nao e linearmente ordenado pois se A B =
nao podemos dizer que A  B nem que B  A.
2

E. 1.6 Exerccio. Voce consegue construir uma relacao de ordem em


ordem total?


ou em

3


? E uma relacao de
6

Mais Exemplos
Seja o conjunto dos n
umeros naturais . Podemos estabelecer em a relacao de ordem usual onde
dizemos que x y se x y for um n
umero negativo ou nulo. Esta relacao e uma relacao de ordem
total. O leitor nao deve pensar que essa e a u
nica relacao de ordem total existente em . Um outro
exemplo e o seguinte.


Vamos estabelecer uma relacao de ordem em


que denotaremos pelo smbolo pi . Sejam a,
b . Se a e b forem pares dizemos que a pi b se a b. Se a e b forem mpares dizemos que a pi b
se a b. Se a e par e b e mpar entao dizemos sempre que a pi b.


E. 1.7 Exerccio. Mostre que a relacao pi estabelece uma relacao de ordem total em


Um exemplo analogo pode ser construdo em . Vamos estabelecer uma relacao de ordem em
que denotaremos pelo smbolo ri . Sejam x, y . Se x e y forem racionais dizemos que x ri y se


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

32/1304

x y. Se x e y forem irracionais dizemos que x ri y se x y. Se x e racional e y e irracional entao


dizemos sempre que x ri y.
E. 1.8 Exerccio. Mostre que a relacao ri estabelece uma relacao de ordem total em


Ordem Lexicogr
afica
possvel estabelecer uma relacao de ordem total em 2 da seguinte forma: dizemos que (x1 , x2 ) L
E
(y1 , y2 ) se x1 < y1 ou se x1 = y1 e x2 y2 . Essa relacao de ordem e denominada relaca
o de ordem
2
lexicogr
afica de
.


Essa definicao pode ser facilmente generalizada. Seja X um conjunto totalmente ordenado por uma
relacao de ordem total X . Entao, X n pode ser totalmente ordenado dizendo-se (x1 , . . . , xn ) L
(y1 , . . . , yn ) se houver um j {1, . . . , n}, tal que xi = yi para todo i < j e xj X yj .

SSeja nX um conjunto totalmente ordenado por uma relacao de ordem total X e seja Seja X =
em denominada lexicografica, da
n=1 X . Podemos estabelecer em X uma ordem total X , tamb
seguinte maneira. Sejam m, n e p = min{m, n}. Entao, dizemos (x1 , . . . , xm ) X (y1 , . . . , yn ) se
(x1 , . . . , xp ) L (y1 , . . . , yp ) no sentido dado no paragrafo anterior, ou se (x1 , . . . , xp ) = (y1 , . . . , yp ),
mas m < n.


E. 1.9 Exerccio. Por que essas relacoes de ordem sao denominadas lexicograficas? Pense na maneira
como palavras (de tamanho arbitrario!) sao ordenadas em um dicionario.
6
Podemos ainda estender a definicao de ordem lexicografica. Seja X um conjunto totalmente ordenado por uma relacao de ordem total X e seja Y um conjunto totalmente ordenado por uma relacao
de ordem total Y . Entao, X Y pode ser totalmente ordenado dizendo-se X Y 3 x L y X Y se houver
um j Y , tal que x(i) = y(i) para todo i Y j e x(j) X y(j).

Exemplo. Sejam f, g, duas funcoes de


em . Dizemos que f L g se existir y
tal que
f (x) = g(x) para todo x < y mas f (y) g(y). Lembrando que o conjunto de todas as funcoes de
em e
, ve-se que essa definicao coincide com a dada acima.


Conjuntos Dirigidos
Um conjunto I e dito ser um conjunto dirigido (directed set) se for dotado de uma relacao de
ordem parcial, que denotaremos por , e se for dotado da seguinte propriedade: para quaisquer dois
elementos a e b de I existe pelo menos um terceiro elemento c I tal que a  c e b  c.
Exemplo.

Exemplo.

e um conjunto dirigido com a relacao de ordem usual.

e um conjunto dirigido com a relacao de ordem ri definida acima.

Exemplo. Seja o conjunto n , n = 1, 2, . . ., e seja I o conjunto de todos os abertos limitados de n


(um conjunto e limitado se for subconjunto de alguma bola aberta de raio finito centrada na origem).
Mostre que I e um conjunto dirigido pela relacao de ordem de inclusao: A  B se A B. Note que
essa relacao de ordem nao e uma relacao de ordem total.


JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

33/1304

Contra-Exemplo. Seja X um conjunto nao-vazio e seja I = (X) \ {X}, ou seja, I e a colecao


de todos os subconjuntos de X, exceto o proprio X. Podemos ter em I uma relacao de ordem (de
inclusao) dizendo que A  B se A B. Notemos, porem, que I nao e um conjunto dirigido pois
para A I, A 6= temos X \ A I mas nao existe em I nenhum conjunto que contenha A e X \ A
simultaneamente como subconjuntos.
Exemplo. Causalidade de Einstein. Seja 4 o espaco-tempo quadri-dimensional de Minkowski e
sejam E0 = (t0 , x0 , y0 , z0 ) e E1 = (t1 , x1 , y1 , z1 ) dois eventos em 4 . Dizemos que o evento E0 precede
causalmente o evento E1 , (em notacao simbolica E0 Einstein E1 ), se t0 t1 e se
c2 (t1 t0 )2 (x1 x0 )2 (y1 y0 )2 (z1 z0 )2 0 ,
onde c e a velocidade da luz.
E. 1.10 Exerccio. Mostre que Einstein e uma relacao de ordem em
por essa relacao.

e que

e um conjunto dirigido
6

Redes e Seq
u
encias
Seja I um conjunto dirigido com respeito a` uma relacao de ordem parcial . Se M e um conjunto
nao-vazio, uma funcao f : I M e denominada uma rede em M baseada no conjunto dirigido I com
respeito a  ou, simplesmente, uma rede6 em M .

Uma seq
uencia em M e uma rede baseada em , que e um conjunto dirigido com respeito a` ordem
usual dos naturais, ou seja, e uma funcao f : M .


A nocao de rede e importante, por exemplo, no estudo de funcoes contnuas em espacos topologicos
gerais e na definicao da nocao de convergencia (vide Captulo 21, pagina 978).
Se f :
M e uma seq
uencia em M , os elementos f (n) de sua imagem sao freq
uentemente

denotados por uma notacao com ndices: fn . E tambem comum denotar-se a propria seq
uencia por
{fn , n } ou por {fn }n , que, estritamente falando, representam a imagem de f em M .


M
aximos e Mnimos
Se X e um conjunto dotado de uma relacao de ordem parcial (que denotamos por ) diz-se que
um elemento z X e um m
aximo de X se x  z para todo x X. Se z e z 0 sao maximos de X entao,
por hipotese, valem ambas as relacoes z  z 0 e z 0  z, o que implica z = z 0 . Assim, se X possuir um
maximo ele e u
nico, e e denotado por max(X).
Se A X, a relacao de ordem parcial em X induz uma relacao de ordem parcial em A. Com essa
relacao, podemos definir max(A), se existir, como o elemento de A tal que a  max(A) para todo
a A. Note que, por definicao, max A A.

Analogamente, um elemento a e dito ser um mnimo de X se a  x para todo x X. Se a e a0


sao mnimos de X entao, por hipotese, valem ambas as relacoes a  a0 e a0  a, o que implica a = a0 .
Assim, se X possuir um mnimo ele e u
nico, e e denotado por min(X).
6

Alguns autores em lngua portuguesa preferem usar a palavra reticulado em lugar de rede.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

34/1304

Elementos Maximais e Minimais


Seja X e um conjunto dotado de uma relacao de ordem parcial (que denotamos por ).

Um elemento z X e dito ser um elemento maximal se nao existir x X, x 6= z tal que z  x.


Um elemento a X e dito ser um elemento minimal se nao existir x X, x 6= a tal que x  a.

Os elementos maximais e minimais de um conjunto parcialmente ordenado X, se exitirem, nao sao


necessariamente u
nicos, como mostra o seguinte exemplo.
E. 1.11 Exerccio-Exemplo. Considere no plano 2 o quadrado fechado Q = [0, 1] [0, 1], ou seja, os
elementos de Q sao pares ordenados (x, y) 2 com 0 x 1 e 0 y 1. Estabelecemos em Q
uma relacao de ordem (parcial!) da seguinte forma: (x, y)  (x 0 , y 0 ) se x = x0 e se y y 0 . Em palavras,
(x, y)  (x0 , y 0 ) se ambos os pontos estiverem em uma mesma linha vertical, mas (x, y) estiver mais baixo
que (x0 , y 0 ). Cheque que isso e, de fato, uma relacao de ordem, mas que nao e uma ordem total, pois nao
se pode comparar pontos que estao em linhas verticais diferentes.


Com essa definicao convenca-se que todos os elementos da forma (x, 1) sao maximais. Porem, se x
for diferente de x0 , nao se pode nem dizer que (x, 1)  (x0 , 1) nem que (x0 , 1)  (x, 1). Igualmente,
convenca-se que todos os elementos da forma (x, 0) sao minimais.
Note tambem que para a existencia de elementos maximais e importante que Q contenha pontos na aresta
de cima e (com coordenada y = 1), analogamente, para a existencia de elementos minimais e importante
que Q contenha pontos aresta de baixo (com coordenada y = 0). Por exemplo, se voce definir a mesma
relacao de ordem no quadrado aberto (0, 1) (0, 1) nao ha mais elementos maximais ou minimais.
6
Se um conjunto nao-vazio e parcialmente ordenado X possuir um u
nico elemento maximal, este
elemento e denominado o maior elemento de X. Reciprocamente, se um conjunto nao-vazio e parcialmente ordenado X possuir um u
nico elemento minimal, este elemento e denominado o menor elemento
de X.
Conjuntos Bem-Ordenados
Um conjunto X dotado de uma relacao parcial de ordem  e dito ser um conjunto bem-ordenado
se todo subconjunto A nao vazio de X tem um elemento mnimo em A.
E. 1.12 Exerccio. Mostre que todo conjunto bem-ordenado segundo uma relacao parcial de ordem e
tambem totalmente ordenado segundo a mesma relacao.
6
E. 1.13 Exerccio. A recproca nao e, entretanto, verdadeira. Mostre que e totalmente ordenado pela
relacao usual de ordem entre numeros reais, mas nao e um conjunto bem-ordenado.
6


E. 1.14 Exerccio. Mostre que o conjunto dos numeros naturais




e bem-ordenado.

A importancia de conjuntos bem-ordenados e que a eles se aplica uma generalizacao do bemconhecido metodo de inducao matematica, muito empregado em demonstracoes de teoremas, denominada princpio de induca
o transfinita. O estudante interessado encontrara em [52] uma excelente

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

35/1304

referencia introdutoria. Nesta mesma referencia o estudante interessado encontrara uma demonstracao
do seguinte e importante resultado, devido a Zermelo7 :
Teorema 1.1 (Teorema do Bom-Ordenamento) Se X e um conjunto n
ao-vazio ent
ao e possvel
encontrar uma relaca
o de ordem  em X tal que X e bem-ordenado por essa relaca
o.
2
Incidentalmente, o Teorema 1.1 junto com a afirmacao do Exerccio E. 1.12 informam que todo
conjunto nao-vazio possui ao menos uma relacao de ordem total.
Majorantes e Minorantes
Seja X um conjunto dotado de uma ordem parcial denotada por  e seja A X. Se existe t X
tal que a  t para todo a A dizemos que t e um majorante de A, ou um limitante superior 8 de A.

Analogamente, se existe h X tal que h  a para todo a A dizemos que h e um minorante de A


ou um limitante inferior9 de A.
Conjuntos Limitados
Seja X um conjunto dotado de uma ordem parcial denotada por . Um conjunto A X que tenha
pelo menos um majorante e dito ser um conjunto limitado superiormente. Um conjunto A X que
tenha pelo menos um minorante e dito ser um conjunto limitado inferiormente.
Infimo e Supremo
Seja X um conjunto dotado de uma ordem parcial denotada por  e seja A X.

O mnimo do conjunto de majorantes de A, se existir, e dito ser o supremo de A e e indicado por


sup(A). Note que o supremo de A, se existir, e u
nico, por ser o mnimo de um conjunto. Assim, s X
e dito ser o supremo de A se for um majorante de A e se s  t para todo t que seja majorante de A.
Note que o supremo de um conjunto A X nao e necessariamente um elemento de A, ao contrario do
que ocorre com o maximo de A (caso exista).
O maximo do conjunto dos minorantes de A, se existir, e dito ser o nfimo de A e e indicado por
inf(A). Note que o nfimo de A, se existir, e u
nico, por ser o maximo de um conjunto. Assim, i e o
nfimo de A se for um minorante de A e se h  i para todo h que seja minorante de A. Note que o
nfimo de um conjunto A X nao e necessariamente um elemento de A, ao contrario do que ocorre
com o mnimo de A (caso exista).
interessante notar o seguinte. Dado um conjunto X dotado de uma ordem parcial poderamos nos
E
perguntar se todo subconjunto limitado superiormente de X possui um supremo ou, analogamente, se
todo subconjunto de X limitado inferiormente possui um nfimo. A validade ou nao dessas propriedades
depende de X e da relacao de ordem em questao. Por exemplo, para X = , o conjunto dos racionais
7

Ernst Friedrich Ferdinand Zermelo (1871-1953).


A express
ao limite superior e tambem usada na literatura, mas deve ser evitada para n
ao causar confus
ao com a
noca
o de limite.
9
A express
ao limite inferior e tambem usada na literatura, mas deve ser evitada para n
ao causar confus
ao com a
noca
o de limite.
8

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

36/1304

com a relacao de ordem usual, verifica-se que a propriedade nao e valida. Tomemos A = {x , x 2 <
2}. Claramente esse conjunto e limitado inferior e superiormente mas nao possui nem supremo nem
nfimo (por que?). Para X = e X (com as relacoes de ordem usuais) a propriedade e, porem,
valida.


E. 1.15 Exerccio. Tome X = com a relacao de ordem usual. Mostre que inf((1, 1)) = 1 e que
sup((1, 1)) = 1. Note que 1 e 1 nao sao elementos de (1, 1).
6


E. 1.16 Exerccio. Suponha que A e B sejam dois sub-conjuntos de um conjunto X dotado de uma
ordem total e que inf(A) e inf(B) existam. Mostre entao que
inf(A B) = min{inf(A), inf(B)}.
6
E. 1.17 Exerccio. Suponha que A e B sejam dois sub-conjuntos de um conjunto X dotado de uma
ordem total e que sup(A) e sup(B) existam. Mostre entao que
sup(A B) = max{sup(A), sup(B)}.
6
O Lema de Zorn
Uma das afirmativas fundamentais de toda a Matematica usual e o seguinte resultado, conhecido
como lema de Zorn, em homenagem a um dos seus formuladores10 :
Lema 1.1 (Lema de Kuratowski-Zorn) Seja X um conjunto n
ao-vazio e  uma relaca
o de ordem
parcial em X. Suponha que todo sub-conjunto linearmente ordenado de X tenha pelo menos um majorante em X. Ent
ao, todo sub-conjunto linearmente ordenado de X tem algum majorante em X que e
tambem um elemento maximal de X. Implicitamente isso est
a dizendo que, sob as hip
oteses, X possui
ao menos um elemento maximal.
2
Para uma demonstracao do Lema de Zorn, vide, por exemplo, [52].
E. 1.18 Exerccio. Verifique que se X = [0, 1] e ordenado pela relacao de ordem usual todo subconjunto de X tem um majorante em X e que 1 e um desses possveis majorantes. Verifique que 1 e um
elemento maximal de X.
6
E. 1.19 Exerccio. Verifique que se X = [0, 1) e linearmente ordenado pela relacao de ordem usual e
nem todo sub-conjunto de X tem um majorante em X (tente, por exemplo, sub-conjuntos do tipo [a, 1)
com 0 a < 1). Verifique que X nao tem um elemento maximal.
6

10
Max August Zorn (1906-1993). Em verdade, o Lema de Zorn foi primeiramente descoberto por Kazimierz Kuratowski
(1896-1980). O trabalho de Kuratowski data de 1922 e o de Zorn de 1935.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

37/1304

E. 1.20 Exerccio. Cheque se as hipoteses do Lema de Zorn sao satisfeitas ou nao nos quadrados abertor
e fechados do Exemplo E. 1.11, pagina 34.
6
O Lema de Zorn e equivalente ao chamado Axioma da Escolha (vide pagina 28), ou seja, admitir
um como verdadeiro leva a demonstrar a validade do segundo. Essa equivalencia nao sera provada
aqui (vide, por exemplo, [52]). Toda a Matematica usual e fundada na aceitacao de um ou de outro
como verdadeiro e, em princpio, uma nova Matematica pode ser construda (com resultados distintos
dos da Matematica usual) se esses dois axiomas forem substitudos por um terceiro inequivalente. A
relevancia de tais Matematicas em Fsica e uma questao em aberto.

1.1.3

Cardinalidade

A No
c
ao de Cardinalidade de Conjuntos
Seja K uma colecao de conjuntos. Dados dois conjuntos A e B da colecao K, dizemos que A e
B sao equivalentes se houver uma funcao bijetora de A sobre B, ou seja, se houver uma funcao com
domnio igual a A e imagem igual a B tal que a cada elemento b B existe um u
nico elemento a A
com f (a) = b.
E. 1.21 Exerccio. Mostre que essa e uma relacao de equivalencia entre os conjuntos da colecao K. 6
Para dois conjuntos que sao equivalentes no sentido acima diz-se tambem que os mesmos tem a
mesma cardinalidade. Ou seja, dois conjuntos tem a mesma cardinalidade se e somente se houver uma
funcao bijetora entre eles.
Um conjunto A e dito ter n elementos (para um n
umero natural n) se for equivalente ao conjunto
{1, . . . , n}.
Nota.

Esta u
ltima definica
o pressup
oe que o conceito de n
umero natural j
a seja conhecido. Outra construca
o mais simples em termos de

pressupostos e feita de modo informal como segue: diz-se que um conjunto tem um elemento se for equivalente ao conjunto {}; que um
conjunto tem dois elementos se for equivalente ao conjunto {, {}}; que tem tres elementos se for equivalente ao conjunto {, {, {}}} e assim
por diante. Em verdade essa construca
o permite produzir uma definica
o do conceito de n
umero natural: o n
umero um e, grosseiramente
falando, o nome dado a
` classe de equivalencia formada pelos conjuntos equivalentes ao conjunto {}; o n
umero dois e o nome dado a
` classe
de equivalencia do conjunto {, {}}; o n
umero tres e nome dado a
` classe de equivalencia do conjunto {, {, {}}} e assim por diante.
Ali
as, o n
umero zero e o nome dado a
` classe de equivalencia de . O n
umeros naturais seriam ent
ao o conjunto de todas as classes de

equivalencia construdas dessa forma. Esta definica


o11 do conceito de n
umero natural, devida a von Neumann12 , pressup
oe apenas conhecidos
conceitos primitivos como os de conjuntos, classes de equivalencia e de conjunto vazio. O leitor poder
a encontrar uma discuss
ao extensa sobre
a definica
o de n
umeros naturais em [124, 93, 52].

Diz-se que um conjunto A e finito se tiver a cardinalidade de {1, . . . , n} para algum n


dito ser infinito se nao for finito.
E. 1.22 Exerccio.
11

. A e

Seja A um conjunto finito com n elementos. Mostre que (A) tem 2 n elementos.

J. von Neumann Zur Einf


uhrung transfiniten Zahlen, Acta Szeged 1 (1923) 199-208.
J
anos von Neumann (1903-1957). Von Neumann tambem adotou os nomes de Johann von Neumann e John von
Neumann.
12

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

38/1304

6
Conjuntos Cont
aveis
Um conjunto A e dito ser contavel se for finito ou se tiver a cardinalidade do conjunto dos n
umeros
naturais, ou seja, se for finito ou se existir uma funcao bijetora f :
A cujo domnio e
e cuja
imagem e todo A.


Nota. Por vezes conjuntos contaveis que nao sao finitos sao chamados de conjuntos enumeraveis. Nao
ha, infelizmente, unidade nessa nomenclatura mas emprega-la-emos aqui se vier a ser necessario.
Vamos agora provar alguns teoremas fundamentais sobre conjuntos contaveis (cuja importancia,
apesar da aparente simplicidade dos enunciados, nao pode ser subestimada pois seu alcance estende-se
por toda a Matematica, em particular, por muito do que veremos no restante do curso).
Precisamos da seguinte proposicao:
Proposi
c
ao 1.5 Um conjunto e cont
avel se e somente se for equivalente a um subconjunto de


. 2

Prova. Por definicao todo conjunto contavel A (finito ou nao) e equivalente a algum subconjunto de
(no pior dos casos ao proprio ).


Provemos entao a recproca. Seja A equivalente a um subconjunto Z de . Se Z for finito A


tambem o sera e portanto contavel. Suponhamos entao que Z nao e finito. Vamos construir uma
Z. A mesma e definida da seguinte forma
funcao bijetora F :


F (1) = min Z,
F (n) = min{Z \ {F (1), F (2), . . . , F (n 1)}} para n = 2, 3, . . . .
facil ver que F e bijetora e que sua imagem e Z (faca isso). Assim, Z e enumeravel e, portanto, A
E
tambem o e.
Esta proposicao tem uma conseq
uencia simples:
Proposi
c
ao 1.6 Se A e um conjunto cont
avel e B A ent
ao B e cont
avel.
Prova. Se A e contavel e B A entao B e equivalente a um subconjunto de
proposicao anterior, B e contavel.


2
e, portanto, pela

Chegamos um importante teorema:


Teorema 1.2 O produto Cartesiano

e cont
avel.

Prova. Seja a funcao G :

dada por G(a, b) = 2a 3b . A imagem dessa funcao e um


subconjunto proprio de
mas essa funcao e bijetora: a cada elemento z de sua imagem ha um e


JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

39/1304

somente um par (a, b) de n


umeros naturais tais que 2a 3b = z (por que?). Assim, fica provado pela
Proposicao 1.5 que e contavel.


Note que, como




nao e finito (por que?) e um conjunto enumeravel.

Esse u
ltimo teorema tem uma conseq
uencia de grande importancia:
Teorema 1.3 O conjunto

dos n
umeros racionais positivos e um conjunto cont
avel.

Prova. Todo racional positivo e da forma p/q onde p e q


sao irredutveis ou primos entre si (ou
seja, nao ha cancelamentos que permitam escrever p/q = a/b com a < p e b < q). Assim, ha uma
correspondencia um-a-um entre + e o subconjunto de formado por todos os pares (p, q) onde p
e q sao primos entre si. Como e contavel, a Proposicao 1.6 diz entao que + e tambem contavel.


E. 1.23 Exerccio. Prove que o conjunto dos numeros inteiros


sao conjuntos contaveis.

e o conjunto dos numeros racionais


6

Um fato tambem importante e que ha conjuntos de n


umeros que nao sao contaveis. O exemplo
mais importante e o dos n
umeros reais.
Teorema 1.4 O conjunto dos n
umeros reais n
ao e cont
avel.

Prova. Para provar isso basta mostrar que ha um subconjunto de que nao e contavel. Considere o
conjunto U de todos os n
umeros reais do intervalo [0, 1) tais que apenas os dgitos 0 ou 1 aparecem
em sua representacao decimal. Por exemplo, n
umeros como 0, 001101 ou 0, 1 ou 0 ou 0, 1011 ou
1/9 = 0, 11111 . . . sao elementos de U . De modo mais preciso, U e o subconjunto do intervalo [0, 1)
formado por todos os n
umeros u que podem pode ser escritos da forma


u =

X
dn (u)
,
n
10
n=1

onde dn (u) {0, 1} para todo n 1. dn (u) e o n-esimo dgito do n


umero u na base decimal. Note
que dois elementos u e v de U sao iguais se e somente se dn (u) = dn (v) para todo n (prove isso!).
Vamos provar que U nao e um conjunto contavel. Para isso vamos supor o oposto, ou seja, que U
e contavel e veremos que essa hipotese leva a um absurdo. Vamos supor que haja uma funcao bijetora
f:
U cuja imagem e U . Considere o n
umero real a definido por


a =

X
1 dn (f (n))
.
n
10
n=1

Como 1 dn (f (n)) e igual a 0 ou a 1 (por que?), segue obviamente que a e um elemento de U .

Entretanto, e facil ver que a nao faz parte da imagem da funcao f . Para ver isso note que se a fosse
um elemento da imagem de f haveria um inteiro m tal que f (m) = a. Mas isso significa entao que o

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

40/1304

m-esimo dgito de a seria dm (a) = dm (f (m)). Mas pela definicao do proprio a, o seu m-esimo dgito e
1 dm (f (m)). Assim, teramos que dm (f (m)) = 1 dm (f (m)) o que nao e possvel.
Conclumos entao que a e um elemento de U mas nao pode ser um elemento da imagem da funcao f .
Isso e uma contradicao, pois supomos justamente que a imagem da f era todo o conjunto U . Portanto,
U nao e contavel e, assim, tambem nao o e.


facil ver que, em verdade, poderamos substituir a base decimal, usada na representacao do
Nota. E
conjunto U acima, por qualquer base b
com b > 2. Ou seja, se considerarmos o conjunto U b de
todos os reais u do intervalo [0, 1] representaveis na base b, b , b > 2, da forma


u =

X
dn (u)
.
n
b
n=1

onde dn (u) {0, 1}, entao, repetindo o que fizemos acima, veramos que Ub nao e contavel. Claramente
U = U10 .
ltima nota pois nele nao vale a unicidade da
Nota. O caso da base binaria b = 2 foi excludo da u
representacao dos elementos de U2 na forma

X
dn (u)
u =
.
2n
n=1

onde dn (u) {0, 1}. Para ver isso, faca o exerccio seguinte.
E. 1.24 Exerccio. Mostre que na base binaria 0, 1 e 0, 01111111 . . . representam o mesmo numero, a
saber, o numero 1/2. Sugestao: use a formula da progressao geometrica infinita para calcular quanto vale
0, 01111111 . . ..
6
Nota.
Os conjuntos Ub , b > 2, sao exemplos de uma classe de conjuntos chamados de conjuntos
de Cantor13 . Tornaremos a reencontrar tais conjuntos quando falarmos de Teoria da Medida (vide
Captulo 20, especialmente Secao 20.2, pagina 961.).
Ainda sobre os n
umeros reais, tem-se tambem o seguinte fato, que para referencia futura formulamos
como uma proposicao.
Proposi
c
ao 1.7


2


tem a mesma cardinalidade.

suficiente mostrar que (0, 1) e (0, 1) (0, 1) tem a mesma cardinalidade, pois a funcao
Prova. E
x (1 + tanh(x))/2 e uma bijecao de em (0, 1). Fixemos para cada x (0, 1) uma representacao
decimal x = 0, d1 d2 d3 . . . com dn {0, . . . , 9}. Seja F : (0, 1) (0, 1) (0, 1) definida por


F (0, d1 d2 d3 d4 . . .) := ( 0, d1 d3 d5 d7 . . . ,
F e bijetora e F 1 : (0, 1) (0, 1) (0, 1) e dada por

0, d2 d4 d6 d8 . . . ) .

F 1 (( 0, a1 a2 a3 a4 . . . , 0, b1 b2 b3 b4 . . . )) = 0, a1 b1 a2 b2 a3 b3 a4 b4 . . . .

13

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de Fsica-Matem


atica

Finalizamos com um outro teorema de grande importancia:


Teorema 1.5 Se Ci , i


Captulo 1

Vers
ao de 29 de setembro de 2005.

, s
ao conjuntos cont
aveis ent
ao C =

Ci tambem o e.

41/1304

Prova. Se cada Ci e contavel entao para cada i ha uma funcao bijetora gi :


Ci cuja imagem
e Ci . Defina-se entao a funcao G : ( ) C dada por G(a, b) = ga (b). Esta funcao nao e, em
geral, bijetora, pois podem existir elementos comuns entre conjuntos Ci e Cj com i 6= j e teramos
gi (m) = gj (n) para algum n e m. Entretanto, a imagem de G e C.


Considere entao em a seguinte relacao de equivalencia: o par (a, b) e equivalente ao par


(c, d) se e somente se ga (b) = gc (d). O conjunto pode ser entao, como ja observamos, escrito
como a uniao disjunta de suas classes de equivalencia pela relacao acima. Construamos entao um
subconjunto K de tomando-se um e somente um elemento de cada classe de equivalencia escolhido
arbitrariamente (usamos aqui o Axioma da Escolha para afirmar que tal construcao e possvel).


Defina entao agora a funcao H : K C dada por H(a, b) = ga (b) para (a, b) K. Pela propria
construcao do conjunto K essa funcao H e bijetora e sua imagem e C. Como K e um subconjunto de
que e contavel, temos que K tambem o e e, portanto, C e contavel.


N
umeros Reais Alg
ebricos e Transcendentes
Na reta real diz-se que um n
umero x e um n
umero algebrico se x for raiz de um polinomio do tipo
P (t) = a0 + a1 t + a2 t2 + + an tn ,
para algum n , onde os coeficientes a0 , . . . , an sao n
umeros racionais. Um tal polinomio e dito ser
um polin
omio racional.


Todo n
umero racional p/q e tambem algebrico pois e raiz do polinomio
racional p qt. Ha tambem
muitos n
umeros irracionais que sao algebricos. Por exemplo, o n
umero 2 e raiz do polinomio racional
2 + t2 e, portanto, e algebrico. Os n
umeros reais que nao sao algebricos sao chamados de n
umeros
transcendentes.
E. 1.25 Exerccio. Prove que o conjunto de todos os numeros algebricos da reta real e um conjunto
contavel. Use para tal o fato de que os racionais formam um conjunto contavel.
6
O exerccio anterior pode ser usado para concluir que existem n
umeros transcendentes (que nao
sao raiz de nenhum polinomio racional) pois os reais, como sabemos, nao sao contaveis enquanto,
segundo o exerccio, os algebricos o sao. Deve, portanto, haver uma colecao nao-contavel de n
umeros
transcendentes na reta real.
Historicamente, a existencia de n
umeros transcendentes foi estabelecida (por outros argumentos)
14
por Liouville em 1851. Em 1874, Cantor15 demonstrou a afirmacao do exerccio acima, provando que
14
15

Joseph Liouville (1809-1882).


Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

42/1304

o conjunto de todos os n
umeros algebricos da reta real e um conjunto contavel.
E. 1.26 Exerccio. Seja 0 = e 1 o conjunto dos numeros algebricos, definidos como o conjunto de
todos os zeros reais de polinomios com coeficientes racionais. Definimos 2 como o conjunto de todos os
zeros reais de polinomios com coeficientes em 1 . Sucessivamente, definimos n , n
S1 como o conjunto
de todos os zeros reais de polinomios com coeficientes em n1 . Seja tambem = n=0 n . Mostre que
todos os n e sao conjuntos contaveis e, portanto, subconjuntos proprios de .
6


Os n
umeros e e s
ao irracionais e transcendentes
Sabe-se que os n
umeros e e sao irracionais e transcendentes.
As provas de que e e e2 sao irracionais foram primeiramente obtidas por Euler16 em 1737. Uma
prova que e e irracional pode ser encontrada nestas Notas a` pagina 836 ou, por exemplo, em [123] ou
[55].
A prova de que e irracional nao e tao simples quanto a de que e e irracional. A demonstracao de
que e irracional foi primeiramente obtida por Lambert17 em 1768 e consistiu em provar que se r e
um n
umero racional nao-nulo entao nem er nem tan(r) podem ser racionais. Como tan(/4) = 1, que
e racional, segue que /4 deve ser irracional.
A demonstracao de que e e transcendente foi obtida pela primeira vez por Hermite 18 em 1873.
A demonstracao de que e transcendente foi obtida pela primeira vez por Lindemann19 em 1882.
Um fato de grande interesse e que provar que e algebrico seria equivalente 20 a resolver o celebre
problema da quadratura do crculo, que consiste em achar um metodo atraves do qual, apenas com
regua e compasso constroi-se um quadrado cuja area e igual a de um crculo de raio 1.
Tal seria
possvel caso houvessem meios de se construir um segmento de reta cujo comprimento seja . Esse
problema classico da geometria Euclidiana ficou em aberto por cerca de dois mil anos (!), tendo sido
resolvido negativamente em 1882 por Lindemann quando este provou, justamente, que nao e um
n
umero algebrico, concluindo assim a impossibilidade da construcao proposta.
Para provas de que e e transcendente vide, por exemplo, [123] ou [55]. Para provas que e irracional
e transcendente e para uma serie de outros resultados congeneres, vide [55].
Produtos Cartesianos e Contabilidade
interessante notar que produtos Cartesianos contaveis de conjuntos contaveis n
E
ao sao, geralmente,
conjuntos contaveis. Considere como exemplo o produto Cartesiano
Y
K :=
{0, 1} = {0, 1} ,


16

Leonhard Euler (1707-1783).


Johann Heinrich Lambert (1728-1777).
18
Charles Hermite (1822-1901). A prova original da transcendencia de e encontra-se em Comptes rendus, 77 18-24
(1873).
19
Carl Louis Ferdinand von Lindemann (1852-1939). A prova original da transcendencia de encontra-se em Math.
Ann. 20, 213-225 (1882).
20
Para uma bela discuss
ao sobre isso, vide [29].
17

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

43/1304

que e denominado espaco de Cantor21 . Podemos mostrar que K nao e contavel. Cada elemento de K
e uma funcao d :
{0, 1}. Podemos assim associar univocamente a cada d o n
umero real


X
d(n)
n=1

10n

que e um elemento do conjunto U definido acima. Por outro lado, todo elemento de U pode ser
escrito assim para um u
nico d K. Assim, K e U tem a mesma cardinalidade e, portanto, K nao e
contavel pois U , como ja vimos, nao o e.


E. 1.27 Exerccio.
Mostre que todos os conjuntos Ub , definidos acima, com b > 2, tem a mesma
cardinalidade de K (e, portanto, a mesma cardinalidade entre si).
6

1.1.4

Infimos e Supremos de Famlias de Conjuntos

Seja I um conjunto arbitrario de ndices e {Ai , i I}\


uma colecao de conjuntos indexados por
elementos de I. Chama-se por vezes o conjunto inf Ai :=
Ai de nfimo da colecao {Ai , i I} e o
iI
iI
[
conjunto sup Ai :=
Ai de supremo da colecao {Ai , i I}.
iI

iI

Essas nocoes S
coincidem com as nocoes de nfimo e supremo apresentadas a` pagina 35 se considerarmos em X = iI Ai a relacao de ordem definida pela inclusao de conjuntos: se A, B X dizemos
que A  B se A B.
E. 1.28 Exerccio. Mostre isso.

Limites do Infimo e Limites do Supremo de Famlias de Conjuntos


Seja {An , n } uma colecao contavel de subconjuntos de um conjunto X. Define-se um conjunto
chamado de limite do nfimo da colecao, denotado por limAn , como sendo o conjunto dado por


limAn :=

Ak .

n=1 k=n

O chamado limite do supremo da colecao, denotado por limAn , e o conjunto definido por
limAn :=

Ak .

n=1 k=n

Se considerarmos a relacao de ordem entreTconjuntos definida pela inclusao de conjuntos, e de


se notar que a seq
uencia de conjuntos Bn :=
, esta ordenada de forma crescente
k=n Ak , n
(ou seja,
uencia de conjuntos
S Bn  Bm se n m) e limAn e seu supremo. Analogamente, a seq
Cn :=
A
,
n

,
est
a
ordenada
de
forma
decrescente
(ou
seja,
C

C
se
n m) e limAn e
k
n
m
k=n
seu nfimo.


21

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

44/1304

E. 1.29 Exerccio. Justifique a seguinte afirmativa: limAn e o conjunto de todos os pontos x de X que
pertencem a todos os conjuntos An exceto a no maximo um numero finito deles. Dizemos, nesse caso, que
x pertence a quase todos os An s).
6
E. 1.30 Exerccio. Justifique a seguinte afirmativa: limAn e o conjunto de todos os pontos x de X que
pertencem um numero infinito de conjuntos An . Dizemos, nesse caso, que x pertence freq
uentemente aos
An s).
6
Converg
encia de seq
u
encias de conjuntos
Chegamos a uma definicao importante: dizemos que uma colecao contavel de conjuntos {A n , n
converge a um conjunto A se
limAn = limAn = A.


Se uma colecao contavel de conjuntos {An , n } converge a um conjunto A, entao A e dito ser o
n
limite de An , e escrevemos, como usualmente, A = lim An , ou ainda An A.


E. 1.31 Exerccio. Justifique a seguinte afirmativa: lim An so existe se nao ha pontos x X que,
n
simultaneamente, pertencam a infinitos conjuntos A n e nao pertencam a infinitos conjuntos An .
6
E. 1.32 Exerccio. Seja a famlia contavel de subconjuntos de dada por A n = [0, 10] se n for par e
An = [0, 5] se n for mpar. Determine limAn e limAn e limn An se este existir.
6


E. 1.33 Exerccio. Seja a famlia contavel de subconjuntos de dada por A n = [0, 1] se n for par e
An = [2, 3] se n for mpar. Determine limAn e limAn e lim An , se este existir.
6


E. 1.34 Exerccio. Seja a famlia contavel de subconjuntos de dada por




1
1
An =
, 1+
n+1
n+1


com n

. Determine limAn , limAn e lim An , se este existir.




E. 1.35 Exerccio. Seja a famlia contavel de subconjuntos de dada por




1
1
An =
, 1
n+2
n+2


com n


. Determine limAn , limAn e lim An , se este existir.

E. 1.36 Exerccio. Crie seus proprios exemplos de famlias contaveis A n de subconjuntos de


seus limAn , limAn e lim An , se este existir.
n

e estude
6

JCABarata. Curso de Fsica-Matem


atica

1.2

Vers
ao de 29 de setembro de 2005.

Captulo 1

45/1304

Estruturas Alg
ebricas B
asicas

Ainda atentos ao carater introdutorio apresentaremos aqui definicoes e exemplos das estruturas algebricas
mais comuns.
Opera
co
es e Rela
co
es
Sejam C e I dois conjuntos nao-vazios e consideremos o produto Cartesiano C I (o conceito de
produto Cartesiano de conjuntos foi definido a` pagina 28). Uma funcao f : C I C e por vezes dita
ser uma operaca
o sobre C. Se I e um conjunto finito, f e dita ser uma operaca
o finit
aria sobre C.
Um conjunto R C I e dito ser uma relacao em C. Se I e um conjunto finito, R e dito ser uma
relaca
o finit
aria em C.
Fun
co
es Finit
arias
Sejam C e I dois conjuntos e consideremos funcoes f : C I C. Se I e um conjunto finito
f : C I C e dita ser uma funca
o finit
aria sobre C ou operaca
o finit
aria sobre C. Sem perda de
n
generalidade consideraremos aqui funcoes finitarias do tipo f : C C para algum n . Se f e uma
funcao finitaria para um dado n, f e dita ser uma funcao n-aria sobre C. Um exemplo de uma funcao
nao finitaria seria uma funcao do tipo f : C C que a cada seq
uencia em C associa um elemento de
C.


Funcoes 2-arias serao chamadas aqui de funco


es bin
arias e funcoes 1-arias sao chamadas de funco
es
un
arias.
Por vezes iremos falar tambem de funcoes 0-arias sobre C, que consistem em funcoes f : {} C.
Uma tal funcao tem por imagem simplesmente umelemento fixo de C. Exemplos de funcoes 0-arias
seriam f () = 1 ou f () = 0 ou f () = 2. Freq
uentemente denotamos tais funcoes pelo
sobre
elemento de C por ela associado. Nos tres exemplos acima, poderamos denotar as funcoes por 1, 0 ou

2, respectivamente.


Rela
co
es Finit
arias
Ha uma nomenclatura analoga para o caso de relacoes. Sejam C e I dois conjuntos e consideremos
relacoes R C I . Se I e um conjunto finito R e dita ser uma relaca
o finit
aria sobre C. Sem perda
n
de generalidade consideraremos aqui relacoes finitarias do tipo R C para algum n . Se R e
uma relacao finitaria para um dado n, R e dita ser uma relacao n-aria sobre C. Para o caso n = 1 as
relacoes sao tambem chamadas de unarias e para o caso n = 2 sao ditas binarias. Relacoes binarias
foram estudadas a` pagina 23.


Estruturas
Seja C um conjunto, F uma colecao de operacoes (nao necessariamente finitarias) sobre C e seja
R uma colecao de relacoes (nao necessariamente finitarias) em C. A tripla hC, F, Ri e dita ser uma
estrutura sobre C. Note-se que tanto F quanto R podem ser vazias.
Dado que operacoes sobre um conjunto C tambem sao relacoes sobre C, a definicao de estrutura

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

46/1304

porem conveniente mante-la como esta, pois funcoes sao de imacima poderia ser simplificada. E
portancia especial.
Uma estrutura hC, Fi e dita ser uma estrutura algebrica e uma estrutura hC, Ri e dita ser uma
estrutura relacional.
Tipos de Opera
co
es e de Rela
co
es
Ainda um comentario sobre a nomenclatura.
Sejam C e I conjuntos e seja : C I C uma operacao sobre o conjunto C. A cardinalidade de I
e dita ser o tipo da operaca
o . Assim, uma funcao n-aria e tambem dita ser de tipo n. Analogamente,
se R C I e uma relacao em C a cardinalidade de I e dita ser o tipo da relacao R.
Coment
ario Sobre a Nota
c
ao
Antes de prosseguirmos, facamos uma observacao sobre a notacao que e costumeiramente adotada,
especialmente quando se trata de funcoes binarias.
Dado um conjunto C e uma funcao binaria denotada por um smbolo , a imagem de um par
muito pratico, por vezes, usar uma outra notacao
(a, b) C 2 e comummente denotada por (a, b). E
e denotar (a, b) por a b. Essa notacao e denominada mesofixa. Um exemplo claro desse uso esta
umeros complexos. Denotamos +(z, w)
na funcao soma, denotada pelo smbolo + : 2 de dois n
por z + w. Outro exemplo esta na funcao produto : 2 de dois n
umeros complexos. Denotamos
(z, w) por z w.
Essa notacao sera usada adiante para outras funcoes binarias alem das funcoes soma e produto de
n
umeros ou matrizes.

Funcoes unarias tambem tem por vezes uma notacao especial, freq
uentemente do tipo exponencial.
Tal e o caso da operacao que associa a cada elemento de um grupo a` sua inversa, g 7 g 1 , ou o
caso da operacao que associa a cada conjunto o seu complementar A 7 A c . Ou ainda o caso da
transposicao de matrizes M 7 M T , da conjugacao de n
umeros complexos z 7 z para o que usa-se
tambem sabidamente a notacao z 7 z.

1.2.1

Semi-grupos, Mon
oides e Grupos

Semi-grupos
Um semi-grupo e um conjunto nao-vazio S dotado de uma operacao binaria S S S denotada
por e denominada produto tal que a seguinte propriedade e satisfeita.
1. Associatividade. Para todos a, b e c S vale (a b) c = a (b c).
Mon
oides

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

47/1304

Um monoide e um conjunto nao-vazio M dotado de uma operacao binaria M M M denotada


por e denominada produto tal que as seguintes propriedades sao satisfeitas.
1. Associatividade. Para todos a, b e c M vale (a b) c = a (b c).
2. Elemento neutro. Existe um (
unico!) elemento e M , denominado elemento neutro, tal que
g e = e g = g para todo g M .
Observaca
o A unicidade do elemento neutro e garantida pela observacao que se houvesse e 0 M
tal que g e0 = e0 g = g para todo g M teramos e0 = e0 e = e.
Grupos
Uma das nocoes mais fundamentais de toda a Matematica e a de grupo. Um grupo e um conjunto
nao-vazio G dotado de uma operacao binaria G G G denotada por e denominada produto e de
uma operacao unaria G G (bijetora) denominada inversa, denotada pelo expoente 1 , tais que as
seguintes propriedades sao satisfeitas.
1. Associatividade. Para todos a, b e c G vale (a b) c = a (b c).
2. Elemento neutro. Existe um (
unico!) elemento e G, denominado elemento neutro, tal que
g e = e g = g para todo g G.
3. Inversa. Para cada g G existe um (
unico!) elemento h G tal que g h = h g = e. Esse
elemento e denominado a inversa de g e denotado por g 1 .
Observaco
es.
1. A unicidade do elemento neutro e garantida pela observacao que se houvesse e 0 tal que g e0 =
e0 g = g para todo g G teramos e0 = e0 e = e.
2. Analogamente se estabelece a unicidade da inversa, pois se g, h G sao tais que h g = g h = e,
teremos g 1 = g 1 e = g 1 (g h) = (g 1 g) h = e h = h.
3. A funcao G 3 g 7 g 1 G, que associa cada elemento de G a` sua inversa, e um exemplo de uma
funcao unaria.
4. Como e e = e segue que e1 = e.
5. Para todo g G vale (g 1 )1 = g pois, usando a associatividade,
(g 1 )1 = ( g 1 )1 e = (g 1 )1 (g 1 g) = ((g 1 )1 g 1 ) g = e g = g .
Um grupo e dito ser comutativo ou Abeliano22 se a b = b a para todos a, b G. Essa nomenclatura
se aplica tambem a semi-grupos e monoides.
evidente que todo grupo e um monoide e que todo monoide e um semi-grupo.
E
22

Niels Henrik Abel (1802-1829).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

48/1304

Existe uma construcao canonica devida a Grothendieck, que discutimos a` pagina 85, que permite
construir um grupo Abeliano a partir de um semi-grupo Abeliano dado. Essa construcao e importante
em varias areas da Matematica. O leitor interessado podera passar sem perda a` discussao da pagina
85.
Exemplos Simples
1. O conjunto S = {1, 2, 3, . . .} e um semi-grupo em relacao a` operacao de soma usual. O conjunto
M = {0, 1, 2, 3, . . .} e um monoide em relacao a` operacao de soma usual, sendo o elemento
neutro e = 0. O conjunto G =
= {. . . , 2, 1, 0, 1, 2, . . .} e um grupo em relacao a`
operacao de soma usual, sendo o elemento neutro e = 0 e a inversa n1 = n.
2.

dotado da operacao de multiplicacao usual e um monoide onde o elemento neutro e o n


umero
1. Nao e um grupo, pois 0 nao tem inversa multiplicativa.


3. O conjunto {x
e um monoide.


, x > 0} e um semi-grupo Abeliano em relacao a` operacao de soma, mas nao

4. O conjunto + = {x
nao um grupo.


, x 0} e um monoide Abeliano em relacao a` operacao de soma mas

5. O conjunto dos n
umeros inteiros e um grupo Abeliano em relacao a` operacao usual de soma
de n
umeros inteiros. Esse grupo e comummente denotado por ( , +), para lembrar o conjunto
considerado (no caso, ) e a operacao considerada nesse conjunto (no caso, +) .
6. O conjunto dos n
umeros racionais e um grupo Abeliano em relacao a` operacao usual de soma
de n
umeros racionais. Esse grupo e comummente denotado por ( , +).
7. O conjunto \ {0} = {r , r 6= 0} e um grupo Abeliano em relacao a` operacao usual de
produto de n
umeros racionais. Esse grupo e comummente denotado por ( , ).
8. O conjunto dos n
umeros reais e um grupo Abeliano em relacao a` operacao usual de soma de
n
umeros reais. Esse grupo e comummente denotado por ( , +).


9. O conjunto dos n
umeros complexos e um grupo Abeliano em relacao a` operacao usual de soma
de n
umeros complexos. Esse grupo e comummente denotado por ( , +).
10. O conjunto \ {0} = {x , x 6= 0} e um grupo Abeliano em relacao a` operacao usual de
produto de n
umeros reais. Esse grupo e comummente denotado por ( , ).


11. O conjunto \ {0} = {z , z 6= 0} e um grupo Abeliano em relacao a` operacao usual de


produto de n
umeros complexos. Esse grupo e comummente denotado por ( , ).
12. Mat( , n), o conjunto das matrizes complexas n n com o produto usual de matrizes e apenas
um monoide.
13. Mat( , n), o conjunto das matrizes complexas n n e um grupo em relacao a` operacao de soma
de matrizes.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

49/1304

14. O conjunto GL( , n) de todas as matrizes reais n n com determinante nao-nulo (e, portanto,
invertveis) e um grupo em relacao a operacao de produto usual de matrizes. GL( , n) e naoAbeliano.


15. O conjunto GL( , n) de todas as matrizes complexas n n com determinante nao-nulo (e,
portanto, invertveis) e um grupo em relacao a operacao de produto usual de matrizes. GL( , n)
e nao-Abeliano.
16. Seja X um conjunto nao-vazio. Entao (X) e um grupo Abeliano em relacao a` operacao de
diferenca simetrica A4B, A, B X, definida em (1.2), pagina 22. De fato, o Exerccio E. 1.1,
pagina 22, garante associatividade e comutatividade, o elemento neutro e o conjunto vazio e
para todo A (X) tem-se A1 = A. Verifique!
17. Outro exemplo importante e o seguinte. Seja C um conjunto nao-vazio e tomemos S = C C , o
conjunto de todas as funcoes de C em C. Entao, S e um monoide com o produto formado pela
composica
o de funcoes: f g, e onde o elemento neutro e a funcao identidade id(s) = s, s C.
O sub-conjunto de C C formado pelas funcoes bijetoras e um grupo nao-Abeliano, onde o produto
e a composicao de funcoes, o elemento neutro e a funcao identidade e o elemento inverso de uma
funcao f : C C e a funcao inversa f 1 . Esse grupo e denominado grupo de permutaco
es do
conjunto C e denotado por P erm(C).
E. 1.37 Exerccio. Em caso de duvida, prove todas as afirmacoes acima.

Sub-grupos
Seja G um grupo em relacao a uma operacao e cujo elemento neutro seja e. Um subconjunto
H de G e dito ser um sub-grupo de G se for tambem por si so um grupo em relacao a` mesma operacao,
ou seja, se
1. e H,
2. h1 h2 H para todos h1 H e h2 H,
3. h1 H para todo h H.
Todo grupo G sempre possui pelo menos dois sub-grupos: o proprio G e o conjunto {e} formado
apenas pelo elemento neutro de G.
facil ver que SL( , n), o
facil verificar que ( , +) e ( , +) sao sub-grupos de ( , +). E
E
conjunto de todas as matrizes reais n n com determinante igual a 1, e um sub-grupo de GL( , n).
Idem para SL( , n) em relacao a GL( , n).


Os Grupos

O bem conhecido algoritmo de Euclides23 afirma que, dado n , n > 0, entao todo n
umero inteiro
z pode ser escrito de maneira u
nica na forma z = qn + r, onde q e r {0, 1, . . . , n 1}.


23

Euclides de Alexandria ( 325 A.C, 265 A.C.).

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

50/1304

O n
umero r e denominado resto da divis
ao de z por n e e tambem denotado por r = z mod n.
Seja n um inteiro positivo maior ou igual a 2 e seja o conjunto {0, 1, . . . , n 1}. Vamos definir
uma operacao binaria em {0, 1, . . . , n 1}, denominada soma e denotada pelo smbolo +, da
seguinte forma:
+ = [ + ] mod n
para todos , {0, 1, . . . , n 1}. Acima [ + ] representa a soma usual de n
umeros inteiros em
.
E. 1.38 Exerccio. Prove que a operacao de soma definida acima e uma operacao binaria de {0, 1, . . . , n
1} e mostre que a mesma e associativa, comutativa e tem 0 como elemento neutro.
6
E. 1.39 Exerccio. Para cada a {0, 1, . . . , n 1}, defina a1 = (n a) mod n. Mostre que
a1 {0, 1, . . . , n 1} e que a + a1 = 0.
6
Os dois exerccios acima provam que {0, 1, . . . , n 1} e um grupo Abeliano em relacao a` operacao
de soma definida acima. Esse grupo e denominado grupo n .

estendido

O conjunto + = {x , x 0} e um semi-grupo Abeliano em relacao a` operacao de soma e


em relacao a` operacao de produto e vale ainda a propriedade distributiva a(b + c) = ab + ac. + e
tambem, sabidamente, um conjunto linearmente ordenado pela relacao de ordem usual.


Vamos abaixo descrever um outro conjunto linearmente ordenado que contem + e e tambem um
semi-grupo Abeliano em relacao a` operacao de soma e em relacao a` operacao de produto e vale ainda
a propriedade distributiva.


Definimos um conjunto, que denotaremos por R+ , juntando a + um conjunto formado por um


elemento, elemento esse que denotaremos provisoriamente por , com 6 + , para o qual certas
relacoes algebricas serao definidas. Seja R+ = + {} e definimos as operacoes de soma e produto
em R+ da seguinte forma: se a e b sao elementos de + suas soma e produto sao definidos como
usualmente. Fora isso, valem


1. a + = + a = , para todo a


+.

2. + = .
3. a = a = , para todo a


+,

a 6= 0.

4. 0 = 0 = 0.
5. = .
E. 1.40 Exerccio. Verifique que R+ e um semi-grupo Abeliano em relacao `a operacao de soma e em
relacao `a operacao de produto definidas acima e que vale ainda a propriedade distributiva.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

51/1304

R+ e linearmente ordenado tomando-se em + a relacao de ordem usual e fixando-se a < para


todo a + .
bastante claro que na definicao abstrata acima o objeto representado pelo smbolo desempenha o
E
papel formalmente desempenhado por um n
umero infinito positivo. A construcao das relacoes algebricas
acima prescinde, porem, dessa nocao, pois pode ser qualquer objeto (fora de + ).


Com um certo abuso de linguagem, e costume, substituir o smbolo pelo smbolo , dando
comum tambem denotar-se
a entender que representa algo como um n
umero infinito positivo. E
R+ = [0, ].


E. 1.41 Exerccio. Que problemas surgem quando se tenta estender a construcao acima para o conjunto
de todos os reais?
6

1.2.2

Corpos

Um corpo24 e um conjunto nao-vazio C dotado de duas operacoes binarias, denotadas por + e ,


denominadas soma e produto, respectivamente, satisfazendo o seguinte: para , e C quaisquer,
valem
1. A operacao de soma tem as seguintes propriedades:
(a) Comutatividade: + = +
(b) Associatividade: + ( + ) = ( + ) +
(c) Elemento neutro: existe um elemento 0 C, chamado de zero, tal que + 0 = para todo
C.

(d) Para cada C existe um u


nico elemento denotado por com a propriedade + = 0.
Esse elemento e mais comummente denotado por .
2. A operacao de produto tem as seguintes propriedades:
(a) Comutatividade: =

(b) Associatividade: ( ) = ( )

(c) Elemento neutro: existe um elemento 1 C, chamado de unidade, tal que 1 = para
todo C.

(d) Para cada C, 6= 0, existe um u


nico elemento denotado por com a propriedade
= 1. Esse elemento e mais comummente denotado por 1 .
3. O produto e distributivo em relacao a` adicao: ( + ) = + .
Note-se que corpos sao grupos comutativos em relacao a` operacao de soma e monoides comutativos
em relacao a` operacao de produto.
24

Em ingles a palavra empregada e field. A express


ao em portugues provavelmente provem do frances corp ou do
alem
ao K
orper.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

52/1304

Os elementos de um corpo sao por vezes denominados escalares.


facil verificar que ,
Exemplos. E
e
sao corpos em relacao a`s operacoes usuais de soma e
produto. O conjunto das matrizes n n para qualquer n 2 com o produto usual de matrizes nao e
um corpo pois, entre outras razoes, o produto nao e comutativo.


Em um corpo C sempre vale que 0 = 0 para todo C. De fato, como 0 = 0 + 0, segue que
0 = (0 + 0) = 0 + 0.
Somando-se a ambos os lados o elemento inverso 0 teremos
0 + ( 0) = 0 + 0 + ( 0),
ou seja,
0 = 0 + 0 = 0,

como queramos provar. Pela comutatividade do produto vale tambem 0 = 0 para todo C.
Vamos exibir outros exemplos menos triviais de corpos.

Os Corpos

( p), com p Primo

E. 1.42 Exerccio. Mostre que o conjunto de todos os numeros reais da forma a + b 2, com a e b
racionais, e um corpo.
6
O corpo do exemplo acima e denotado por

( 2).

E. 1.43 Exerccio. Seja p um numero primo. Mostre que o conjunto de todos os numeros reais da forma

a + b p, com a e b racionais, e um corpo.


6
O corpo do exemplo acima e denotado por

( p).

E. 1.44 Exerccio. Mostre que o conjunto de todos os numeros reais da forma a + b 2 com a e b
inteiros n
ao e um corpo.
6
Os Corpos

p,

com p Primo

O bem conhecido algoritmo de Euclides25 afirma que, dado n , n > 0, entao todo n
umero inteiro
z pode ser escrito de maneira u
nica na forma z = qn + r, onde q e r {0, 1, . . . , n 1}.


O n
umero r e denominado resto da divis
ao de z por n e e tambem denotado por r = z mod n.

Seja n um inteiro positivo maior ou igual a 2 e seja n o conjunto {0, 1, . . . , n 1}. Vamos definir
operacoes de soma e produto em n da seguinte forma:
+ = [ + ] mod n

Acima [ + ] e [] sao a soma e o produto usuais em


Temos o seguinte teorema:
25

Euclides de Alexandria ( 325 A.C, 265 B.C.).

= [] mod n.
.

JCABarata. Curso de Fsica-Matem


atica

Teorema 1.6 O conjunto


n
umero primo.

Vers
ao de 29 de setembro de 2005.

Captulo 1

53/1304

e um corpo com as operaco


es acima definidas se e somente se n for um
2

Prova. As operacoes de soma e produto definidas acima sao automaticamente comutativas, associativas
e distributivas (por que?). Fora isso sempre vale que = n para todo n . Resta-nos estudar
a existencia de elementos inversos 1 . Vamos supor que n seja um corpo. Entao, a {2, . . . , n 1}
tem uma inversa em n , ou seja, um n
umero b {1, . . . , n 1} tal que a b = 1. Lembrando a
definicao de produto em n , isso significa que existe um inteiro r tal que ab = rn + 1. Mas isso implica
n
1
b =r
.
a
a

Como o lado esquerdo nao e um n


umero inteiro, o lado direito tambem nao pode ser. Isso diz entao que
n/a nao pode ser inteiro para nenhum a {2, . . . , n 1}, ou seja, n nao tem divisores e e, portanto,
um primo. Resta-nos mostrar que p e efetivamente um corpo quando p e primo, o que agora se reduz
a mostrar que para todo a p existe um elemento inverso.

Para apresentar a demonstracao, recordemos tres conceitos da teoria de n


umeros. 1. Sejam dois
n
umeros inteiros f e g, dizemos que f divide g se g/f . Se f divide g, denotamos esse fato por
f |g. 2. Sejam dois n
umeros inteiros f e g. O m
aximo divisor comum de f e g, denotado mdc(f, g) e
o maior inteiro m tal que m|f e m|g. 3. Dois n
umeros inteiros f e g sao ditos ser primos entre si se
mdc(f, g) = 1.
A demonstracao da existencia de inverso em
demonstrar a seguinte afirmativa.

sera apresentada em partes. Vamos primeiro

Lema 1.2 Se f e g s
ao dois n
umeros inteiros quaisquer ent
ao existem inteiros k 0 e l0 tais que
mdc(f, g) = k 0 f + l0 g.
2
Prova. Seja m = mdc(f, g). Seja M o conjunto de todos os n
umeros positivos que sejam da forma
0
kf + lg com k e l inteiros. Seja m o menor elemento de M . Note que como os elementos de M sao
positivos, esse menor elemento existe. Claramente
m0 = k 0 f + l 0 g

(1.19)

para algum k 0 e l0 . Como, por definicao, m|f e m|g, segue que m|m0 , o que so e possvel se
m0 m.

(1.20)

Vamos agora demonstrar por contradicao que m0 |f . Se isso nao fosse verdade, existiriam (pelo algoritmo
de Euclides) inteiros e com
0 < < m0
(1.21)
tal que
f = m0 + .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

54/1304

Usando (1.19) isso diz que


= f (k 0 f + l0 g) = (1 k 0 )f + (l0 )g.
Mas, como > 0 isso diz que M . Logo, m0 , contradizendo (1.21). Logo m0 |f . De maneira
totalmente analoga prova-se que m0 |g. Portanto m0 mdc(f, g) = m. Lembrando que havamos
provado (1.20), segue que m = m0 e, portanto m = k 0 f + l0 g, demonstrando o Lema.
Corol
ario 1.1 Se f e g s
ao dois n
umeros inteiros primos entre si ent
ao existem inteiros k 0 e l0 tais
que
1 = k 0 f + l0 g.
2
Prova. Pela definicao, como f e g sao dois n
umeros inteiros primos entre si segue que mdc(f, g) = 1.

Para finalmente demonstrarmos a existencia de inverso em p , com p primo, seja a {1, . . . , p1}.

E obvio que a e p sao primos entre si (por que?). Assim, pelo corolario, existem inteiros r e s com
1 = sa rp.
Isso diz que sa = rp + 1. Logo, definindo b

como sendo b = s mod p teremos

ba = (s mod p)a = (rp + 1) mod p = 1,


ou seja, b = a1 , completando a demonstracao.

Caracterstica de um Corpo
Seja C um corpo e 1 sua unidade. Para um n
umero natural n definimos n 1 = 1| + {z
+ 1}.
n vezes
Define-se a caracterstica de C como sendo o menor n
umero natural nao-nulo n tal que n 1 = 0.
Se um tal n
umero nao existir, diz-se que o corpo tem caracterstica zero.

Exemplos. , , , ( 2) tem caracterstica zero. p , p primo, tem caracterstica p. Mostre isso.




E. 1.45 Exerccio. Mostre que a caracterstica de um corpo e ou igual a zero ou e um numero primo.
Sugestao: Mostre primeiro que (nm) 1 = (n 1)(m 1) para quaisquer numeros naturais n e m. Use entao
o fato que todo natural pode ser decomposto em um produto de fatores primos e use o fato que, em um
corpo, se a b = 0 entao ou a ou b ou ambos sao zero (ou seja, todo corpo e um anel de integridade: nao
tem divisores de zero).
6

JCABarata. Curso de Fsica-Matem


atica

1.2.3

Vers
ao de 29 de setembro de 2005.

Captulo 1

55/1304

Espa
cos Vetoriais

Um espaco vetorial V sobre um corpo K e um conjunto de elementos chamados vetores dotado de uma
operacao +: V V V denominada soma e tambem de um produto por escalares : K V V
com as seguintes propriedades:
1. A cada par u, v V de vetores e associado um elemento u + v V , denominado soma de u e v,
com as seguintes propriedades:
(a) A soma e comutativa:
u+v =v+u
para todos u, v V ,

(b) A soma e associativa:


u + (v + w) = (u + v) + w
para todos u, v, w V ,

(c) Existe um u
nico vetor denotado por 0, denominado vetor nulo, tal que
u+0=u
para todo u V ,

(d) A cada u V existe associado um u


nico vetor denotado por u tal que
u + (u) = 0.
2. A cada par K, u V existe associado um vetor denotado por u V , denominado produto
de u por , de forma que
(a) O produto por escalares e associativo:
( u) = () u,
para todos , K e u V , onde e o produto de por em K,

(b) 1 u = u para todo u V , onde 1 e a unidade de K,

(c) O produto por escalares e distributivo em relacao a` soma de vetores:


(u + v) = u + v,
para todo K e todos u, v V ,

(d) O produto por escalares e distributivo em relacao a` soma de escalares:


( + ) u = u + u,
para todos , K e todo u V .
Note-se que espacos vetoriais sao grupos comutativos em relacao a` operacao de soma.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

56/1304

E. 1.46 Exerccio. Mostre usando os postulados acima que 0u = 0 para todo u V , onde, permitindonos um certo abuso de linguagem, o 0 do lado esquerdo representa o zero do corpo K e o do lado direito o
vetor nulo de V .
6
Nomenclatura.
Os elementos de um corpo sobre os quais um espaco vetorial se constitui sao
freq
uentemente denominados escalares.
freq
Notaca
o. E
uente omitir-se o smbolo de produto por escalares quando nenhuma confusao e
possvel.
Anti-exemplo. Tomemos o conjunto dos reais com a operacao de soma usual, um corpo p com p
primo e o produto p , x, p e x dada pelo produto usual em . Essa estrutura
n
ao forma um espaco vetorial. A regra distributiva


( + ) x = x + x
nao e satisfeita para todo ,

p.

Acima, x e o produto usual em




*
quase desnecessario mencionar o quao importantes espacos vetoriais sao no contexto da Fsica,
E
onde, porem, quase somente espacos vetoriais sobre o corpo dos reais ou dos complexos aparecem.
Discutiremos mais aspectos basicos da teoria dos espacos vetoriais na Secao 2.1, pagina 94.
*

1.2.4

An
eis, Algebras
e M
odulos

An
eis
Um anel e um conjunto A dotado de duas operacoes binarias denotadas por + e e denominadas
soma e produto, respectivamente, tais que A e um grupo Abeliano em relacao a` operacao de soma e
um semi-grupo em relacao a` operacao de produto. Por fim, a operacao de produto e distributiva em
relacao a` soma: para quaisquer a, b e c A valem a (b + c) = a b + a c e (a + b) c = a c + b c.
Como usual, denotamos por a a inversa aditiva do elemento a de um anel.

Se 0 e o elemento neutro de um anel A em relacao a` operacao de soma, entao a 0 = 0 pois, como


0 = 0 + 0, tem-se pela propriedade distributiva a 0 = a 0 + a 0, que implica 0 = a 0 (a 0) =
a 0 + a 0 (a 0) = a 0.

Algebras
Uma algebra e um espaco vetorial V sobre um corpo K dotado de uma operacao de produto binaria
dita produto da algebra, de modo que as seguintes propriedades sao satisfeitas

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

57/1304

1. O produto da algebra e distributivo em relacao a soma vetorial: para todos a, b e c V valem


a (b + c) = a b + a c e (a + b) c = a c + b c.
2. O produto por escalares comuta com o produto da algebra e e distributivo em relacao a ele: para
todos a, b V e K vale
(a b) = (a) b = a (b).
Uma algebra V e dita ser uma a
lgebra comutativa ou uma a
lgebra Abeliana 26 se para todos a, b V
tivermos
a b = b a.
Uma algebra V e dita ser uma a
lgebra associativa se para todos a, b e c V tivermos
a (b c) = (a b) c.

Algebras
associativas sao aneis.
Notaca
o. Se A e uma algebra associativa, podemos sem ambig
uidade denotar o produto de dois de seus
elementos a, b A simplesmente por por ab. Pela mesma razao, em uma algebra associativa produtos
triplos como a(bc) e (ab)c podem ser escritos sem ambig
uidade como abc.
Devemos dizer que ha muitas algebras importantes encontradas na Fsica que nao sao nem comutativas nem associativas. Por exemplo, a algebras do produto vetorial em 3 nao e nem comutativa
nem associativa.


Algebras
de Lie
Uma classe especialmente importante de algebras nao-comutativas e nao-associativas e formada
pelas chamadas a
lgebras de Lie.
Uma algebra L (sobre um corpo K) e dita ser uma a
lgebra de Lie27 se seu produto, alem das
propriedades 1 e 2 da pagina 56, satisfizer
1. Anti-comutatividade. Para todos a, b L vale a b = b a.
2. Identidade de Jacobi28 . Para todos a, b e c L vale
a (b c) + c (a b) + b (c a) = 0.

(1.22)

Por razoes historicas o produto de dois elementos de uma algebra de Lie e denotado pelo smbolo
[a, b] em lugar de a b.
26

Niels Henrik Abel (1802-1829).


Marius Sophus Lie (1842-1899).
28
Carl Gustav Jacob Jacobi (1804-1851).
27

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

58/1304

Seja A uma algebra associativa. Podemos associar a A uma algebra de Lie definindo o produto
[a, b] = ab ba para a, b A. A anti-comutatividade e obvia e a identidade de Jacobi segue do fato
que
[a, [b, c]] + [c, [a, b]] + [b, [c, a]]
= a(bc cb) (bc cb)a + c(ab ba) (ab ba)c + b(ca ac) (ca ac)b
= abc acb bca + cba + cab cba abc + bac + bca bac cab + acb
= 0,
como facilmente se constata.

Exemplos B
asicos de Algebras
de Lie
Todos os exemplos aqui exibidos sao relevantes na teoria dos grupos de Lie.
E. 1.47 Exerccio. Mostre que

3


dotado do produto vetorial usual e uma algebra de Lie.

E. 1.48 Exerccio. Mostre que Mat ( , n) (ou Mat ( , n)), o conjunto de todas as matrizes n n
reais (complexas) e uma algebra de Lie com relacao ao produto [A, B] = AB BA.
6


E. 1.49 Exerccio. Mostre que o subconjunto de Mat ( , n) (ou de Mat ( , n)) formado pelas matrizes
com traco nulo e uma algebra de Lie com relacao ao produto [A, B] = AB BA.
6


E. 1.50 Exerccio. Mostre que o subconjunto de Mat ( , n) (ou de Mat ( , n)) formado pelas matrizes
anti-simetricas, ou seja, tais que AT = A, e uma algebra de Lie com relacao ao produto [A, B] =
AB BA.
6


E. 1.51 Exerccio. Mostre que o subconjunto de Mat ( , n) formado pelas matrizes anti-autoadjuntas,
ou seja, tais que A = A, e uma algebra de Lie (sobre o corpo dos reais!) com relacao ao produto
[A, B] = AB BA.
6
E. 1.52 Exerccio. Conclua igualmente que o subconjunto de Mat ( , n) formado pelas matrizes antiautoadjuntas, ou seja, tais que A = A, e de traco nulo (Tr(A) = 0) e uma algebra de Lie (sobre o corpo
dos reais!) com relacao ao produto [A, B] = AB BA.
6
E. 1.53 Exerccio. Fixada uma matriz B Mat ( , n), mostre que o subconjunto de Mat ( , n)
formado pelas matrizes A com a propriedade AB = BAT e uma algebra de Lie real com relacao ao
produto [A, B] = AB BA.
6


E. 1.54 Exerccio. Fixada uma matriz B Mat ( , n), mostre que o subconjunto de Mat ( , n)
formado pelas matrizes A com a propriedade AB = BA e uma algebra de Lie real com relacao ao

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

59/1304

produto [A, B] = AB BA.

Tratemos agora de exibir um exemplo basico de uma algebra de Lie de dimensao infinita.
Colchetes de Poisson
Sejam f (p, q) e g(p, q), com f : 2
e g : 2 , duas funcoes reais, infinitamente
diferenciaveis, de duas variaveis reais p e q. Definimos os colchetes de Poisson 29 de f e g, denotados
por {f, g}, por
f g f g

.
{f, g} :=
p q
q p


claro que {f, g} e igualmente uma funcao infinitamente diferenciavel de p e q.


E

Os colchetes de Poisson satisfazem as seguintes propriedades: para quaisquer funcoes f, g e h como


acima, valem
1. Linearidade. {f, g + h} = {f, g} + {f, h} para quaisquer ,
{f + g, h} = {f, h} + {g, h}.


. Analogamente

2. Anti-simetria. {f, g} = {g, f }.


3. Identidade de Jacobi30 . {f, {g, h}} + {h, {f, g}} + {g, {h, f }} = 0.
4. Identidade de Leibniz31 . {f, gh} = {f, g}h + g{f, h}.
E. 1.55 Exerccio importante. Verifique a validade das quatro propriedades acima.

As propriedades 1 e 2 e 3 indicam que o conjunto das funcoes 2 infinitamente diferenciaveis


e uma algebra de Lie com o produto definido pelos colchetes de Poisson. Trata-se de uma algebra de
Lie de dimensao infinita.


A definicao acima dos colchetes de Poisson pode ser facilmente generalizada para variedades diferenciaveis de dimensao par, mas nao trataremos disso aqui por ora. Os colchetes de Poisson desempenham um papel importante na Mecanica Classica.
E. 1.56 Exerccio. Mostre que matrizes A, B, C de Mat ( , n) (ou de Mat ( , n)) tambem satisfazem
uma identidade de Leibniz: [A, BC] = [A, B]C + B[A, C]. Em verdade, essa identidade e valida em
qualquer algebra associativa. Mostre isso tambem (a prova e identica ao caso de matrizes).
6


M
odulos
Seja A um anel. Um A-m
odulo a
` esquerda e um grupo Abeliano M (cujo produto, seguindo a
convencao, denotaremos por +) dotado de uma funcao A M M que a cada par a A, m M
29

Simeon Denis Poisson (1781-1840).


Carl Gustav Jacob Jacobi (1804-1851).
31
Gottfried Wilhelm von Leibniz (1646-1716).

30

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

60/1304

associa um elemento de M denotado por a m com as seguintes propriedades: para todos a, b A e


todos m, n M
1. a (m + n) = a m + a n,
2. (a + b) m = a m + b m,
3. a (b m) = (ab) m,
4. Se A possuir uma identidade e, entao e m = m.
Seja A um anel. Um A-m
odulo a
` direita e um grupo Abeliano M dotado de uma funcao M A M
que a cada par a A, m M associa um elemento de M denotado por m a com as seguintes
propriedades: para todos a, b A e todos m, n M
1. (m + n) a = m a + n a,
2. m (a + b) = m a + m b,
3. (m b) a = m (ba),
4. Se A possuir uma identidade e, entao m e = m.
Sejam A e B dois aneis. Um bim
odulo em relacao a A e B e um grupo Abeliano M dotado de
duas funcoes A M M e M B M que a cada a A, b B e m M associam elementos de
M denotados por a m e m b, respectivamente, de modo que M seja um A-modulo a` esquerda e um
B-modulo a` direita e de modo que valha
1. a (m b) = (a m) b para todos a A, b B, m M .

1.2.5

Mais sobre An
eis

Apresentaremos em seq
uencia uma serie de definicoes apos as quais discutiremos exemplos relevantes.
An
eis com Unidade
Um anel com unidade e um anel R com a propriedade de existir em R um elemento 1, chamado de
unidade, com 1 6= 0, tal que a 1 = 1 a = a para todo a R.
An
eis sem Divisores de Zero
Dado um anel R um elemento nao-nulo a R e dito ser um divisor de zero se existir pelo menos
um b R com b 6= 0 tal que a b = 0 ou b a = 0.

Se em um dado anel a relacao a b = 0 so for possvel se a = 0 ou b = 0 ou ambos, entao esse anel


e dito ser um anel sem divisores de zero.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

61/1304

Exemplos.
e sao aneis sem divisores de zero (com os produtos e somas usuais), mas os aneis
Mat(n, ), n > 1, tem divisores de zero (com o produto e soma usual), pois tem-se, por exemplo,

 


0 0
0 0
1 0
.
=
0 0
0 1
0 0


E. 1.57 Exerccio.
divisores de zero?

Mostre que em

E. 1.58 Exerccio. Mostre que em

tem-se 2 2 = 0, ou seja, 2 e um divisor de zero. Ha outros


6

existem divisores de zero caso n nao seja um numero primo. 6

An
eis de Integridade
Um anel comutativo (ou seja, cujo produto e comutativo), com unidade e sem divisores de zero e
dito ser um anel de integridade ou tambem um domnio de integridade.
Para a relacao entre aneis de integridade e corpos, vide adiante.
An
eis de Divis
ao
Um anel R e dito ser um anel de divis
ao se possuir uma unidade multiplicativa 1, i.e., um elemento
tal que para todo a R vale a 1 = 1 a = a e se para todo a R, a 6= 0, existir uma inversa
multiplicativa em R, ou seja, um elemento denotado por a1 tal que a a1 = a1 a = 1.
E. 1.59 Exerccio importante.
Mostre que um anel de divisao nao pode possuir divisores de zero.
Portanto, todo anel de divisao comutativo e tambem um anel de integridade.
6
Exemplos. Com as definicoes usuais , e sao aneis de divisao mas nao o e (falta a inversa).
Mat(n, ) com n > 1 tambem nao e um anel de divisao com as definicoes usuais pois nem toda a
matriz e invertvel.


Outro exemplo de anel de divisao (nao comutativo!) sao os quaternions, que serao discutidos a`
pagina 88.

Algebras
de Divis
ao
Uma algebra A e dita ser uma a
lgebra de divis
ao se possuir uma unidade multiplicativa 1, i.e., um
elemento tal que para todo a A vale a 1 = 1 a = a e se para todo a A, a 6= 0, existir uma inversa
multiplicativa em A, ou seja, um elemento denotado por a1 tal que a a1 = a1 a = 1.
Corpos
Todo anel de divisao cujo produto e comutativo e um corpo (verifique).
Corpos N
ao-comutativos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

62/1304

Como a u
nica distincao entre as definicoes de corpos e de aneis de divisao e que para os primeiros a
comutatividade do produto e requerida, diz-se tambem por vezes que aneis de divisao nao-comutativos
sao corpos n
ao-comutativos.
Corpos e An
eis de Integridade
bem claro pelas definicoes que todo corpo e tambem um anel de integridade. A reciproca e
E
parcialmente valida:
Teorema 1.7 Todo anel de integridade finito e um corpo.

Prova. Se A e um anel de integridade, tudo que precisamos e mostrar que todo elemento nao-nulo de
A e invertvel. Seja a um elemento de A \ {0}. Definamos a aplicacao : A \ {0} A dada por
(y) = ay.
Note que, como A e um anel de integridade o lado direito e nao nulo pois nem a nem y o sao. Assim,
e, em verdade, uma aplicacao de A \ {0} em A \ {0} e, como tal, e injetora, pois se ay = az, segue
que a(y z) = 0, o que so e possvel se y = z, pois A e um anel de integridade e a 6= 0. Agora,
uma aplicacao injetora de um conjunto finito em si mesmo tem necessariamente que ser sobrejetora
(por que?). Assim, e uma bijecao de A \ {0} sobre si mesmo. Como 1 A \ {0}, segue que existe
y A \ {0} tal que ay = 1, ou seja, a tem uma inversa. Como a e um elemento arbitrario de A \ {0},
segue que todo elemento de A \ {0} tem inversa e, portanto, A e um corpo.
Aneis de integridade infinitos nao sao necessariamente corpos:
Anti-exemplo. Um exemplo de um anel de integridade que nao e um corpo e o conjunto de todos
os polinomios de em com o produto e soma usuais. Em verdade, os u
nicos polinomios que tem
inverso multiplicativo sao os polinomios constantes nao-nulos.

1.2.6

A
co
es e Representa
co
es

A
co
es
Seja M um conjunto nao-vazio e G um grupo. Uma funcao : G M M e dita ser uma aca
o a
`
esquerda de G sobre M se as seguintes condicoes forem satisfeitas:
1. Para todo g G a funcao (g, ) : M M e bijetora32 .
2. Se e e a identidade de G entao (e, ) : M M e a funcao identidade: (e, x) = x para todo
x M.

32

Para g G fixo, (g, ) : M M denota a funca


o M 3 m 7 (g, m) M , ou seja, a funca
o que a cada m M
associa (g, m) M .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

63/1304

3. Para todos g, h G e todo x M vale


(g, (h, x)) = (gh, x).

(1.23)

Uma funcao : G M M e dita ser uma aca


o a
` direita de G sobre M se as seguintes condicoes
forem satisfeitas
1. Para todo g G a funcao (g, ) : M M e bijetora.
2. Se e e a identidade de G entao (e, ) : M M e a funcao identidade: (e, x) = x para todo
x M.
3. Para todos g, h G e todo x M vale
(g, (h, x)) = (hg, x).

(1.24)

Note-se que a distincao basica entre (1.23) e (1.24) e a ordem do produto no grupo. Se G e Abeliano
nao ha distincao entre uma acao a` direita ou a` esquerda.
E. 1.60 Exerccio. Seja : G M M uma acao `a esquerda de um grupo G em um conjunto M .
Mostre que : G M M definida por (g, x) = (g 1 , x) e uma acao `a direita de G em M .
6

freq
E
uente encontrar-se outras notacoes para designar acoes de grupos em conjuntos. Uma acao a`
esquerda (g, x) e freq
uentemente denotada por g (x), de modo que a relacao (1.23) fica g (h (x)) =
gh (x). Para uma acao a` direita, (1.24) fica g (h (x)) = hg (x).
Talvez a notacao mais conveniente seja denotar uma acao a` esquerda (g, x) simplesmente por g x
ou apenas gx. A relacao (1.23) fica g(hx) = (gh)x. Para uma acao a` direita (g, x) a notacao fica x g,
ou apenas xg, de modo que (1.24) fica (xh)g = x(hg). Essa notacao justifica o uso da nomenclatura a
`
direita ou a
` esquerda para classificar as acoes.

Seja F uma colecao de funcoes bijetoras de um conjunto M em si mesmo. Uma acao : GM M


e dita ser uma aca
o de G em M pela famlia F se para todo g G as funcoes (g, ) : M M forem
elementos do conjunto F.
E. 1.61 Exerccio. Seja G = SO(n) o grupo de todas as matrizes reais n n ortogonais (ou seja, tais
que RT = R1 , onde RT denota a transposta de R). Seja M o conjunto de todas as matrizes reais n n
simetricas (ou seja, tais que AT = A). Mostre que R (A) := RART , com R SO(n) e A M, e uma
acao `a esquerda de G em M . Com as mesmas definicoes, mostre que R (A) := RT AR e uma acao `a direita
de G em M.
Sugest
ao. O u
nico ponto que poderia ser difcil para alguns seria mostrar que, para cada R fixo, R e
bijetora, ou seja, e sobrejetora e injetora. Para mostrar que R e sobrejetora, note que se A e uma matriz
simetrica qualquer, podemos trivialmente escrever A = R(R T AR)RT , mostrando que A = R (B), onde
B = RT AR e simetrica. Para provar que R e injetora note que, se RA1 RT = RA2 RT , segue facilmente,
multiplicando-se por RT `a esquerda e por R `a direita, que A1 = A2 .
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

64/1304

E. 1.62 Exerccio. Seja G = SU(n) o grupo de todas as matrizes complexas n n unitarias (ou seja,
tais que U = U 1 , onde U denota a adjunta de U : U = U T ). Seja M o conjunto de todas as matrizes
complexas n n Hermitianas (ou seja, tais que A = A). Mostre que U (A) := U AU , com U SU(n)
e A M, e uma acao `a esquerda de G em M. Com as mesmas definicoes, mostre que U (A) := U AU e
uma acao `a direita de G em M.
6

Orbita
de uma a
c
ao
Seja G um grupo e : G M M uma acao (`a esquerda ou a` direita) de G sobre um conjunto
nao-vazio M . Para m M , definimos a o
rbita de m pela acao como sendo o conjunto Orb (m) :=
{g (m), g G} M .
Claro esta que para todo m M vale m Orb (m).

E. 1.63 Exerccio. Mostre que para todo m M vale a afirmacao que para todo m 0 Orb (m) tem-se
Orb (m0 ) = Orb (m).
6
E. 1.64 Exerccio. Conclua que se existe m M tal que Orb (m) = M , entao Orb (m0 ) = M para
todo m0 M .
6
Transitividade e Espa
cos Homog
eneos
O fato descrito no Exerccio E. 1.64 conduz naturalmente a`s seguintes definicoes.
Seja G um grupo e : G M M uma acao (`a esquerda ou a` direita) de G sobre um conjunto
nao-vazio M . Dizemos que age transitivamente em M se existir m M tal que { g (m), g G} = M .
Em palavras, age transitivamente em M se existir pelo menos um elemento de M cuja orbita e todo
M . Pelo Exerccio E. 1.63, se um elemento de M possui essa propriedade, entao todos a possuem.
Se uma acao age transitivamente em M dizemos que M e um espaco homogeneo do grupo G pela
a acao , ou simplesmente um espaco homogeneo do grupo G.
Representa
co
es de Grupos
Uma representacao de um grupo e uma acao a esquerda do mesmo em um espaco vetorial pela
famlia das aplicacoes lineares invertveis agindo nesse espaco vetorial.
Sejam G um grupo e V um espaco vetorial sobre um corpo K. Uma representacao de G em V e
uma funcao : G V V tal que para todo g G as funcoes (g, ) : V V sejam lineares e
bijetivas e satisfazem (e, v) = v e (g, (h, v)) = (gh, v) para todos g, h G e todo v V .
Devido a` linearidade e conveniente denotar (g, v) por (g)v. Uma representacao satisfaz assim:

1. Para todo g G, (g) e uma aplicacao linear bijetora de V em V :


(g)(u + v) = (g)u + (g)v
para todos , K e todos u, v V .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

65/1304

2. (e) = , o operador identidade em V .


3. Para todos g, h G vale

(g)(h) = (gh).

Representa
co
es de Algebras
Seja A uma algebra sobre um corpo K e V um espaco vetorial sobre o mesmo corpo. Uma representacao de A em V e uma famlia de funcoes lineares de V em V , {(a), a A}, satisfazendo
1. Para todo a A, (a) : V V e uma aplicacao linear, ou seja
(a)(u + v) = (a)u + (a)v
para todos , K e todos u, v V .
2. Para todos , K e todos a, b A vale
(a + b) = (a) + (b).
3. Para todos a, b A

(ab) = (a)(b).

Uma representacao de uma algebra A em um espaco vetorial V e dita ser uma representaca
o fiel
se (a) = 0 so ocorrer para a = 0.
Uma representacao de uma algebra A em um espaco vetorial V e dita ser uma representaca
o
n
ao-degenerada se (a)v = 0 para todo a A so ocorrer para v = 0.

1.2.7

Morfismos, Homomorfismos, Epimorfismos, Isomorfismos, Monomorfismos, Endomorfismos e Automorfismos

Dos radicais gregos h


omos: semelhante, igual; m
onos: um, sozinho; epi: sobre; sos: semelhante, igual; endon: para dentro, dentro; aut
os:
pr
oprio, mesmo e morph
e: forma.

Nesta secao nos limitaremos a listar algumas definicoes basicas que serao usadas e desenvolvidas no
restante do texto, onde tambem exemplos serao apresentados. A pretensao nao e a de desenvolver os
assuntos, mas de apresentar as definicoes para referencia futura.
Em termos informais um morfismo entre duas estruturas de um mesmo tipo (dois grupos, dois
espacos vetoriais, duas algebras, dois aneis etc.) e uma funcao entre as mesmas que respeita as operacoes
de produto la definidas.
Morfismos em Grupos
Dados dois grupos G e H, com unidades eG e eH , respectivamente, uma funcao : G H e dita
ser um homomorfismo ou morfismo de grupos se (eG ) = eH e se (a b) = (a) (b) para todos
a, b G.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

66/1304

Dados dois grupos G e H, com unidades eG e eH , respectivamente, uma funcao : G H e dita


ser um anti-homomorfismo se (eG ) = eH e se (a b) = (b) (a) para todos a, b G. Por exemplo,
a aplicacao : G G tal que (g) = g 1 e um anti-homomorfismo (verifique).
Um homomorfismo : G H entre dois grupos e dito ser um monomorfismo se for injetivo.
Um homomorfismo : G H entre dois grupos e dito ser um epimorfismo se for sobrejetor.

Um homomorfismo : G H entre dois grupos e dito ser um isomorfismo se for bijetor, em cujo
caso a aplicacao inversa 1 : H G e tambem um homomorfismo.

Se dois grupos G e H forem tais que exista um isomorfismo entre ambos dizemos que G e H sao
isomorfos (por ) e denotamos esse fato por G ' H, ou simplesmente por G ' H.
E. 1.65 Exerccio importante.
equivalencia.

Mostre que a relacao de isomorfia entre grupos e uma relacao de


6

Um homomorfismo de um grupo G em si mesmo : G G e dito ser um endomorfismo de G.


Um isomorfismo de um grupo G em si mesmo : G G e dito ser um automorfismo de G.

Um exemplo basico de automorfismo e o seguinte: seja g G fixo. Definimos g : G G por


g (a) = g 1 ag para todo a G.
E. 1.66 Exerccio. Mostre que para cada g G fixo, g e um homomorfismo e que sua inversa e g1 .
6
Um automorfismo de um grupo G e dito ser um automorfismo interno se for da forma g para
algum g G.
Muitas das definicoes apresentadas acima tem seus analogos em outras estruturas, como espacos
vetoriais, algebras, aneis, modulos etc. Trataremos de alguns casos.
Morfismos em Espa
cos Vetoriais
Sejam U e V dois espacos vetoriais sobre o mesmo corpo K. Uma funcao : U V e dita ser um
homomorfismo ou morfismo de espacos vetoriais se (1 u1 + 2 u2 ) = 1 (u1 ) + 2 (u2 ) para todos
1 , 2 K e todos u1 , u2 U .
Sejam U e V dois espacos vetoriais sobre o mesmo corpo K. Uma funcao : U V e dita ser um
isomorfismo de espacos vetoriais se for um morfismo de espacos vetoriais, e se for bijetora.

Se dois espacos vetoriais U e V sobre o mesmo corpo forem tais que exista um isomorfismo entre
ambos dizemos que U e V sao isomorfos (por ) e denotamos esse fato por U ' V , ou simplesmente
por U ' V .
E. 1.67 Exerccio importante. Mostre que a relacao de isomorfia entre espacos vetoriais e uma relacao
de equivalencia.
6
Em espacos vetoriais os conceitos de mono-, endo- e e automorfismo nao sao muito empregados.
Em verdade, morfismos de espacos vetoriais sao mais freq
uentemente denominados operadores lineares
ou aplicaco
es lineares, como matrizes, por exemplo.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

67/1304

No caso de espacos vetoriais sobre o corpo dos complexos existem tambem os conceitos de antihomomorfismo, anti-isomorfismo etc. Sejam U e V dois espacos vetoriais sobre . Uma funcao :
U V e dita ser um anti-homomorfismo ou anti-morfismo de espacos vetoriais se ( 1 u1 + 2 u2 ) =
1 (u1 )+2 (u2 ) para todos 1 , 2 e todos u1 , u2 U . O conceito de anti-isomorfismo e analogo.

Morfismos em Algebras
Sejam A e B duas algebras (sobre o mesmo corpo K, como espacos vetoriais). Uma funcao :
A B e dita ser um homomorfismo ou morfismo de a
lgebras se for um morfismo de espacos vetoriais
(ou seja (1 a1 + 2 a2 ) = 1 (a1 ) + 2 (a2 ) para todos 1 , 2 K e todos a1 , a2 A) e se
(a1 a2 ) = (a1 ) (a2 ) para todos a1 , a2 A.
Sejam A e B duas algebras sobre o mesmo corpo K. Uma funcao : A B e dita ser um
isomorfismo de a
lgebras se for um morfismo de algebras e se for bijetora.

Se duas algebras A e B sobre o mesmo corpo forem tais que exista um isomorfismo entre ambos
dizemos que A e B sao isomorfas (por ) e denotamos esse fato por A ' B, ou simplesmente por
A ' B.
E. 1.68 Exerccio importante.
equivalencia.

Mostre que a relacao de isomorfia entre algebras e uma relacao de


6

Um morfismo de algebra de uma algebra A em si mesma : A A e dito ser um endomorfismo


de A.

1.3
1.3.1

Cosets, Sub-Grupos Normais e o Grupo Quociente. O


Centro de um Grupo
Cosets

Cosets `
a esquerda, ou left cosets
Seja G um grupo e H um sub-grupo de G. Podemos definir em G uma relacao de equivalencia, que
ndice l denotando left) dizendo que dois elementos x e y de G sao
denotaremos por H
l (o sub-
1
equivalentes se x y H. Representaremos por x H
l y o fato de x e y serem equivalentes no sentido
acima.
E. 1.69 Exerccio importante.
equivalencia.

Verifique que a definicao acima corresponde de fato a uma relacao de


6

Denotemos por (G/H)l a colecao das classes de equivalencia de G pela relacao H


l . O conjunto
(G/H)l e denominado coset a
` esquerda de G por H, ou left coset de G por H.
Seja []l a aplicacao G (G/H)l que associa a cada elemento de G a classe de equivalencia a qual
o elemento pertence. A aplicacao []l e denominada aplicaca
o quociente a
` esquerda associada a H.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

68/1304

Note-se que []l e sobrejetora mas, em geral, nao e injetora, pois se g 0 H


ao [g 0 ]l = [g]l . Com isso,
l g ent
os elementos de (G/H)l poderao ser denotados por [g]l com g G, o que freq
uentemente faremos.
Podemos identificar [g]l com o conjunto gH = {gh, h H} G. De fato, g 0 gH se e somente se
0
existe h H tal que g 0 = gh e, portanto, se e somente se g 1 g 0 H, ou seja, se e somente se g H
l g.

Cosets `
a direita, ou right cosets
Seja G um grupo e H um sub-grupo de G. Podemos definir em G uma relacao de equivalencia, que
denotaremos por H
ndice r denotando right) dizendo que dois elementos x e y de G sao
r (o sub-
equivalentes se xy 1 H. Representaremos por x H
r y o fato de x e y serem equivalentes no sentido
acima.
E. 1.70 Exerccio importante.
equivalencia.

Verifique que a definicao acima corresponde de fato a uma relacao de


6

Denotemos por (G/H)r a colecao das classes de equivalencia de G pela relacao H


r . O conjunto
(G/H)r e denominado coset a
` direita de G por H, ou right coset de G por H.
Seja []r a aplicacao G (G/H)r que associa a cada elemento de G a classe de equivalencia a qual o
elemento pertence. A aplicacao []r e denominada aplicaca
o quociente a
` direita associada a H. Note-se
0
H
que []r e sobrejetora mas, em geral, nao e injetora, pois se g r g entao [g 0 ]r = [g]r . Com isso, os
elementos de (G/H)r poderao ser denotados por [g]r com g G, o que freq
uentemente faremos.
Podemos identificar [g]r com o conjunto Hg = {hg, h H} G. De fato, g 0 Hg se e somente se
existe h H tal que g 0 = hg e, portanto, se e somente se g 0 g 1 H, ou seja, se e somente se g 0 H
r g.
H
Doravante, denotaremos H
l simplesmente por l e r por r , ficando o subgrupo H subentendido.

A
c
ao `
a esquerda de G sobre (G/H)l
sempre possvel definir uma acao a` esquerda de G sobre o coset a` esquerda (G/H) l , a qual age
E
transitivamente em (G/H)l (vide definicao a` pagina 64). Isso faz de (G/H)l um espaco homogeneo de
G (vide definicao a` pagina 64).
Seja G um grupo, H um sub-grupo de G e seja o coset a` esquerda (G/H)l , definido acima. Defina
: G (G/H)l (G/H)l

tal que

G (G/H)l 3 (g, [f ]l ) 7 g ([f ]l ) := [gf ]l (G/H)l .

Entao, define uma acao a` esquerda de G sobre (G/H)l . De fato, tem-se que
1. Para cada g G, g : (G/H)l (G/H)l e bijetora, pois se existem f1 , f2 G tais que
[gf1 ]l = [gf2 ]l , entao gf1 l gf2 , ou seja, (gf1 )1 (gf2 ) H, ou seja, (f1 )1 f2 H. Isso estabelece
que f1 l f2 , ou seja, que [f1 ]l = [f2 ]l , provando que g : (G/H)l (G/H)l e injetora. Note-se
que g : (G/H)l (G/H)l e sobrejetora, pois g ([g 1 f ]l ) = [f ]l e variando f em G, [f ]l varre
todo (G/H)l .
2. Para a identidade e G, e ([f ]l ) = [ef ]l = [f ]l para todo f G, provando que e : (G/H)l
(G/H)l e a aplicacao identidade.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

69/1304

3. Para todos g, h G vale g (h ([f ]l )) = g ([hf ]l ) = [ghf ]l = gh ([f ]l ) para qualquer f G.


Isso provou que : G (G/H)l (G/H)l e uma acao a` esquerda de G em (G/H)l .

Nao e difcil ver que a acao age transitivamente em (G/H)l . De fato, se e e a unidade de G, entao
g ([e]l ) = [g]l e variando g por todo G a imagem [g]l varre todo (G/H)l .
A
c
ao `
a direita de G sobre (G/H)r

sempre possvel definir uma acao a` direita de G sobre o coset a` direita (G/H) r , a qual age
E
transitivamente em (G/H)r (vide definicao a` pagina 64). Isso faz de (G/H)r um espaco homogeneo de
G (vide definicao a` pagina 64).
Seja G um grupo, H um sub-grupo de G e seja o coset a` direita (G/H)r , definido acima. Defina
: G (G/H)r (G/H)r

tal que

G (G/H)r 3 (g, [f ]r ) 7 g ([f ]r ) := [f g]r (G/H)r .

Entao, define uma acao a` direita de G sobre (G/H)r . De fato, tem-se que
1. Para cada g G, g : (G/H)r (G/H)r e bijetora, pois se existem f1 , f2 G tais que
[f1 g]r = [f2 g]r , entao f1 g r f2 g, ou seja, (f1 g)(f2 g)1 H, ou seja, f1 (f2 )1 H. Isso
estabelece que f1 r f2 , ou seja, que [f1 ]r = [f2 ]r , provando que g : (G/H)r (G/H)r e
injetora. Note-se que g : (G/H)r (G/H)r e sobrejetora, pois g (f [g 1 ]r ) = [f ]r e variando f
em G, [f ]r varre todo (G/H)r .
2. Para a identidade e G, e ([f ]r ) = [f e]r = [f ]r para todo f G, provando que e : (G/H)r
(G/H)r e a aplicacao identidade.
3. Para todos g, h G vale g (h ([f ]r )) = g ([f h]r ) = [f hg]r = hg ([f ]r ) para qualquer f G.
Isso provou que : G (G/H)r (G/H)r e uma acao a` direita de G em (G/H)r .

Nao e difcil ver que a acao age transitivamente em (G/H)r . De fato, se e e a unidade de G,
entao g ([e]r ) = [g]r e variando g por todo G a imagem [g]r varre todo (G/H)r .
*
Os cosets (G/H)l e (G/H)r podem ser identificados e transformados em grupos se uma certa
hipotese for feita sobre o sub-grupo H e sua relacao com G. Esse e nosso assunto na Secao 1.3.2.

1.3.2

Subgrupos Normais e o Grupo Quociente

Sub-Grupos Normais
Seja G um grupo. Um subgrupo N de G e dito ser um subgrupo normal se gng 1 N para todo
g G e todo n N . Se N e um sub-grupo normal de G denotamos esse fato escrevendo N  G.
Observe que todo sub-grupo de um grupo Abeliano G e normal.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

70/1304

E. 1.71 Exerccio. Sejam G e H dois grupos e : G H um homomorfismo. Mostre que Ran () :=


{(g)| g G} e um sub-grupo de H.
6
E. 1.72 Exerccio importante. Sejam G e H dois grupos e : G H um homomorfismo. Seja e H a
unidade de H. Mostre que Ker () := {g G| (g) = eH } e um sub-grupo normal de G.
6
Nota sobre a nomenclatura dos dois exerccios acima.

O smbolo Ran provem da palavra inglesa range (alcance, em portugues) e e

freq
uentemente empregado como sin
onimo da imagem de uma funca
o ou aplicaca
o. O smbolo Ker provem do ingles kernel (n
ucleo ou
caroco, em portugues).

Cosets por subgrupos normais


Nesse contexto, a seguinte proposicao e fundamental.
Proposi
c
ao 1.8 Seja G um grupo e seja N um sub-grupo de G. Ent
ao, uma condica
o necess
aria e
suficiente para que possamos identificar (G/N )l com (G/N )r , ou seja, para que tenhamos [g]l = [g]r
para todo g G, e que N  G, ou seja, que N seja um sub-grupo normal de G.
2
Prova. Por definicao, g 0 [g]l se e somente existe n N tal que g 1 g 0 = n, o que e verdade se e
somente se g 0 g 1 = gng 1 . Mas g 0 [g]r se e somente se g 0 g 1 N . Assim [g]l = [g]r para todo g G
se e somente se gng 1 N para todo g G e n N , o que e verdade se somente se N e um subgrupo
normal de G.
Com isso, caso N  G, definimos [g] := [g]l = [g]r para todo g G e definimos o coset de G por N
por G/N := (G/N )l = (G/N )r , ou seja, G/N = {[g], g G}.
Advert
encia. O leitor deve ser advertido aqui que, infelizmente, e comum na literatura denotar o
coset a` esquerda (G/H)l por G/H, mesmo quando H nao e normal (vide, por exemplo, [119] ou [57],
entre outros). Evitaremos fazer isso, pois isso pode levar a uma confusao de conceitos.
A
co
es `
a direita e `
a esquerda sobre o coset por um subgrupo normal
Se H e um subgrupo qualquer de G, definimos paginas acima uma acao transitiva a` esquerda
: G (G/H)l (G/H)l e uma acao transitiva a` direita : G (G/H)r (G/H)r . Fica claro
pela Proposicao 1.8 que se N  G, podemos definir tanto
: G (G/N ) G/N

tal que

G (G/N ) 3 (g, [f ]) 7 g ([f ]) := [gf ] G/N

como uma acao a` esquerda de G sobre G/N quanto


: G (G/N ) G/N

tal que

G (G/N ) 3 (g, [f ]) 7 g ([f ]) := [f g] G/N

como uma acao a` direita de G sobre G/N . Ambas as acoes agem transitivamente.
O Grupo Quociente de G por N

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

71/1304

Sub-grupos normais sao importantes, pois com eles podemos fazer da colecao de classes de equivalencia G/N um grupo, denominado grupo quociente de G por N . A construcao e a seguinte.

Seja N  G. Podemos fazer de G/N um grupo definindo o produto como [g]N [h]N = [gh]N . E
muito facil ver que, se esta expressao esta bem definida, ela de fato representa um produto associativo
na colecao de classes de equivalencia G/N . O elemento neutro seria a classe [e] N , onde e e a identidade
1
de g. Por fim, [g]1
ao trivial e mostrar que a definicao de produto como
N = [g ]N . O ponto n
[g]N [h]N = [gh]N faz sentido, ou seja, e independente dos elementos tomados nas classes de g e h. Para
isso precisaremos que N seja normal.
O que temos de fazer e mostrar que se g 0 N g e h0 N h entao g 0 h0 N gh, ou seja, precisamos
mostrar que se g 0 g 1 N e h0 h1 N entao g 0 h0 (gh)1 N . Mas, de fato, tem-se que
g 0 h0 (gh)1 = g 0 h0 h1 g 1 = (g 0 g 1 )[g(h0 h1 )g 1 ].
Agora, por hipotese, h0 h1 N . Da, como N e normal (e aqui que essa hipotese entra pela primeira
vez), g(h0 h1 )g 1 N . Como, tambem pela hipotese, g 0 g 1 N e N e um sub-grupo, conclumos que
g 0 h0 (gh)1 N , ou seja, g 0 h0 N gh. Assim [g]N [h]N = [gh]N esta bem definido e faz das classes G/N
um grupo. Esse grupo e denominado de grupo quociente de G por N .
A nocao de grupo quociente e muito importante na teoria de grupos e iremos explorar algumas das
aplicacoes nessas notas. Adiante usaremo-la para construir a nocao de produto tensorial e soma direta
de varios objetos, tais como grupos, algebras etc. A nocao de grupo quociente e importante por permitir
estudar a relacao de certos grupos entre si. Mais adiante, por exemplo, mostraremos que o grupo SO(3)
e isomorfo ao grupo SU (2)/{ , }, um resultado de direto interesse fsico na Mecanica Quantica. A
nocao de grupo quociente e tambem muito importante em problemas combinatorios envolvendo grupos,
mas nao falaremos disso aqui. Para uma discussao mais ampla, vide [118], [119] ou [97].

1.3.3

O Centro de um Grupo. Centralizadores e Normalizadores

O Centro de um Grupo
Seja G um grupo. O conjunto dos elementos de G que tem a propriedade de comutarem com todos
os elementos de G e denominado o centro do grupo G e e freq
uentemente denotado por 33 Z(G). Em
smbolos:
Z(G) := {h G| hg = gh para todo g G} .
Note que Z(G) nunca e um conjunto vazio, pois o elemento neutro de G sempre pertence e Z(G).
Em alguns grupos, porem, esse pode ser o u
nico elemento de Z(G). Esse e o caso, por exemplo, do
grupo de permutacoes de n elementos (por que?).
E. 1.73 Exerccio. Mostre que Z(G) e sempre um subgrupo Abeliano de G.

elementar constatar que para qualquer grupo G, seu centro Z(G) e um subgrupo normal de G.
E

E igualmente elementar constatar que se G e Abeliano entao Z(G) = G.


33

O emprego da letra Z provavelmente provem da palavra alem


a Zentrum.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

72/1304

Centralizadores e Normalizadores
Seja G um grupo e F um sub-conjunto nao vazio de G.
Dado um elemento h G, denotamos por hF h1 o conjunto de todos os elementos de G que sejam
da forma hf h1 para algum f F , ou seja, hF h1 := {hf h1 , f F }.

O chamado normalizador de F (em G), denotado por N (F, G) (ou simplesmente por N (F ), quando
G e subentendido), e o conjunto de todos os elementos g G tais que gF g 1 = F .
O chamado centralizador de F (em G), denotado por C(F, G) (ou simplesmente por C(F ), quando
G e subentendido), e o conjunto de todos os elementos de G que comutam com todos os elementos de
F:
C(F, G) := {g G| gf = f g para todo f F }.
E. 1.74 Exerccio. Mostre que o centralizador de F G e um sub-grupo de G.

E. 1.75 Exerccio. Se F G, mostre que o normalizador N (F ) N (F, G) de F em G e um sub-grupo


de G. Mostre que se F e um subgrupo de G entao F e normal em relacao a N (F ) (ou seja, F  N (F )) e
que se H e um subgrupo de G tal que F e normal em relacao a H (ou seja, F  H), entao H N (F ) e,
portanto, N (F ) e o maior subgrupo de G em relacao ao qual F e normal.
6
O Centro de GL( , n)
Como exerccio vamos determinar o centro de GL( , n). Se A Z(GL( , n)) entao AB = BA
para toda B GL( , n). Tomemos, em particular, uma matriz B da forma B = + E a, b , onde E a, b ,
com a, b {1, . . . , n}, e a matriz cujo elemento ij e nulo a menos que i = a e que j = b, em cujo
caso (E a, b )ij = 1. Em smbolos, (E a, b )ij = ia jb . (Antes de prosseguir, convenca-se que + E a, b
GL( , n), notando que det( + E a, b ) 6= 0). Agora, como AB = BA, segue que AE a, b = E a, b A. Pela
regra de produto de matrizes, isso significa
(AE a, b )ij =

n
X
k=1

Aik (E a, b )kj =

n
X

Aik ka jb = Aia jb

k=1

q
(E

a, b

A)ij

n
n
X
X
a, b
=
(E )ik Akj =
ia kb Akj = Abj ia .
k=1

k=1

Assim, Aia jb = Abj ia . Tomando-se j = b, conclumos Aia = Abb ia . Como a e b sao arbitrarios,
conclumos dessa igualdade que Abb = , constante independente de b. Da, Aia = ia , o que significa
que A = . Como det(A) 6= 0, devemos ter 6= 0.
Para futura referencia expressamos nossas conclusoes na forma de uma proposicao:

Proposi
c
ao 1.9 O centro do grupo GL( , n), ou seja, Z(GL( , n)), coincide com o conjunto de
todas as matrizes da forma , com 6= 0, ou seja, e o conjunto das matrizes n
ao-nulas que s
ao

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

73/1304

m
ultiplos da unidade. Em smbolos,
Z(GL( , n)) = { , , 6= 0} .
Como conseq
uencia podemos afirmar que se uma matriz A Mat ( , n) comuta com todas as demais
matrizes de Mat ( , n) ent
ao A = para algum .
2
E. 1.76 Exerccio. Mostre que o centro de SL( , n) e o conjunto de todas as matrizes da forma ,
com satisfazendo n = 1. Mostre que esse grupo e isomorfo ao grupo n .
6
E. 1.77 Exerccio. Mostre que o centro de SL( , n) e o conjunto de todas as matrizes da forma ,
com satisfazendo n = 1. Esse grupo e { } quando n e mpar e { , } quando n e par. (Lembre-se
que SL( , n) e formado apenas por matrizes reais).
6


1.4

O Produto Direto e o Produto Semi-Direto de Grupos

Vamos aqui descrever dois procedimentos importantes que permitem construir um grupo a partir de
dois outros grupos dados.
por vezes muito
Sejam G e H dois grupos, cujas identidades sao eG e eH , respectivamente. E
importante fazer do produto Cartesiano G H um grupo.
O Produto Direto de Grupos
A maneira mais facil e definir o produto de dois pares ordenados (g1 , h1 ), (g2 , h2 ), com g1 , g2 G
e h1 , h2 H, por
(g1 , h1 ) (g2 , h2 ) := (g1 g2 , h1 h2 ).
O leitor pode facilmente se convencer que esse produto e associativo, que (e G , eH ) e o elemento neutro
e que (g, h)1 = (g 1 , h1 ).
Isso faz de G H um grupo, denominado produto direto de G e H. Esse grupo e por vezes denotado
por G H.
E. 1.78 Exerccio. Mostre que G H e H G sao isomorfos.

A definicao acima pode ser amplamente generalizada. Seja Gs ,Qs , uma colecao de grupos
indexados por s . ConsideremosSo produto Cartesiano G := s Gs , definido como sendo a
colecao de todasQas funcoes f :Q
s Gs , com f (s) Gs . Entao, podemos fazer de G um grupo
definindo para
s f1 (s) ,
s f2 (s) G o produto
!
!
!
Y
Y
Y
f1 (s)
f2 (s) =
f1 (s)f2 (s) .
s

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

74/1304

Como facilmente se ve, esse produto faz de G um grupo, denominado produto direto da colecao de
grupos Gs , s .
O Produto Semi-Direto de Grupos
Dados dois grupos G e H ha uma outra maneira de fazer de G H um grupo alem do produto
direto. Para tal e necessario que exista uma acao de G em H por automorfismos de H. Expliquemos
melhor isso.
Lembremos que um automorfismo de um grupo H e um isomorfismo de H em si mesmo : H
H. Uma acao (`a esquerda) de G sobre H por automorfismos e um funcao : G H H tal que a
cada par (g, h) G H associa um elemento denotado por g (h) de H de tal forma que as seguintes
condicoes sejam satisfeitas:
1. Para todo g G, a funcao g () : H H e um automorfismo de H, ou seja, g (h)g (h0 ) =
g (hh0 ), sendo que g () : H H e bijetora com (g )1 = g1 .
2. Para todo h H vale eG (h) = h.
3. Para todo h H vale g (g0 (h)) = gg0 (h) para quaisquer g, g 0 G.
Acima eG e eH sao as unidades de G e H, respectivamente.
E. 1.79 Exerccio-exemplo. Um exemplo importante e o seguinte. Seja N  G. Entao, com n N ,
g (n) := gng 1 define uma acao (`a esquerda) de G sobre N por automorfismos. Verifique!
6
Pela definicao geral, tem-se pelas propriedades 1, 2 e 3 acima que para quaisquer g G e h H
g (eH )h = g (eH )g (g1 (h)) = g (eH g1 (h)) = g (g1 (h)) = h,
o que implica g (eH ) = eH para todo g G.

Se G e H sao grupos e : G H H e uma acao a` esquerda de G sobre H por automorfismos,


entao podemos definir em GH um produto de dois pares ordenados (g1 , h1 ), (g2 , h2 ), com g1 , g2 G
e h1 , h2 H, por
(g1 , h1 ) (g2 , h2 ) := (g1 g2 , h1 g1 (h2 )).
E. 1.80 Exerccio importante. Mostre que esse produto e associativo, que (e G , eH ) e a unidade e que
para quaisquer g G, h H tem-se (g, h)1 = (g 1 , g1 (h1 )).
6
Com isso G H adquire a estrutura de um grupo, denominado produto semi-direto de G por H
pelo automorfismo : G H H, ou simplesmente produto semi-direto de G por H quando um
automorfismo : G H H especfico e subentendido. Na literatura o produto semi-direto de G por
H e denotado de varias formas: por G H, por G H, por Gs H, ou por por GsH quando um
automorfismo : G H H especfico e subentendido. Nestas notas adotaremos as duas u
ltimas
formas.
Exemplos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

75/1304

I. Seja G um grupo e N  G. Entao, para g1 , g2 G e n1 , n2 N o produto


(g1 , n1 ) (g2 , n2 ) := (g1 g2 , n1 g1 n2 g11 )

define o grupo GsN , produto semi-direto de um grupo G por um sub-grupo normal N atraves do
automorfismo natural.
II. Considere o grupo G, formado por todos os n
umeros reais nao-nulos com o produto dado pela
multiplicacao usual e o grupo H, formado por todos os reais com o produto dado pela soma: G =
( \ {0}, ) e H = ( , +).


Para todo a \ {0} e x definimos : G H H por a (x) := ax. Para cada a G, tem-se
que a e bijetora, com inversa dada por 1/a . Fora isso, a (x) + a (y) = ax + ay = a(x + y) = a (x + y).
Assim, a e um automorfismo (condicao 1. da definicao acima). Fora isso, para todo x H, 1 (x) = x
(condicao 2.). Por fim, para todo x H, a (b (x)) = abx = ab (x), para quaisquer a, b G (condicao
3.). Conclumos que e uma acao a` esquerda de G sobre H por automorfismos.


Assim, fazemos de G H um grupo Gs H com o produto


(a, x) (b, y) := (ab, x + ay) .
O elemento neutro e o par (1, 0) e (a, x)1 = (1/a, x/a).

Para interpretar o que esse grupo Gs H significa, vamos definir uma acao34 de Gs H sobre o
conjunto da seguinte forma. Para (a, x) Gs H e z , definimos


((a, x), z) := az + x.
Para verificar que isso e uma acao notemos as seguintes propriedades: i. para cada (a, x) fixo
((a, x), z) e uma funcao bijetora de
em
(lembre-se que a 6= 0). ii. Para todo z ,
((1, 0), z) = z.


iii.

((a, x), ((b, y), z)) = ((a, x), bz + y) = a(bz + y) + x = abz + (x + ay)
= ((ab, x + ay), z) = ((a, x) (b, y), z).

Isso mostrou que e uma acao de Gs H sobre o conjunto . Como vemos, a acao de um elemento
(a, x) consiste em uma combinacao de uma multiplicacao por a 6= 0 seguida por uma translacao por
x . Isso exibe o significado geometrico do grupo Gs H. Vamos a um outro exemplo semelhante.


III. Considere o conjunto de todas as operacoes do espaco tridimensional que envolvem rotacoes e
translacoes. Por exemplo, considere-se a operacao na qual cada vetor ~x e primeiramente rodado por
uma matriz de rotacao R SO(3) e em seguida e transladado por um vetor ~x0 :
~x 7 R~x + ~x0 .

(1.25)

A composicao de duas de tais operacoes conduz a` transformacao ~x 7 R 0 (R~x + ~x0 ) + ~x00 , ou seja,
~x 7 (R0 R)~x + ~x00 + R0 ~x0 .
34

O conceito de aca
o de um grupo em um conjunto foi definido a
` p
agina 62.

(1.26)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

76/1304

O espaco vetorial 3 e naturalmente um grupo Abeliano em relacao a` adicao de vetores. Se R


SO(3), R (~x0 ) := R~x0 define uma acao por automorfismos de SO(3) sobre 3 . A expressao (1.26)
inspira a definicao do produto semi-direto SO(3)s 3 por


(R0 , ~x00 ) (R, ~x0 ) = (R0 R, ~x00 + R0~x0 ).


E. 1.81 Exerccio. Verifique que a transformacao (1.25) define uma acao `a esquerda do grupo SO(3)s 3
6
sobre o conjunto 3 .


Defini
c
ao. Os grupos En := SO(n)s

n


sao denominados grupos Euclidianos3536 .

IV. Seja V um espaco vetorial (e, como tal, um grupo Abeliano em relacao a` soma de vetores) e seja
Aut(V ) a colecao de todas as aplicacoes lineares bijetoras de V em V .
Por exemplo V =

n


e Aut(

n


) e o conjunto de todas as matrizes reais n n invertveis.

Entao, fazemos de Aut(V ) V um grupo, definindo

(A, v) (B, u) := (AB, v + Au).


Esse grupo e por vezes denominado grupo afim do espaco vetorial V .
Observaca
o. O caso V =


corresponde exatamente ao exemplo II, acima.

Mencionamos, por fim, que o grupo de Poincare, introduzido a` pagina 730, e tambem um exemplo
de um grupo definido como um produto semi-direto de dois grupos, a saber, o produto semi-direto do
grupo das transformacoes de Lorentz com grupo das translacoes no espaco-tempo.

1.5
1.5.1

Somas Diretas e Produtos Tensoriais


Discuss
ao Informal Preliminar

Nesta secao apresentaremos duas maneiras distintas de construir grupos Abelianos a partir de dois
grupos Abelianos dados, que sao o chamado produto tensorial de dois grupos e a chamada soma direta
de dois grupos. As construcoes precisas (especialmente a do produto tensorial) sao um tanto elaboradas,
mas as ideias por tras delas sao simples, de modo que tentaremos primeiramente apresenta-las de modo
elementar para depois (a partir da Secao 1.5.2) nos dedicarmos a` sua definicao precisa.
Essas construcoes prestam-se tambem a definir o produto tensorial e a soma direta de espacos
vetoriais (sobre um mesmo corpo), o que tambem discutiremos.
Na Secao 1.5.5 serao apresentadas mais generalizacoes envolvendo (uma colecao arbitraria) de grupos
nao necessariamente Abelianos.
Um comentario pertinente (destinado aos estudantes mais avancados) e que as construcoes de
produto tensorial e soma direta de espacos vetoriais que apresentaremos adiante correspondem a`s nocoes
35
36

Euclides de Alexandria ( 325 A.C, 265 A.C.).


Para alguns autores, os grupos Euclidianos s
ao os grupos O(n)s

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

77/1304

de produto tensorial e soma direta algebricos. Isso significa que outras estruturas, como uma topologia,
ou propriedades, como completeza, nao sao necessariamente herdadas pela construcao. Assim, por
exemplo, o produto tensorial algebrico de dois espacos de Banach nao e necessariamente um espaco de
Banach. Para tal e necessario introduzir um completamento extra, que pode nao ser u
nico.
A No
c
ao de Soma Direta de Dois Grupos
Sejam A e B dois grupos Abelianos, com identidades eA e eB (e cujas operacoes de produto denotaremos ambas pelo mesmo smbolo +). Desejamos encontrar uma maneira de fazer do produto
Cartesiano A B um grupo tambem. Uma maneira de fazer isso e definir a soma de dois pares
ordenados (a, b), (a0 , b0 ) A B por
(a, b) + (a0 , b0 ) := (a + a0 , b + b0 ).

(1.27)

O leitor pode facilmente constatar que essa operacao e uma operacao binaria de A B em si mesmo,
que ela e associativa, que tem por elemento neutro o par (eA , eB ) e que para cada (a, b) A B
a inversa e (a, b)1 = (a, b), onde a e o elemento inverso de a em A, e analogamente para b.
Portanto, com esse produto, A B e um grupo.

Com essa estrutura, facilmente se verifica que A B torna-se um grupo Abeliano, denominado
soma direta de A e B ou produto direto de A e B 37 e denotado pelo smbolo A B. Com essa estrutura
de grupo em mente, os pares ordenados (a, b) sao freq
uentemente denotados pelo smbolo a b.
A No
c
ao de Soma Direta de Dois Espa
cos Vetoriais
Sejam U e V dois espacos vetoriais em relacao a um mesmo corpo que, sem perda de generalidade,
consideraremos doravante como sendo o corpo dos complexos. U e V sao dois grupos Abelianos em
relacao a`s respectivas operacoes de soma de vetores. Assim, pela construcao acima, podemos definir o
grupo U V . Esse objeto ainda nao tem uma estrutura de espaco vetorial (sobre os complexos), pois
nao dissemos como definir o produto de um elemento de U V por um escalar . Isso e feito da
seguinte forma, para u U , v V , define-se (u v) por
(u v) := (u) (v).

(1.28)

E. 1.82 Exerccio.
Constate que, com essa definicao, U V torna-se um espaco vetorial, ou seja,
verifique que sao validos os postulados da definicao formal de espaco vetorial dados `a pagina 55.
6
Esse espaco vetorial que denotaremos por U V , e denominado soma direta dos espacos U e V
ou produto direto38 de U e V .


A No
c
ao de Produto Tensorial de Dois Grupos
37

A distinca
o entre produto direto e soma direta s
o se faz quando uma coleca
o n
ao-finita de grupos e envolvida. Vide
Seca
o 1.5.5.
38
A distinca
o entre produto direto e soma direta s
o se faz quando uma coleca
o n
ao-finita de espacos vetoriais e
envolvida. Vide Seca
o 1.5.5.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

78/1304

A definicao de produto tensorial de dois grupos Abelianos A e B, que denotaremos por A B,


e distinta da de soma direta. A ideia basica, porem, e a mesma, ou seja, tentar fazer do produto
Cartesiano A B um grupo, mas a regra de produto e muito diferente daquela dada em (1.27). Em
primeiro lugar, os elementos de A B sao somas formais finitas de pares ordenados de A B como
(a, b) + (a0 , b0 ),

mas nao impomos a relacao (1.27). O que realmente entendemos por soma formal sera explicado
adiante, quando definirmos o conceito de grupo Abeliano livremente gerado por um conjunto, uma
nocao muito simples. Por ora fiquemos apenas com a nocao intuitiva. Para dar a A B uma estrutura
de grupo, desejamos impor algumas condicoes a`s somas formais acima. Primeiramente impomos que
(a, b) + (a0 , b0 ) = (a0 , b0 ) + (a, b),
para todos a, a0 A, b, b0 B. Em segundo lugar, impomos que
(a + a0 , b) = (a, b) + (a0 , b)

e que
(a, b + b0 ) = (a, b) + (a, b0 )
para todos a, a0 A, b, b0 B. O estudante deve notar que essas imposicoes sao mais limitadas que
aquelas de (1.27). Note tambem que as imposicoes acima sao inspiradas na bem-conhecida propriedade
de transitividade de produtos e somas de n
umeros reais ou complexos: (x+x0 )y = xy +x0 y e x(y +y 0) =
0
xy + xy .
E. 1.83 Exerccio. Mostre que com as regras de soma dadas acima todos os pares (e A , b) e (a, eB )
sao identificados entre si e com o elemento neutro da operacao de soma de pares ordenados. Fora isso, o
elemento inverso de um par (a, b) e (a, b) = (a, b). Mostre que, com isso, A B e um grupo Abeliano,
denominado Produto Tensorial dos Grupos Abelianos A e B.
6
Com essa estrutura de grupo em mente, os pares ordenados (a, b) sao freq
uentemente denotados
pelo smbolo a b.
A No
c
ao de Produto Tensorial de Dois Espa
cos Vetoriais
Sejam U e V dois espacos vetoriais em relacao a um mesmo corpo que, sem perda de generalidade,
consideraremos doravante como sendo o corpo dos complexos. U e V sao dois grupos Abelianos em
relacao a`s respectivas operacoes de soma de vetores. Assim, pela construcao acima, podemos definir o
grupo U V . Esse objeto ainda nao tem uma estrutura de espaco vetorial (sobre os complexos), pois
nao dissemos como definir o produto de um elemento de U V por um escalar . Isso e feito da
seguinte forma, para u U , v V , define-se (u v) impondo
(u v) := (u) (v) = (u) (v).

(1.29)

O estudante deve comparar essa regra de produto por escalares com a regra 1.28.
Para elementos de U V que sejam somas finitas, como por exemplo u v + u0 v 0 , impomos
(u v + u0 v 0 ) := (u v) + (u0 v 0 )

= (u) v + (u0 ) v 0 = u (v) + u0 (v 0 ).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

79/1304

E. 1.84 Exerccio.
Constate que, com essa definicao, U V torna-se um espaco vetorial, ou seja,
verifique que sao validos os postulados da definicao formal de espaco vetorial dados `a pagina 55.
6
Esse espaco vetorial que denotaremos por U V , e denominado produto tensorial dos espacos U
e V.


*
Vamos agora tentar formalizar as nocoes que apresentamos acima, apresentando suas definicoes
matematicas precisas. O leitor que acredita ter entendido o que apresentamos acima pode dispensar-se
de ler o restante da presente secao.

1.5.2

Grupos Gerados por Conjuntos. Grupos Gerados por Rela


co
es

Suporte de uma fun


c
ao
Seja f : X G uma funcao de um conjunto nao-vazio X em um grupo G. O suporte de f , denotado
por supp (f ), e o conjunto de todos os pontos x X tais que f (x) 6= e, onde e e a unidade de G:
supp (f ) := {x X| f (x) 6= e}. Uma funca
o f : X G e dita ser de suporte finito se seu suporte for
um conjunto finito.
Grupo Abeliano Livremente Gerado por um Conjunto
Uma nocao importante que usaremos adiante e a de grupo Abeliano livremente gerado por um
conjunto X. Seja X um conjunto. Seja F (X) a colecao de todas as funcoes de suporte finito de X
facil ver que F (X) tem naturalmente uma estrutura de grupo Abeliano, definindo, para f ,
em . E
0
f F (X) o produto de f e f 0 como sendo o elemento f f 0 = (f + f 0 ) de F (X) dado por
(f + f 0 )(x) = f (x) + f 0 (x).

(1.30)

claro que esse (f + f 0 ) tem suporte finito. O elemento neutro e de F (X) e


para todo x X. E
claramente a funcao identicamente nula. Pelo fato de F (X) ter essa estrutura natural de grupo F (X)
e denominado grupo Abeliano livremente gerado pelo conjunto X.
Para x X vamos denotar por x a funcao caracterstica de x:

1, se y = x
x (y) :=
.
0, se y 6= x

(1.31)

Claramente x F (X). Dado que cada f F (X) tem suporte finito, pode-se escreve-lo da forma
f =

N
X

a n xn ,

(1.32)

n=1

para valores de N e dos an s dependentes de f , com {x1 , . . . , xN } = supp f e com ai


i = 1, . . . , N .

para

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

80/1304

Com um flagrante abuso de linguagem e costume escrever (1.32) da forma


f =

N
X

a n xn ,

(1.33)

n=1

onde fica, por assim dizer, subentendido que aqui os xn s representam nao os elementos de X mas sim
suas funcoes caractersticas (X pode ser um conjunto qualquer, de modo que operacoes como soma de
elementos de X ou multiplicacao de elementos de X por um inteiro podem nao serem sequer definidas).
facil verificar que F (X) e um grupo Abeliano livre (da seu nome), o que quer dizer que nao ha em
E
F (X) nenhuma relacao nao trivial entre seus elementos, a nao ser aquela que lhe confere Abelianidade:
f f 0 f 1 f 0 1 = e.
Rela
co
es e Grupos Gerados M
odulo Rela
co
es
Vamos passar agora a uma construcao muito importante, a de grupo Abeliano livremente gerado
por um conjunto modulo relacoes. Vamos apresentar essa construcao de forma bem geral.
Seja J um conjunto (em princpio arbitrario) de ndices e sejam entao, para cada j J, elementos
de F (X) dados por
n(j)
X
j, i xj, i
(1.34)
rj =
i=1

onde, para cada j J, n(j) e, para todo j J e i {1, . . . , n(j)}, tem-se j, i e xj, i X com
xj, i 6= xj, i0 se i 6= i0 . Denotamos R := {rj , j J}. Os elementos de R serao chamados relacoes.


Seja entao R o subgrupo de F (X) formado por todos os elementos de F (X) que sao combinacoes
lineares finitas de rj s com coeficientes em :

para certos si

em

s R s = s1 rj1 + + sm rjm ,

(1.35)

, que dependem de s. R e dito ser o subgrupo de F (X) gerado pelos rj s.

Por ser um subgrupo de um grupo Abeliano, R e normal. Assim, podemos definir o grupo Abeliano
livremente gerado por X, m
odulo as relaco
es R como sendo o grupo F (X)/R. Note-se que [R] R = e,
o que equivale a dizer que os elementos de R sao identificados como zero (da serem chamados de
relacoes, pois refletem identidades que nao existiam em F (X) e que estao sendo agora impostas em
F (X)/R).
*
Vamos ilustrar as definicoes e construcoes acima apresentando as definicoes de soma direta e produto
tensorial de dois grupos Abelianos e, em seguida, de dois espacos vetoriais. As definicoes de acima sao
particularmente relevantes para o conceito de produto tensorial.

1.5.3

Somas Diretas

A Soma Direta de dois Grupos Abelianos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

81/1304

Sejam A e B dois grupos Abelianos cujo produto de grupo denotaremos aditivamente: com o
smbolo +. Seja X = A B. Seja em F (X) = F (A B) o conjunto R de relacoes dado por
R

:=

{r F (X)| r = (a + a0 , b + b0 ) (a, b) (a0 , b0 ), com a, a0 A e b, b0 B}. (1.36)

Seja R = R(A B) o subgrupo de F (A B) gerado por R. Chegamos assim a` definicao do grupo


Abeliano A B, a soma direta de A e B, que e definido como A B := F (A B)/R(A B).
Notaca
o. Para a A e b B denotaremos por a b o elemento de A B que corresponde (na notacao
discutida acima) a` funcao (a, b) .
A Soma Direta de dois Espa
cos Vetoriais
Sejam U e V dois espacos vetoriais (sobre ). Como U e V sao dois grupos Abelianos, o grupo
Abeliano U V esta definido pelo procedimento acima. Isso, entretanto, ainda nao faz de U V um
espaco vetorial.
Para isso e preciso definir o produto de um escalar por um elemento de U V . Definimos entao o
produto de um escalar por um elemento u v U V como sendo o elemento (u) (v), ou
seja,
(u v) := (u) (v).
facil constatar que, com essa definicao, U V torna-se um espaco vetorial (vide a definicao formal
E
de espaco vetorial a` pagina 55), que denotaremos por U V . O assim definido espaco vetorial U V
e denominado a soma direta dos espacos vetoriais U e V sobre o corpo .


1.5.4

Produtos Tensoriais

A definicao de produtos tensoriais e mais delicada e faz uso mais forte do conceito de grupo livremente
gerado por um conjunto.
O Produto Tensorial de dois Grupos Abelianos
Sejam A e B dois grupos Abelianos cujo produto de grupo denotaremos aditivamente: com o
smbolo +. Seja X = A B. Seja em F (X) = F (A B) o conjunto R de relacoes dado por
R

:=

{r F (X)| r = (a + a0 , b) (a, b) (a0 , b)


ou r = (a, b + b0 ) (a, b) (a, b0 ), com a, a0 A e b, b0 B}.

(1.37)

Seja R = R(A B) o subgrupo de F (A B) gerado por R. Chegamos assim a` definicao do grupo


Abeliano A B, o produto tensorial de A e B, que e definido como A B := F (A B)/R(A B).
Notaca
o. Para a A e b B denotaremos por a b o elemento de A B que corresponde (na notacao
discutida acima) a` funcao (a, b) .
O Produto Tensorial de dois Espa
cos Vetoriais

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

82/1304

Sejam U e V dois espacos vetoriais (sobre ). Como U e V sao dois grupos Abelianos, o grupo
Abeliano U V esta definido pelo procedimento da u
ltima sub-secao. Isso, entretanto, ainda nao faz
de U V um espaco vetorial. Para isso tomemos X = U V e consideremos o sub-espaco de F (X)
definido por
R := {r F (U V )| r = (u) v u (v), com , u U, v V }.

(1.38)

Como antes, seja R = R(U V ) o subgrupo gerado por R. Definimos agora um novo grupo Abeliano
U V como U V := F (U V )/R(U V ).


U V e por ora apenas mais um grupo Abeliano, mas podemos adicionar-lhe uma estrutura de
espaco vetorial da seguinte forma.


Primeiramente e preciso definir o produto de um escalar por um elemento de U V . Para elementos


da forma u v com u U e v V , definimos entao o produto (u v), para por


(u v) := (u) v = u (v).


Au
ltima igualdade segue da definicao de U V .


Os demais elementos de U V sao da forma de combinacoes lineares finitas com coeficientes


inteiros de elementos como u v, ou seja, sao da forma


n
X
k=1

ck (uk vk )


para algum n > 0 e ck

. Para os mesmos definimos


!
n
n
X
X
ck (uk vk )

ck (uk vk )
:=


k=1

k=1

n
X
k=1

ck (uk ) vk =


n
X
k=1

ck uk (vk ).


facil constatar que, com essa definicao, U V torna-se um espaco vetorial (vide a definicao
E
formal de espaco vetorial a` pagina 55), que tambem denotaremos por U V . O assim definido espaco
vetorial U V e denominado produto tensorial dos espacos vetoriais U e V sobre o corpo .


O Produto Tensorial de dois M


odulos sobre uma Algebra
Associativa
Vamos aqui a uma definicao que nos sera importante. Sejam M e N dois bimodulos sobre uma
algebra associativa A, ambos supostos serem espacos vetoriais sobre o corpo dos complexos. Conforme a
sub-secao anterior podemos definir o espaco vetorial M N . Entretanto, em muitos casos e necessario
definir um outro tipo de produto tensorial entre M e N .


Para tal seja X = M N e definamos em F (X) o conjunto de relacoes




R := {r F (X)| r = (ma) n m (an), com a A, m M, n N }.




(1.39)

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

83/1304

Definamos entao R = R(M N ) como o subgrupo gerado por R e o produto tensorial




M A N := F (M N )/R(M N ).


(1.40)

Podemos fazer de M A N um modulo, digamos a` direita, sobre A tomando o produto


a (m A n) := (ma) A n = m A (an).

(1.41)

Faremos uso freq


uente desse produto tensorial adiante. O mais importante para nos sera a identidade (ma) A n = m A (an) valida em todo M A N para todo a A.

1.5.5

Produtos Diretos e Somas Diretas Arbitr


arios

Aqui apresentaremos as definicoes de produtos diretos e somas diretas de colecoes arbitrarias de grupos
(nao necessariamente Abelianos) e de espacos vetoriais.
Produto Direto e Soma Direta de Cole
co
es Arbitr
arias de Grupos
Seja J um conjunto arbitrario de ndices e G := {Gi , i J} uma colecao de grupos. Seja
o produto Cartesiano
:= iJ Gi . Podemos fazer de
um grupo definindo o produto de dois
elementos 3 g = aJ ga , 3 h = bJ hb como g h = aJ (ga ha ). Com essa estrutura e dito
Y
ser o produto direto dos grupos Gi , i J e sera denotado por p =
Gi .
iJ

possui um subgrupo importante, aquele formado por elementos aJ ga p onde apenas um


n
umero finito de ga s e distinto da identidade ea doM
respectivo grupo Ga . Esse subgrupo e dito ser a
soma direta dos Gi s , i J e e denotado por s =
Gi .
p

iJ

Soma Direta de Cole


co
es Arbitr
arias de Espa
cos Vetoriais
Se {Vi , i J} e uma colecao de espacos vetoriais que, em particular,
L sao grupos Abelianos, cai
definida, pelo apresentado na sub-secao anterior, a soma direta s :=
iJ Vi , definida primeiramente
como grupo Abeliano. s pode ser feito um espaco vetorial definindo-se, para um escalar generico ,


(aJ va ) := aJ (va ),
para todo aJ va

(1.42)

s.

Um caso especial que ira nos interessar e o seguinte: seja M um bimodulo sobre uma algebra
associativa A e tomemos J = e Vn = M A n M A A M . O exposto acima permite definir a
|
{z
}
n vezes
M
soma direta
M A n .


JCABarata. Curso de Fsica-Matem


atica

1.5.6

Captulo 1

Vers
ao de 29 de setembro de 2005.

84/1304

M
odulos e Deriva
co
es

Seja A uma algebra sobre com identidade e e seja M um bimodulo sobre A. Uma aplicacao linear
: A M e dita ser uma derivaca
o de A em M se satisfaz a regra de Leibniz39 :
(ab) = a(b) + (a)b,

(1.43)

para todos a, b A.

Vamos a alguns exemplos.

Exemplo 1. Seja A uma algebra sobre


de bimodulo:

com unidade e e M = A A com os seguintes produtos




a (b c) := (ab) c,

(1.44)

(b c) a := b (ca).

(1.45)

Deixa-se ao leitor verificar a associatividade dos produtos de bimodulo nesse caso. Defina-se
(a) := a e e a.

(1.46)

Deixa-se ao leitor verificar a validade da regra de Leibniz nesse exemplo. Note-se tambem que, por
essa definicao, (e) = 0.
Exemplo 2. Seja A uma algebra sobre
de bimodulo:

com unidade e e M = A A com os seguintes produtos




a (b c) := (ab) c,

(1.47)

(b c) a := b (ca) (bc) a.

(1.48)

Deixa-se ao leitor verificar a associatividade dos produtos de bimodulo nesse caso. Defina-se
(a) := e a.

(1.49)

Deixa-se ao leitor verificar a validade da regra de Leibniz nesse exemplo. Note-se tambem que, por
essa definicao, (e) = e e 6= 0.

Exemplo 3. Exemplo importante de derivacoes pode ser visto em algebras de Lie. Seja A uma
algebra de Lie vista como um bimodulo sobre si mesma. Seja z um elemento fixo da algebra e seja a
facil verificar (faca!) usando a identidade de Jacobi
aplicacao dz : A A dada por dz (a) = [z, a]. E
(1.22) que
dz ([a, b]) = [dz (a), b] + [a, dz (b)]
para todo a, b A. Assim, tem-se que a cada z A e associada uma derivacao d z .

1.6

T
opicos Especiais

Esta secao e formada por alguns assuntos independentes que, embora relevantes, nao se enquadram na
exposicao introdutoria que pretendamos ter nas secoes anteriores.
39

Gottfried Wilhelm von Leibniz (1646-1716).

JCABarata. Curso de Fsica-Matem


atica

1.6.1

Vers
ao de 29 de setembro de 2005.

Captulo 1

85/1304

O Grupo de Grothendieck

Vamos agora descrever uma construcao que permite obter um grupo Abeliano a partir de um semi-grupo
Abeliano dado. Um grupo construdo por esse procedimento e chamado de grupo de Grothendieck 40
associado ao semi-grupo Abeliano em questao. Grupos de Grothendieck desempenham um papel importante em varias areas da Matematica, como por exemplo na chamada K-teoria.
Seja um semi-grupo Abeliano S (nao necessariamente dotado de um elemento neutro) cujo produto
denotamos pelo smbolo +.
Consideremos em primeiro lugar o produto Cartesiano S S e vamos introduzir la uma relacao de
equivalencia da seguinte forma: dois pares (a, b) e (a0 , b0 ) S S sao equivalentes, (a, b) (a0 , b0 ),
se existir pelo menos um elemento p S tal que
a + b0 + p = a0 + b + p.

(1.50)

Vamos mostrar que isso define de fato uma relacao de equivalencia. Em primeiro lugar e claro que
(a, b) (a, b) para qualquer par (a, b) S 2 = S S, dado que aqui, para verificar (1.50), basta tomar
qualquer elemento p S. Em segundo lugar e evidente que se (a, b) (a0 , b0 ) entao (a0 , b0 ) (a, b).
Finalmente, vamos mostrar que se (a, b) (c, d) e (c, d) (e, f ) entao (a, b) (e, f ). Por hipotese
existem p e p0 S tais que
a+d+p=b+c+p

c + f + p 0 = d + e + p0 .

Daqui extramos que


(a + d + p) + (c + f + p0 ) = (b + c + p) + (d + e + p0 ),
ou seja, que
a + f + p00 = b + e + p00 ,
onde p00 = d + c + p + p0 . Essa relacao diz precisamente que (a, b) (e, f ), completando a prova de
que temos assim uma relacao de equivalencia em S 2 .
Vamos entao considerar agora o conjunto K(S) := S 2 / de todas as classes de equivalencia definidas acima. Vamos construir em K(S) uma estrutura de grupo Abeliano, cujo produto denotaremos
por +. Dadas duas classes [(a, b)] e [(c, d)] definimos
[(a, b)] + [(c, d)] := [(a + c, b + d)].
Note-se que por essa definicao tem-se (verifique!)
[(a, b)] + [(c, d)] = [(c, d)] + [(a, b)]
para todo a, b, c, d S.

A primeira coisa a fazer e mostrar que essa definicao independe dos elementos tomados nas classes.
Para isto basta provar que se (a0 , b0 ) (a, b) entao (a + c, b + d) (a0 + c, b0 + d). Se (a0 , b0 ) (a, b)
entao existe p S tal que
a + b0 + p = a0 + b + p.
40

Alexander Grothendieck (1928-).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

86/1304

Somando-se c + d a ambos os lados tiramos


(a + c) + (b0 + d) + p = (a0 + c) + (b + d) + p
que e precisamente a afirmativa que (a + c, b + d) (a0 + c, b0 + d).
igualmente facil verificar que para quaisquer x, y S tem-se que (x, x) (y, y) e que, portanto,
E
[(x, x)] = [(y, y)]. Vamos provar que ha em K(S) um elemento neutro. Este e precisamente a classe
e := [(x, x)] com x S arbitrario. Note-se que, para qualquer par (a, b) S 2 teremos
[(a, b)] + [(x, x)] = [(a + x, b + x)] = [(a, b)] ,
pois (a + x + b) + p = (b + x + a) + p para qualquer p S.

Falta-nos provar a associatividade do produto e a existencia de uma inversa para cada elemento de
K(S). Para a associatividade, notemos que


[(a, b)] + [(c, d)] + [(e, f )] := [(a, b)] + [(c + e, d + f )] = [(a + c + e, b + d + f )] ,



[(a, b)] + [(c, d)] + [(e, f )] := [(a + c, b + d)] + [(e, f )] = [(a + c + e, b + d + f )] .

Para provar a existencia de inversa notemos que para cada par (a, b) S 2 podemos tomar [(a, b)]1 :=
[(b, a)] pois
[(a, b)] + [(a, b)]1 = [(a, b)] + [(b, a)] = [(a + b, a + b)] = e .
Isso mostrou que K(S) tem uma estrutura de grupo Abeliano. Este e o chamado grupo de Grothendieck associado ao semi-grupo Abeliano S.
Como de costume, denotaremos [(a, b)]1 por [(a, b)]. Assim, [(a, b)] = [(b, a)].
E. 1.85 Exerccio. Seja o monoide Abeliano
Mostre que K( ) ' .

dos numeros naturais contendo o 0 com a soma usual.


6


O exerccio acima indica a possibilidade de se definir os n


umeros inteiros a partir dos naturais.
Os inteiros seriam, por definicao, o grupo de Grothendieck do monoide Abeliano dos naturais com a
operacao de soma usual.
E. 1.86 Exerccio. Seja o monoide Abeliano 1 dos numeros naturais maiores ou iguais a 1 com o
produto dado pela multiplicacao usual. Mostre que K( 1 ) ' + , o grupo dos racionais positivos (sem o
zero) com o produto dado pela multiplicacao usual.
6


O exerccio acima indica a possibilidade de se definir os n


umeros racionais positivos a partir dos
naturais. Os racionais seriam, por definicao, o grupo de Grothendieck do monoide Abeliano dos naturais
com a operacao de produto usual.
Para cada elemento a de um monoide Abeliano M podemos associar um elemento de K(M ) por
facil ver que todo elemento [(a, b)] de K(M ) pode ser escrito da
M 3 a 7 [a] := [(a, 0)] K(M ). E
forma [(a, b)] = [a][b] e que [a][b] = [a0 ][b0 ] se e somente se existir p M com a+b0 +p = a0 +b+p.

JCABarata. Curso de Fsica-Matem


atica

1.6.2

Vers
ao de 29 de setembro de 2005.

Captulo 1

87/1304

Grup
oides

dado um conjunto C e um subconjunto C0 C, o qual


Um grupoide e definido da seguinte forma. E
e a imagem de duas funcoes unarias p e c (chamadas de partida e chegada), ou seja, p : C C 0 ,
c : C C0 . Os elementos de C0 sao pontos fixos de p e de c, ou seja,
c() =

p() =

para todo C0 (aqui denotaremos os elementos de C por letras gregas).

Define-se em C C um subconjunto (ou seja, uma relacao em C), que denotaremos por RC , da
seguinte forma:
RC := {(, ) C 2 | p() = c()}.

tambem dada uma funcao binaria RC C, que denotaremos por e que denominaremos
E
produto, a qual satisfaz as seguintes hipoteses:
1. Associatividade: ( ) = ( ) sempre que os produtos estejam definidos, ou seja, se
(, ), (, ), (, ) e ( , ) forem todos elementos de RC
2. Para todo (, ) RC temos p( ) = p().
3. Para todo (, ) RC temos c( ) = c().
4. Para todo C temos p() = .
5. Para todo C temos c() = .
Fora isso, existe para cada C uma assim chamada inversa bilateral 1 C a qual satisfaz
1 = c() e 1 = p(). Note que, por essa definicao, tem-se que, para todo 0 C0 ,
0 01 = 01 0 = 0 .
Estes ingredientes definem um grupoide. Note-se que um grupoide nao necessariamente contem um
elemento neutro (vide exemplos).

Exemplo. Caminhos. Este exemplo e um prototipo da definicao de grupoide acima, ou seja, aquela
possivelmente foi criada tendo o mesmo como exemplo-guia.
Seja I o intervalo fechado [0, 1] e vamos considerar o conjunto C de todas as funcoes contnuas de
I em um espaco topologico Hausdorff qualquer (por exemplo 2 ). Um elemento de C e uma curva
orientada contnua em 2 que tem um ponto de partida (0) e um ponto de chegada (1).


Podemos introduzir uma relacao de equivalencia em C da seguinte forma: duas curvas e C


sao equivalentes ( ) se existir uma bijecao contnua b : I I com b(0) = 0, b(1) = 1, tal que
= b. Vamos denominar por C as classes de equivalencia de C pela relacao de equivalencia acima:
C := C/ .
O conjunto C0 e o subconjunto de C formado pelas classes de equivalencia de curvas constantes:
[] C0 (t) = (t0 ), t, t0 I.

Definimos as funcoes unarias p e c da seguinte forma: p([]) e a classe de equivalencia da curva


constante que a todo t I associa o ponto (0) de 2 , o ponto de partida de ; c([]) e a classe de
equivalencia da curva constante que a todo t I associa o ponto (1) de 2 , o ponto de chegada de .


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 1

88/1304

Dados dois elementos em C queremos agora definir o seu produto. A ideia a ser seguida e que o
produto de duas curvas e definido apenas quando o ponto de chegada da primeira coincide com o ponto
de partida da segunda e resulta em uma curva u
nica unindo o ponto de partida da primeira com o
ponto de chegada da u
ltima. Matematicamente isso e feito definindo-se o produto [] [] como sendo
a classe de equivalencia da curva definida pela composicao

(2t),
para 0 t 1/2
(t) :=
.
(2t 1), para 1/2 < t 1
Claramente so e um elemento de C (ou seja, uma curva contnua) se (1) = (0).

Por fim a inversa bilateral de [] e definida como sendo a classe [ 1 ], onde 1 (t) = (1 t).

Deixamos para o leitor como exerccio mostrar que a estrutura definida acima e a de um grupoide.

Notemos que para a composicao acima nao vale a associatividade: ( ) 6= ( ), se


ambos os lados estiverem definidos (por que?). No entanto, as curvas ( ) e ( ) sao
equivalentes no sentido da definicao acima e de tal forma que para o produto definido nas classes
C vale a associatividade [] ([] []) = ([] []) [], se ambos os lados estiverem definidos (por
que?). Essa e a razao de termos feito a construcao nas classes C e nao diretamente em C. Esse fato
ja deve ser familiar ao leitor que conheca o conceito de grupo de homotopia de espacos topologicos.
O grupoide apresentado acima e o grupo de homotopia sao, alias, fortemente aparentados e ao leitor
sugere-se pensar sobre qual a conexao entre ambos.
Exemplo. Relaco
es de equivalencia. Seja K um conjunto no qual haja uma relacao de equivalencia
R K K. Tomamos C = R e C0 = {(x, x), x K} R. Definimos
1. p((x, y)) := (x, x), x, y K com x y.
2. c((x, y)) := (y, y), x, y K com x y.
3. Produto: (x, y) (y, z) := (x, z), x, y, z K com x y z.
4. Inversa bilateral: (x, y)1 := (y, x).
facil de se verificar (faca-o) que a estrutura assim definida e a de um grupoide.
E

1.6.3

Quat
ernions

Vamos nesta secao tratar brevemente de um tipo de algebra que possui algumas aplicacoes interessantes
na teoria de grupos e outros lugares, a chamada algebra dos quaternions.
Dado um espaco vetorial como 2 ha varias maneiras de definir no mesmo um produto de modo a
fazer do mesmo uma algebra. Por exemplo, podemos definir em 2 o produto


(x1 , x2 ) (y1 , y2 ) = (x1 y1 , x2 y2 ),

(1.51)

que e associativo e comutativo, como tambem o produto


(x1 , x2 ) (y1 , y2 ) = (x1 y1 x2 y2 , x1 y2 + x2 y2 ),

(1.52)

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

89/1304

que e igualmente associativo e comutativo (Exerccio. Verifique).


O produto (1.51) faz de 2 uma algebra isomorfa a , ou seja, a duas copias da algebra usual
dos n
umeros reais. O produto (1.52) faz de 2 uma algebra isomorfa a` dos n
umeros complexos . (Em
2
com o produto (1.52)!).
verdade, os n
umeros complexos sao definidos como sendo a algebra


Em

3


podemos definir igualmente varios tipos de produtos, tais como o produto


(x1 , x2 , x3 ) (y1 , y2 , y3 ) = (x1 y1 , x2 y2 , x3 y3 ),

(1.53)

que e igualmente associativo e comutativo; o produto


(x1 , x2 , x3 ) (y1 , y2 , y3 ) = (x1 y1 , x2 y2 x3 y3 , x2 y3 + x3 y2 ),

(1.54)

tambem associativo e comutativo ou ainda um produto como


(x1 , x2 , x3 ) (y1 , y2 , y3 ) = (x2 y3 x3 y2 , x3 y1 x1 y3 , x1 y2 x2 y1 ),

(1.55)

que nao e nem associativo nem comutativo. O produto (1.53) faz de 3 uma algebra isomorfa a
(tres copias da algebra dos reais). O produto (1.54) faz de 3 uma algebra isomorfa a
e o produto (1.55) e o bem conhecido produto vetorial.


O que se pode entao fazer em 4 ? Naturalmente poder-se-ia definir em


o que fizemos acima. Por exemplo, com o produto


4


varias algebras imitando

(x1 , x2 , x3 , x4 ) (y1 , y2 , y3 , y4 ) = (x1 y1 , x2 y2 , x3 y3 , x4 y4 ),


4

torna-se uma algebra associativa e comutativa isomorfa a

(1.56)

. Com o produto


(x1 , x2 , x3 , x4 ) (y1 , y2 , y3 , y4 ) = (x1 y1 x2 y2 , x1 y2 + x2 y1 , x3 y3 x4 y4 , x3 y4 + x4 y3 ),


4


torna-se uma algebra associativa e comutativa isomorfa a

. Com o produto

(x1 , x2 , x3 , x4 ) (y1 , y2 , y3 , y4 ) = (x2 y3 x3 y2 , x3 y1 x1 y3 , x1 y2 x2 y1 , x4 y4 )


4

torna-se uma algebra nao-associativa e nao-comutativa isomorfa a


na componente 3 .


(1.57)

3


(1.58)

, com o produto vetorial




Ha tambem outros produtos que sao meras variantes das listadas acima (ache algumas). Existe,
porem, um outro produto nao trivial, denominado produto quaterni
onico, que faz de 4 uma algebra
associativa mas nao-comutativa e com unidade. Esse produto foi descoberto por W. R. Hamilton 41 .
A historia da descoberta desse produto em 4 , feita em 1843, e muito interessante e representou um

marco na historia da Algebra.


Esse produto e o seguinte


(x0 , x1 , x2 , x3 ) (y0 , y1 , y2 , y3 ) =
(x0 y0 x1 y1 x2 y2 x3 y3 , x0 y1 +y0 x1 +x2 y3 x3 y2 , x0 y2 +y0 x2 +x3 y1 x1 y3 , x0 y3 +y0 x3 +x1 y2 x2 y1 ).
(1.59)
41

William Rowan Hamilton (1805-1865). W. R. Hamilton foi tambem o inventor do chamado formalismo Hamiltoniano
da Mec
anica Cl
assica.

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

90/1304

E. 1.87 Exerccio. Mostre que o produto acima e associativo.

lgebra dos quaternions ou a


lgebra
O espaco vetorial 4 dotado do produto acima e denominado a
quaterni
onica e e denotada freq
uentemente por . A algebra e associativa mas nao e comutativa.
tem uma unidade, a saber, o vetor (1, 0, 0, 0) 4 .


E. 1.88 Exerccio. Mostre que

nao e uma algebra comutativa.

E. 1.89 Exerccio. Mostre que (1, 0, 0, 0) e a unidade de

Ha uma maneira melhor de representar o produto quaternionico que a expressao (1.59). Vamos
escrever os vetores da base canonica de 4 como


e0 = (1, 0, 0, 0),

e1 = (0, 1, 0, 0),

e2 = (0, 0, 1, 0),

e3 = (0, 0, 0, 1),

de modo que todo x 4 pode ser escrito na forma x = x0 e0 + x1 e1 + x2 e2 + x3 e3 . O produto


quaternionico pode entao ser definido pelo produto dos elementos da base canonica, que segue as
seguintes regras:


1. e0 e a unidade da algebra: x e0 = e0 x = x para todo x

4


2. (e1 )2 = (e2 )2 = (e3 )2 = e0 .


3. ei ej = ej ei para todo i 6= j com i, j = 1, 2, 3.
4. e1 e2 = e3 , e2 e3 = e1 e e3 e1 = e2 .
E. 1.90 Exerccio. Verifique que essas regras reproduzem perfeitamente (1.59).

Alem de ser de manipulacao mais simples, essas regras permitem representar a algebra quaternionica
de um modo talvez mais familiar, a saber, em termos de certas matrizes complexas 2 2.

Quat
ernions e Algebras
de Matrizes 2 2
Sejam a e b dois n
umeros complexos e seja M (a, b) a matriz


a b
M (a, b) =
,
b a
facil de se ver que o conjunto de todas as matrizes dessa
onde z e o complexo conjugado de z . E
forma e uma algebra:
M (a, b)M (c, d) = M (ac bd, ad + bc).
E. 1.91 Exerccio. Verifique!

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

91/1304

Existe um isomorfismo entre a algebra dos quaternions e essa algebra de matrizes 2 2. Basta
associar (bijetivamente!) a cada quadrupla (x0 , x1 , x2 , x3 ) a matriz M (x0 + ix3 , x2 + ix1 ):


x0 + ix3 x2 + ix1
=: M (x).
(1.60)
x = (x0 , x1 , x2 , x3 )
x2 + ix1 x0 ix3
facil verificar entao (faca!) que o produto quaternionico e respeitado por essa associacao:
E
M (x)M (y) = M (x y),
4

onde, acima, x y e o produto quaternionico de x e y




Note-se que por essa associacao tem-se

M (x) = M (x0 e0 + x1 e1 + x2 e2 + x3 e3 ) = x0 M (e0 ) + x1 M (e1 ) + x2 M (e2 ) + x3 M (e3 ),


com
M (e0 ) =

M (e1 ) = i1 ,

M (e2 ) = i2 ,

onde

=
e
1 =

0 1
1 0

2 =

1 0
0 1

0 i
i 0

sao as chamadas matrizes de Pauli42 , que satisfazem

3 =

M (e3 ) = i3 ,

1
0
0 1

1. (1 )2 = (2 )2 = (3 )2 = ,
2. i j = j i para todo i 6= j e
3. 1 2 = i3 , 2 3 = i1 , 3 1 = i2 .
E. 1.92 Exerccio. Verifique essas propriedades.

Sub-
algebras Abelianas
possui algumas sub-algebras Abelianas.
E. 1.93 Exerccio. Mostre que 1 := {x 4 , x = x0 e0 + x1 e1 = (x0 , x1 , 0, 0)} e uma sub-algebra
Abeliana de que e isomorfa `a algebra dos complexos.
6


E. 1.94 Exerccio. Mostre o mesmo para 2 := {x


4
, x = x0 e0 + x3 e3 = (x0 , 0, 0, x3 )}.
3 := {x


42

Wolfgang Pauli (1900-1958).

4


, x = x0 e0 + x2 e2 = (x0 , 0, x2 , 0)} e
6

JCABarata. Curso de Fsica-Matem


atica

Captulo 1

Vers
ao de 29 de setembro de 2005.

E. 1.95 Exerccio. Sera possvel fazer de 4 um espaco vetorial complexo? Seja


x 4 o produto do escalar pelo vetor x definido por


92/1304

e considere para

x = (Re()e0 + Im()e1 ) x,
onde o produto do lado direito e o o produto quaternionico. Mostre que isso faz de 4 um espaco vetorial
sobre o corpo dos complexos. Para isto verifique as propriedades definidoras de um espaco vetorial listadas
`a pagina 55.
6


E. 1.96 Exerccio.
considerados:

No exerccio anterior ha outros produtos do escalar pelo vetor x que podem ser
x = (Re()e0 + Im()e2 ) x,

ou
x = (Re()e0 + Im()e3 ) x,
ou mesmo
x = x (Re()e0 + Im()e1 )
etc. Mostre que todos esses seis produtos de escalares
vetorial sobre o corpo dos complexos.

por vetores x

4


fazem de

4


um espaco
6

e um anel de divis
ao

facil ver que a algebra dos quaternions e um anel de divisao (vide pagina 61), ou seja, todo
E
x 4 , x 6= 0, tem uma inversa em relacao ao produto quaternionico. Do isomorfismo M definido em
(1.60) acima ve-se que


det(M (x)) = det (M (x0 + ix1 , x2 + ix3 )) = (x0 )2 + (x1 )2 + (x2 )2 + (x3 )2
e, portanto, M (x) tem uma matriz inversa sempre que x 6= 0.

De fato, definindo-se para x = x0 e0 + x1 e1 + x2 e2 + x3 e3

4


o conjugado quaternionico

x = x 0 e0 x 1 e1 x 2 e2 x 3 e3
e do fato facilmente constatavel que43
x x = (x0 )2 + (x1 )2 + (x2 )2 + (x3 )2
e facil ver que para x 6= 0 tem-se
x
ou seja x1 x = x x1 = e0 .

1
xx

4


E. 1.97 Exerccio. Verifique.


43

Com um abuso de linguagem identificamos aqui ((x0 )2 +(x1 )2 +(x2 )2 +(x3 )2 )e0

com (x0 )2 +(x1 )2 +(x2 )2 +(x3 )2

JCABarata. Curso de Fsica-Matem


atica

Note que por


ou y = 0.

Vers
ao de 29 de setembro de 2005.

Captulo 1

93/1304

nao tem divisores de zero: x y = 0 se e somente se x = 0

ser um anel de divisao,

Norma Quaterni
onica
Em uma algebra A uma funcao N : A


que satisfaca

N (a b) = N (a)N (b)
para todo a, b A e N (a) = 0 a = 0 e dita ser uma norma algebrica.

Em e tem-se a norma algebrica N (z) = |z|, o modulo ou valor absoluto de z.


uma norma algebrica. Para x 4 a expressao


tambem possui

N (x) = x x
define44 uma norma algebrica em

E. 1.98 Exerccio. Verifique que a mesma satisfaz N (x y) = N (x)N (y).

Ha um teorema devido a Hurwitz45 que afirma que ha apenas quatro algebras que sao algebras de
divisao46 e possuem uma norma algebrica: , , e a chamada algebra dos octonions, da qual nao
falaremos aqui. Esta u
ltima, por sinal, nao e associativa.


A algebra
possui varias outras propriedades interessantes, mas vamos encerrar aqui nossa exposicao introdutoria. O leitor interessado podera encontrar mais sobre nos bons livros de algebra,
especialmente nos mais antigos.

44

Vide nota de rodape 43, p


agina 92.
Adolf Hurwitz (1859-1919).
46
Vide definica
o a
` p
agina 61
45

Captulo 2
Espacos Vetoriais
Conte
udo
2.1

2.2

Espa
cos Vetoriais

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.1

Sub-Espacos e Espacos Quocientes . . . . . . . . . . . . . . . . . . . . . . . .

94

2.1.2

Bases Algebricas de um Espaco Vetorial . . . . . . . . . . . . . . . . . . . . .

95

2.1.3

O Dual Algebrico de um Espaco Vetorial

. . . . . . . . . . . . . . . . . . . . 101

Formas Lineares, Sesquilineares e Produtos Escalares em Espa


cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
2.2.1

Formas Multilineares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

2.2.2

Formas Sesquilineares e as Desigualdades de Cauchy-Schwarz e Minkowski . . 113

2.2.3

Produtos Escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117

2.2.4

Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 119

2.3

Normas em Espa
cos Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . 121

2.4

Formas Bilineares e Sesquilineares em Espa


cos de Dimens
ao Finita . . . 128

2.5

Estruturas Complexas sobre Espa


cos Vetoriais Reais . . . . . . . . . . . . 132

nocao de espaco vetorial que introduzimos na Secao 1.2.3, pagina 55, e da maior importancia
na Fsica e na Matematica. Neste captulo vamos desenvolve-la com mais detalhe. Particular
atencao sera dada a`s nocoes de forma multilinear, forma sesquilinear, produto escalar e norma
em espacos vetoriais.

2.1
2.1.1

Espa
cos Vetoriais
Sub-Espa
cos e Espa
cos Quocientes

Sub-espa
cos
Seja V um espaco vetorial sobre um corpo K. Um subconjunto W de V e dito ser um sub-espaco

de V (sobre o mesmo corpo K) se para todo , K e todo u, v W valer que u + v W . E


evidente que um sub-espaco de um espaco vetorial e por si so um espaco vetorial.
Quocientes
Se W e um sub-espaco de um espaco vetorial V sobre um corpo K, entao e possvel definir em V
uma relacao de equivalencia EW V V da seguinte forma: dizemos que (u, v) V V pertence a
EW se u v W .
94

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

E. 2.1 Exerccio. Mostre que isso de fato define uma relacao de equivalencia em V .

95/1304

Seguindo a notacao usual denotaremos tambem essa relacao de equivalencia pelo smbolo W :
u W v se u v W .
Denotemos por V /W o conjunto das classes de equivalencia de V pela relacao E W . Denotaremos
por [u] V /W a classe de equivalencia que contem o vetor u V .

Com esses ingredientes podemos transformar V /W em um espaco vetorial sobre K. Isso se da


definindo em V /W uma soma e um produto por escalares. O vetor nulo sera a classe de equivalencia
[0] que contem o vetor 0. Como subconjunto de V , a classe [0], alias, vem a ser o conjunto W (por
que?).
Se [u] e [v] sao as classes de equivalencia que contem os elementos u e v, respectivamente, de V ,
entao definimos
[u] + [v] = [u + v].

E. 2.2 Exerccio. Mostre que essa definicao e coerente, no sentido que independe dos representantes (u
e v) escolhidos nas classes.
6
E. 2.3 Exerccio. Mostre que essa operacao de soma e comutativa e associativa.

E. 2.4 Exerccio. Mostre que [u] + [0] = [u] para todo u V .

Analogamente, a operacao de multiplicacao por escalares e definida por


[u] = [u],
para todo u V .
E. 2.5 Exerccio.
escolhido na classe.

Mostre que essa definicao e coerente, no sentido que independe do representante u


6

E. 2.6 Exerccio. Mostre que o conjunto V /W e, portanto, um espaco vetorial sobre o corpo K com as
operacoes definidas acima.
6
O espaco vetorial V /W assim obtido e denominado espaco quociente de V por W .

2.1.2

Bases Alg
ebricas de um Espa
co Vetorial

Depend
encia Linear
Um conjunto finito u1 , . . . , un V de vetores e dito ser linearmente dependente se existir um
conjunto de escalares 1 , . . . , n V , nem todos nulos, tais que
1 u1 + + n un = 0.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

96/1304

Um conjunto arbitrario de vetores e dito ser linearmente independente se nao possuir nenhum subconjunto finito que seja linearmente dependente.
Combina
co
es Lineares
Para um conjunto finito de vetores {u1 , . . . , un } V e de escalares {1 , . . . , n } K, uma
expressao como
1 u1 + + n un

e dita ser uma combinaca


o linear dos vetores u1 , . . . , un .
Varredura Linear

Seja C V um conjunto de vetores. A varredura linear (linear span) de C, denotado por span (C)
e o conjunto de todos os vetores de V que podem ser escritos como uma combinacao linear finita de
elementos de C.
Bases Alg
ebricas em Espa
cos Vetoriais
Aqui I designa um conjunto arbitrario nao-vazio de ndices.
Uma base algebrica1 em um espaco vetorial V e um conjunto B = {bi , i I} de vetores linearmente
independentes tais que span (B) = V e tais que qualquer vetor u de V pode ser escrito de modo u
nico
como uma combinacao linear finita de elementos de B.
Se B e uma base algebrica, entao para cada u V existem univocamente definidos 1 , . . . , n K
e i1 , . . . , in I tais que:
u = 1 b i1 + + n b in .
Os seguintes teoremas podem ser demonstrados com uso do Lema de Zorn (omitiremos as demonstracoes aqui. Vide, por exemplo, [61]).
Teorema 2.1 Todo espaco vetorial V possui uma base algebrica, exceto o espaco vetorial trivial V =
{0}.
2
Teorema 2.2 Dado um espaco vetorial V (n
ao trivial), todas as bases algebricas em V tem a mesma
cardinalidade.
2
Dimens
ao Alg
ebrica
Um espaco vetorial e dito ser de dimens
ao algebrica finita se possuir uma base algebrica finita. Se
um espaco vetorial V tem dimensao algebrica finita, sua dimens
ao algebrica, ou simplesmente dimens
ao
e definida como sendo o n
umero de elementos de sua base.
Nem todo espaco vetorial tem uma base algebrica finita (vide exemplos abaixo). De modo geral,
se um espaco vetorial possui uma base algebrica, sua dimensao algebrica e definida como sendo a
1

Tambem denominada base de Hamel. Georg Hamel (1877-1954)

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

97/1304

cardinalidade de suas bases algebricas (pelo Teorema 2.2 acima sao todas iguais).
Exemplo 1. V = n sobre o corpo dos complexos ou V = n sobre o corpo dos reais. Tais sao bem
conhecidos exemplos-prototipo de espacos vetoriais de dimensao finita (= n).


P,

Seja P = conjunto de todos os polinomios de uma variavel real com coeficientes complexos: P n (t)

com t

Pn (t) = an tn + + a1 t + a0

, ai , e dito ser um polinomio de grau n se an 6= 0.

Exemplo 2. V = P sobre o corpo dos complexos. Este e claramente um espaco vetorial de dimensao
infinita. V possui uma base algebrica, a saber, o conjunto de todos os polinomios da forma b n = tn ,
n = 0, 1, 2, . . ..
Exemplo 3. V = sobre o corpo dos reais. O conjunto dos reais sobre o corpo dos reais e tambem
um espaco vetorial de dimensao 1, a saber, uma possvel base e formada pelo elemento 1: B = {1}, ja
que, obviamente, qualquer elemento x pode ser escrito como x = x 1, com x no corpo dos reais.


Esse exemplo pode parecer banal, e de fato o e, mas leva a um anti-exemplo curioso que mostra
que a dimensao algebrica de um espaco vetorial e tambem fortemente dependente do corpo de escalares
utilizado.
Exemplo 4. V =


sobre o corpo dos racionais.

A surpresa aqui e que este n


ao e um espaco vetorial de dimensao algebrica finita: nao existe um
conjunto finito {x1 , . . . , xm } de n
umeros reais tais que todo x possa ser escrito como


x = r 1 x1 + + r m xm ,
onde os n
umeros ri sao racionais. A razao e que, como e um conjunto contavel, a colecao de n
umeros
que se deixam escrever como o lado direito e uma colecao contavel (tem a mesma cardinalidade de
m
). O conjunto , porem, nao e contavel.


Um resultado um tanto surpreendente diz, porem, que esse espaco vetorial possui uma base algebrica,
ou seja, existe um conjunto H
tal que para cada x
existe um conjunto finito h1 , . . . , hn
de elementos de H e um conjunto finito de racionais r1 , . . . , rn tais que x = r1 h1 + + rn hn . A
demonstracao da existencia de uma tal base faz uso do Lema de Zorn e pode ser encontrada em [17]
ou [19]. Essa base e denominada base de Hamel de .


Uma conseq
uencia curiosa da existencia de bases de Hamel em
inicia a` pagina 98.


sera discutida no topico que se

Outros exemplos menos dramaticos que mostram a dependencia da dimensao com o corpo utilizado
sao os seguintes: sejam V1 = sobre o corpo dos complexos e V2 = sobre o corpo dos reais. V1 tem
dimensao 1, mas V2 tem dimensao 2.
Mais adiante faremos uso do seguinte resultado:
Teorema 2.3 Se em um espaco vetorial V existir um conjunto {v1 , . . . , vn } de n vetores linearmente
independentes, ent
ao a dimens
ao algebrica de V e maior ou igual a n.
2
Prova. A demonstracao e feita por absurdo. Suponhamos que haja uma base B = {b 1 , . . . , bk } em V

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

98/1304

com k < n. Entao podemos escrever


v 1 = 1 b1 + + k bk .
pois B e uma base. Nem todos os i podem ser nulos. Supondo que k seja um elemento nao-nulo,
podemos escrever
bk = (k )1 (v1 1 b1 k1 bk1 )
(2.1)
Analogamente, temos que

v 2 = 1 b1 + + k bk
e, usando (2.1), podemos escrever
v2 = 1 b1 + + k1 bk1 + 1 v1 .
Os i nao podem ser todos nulos, pois de outra forma teramos v2 = 1 v1 , contrariando a hipotese
de os vi s serem linearmente independentes. Suponhamos que k1 seja o elemento nao-nulo, podemos
escrever bk1 como uma combinacao linear envolvendo {b1 , . . . , bk2 } e os vetores v1 e v2 . Prosseguindo,
concluiremos apos k passos que
vk+1 = 01 v1 + + 0k vk
contrariando a hipotese de que os vi s sao linearmente independentes.
Automorfismos descontnuos do grupo ( , +)


Nota para os estudantes mais avancados.


Neste topico usaremos as bases de Hamel da reta real para ilustrar uma patologia cuja existencia
e por vezes mencionada na teoria de grupos, a saber, a existencia de automorfismos descontnuos do
grupo ( , +).


Considere-se a equacao f (x + y) = f (x) + f (y) para todo x, y . Podemos nos perguntar:


bastante claro que funcoes do tipo f (x) = cx, com
que funcoes f :

podem satisfaze-la? E
c constante real, satisfazem f (x + y) = f (x) + f (y) para todo x, y . Fora isso, f (x) = cx sao
contnuas e sao bijecoes de em (a menos que c = 0).


Serao essas as u
nicas funcoes com a propriedade f (x + y) = f (x) + f (y) para todo x, y ? Sera
que ha outras funcoes com essa propriedade e que nao sejam contnuas? Sera que ha outras funcoes com
essa propriedade, nao-contnuas, e que tambem sejam bijecoes de em ? A resposta a essa u
ltima
pergunta e muito curiosa e conduz a uma classe de funcoes cuja existencia ilustra algumas dificuldades
encontradas na teoria de grupos.


Provemos em primeiro lugar a seguinte afirmacao:


Proposi
c
ao 2.1 Se f : satisfizer f (x + y) = f (x) + f (y) para todo x, y
em toda reta real , ent
ao f e da forma f (x) = cx para algum c, constante real.


Historicamente esse pequeno resultado e devido a Cauchy2 .


2

Augustin Louis Cauchy (1789-1857).

e f for contnua
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

99/1304

claro
Prova. Seja f contnua satisfazendo f (x + y) = f (x) + f (y) para todo x, y e f : . E
que, tomando x = y = 0 tem-se f (0) = f (0 + 0) = 2f (0) e, portanto f (0) = 0. Segue facilmente da
que 0 = f (0) = f (x + (x)) = f (x) + f (x) e, portanto f (x) = f (x) para todo x .


Seja agora p inteiro positivo e x real, ambos arbitrarios. Teremos que f (px) = f ((p 1)x + x) =
f ((p 1)x) + f (x) = f ((p 2)x) + 2f (x) etc. Repetindo p vezes esse proceder, conclumos que
f (px) = pf (x). Como f (x) = f (x), essa relacao vale para p negativo tambem. Seja agora q
inteiro, nao-nulo. Entao, pelo que acabamos de provar, f (1) = f (q/q) = qf (1/q) e conclumos que
f (1/q) = f (1)/q. Se entao tivermos um n
umero racional r da forma r = p/q, com p inteiro e q inteiro
nao-nulo, teremos que f (r) = f (p/q) = pf (1/q) = (p/q)f (1) = rf (1). Finalizamos a prova evocando
a continuidade de f e o fato que todo x real pode ser aproximado por um n
umero racional: seja
x e rn , n , uma seq
uencia de n
umeros racionais que coverge a x, i.e., x = lim n rn . Entao
f (x) = f (limn rn ) = limn f (rn ) = (limn rn ) f (1) = xf (1). Na segunda igualdade usamos a
hipotese (crucial!) que f e contnua em toda parte. Denotando f (1) = c a afirmacao esta provada.


Com esse resultado em maos podemos nos perguntar: havera funcoes nao-contnuas que satisfazem
f (x + y) = f (x) + f (y)? Talvez surpreendentemente, a resposta e positiva. Nao so ha funcoes nao
em . Funcoes com tais
contnuas com essa propriedade, mas ha dentre elas funcoes bijetoras de
caractersticas um tanto patologicas podem ser construdas com o uso das assim chamadas bases de
Hamel da reta real. Detalhemos.


Seja o espaco vetorial V dos n


umeros reais sob o corpo dos racionais. Como consideramos paginas
acima, esse espaco vetorial tem dimensao algebrica infinita, mas existe uma base H
de V , naocontavel, denominada base de Hamel, tal que todo elemento x de pode ser escrito como combinacao
linear finita (
unica!) por racionais de elementos de H, ou seja, para todo x
existe um n (que
depende de x), racionais r1 , . . . , rn (que dependem de x) e elementos h1 , . . . , hn de H (que tambem
dependem de x) tais que x pode ser escrita (de forma u
nica!) como x = r1 h1 + + rn hn . Denominaremos essa expressao a decomposicao de x em H.


0
h0m sao suas
Notemos que se x e y sao n
umeros reais e x = r1 h1 + + rn hn e y = r10 h01 + + rm
0
decomposicoes em H, entao a decomposicao de x + y e r1 h1 + + rn hn + r10 h01 + + rm
h0m .

Vamos definir uma funcao f :


, da seguinte forma. Primeiramente fixamos seus valores
nos elementos de H tomando, para cada h H, f (h) := fh , onde os n
umeros fh sao escolhidos
arbitrariamente. Em segundo lugar, para qualquer x , e cuja decomposicao em H seja x =
r1 h1 + + rn hn , definimos f (x) := r1 f (h1 ) + + rn f (hn ) = r1 fh1 + + rn fhn . Assim, se x e y sao
0
n
umeros reais e x = r1 h1 + + rn hn e y = r10 h01 + + rm
h0m sao suas decomposicoes em H, teremos
0
fh0m = f (x) + f (y).
f (x + y) = r1 fh1 + + rn fhn + r10 fh01 + + rm


O leitor pode convencer-se que ha, para cada base de Hamel H, infinitas funcoes desse tipo (devido
a` arbitrariedade da escolha dos fh s) e que todas sao descontnuas, exceto se escolhermos fh = ch para
todo h H, com uma constante c fixa.
Espertamente, podemos tomar f como uma bijecao de H em H, ou seja, podemos escolher3 fh H
para todo h H e de modo que para todo h H exista um g H u
nico tal que fg = h. Uma situacao
trivial dessas e aquela na qual f e a identidade quando restrita a H: fh = h para todo h H, mas
outras escolhas sao tambem possveis. Se f for uma bijecao de H em H, e facil de se ver que imagem
3

Que tal e possvel e garantido pelo axioma da escolha Exerccio.

JCABarata. Curso de Fsica-Matem


atica

de f no domnio

e toda a reta real




Captulo 2

Vers
ao de 29 de setembro de 2005.

100/1304

(mostre isso)!

Alem disso, uma tal f , bijetora enquanto funcao de H em H, e igualmente bijetora como funcao
em . Mostremos isso. Sejam x e y
com decomposicoes x = r1 h1 + + rn hn e y =
de
s1 g1 + + sm gm com rj , sk
e hj , gk H e suponhamos que f (x) = f (y). Isso significa que
r1 fh1 + + rn fhn = s1 fg1 + + sm fgm . Como cada fhj e cada fgk e elemento de H, essa igualdade
so e possvel se m = n, se fhj = fg(j) e se rj = s(j) para todo j = 1, . . . , n, onde e um elemento do
grupo de permutacoes de n elementos (ou seja, e uma bijecao de {1, . . . , n} em si mesmo). Como f e
uma bijecao de H em si mesmo, segue que hj = g(j) para todo j = 1, . . . , n. Assim,


x =

n
X

r j hj =

j=1

e, portanto, f :

n
X
j=1

s(j) g(j) =

n
X

sj gj = y,

j=1

e bijetora.


Uma funcao que satisfaca f (x + y) = f (x) + f (y) para todo x, y e f : representa um


endomorfismo do grupo ( , +). O que aprendemos no u
ltimo paragrafo pode ser expresso na linguagem
da teoria de grupos como a afirmacao que existem automorfismos de ( , +) que nao sao contnuos.
Esse fato ilustra algumas situacoes patologicas que sao por vezes encontradas ou mencionadas no
estudo de grupos contnuos. Com o uso de funcoes f desse tipo e possvel, por exemplo, construir
sub-grupos uniparametricos nao-contnuos de um grupo de Lie dado ou representacoes nao-contnuas
de tais sub-grupos.


Assim, por exemplo, se A e uma matriz real n n antisimetrica, entao O(t) = exp(tA), t e um
subgrupo uniparametrico contnuo de SO(n), pois O(0) = e O(t)O(t0 ) = O(t+t0 ) para todos t, t0 ,
sendo os elementos de matriz de O(t) funcoes contnuas de t. Se agora definirmos P (t) = exp(f (t)A),
t , para uma funcao f : , patologica como acima (ou seja, satisfazendo f (x+y) = f (x)+f (y)
para todo x, y , bijetora mas descontnua), ainda teremos P (0) = e P (t)P (t0 ) = P (t + t0 ) para
todos t, t0 , mas os elementos de matriz de P (t) nao sao funcoes contnuas de t.


Bases Topol
ogicas em Espa
cos Vetoriais
Nota para os estudantes mais avancados.
O conceito de base algebrica nao deve ser confundido com o de base topol
ogica, conceito esse pertencente ao contexto dos espacos vetoriais topologicos:
Uma base topol
ogica em um espaco vetorial topologico V e um conjunto B = {b i , i I} de vetores
linearmente independentes tais que span (B) e um conjunto denso em V , ou seja, o fecho de span (B)
e V .
Uma base topologica e dita ser base topol
ogica completa se nao possuir nenhum subconjunto proprio
que tambem seja uma base topologica.
A dimens
ao topol
ogica de um espaco vetorial e entao definida como sendo a cardinalidade das bases
topologicas completas de V .
Para ilustrar como os conceitos de base algebrica e base topologica sao diferentes, consideremos
novamente o seguinte Exemplo 4 acima:
Exemplo 5. V =


sobre o corpo dos racionais, com a topologia usual sobre




, tem uma base

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

topologica completa de dimensao finita: B = {1}. De fato, o conjunto {r 1, r


Esse espaco vetorial possui entao uma dimensao topologica igual a um.

101/1304

} e denso em


Defini
c
ao. Um espaco vetorial topologico sobre o corpo dos reais ou dos complexos e dito ser separavel
se possuir uma base topologica contavel.

2.1.3

O Dual Alg
ebrico de um Espa
co Vetorial

Seja V um espaco vetorial sobre um corpo K (por exemplo, o corpo


definida sobre todo V , e dita ser um funcional linear se

). Uma aplicacao l : V K,

l(x + y) = l(x) + l(y)


para todo x, y V e todo , K.
E. 2.7 Exerccio.
que l(0) = 0.

Mostre que, de acordo com a definicao acima, vale para qualquer funcional linear l
6

O conjunto de todos os funcionais lineares de V em K e denominado espaco dual algebrico de V e


denotado V 0 . O conjunto V 0 e feito um espaco vetorial (sobre K), atraves da seguinte relacao:
(l + m)(x) := l(x) + m(x),
para todo l e m V 0 ; , K e todo x V . O vetor nulo de V 0 e o funcional linear que associa
trivialmente todo vetor de V a zero: l(x) = 0, x V .

O seguinte teorema e verdadeiro e sera implicitamente usado varias vezes no que segue. Sua demonstracao e, como veremos, elementar mas instrutiva.

Teorema 2.4 Seja um espaco vetorial V sobre um corpo K. Se um vetor v tem a propriedade que
l(v) = 0 para todo l V 0 ent
ao v = 0.
2
Prova. Seja B uma base algebrica em V . Para cada elemento b B podemos associar um funcional
linear lb , definido da seguinte forma. Como todo w V pode ser escrito como uma combinacao linear
finita de elementos de B, podemos sempre escrever
w = wb b + w 0 ,
claro que wb = 0 caso b
onde w 0 e uma combinacao linear finita de elementos de B \ {b} e wb K. (E
nao compareca na decomposicao de w em uma soma finita de elementos de B).
Definimos entao
lb (w) = wb ,
um exerccio simples mostrar que, para cada b B, a aplicacao lb : V K
para todo vetor w V . E
dada acima e um funcional linear.
E. 2.8 Exerccio. Mostre isso.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

102/1304

Seja entao v um vetor como no enunciado do teorema. Se l(v) = 0 para todo l V 0 , vale obviamente que lb (v) = 0 para todo b B. Isso, porem, trivialmente implica que v = 0, completando a
demonstracao.
Notaca
o. Para x V e l V 0 e muito freq
uente, e graficamente conveniente, usar-se a notacao hl, xi
em lugar de l(x).
Se A e B sao espacos vetoriais e A B entao B 0 A0 .
ltima afirmativa.
E. 2.9 Exerccio. Justifique essa u

O Dual Topol
ogico de um Espa
co Vetorial
Seja V um espaco vetorial topologico. O conjunto de todos os funcionais lineares contnuos sobre
V e dito ser o dual topol
ogico de V . O dual topologico sera denotado nestas notas por V . Note-se que
V V 0.
Exemplos de Funcionais Lineares
Exemplo 1. Seja V = n , sobre o corpo dos complexos. Seja a1 , . . . , an um conjunto fixo de
n
umeros complexos. Para qualquer vetor z = (z1 , . . . , zn ) n defina-se
l(z) = a1 z1 + + an zn .
Entao l e um funcional linear em

E. 2.10 Exerccio. Verifique.

Em verdade, e possvel demonstrar a recproca: em n todo funcional linear e da forma acima


para algum conjunto {a1 , . . . , an }. Essa afirmativa e um caso particular de um teorema importante
conhecido como Lema de Riesz, que sera demonstrado no contexto mais geral dos chamados espacos
de Hilbert, dos quais n e um exemplo.
Seja P o conjunto de todos os polinomios de uma variavel real com coeficientes complexos: P n (t) P,
Pn (t) = an tn + + a1 t + a0
com t , ai , e dito ser um polinomio de grau n se an 6= 0. O conjunto P e claramente um espaco
vetorial sobre os complexos.


Exemplo 2. Para cada t0




e p P,
l(p) = p(t0 )

e um funcional linear em P.
E. 2.11 Exerccio. Verifique.
Esse exemplo pode ser generalizado:

JCABarata. Curso de Fsica-Matem


atica

Exemplo 3. Sejam t1 , . . . , tn
definamos


Vers
ao de 29 de setembro de 2005.

Captulo 2

103/1304

, distintos, e a1 , . . . , an n
umeros complexos. Para todo p P,

l(p) = a1 p(t1 ) + + an p(tn ).


Entao l e um funcional linear em P.
E. 2.12 Exerccio. Verifique.

Ou
ltimo exemplo pode ser fortemente generalizado nos dois exemplos que seguem.
Exemplo 3. Seja (a, b) um intervalo finito de e h uma funcao complexa integravel nesse intervalo
Rb
(ou seja, a |h(t)|dt ). Entao,
Z b
h(t) p(t) dt
l(p) =


esta definida para todo p P e define um funcional linear em P.


E. 2.13 Exerccio. Justifique as duas u
ltimas afirmativas.
2

Exemplo 4. Seja a funcao g(x) = ex . Entao


Z
l(p) =
g(t) p(t) dt.

esta definida para todo p P e define um funcional linear em P.


ltimas afirmativas.
E. 2.14 Exerccio. Justifique as duas u

A Rela
c
ao entre V e V 0
Vamos aqui discutir o fato que sempre existe uma maneira (nao-canonica, vide abaixo) de associar
vetores de um espaco vetorial V com elementos de seu dual algebrico V 0 .
Seja V um espaco vetorial sobre um corpo K e B V uma base algebrica em V . Seja FB a colecao
de todas as funcoes de B em K. Afirmamos que existe uma bijecao de FB sobre V 0 , ou seja, esses dois
conjuntos podem ser identificados nesse sentido.
Para tal, seja f FB . Definimos uma aplicacao I : FB V 0 da seguinte forma. Como todo x V
pode ser escrito como uma combinacao linear finita de elementos de B, digamos, x = 1 bi1 + +n bin ,
escrevemos
I(f )(x) = 1 f (bi1 ) + + n f (bin ).
I(f ) e um funcional linear pois, se escrevemos y = n+1 bin+1 + + n+m bin+m , teremos
I(f )(x + y) = 1 f (bi1 ) + + n+m f (bin+m )
= 1 f (bi1 ) + + n f (bin ) + n+1 f (bin+1 ) + + n+m f (bin+m )
= I(f )(x) + I(f )(y).

(2.2)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

104/1304

Isso entao mostrou que I(f ) e de fato um elemento de V 0 para cada f FB . Vamos mostrar o reverso:
que a cada elemento l de V 0 ha um elemento gl de FB associado e que I(gl ) = l. Seja novamente
x = 1 bi1 + + n bin V e seja l um elemento de V 0 . Tem-se
l(x) = 1 l(bi1 ) + + n l(bin ).
Definimos entao gl : B K por

gl (b) = l(b)

para todo b K. Pela definicao


I(gl )(x) = 1 gl (bi1 ) + + n gl (bin ) = 1 l(bi1 ) + + n l(bin ) = l(x)

(2.3)

para todo x V . Logo I(gl ) = l como queramos.

A aplicacao I : FB V 0 e, portanto, uma bijecao entre esses dois conjuntos. Notemos, porem, que
essa bijecao nao e canonica no sentido que a mesma depende da base adotada. Se trocarmos B por
outra base a bijecao altera-se.
De posse desses fatos podemos entender a relacao entre V e V 0 da seguinte forma. Seja o subconjunto
GB de FB formado por todas as funcoes que assumem valores nao-nulos (no corpo K) apenas para um
conjunto finito de B, ou seja, para g GB existe um conjunto finito Bg = {b1 , . . . , bn } B tal que g
e nao-nula nos elementos de Bg , mas e nula em B \ Bg .
Os conjuntos GB e V podem ser identificados no seguinte sentido. Afirmamos que existe uma bijecao
J : GB V . Tal e facil de ver se lembrarmos que os elementos de V podem ser escritos como uma
combinacao linear finita de elementos de B. De fato, para g GB definimos
J(g) = g(b1 )b1 + + g(bn )bn V
onde {b1 , . . . , bn } = Bg . Reciprocamente, se x V e x = 1 bi1 + + n bin , definimos gx GB por
gx (bia ) = a ,

a = 1, . . . , n

e
gx (b) = 0,
facil ver entao que
se b 6 {bi1 , . . . , bin }. E
J(gx ) = g(bi1 )bi1 + + g(bin )bin = 1 bi1 + + n bin = x ,

(2.4)

o que mostra que J e bijetora. Notemos novamente que essa bijecao tambem nao e canonica, no sentido
que a mesma depende da base adotada. Se trocarmos B por outra base a bijecao altera-se.
E. 2.15 Exerccio importante. Mostre agora que J 1 : V Gb e linear, ou seja, J 1 (x + y) =
J 1 (x) + J 1 (y) para todos x, y V e todos , K.
6
Juntando o discutido acima, conclumos que 1 = I J 1 e uma aplicacao linear injetora de V em
V . A mesma, porem, nao e natural, pois depende da base algebrica B escolhida.
0

Assim, fixada uma base B em V ha uma maneira de associar todos os elementos de V com elementos
do seu dual algebrico. Notemos porem que pode haver elementos de V 0 aos quais nao correspondem tais

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

105/1304

identificacoes, ou seja, a imagem de 1 = I J 1 e tipicamente (especialmente em dimensao infinita)


um subconjunto proprio de V 0 .
Exemplo. Seja P o espaco vetorial dos polinomios em definido acima. Seja T = {ti , i },
um conjunto contavel de pontos distintos da reta real e seja q(t) = q0 + q1 t + + qn tn , polinomio.
Definamos lq V 0 por
lq (p) = q0 p(t0 ) + q1 p(t1 ) + + qn p(tn ).


E. 2.16 Exerccio. Mostre que a aplicacao P 3 q lq V 0 e linear e injetora.

E. 2.17 Exerccio. Sera que com o conjunto T fixado todo elemento de V 0 seria da forma lq para algum
q?. Pense. Inspire-se nos exemplos 3 e 4 da pagina 103. O que acontece para conjuntos T diferentes? 6
Coment
ario. Mais interessante que a relacao entre V e V 0 , e a relacao de V com o dual algebrico de
0
V , o chamado bi-dual algebrico de V e denotado por (V 0 )0 , assunto que discutiremos agora. A razao
e que, ao contrario do que tipicamente ocorre entre V e V 0 , ha sempre uma aplicacao linear injetora
entre V e (V 0 )0 que e natural, ou seja, independente de escolhas de bases.
Outro interesse na relacao entre V e (V 0 )0 reside no fato que a mesma revela-nos, como veremos,
uma profunda distincao entre espacos vetoriais de dimensao finita e infinita.
O Bi-dual Alg
ebrico de um Espa
co Vetorial
Se V e um espaco vetorial sobre um corpo K ja observamos que V 0 e tambem um espaco vetorial
sobre o mesmo corpo. Assim, V 0 tem tambem seu dual algebrico que e denominado bi-dual algebrico
de V .
O bi-dual algebrico de um espaco vetorial V e o espaco (V 0 )0 . Como vimos nas paginas anteriores,
existe pelo menos uma aplicacao linear injetiva de V em V 0 . Chamemos esta aplicacao de 1 . Analogamente, existe pelo menos uma aplicacao linear injetiva 2 de V 0 em (V 0 )0 . A composicao 2 1
fornece uma aplicacao linear injetiva de V em (V 0 )0 . Como 1 e 2 dependem de escolhas de base, a
composicao 2 1 tambem depende, nao sendo, assim, natural.

Ao contrario do que ocorre na relacao entre V e V 0 , podemos sempre encontrar uma aplicacao
linear injetiva de V em (V 0 )0 que e natural: independente de base. Vamos denota-la por . Definimos
: V (V 0 )0 da seguinte forma: para x V , (x) e o elemento de (V 0 )0 que associa a cada l V 0 o
valor l(x):
(x)(l) = l(x).
E. 2.18 Exerccio. Mostre que : V (V 0 )0 e linear.

E. 2.19 Exerccio. Mostre que : V (V 0 )0 e injetora. Sugestao: use o Teorema 2.4, enunciado e
demonstrado na pagina 101.
6
transparente pela definicao de que a mesma e independente de bases e, portanto, natural. A
E
relacao entre x V e um elemento de (V 0 )0 mostrada acima e tao direta que quase poderamos dizer que

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

106/1304

V e um subconjunto de (V 0 )0 : V (V 0 )0 . Alguns autores, abusando um pouco da linguagem, chegam


mesmo a escrever uma tal relacao de inclusao. Mais correta, no entanto e a relacao (V ) (V 0 )0 .

Poderamos nesse momento nos perguntar: quando podemos eventualmente ter (V ) = (V 0 )0 ? Para
o caso de espacos vetoriais sobre o corpo dos reais ou dos complexos resposta e simples e um tanto
surpreendente e se expressa no seguinte teorema.
Teorema 2.5 Seja V um espaco vetorial sobre o corpo dos reais ou dos complexos. Ent
ao (V ) = (V 0 )0
se e somente se V e um espaco vetorial de dimens
ao finita.
2
Este teorema revela uma importante distincao entre espacos de dimensao finita e infinita. Em
dimensao finita todos os funcionais lineares do dual algebrico de V 0 sao da forma (x) para algum
vetor x. Em dimensao infinita, porem, ha certamente elementos em (V 0 )0 que nao sao dessa forma.
Assim, ao tomarmos duais duplos em dimensao infinita sempre obtemos espacos vetoriais maiores, o
que nao ocorre em dimensao finita.
Prova. Seja V um espaco vetorial sobre um corpo K =

ou


Caso de dimens
ao finita. Vamos em primeiro lugar supor que V e de dimensao finita e denotemos
claro que o n
por dim V sua dimensao. Seja tambem B = {b1 , . . . , bn } uma base de V . E
umero de
elementos de B e n = dim V .
facil mostrar que o conjunto {(b1 ), . . . , (bn )} e linearmente independente em (V 0 )0 . De fato, se
E
existirem escalares i tais que
1 (b1 ) + + n (bn ) = 0

ou seja,

teramos para todo l V 0

(1 b1 + + n bn ) = 0
(w)(l) = l(w) = 0

onde w = 1 b1 + + 1 bn . Isso, porem, implica w = 0 (pelo Teorema 2.4, pagina 101), o que implica
1 = = n = 0.

Isso claramente diz que dim (V 0 )0 dim V . Afirmamos que a igualdade so se da se (V ) = (V 0 )0 .


De fato, se (V ) = (V 0 )0 entao todo elemento de (V 0 )0 e da forma
(1 b1 + + n bn ) = 1 (b1 ) + + n (bn )

e, portanto {(b1 ), . . . , (bn )} e uma base em (V 0 )0 e dim (V 0 )0 = dim V . Se, por outro lado, (V ) e um
subconjunto proprio de (V 0 )0 , existem elementos v 00 (V 0 )0 tais que v 00 1 (b1 ) n (bn ) 6= 0
para todos i K. Portanto, {v 00 , (b1 ), . . . , (bn )} e um conjunto de n + 1 vetores linearmente
independentes. Logo dim (V 0 )0 > n = dim V , pelo Teorema 2.3, pagina 97.
Vamos entao mostrar que obrigatoriamente tem-se que dim (V 0 )0 = dim V , provando o teorema.
Como vimos quando discutimos a relacao entre V e V 0 a` pagina 103, V 0 e equivalente ao conjunto
FB de todas as funcoes de B em K, enquanto que V e equivalente ao conjunto GB formado por todas
as funcoes que assumem valores nao-nulos (no corpo K) apenas para um conjunto finito de B. Como
B tem um n
umero finito de elementos, sucede GB = FB (por que?). Logo V e V 0 sao equivalentes:
existe uma bijecao linear 1 entre ambos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

107/1304

A aplicacao 1 leva a base B em uma base 1 (B) em V 0 . Para ver isso, notemos que todo elemento
l V 0 e da forma l = 1 (v), para algum v V . Como todo v V e da forma v = 1 b1 + +n bn , segue
que todo elemento l V 0 e da forma 1 1 (b1 )+ +n 1 (bn ). Como 1 e bijetora, {1 (b1 ), . . . , 1 (bn )}
e um conjunto de vetores linearmente independentes pois se existirem escalares 1 , . . . , n tais que
1 1 (b1 ) + + n 1 (bn ) = 0

teramos 1 (1 b1 + + n bn ) = 0 o que implica 1 b1 + + n bn = 0, pois 1 e bijetora. Isso porem


implica 1 = = n = 0, pois {b1 , . . . , bn } e uma base. Assim, 1 (B) = {1 (b1 ), . . . , 1 (bn )} e uma
base em V 0 e, portanto, dim V 0 = n = dim V .
Analogamente, tem-se que V 0 e (V 0 )0 sao equivalentes e, portanto, existe uma bijecao linear 2 entre
ambos que leva a base 1 (B) em uma base 2 1 (B) em (V 0 )0 . Portanto, dim V 0 = dim (V 0 )0 .
Logo dim V = dim V 0 = dim (V 0 )0 , como queramos provar.

Caso de dimens
ao infinita. No caso de dimensao infinita desejamos mostrar que sempre ha elementos
0 0
em (V ) que nao sao da forma (x) para algum x V .
Abaixo K e o corpo dos reais ou dos complexos.

Vamos primeiro delinear a estrategia a ser seguida. Seja B uma base em V (fixa daqui por diante).
Como sabemos, existe uma aplicacao linear bijetora : FB V 0 . Uma funcao s : B K, s FB
e dita ser limitada se existir um M > 0 tal que |s(b)| < M para todo b B. Seja LB o conjunto de
claro que LB FB . Vamos mostrar o seguinte: nao existe
todas as funcoes limitadas de B em K. E
nenhum vetor nao-nulo v V com a propriedade que
(v)() = 0

para todo (LB ). Seja v = 1 b1 + + m bm um tal vetor para o qual (v)() = 0. Isso significa
que para todo (LB )
0 = (v)() = (v) = 1 (b1 ) + + m (bm ).

Tomemos funcionais i s da forma

i (b) =

1, se b = bi
0, de outra forma

para i = 1, . . . , m. Como todo i e um elemento de (LB ) (por que?), teramos 0 = i (v) = i para
todo i, o que implica v = 0.
A conclusao e que nenhum elemento de (V 0 )0 que seja da forma (v) para algum v V nao-nulo
pode anular todos os elementos de (LB ) V 0 . A estrategia que seguiremos sera a de exibir um
elemento de (V 0 )0 que tem precisamente a propriedade de anular todos os elementos de (LB ). Um tal
elemento nao pode pertencer, portanto, a (V ), o que mostra que (V ) e um subconjunto proprio de
(V 0 )0 no caso de dimensao infinita.
Seja u V 0 \ (LB ) e U o sub-espaco de V 0 gerado por u. Todo elemento l V 0 pode ser escrito
de modo u
nico na forma
l = au + y
claro que (V 0 )0
onde a K e y pertence ao sub-espaco complementar de U . Definamos (l) = a. E
e que aniquila todo elemento de (LB ), pois estes pertencem ao sub-espaco complementar de U (por
que?). Assim, (V 0 )0 mas 6 (V ).

JCABarata. Curso de Fsica-Matem


atica

2.2
2.2.1

Vers
ao de 29 de setembro de 2005.

Captulo 2

108/1304

Formas Lineares, Sesquilineares e Produtos Escalares em


Espa
cos Vetoriais
Formas Multilineares

Seja V um espaco vetorial sobre um corpo K (por exemplo, os reais ou os complexos) e n um n


umero
4
n
inteiro positivo. Uma n-forma multilinear em V e uma funcao : V K que seja linear em cada um
dos seus argumentos, ou seja, para todo , K, todos v1 , . . . , vn V , vi0 V e todo i = 1, . . . , n
vale
(v1 , . . . , vi1 , (vi + vi0 ), vi+1 , . . . , vn ) =
(v1 , . . . , vi1 , vi , vi+1 , . . . , vn ) + (v1 , . . . , vi1 , vi0 , vi+1 , . . . , vn ) (2.5)
O seguinte fato importante e conseq
uencia imediata da definicao acima: se e uma n-forma multilinear entao
(v1 , . . . , vi1 , 0, vi+1 , . . . , vn ) = 0
para todo i, ou seja, se um dos argumentos e o vetor nulo a forma se anula.
E. 2.20 Exerccio. Prove isso. Sugestao: o que acontece se escolhermos = = 0?

Um fato importante e o seguinte: o conjunto de todas as n-formas lineares em um espaco vetorial


V sobre um corpo K e igualmente um espaco vetorial sobre K. Para tal procede-se da seguinte forma:
para duas n-formas lineares 1 e 2 e dois escalares 1 , 2 K define-se a combinacao linear 1 1 +2 2
como sendo a n-forma linear que a toda n-upla de vetores v1 , . . . , vn V associa
(1 1 + 2 2 )(v1 , . . . , vn ) = 1 1 (v1 , . . . , vn ) + 2 2 (v1 , . . . , vn ).
E. 2.21 Exerccio. Complete os detalhes da prova que o conjunto de todas as n-formas lineares em um
espaco vetorial V sobre um corpo K forma um espaco vetorial sobre K.
6
Formas Bilineares
De particular interesse e o caso n = 2, em cujo caso as formas sao denominadas formas bilineares:
uma forma bilinear e uma funcao : V 2 K que seja linear em cada um dos seus dois argumentos,
ou seja, para todo , K, todos u, v, w V , valem
(u, (v + w)) = (u, v) + (u, w),
((u + v), w) = (u, w) + (v, w).
4

Tambem chamada n-forma linear ou simplesmente n-forma.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

109/1304

Um exemplo basico importante e o seguinte. Seja V = n o espaco vetorial (sobre o corpo dos
reais) formado por n-uplas de n
umeros reais: V = {x = (x1 , . . . , xn ), xi }. Uma forma bilinear
em V e dada por
n
X
xk y k .
(2.6)
hx, yi =


k=1

Outro exemplo e
A (x, y) = hx, Ayi ,


onde A e uma matriz n n real qualquer.


Formas Bilineares N
ao-Degeneradas
Uma forma bilinear e dita ser uma forma bilinear n
ao-degenerada se satisfizer a seguinte condicao:
se para todo vetor v valer (v, u) = 0, entao u = 0.
Formas Bilineares N
ao-Singulares
Seja V um espaco vetorial e uma forma bilinear em V . Para u V fixo a aplicacao lu (v) = (u, v)
e um funcional linear em V , ou seja, um elemento do espaco dual V 0 . Se a aplicacao l : V V 0 que
associa cada u V ao funcional linear lu acima for um isomorfismo de espacos vetoriais a forma bilinear
e dita ser uma forma bilinear n
ao-singular.
Ha varios outros tipos de formas multilineares que sao importantes, como por exemplo as chamadas
formas multilineares alternantes e, dentre estas as formas simpleticas.
Formas Alternantes
Uma n-forma linear em um espaco vetorial V sobre um corpo K e dita ser uma forma alternante
(ou uma forma anti-simetrica) se satisfizer
(v1 , . . . , vi1 , vi , vi+1 , vi+2 , . . . , vn ) = (v1 , . . . , vi1 , vi+1 , vi , vi+2 , . . . , vn )

(2.7)

para todos os vetores v1 , . . . , vn V e todo i = 1, . . . , n 1. Em palavras, quando trocamos de


lugar dois argumentos vizinhos quaisquer a forma troca de sinal.
Deve ser bem claro que essa definicao equivale a` seguinte afirmacao: se e uma n-forma linear
alternante, entao para todo Sn , o grupo de permutacoes de n elementos, vale

v(1) , . . . , v(n) = (sinal) (v1 , . . . , vn ) ,
(2.8)

para todos os vetores v1 , . . . , vn V , onde sinal e o sinal da permutacao (definido a` pagina 671).
E. 2.22 Exerccio. Esta claro?

Nomenclatura. Se e n-forma linear alternante, n e dito ser o grau de .


O conjunto de todas as n-formas lineares alternantes em um espaco vetorial V sobre um corpo K e
igualmente um espaco vetorial sobre K: para duas n-formas lineares alternantes 1 e 2 e dois escalares

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

110/1304

1 , 2 K define-se a combinacao linear 1 1 + 2 2 como sendo a n-forma linear que a toda n-upla
de vetores v1 , . . . , vn V associa
(1 1 + 2 2 )(v1 , . . . , vn ) = 1 1 (v1 , . . . , vn ) + 2 2 (v1 , . . . , vn ).
facil constatar que a n-forma linear assim definida e tambem alternante.
E
E. 2.23 Exerccio. Complete os detalhes da prova que o conjunto de todas as n-formas lineares alternantes em um espaco vetorial V sobre um corpo K forma um espaco vetorial sobre K.
6
Formas Simpl
eticas
Formas bilineares alternantes nao-degeneradas sao denominadas formas simpleticas 5. Formas simpleticas sao importantes em algumas areas da Fsica, como por exemplo na mecanica classica e no
estudo de metodos de quantizacao.
Assim, uma forma simpletica em um espaco vetorial V sobre um corpo K e uma forma bilinear
para a qual
(u, v) = (v, u)
para todos os vetores u, v V e tal que se (u, v) = 0 para todo v, entao u = 0.
Um exemplo basico importante no caso do espaco vetorial V =
2.4, e o caso geral e o seguinte:
A (x, y) = hx, Ayi ,

e que, como veremos na Secao

onde A e uma matriz n n real anti-simetrica, ou seja, que satisfaz AT = A, o que equivale a dizer
que seus elementos de matriz satisfazem Aij = Aji . Fora isso, pela condicao de nao-degenerescencia
A tem que ser invertvel, pois se hx, Ayi = 0 para todo y, entao hAT x, yi = 0 para todo y, o
que so e possvel se AT x = 0. Isso implicaria que det(A) = det(AT ) = 0. Uma conseq
uencia do
T
fato de A ter de ser invertvel e que n tem que ser par. De fato, a condicao A = A diz que
det(A) = det(AT ) = (1)n det(AT ) = (1)n det(A). Portanto, se n e mpar teramos det(A) = 0.


Algumas Propriedades B
asicas de Formas Lineares Alternantes
evidente pela definicao que se e uma n-forma alternante entao (v1 , . . . , vn ) = 0 caso haja
E
vi = vj para algum par i 6= j. Em particular, para formas simpleticas (u, u) = 0 para todo u V .
E. 2.24 Exerccio. A propriedade mencionada no u
ltimo paragrafo e equivalente `a definicao de forma
linear alternante: se e uma n-forma linear e (v1 , . . . , vn ) = 0 sempre que vi = vj para algum par i 6= j,
entao e alternante. Prove isso. Sugestao: para i 6= j defina a forma bilinear ij (vi , vj ) := (v1 , . . . , vn )
onde todos os vetores v1 , . . . , vn estao fixos exceto vi e vj . Usando agora que ij (x + y, x + y) = 0,
mostre que ij (vi , vj ) = ij (vj , vi ) para todo vi e vj . A afirmacao principal segue disso (por que?). 6
A seguinte proposicao sobre formas lineares alternantes e importante:
5

Do grego symplektik
os: que serve para ligar, trancado, enlacado.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

111/1304

Proposi
c
ao 2.2 Se e uma n-forma linear alternante e v1 , . . . , vn s
ao vetores linearmente dependentes,
ent
ao
(v1 , . . . , vn ) = 0.
2
E. 2.25 Exerccio. Prove isso.

Formas Alternantes Maximais


A Proposicao 2.2 tem uma conseq
uencia imediata: se V e um espaco vetorial de dimensao n e e
uma forma linear alternante de ordem m > n, entao = 0.
E. 2.26 Exerccio. Por que?

Assim, em um espaco de dimensao n o grau maximo de uma forma alternante e n. Formas alternantes de grau maximo sao ditas formas alternantes maximais. Vamos mais adiante estudar como sao essas
formas maximais, mas antes, precisamos discutir alguns fatos importantes sobre formas alternantes em
espacos de dimensao finita.
Em um espaco vetorial V de dimensao n o espaco vetorial das formas alternantes maximais e
unidimensional. Para ver isso notemos o seguinte. Seja {b1 , . . . , bn } uma base em V . Sejam agora 1
e 2 duas formas alternantes maximais em V e seja x1 , . . . , xn uma n-upla de vetores de V . Como
{b1 , . . . , bn } e uma base, podemos sempre escrever
xi =

n
X

ij bj ,

j=1

para todo i = 1, . . . , n. Assim,


1 (x1 , . . . , xn ) =

n
X

n
X

j1 =1

n
X

1j1 njn 1 (bj1 , . . . , bjn )

n
X

1j1 njn 2 (bj1 , . . . , bjn ).

jn =1

e, analogamente,
2 (x1 , . . . , xn ) =

j1 =1

jn =1

Ocorre que 1 (bj1 , . . . , bjn ) e zero caso ocorram dois ndices jk iguais. Por isso, podemos reescrever
as expressoes acima da seguinte forma:
X
1 (x1 , . . . , xn ) =
1j(1) nj(n) 1 (bj(1) , . . . , bj(n) )
jSn

e, analogamente,
2 (x1 , . . . , xn ) =

jSn

1j(1) nj(n) 2 (bj(1) , . . . , bj(n) ) ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

112/1304

onde, acima, Sn e o conjunto de todas as bijecoes de {1, . . . , n} em si mesmo (o chamado grupo de


permutaco
es de n elementos).
E. 2.27 Exerccio. Justifique.

Como 1 e uma forma alternante maximal, tem-se que


1 (bj(1) , . . . , bj(n) ) = sinal(j) 1 (b1 , . . . , bn ).
Assim,
1 (x1 , . . . , xn ) =

1j(1) nj(n) sinal(j) 1 (b1 , . . . , bn )

jSn

e, analogamente,
2 (x1 , . . . , xn ) =

jSn

1j(1) nj(n) sinal(j) 2 (b1 , . . . , bn ).

Como se ve nessas u
ltimas expressoes, 1 (x1 , . . . , xn ) e 2 (x1 , . . . , xn ) diferem apenas pelos fatores
1 (b1 , . . . , bn ) e 2 (b1 , . . . , bn ), respectivamente. Como esses fatores sao apenas n
umeros (elementos
do corpo K), sao proporcionais um ao outro. Isso prova entao que 1 (x1 , . . . , xn ) e 2 (x1 , . . . , xn )
sao proporcionais um ao outro para toda n-upla x1 , . . . , xn e isso era o que queramos provar.
Com as observacoes acima chegamos ao importante conceito de forma determinante.
A Forma Determinante
Como observamos acima, todas as n-formas lineares alternantes maximais de um espaco vetorial
V de dimensao n sao proporcionais umas a`s outras. Assim, o conhecimento de uma forma alternante
maximal determina todas as outras.
A forma determinante6 det em um espaco vetorial V de dimensao n e a n-forma linear alternante
maximal tal que det (b1 , . . . , bn ) = 1 no caso em que {b1 , . . . , bn } e a base canonica de V :



1
0
0
0
1
0



0
0

b1 = , b2 = , . . . , bn = ... .
..
..

.
.
0
0
0
1
Assim,
det (x1 , . . . , xn ) =

jSn

1j(1) nj(n) sinal(j),

onde ij e a j-esima componente do vetor xi na base canonica.


6

Tambem chamada de forma volume, pois em


vetores x1 , x2 , x3 .

, det (x1 , x2 , x3 ) e igual ao volume do paraleleppedo descrito pelos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

113/1304

Como observamos, todas as outras n-formas lineares alternantes maximais de V sao proporcionais
a det .
Determinante de Matrizes
Sejam x1 , . . . , xn vetores, representados na base canonica por vetores-coluna

i1
..
xi = . .
in

hh
ii
Denotamos por x1 , . . . , xn a matriz n n construda de forma que sua a-esima coluna seja o
vetor-coluna xa , ou seja

11
n1
hh
ii

.. .
..
x1 , . . . , xn = ...
.
.
1n nn

hh
ii
evidente que toda matriz M (n n) pode ser escrita na forma M = x1 , . . . , xn para algum
E
conjunto de vetores x1 , . . . , xn que representam suas colunas.
Define-se entao o determinante da matriz M como sendo
det(M ) := det (x1 , . . . , xn ).
Cremos que o conceito de determinante de matrizes e suas propriedades basicas sejam bem conhecidos do estudante.

2.2.2

Formas Sesquilineares e as Desigualdades de Cauchy-Schwarz e Minkowski

Formas Sesquilineares. Defini


co
es
Seja V um espaco vetorial complexo. Uma forma sesquilinear7 e uma funcao : V V
satisfaz as seguintes propriedades:
1. Linearidade em relacao a` segunda variavel:
(u, v + w) = (u, v) + (u, w),
para todos os vetores u, v e w e para todos os n
umeros complexos e .
2. Anti-linearidade em relacao a` primeira variavel:
(u + v, w) = (u, w) + (v, w),
7

Do radical grego sesqui: um e meio.

que

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

114/1304

para todos os vetores u, v e w e para todos os n


umeros complexos e .
imediato pela definicao que toda forma sesquilinear se anula no vetor nulo, ou seja,
E
(u, 0) = (0, u) = 0,
para todo vetor u.
E. 2.28 Exerccio. Prove isso.

Uma forma sesquilinear e dita ser uma forma sesquilinear Hermitiana se satisfizer:
3. Simetria por conjugacao complexa:
(u, v) = (v, u),
para todos os vetores u e v.
Uma forma sesquilinear e dita ser uma forma sesquilinear positiva se satisfizer
4. Positividade. Para todo u V ,

(u, u) 0.

Abaixo (Teorema 2.6, pagina 114) provaremos que toda forma sesquilinear positiva e automaticamente Hermitiana. La provaremos tambem que se e uma forma sesquilinear positiva entao vale
que |(u, v)|2 (u, u) (v, v) para todos os vetores u e v. Essa desigualdade e conhecida como
Desigualdade de Cauchy-Schwarz.
Uma forma sesquilinear e dita ser uma forma sesquilinear n
ao-degenerada se satisfizer:
5. Nao-degenerescencia. Se um vetor u e tal que vale (u, v) = 0 para todo vetor v, entao u = 0.
Nomenclatura. Uma forma sesquilinear que nao e nao-degenerada e dita ser degenerada.
Formas sesquilineares n
ao-singulares
Seja V um espaco vetorial e uma forma sesquilinear em V . Para u V fixo a aplicacao l u (v) =
(u, v) e um funcional linear em V , ou seja, um elemento do espaco dual V 0 . Se a aplicacao anti-linear
l : V V 0 que associa cada u V ao funcional linear lu acima for um anti-isomorfismo8 de espacos
vetoriais a forma sesquilinear e dita ser uma forma sesquilinear n
ao-singular.
A Desigualdade de Cauchy-Schwarz
De importancia fundamental na teoria das formas sesquilineares e o seguinte teorema, que apresentanos a importante desigualdade de Cauchy9 -Schwarz10 .
Teorema 2.6 Se e uma forma sesquilinear positiva, ent
ao e tambem Hermitiana, ou seja,
(u, v) = (v, u) ,
8

Definido a
` p
agina 67.
Augustin Louis Cauchy (1789-1857).
10
Karl Herman Amandus Schwarz (1843-1921).
9

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

115/1304

para todos os vetores u e v. Fora isso vale a desigualdade de Cauchy-Schwarz: para todos os vetores u
e v,
|(u, v)|2 (u, u) (v, v).
(2.9)
Por fim, se e uma forma sesquilinear positiva e n
ao-degenerada ent
ao (u, u) = 0 se e somente se
u = 0.
2
Prova. Faremos uso do fato que, para qualquer n
umero complexo e quaisquer vetores u e v vale, pela
hipotese de positividade,
(u + v, u + v) 0.
Escrevendo-se explicitamente o lado esquerdo temos a desigualdade
||2 (v, v) + (u, v) + (v, u) + (u, u) 0.
E. 2.29 Exerccio. Verifique isso.

Vamos agora escrever na forma = x + iy, onde x e a parte real de e y sua parte imaginaria.
Au
ltima expressao fica
f (x, y) := (x2 + y 2 )(v, v) + (x + iy)(u, v) + (x iy)(v, u) + (u, u) 0.
E. 2.30 Exerccio. Verifique isso.

Vamos decompor (u, v) e (v, u) nas suas partes reais e imaginarias, escrevendo
(u, v) = + i
onde , , e


(v, u) = + i,

(2.10)

. Ficamos com

f (x, y) = (x2 + y 2 )(v, v) + (x y) + i(x + y) + (x + y) + i(x y) + (u, u) 0. (2.11)


Como f (x, y) tem que ser real (e 0) segue que a parte imaginaria da expressao acima deve ser nula
e, como (v, v) e (u, u) sao reais, devemos ter
0 = (x + y) + (x y) = x( + ) + y( ).
Como isso deve valer para todos x, y
diz que


, segue que = e = . Comparando com (2.10), isso


(u, v) = (v, u),

provando que e Hermitiano.


Com as relacoes = e = a expressao (2.11) fica
f (x, y) = (x2 + y 2 )(v, v) + 2(x y) + (u, u).

(2.12)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

116/1304

Vamos agora considerar dois casos: um onde (v, v) = 0 e outro onde (v, v) 6= 0. No primeiro
f (x, y) = 2(x y) + (u, u).
Assim, como (u, u) 0 pela positividade, a condicao f (x, y) 0 e possvel para todos x e y
se e somente se = = 0, ou seja, se e somente se (u, v) = 0 para todo u. Aqui a desigualdade de
Cauchy-Schwarz (2.9) e trivialmente satisfeita, pois ambos os lados sao iguais a zero.


Passemos ao caso (v, v) 6= 0. Resta-nos provar a desigualdade de Cauchy-Schwarz (2.9) para esse
caso. Podemos reescrever o lado direito de (2.12) como
"
2 
2 #
 2


+ 2

f (x, y) = (v, v) x +
+ (u, u)
.
+ y
(v, v)
(v, v)
(v, v)
E. 2.31 Exerccio. Verifique.

Da, constatamos que f (x, y) 0 para todos x e y se e somente se


 2

+ 2
0,
(u, u)
(v, v)


ou seja, se e somente se
(u, u)(v, v) 2 + 2 .

O lado direito e, porem, |(u, v)|2 , e a u


ltima desigualdade significa
|(u, v)|2 (u, u)(v, v),
que e a desigualdade de Cauchy-Schwarz que queramos demonstrar.
Finalmente, se e uma forma sesquilinear positiva e nao-degenerada e um certo vetor u e tal que
(u, u) = 0, segue pela desigualdade de Cauchy-Schwarz que (u, v) = 0 para todo v, o que implica
u = 0, pois e nao-degenerada.

A Desigualdade de Minkowski
A desigualdade de Cauchy-Schwarz tem uma conseq
uencia de certa importancia, a chamada Desigualdade de Minkowski: Se e uma forma sesquilinear positiva (em particular, se e um produto
escalar) entao, para todos os vetores u e v, vale
(u v, u v)1/2 (u, u)1/2 + (v, v)1/2 .

(2.13)

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

117/1304

A demonstracao e simples:
(u v, u v) = (u, u) (u, v) (v, u) + (v, v)
= (u, u) 2Re ((u, v)) + (v, v)
(u, u) + 2 |(u, v)| + (v, v)
(u, u) + 2(u, u)1/2 (v, v)1/2 + (v, v)
=

(u, u)1/2 + (v, v)1/2

2

que e o que se queria demonstrar. Acima, na passagem da terceira para a quarta linha, usamos a
desigualdade de Cauchy-Schwarz.

2.2.3

Produtos Escalares

Produtos Internos ou Produtos Escalares


Uma forma sesquilinear positiva e dita ser um produto escalar ou produto interno se satisfizer:
6. (u, u) = 0 se e somente se u = 0.
A proposicao seguinte apresenta uma definicao alternativa de produto escalar.
Proposi
c
ao 2.3 Uma forma sesquilinear positiva e um produto escalar se e somente se for n
aodegenerada.
2
Prova. Se e um produto escalar, entao se u e tal que (u, v) = 0 para todo v, vale em particular
(tomando v = u) que (u, u) = 0 e, portanto, u = 0. Assim, todo o produto escalar e nao-degenerado.
Reciprocamente, pelo Teorema 2.6, pagina 114, se e uma forma sesquilinear positiva e nao-degenerada,
entao vale automaticamente que (u, u) = 0 se e somente se u = 0

Nota
co
es para produtos escalares
Seguindo a convencao, denotaremos freq
uentemente produtos escalares de dois vetores u e v nao
freq
por (u, v) mas por hu, vi. E
uente tambem denotar um produto escalar de dois vetores u e v por
(u, v). Essa notacao pode causar confusao com a de par ordenado e por isso a evitamos. Em textos
de Fsica e comum encontrar tambem a chamada notaca
o de Dirac para produtos escalares: hu|vi. Por
diversas razoes nao compartilhamos do entusiasmo de alguns com essa notacao e tambem a evitamos.
Detalhando a defini
c
ao de produto escalar
Como o conceito de produto escalar e muito importante, vamos detalha-lo um pouco mais antes de
passarmos a exemplos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

118/1304

Um produto escalar ou produto interno em um espaco vetorial V sobre o corpo dos complexos e
uma funcao V V , denotada por hu, vi, para u, v V , com as seguintes propriedades:
1. O produto escalar e linear na segunda variavel:
hu, v + wi = hu, vi + hu, wi
para todos u, v e w V e todos , .
2. O produto escalar e anti-linear na primeira variavel:
hu + v, wi = hu, wi + hv, wi
para todos u, v e w V e todos , , onde e o complexo conjugado de .
3. Conjugacao complexa:
para todos u, v V .
4. Para todo u V

hu, vi = hv, ui

h0, ui = hu, 0i = 0.

5. Positividade. Para todo vetor u nao-nulo


hu, ui > 0.
Nota. Alguns postulados da definicao de produto escalar acima sao redundantes, pois nem todos sao
independentes. Nos os listamos apenas para ressaltar sua relevancia individual. Por exemplo, o item
2 segue de 1 e 3 (por que?). O item 4 segue de 1 e 2 (por que?). Os itens 1, 2 e 5 implicam o item 3
(como veremos no Teorema 2.6). Independentes sao apenas 1, 2 e 5 ou 1, 3 e 5.
Para um produto escalar de dois vetores vale a seguinte e importantssima desigualdade, conhecida
como Desigualdade de Cauchy-Schwarz:
|hu, vi|2 |hu, ui||hv, vi|.
A demonstracao (mais geral) e apresentada no Teorema 2.6, pagina 114.
Advert
encia. Em livros de Matematica definicao de produto escalar e por vezes apresentada de forma
que se tenha linearidade na segunda variavel e anti-linearidade na primeira variavel acima. A convencao
que adotamos e oposta e e seguida, felizmente, por 100% dos textos de Fsica.
Formas Sesquilineares Positivas e Produtos Escalares
Se V e um espaco vetorial dotado de uma forma sesquilinear positiva , existe uma maneira canonica
de construir a partir de V e um outro espaco vetorial dotado de um produto escalar.
Seja uma forma sesquilinear positiva em um espaco vetorial V . Entao, existe um espaco vetorial

V , um produto escalar
e uma aplicacao linear sobrejetora E : V V tais que

(E(u), E(v)) = (u, v)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

119/1304

e que E(u) = 0 em V caso (u, u) = 0.


Para a mencionada construcao, notemos em primeiro lugar que o conjunto de todos os vetores u
com a propriedade que (u, u) = 0 formam um sub-espaco de V . De fato, se u e v sao dois vetores
desse tipo, teremos que
(u + v, u + v) = ||2 (u, u) + (u, v) + (v, u) + ||2 (v, v) = 0,
pois (u, u) = (v, v) = 0, por hipotese, e pois (v, u) = (u, v) = 0 em funcao da condicao de
ser positivo (pela desigualdade de Cauchy-Schwarz). Vamos denominar esse sub-espaco por Z. O
espaco vetorial quociente V = V /Z (vide a construcao da pagina 94) tem as propriedades desejadas.
A aplicacao E : V V e a aplicacao que associa cada elemento de v de V a` sua classe de equivalencia
[v]: E : V 3 v 7 [v] V . Definimos entao
por

([u], [v]) = (u, v).


um exerccio simples (faca) mostrar que essa definicao de fato independe dos representantes, no caso
E
u e v, tomados nas classes [u] e [v].
e de fato um produto escalar em V .
E. 2.32 Exerccio. Mostre que

Produtos escalares e formas simpl


eticas reais
Seja V um espaco vetorial complexo dotado de um produto escalar h, i. Entao, a expressao
(u, v) := Im(hu, vi)
u, v V , define uma forma simpletica real em V . As condicoes de antisimetria ((u, v) = (v, u))
e de linearidade por combinacoes lineares com escalares reais sao elementares de se constatar. Que
e nao-degenerada, segue do fato que se (u, v) = 0 para todo u valeria, tomando u = iv, 0 =
Im(h iv, vi) = hv, vi, o que implica v = 0.
Na Secao 2.5, pagina 132, veremos que, sob hipoteses adequadas, toda forma simpletica real e a
parte imaginaria de um produto escalar em um espaco complexo.

2.2.4

Exemplos

Para ilustrar os conceitos apresentados acima, passemos a alguns exemplos.


Exemplos de Formas Sesquilineares e Produtos Escalares
Exemplo 2.1 Seja V =

. Um exemplo de produto escalar e dado pelo produto escalar usual:


(u, v) = hu, vi

onde u = (u1 , . . . , un ) e v = (v1 , . . . , vn ).

:=

n
X

uk v k ,

(2.14)

k=1

JCABarata. Curso de Fsica-Matem


atica

Exemplo 2.2 Seja V =

Vers
ao de 29 de setembro de 2005.

Captulo 2

120/1304

. Um exemplo de produto escalar e dado por


(u, v) = hAu, Avi ,


onde u = (u1 , . . . , un ), v = (v1 , . . . , vn ) e onde A e uma matriz n n invertvel.


Exemplo 2.3 Exemplo de uma forma sesquilinear Hermitiana que nao e positiva. Seja V =
dado por
n
X
(u, v) = hu, Avi =
uk Akl vl ,

e seja

k, l=1

onde A e uma matriz n n auto-adjunta, ou seja, seus elementos de matriz satisfazem A kl = Alk .
A assim definida e uma forma sesquilinear Hermitiana,
 mas em
 geral pode nao ser positiva. Um
0
i
caso concreto e o seguinte. Tomemos V = 2 e A =
. Entao, e facil ver que (u, u) =
i 0
hu, Aui = i(u1 u2 u1 u2 ) = 2Im(u1 u2 ), que pode ser negativo ou mesmo nulo. Assim, essa nao e
facil ver, porem, que essa e nao-degenerada (mostre isso!).
positiva. E

Exemplo 2.4 Exemplo de uma forma sesquilinear que nao e Hermitiana. Seja V =
por
n
X
(u, v) = hu, Avi =
uk Akl vl ,

e seja dado

k, l=1

onde A e uma matriz n n que nao e auto-adjunta, ou seja, Akl 6= Alk para pelo menos um elemento
de matriz Akl . A assim definida e uma forma sesquilinear,
 mas em geral pode nao ser Hermitiana.
0 1
Um caso concreto e o seguinte. Tomemos V = 2 e A =
. Entao, e facil ver que
0 0
(u, v) = hu, Avi


= u1 v2 ,

enquanto que (v, u) = v1 u2 . Logo, (u, v) e (v, u) podem ser distintos e nao e Hermitiana. Fora
isso, essa tambem nao e positiva e e degenerada (mostre isso!).

Exemplo 2.5 Exemplo de uma forma sesquilinear positiva mas que nao e um produto escalar. Seja
V = n e seja dado por
(u, v) = hAu, Avi


onde A e uma matriz n n n


ao-invertvel. Entao, existe u0 nao-nulo tal que Au0 = 0. Da, segue que
(u0 , v) = hAu0 , Avi = 0 para todo v e, portanto, e degenerada e (u0 , u0 ) = 0.


1 0
2
eA=
. Note que A nao e invertvel
Um caso concreto e o seguinte. Tomemos V =
0 0
 
0
b
(por que?). Aqui temos que (u, v) = u1 v1 . Note que todo vetor da forma u =
e tal que
u2
Aub = 0 e, portanto (ub , v) = 0 para todo v.

Na Secao 2.4, pagina 128, mostraremos como e a forma geral de formas bilineares, sesquilineares
e produtos escalares nos espacos de dimensao finita n e n . Tratemos agora de dois exemplos em
espacos vetoriais de dimensao infinita.


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

121/1304

Exemplo 2.6 Seja V = C([a, b]) o espaco vetorial das funcoes contnuas complexas de um intervalo
fechado [a, b] da reta real (a < b). Seja p uma funcao contnua estritamente positiva definida em [a, b],
ou seja, p(x) > 0 para todo x [a, b]. Entao, a expressao
(f, g) =

f (x)g(x) p(x)dx ,
a

para funcoes f e g de V define um produto escalar em V (justifique!).

Exemplo 2.7 Seja V = C([0, 1]) o espaco vetorial das funcoes contnuas complexas de um intervalo
fechado [0, 1] da reta real. Seja p uma funcao tal que p e contnua e estritamente positiva no intervalo
[0, 1/2) e identicamente nula no intervalo [1/2, 1]. Entao, a expressao
Z 1
f (x)g(x) p(x)dx ,
(f, g) =
0

para funcoes f e g de V define uma forma sesquilinear positiva em V , que nao e um produto escalar
(justifique!).

Exemplo
2.8 Considere o espaco vetorial n e o produto escalar usual: (u, v) = hu, vi =
Pn
i=1 ui vi . A desigualdade de Cauchy-Schwarz implica

2
!
! n
n
n
X

X
X


(2.15)
|vk |2 .
ui v i
|uj |2





j=1

i=1

k=1

E. 2.33 Exerccio. R Considere o espaco vetorial das funcoes contnuas no intervalo [0, 1] e o produto
1
escalar (f, g) = 0 f (x)g(x) dx. Tomando as funcoes f (x) = x e g(x) = ex , use a desigualdade de

Cauchy-Schwarz para mostrar que e 7.


6
E. 2.34 Exerccio.
esse metodo.

2.3

Tente livremente obter outras desigualdades interessantes do mesmo estilo usando


6

Normas em Espa
cos Vetoriais

Aqui trataremos exclusivamente de espacos vetoriais sobre o corpo dos complexos.


Normas
Uma norma e uma funcao V


usualmente denotada por k k, com as seguintes propriedades.

1. Para todo v V tem-se kvk 0.


2. kvk = 0 se e somente se v for o vetor nulo: v = 0.

JCABarata. Curso de Fsica-Matem


atica

3. Para qualquer

Captulo 2

Vers
ao de 29 de setembro de 2005.

122/1304

e qualquer v V tem-se kvk = ||kvk.

4. Para quaisquer vetores u e v V tem-se ku + vk kuk + kvk.


Por 3 e 4, vale que
ku + vk ||kuk + ||kvk

e quaisquer vetores u e v V .

para quaisquer ,

Nota. As quatro condicoes acima, em verdade, nao sao logicamente independentes e listamo-as devido
a` sua importancia individual. Assim, por exemplo, a condicao de positividade 1 segue das condicoes 4
e 3. Isso sera mostrado logo abaixo (pagina 122) quando falarmos de semi-normas. Note tambem que,
pelo item 3 acima, tem-se k0k = 0 (tome = 0).
Nota. A condicao 4, acima, e de particular importancia e e denominada desigualdade triangular.
Um espaco vetorial pode ter varias normas. Vide exemplos abaixo.
Equival
encia entre Normas
Defini
c
ao. Duas normas k k1 e k k2 em um espaco vetorial V sao ditas equivalentes se existirem duas
constantes positivas c1 e c2 , com 0 < c1 c2 , tais que
c1 kvk1 kvk2 c2 kvk1
para todo vetor v V .
E. 2.35 Exerccio.
6

Mostre que a relacao de equivalencia entre normas e uma relacao de equivalencia.

Tem-se o seguinte teorema, cuja demonstracao pode ser encontrada, por exemplo, em [139]:
Teorema 2.7 Em um espaco vetorial de dimens
ao finita sobre
lentes.

ou


todas as normas s
ao equiva2

A afirmacao desse teorema e freq


uentemente falsa em espacos de dimensao infinita. A importancia
da nocao de equivalencia de normas se manifesta no fato que duas normas equivalentes geram a mesma
topologia metrica.
Semi-Normas
Uma semi-norma e uma funcao V


usualmente denotada por kk, com as seguintes propriedades.

1. Para todo v V tem-se kvk 0.


2. Para qualquer

e qualquer v V tem-se kvk = ||kvk.

3. Para quaisquer vetores u e v V tem-se ku + vk kuk + kvk.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

123/1304

evidente pelas definicoes que


Note-se que, pelo item 2, vale para uma semi-norma que k0k = 0. E
toda norma e uma semi-norma. A diferenca entre norma e semi-norma e que para uma semi-norma a
relacao kvk = 0 nao necessariamente implica v = 0.
Para uma semi-norma (ou norma) vale a desigualdade




kak ka bk kbk ,

(2.16)

para quaisquer a, b V . Como faremos uso da mesma no futuro, vamos apresentar sua demonstracao
aqui, que e uma conseq
uencia direta da desigualdade triangular.
A desigualdade triangular diz-nos que
ka bk kak + kbk

(2.17)

kbk = ka (a b)k kak + ka bk.

(2.18)

e que
De (2.17) segue que
kak ka bk kbk
e de (2.18) que
kak (ka bk kbk).
Quando dois n
umeros reais x e y sao tais que x y e x y entao x |y|. Assim, as duas u
ltimas
desigualdades dizem que




kak ka bk kbk ,
que e o que queramos provar.

Essa desigualdade diz, incidentalmente, que kak 0 para todo vetor de V . Isso mostra que o item
1 da definicao de semi-norma e de norma e superfluo.
Note-se tambem que se fizermos em (2.16) as substituicoes a a b, b b, obtemos




kak kbk ka bk,

(2.19)

para quaisquer a, b V . Essa forma da desigualdade sera empregada algumas vezes nestas notas.
Equival
encia entre Semi-Normas
Ha uma nocao de equivalencia entre semi-normas que e identica a` de equivalencia entre normas.
A Norma Associada a um Produto Escalar
por

Se e um produto escalar em um espaco vetorial V existe associada a uma norma k k dada


kvk = (v, v)1/2 ,

v V.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

124/1304

E. 2.36 Exerccio. Mostre que os postulados da definicao de norma sao de fato satisfeitos.

Invari
ancia de Normas Associadas a Produtos Escalares
Se uma norma em um espaco vetorial V e produzida por um produto escalar, como acima, existe
naturalmente um grupo de transformacoes lineares de V em V que mantem essa norma invariante.
Esse grupo e discutido
682. Por exemplo, a chamada norma Euclidiana de n ,
pna Secao 13.2.3, pagina
n
definida por kxk =
hx, xi para x
, e invariante pelo grupo O(n) das matrizes ortogonais, ou
seja, das matrizes R, reais n n, que satisfazem RT R = . Isso significa que kRxk = kxk para toda
R O(n). O grupo O(n) e seus amigos sao discutidos na Secao 13.2.4, pagina 684 e seguintes.


A Desigualdade Triangular
Talvez a principal importancia da desigualdade de Minkowski (2.13) seja a seguinte. Vamos supor
que seja um produto escalar. Entao podemos definir11 uma metrica ou dist
ancia entre dois vetores
a e b por
d (a, b) := ka bk = (a b, a b)1/2 .
tambem
Como e um produto escalar, segue que d (a, b) = 0 se e somente se a = b (por que?). E
claro que d (a, b) = d (b, a) (por que?). Fora isso, segue da desigualdade de Minkowski que para
quaisquer vetores a, b e c vale
d (a, b) d (a, c) + d (c, b).
Para ver isso, note que
d (a, b) = (a b, a b)1/2
= ((a c) (b c), (a c) (b c))1/2
(a c, a c)1/2 + (b c, b c)1/2
= d (a, c) + d (c, b).
Acima, na passagem da segunda a` terceira linha, usamos a desigualdade de Minkowski com u = a b
e v = b c.

A desigualdade d (a, b) d (a, c) + d (c, b) e importante no estudo de propriedades topologicas


de espacos vetoriais e e denominada desigualdade triangular (pergunta ao estudante: de onde vem esse
nome?).

Note que a desigualdade triangular vale tambem se nao for um produto escalar, mas apenas uma
forma sesquilinear positiva (por que?). Nesse caso e tambem verdade que d (a, b) = d (b, a), porem,
nao e mais verdade que d (a, b) = 0 se e somente se a = b e, por isso, d e dita ser uma pseudo-metrica.
Norma e Produto Escalar
11

As noco
es de metrica e de espacos metricos ser
ao discutidas no Captulo 16.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

125/1304

Se um espaco vetorial V possuir um produto


escalar entao, como observamos, e possvel definir nele
p
uma norma da seguinte forma: kuk =
hu, ui, u V .

A norma assim definida possui duas propriedades importantes que mencionamos aqui: a identidade
do paralelogramo e a identidade de polarizaca
o.
Identidade do paralelogramo: Para todos os vetores u, v V vale
ku + vk2 + ku vk2 = 2kuk2 + 2kvk2 .

(2.20)

Prova. Tem-se simplesmente pelas definicoes que


ku + vk2 = kuk2 + hu, vi + hv, ui + kvk2
e
ku vk2 = kuk2 hu, vi hv, ui + kvk2 .
Somando-se ambas tem-se o resultado.
E. 2.37 Exerccio. Por que essa relacao e chamada identidade do paralelogramo?

Identidade de polariza
c
ao: Para todos os vetores u, v de um espaco vetorial complexo V vale
3

hu, vi =

1 X n
i ku + in vk2 ,
4 n=0

(2.21)

1X n
i ku + in vk2 ,
hu, vi =
4 n=0

(2.22)

ou seja,
4hu, vi = ku + vk2 ku vk2 iku + ivk2 + iku ivk2 .
Prova. Exerccio. Expanda o lado direito e verifique a igualdade.
E. 2.38 Exerccio. Por que essa relacao e chamada identidade de polarizacao?

Notemos que, com a definicao dada acima de norma associada a um produto escalar, a desigualdade
de Cauchy-Schwarz fica
|hu, vi| kukkvk.
A Identidade de Polariza
c
ao
A identidade de polarizacao mencionada acima e um caso especial de uma outra ligeiramente mais
geral, tambem denominada identidade de polarizacao. Seja A um operador linear em um espaco vetorial

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

126/1304

V sobre os complexos e sejam u e v elementos de seu domnio. Entao vale que


3

1 X n
hu, Avi =
i h(u + in v), A(u + in v)i ,
4 n=0

(2.23)

1X n
hu, Avi =
i h(u + in v), A(u + in v)i ,
4 n=0
E. 2.39 Exerccio.
igualdades.

(2.24)

Mostre isso. Sugestao: expanda o lado direito das igualdades acima e constate as
6

Tomando-se A como o operador identidade reobtem-se as identidades (2.21)-(2.22).


A relacao (2.23) mostra que se para um operador linear A conhecermos todas as quantidades
h, Ai para todos os vetores V , entao conhecemos tambem todas as quantidades hu, Avi para
todos u, v V .
Para a fsica quantica a identidade de polarizacao (2.23) diz que se A for um observavel (operador
auto-adjunto), entao o conhecimento de todos os valores esperados de A, ou seja, das quantidades
h, Ai com kk = 1 e dos produtos escalares hu, vi para vetores com kuk = kvk = 1, fixa todas as
probabilidades de transicao |hu, Avi|2 , pois
3

1 X n
i hn , An i (2 + in hu, vi + in hv, ui),
hu, Avi =
4 n=0
onde
n =

(2.25)

1
1
n
p
(u + in v).
(u
+
i
v)
=
n
n
n
ku + i vk
2 + i hu, vi + i hv, ui

Uma conseq
u
encia da identidade de polariza
c
ao
A relacao (2.23) permite-nos facilmente provar a seguinte afirmacao, freq
uentemente empregada:
Proposi
c
ao 2.4 Se um operador linear A agindo em um espaco vetorial complexo V satisfaz hu, Aui =
0 para todo vetor u V ent
ao A = 0.
2
Para matrizes reais em espacos vetoriais reais nao vale uma afirmativa tao forte. Por exemplo,
se V = n P
e A for uma matriz anti-simetrica, ou seja AT = A, entao vale automaticamente que
hx, Axi = na, b=1 xa Aab xb = 0, pois Aab = Aba para todo x n . Porem, A pode ser nao-nula.


Todavia, para matrizes simetricas vale o seguinte:

Proposi
c
ao 2.5 Seja M Mat ( , n) uma matriz simetrica (ou seja, tal que M T = M ) para a qual
valha que hx, M xi = 0 para todo x n . Ent
ao M = 0.
2


JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

Prova. Se M e uma matriz simetrica, e facil verificar que para quaisquer vetores u e v
hu, M vi


127/1304

n


tem-se

1
[h(u + v), M (u + v)i h(u v), M (u v)i ] .
4


(Para provar isso expanda o lado direito e use que hu, M vi = hv, M ui , pois M e simetrica). Logo,
da hipotese sobre M , segue que hu, M vi = 0 para todos u e v n e, portanto, M = 0


Obtendo Produtos Escalares a Partir de Normas


Nas u
ltimas paginas vimos que podemos obter uma norma a partir de um produto escalar. Podemos
nos perguntar: se uma norma for dada em um espaco vetorial, seria possvel obter um produto escalar
a partir dessa norma?
A chave para responder isso e sugerida pelas identidades do paralelogramo e de polarizacao, ambas
validas para normas definidas a partir de produtos escalares: Se uma norma satisfaz a identidade do
paralelogramo, ou seja, se
ku + vk2 + ku vk2 = 2kuk2 + 2kvk2 .
para todos os vetores u, v V , entao um produto escalar pode ser definido por
3

1 X n
hu, vi =
i ku + in vk2 .
4 n=0
A demonstracao que o lado direito define de fato um produto escalar e engenhosa, a principal dificuldade
consiste em demonstrar a linearidade do produto escalar (item 1 da definicao de produto escalar).
Omitiremos a demonstracao aqui, que pode ser encontrada, por exemplo na secao 16.8 e seguintes da
referencia [74]. Vide tambem [138].
Mencionemos por fim que nem toda norma satisfaz a identidade do paralelogramo e, portanto, nem
sempre e possvel definir um produto escalar a partir de uma norma.
E. 2.40 Exerccio. Seja o espaco vetorial V = C([0, 1], ) das funcoes contnuas do intervalo [0, 1]
assumindo valores complexos e seja a norma kf k = supx[0, 1] |f (x)|. Mostre que a identidade do paralelogramo nao e satisfeita para as funcoes f (x) = x e g(x) = 1, x [0, 1], que sao elementos de V .
6
E. 2.41 Exerccio. Seja o espaco vetorial V = n , com n 2. Para a = (a1 , . . . , an ) n a expressao
kakp := [|a1 |p + + |an |p ]1/p , define uma norma em V = n , caso p 1. Mostre que essa norma viola
a identidade do paralelogramo para todo p 6= 2. Para tal considere os vetores u = (1, 0, 0, . . . , 0) e
v = (0, 1, 0, . . . , 0). A norma k kp sera discutida com mais detalhe no Captulo 16.
6

JCABarata. Curso de Fsica-Matem


atica

2.4

Vers
ao de 29 de setembro de 2005.

Captulo 2

128/1304

Formas Bilineares e Sesquilineares em Espa


cos de Dimens
ao Finita

possvel estabelecer a forma geral de uma forma bilinear ou sesquilinear em certos espacos vetoriais,
E
o que discutiremos nesta secao.
como os espacos de dimensao finita n ou n . E


Faremos uso do chamado Teorema da Representacao de Riesz, que afirma o seguinte.


Teorema 2.8 (Teorema da Representa
c
ao de Riesz) Seja l um funcional linear contnuo em um
espaco de Hilbert H (com um produto escalar h, iH ). Ent
ao existe H, u
nico, tal que
l(x) = h, xiH ,

x H.
2

A demonstracao desse importante teorema pode ser encontrada na Secao 25.3.1, pagina 1110. Notemos que esse teorema se aplica aos espacos vetoriais n ou n , pois os mesmos sao espacos de Hilbert
em relacao aos produtos escalares h, i e h, i , respectivamente, definidos em (2.6) e (2.14) (paginas
109 e 119).


Continuidade
Vamos provar a seguinte afirmacao: toda forma bilinear em n e contnua (em ambas as variaveis),
o mesmo valendo para formas bilineares ou sesquilineares em n .


Vamos provar a afirmacao para as formas sesquilineares em n . Os outros casos sao identicos. Seja
uma forma sesquilinear em n . Para vetores x, y n , y 6= 0, escrevemos
(x, y) = kyk (x, y/kyk),

(2.26)

p
onde kyk = hy, yi . Notemos entao que se v e um vetor de norma igual a 1 e {b1 , . . . , bn } e uma
base ortonormal em n entao v = v1 b1 + + vn bn com |vj | 1. Assim,


(x, v) = v1 (x, b1 ) + + vn (x, bn )


e, portanto,
|(x, v)| |(x, b1 )| + + |(x, bn )|
Para cada x fixo o lado direito e uma constante Kx e nao depende de v. Aplicando isso a (2.26),
teremos
|(x, y)| kykKx .
Isso mostra que
lim |(x, y)| = 0

y0

para todo x fixo. Como (x, y) e linear na segunda variavel, segue que
lim (x, y) = (x, y0 )

yy0

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

129/1304

para todo y0 n , provando a continuidade de na segunda variavel. A prova para a primeira variavel
e identica. Os casos em que e bilinear em n ou em n e analogo.


Formas Sesquilineares em

Seja uma forma sesquilinear em


lx :

n
n

. Entao, pelo que acabamos de ver, para cada x


,

lx (y) = (x, y)

e um funcional linear e contnuo. Pelo Teorema da Representacao de Riesz existe um u


nico vetor
n
n
x
tal que lx (y) = hx , yi para todo y , ou seja,


(x, y) = hx , yi .


Seja A a funcao que a cada x


Tem-se,

associa o (
unico!) vetor x com a propriedade acima: A(x) = x .
(x, y) = hA(x), yi .

(2.27)

Afirmamos que A e um operador linear, ou seja, A(1 x1 + 2 x2 ) = 1 A(x1 ) + 2 A(x2 ) para todos
os n
umeros complexos 1 e 2 e todos os vetores x1 e x2 . De fato, por (2.27),
hA(1 x1 + 2 x2 ), yi


= (1 x1 + 2 x2 , y)
= 1 (x1 , y) + 2 (x2 , y)
= 1 hA(x1 ), yi + 2 hA(x2 ), yi


= h1 A(x1 ) + 2 A(x2 ), yi .


Assim, para todo y

tem-se

h [A(1 x1 + 2 x2 ) 1 A(x1 ) 2 A(x2 )] , yi




= 0,

o que implica
A(1 x1 + 2 x2 ) = 1 A(x1 ) + 2 A(x2 ),
que e o que queramos provar. Assim, A e em verdade um operador linear. Resumimos esses fatos no
seguinte teorema:
Teorema 2.9 Para toda forma sesquilinear em

existe uma matriz n n complexa A tal que

(x, y) = hA x, yi
para todos x, y

Esse teorema estabelece assim a forma geral das formas sesquilineares em


Formas Bilineares em

n


JCABarata. Curso de Fsica-Matem


atica

Seja uma forma bilinear em




lx :

Vers
ao de 29 de setembro de 2005.

130/1304

. Entao, para cada x




Captulo 2

lx (y) = (x, y)

e um funcional linear e contnuo. Pelo Teorema da Representacao de Riesz existe um u


nico vetor
n
tal que lx (y) = hx , yi , ou seja,
x


(x, y) = hx , yi .


Seja A a funcao que a cada x n associa o (


unico!) vetor x com a propriedade acima: A(x) = x .
De maneira analoga ao que fizemos acima podemos provar que A e um operador linear, ou seja, uma
matriz n n real e (x, y) = hAx, yi .


Resumimos esses fatos no seguinte teorema:

Teorema 2.10 Para toda forma bilinear em

n


existe uma matriz n n real A tal que

(x, y) = hA x, yi
para todos x, y

n


Esse teorema estabelece assim a forma geral das formas bilineares em


Formas Bilineares em

n


Seja uma forma bilinear em

. Entao
s (x, y) = (x, y)

define uma forma sesquilinear em n , onde x = (x1 , . . . , xn ) para x = (x1 , . . . , xn )


provamos acima, portanto, existe uma matriz complexa A tal que

. Pelo que

s (x, y) = hA x, yi .


para todos x, y

, ou seja,
(x, y) = hA x, yi ,


para todos x, y

Note que isso tambem diz que


(x, y) = hA x, yi ,


onde A e o complexo conjugado da matriz A .


Resumimos esses fatos no seguinte teorema:
Teorema 2.11 Para toda forma bilinear em

existe uma matriz n n complexa A tal que

(x, y) = hA x, yi
para todos x, y

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

Esse teorema estabelece assim a forma geral das formas bilineares em

131/1304

Formas Simpl
eticas
Se e uma forma bilinear alternante em n ou n , ou seja, e bilinear e (x, y) = (y, x),
entao e da forma (x, y) = hA x, yi onde A e uma matriz anti-simetrica, ou seja, AT = A. De
fato, como hx, yi = hy, xi e como (x, y) = (y, x), segue que


hA x, yi

= hA y, xi


Como isso vale para todo x, y

n


(ou

= h y, AT xi


= hAT x, yi .


), tem-se AT = A.

Isso determina a forma geral de uma forma bilinear alternante em

n


ou

Se e uma forma simpletica, ou seja, e uma forma bilinear alternante nao-degenerada, entao A
tem que ser tambem invertvel. De fato, se hAx, yi = 0 para todo y, entao Ax = 0. Se A e invertvel
isso so e possvel se x = 0.


Uma conseq
uencia do fato de A ter de ser invertvel e que n tem que ser par. De fato, a condicao
A = A diz que det(A) = det(AT ) = (1)n det(AT ) = (1)n det(A). Portanto, se n e mpar
teramos det(A) = 0.
T

A conclusao e que formas simpleticas so ocorrem nos espacos de dimensao finita n ou n se a


dimensao n for par, e nesse caso, tem a forma (x, y) = hAx, yi , onde A e invertvel e satisfaz
AT = A.


Formas Sesquilineares Hermitianas em

Se e uma forma sesquilinear Hermitiana em


que hAx, yi = (x, y), entao

, tem-se (x, y) = (y, x). Se A e a matriz tal

hAx, yi


= hAy, xi


= hx, Ayi


= hA x, yi ,


ltima relacao vale para todo x, y


onde A := AT e a adjunta de A. Como a u
seja, A e uma matriz auto-adjunta.
n

Portanto, a forma geral de uma forma sesquilinear Hermitiana em


matriz auto-adjunta.
Produtos Escalares em

, tem-se A = A , ou

e hAx, yi , onde A e uma




Se e um produto escalar em n , e sesquilinear Hermitiana e (x, x) > 0 se x 6= 0. Se A e a


matriz tal que hAx, yi = (x, y), entao


hAx, xi > 0

(2.28)

se x 6= 0. Uma conseq
uencia disso e o seguinte: se vi e um dos autovetores de A com autovalor i ,
entao i > 0. De fato, tomando x = vi em (2.28), teremos12 0 < hAvi , vi i = i hvi , vi i , o que implica


12

Lembre-se que os autovalores de uma matriz auto-adjunta s


ao sempre n
umeros reais.

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

132/1304

i > 0. Esse fato, em particular, nos diz que A e invertvel (pois o determinante de A e o produto de
seus autovalores).
bem sabido que os autovetores vi de uma
Outra conseq
uencia dessas observacoes e a seguinte. E
matriz auto-adjunta A podem ser escolhidos de modo a formar uma
base ortonormal (vide Teorema
3.12, pagina 184). Vamos definir uma matriz B de modo que Bvi = i vi para todos os autovetores
vi de A. Isso define a acao de B nos vetores de uma base e, portanto, B fica definida em toda parte 13 .
facil provar que B assim definida e tambem auto-adjunta, B = B, e que B 2 = A. Claramente
E
B e tambem invertvel e tem autovalores > 0.
E. 2.42 Exerccio. Mostre esses fatos.

Disso conclumos que


(x, y) = hAx, yi
Em resumo, se e um produto escalar em
invertvel e com autovalores > 0 tal que

= hBx, Byi .

entao existe uma (


unica) matriz auto-adjunta B ,

(x, y) = hB x, B yi
para todo x, y

2.5

Estruturas Complexas sobre Espa


cos Vetoriais Reais

Seja V um espaco vetorial real. Em V esta, portanto, definido um produto por escalares reais: x v V ,
onde x e v V . Sob certas circunstancias e possvel transformar V em um espaco vetorial complexo
definindo um produto por escalares complexos: z v V para z e v V . Tambem sob hipoteses,
um produto escalar complexo pode ser definido em V .


Suponha que exista um operador linear J : V V , agindo em V , com a propriedade J 2 = ,


onde denota o operador identidade. Se z e da forma z = x + iy com x, y , defina-se em V o
produto por escalares complexos por


(x + iy) v := xv + yJv .

(2.29)

As seguintes propriedades poder ser facilmente verificadas como exerccio:


1. O produto por escalares complexos (2.29) e associativo:
( u) = () u ,
para todos ,

e u V , onde e o produto de por em

2. 1 u = u para todo u V .
13

Para o estudante mais avancado: aqui poderamos usar tambem o teorema espectral, Teorema 3.4.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

133/1304

3. O produto por escalares complexos (2.29) e distributivo em relacao a` soma de vetores:


(u + v) = u + v ,
para todo

e todos u, v V .

4. O produto por escalares complexos (2.29) e distributivo em relacao a` soma de escalares:


( + ) u = u + u ,
para todos ,

e todo u V .

Portanto, pela definicao da Secao 1.2.3, pagina 55, V e um espaco vetorial complexo com o produto
definido acima. Vamos denotar por VJ esse espaco vetorial complexo, para nao confund-lo com V , que
e um espaco vetorial real. Note que os vetores de V e de VJ sao os mesmos, mas V e VJ representam
estruturas diferentes. VJ e dito ser uma estrutura complexa sobre o espaco vetorial real V .
Uma questao de grande interesse, especialmente no contexto das chamadas algebras CAR e CCR
(vide [16]) que descrevem as algebras de comutacao e anticomutacao canonicas da Mecanica Quantica
e das Teorias Quanticas de Campos (que descrevem modelos fermionicos14 e bosonicos15 ), e saber se
e possivel introduzir um produto escalar complexo no espaco complexo VJ . Como veremos no que
segue, tal e possivel se houver em V uma forma simpletica real ou um produto escalar real satisfazendo
certas hipoteses. Desenvolveremos primeiro as ideias gerais e apresentaremos exemplos posteriormente,
a` pagina 136.
Formas simpl
eticas reais e produtos escalares reais
Para mostrar como construir produtos escalares complexos no espaco complexo V J precisamos do
seguinte resultado preparatorio, que tem interesse por si so, por estabelecer uma relacao entre formas
simpleticas16 reais e produtos escalares reais.
Lema 2.1 Seja V um espaco vetorial real e suponha que exista um operador linear J : V V
satisfazendo J 2 = . Valem as seguintes afirmaco
es
I. Se : V V


e um produto escalar real em V satisfazendo


(Ju, v) = (u, Jv)

para todos u , v V , ent


ao : V V


definida para todos u, v V por

(u, v) := (Ju, v) = (u, Jv)


e uma forma simpletica real e satisfaz
(a) (Ju, v) = (u, Jv) para todos u , v V ,
14

Enrico Fermi (1901-1954).


Satyendra Nath Bose (1894-1974).
16
Para a definica
o, vide p
agina 110.
15

(2.30)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

134/1304

(b) (u, Ju) 0 para todo u V .


II. Se : V V


e uma forma simpletica real em V satisfazendo

(a) (Ju, v) = (u, Jv) para todos u , v V ,


(b) (u, Ju) 0 para todo u V ,

ent
ao : V V


definida para todos u, v V por


(u, v) := (u, Jv) = (Ju, v)

(2.31)

e um produto escalar real e satisfaz


(a) (Ju, v) = (u, Jv) para todos u , v V .
2
Prova da parte I. Pelas hipoteses, e um produto escalar real e, portanto, e uma forma bilinear real,
positiva, simetrica e nao-degenerada. Que definida em (2.30) e uma forma bilinear e evidente. Para
todos u, v V tem-se
(u, v) = (Ju, v) = (u, Jv)

simetria

(Jv, u) = (v, u) ,

provando que e uma forma alternante. Se (u, v) = 0 para todo v V , entao (Ju, v) = 0 para
todo v V . Mas como e nao-degenerada, segue que Ju = 0, o que implica u = 0, pois J 2 = . Isso
provou que e nao degenerada e, portanto, e uma forma simpletica. Note-se agora que
(u, Jv) = (Ju, Jv) = (u, J 2 v) = (u, v) = (Ju, v) .
Por fim, (u, Ju) = (Ju, Ju) 0, pois e um produto escalar. Pelo mesmo motivo, (Ju, Ju) = 0
se e somente se Ju = 0. Como J 2 = , isso implica u = 0. Isso provou as afirmacoes da parte I.
Prova da parte II. Pelas hipoteses, e uma forma simpletica real e, portanto, e uma forma bilinear real,
alternante e nao-degenerada. Que definida em (2.31) e uma forma bilinear e evidente. Para todos
u, v V tem-se
(u, v) = (u, Jv) = (Ju, v)

altern
ancia

(v, Ju) = (u, v) ,

provando que e uma forma simetrica. Se (u, v) = 0 para todo v V , entao (u, Jv) = 0 para todo
v V . Mas como e nao-degenerada, segue que u = 0, provando que e uma forma nao-degenerada.
Para todo u tem-se tambem (u, u) = (u, Ju) 0, por hipotese, provando que e uma forma
positiva. Assim, pela Proposicao 2.3, pagina 117, e um produto escalar. Note-se agora que, por
definicao, (u, v) = (Ju, v) para todos u , v V . Disso segue que (u, v) = (Ju, v) e que
(u, Jv) = (Ju, Jv) = (u, J 2 v) = (u, v) = (Ju, v) .
Isso provou as afirmacoes da parte II.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

135/1304

Produtos escalares complexos sobre estruturas complexas


A proposicao que segue mostra como se pode construir em VJ um produto escalar complexo se for
fornecida uma forma simpletica real ou um produto escalar real em V satisfazendo certas hipoteses.
Proposi
c
ao 2.6 Suponhamos que V seja um espaco vetorial real e que exista J : V V , um operador
linear em V , satisfazendo J 2 = . Ent
ao valem as seguintes afirmaco
es:
A. Se existir uma forma simpletica real : V V


satisfazendo

(a) (Ju, v) = (u, Jv) para todos u , v V ,


(b) (u, Ju) 0 para todo u V 17 ,

ent
ao, V V 3 (u, v) 7 hu, viJ,

definida por

hu, viJ, := (u, Jv) + i(u, v)


para todos u, v V , e um produto escalar complexo sobre a estrutura complexa V J .
B. Se existir um produto escalar real : V V

satisfazendo


(a) (Ju, v) = (u, Jv) para todos u , v V ,


ent
ao, V V 3 (u, v) 7 hu, viJ,

definida por

hu, viJ, := (u, v) + i(Ju, v)


para todos u, v V , e um produto escalar complexo sobre a estrutura complexa V J .
2
Prova. Mostremos em primeiro lugar que as hipoteses das partes A e B sao equivalentes. Pelo Lema 2.1,
pagina 133, a existencia de uma forma simpletica real satisfazendo as hipoteses da parte A implica
a existencia de um produto escalar real dado por (u, v) := (u, Jv) = (Ju, v) satisfazendo as
hipoteses da parte B, sendo que, por essa definicao de ,
(u, Jv) + i(u, v) = (u, v) + i(Ju, v) .

(2.32)

Reciprocamente, tambem pelo Lema 2.1, pagina 133, a existencia de um produto escalar real satisfazendo as hipoteses da parte B implica a existencia de uma forma simpletica real dada por
(u, v) := (Ju, v) = (u, Jv) satisfazendo as hipoteses da parte A, sendo que, por essa definicao
de , a igualdade (2.32) e tambem valida. Assim, e suficiente provarmos, digamos, a parte A.
evidente que para quaisquer u, v, w V valem
Prova da parte A. E
h(u + v), wiJ, = hu, wiJ, + hv, wiJ, ,
17

hu, (v + w)iJ, = hu, viJ, + hu, wiJ, .

Em [16] essa u
ltima condica
o n
ao e mencionada, mas ela e necess
aria.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

136/1304

Alem disso,
hv, uiJ, = (v, Ju) + i(v, u) = (Ju, v) i(u, v) = (u, Jv) i(u, v) = hu, viJ, .
(2.33)
Para x, y tem-se tambem


hu, (x + iy) viJ,

hu, xv + yJviJ,

hu, xviJ, + hu, yJviJ,

(u, xJv) + i(u, xv) + (u, yJ 2 v) + i(u, yJv)

J 2 =

=
=

(u, xJv) + i(u, xv) + (u, yv) + i(u, yJv)






x (u, Jv) + i(u, v) + iy (u, Jv) + i(u, v)

(x + iy)hu, viJ, .

Pela propriedade (2.33), isso implica tambem h(x + iy) u, viJ, = (x iy)hu, viJ, , mostrando que
h, iJ, e uma forma sesquilinear.

Pelas hipoteses, tem-se hu, uiJ, = (u, Ju) 0, mostrando que h, iJ, e positiva. Se 0 =
hu, viJ, = (u, Jv) + i(u, v) para todo u, segue que (u, v) = 0 para todo u, o que implica que
v = 0, pois e nao-degenerada (pela nossa definicao de forma simpletica). Isso mostrou que h, i J,
e nao-degenerada. Assim, h, iJ, e uma forma sesquilinear positiva e nao-degenerada e pelo Teorema
2.6, pagina 114, segue que hu, uiJ, = 0 se e somente se u = 0. Isso mostrou que h, iJ, e um produto
escalar complexo em VJ .
Exemplos
Vamos primeiramente estudar o caso de espacos de dimensao finita. Vale a seguinte proposicao:
Proposi
c
ao 2.7 Um espaco vetorial real V de dimens
ao finita admite uma estrutura complexa (n
ao
necessariamente u
nica) se e somente se tiver dimens
ao par.
2
Prova. Se J e um operador linear agindo no espaco vetorial real de dimensao finita V , podemos
representa-lo como uma matriz. Se J 2 = entao, tomando-se o determinante de ambos os lados,
temos (det(J))2 = (1)n , onde n e a dimensao de V . Como o lado esquerdo e positivo, n tem que
ser par. Reciprocamente, vamos supor que V tenha dimensao par, digamos 2m. Desejamos mostrar
que existe um operador linear agindo em V satisfazendo J 2 = . Uma possvel escolha e a seguinte.
Como V tem dimensao par podemos encontrar dois subespacos V1 e V2 , ambos de dimensao m, com
V = V1 V2 . Como V1 e V2 tem a mesma dimensao, sao isomorfos, e existe um operador linear
A : V1 V2 que e bijetivo (o Exemplo 2.9, abaixo, deixara isso mais claro. Um tal operador nao e
necessariamente u
nico, mas isso nao representa um problema). Todo elemento v V pode ser escrito

da forma v = v1 v2 com v1 V1 e v2 V2 . Podemos definir Jv = J(v1 v2 ) := (Av2 ) (Av1 ). E


2
trivial, entao, verificar que J = , como desejado.

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

137/1304

Exemplo 2.9 Seja V um espaco vetorial real de dimensao 2m. Em alguma base, podemos representar
v V na forma de um vetor-coluna:

vm+1
v1
..
..
.
.

v2m
vm
(2.34)
Defina-se, entao,
Jv :=
v =
,
.
v1
vm+1
.
.
..
..
vm
v2m

ou seja, em forma matricial, na mesma base,

J =
sendo

m
m

m
m

elementar verificar que J 2 =


matrizes m m. E

2m ,

como desejado.

A escolha de J indicada acima dependeu de uma particular decomposicao de V em dois subespacos de dimensao m. Ha varias outras decomposicoes possveis, que fornecem outros operadores J
e, portanto, outras estruturas complexas. Permanecendo no exemplo acima, e facil ver que, se x, y ,
entao o produto por escalares complexos fica

v1
v1
xv1 yvm+1
..
..
..

.
.
.

vm
vm
xvm yv2m
(x + iy)
(2.35)
:= (x + yJ)
=
.
vm+1
vm+1
xvm+1 + yv1
.
.

..
..
..

.
v2m
v2m
xv2m + yvm


Seguindo ainda o exemplo de (2.34) e (2.35) para V = 2m , vamos ilustrar a Proposicao 2.6 e
produto escalar complexo para ( 2m )J . Adotemos para o produto escalar usual:


(u, v) :=

2m
X
k=1

Temos que

uk vk = u1 v1 + + u2m v2m .

(Ju, v) = um+1 v1 u2m vm + u1 vm+1 + + um v2m

e que

(u, Jv) = u1 vm+1 um v2m + um v1 + + u2m vm

Logo (Ju, v) = (u, Jv) e podemos aplicar a Proposicao 2.6, obtendo em (


hu, viJ, = (u, v) + i(Ju, v)
=

2m

)J o produto escalar

u1 v1 + + u2m v2m + i um+1 v1 u2m vm + u1 vm+1 + + um v2m

= u1 (v1 + ivm+1 ) + + um (vm + iv2m ) + um+1 (vm+1 iv1 ) + u2m (v2m ivm )
= (u1 + ium+1 )(v1 + ivm+1 ) + + (um + iu2m )(vm + iv2m ) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

138/1304

E. 2.43 Exerccio. Verifique que hu, viJ, = hu, viJ, para todo .

Entendemos, assim, que a estrutura complexa que estudamos consiste nesse caso em identificar
bijetivamente 2m e m por

v1
v1 + ivm+1
..

v
..
2m
3 m
m
.

vm+1
.

..
vm + iv2m
v2m


e adotar em

o produto escalar complexo h, i usual (definido a` pagina 17).




Vejamos como as ideias de acima podem ser generalizadas e de modo a incluir espacos de dimensao
infinita.

Exemplo 2.10 Se V e um espaco vetorial real de (dimensao finita ou nao) e sempre possvel encontrar
um operador linear J satisfazendo J 2 = se V possuir dois subespacos V1 e V2 com V = V1 V2
e tais que existe A : V1 V2 , linear e bijetora (em dimensao finita isso requer que V1 e V2 tenham a
mesma dimensao e, portanto, que V tenha dimensao par, como mencionado na Proposicao 2.7). De
fato, para v V da forma v = v1 v2 com v1 V1 e v2 V2 , definindo Jv := (A1 v2 ) (Av1 ) e facil
constatar que J 2 = .

Para um tal J o produto por um escalar complexo = x + iy, com x, y , fica definido por

(v1 v2 ) := (x+yJ)(v1 v2 ) = x(v1 v2 )+y (A1 v2 ) (Av1 ) = (xv1 yA1 v2 )(xv2 +yAv1 ) .


Se V e um espaco de Hilbert real separavel com uma base {k , k }, podemos tomar V1 e V2


como os espaco gerados por {k , k , k par} e {k , k , k mpar}, respectivamente. Uma
possvel escolha para a bijecao linear A : V1 V2 seria
!

X
X
A
a2m 2m =
a2m 2m+1 ,


m=0

para a qual

m=0

a2m+1 2m+1

m=0

a2m+1 2m ,

m=0

ou seja, em termos de elementos da base, A2m = 2m+1 e A1 2m+1 = 2m para todo m 0. Com
essa definicao, teramos
"
!
!#
"
!
!#

X
X
X
X
J
a2m 2m
a2m+1 2m+1
a2m+1 2m
=

a2m 2m+1
.
m=0

m=0

m=0

m=0

O produto com escalares complexos = x + iy, com x, y , fica definido por


!
!

X
X
X
(x + iy)
a m m =
(xa2m ya2m+1 )2m
(xa2m+1 + ya2m )2m+1 .


m=0

m=0

m=0

JCABarata. Curso de Fsica-Matem


atica

Captulo 2

Vers
ao de 29 de setembro de 2005.

139/1304

Para um tal J o produto por um escalar complexo = x + iy com x, y fica definido por

(v1 v2 ) := (x+yJ)(v1 v2 ) = x(v1 v2 )+y (A1 v2 ) (Av1 ) = (xv1 yA1 v2 )(xv2 +yAv1 ) .


Para , V da forma =
real usual, constatamos que
(, J) =

m=0

2m 2m+1 +

m m , =

m=0

m m e (, ) :=

m=0

2m+1 2m

e que

m=0

m m , o produto escalar

m=0

(J, ) =

2m+1 2m +

m=0

2m 2m+1 .

m=0

Assim, (, J) = (J, ) e pela parte B da Proposicao 2.6, pagina 135, h, iJ, := (, ) +


i(J, ) e um produto escalar complexo. Explicitamente, tem-se
h, iJ, =

(2m + i2m+1 )(2m + i2m+1 ) .

m=0

E. 2.44 Exerccio. Verifique! Verifique tambem que h, iJ, = h, iJ, para todo .

A forma simpletica real associada a pela parte I do Lema 2.1, pagina 133, e
(, ) = (, J) =

m=0

2m 2m+1

2m+1 2m .

m=0

Exemplo 2.11 Uma situacao que nao se deve deixar de comentar e a seguinte. Se V e um espaco
vetorial complexo com um produto escalar complexo h, i, V e naturalmente tambem um espaco
vetorial real, sendo que, como comentamos a` pagina 119, (u, v) := Im(hu, vi) u, v V , define
uma forma simpletica real em V . Definindo em V o operador linear Ju = iu, tem-se J 2 = . A
multiplicacao por escalares complexos nao apresenta novidades: para x, y
e u V vale, pela
definicao, (x + iy) u = xu + yJu = (x + iy)u.
facil constatar que (u, Jv) = Im(hu, ivi) = Im(hiu, vi) = (Ju, v) e que (u, Ju) =
E
Im(hu, iui) = hu, ui 0. Assim, pela parte A da Proposicao 2.6, pagina 135, hu, viJ, := (u, Jv) +
i(u, v) e um produto escalar complexo em V . No entanto, e facil ver que nesse caso hu, vi J, =
Im(hu, ivi) + iIm(hu, vi) = Re(hu, vi) + iIm(hu, vi) = hu, vi.


O produto escalar real associado a pela parte II do Lema 2.1, pagina 133, e
(u, v) = (u, Jv) = Im(hu, ivi) = Re(hu, vi) .

interessante notar tambem que se tivessemos adotado Ju = iu, u V , teramos ainda para
E
(u, v) = Im(hu, vi) que (u, Jv) = (Ju, v). Porem, (u, Ju) = hu, ui 0, violando a
condicao de positividade.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 2

140/1304

Exemplo 2.12 Uma situacao um pouco diferente e a seguinte. Seja V um espaco vetorial complexo
dotado de um produto escalar complexo h, i. Sejam V1 e V2 dois sub-espacos ortogonais de V
(ortogonais segundo o produto escalar h, i). Encarando V como um espaco real, definamos o operador
claro que J 2 = . A
linear J : V V por J(v1 v2 ) = i(v1 (v2 )), onde v1 V1 e v2 V2 . E
multiplicacao por escalares complexos x + iy, com x, y , fica


(x + iy) (v1 v2 ) = x(v1 v2 ) + yJ(v1 v2 ) = ((x + iy)v1 ) ((x iy)v2 ) ,


ou seja, (v1 v2 ) = (v1 ) (v2 ), para todos , v1 V1 e v2 V2 .
tambem facil constatar que para o produto escalar real (u, v) = Re(hu, vi) vale a relacao
E
(u, Jv) = (Ju, v) (para isso e essencial que V1 e V2 sejam ortogonais segundo h, i).

O forma simpletica real associada a pela parte I do Lema 2.1, pagina 133, e, tomando u = u 1 u2 ,
v = v1 v2 , com u1 , v1 V1 e u2 , v2 V2 ,
(u, v) := (Ju, v) = Im (hu1 , v1 i) Im (hu2 , v2 i) ,
como facilmente se verifica.
Pela parte B da Proposicao 2.6, pagina 135, hu, viJ, := (u, v) + i(Ju, v) e um produto escalar
complexo. Por essa definicao, tem-se, tomando u = u1 u2 , v = v1 v2 , com u1 , v1 V1 e u2 , v2 V2 ,
hu, viJ, = h(u1 u2 ), (v1 v2 )iJ,
= Re(hu1 , v1 i) + Re(hu2 , v2 i) + i (Re(hiu1 , v1 i) + Re(h iu2 , v2 i))
= Re(hu1 , v1 i) + Re(hu2 , v2 i) + iIm(hu1 , v1 i) iIm(hu2 , v2 i)
= hu1 , v1 i + hu2 , v2 i .
E. 2.45 Exerccio. Verifique tambem que hu, viJ, = hu, viJ, para todo .

Parte II

T
opicos de Algebra
Linear

141

Captulo 3

T
opicos de Algebra
Linear I
Conte
udo
3.1

Rudimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143

3.2

No
co
es B
asicas sobre o Espectro de uma Matriz . . . . . . . . . . . . . . . 147
3.2.1

3.3

Polin
omios de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 155
3.3.1

3.4

O Teorema de Hamilton-Cayley . . . . . . . . . . . . . . . . . . . . . . . . . . 157

Matrizes Diagonaliz
aveis e o Teorema Espectral . . . . . . . . . . . . . . . 162
3.4.1

3.5

O Traco de uma Matriz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153

Diagonalizacao Simultanea de Matrizes . . . . . . . . . . . . . . . . . . . . . 176

Matrizes Auto-adjuntas, Normais e Unit


arias . . . . . . . . . . . . . . . . 180
3.5.1

Matrizes Positivas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187

3.6

Matrizes Triangulares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190

3.7

O Teorema de Decomposi
ca
o de Jordan e a Forma Can
onica de Matrizes 191

3.8

3.9

3.7.1

Resultados Preparatorios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192

3.7.2

O Teorema da Decomposicao de Jordan . . . . . . . . . . . . . . . . . . . . . 198

3.7.3

Matrizes Nilpotentes e sua Representacao Canonica . . . . . . . . . . . . . . 201

3.7.4

A Forma Canonica de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . . . 205

Algumas Representa
co
es Especiais de Matrizes . . . . . . . . . . . . . . . 207
3.8.1

A Decomposicao Polar de Matrizes . . . . . . . . . . . . . . . . . . . . . . . . 207

3.8.2

O Teorema da Triangularizacao de Schur . . . . . . . . . . . . . . . . . . . . 210

3.8.3

A Decomposicao QR e a Decomposicao de Iwasawa (KAN) . . . . . . . . . 212

Propriedades Especiais de Determinantes . . . . . . . . . . . . . . . . . . . 215


3.9.1

Expansao do Polinomio Caracterstico . . . . . . . . . . . . . . . . . . . . . . 215

3.9.2

A Desigualdade de Hadamard . . . . . . . . . . . . . . . . . . . . . . . . . . . 216

3.10 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219

principal objetivo deste captulo e apresentar a demonstracao do Teorema Espectral para


matrizes diagonalizaveis, em particular, para matrizes auto-adjuntas (resultado de grande
relevancia para a Mecanica Quantica) e a demonstracao do Teorema de Decomposicao de
Jordan para matrizes gerais. Sempre trabalharemos no contexto de espacos vetoriais de
dimensao finita n sobre o corpo dos complexos. A leitura deste captulo pressupoe serem conhecidos

do leitor alguns conceitos basicos de Algebra


Linear, tais como o conceito de matriz, de determinante
de uma matriz, suas propriedades e metodos de calculo. Este captulo sera continuado no Captulo 4,
pagina 222, onde outros aspectos de algebras de matrizes serao explorados.
142

JCABarata. Curso de Fsica-Matem


atica

3.1

Vers
ao de 29 de setembro de 2005.

Captulo 3

143/1304

Rudimentos

Alguma Nota
c
ao
O conjunto de todas as matrizes mn com entradas complexas sera denotado aqui por Mat ( , m, n).
O conjunto de todas as matrizes quadradas n n com entradas complexas sera denotado simplesmente
por Mat ( , n).
Dado um conjunto de n n
umeros complexos 1 , . . . , n , denotaremos por diag (1 , . . . , n ) a
matriz A Mat ( , n) cujos elementos Aij sao definidos da seguinte forma:

i , se i = j
.
Aij =
0, se i 6= j
Uma tal matriz e dita ser diagonal pois apenas os elementos de sua diagonal principal sao eventualmente
nao-nulos. Na representacao usual

1 0

A = ... . . . ... .
0 n
A mais popular dentre as matrizes diagonais e a matriz identidade, que denotaremos por

1 0

= diag (1, . . . , 1) = ... . . . ... .


0 1

nestas notas:

Denotaremos por a, b a matriz a b cujos elementos de matriz sao todos nulos. Denotaremos por
a
matriz identidade l l. Por vezes, quando nao houver perigo de confusao, poderemos omitir os
l
sub-ndices e escrever a, b simplesmente como e l simplesmente como .

Sejam x1 , . . . , xn vetores, representados na base canonica por vetores-coluna



xa1

xa = ... .
xan
hh
ii
Denotaremos por x1 , . . . , xn a matriz n n construda de forma que sua a-esima coluna seja o
vetor-coluna xa , ou seja

n
1

x
x
1
1
hh
ii

(3.1)
x1 , . . . , xn = ... . . . ... .
1
n
xn x n

Consideranto os vetores da base canonica




1
0
0
1




e 1 = 0 ,
e 2 = 0 ,
..
..
.
.
0
0

...,

en


0
0


= ... ,

0
1

(3.2)

JCABarata. Curso de Fsica-Matem


atica

e tambem evidente que


=

hh

Vers
ao de 29 de setembro de 2005.

Captulo 3

144/1304

ii
e1 , . . . , en .

(3.3)

A notacao acima e u
til por permitir a seguinte observacao. Seja B uma matriz qualquer. Entao,
ii
ii
hh
hh
1
n
1
n
(3.4)
= Bx , . . . , Bx .
B x , ..., x

Essa
hh relacao eii provada observando-se a regra de multiplicacao de matrizes: a a-esima coluna de
B x1 , . . . , xn e
B11 xa1 + + B1n xan
..
.

Bn1 xa1

++

(3.5)

Bnn xan

que vem a ser as componentes de Bxa , representado como vetor-coluna na base canonica.
Ainda sobre essa notacao, vale a seguinte identidade u
til, cuja demonstracao (elementar) deixamos
como exerccio: se D = diag (d1 , . . . , dn ) e uma matriz diagonal, entao
hh
ii
hh
ii
(3.6)
x1 , . . . , x n D = d 1 x1 , . . . , d n xn .
Seja V um espaco vetorial dotado de um produto escalar h, i. Dizemos que dois vetores u e v sao
perpendiculares (em relacao ao produto escalar h, i) se hu, vi = 0.

Se v1 , . . . , vk sao vetores em um espaco vetorial V , denotamos por [v1 , . . . , vk ] o sub-espaco gerado


pelos vetores v1 , . . . , vk , ou seja, a colecao de todos os vetores que sao combinacoes lineares dos vetores
v1 , . . . , vk :
[v1 , . . . , vk ] = {1 v1 + + k vk , 1 , . . . , k }.
Denotamos por [v1 , . . . , vk ] o subespaco de todos os vetores perpendiculares a todos os vetores
de [v1 , . . . , vk ]:
[v1 , . . . , vk ] = { w V | hw, (1 v1 + + k vk )i = 0 para todos 1 , . . . , k }.
Menores de uma matriz, a matriz dos cofatores e a regra de Laplace
Se A Mat ( , n), n > 1, a matriz Men(A), chamada de matriz dos menores de A, e a matriz de
Mat ( , n) construida da seguinte forma: cada elemento de matriz Men(A)ij e determinante da matriz
(n 1) (n 1) obtida eliminando-se a i-esima linha e a j-esima coluna de A. Se n = 1, convenciona-se
definir Men(A) = 1.
Se A Mat ( , n), n 1, a matriz Cof(A), chamada de matriz dos cofatores de A, e a matriz de
Mat ( , n) cujos elementos de matriz Cof(A)ij sao dados por Cof(A)ij = (1)i+j Men(A)ij para cada
i, j. Assim, cada elemento de matriz Cof(A)ij e dado por (1)i+j vezes o determinante da matriz
(n 1) (n 1) obtida eliminando-se a i-esima linha e a j-esima coluna de A.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

145/1304

E. 3.1 Exerccio. Seja Mat ( , n) a matriz diagonal cujos elementos sao, alternadamente +1 e 1:
= diag (+1, 1, +1, . . . , (1)n+1 ), ou seja, os elementos de matriz de sao ij = (1)i+1 ij . Mostre
que
Cof(A) = Men(A)1
para toda matriz A Mat ( , n).

Para uma matriz M Mat ( , n), a transformacao de similaridade M 7 M 1 e denominada


chessboard transformation, pois com ela os sinais sao trocados em M como em um tabuleiro de
xadrez.
A bem-conhecida regra de Laplace1 afirma que, se A possui uma inversa, entao
T
1
A1 =
Cof(A) ,
det(A)

ou seja,

A1

ij

(3.7)

(1)i+j
1
Cof(A)ji =
Men(A)ji .
det(A)
det(A)

(3.8)

Em (3.91), pagina 216, apresentaremos outra formula explcita para o computo da inversa de matrizes baseada no Teorema de Hamilton-Cayley (Teorema 3.2, pagina 158).
Igualmente u
teis sao as expans
oes do determinante em cofatores: para todo i = 1, . . . , n vale
det(A) =

n
X

Aij Cof(A)ij

j=1

e para todo j = 1, . . . , n vale


det(A) =

n
X

n
X
=
(1)i+j Aij Men(A)ij

Aij Cof(A)ij =

i=1

(3.9)

j=1

n
X

(1)i+j Aij Men(A)ij .

(3.10)

i=1

Omitiremos as demonstracoes, pois as mesmas podem ser encontradas em livros elementares sobre
algebra linear.
E. 3.2 Exerccio. Usando a regra de Laplace (3.7), mostre que para toda matriz A Mat ( , n) valem
as relacoes
Men(A1 ) = Men(A)1 ,
Cof(A1 ) = Cof(A)1 ,
Cof(A) = Men(A1 ) ,

Men(A) = Cof(A1 ) .

Se A Mat ( , n) e invertvel, segue da regra de Laplace (3.7) que det(A1 ) =


e, portanto,
det(Cof(A)) = det(A)n1 .

1
det(A)n

6
det(Cof(A))
(3.11)

Do Exerccio E. 3.2, conclui-se tambem que


det(Men(A)) = det(A)n1 .
1

Pierre-Simon Laplace (1749-1827).

(3.12)

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

146/1304

E. 3.3 Exerccio. Mostre que para toda matriz A Mat ( , n) vale



n2
Cof Cof(A) = det(A)
A.

Do Exerccio E. 3.2, obtem-se tambem

Men Men(A)
Assim, para toda matriz A Mat ( , n) vale

det(A)

n2

A.



Cof Cof(A) = Men Men(A) .


Portanto, se det(A) = 1, vale Cof Cof(A) = Men Men(A) = A.

Um resultado u
til
Mais abaixo usaremos o seguinte fato:
Proposi
c
ao 3.1 Seja M Mat ( , n) uma matriz da seguinte forma

A
k, nk
,
M =
B
C

onde A e uma matriz k k, B e uma matriz (n k) k e C e uma matriz (n k) (n k). Ent


ao
det(M ) = det(A) det(C) .
2
Prova. O primeiro ingrediente da prova e a constatacao que

A
A
k, nk
k, nk
k
=

M =
B
C
B
nk
nk, k

A
nk, k

k, nk

nk

k, nk

k, nk

nk

k, nk

nk, k

E. 3.4 Exerccio. Verifique!


Com isso, temos pela regra do determinante de um produto de matrizes que

A
k, nk
k
k, nk
k
det
det
det(M ) = det
B
nk, k
nk
nk
nk, k

6
k, nk

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

147/1304

Agora, pelas regras (3.9)-(3.10) de calculo de determinantes, e facil constatar (faca-o!) que

A
k, nk
k
k, nk
= det(A),
= det(C) .
det
det
C
nk, k
nk
nk, k

Isso completa a prova.

3.2

det

k, nk

nk

= 1.

No
co
es B
asicas sobre o Espectro de uma Matriz

O Espectro de uma Matriz


Seja A Mat ( , n) uma matriz n n com entradas complexas. No estudo das propriedades de
A e de grande importancia saber para quais n
umeros complexos a matriz A e invertvel e para
quais nao e.
Chegamos a`s seguintes importantes definicoes.
Defini
c
ao. Um n
umero complexo e dito ser um elemento do espectro de A Mat ( , n) se a matriz
A nao possuir uma inversa.
Defini
c
ao. Um n
umero complexo e dito ser um elemento do conjunto resolvente de A Mat ( , n)
se a matriz A possuir uma inversa.
Em outras palavras, o espectro de A Mat ( , n), denotado por (A), e o conjunto de todos os
para os quais a matriz A nao tem inversa.

O conjunto resolvente de A Mat ( , n), denotado por (A), e o conjunto de todos os para
os quais a matriz A tem inversa.
evidente que (A) e (A) sao conjuntos complementares, ou seja, (A) (A) = mas (A)
E
(A) = .
Um fato importante e que A e nao-invertvel se e somente se det( A) = 0. Assim, um n
umero
complexo e um elemento do espectro de uma matriz A se e somente se for tal que det( A) = 0.
Chegamos ao importante conceito de polinomio caracterstico de uma matriz.

O Polin
omio Caracterstico de uma Matriz

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Seja A Mat ( , n) uma matriz cujos elementos de matriz

A11 A12
A21 A22

det( A) = det
..
..

.
.
An1

Captulo 3

sao Aij . Para

A1n

A2n

..
..

.
.
Ann

148/1304

a expressao

define, como facilmente se constata pelos metodos usuais e bem conhecidos de calculo de determinantes,
um polinomio de grau n na variavel , com coeficientes complexos, os quais dependem dos elementos de
matriz Aij de A. Esse polinomio e denominado polin
omio caracterstico de A e desempenha um papel
muito importante no estudo de propriedades de matrizes. O leitor podera encontrar na Secao 3.9.1,
pagina 215, uma expressao mais explcita para o polinomio caracterstico em termos dos elementos de
matriz Aij de A (vide (3.90), pagina 216), mas por ora nao precisaremos de maiores detalhes sobre esse
polinomio.
Denotaremos por vezes por pA o polinomio caracterstico de uma matriz A Mat ( , n). Como
todo polinomio complexo de grau n, pA possui n razes, nao necessariamente distintas no plano complexo (teorema fundamental da algebra). As razes do polinomio caracterstico p A sao denominadas
autovalores da matriz A. Assim, o espectro de uma matriz A coincide com o conjunto de seus auto
valores. O estudo de autovalores de matrizes e de grande importancia na Algebra
Linear e em suas
aplicacoes a` Teoria das Equacoes Diferenciais, a` Geometria, a` Teoria dos Sistemas Dinamicos e a` Fsica,
especialmente a` Fsica Quantica.
Seja A Mat ( , n) uma matriz e sejam 1 , . . . , r , 1 r n, seus autovalores distintos, cada
qual com multiplicidade a1 , . . . , ar , respectivamente, ou seja, cada i e uma raiz de ordem ai do
polinomio caracterstico de A:


q() = det( A) =

r
Y
i=1

( i )ai .

A quantidade ai e um n
umero inteiro positivo e e denominado multiplicidade algebrica do autovalor i .
Note-se que como o n
umero de razes de pA (contando as multiplicidades) e exatamente igual a seu
grau, segue facilmente que a seguinte relacao e valida:
r
X

ai = n ,

(3.13)

i=1

ou seja, a soma das multiplicidades algebricas dos autovalores de uma matriz A Mat ( , n) e n.
Uma conseq
uencia elementar disso e a seguinte proposicao u
til:

Proposi
c
ao 3.2 Seja A Mat ( , n) uma matriz e sejam 1 , . . . , r , 1 r n, seus autovalores
distintos, cada qual com multiplicidade algebrica a1 , . . . , ar , respectivamente. Ent
ao
det(A) =

r
Y

(k )ak .

(3.14)

k=1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

149/1304

Qr
ak
Prova. Por definicao, o polinomio caracterstico de A e q()
= det( A) =
k=1 (k ) . Tomando
Q
r
n
ak
= 0 e usando (3.13), teremos que det(A) = (1)
em, det(A) = (1)n det(A) e
k=1 (k ) . Por
a proposicao esta demonstrada.
Essa proposicao diz que o determinante de uma matriz e o produto de seus autovalores, incluindo
a multiplicidade algebrica.
Matrizes Similares. Transforma
co
es de Similaridade
Duas matrizes A Mat ( , n) e B Mat ( , n) sao ditas matrizes similares se existir uma matriz
invertvel P Mat ( , n) tal que P 1 AP = B.

Para uma matriz invertvel P Mat ( , n) fixa, a transformacao que leva cada matriz A
Mat ( , n) a` matriz P 1 AP e denominada transformaca
o de similaridade.
Sabemos que o determinante e invariante por transformacoes de similaridade, pois para toda matriz
A vale det(A) = det(P 1 AP ).
O determinante nao e o u
nico objeto associado a uma matriz que e invariante por transformacoes
de similaridade. O polinomio caracterstico e, portanto, o conjunto de seus autovalores (incluindo as
multiplicidades), tambem o e. Isso pode ser visto da seguinte forma.

Sejam A e B duas matrizes similares com B = P 1 AP para algum P . O polinomio caracterstico


de A e pA () = det( A) e o de B e pB () = det( B). Pela invariancia do determinante vale
pA () = det( A) = det(P 1 ( A)P ) = det( P 1 AP ) = det( B) = pB () . (3.15)
Assim, A e B tem o mesmo polinomio caracterstico e, portanto, seus autovalores sao iguais, incluindo
suas multiplicidades.
Coment
ario sobre Matrizes Bijetoras
Em parte do que segue estaremos implicitamente usando a seguinte proposicao:
Proposi
c
ao 3.3 Uma matriz A Mat ( , n) e bijetora (ou seja, e invertvel) se e somente se Av = 0
valer apenas para v = 0.
2
Prova. Se A e bijetora, entao existe A1 . Logo, aplicando-se A1 a` esquerda na igualdade Av = 0,
obtem-se v = 0. Vamos agora provar a recproca: vamos supor que Av = 0 vale apenas para v = 0 e
provar que A e injetora e sobrejetora e, portanto, bijetora.
Prova-se que A e injetora por absurdo. Se A nao e injetora, entao, existem vetores x e y com x 6= y
mas com Ax = Ay. Como A e linear, isso implica A(x y) = 0. Pela hipotese que Av = 0 vale apenas
para v = 0, segue que x = y, uma contradicao.
Para provarmos que A e sobrejetora procedemos da seguinte forma. Seja {e 1 , . . . , en } uma base
em n . Vamos primeiramente mostrar que {Ae1 , . . . , Aen } e um conjunto linearmente independente
de vetores em n (e, portanto, uma base em n ). Suponhamos que assim nao o seja e que existam
n
umeros complexos 1 , . . . , n , nao todos nulos, tais que 1 Ae1 + + n Aen = 0. Pela linearidade

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

150/1304

de A, segue que A (1 e1 + + n en ) = 0. Novamente, pela hipotese que Av = 0 vale apenas para


v = 0, segue que 1 e1 + + n en = 0. Isso, porem, diz que os vetores {e1 , . . . , en } sao linearmente
dependentes, o que e absurdo.
Logo, {Ae1 , . . . , Aen } e um conjunto de n vetores linearmente independente em n e, portanto, e
uma base nesse espaco. Assim, qualquer x n pode ser escrito como uma combinacao linear tal como
x = 1 Ae1 + + n Aen = A (1 e1 + + n en ). Isso mostra que x esta na imagem de A. Como x e
arbitrario, segue que A e sobrejetora.
Um corolario evidente e o seguinte:
Corol
ario 3.1 Se uma matriz A Mat ( , n) n
ao e bijetora (ou seja, se n
ao possui inversa), ent
ao
existe um vetor n
ao-nulo v tal que Av = 0.
2
Autovetores
Seja 0 um autovalor de uma matriz A. Entao 0 A nao tem inversa. Logo, como V = n e um
espaco vetorial de dimensao finita, existe pelo Corolario 3.1 acima pelo menos um vetor nao-nulo v tal
que (0 A)v = 0, ou seja, Av = 0 v. Chegamos a mais uma importante definicao:
Defini
c
ao. Um vetor nao-nulo v e dito ser um autovetor de uma matriz A se houver 0

tal que

Av = 0 v .
Note-se que se um tal 0 satisfaz a relacao acima para algum v =
6 0 entao 0 A nao tem inversa.
0 e entao um elemento do espectro de A, ou seja, um autovalor. 0 e dito ser o autovalor associado
ao autovetor v.
Uma observacao importante e a seguinte. Sejam v1 e v2 dois autovetores aos quais esta associado o
mesmo autovalor, ou seja, Av1 = 0 v1 e Av2 = 0 v2 . Entao, para quaisquer n
umeros complexos c1 e
c2 o vetor v = c1 v1 + c2 v2 tambem satisfaz Av = 0 v. De fato,
Av = A(c1 v1 + c2 v2 ) = c1 Av1 + c2 Av2 = c1 0 v1 + c2 0 v2 = 0 (c1 v1 + c2 v2 ) = 0 v .
A conclusao a que se chega e que, para cada autovalor i de uma matriz A, a colecao formada pelo
vetor nulo e todos os autovetores de A com autovalor i e um subespaco vetorial. Vamos denotar esse
subespaco por E(i ) ou simplesmente Ei .
Se i e j sao autovalores distintos de A entao os sub-espacos de autovetores E( i ) e E(j ) tem
em comum apenas o vetor nulo, ou seja, E(i ) E(j ) = {0}. Isso e facil de provar, pois se w e tal
que Aw = i w e Aw = j w entao, subtraindo-se uma relacao da outra teramos 0 = (i j )w, que
implica w = 0, ja que i 6= j .
Essas consideracoes nos levam a mais um conceito importante: o de multiplicidade geometrica de
um autovalor.
A Multiplicidade Geom
etrica de um Autovalor

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

151/1304

Alem do conceito de multiplicidade algebrica de um autovalor, ha tambem o conceito de multiplicidade geometrica de um autovalor, do qual trataremos agora.
Como antes seja A Mat ( , n) uma matriz e sejam 1 , . . . , r , 1 r n, seus autovalores
distintos, cada qual com multiplicidade algebrica a1 , . . . , ar , respectivamente.
Acima introduzimos os sub-espacos Ei = E(i ), definidos como sendo os sub-espacos gerados por
todos os autovetores que tem i como autovalor. A multiplicidade geometrica de um autovalor i e
definida como sendo a dimensao do subespaco Ei , ou seja, como sendo o n
umero maximo de autovetores
linearmente independentes com autovalor i .
importante advertir de imediato o leitor do fato que a multiplicidade algebrica e multiplicidade
E
geometrica de autovalores nem sempre coincidem. Isso e bem ilustrado no seguinte exemplo simples.
Seja


0 1
A =
.
0 0
Seu polinomio caracterstico e

1
pa () = det( A) = det
0

= 2 .

Assim, seu (
unico) autovalor e 0 com multiplicidade algebrica 2. Quais os seus autovetores? Sao aqueles
vetores que satisfazem Av = 0. Denotando v como um vetor coluna
 
a
,
v =
b
a relacao Av = 0 significa

0 1
0 0

 
 
a
b
=
= 0.
b
0

Logo b = 0 e todos os autovetores sao da forma

 
a
v =
,
0
evidente que o subespaco gerado pelos autovetores com autovalor zero tem dimensao 1.
a . E
Assim, a multiplicidade algebrica do autovalor zero e 2 mas a sua multiplicidade geometrica e 1.
A Multiplicidade Alg
ebrica e a Multiplicidade Geom
etrica
Apesar de a multiplicidade algebrica e a multiplicidade geometrica de um autovalor nem sempre
coincidirem, ha uma relacao de ordem entre eles. A saber, e possvel mostrar que a multiplicidade
geometrica de um autovalor e sempre menor ou igual a` sua multiplicidade algebrica.
Isso segue das seguintes consideracoes. Seja 0 um autovalor de A Mat ( , n) e E(0 ) o subespaco
gerado pelos autovetores com autovalor 0 , e cuja dimensao denotaremos por d. Vamos escolher uma
base v1 , . . . , vd , vd+1 , . . . , vn onde os primeiros d vetores sao elementos de E(0 ). Nessa base a matriz
A tem a forma


D
d, nd
,
A3
A4

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

152/1304

onde D e uma matriz d d diagonal D = diag 0 , . . . , 0 , A4 e uma matriz (n d) (n d) e


| {z }
d vezes
A3 e uma matriz (n d) d. Alguns segundos (minutos?) de meditacao, usando pela Proposicao 3.1
da pagina 146, nos levam a concluir que o polinomio caracterstico de A e dado por
det( A) = ( 0 )d det( A4 ) .
Isso mostra que a multiplicidade algebrica de 0 e pelo menos igual a d, sua multiplicidade geometrica.
E. 3.5 Exerccio. Realize a meditacao sugerida acima.

Matrizes Simples
O que foi exposto acima leva-nos naturalmente ao conceito de matriz simples que, como veremos
mais adiante, esta intimamente ligado ao problema da diagonalizabilidade de matrizes.
Defini
c
ao. Uma matriz A Mat ( , n) e dita ser uma matriz simples se cada autovalor de A tiver
uma multiplicidade algebrica igual a` sua multiplicidade geometrica.
Deixamos para o leitor provar o seguinte fato: toda matriz diagonal e simples.
E. 3.6 Exerccio. Prove isso.

Adiante faremos uso da seguinte proposicao.


Proposi
c
ao 3.4 Se A Mat ( , n) e uma matriz simples e P Mat ( , n) e invertvel ent
ao P 1 AP
e tambem simples.
2
Prova. Ja vimos (pagina 149) que A e P 1 AP tem o mesmo polinomio caracterstico e, portanto,
os mesmos autovalores, incluindo suas multiplicidades algebricas. Seja 0 um desses autovalores com
multiplicidade algebrica d e sejam v1 , . . . , vd um conjunto de d autovetores linearmente independentes de A. Os vetores P 1 v1 , . . . , P 1 vd sao autovetores de P 1 AP com autovalor 0 . De fato,
(P 1 AP ) P 1 vi = P 1 Avi = 0 P 1 vi . Fora isso os d vetores P 1 v1 , . . . , P 1 vd sao tambem linearmente independentes. Para ver isso, suponha houvesse constantes c1 , . . . , cd tais que
c1 P 1 v1 + + cd P 1 vd = 0 .
Multiplicando-se a` esquerda por P teramos c1 v1 + + cd vd = 0. Como v1 , . . . , vd sao linearmente
independentes as constantes ci tem que ser todas nulas, provando que os vetores P 1 v1 , . . . , P 1 vd
sao tambem linearmente independentes.
Isso prova que a multiplicidade geometrica do autovalor 0 e pelo menos igual a d. Como ela nao
pode ser maior que d (pagina 151), conclui-se que e igual a d provando a proposicao.
A seguinte proposicao elementar e por vezes u
til para verificar se uma matriz e simples.
Proposi
c
ao 3.5 Se todos os n autovalores de uma matriz A Mat ( , n) forem distintos ent
ao A e
simples.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

153/1304

Prova. Se os autovalores de A sao 1 , . . . , n , todos distintos, entao cada um tem multiplicidade


algebrica igual a 1. Forcosamente, sua multiplicidade geometrica e tambem igual a 1, ja que a multiplicidade geometrica nao pode ser maior que a algebrica.
Ressaltemos que a recproca da proposicao acima nao e verdadeira: uma matriz pode ser simples e
possuir autovalores com multiplicidade algebrica maior que 1.

3.2.1

O Tra
co de uma Matriz

O Tra
co de uma Matriz
Seja A Mat ( , n), cujos elementos de matriz sao Aij , i, j = 1, . . . n. Sejam 1 , . . . , n seus n
autovalores (nao necessariamente distintos e repetidos conforme sua multiplicidade).
Definimos o traco de A como sendo a soma de seus n autovalores:
Tr(A) :=

n
X

a .

a=1

Uma conclusao que se tira dessa definicao e que se duas matrizes sao similares, entao ambas tem o
mesmo traco, ou seja, para qualquer matriz invertvel P e qualquer matriz A vale

Tr P 1 AP = Tr(A) .
(3.16)

A razao reside na observacao feita acima que duas matrizes similares tem o mesmo conjunto de autovalores e, portanto, o mesmo traco.
Temos a seguinte e importante proposicao:

Proposi
c
ao 3.6 O traco de uma matriz A Mat ( , n) e igual a soma dos elementos de sua diagonal
principal, ou seja,
n
n
X
X
Tr(A) :=
a =
Aaa .
(3.17)
a=1

a=1

Prova. A demonstracao consistira em se calcular o coeficiente de n1 no polinomio caracterstico p()


de A de dois modos diferentes. O polinomio caracterstico de A e

A11 A12
A1n
A21 A22
A2n

p() = det( A) = det


.
.
..
..
.
..
..

.
.
An1

Ann

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

154/1304

P
As tecnicas de calculo de determinantes nos dizem que o coeficiente de n1 e ni=1 Aii . Por exemplo,
para o caso n = 2


A11 A12
p() = det
= 2 (A11 + A22 ) + A11 A22 A12 A21 .
A21 A22
E. 3.7 Exerccio. Convenca-se da veracidade da afirmativa acima para o caso de n arbitrario. Sugestao:
use a expansao em cofatores (3.9)-(3.10) ou leia a Secao 3.9.1, pagina 215.
6
Por outro lado, os autovalores de A, 1 , . . . , n , sao por definicao as razes do polinomio caracterstico. Logo,
p() = ( 1 )( 2 ) ( n ) .

Expandindo-se essa expressao, conclui-se que o coeficiente de n1 e


(1 + + n ) = Tr(A) .
E. 3.8 Exerccio. Certo?

Do exposto acima, conclui-se que o coeficiente de n1 no polinomio caracterstico de A e

n
X
i=1

Aii = (1 + + n ) = Tr(A) ,

o que termina a prova.


Essa proposicao leva a duas outras propriedades igualmente importantes: a linearidade do traco e
a chamada propriedade cclica do traco.
ao
Proposi
c
ao 3.7 (A Linearidade do Tra
co) Sejam A, B Mat ( , n) e , . Ent
Tr(A + B) = Tr(A) + Tr(B) .
2
Prova. A prova e imediata por (3.17).
curioso notar que a linearidade do traco vista acima e evidente por (3.17), mas nao e nem
E
um pouco evidente pela definicao do traco de uma matriz como soma de seus autovalores, pois os
autovalores individuais de A + B n
ao sao em geral combinacoes lineares dos autovalores de A e de
B, especialmente no caso em que A e B nao comutam.
Proposi
c
ao 3.8 (A Propriedade Cclica do Tra
co) Sejam A, B Mat ( , n). Ent
ao
Tr(AB) = Tr(BA) .
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

155/1304

Prova. Pelo que vimos acima, tem-se


Tr(AB) =

n
X

(AB)ii =

i=1

n
n
X
X
i=1

Aij Bji

j=1

n
n
X
X
j=1

Bji Aij

i=1

n
X

(BA)jj = Tr(BA) .

j=1

Na segunda e quarta igualdades usamos a regra de produto de matrizes. Na terceira igualdade apenas
trocamos a ordem das somas.
Novamente vale aqui o comentario que a propriedade cclica expressa na Proposicao 3.8 nao e
nada evidente pela definicao do traco de uma matriz como soma de seus autovalores. Os autovalores
individuais de produto de matrizes AB n
ao sao em geral iguais aos do produto BA.
Mais adiante, demonstraremos uma outra propriedade importante do traco que o relaciona com
o determinante,
a saber, provaremos que para qualquer matriz A, real ou complexa, n n, tem-se

A
Tr(A)
det e = e
. Vide Proposicao 4.7, pagina 234.

3.3

Polin
omios de Matrizes

Polin
omios de Matrizes
Seja p um polinomio de grau m:
p(x) = am xm + + a1 x + a0
com x
por

, aj

e am 6= 0. Para uma matriz A Mat ( , n) definimos o polin


omio matricial p(A)
p(A) = am Am + + a1 A + a0 .

Obviamente p(A) e tambem uma matriz n n com entradas complexas.

Se as razes do polinomio p forem 1 , . . . , r , com multiplicidades m1 , . . . , mr , respectivamente,


entao
r
Y
p(x) = am (x j )mj ,
j=1

facil provar, entao, que


para todo x . E

p(A) = am

r
Y
j=1

(A j )mj .

E. 3.9 Exerccio. Justifique isso.

E. 3.10 Exerccio. Mostre que se D = diag (d1 , . . . , dn ) e q e um polinomio entao


q(D) = diag (q(d1 ), . . . , q(dn )) .
6

JCABarata. Curso de Fsica-Matem


atica

E. 3.11 Exerccio.
mostre que

Captulo 3

Vers
ao de 29 de setembro de 2005.

156/1304

Suponha que A = P 1 DP , onde D = diag (d1 , . . . , dn ). Se q e um polinomio


q(A) = P 1 q(D)P = P 1 diag (q(d1 ), . . . , q(dn )) P .
6

O Polin
omio Mnimo
Vamos mostrar que para cada matriz A Mat ( , n) sempre existe pelo menos um polinomio p
com a propriedade que p(A) = .
Para tal notemos primeiramente que Mat ( , n) e um espaco vetorial complexo de dimensao n 2 .
De fato toda a matriz A Mat ( , n), cujos elementos de matriz sao Aij pode ser trivialmente
escrita na forma
n X
n
X
A =
Aab E ab
a=1 b=1

onde E ab Mat ( , n) sao matrizes cujos elementos de matriz sao (E ab )ij = i,a j,b , ou seja, todos os
elementos de matriz de E ab sao nulos, exceto o elemento a, b, que vale 1.
E. 3.12 Exerccio. Certo?

Assim, vemos que as matrizes {E ab , a = 1, . . . , n, b = 1, . . . , n} formam uma base em Mat ( , n),


mostrando que Mat ( , n) e um espaco vetorial de dimensao n2 . Isto posto, temos que concluir que
qualquer conjunto de mais de n2 matrizes nao-nulas em Mat ( , n) e linearmente dependente.
Se uma das matrizes Ak , k = 1, . . . , n2 , for nula, digamos Aq = , entao p(x) = xq , tem
a propriedade que p(A) = 0, que e o que desejamos provar. Se, por outro lado, as matrizes A k ,
2
k = 1, . . . , n2 , sao todas nao-nulas, entao conjunto { , A, A2 , . . . , An } e linearmente dependente,
pois possui n2 + 1 elementos. Portanto, existem constantes c0 , . . . , cn2 , nem todas nulas, tais que
2

c 0 + c 1 A + c 2 A 2 + + c n2 A n =

Como o lado esquerdo e um polinomio em A, fica provada nossa afirmacao que toda matriz possui um
polinomio que a anula. Chegamos a`s seguintes definicoes:
Defini
c
ao. Polin
omio M
onico. Um polinomio p : de grau n e dito ser um polin
omio m
onico
se for da forma
p(x) = xn + an1 xn1 + + a1 x + a0 ,


ou seja, se o coeficiente do monomio de maior grau (no caso, xn ) for igual a 1. Note-se que polinomios
monicos nunca sao identicamente nulos.

Defini
c
ao. Polin
omio Mnimo de uma Matriz. Dada uma matriz A Mat ( , n), o polin
omio
mnimo de A e o polinomio monico de menor grau que e anulado em A, ou seja, e o polinomio nao-nulo
de menor grau da forma
M (x) = xm + am1 xm1 + + a1 x + a0
para o qual M (A) = .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

157/1304

As consideracoes acima mostram que um tal polinomio sempre existe e que tem grau no maximo
igual a n2 . Essa e, no entanto, uma estimativa exagerada para o grau do polinomio mnimo de uma
matriz A Mat ( , n) pois, como veremos abaixo, o polinomio mnimo de uma matriz A Mat ( , n)
tem, na verdade, grau menor ou igual a n. Isso e um corolario de um teorema conhecido como Teorema
de Hamilton-Cayley , que demonstraremos abaixo (Teorema 3.2, pagina 158).
Finalizamos com um teorema basico que garante a unicidade do polinomio mnimo e estabelece sua
relacao com outros polinomios que anulam A.
nico. Fora isso se P e um
Teorema 3.1 O polin
omio mnimo M de uma matriz A Mat ( , n) e u
polin
omio n
ao-identicamente nulo que tambem se anula em A, ou seja, P (A) = , ent
ao P e divisvel
por M , ou seja, existe um polin
omio F tal que P (x) = F (x)M (x) para todo x .
2
Demonstracao. Dada uma matriz A Mat ( , n), o polinomio mnimo de A e o polinomio de menor
grau da forma
M (x) = xm + am1 xm1 + + a1 x + a0
para o qual M (A) = . Vamos supor que haja outro polinomio N da forma
N (x) = xm + bm1 xm1 + + b1 x + b0
para o qual N (A) = . Subtraindo um do outro teramos o polinomio
(M N )(x) = (am1 bm1 )xm1 + + (a1 b1 )x + (a0 b0 ) ,
que tem grau menor ou igual a m 1 e para o qual vale (M N )(A) = M (A) N (A) = = .
Como, por hipotese, nao ha polinomios nao-nulos com grau menor que o de M que anulam A, isso e
uma contradicao, a menos que M = N . Isso prova a unicidade.
Seja P um polinomio nao identicamente nulo para o qual valha P (A) = . Se p e o grau de P ,
deve-se ter p m, onde m e o grau do polinomio mnimo de A. Logo, pelos bem conhecidos fatos sobre
divisao de polinomios, podemos encontrar dois polinomios F e R, cujos graus sao, respectivamente
p m e r com 0 r < m, tais que
P (x) = F (x)M (x) + R(x) ,
para todo x . Ora, isso diz que
P (A) = F (A)M (A) + R(A) .
Como P (A) = e M (A) = , isso implica R(A) = . Como, porem, o grau de R e menor que m,
tem-se que R deve ser identicamente nulo. Isso completa a prova.

3.3.1

O Teorema de Hamilton-Cayley

Vamos aqui demonstrar um teorema sobre matrizes que sera usado mais adiante de varias formas, em
particular no Teorema Espectral, o chamado Teorema de Hamilton2 -Cayley3 . Esse teorema fornece
2
3

Sir William Rowan Hamilton (1805-1865).


Arthur Cayley (1821-1895).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

158/1304

tambem, como veremos, um metodo eficiente para o calculo da inversa de matrizes. Cayley e Hamilton
demonstraram casos particulares do teorema para matrizes 2 2, 3 3 (Cayley) e 4 4 (Hamilton).
A primeira demonstracao geral e devida a Frobenius4 . Cayley, Hamilton e Sylvester5 estao entre os
fundadores modernos da teoria das matrizes6 .
Teorema 3.2 (Teorema de Hamilton-Cayley) Seja A Mat ( , n) e seja q(x) = det(x A) o
polin
omio caracterstico de A (e que tem grau n). Ent
ao q(A) = .
2
Prova. Desejamos mostrar que para todo vetor y n vale q(A)y = 0. Se y = 0 isso e trivial. Se
y 6= 0 mas com Ay = 0 entao
q(A)y = (1)n 1 n y ,

onde 1 , , n sao os autovalores de A. Mas a propria relacao Ay = 0 indica que um dos autovalores
e igual a zero. Logo q(A)y = 0. Mais genericamente, se y 6= 0 e {y, Ay} nao for um conjunto de vetores
linearmente independentes, entao Ay e y sao proporcionais, ou seja, existe um autovalor, digamos, n
tal que Ay = n y. Nesse caso tambem tem-se
!
n1
Y
(A i ) (A n )y = 0 ,
q(A)y =
i=1

pois (A n )y = Ay n y = 0.

Seja entao y daqui por diante um vetor fixado, nao-nulo e tal que {y, Ay} e um conjunto de dois
vetores nao-nulos e linearmente independentes.
Como o espaco

tem dimensao n, nem todos os conjuntos de vetores da forma


{y, Ay, A2 y, . . . , Aj y}

sao formados por vetores nao-nulos linearmente independentes. Por exemplo, se j n, o conjunto
{y, Ay, A2 y, . . . , Aj y} nao pode ser formado por vetores nao-nulos linearmente independentes pois
seu n
umero excede a dimensao do espaco.
Seja k o maior n
umero tal que {y, Ay, A2 y, . . . Ak1 y} e um conjunto de vetores nao-nulos e
claro que 1 < k n.
linearmente independentes. E
claro tambem, pela definicao de k, que
E
Ak y = hk y + hk1 Ay + + h1 Ak1 y ,

(3.18)

para constantes h1 , . . . , hk .
Vamos denominar z1 = Ak1 y, z2 = Ak2 y, . . . , zk = y, ou seja, zj = Akj y, j = 1, . . . , k, todos
nao-nulos por hipotese. Caso k < n, escolhamos ainda vetores zk+1 , . . . , zn de modo que o conjunto
{z1 , . . . , zn } forme uma base em n .

Coloquemo-nos agora a seguinte questao: qual e a forma da matriz A nessa base? No sub-espaco
gerado pelos vetores {z1 , . . . , zk } tem-se o seguinte: para i = 2, . . . , k vale Azi = zi1 . Alem disso, por
4

Ferdinand Georg Frobenius (1849-1917)


James Joseph Sylvester (1814-1897).
6
Muitos certamente se surpreender
ao em saber que Cayley e Sylvester eram originalmente advogados.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

159/1304

(3.18), Az1 = h1 z1 + h2 z2 + + hk zk . Isso mostra que o subespaco gerado pelos vetores {z1 , . . . , zk }
e invariante pela acao de A e o operador linear A, no mesmo subespaco, tem a forma

h1 1 0 . . . 0 0

..
. 0 0
h2 0 1
.
.. . . . . . . ..
..
.
.
. .
.

.
(3.19)

.
.
hk2 0 0

.
1
0

hk1 0 0 . . . 0 1
hk 0 0 . . . 0 0
E. 3.13 Exerccio. Justifique isso.

Se designarmos por P o operador que realiza essa mudanca de base, o operador linear A na base
{z1 , . . . , zn } tem, portanto, a forma A0 = P 1 AP , onde


A1 k, nk
0
A =
,
A2
A3
onde A1 e a matriz kk definida em (3.19), A2 e uma matriz (nk)k e A3 e uma matriz (nk)(nk).
Nao nos sera necessario especificar os elementos das matrizes A2 e A3 .
Outros segundos (minutos?) de meditacao, usando a Proposicao 3.1 da pagina 146, nos levam a
concluir que o polinomio caracterstico q pode ser escrito como
q(x) = det(x A0 ) = det(x A1 ) det(x A3 ) .
(O estudante deve recordar-se que as matrizes A e A0 , por serem similares, tem o mesmo polinomio
caracterstico).
Vamos denominar qk (x) = det(x A1 ) e rk (x) = det(x A3 ). Claramente, q(x) = qk (x)rk (x).
Nao sera necessario, no que segue, calcular rk , mas precisaremos calcular qk . Como esse pequeno
resultado tem interesse independente, vamos formula-lo como um lema, para futura referencia.
Lema 3.1 Para h1 , . . . , hk , tem-se

x h1 1 0 . . . 0
0

.
h2
x 1 . . 0
0
.
..
.. .. ..
..
.
.
.
.
= xk (h1 xk1 + + hk1 x + hk ) .

qk (x) := det

.
. . 1 0
hk2 0
0

hk1 0
0 . . . x 1
hk
0
0 ... 0
x

Prova. A prova e feita por inducao. Para k = 2 vale




x h1 1
= x2 h1 x h2 .
q2 (x) = det
h2
x

(3.20)

JCABarata. Curso de Fsica-Matem


atica

Para k > 2, tem-se, pelas

x h1

h2

qk (x) = x det ...

hk2
hk1

Captulo 3

Vers
ao de 29 de setembro de 2005.

bem conhecidas regras de calculo de determinantes,

1
0
0
x h1 1
..

. 0
x
0
x
h2

.
.. ..
+ 1 det ..

.
.

hk2 0
0
x 1
0

...

(k1)(k1)

k1+1
= xqk1 (x) + (1)
(hk ) det

0
0

hk

... 0
0

.
1 . . 0
0
.
.. .. ..
.
.
. ..

..
. 1 0
0
0 . . . x 1 (k2)(k2)

0
..

160/1304

0
0

.. ..

.
.

x 1
... 0
0 (k1)(k1)
.

= xqk1 (x) + (1)k+1 hk (1)k2


= xqk1 (x) hk .

(3.21)

E. 3.14 Exerccio. Complete os detalhes.

Assim, se pela hipotese indutiva qk1 e da forma


qk1 (x) = xk1 (h1 xk2 + + hk2 x + hk1 ) ,
segue de (3.21) que
qk (x) = x(xk1 (h1 xk2 + + hk2 x + hk1 )) hk
= xk (h1 xk1 + + hk2 x2 + hk1 x + hk ) ,

(3.22)

como queramos provar.


Retomando, temos que q(A)y = qk (A)rk (A)y = rk (A)qk (A)y. Sucede, porem, que qk (A)y = 0. De
fato, pelo computo acima,
qk (A)y = Ak y h1 Ak1 y hk2 A2 y hk1 Ay hk y ,
que e igual a zero por (3.18). Logo q(A)y = 0. Como y foi escolhido arbitrario, segue que q(A) = ,
demonstrando o Teorema de Hamilton-Cayley, Teorema 3.2.

O Teorema de Hamilton-Cayley e a Inversa de Matrizes

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

161/1304

O Teorema de Hamilton-Cayley fornece-nos um metodo de calcular a inversa de matrizes naosingulares. De fato, se q(x) = xn + an1 xn1 + + a1 x + a0 e o polinomio caracterstico de uma matriz
nao-singular A, entao o Teorema de Hamilton-Cayley afirma que
An + an1 An1 + + a1 A + a0
ou seja,
Isso tem por implicacao

A An1 + an1 An2 + + a2 A + a1


A1 =

=


= a0 .


1
An1 + an1 An2 + + a2 A + a1 .
a0

(3.23)

Vide (3.91), pagina 216, para uma expressao mais explcita.

Nota. Usando a definicao de polinomio caracterstico q(x) = det(x A), e evidente (tomando-se
x = 0) que a0 = (1)n det(A). Assim, a0 6= 0 se e somente se A for nao-singular.

Em muitos casos a formula (3.23) e bastante eficiente para calcular A1 , pois a mesma envolve
poucas operacoes algebricas em comparacao com outros metodos, o que e uma vantagem para valores
grandes de n. Compare, por exemplo, com a regra de Laplace, expressao (3.8), pagina 145, para o
calculo de A1 , que envolve o computo de n2 + 1 determinantes de sub-matrizes de ordem n 1 de A.

E. 3.15 Exerccio.
6

Use esse metodo para calcular a inversa das suas matrizes nao-singulares favoritas.

De volta ao polin
omio mnimo
O Teorema 3.1, pagina 157, e o Teorema de Hamilton-Cayley, juntos, permitem-nos precisar algo a
respeito da forma geral do polinomio mnimo de uma matriz.
Se A Mat ( , n) tem r autovalores distintos 1 , . . . , r , cada qual com multiplicidade algebrica
a1 , . . . , ar , respectivamente, entao seu polinomio caracterstico q e da forma
q(x) =

r
Y

k=1

(x k )ak .

Pelo Teorema de Hamilton-Cayley, q(A) = 0 e, portanto, pelo Teorema 3.1, M , o polinomio mnimo
de A, divide q. Logo, M deve ser da forma
M (x) =

s
Y
l=1

(x kl )bl ,

(3.24)

onde s r, {k1 , . . . , ks } {1 , . . . , r } e onde 0 < bl akl para todo 1 l s. Seja agora,


porem, vm 6= 0 um autovetor de A com autovalor m Segue do fato que M (A) = 0 que
0 = M (A)vm =

s
Y
l=1

bl

(A kl ) vm =

s
Y
l=1

(m kl )bl vm .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

162/1304

Q
Logo, sl=1 (m kl )bl = 0 e isso implica que m {k1 , . . . , ks }. Como isso vale para todo
1 m r, segue que {1 , . . . , r } {k1 , . . . , ks } e, portanto, {1 , . . . , r } = {k1 , . . . , ks }.
Nossa conclusao e resumida no seguinte:
Proposi
c
ao 3.9 Seja A Mat ( , n) com r autovalores distintos 1 , . . . , r , cada qual com
multiplicidade algebrica a1 , , . . . , ar , sendo 1 r n. Ent
ao M , o polin
omio mnimo de A, e da
forma
r
Y
M (x) =
(x k )bk ,
(3.25)
k=1

x , onde 0 < bl al para todo 1 l r. Em particular, se A Mat ( , n) tiver exatamente n


autovalores distintos, teremos que bl = al = 1 para todo 1 l n, e
M (x) = q(x) =

n
Y

k=1

(x k ) ,

x .

3.4

Matrizes Diagonaliz
aveis e o Teorema Espectral

Matrizes Diagonaliz
aveis
Vamos agora apresentar uma nocao intimamente ligada a` de matriz simples introduzida acima
(pagina 152), mas de importancia maior.
Defini
c
ao. Uma matriz A Mat ( , n) e dita ser uma matriz diagonaliz
avel se existir uma matriz
1
invertvel P Mat ( , n) tal que P AP e uma matriz diagonal, ou seja,

d1 0

P 1 AP = D = diag (d1 , . . . , dn ) = ... . . . ... .


0 dn
facil de se ver que os elementos da diagonal de D sao os autovalores de A. De fato, se A e
E
diagonalizavel por P , vale para seu polinomio caracterstico
p() = det( A) = det(P 1 ( A)P ) = det( P 1 AP ) = det( D)

d1
0

.. = ( d ) ( d ) ,
..
= det ...
.
1
n
.
0
dn

o que mostra que os di sao as razes do polinomio caracterstico de A e, portanto, seus autovalores.
E. 3.16 Exerccio. Justifique todas as passagens acima.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

163/1304

Diagonaliza
c
ao de Matrizes
O proximo teorema e fundamental no estudo de matrizes diagonalizaveis.
Teorema 3.3 Uma matriz A Mat ( , n) e diagonaliz
avel se e somente se possuir um conjunto de
n autovetores linearmente independentes, ou seja, se e somente se o sub-espaco gerado pela coleca
o de
todos os autovetores de A possuir dimens
ao n.
2
Prova. Vamos primeiro provar que se A Mat ( , n) possui um conjunto de n autovetores linearmente
independentes entao A e diagonalizavel. Para tal vamos construir a matriz P que diagonaliza A.
Seja {v 1 , . . . , v n } um conjunto de n autovetores linearmente independentes de A, cujos autovalores
sao {d1 , . . . , dn }, respectivamente. Vamos denotar as componentes de v i na base canonica por vji ,
ii
hh
j = 1, . . . , n. Seja a matriz P definida por P = v 1 , . . . , v n , ou seja,

v11 v1n

P = ... . . . ... .
vn1 vnn

Como se ve pela construcao, a a-esima coluna de P e formada pelas componentes do vetor v a . Por
(3.4), segue que
hh
ii
hh
ii
AP = Av 1 , . . . , Av n = d1 v 1 , . . . , dn v n .
Por (3.6) vale, porem, que
hh

d1 v 1 , . . . , dn v n

E. 3.17 Exerccio. Verifique.

ii

v11 v1n
d1 0

= ... . . . ... ... . . . ... = P D .


vn1 vnn
0 dn
6

Portanto, AP = P D. Como, por hipotese, as colunas de P sao formadas por vetores linearmente
independentes, tem-se que det(P ) 6= 0 (por que?). Logo, P e invertvel e, portanto, P 1 AP = D, como
queramos demonstrar.
Vamos provar agora a afirmacao recproca que se A e diagonalizavel, entao possui n autovetores
linearmente independentes. Suponha que exista P tal que

d1 0

P 1 AP = D = ... . . . ... .
0 dn

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

evidente que os vetores da base canonica


E


1
0
0
1




e 1 = 0 , e 2 = 0 ,
..
..
.
.
0
0

...,

en

164/1304


0
0


= ...

0
1

sao autovetores de D com Dea = da ea . Logo, v a = P ea sao autovetores de A, pois


Av a = AP ea = P Dea = P (da ea ) = da P ea = da v a .

Provar que os vetores v a sao linearmente independentes e facil. Suponha que existam n
umeros complexos 1 , . . . , n tais que
1 v 1 + + n v n = 0 .

Multiplicando-se a` esquerda por P 1 teramos

1 e 1 + + n e n = 0 .
Como os ea sao obviamente linearmente independentes, segue que 1 = = n = 0, provando que os
v a sao linearmente independentes.

Matrizes Diagonaliz
aveis e Matrizes Simples
Vamos agora discutir a relacao entre os conceitos de matriz diagonalizavel e o de matriz simples,
conceito esse introduzido a` pagina 152. Tem-se a saber o seguinte fato:
Proposi
c
ao 3.10 Uma matriz A Mat ( , n) e diagonaliz
avel se e somente se for simples, ou
seja, se e somente se a multiplicidade algebrica de cada um dos seus autovalores coincidir com sua
multiplicidade geometrica.
2
Prova. Se A e diagonalizavel existe P tal que P 1 AP = D, diagonal. Como toda matriz diagonal, D
e simples. Escrevamos D na forma

D = diag 1 , . . . , 1 , . . . , r , . . . , r , .
| {z }
| {z }
a1 vezes
ar vezes

Um conjunto de n-autovetores de D linearmente independentes e


canonica:


1
0
0
1




e 1 = 0 , e 2 = 0 , . . . , e n =
..
..
.
.
0
0

fornecido pelos vetores da base



0
0

..
. .

0
1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

165/1304

Os vetores e1 , . . . , ea1 geram o subespaco de autovetores com autovalor 1 de D etc.


Para a matriz A, os vetores P e1 , . . . , P ea1 geram o subespaco de autovetores com autovalor 1 etc.
claro que a dimensao desse subespaco e a1 , pois P e1 , . . . , P ea1 sao linearmente independentes, ja
E
que os vetores da base canonica e1 , . . . , ea1 o sao. Como isso tambem vale para os demais autovalores
conclumos que A e simples.
Resta-nos agora mostrar que se A Mat ( , n) e simples entao A e diagonalizavel. Como antes,
sejam 1 , . . . , r , 1 r n, seus autovalores distintos, cada qual com multiplicidade algebrica
a1 , . . . , ar , respectivamente, e seja E(i ) o subespaco gerado pelos autovetores com autovalor i .
Como A e simples, tem-se que a dimensao de E(i ) e ai . Ja observamos (pagina 150) que sub-espacos
E(i ) associados a autovalores distintos tem em comum apenas o vetor nulo.
Pr Assim, se em cada E( i )
escolhermos ai vetores independentes, teremos ao todo um conjunto de i=1 ai = n autovetores (vide
(3.13)) linearmente independentes de A. Pelo Teorema 3.3, A e diagonalizavel, completando a prova.

Projetores
Uma matriz E Mat ( , n) e dita ser um projetor se satisfizer
E2 = E .
Discutiremos varias propriedades importantes de projetores adiante, especialmente de uma classe
especial de projetores denominados projetores ortogonais. Por ora, vamos mostrar duas propriedades
que usaremos logo abaixo quando discutirmos o teorema espectral.
A primeira propriedade e a afirmacao que se e um autovalor de um projetor E entao ou e igual
a zero ou a um. De fato se v e um autovetor associado a um autovalor de E, tem-se que Ev = v e
E 2 v = 2 v. Como E 2 = E, segue que 2 v = v. Logo ( 1) = 0 e, portanto, = 0 ou = 1.

A segunda propriedade e uma conseq


uencia da primeira: o traco de um projetor E Mat ( , n) e
um n
umero inteiro positivo ou nulo, mas menor ou igual a n. De fato, pela definicao, o traco de um
projetor E e a soma de seus autovalores. Como os mesmos valem zero ou um a soma e um inteiro
positivo ou nulo. Como ha no maximo n autovalores a soma nao pode exceder n. Na verdade, o u
nico
nico projetor cujo traco vale exatamente 0
projetor cujo traco vale exatamente n e a identidade e o u
e a matriz nula (por que?).
Essas observacoes tem a seguinte conseq
uencia que usaremos adiante. Se E 1 , . . . , Er sao r projetores
nao-nulos com a propriedade que
r
X
=
Ea
a=1

entao r n. Para ver isso, basta tomar o traco de ambos os lados dessa expressao:
Tr( ) =

r
X

Tr(Ea ) .

(3.26)

a=1

O lado esquerdo vale n enquanto que o lado direito e uma soma de r inteiros positivos. Obviamente
isso so e possvel se r n.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

166/1304

Uma outra observacao u


til e a seguinte: se E e E 0 sao dois projetores satisfazendo EE 0 = E 0 E = ,
0
entao E + E e igualmente um projetor, como facilmente se constata.
O Teorema Espectral

O chamado Teorema Espectral e um dos mais importantes teoremas de toda a Algebra


Linear e, em
verdade, de toda Analise Funcional, ja que o mesmo possui generalizacoes para operadores limitados
e nao-limitados (auto-adjuntos) agindo em espacos de Hilbert. Dessas generalizacoes trataremos na
Secao 26.6.1, pagina 1215, para o caso dos chamados operadores compactos e na Secao 26.7, pagina
1223, para o caso geral de operadores limitados auto-adjuntos. Nessa versao mais geral o teorema
espectral e de importancia fundamental para a interpretacao probabilstica da Fsica Quantica. Vide
discussao da Secao 26.7.5, pagina 1244.
Teorema 3.4 (O Teorema Espectral para Matrizes) Uma matriz A Mat ( , n) e diagonaliz
avel se e somente se existirem r , 1 r n, escalares distintos 1 , . . . , r e projetores
n
ao-nulos distintos E1 , . . . , Er Mat ( , n) tais que


A =

r
X

a E a ,

(3.27)

a=1

r
X

Ea

(3.28)

a=1

Ei Ej = i, j Ej .
Os escalares 1 , . . . , r vem a ser os autovalores distintos de A.

Adiante demonstraremos uma versao um pouco mais detalhada desse importante teorema (Teorema
3.6, abaixo). Os projetores Ea que surgem em (3.27) sao denominados projetores espectrais de A. A
decomposicao (3.27) e freq
uentemente denominada decomposica
o espectral de A. Na Proposicao 3.11,
pagina 169 mostraremos como os projetores espectrais Ea de A podem ser expressos em termos de
polinomios em A. Na Proposicao 3.12, pagina 169, provaremos a unicidade da decomposicao espectral
de uma matriz diagonalizavel.
Prova do Teorema 3.4. Se A Mat ( , n) e diagonalizavel existe P Mat ( , n) tal que P 1 AP =
D = diag (1 , . . . , n ), onde 1 , . . . , n sao os autovalores de A. Como pode haver autovalores
repetidos, vamos denotar por {1 , . . . , r }, 1 r n, o conjunto de autovalores distintos de A.
bem claro que podemos escrever
E
D =

r
X

a Ka ,

a=1

onde as matrizes Ka sao todas matrizes diagonais, cujos elementos diagonais sao ou 0 ou 1 e tais que
r
X
a=1

Ka =

(3.29)

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

167/1304

As matrizes Ka sao simplesmente definidas de modo a terem elementos de matriz iguais a 1 nas posicoes
da diagonal ocupadas pelo autovalor a em D e zero nos demais. Formalmente,

1, se i = j e (D)ii = a
0, se i = j e (D)ii 6= a .
(Ka )ij =

0, se i 6= j
Por exemplo, se

teremos

2
0
D =
0
0

1
0
D = 2
0
0

0
0
0
0

0
0
1
0

0
0

0
0
+3

0
0
0
0

0
3
0
0

0
0
2
0

0
1
0
0

0
0
0
0

0
0

0
4

0
0

0
0
+4

0
0
0
0

facil constatar que as matrizes Ka tem a seguinte propriedade:


E

0
0
0
0

0
0
0
0

0
0
.
0
1

Ka Kb = a, b Ka .

(3.30)

De fato, e evidente que (Ka )2 = Ka para todo a, pois Ka e diagonal com zeros ou uns na diagonal.
Analogamente, se a 6= b Ka Kb = 0, pois os zeros ou uns aparecem em lugares distintos das diagonais
das duas matrizes.
Como A = P DP 1 , tem-se que
A =

r
X

a E a ,

a=1

facil agora provar que


onde Ea := P Ka P 1 . E

r
X

Ea

a=1

e que

Ei Ej = i, j Ej .
De fato, por (3.29),
r
X
a=1

Ea =

r
X
a=1

P Ka P 1 = P

r
X
a=1

Ka

P 1 = P P 1 =

Analogamente, tem-se por (3.30),


Ea Eb = P Ka P 1 P Kb P 1 = P Ka Kb P 1 = a, b P Ka P 1 = a, b Ea .
Vamos agora provar a recproca. Vamos supor que A possua a representacao (3.27), onde os E a s
satisfazem as propriedades enunciadas.

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

168/1304

Notemos primeiramente que para todo vetor x, os vetores Ek x ou sao nulos ou sao autovetores de
A. De fato, por (3.27)
r
X
AEk x =
j E j E k x = k E k x .
j=1

Logo ou Ek x = 0 ou Ek x e autovetor de A.

Como ha no maximo n autovetores, o espaco por eles gerado tem dimensao menor ou igual a n.
Por (3.28), porem, vale para todo vetor x que
x =

x =

r
X

Ek x .

k=1

Para x nao-nulo, alguns dos Ek x, acima, devem ser nao-nulos e, portanto, autovetores de A. Assim,
todo vetor x pode ser escrito como uma combinacao linear de autovetores de A, o que significa que
o espaco gerado por esses autovetores tem dimensao exatamente igual a n. Pelo teorema 3.3, A e
diagonalizavel. Isso completa a demonstracao.
No Teorema 3.6, pagina 171, apresentaremos uma segunda demonstracao do Teorema Espectral
para Matrizes, a qual lanca luz sobre outras condicoes de diagonalizabilidade de matrizes. Antes,
exploremos algumas das conseq
uencias do Teorema Espectral.
O C
alculo Funcional para Matrizes Diagonaliz
aveis
O Teorema Espectral tem o seguinte corolario, muitas vezes conhecido como c
alculo funcional.
avel e seja
Teorema 3.5 (C
alculo Funcional) Seja A Mat ( , n) uma matriz diagonaliz
r
X

A =

a E a .

a=1

sua decomposica
o espectral, de acordo com o Teorema Espectral, o Teorema 3.4. Ent
ao para qualquer
polin
omio p vale
r
X
p(A) =
p(a )Ea .
(3.31)
a=1

Prova. Tem-se, pelas propriedades dos Ea s,


2

A =

r
X

a b E a E b =

a, b=1

r
X

a, b=1

Analogamente, mostra-se que


A

r
X
=
(a )m Ea ,
a=1

para qualquer m


a b a, b Ea =

. O resto da prova e trivial.

r
X
a=1

(a )2 Ea .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

169/1304

E. 3.18 Exerccio. Usando (3.31) demonstre novamente o Teorema de Hamilton-Cayley (Teorema 3.2,
pagina 158), agora apenas para matrizes diagonalizaveis.
6
Obtendo os projetores espectrais
O Calculo Funcional para matrizes, Teorema 3.5, tem diversas conseq
uencias praticas, uma delas
sendo a seguinte proposicao, que permite expressar os projetores espectrais de uma matriz A diretamente em termos de A.
Proposi
c
ao 3.11 Seja A Mat ( , n), diagonaliz
avel, e seja A = 1 E1 + + r Er , com os k s
distintos, sua representaca
o espectral, descrita no Teorema 3.4. Sejam os polin
omios p j , j = 1, . . . , r,
definidos por

r 
Y
x l
pj (x) :=
.
(3.32)
j l
l=1
l6=j

Ent
ao,
j = 1, . . . , r .

Ej = pj (A) ,

(3.33)
2

Prova. Pela definicao dos polinomios pj , e evidente que pj (k ) = j, k . Logo, pelo Calculo Funcional
para matrizes,
r
X
pj (A) =
pj (k )Ek = Ej .
k=1

O Teorema Espectral para matrizes. Unicidade


Proposi
c
ao 3.12 A representaca
o espectral de uma matriz diagonaliz
avel A Mat ( , n) descrita no
Teorema 3.4 e u
nica.
2
Demonstracao. Seja A Mat ( , n) diagonalizavel e seja A =

r
X

k Ek a representacao espectral de A

k=1

descrita no Teorema 3.4, onde k , k = 1, . . . , r, com 1 r n sao os autovalores distintos de A, Seja


r0
X
A=
k0 Ek0 uma segunda representacao espectral para A, onde os k0 s sao distintos e onde os Ek0 s
k=1

sao nao-nulos e satisfazem

Ej0 El0

j, l El0

r
X

Ek0 . Por essa u


ltima propriedade segue que para

k=1
P0
um dado vetor x 6= 0 vale x = rk=1 Ek0 x, de modo que nem todos os vetores Ek0 x sao nulos. Seja Ek0 0 x
P0
um desses vetores nao-nulos. Tem-se que AEk0 0 x = rk=1 k0 Ek0 Ek0 0 x = k0 0 Ek0 0 x. Isso mostra que k0 0 e

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

170/1304

um dos autovalores de A e, portanto, {10 , . . . , r0 0 } {1 , . . . , r }. Isso, em particular ensina-nos


que r 0 r. Podemos sem perda de generalidade considerar que os dois conjuntos sejam ordenados de
modo que k0 = k para todo 1 k r 0 . Assim,
A =

r
X

r
X

k E k =

k=1

k Ek0 .

(3.34)

k=1

Sejam agora os polinomios pj , j = 1, . . . , r, definidos em (3.32), os quais satisfazem pj (j ) = 1 e


pj (k ) = 0 para todo k 6= j. Pelo Calculo Funcional descrito acima, segue de (3.34) que, com 1 j r 0 ,
pj (A) =

r
X

pj (k )Ek =

|k=1 {z

=Ej

r
X

pj (k )Ek0 ,

|k=1 {z

Ej = Ej0 .

=Ej0

P0
(A igualdade pj (A) = rk=1 pj (k )Ek0 segue do fato que os Ek0 s satisfazem as mesmas relacoes algebricas
que os Ek s e, portanto, para a representacao espectral de A em termos dos Ek0 s vale tambem o Calculo
Funcional). Lembrando que a igualdade Ej = Ej0 vale para todo 1 j r 0 , segue que
=

r
X
k=1

Ek =

r
X

Ek .

k=1

P
A u
ltima igualdade implica rk=r0 +1 Ek = . Multiplicando por El com r 0 + 1 l r, segue que
El = para todo r 0 + 1 l r. Isso so e possvel se r = r 0 , pois os E 0 ks sao nao-nulos. Isso completa
a demonstracao.

O Teorema Espectral para matrizes. Uma segunda visita


O Teorema Espectral, Teorema 3.4, pode ser formulado de um modo mais detalhado (Teorema
3.6). A principal utilidade dessa outra formulacao e a de fornecer mais informacoes sobre os projetores
espectrais Ea (vide expressao (3.37), abaixo). Obtem-se tambem nessa nova formulacao mais condicoes
necessarias e suficientes a` diagonalizabilidade e que podem ser u
teis, como veremos, por exemplo, no
Teorema 3.14 provado adiante (pagina 175).
Teorema 3.6 (Teorema Espectral para Matrizes. Vers
ao Detalhada) Seja A Mat ( , n).
S
ao equivalentes as seguintes afirmaco
es:
1. A possui n autovetores linearmente independentes, ou seja, o sub-espaco gerado pelos autovetores
de A tem dimens
ao n.
2. A e diagonaliz
avel, ou seja, existe uma matriz P Mat ( , n) invertvel tal que P 1 AP e uma
matriz diagonal diag (d1 , . . . , dn ), onde os di s s
ao autovalores de A.
3. Para todo vetor x

e todo escalar

tais que (A )2 x = 0, vale que (A )x = 0.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

4. Se x e um vetor n
ao-nulo tal que (A )x = 0 para algum
vetor y com a propriedade que (A )y = x.

171/1304

ent
ao n
ao existe nenhum

5. Todas as razes do polin


omio mnimo de A tem multiplicidade 1.
6. Existem r , escalares distintos 1 , . . . , r e projetores distintos E1 , . . . , Er Mat ( , n),
denominados projetores espectrais de A, tais que


A =

r
X

a E a .

a=1

Alem disso, as matrizes Ea satisfazem


=

r
X

Ea

(3.35)

a=1

Ei Ej = i, j Ej .

(3.36)

Os projetores espectrais Ek do item 6, acima, podem ser expressos em termos de polin


omios da matriz
A:
1
Ek =
mk (A) ,
(3.37)
mk (k )
para todo k, 1 k r, onde os polin
omios mk s
ao definidos por
M (x) = (x k )mk (x) ,
M sendo o polin
omio mnimo de A.

Demonstracao. A prova da equivalencia sera feita demonstrando-se sucessivamente as seguintes implicacoes: 1 2, 2 3, 3 4, 4 5, 5 6, 6 1. Que 1 implica 2 ja foi demonstrado no Teorema
3.3, pagina 163.
2 3. Seja D = P 1 AP diagonal. D = diag (d1 , . . . , dn ). Seja (A )2 x = 0. Segue que
P 1 (A )2 P y = 0
onde y = P 1 x. Logo,
(D )2 y = 0 ,
ou seja,
(d1 )2 y1 = 0
..
.
(dn )2 yn = 0,

JCABarata. Curso de Fsica-Matem


atica

onde yj sao as componentes de y:

Vers
ao de 29 de setembro de 2005.

Captulo 3

172/1304


y1
..
y = . .
yn

Agora, e evidente que se (da )2 ya = 0 entao (da )ya = 0. Logo


(D )y = 0 .
Usando-se y = P 1 x e multiplicando-se a` direita por P , conclumos que
0 = P (D )P 1 x = (P DP 1 )x = (A )x ,
que e o que queramos provar.
3 4. A prova e feita por contradicao. Vamos supor que para algum vetor x 6= 0 exista tal que
(A )x = 0. Suponhamos tambem que exista vetor y tal que (A )y = x. Teramos
(A )2 y = (A )x = 0 .
Pelo item 3 isso implica (A )y = 0. Mas isso diz que x = 0, uma contradicao.
4 5. Seja M o polinomio mnimo de A, ou seja, o polinomio monico7 de menor grau tal que M (A) = 0.
Vamos mostrar que todas as razes de M tem multiplicidade 1. Vamos, por contradicao, supor
que haja uma raiz, 0 , com multiplicidade maior ou igual a 2. Teramos, para x ,
M (x) = p(x)(x 0 )2 .
Assim, M (A) = p(A)(A 0 )2 = 0. Como M e, por definicao, o polinomio de menor grau que
zera em A, segue que
p(A)(A 0 ) 6= 0 .
Assim, existe pelo menos um vetor z tal que p(A)(A 0 )z 6= 0. Vamos definir um vetor x por
x := p(A)(A 0 )z. Entao
(A 0 )x = (A 0 )p(A)(A 0 )z = p(A)(A 0 )2 z = M (A)z = 0 ,
pois M (A) = 0. Agora, pela definicao,
x = (A 0 )y ,
onde y = p(A)z. Pelo item 4, porem, isso e impossvel.
5 6. Pela hipotese que as razes de M sao simples segue da expressao (3.25) da Proposicao 3.9, pagina
162, que para x ,
r
Y
M (x) =
(x j ) ,
j=1

A definica
o de polin
omio m
onico est
aa
` p
agina 156.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

173/1304

onde j sao as razes de M e que coincidem com os r autovalores distintos de A. Para k = 1, . . . , r


defina-se os polinomios mk por
M (x) =: (x k )mk (x) ,
ou seja,
mk (x) :=

r
Y
j=1
j6=k

(x j ) .

claro que mk (j ) = 0 j 6= k (por que?).


E

Vamos agora definir mais um polinomio, g, da seguinte forma:


g(x) = 1

r
X
k=1

1
mk (x) .
mk (k )

Como os polinomios mk tem grau r 1, o polinomio g tem grau menor ou igual a r 1. Porem,
observe-se que, para todos os j , j = 1, . . . , r, vale
g(j ) = 1

r
X
k=1

mj (j )
1
mk (j ) = 1
= 0.
mk (k )
mj (j )

Assim, g tem pelo menos r razes distintas! O u


nico polinomio de grau menor ou igual a r 1
que tem r razes distintas e o polinomio nulo. Logo, conclumos que
g(x) = 1

r
X
k=1

1
mk (x) 0
mk (k )

para todo x . Isso significa que todos os coeficientes de g sao nulos. Assim, para qualquer
matriz B tem-se g(B) = 0. Para a matriz A isso diz que
=

r
X
k=1

Definindo-se
Ek :=

1
mk (A) .
mk (k )

1
mk (A) ,
mk (k )

conclumos que
=

r
X

Ek .

(3.38)

(3.39)

k=1

Para todo k vale 0 = M (A) = (A k )mk (A), ou seja, Amk (A) = k mk (A). Pela definicao de
Ek isso significa
AEk = k Ek .
Assim, multiplicando-se ambos os lados de (3.39) por A, segue que
A =

r
X
k=1

k E k .

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

174/1304

Para completar a demonstracao de 6, resta-nos provar que Ei Ej = i, j Ej .


Para i 6= j tem-se pela definicao dos Ek s que
1
mi (A)mj (A)
mi (i )mj (j )

r
r
1
Y
Y

=
(A k ) (A l )
mi (i )mj (j ) k=1
l=1

Ei Ej =

k6=i

mi (i )mj (j )
=

r
Y

k=1
k6=i, k6=j

mi (i )mj (j )

l6=j

r
Y

l=1

k=1
k6=i, k6=j

= 0,

#
" r
Y
(A k )
(A l )

(A k ) M (A)

pois M (A) = 0. Resta-nos provar que Ej2 = Ej para todo j. Multiplicando-se ambos os lados de
(3.39) por Ej teremos
r
X
Ej =
Ej Ek = E j Ej ,
k=1

ja que Ej Ek = 0 quando j 6= k. Isso completa a demonstracao do item 6.

6 1. Notemos primeiramente que para todo vetor x, os vetores Ek x ou sao nulos ou sao autovetores
de A. De fato, por 6,
r
X
AEk x =
j E j E k x = k E k x .
j=1

Logo, ou Ek x = 0 ou Ek x e autovetor de A. O espaco gerado pelos autovetores de A obviamente


tem dimensao menor ou igual a n. Por (3.39), porem, vale para todo vetor x que
x =

x =

r
X

Ek x .

k=1

Assim, todo vetor x pode ser escrito como uma combinacao linear de autovetores de A, o que
significa que o espaco gerado pelos autovetores tem dimensao exatamente igual a n.
Isso completa a demonstracao do Teorema 3.6.
Destacamos ao leitor o fato de que a expressao (3.37) permite representar os projetores espectrais
diretamente em termos da matriz diagonalizavel A.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

175/1304

Diagonalizabilidade de Projetores
A proposicao abaixo e uma aplicacao simples do Teorema 3.6 a projetores. A mesma sera usada
abaixo quando falarmos de diagonalizacao simultanea de matrizes.
Proposi
c
ao 3.13 Seja E Mat ( , n) um projetor, ou seja, tal que E 2 = E. Ent
ao E e diagonaliz
avel.
2
Prova. Seja E Mat ( , n) um projetor. Definamos E1 = E e E2 =
projetor, pois
(E2 )2 = ( E)2 =

2E + E 2 =

2E + E =

E. Entao E2 e tambem um
E = E2 .

Tem-se tambem que E1 E2 = 0, pois


E1 E2 = E( E) = E E 2 = E E = 0 .
Fora isso, e obvio que = E1 + E2 e que E = 1 E1 + 2 E2 , com 1 = 1 e 2 = 0. Ora, isso tudo
diz que E satisfaz precisamente todas as condicoes do item 6 do Teorema 3.6. Portanto, pelo mesmo
teorema, E e diagonalizavel.

Uma Condi
c
ao Suficiente para Diagonalizabilidade
Ate agora estudamos condicoes necessarias e suficientes para que uma matriz seja diagonalizavel.
Vimos que uma matriz A Mat ( , n) e diagonalizavel se e somente se for simples ou se e somente
se tiver n autovetores linearmente independentes ou se e somente se puder ser representada na forma
espectral, como em (3.27). Nem sempre, porem, e imediato verificar essas hipoteses, de modo que e
u
til saber de condicoes mais facilmente verificaveis e que sejam pelo menos suficientes para garantir
diagonalizabilidade. Veremos abaixo que e, por exemplo, suficiente que uma matriz seja auto-adjunta
ou normal para garantir que ela seja diagonalizavel.
Uma outra condicao u
til e aquela contida na seguinte proposicao.
Proposi
c
ao 3.14 Se A Mat ( , n) tem n autovalores distintos ent
ao A e diagonaliz
avel.

Prova. Isso e imediato pelas Proposicoes 3.5 e 3.10, das paginas 152 e 164, respectivamente.
Observaca
o. A condicao mencionada na u
ltima proposicao e apenas suficiente, pois ha obviamente
matrizes diagonalizaveis que nao tem autovalores todos distintos.
Outra forma de provar a Proposicao 3.14 e a seguinte. Seja {1 , . . . , n } o conjunto dos n
autovalores de A, todos distintos. O polinomio caracterstico de A e q(x) = (x 1 ) (x n ). Como
as razes de q tem, nesse caso, multiplicidade 1, segue pela Proposicao 3.9, pagina 162, que o polinomio
mnimo de A, M , coincide com o polinomio caracterstico de A: q(x) = M (x), x . Logo, o
polinomio mnimo M de A tem tambem razes com multiplicidade 1. Assim, pelo item 5 do Teorema
3.6, pagina 171, A e diagonalizavel.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

176/1304

E. 3.19 Exerccio. Demonstre a seguinte afirmacao: se os autovalores de uma matriz A sao todos
iguais, entao A e diagonalizavel se e somente se for um multiplo de . Sugestao: use o Teorema Espectral
ou a forma geral do polinomio mnimo (3.25).
6
Segue da afirmativa desse exerccio que matrizes triangulares superiores com diagonal principal
constante, ou seja, da forma

A12 . . . A1(n1) A1n


0 . . . A2(n1) A2n

..

.
.
.
.
,
A = .
.
.

0 0 . . .

A(n1)n
0 0 ...
0

so sao diagonalizaveis se todos os elementos acima da diagonal principal forem nulos, ou seja, se A ij = 0,
j > i. Naturalmente, a mesma afirmativa e valida para matrizes da forma AT , triangulares inferiores
com diagonal principal constante.

3.4.1

Diagonaliza
c
ao Simult
anea de Matrizes

Uma matriz A Mat ( , n) e dita ser diagonalizada por uma matriz P Mat ( , n) se P 1 AP for
uma matriz diagonal.
Uma questao muito importante e saber quando duas matrizes diagonalizaveis podem ser diagonalizadas por uma mesma matriz P . A resposta e fornecida no proximo teorema.
Teorema 3.7 (Diagonaliza
c
ao Simult
anea de Matrizes) Duas matrizes diagonaliz
aveis A e B
Mat ( , n) podem ser diagonalizadas pela mesma matriz P Mat ( , n) se e somente se AB = BA,
ou seja, se e somente se comutarem entre si.
2
Prova. A parte facil da demonstracao e provar que se A e B podem ser diagonalizadas pela mesma
matriz P entao A e B comutam entre si. De fato
P 1 (AB BA)P = (P 1 AP )(P 1 BP ) (P 1 BP )(P 1 AP ) = 0 ,
pois P 1 AP e P 1 BP sao ambas diagonais e matrizes diagonais sempre comutam entre si (por que?).
Assim, P 1 (AB BA)P = 0 e, portanto, AB = BA.

Vamos agora passar a mostrar que se AB = BA entao ambas sao diagonalizaveis por uma mesma
matriz P .
Sejam 1 , . . . , r os r autovalores distintos de A e 1 , . . . , s os s autovalores distintos de B.

Evocando o teorema espectral, A e B podem ser escritos de acordo com suas decomposicoes espectrais como
r
X
A =
i EiA
i=1

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

e
B =

s
X

177/1304

j EjB ,

j=1

onde, de acordo com (3.37),


1

r
r

Y
Y
A
(i k )
Ei =
(A k

k=1
k=1

) ,

k6=i

k6=i

(j k )
=
(B k ) ,

k=1
k=1

s
Y

EjB

i = 1, . . . , r

(3.40)

j = 1, . . . , s .

(3.41)

k6=j

k6=j

Como A e B comutam entre si e como EiA e EjB , dados em (3.40)-(3.41), sao polinomios em A e B,
respectivamente, segue que EiA e EjB tambem comutam entre si para todo i e todo j.
Com isso, vamos definir
Qi, j = EiA EjB = EjB EiA
para i = 1, . . . , r e j = 1, . . . , s.
Note-se que os Qi, j s sao projetores pois
Q2i, j = (EiA EjB )(EiA EjB ) = (EiA )2 (EjB )2 = EiA EjB = Qi, j .
Fora isso, e facil ver que,
Qi, j Qk, l = i, k j, l Qi, j .

(3.42)

E. 3.20 Exerccio. Mostre isso.

Note-se tambem que


=

r X
s
X

Qi, j ,

(3.43)

i=1 j=1

pois
r X
s
X
i=1 j=1

Qi, j =

r X
s
X

EiA EjB =

i=1 j=1

r
X
i=1

EiA

s
X
j=1

EjB

Afirmamos que podemos escrever


A =

r X
s
X

i,A j Qi, j

(3.44)

i,B j Qi, j ,

(3.45)

i=1 j=1

e
B =

r X
s
X
i=1 j=1

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

178/1304

onde i,A j = i e i,B j = j . De fato, com essas definicoes,


r X
s
X

i,A j Qi, j =

i=1 j=1

r X
s
X

r
X

i EiA EjB =

i EiA

i=1

i=1 j=1

s
X
j=1

EjB

= A

= A.

Para B a demonstracao e analoga.


Nas relacoes (3.44) e (3.45) e possvel fazer simplificacoes em funcao do fato de que nem todos os
projetores Qi, j sao nao-nulos. Seja Q1 . . . , Qt a lista dos projetores Qi, j nao-nulos, ou seja,
{Q1 . . . , Qt } = {Qi, j | Qi, j 6= 0, i = 1, . . . , r e j = 1, . . . , s} .
evidente por (3.42) que os Qk s sao projetores e que
E
Qk Ql = k, l Qk .
Por (3.43), tem-se
=

t
X

Qk

(3.46)

A
k Qk

(3.47)

B
k Qk

(3.48)

k=1

e por (3.44) e (3.45)


A =

t
X
k=1

B =

t
X
k=1

B
onde as constantes A
ao relacionadas de modo obvio com i,A j e i,B j , respectivamente.
k e k est

Em (3.47) e (3.48) vemos que A e B, por serem diagonalizaveis e por comutarem entre si, tem
decomposicoes espectrais com os mesmos projetores espectrais. Note-se tambem que, pela observacao
feita no topico Projetores, a` pagina 165 (vide equacao (3.26)), tem-se 1 t n.

Vamos agora completar a demonstracao que A e B podem ser diagonalizados por uma mesma matriz
invertvel P .
Seja Ek o subespaco dos autovetores de Qk com autovalor 1. Sub-espacos Ek s diferentes tem em
comum apenas o vetor nulo. De fato, se k 6= l e w e um vetor tal que Qk w = w e Ql w = w entao, como
Qk Ql = 0 segue que
0 = (Qk Ql )w = Qk (Ql w) = Qk w = w .
Seja dk a dimensao do subespaco Ek e seja
u1k , . . . , udkk
um conjunto de dk vetores linearmente independentes em Ek . Notemos que dk coincide com a multiplicidade algebrica do autovalor 1 de Qk , pois, conforme diz a Proposicao 3.13, o projetor Qk e diagonalizavel
e, portanto, e uma matriz simples (Proposicao 3.10).

JCABarata. Curso de Fsica-Matem


atica

Como

Pt

k=1

Captulo 3

Vers
ao de 29 de setembro de 2005.

Qk , tem-se, tomando-se o traco, que n =

Pelas definicoes, temos que


Ql uak = k, l uak ,

Pt

k=1

179/1304

dk .
(3.49)

pois Qk uak = uak e, portanto, Ql uak = Ql (Qk uak ) = (Ql Qk )uak = 0 para k 6= l.
Afirmamos que o conjunto de vetores

u11 , . . . , ud11 , u12 , . . . , ud22 , . . . u1t , . . . , udt t

(3.50)

e um conjunto de n vetores linearmente independentes. De fato, suponha que existam constantes c k, j


tais que
dk
t X
X
ck, j ujk = 0 .
k=i j=1

Aplicando-se a` direita Ql teramos

dl
X

cl, j ujl = 0 ,

j=1

o que so e possvel se cl, j = 0 para todo j pois u1l , . . . , udl l , foram escolhidos linearmente independentes.
Como l e arbitrario, conclumos que cl, j = 0 para todo l e todo j, o que mostra que o conjunto de
vetores em (3.50) e linearmente independente.
Seja entao a matriz P Mat ( , n) definida por
ii
hh
P = u11 , . . . , ud11 , u12 , . . . , ud22 , . . . u1t , . . . , udt t .

P e invertvel pois o conjunto (3.50) e linearmente independente (e, portanto, det(P ) 6= 0).
Tem-se,

hh
ii
AP = Au11 , . . . , Aud11 , Au12 , . . . , Aud22 , . . . , Au1t , . . . , Audt t .
P
Escrevendo A = tl=1 A
l Ql (3.47) e usando (3.49), temos
Auak

t
X

a
A a
A
l Q l uk = k uk .

l=1

Assim,
AP =
onde

Portanto,

hh

A dt
A 1
A d1
A 1
A d1
1
A
1 u1 , . . . , 1 u1 , 2 u1 , . . . , 2 u1 , . . . , t ut , . . . , t ut

ii

= P DA ,

A
A
A
A
DA = diag A
, . . . , A
.
1 , 2 , . . . , 2 , . . . , t , . . . , t
| 1 {z
} |
{z
}
{z
}
|
d1 vezes
d2 vezes
dt vezes

P 1 AP = DA .

JCABarata. Curso de Fsica-Matem


atica

Analogamente,
BP =
Escrevendo B =
BP =
onde

Portanto,

Pt

l=1

hh

hh

Vers
ao de 29 de setembro de 2005.

Captulo 3

180/1304

ii
Bu11 , . . . , Bud11 , Bu12 , . . . , Bud22 , . . . Bu1t , . . . , Budt t .

B
l Ql (3.48) temos,

1
B d1
B 1
B d2
B 1
B dt
B
1 u1 , . . . , 1 u1 , 2 u2 , . . . , 2 u2 , . . . , t ut , . . . , t ut

ii

= P DB ,

B
B
B
B
DB = diag B
.
, . . . , B
1 , 2 , . . . , 2 , . . . , t , . . . , t
|
| 1 {z
} |
{z
}
{z
}
d1 vezes
d2 vezes
dt vezes

P 1 BP = DB .

Isso provou que A e B sao diagonalizaveis pela mesma matriz invertvel P . A demonstracao do
Teorema 3.7 esta completa.

3.5

Matrizes Auto-adjuntas, Normais e Unit


arias

A Adjunta de uma Matriz


Seja V um espaco vetorial dotado de um produto escalar h, i e seja A : V V um operador
linear. Um operador linear A que para todos u, v V satisfaca
hu, Avi = hA u, vi

e dito ser o operador adjunto de A. Em espacos vetoriais gerais nao e obvio (e nem sempre verdadeiro!)
que sempre exista o adjunto de um operador linear A dado. Ha muitos casos, porem, nos quais isso
pode ser garantido8 . Aqui trataremos do caso dos espacos V = n com o produto escalar usual.
Sejam u = (u1 , . . . , un ) e v = (v1 , . . . , vn ) dois vetores de
escalar usual
n
X
hu, vi =
uk v k .

para os quais define-se o produto

k=1

Um operador linear A e representado (na base canonica) por uma matriz cujos elementos de matriz
sao Aij , com i, j {1, . . . , n}.
um exerccio simples (faca!) verificar que o operador adjunto A de A e representado (na base
E
canonica) por uma matriz cujos elementos de matriz sao (A )ij = Aji , com i, j {1, . . . , n}. Ou
seja, a matriz adjunta de A e obtida (na base canonica!) transpondo-se A e tomando-se o complexo
conjugado de seus elementos.
Os seguintes fatos sao importantes:
8

Tal e o caso dos chamados operadores lineares limitados agindo em espacos de Hilbert, para os quais sempre e possvel
garantir a existencia do adjunto.

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

Proposi
c
ao 3.15 Se A e B s
ao dois operadores lineares agindo em

181/1304

ent
ao

(A + B) = A + B
para todos , . Fora isso,

(AB) = B A .

Por fim, vale para todo A que (A ) = A.

Deixamos a demonstracao como exerccio para o leitor.


A operacao Mat ( , n) 3 A 7 A Mat ( , n) e demoninada operaca
o de adjunca
o de matrizes.
Como vimos na Proposicao 3.15, a operacao de adjuncao e anti-linear e e um anti-homomorfismo
algebrico.
Os espectro e a opera
c
ao de adjun
c
ao
Seja A Mat ( , n). Como ja vimos, o espectro de A, (A), e o conjunto de razes de seu
polinomio caracterstico, definido por pA (z) = det(z A), z . Como para toda B Mat ( , n)
vale det(B ) = det(B) (por que?), segue que pA (z) = det(z A) = det(z A ) = pA (z), ou seja,
pA (z) = pA (z). Com isso, provamos a seguinte afirmacao:
Proposi
c
ao 3.16 Seja A Mat ( , n). Ent
ao, (A) se e somente se (A ), ou seja, e um
autovalor de A se e somente se e um um autovalor de A .
Em smbolos, as afirmacoes acima sao expressas pela igualdade (A) = (A ).
Matrizes Hermitianas, Normais e Unit
arias
Vamos agora a algumas definicoes muito importantes.
Defini
c
ao. Um operador linear em n e dito ser simetrico, Hermitiano ou auto-adjunto se A = A , ou
seja, se para todos u, v V satisfizer
hu, Avi = hAu, vi .
Advert
encia. Em espacos vetoriais de dimensao finita as nocoes de operador simetrico, Hermitiano
ou auto-adjunto sao sinonimas. Em espacos vetoriais de dimensao infinita, porem, ha uma distincao
entre essas nocoes relativa a problemas com o domnio de definicao de operadores.
Defini
c
ao. Um operador linear em
com seu adjunto.

e dito ser normal se AA = A A. Ou seja, A e normal se comuta

claro que todo


ario se A A = AA = . E
Defini
c
ao. Um operador linear em n e dito ser unit
n

operador unitario e normal e que um operador e unitario em


se e somente se A = A1 . Note que
se A e unitario entao, para todos u, v V , tem-se
hAu, Avi = hu, vi .

JCABarata. Curso de Fsica-Matem


atica

Defini
c
ao. Se A e um operador linear em

Captulo 3

Vers
ao de 29 de setembro de 2005.

182/1304

define-se a parte real de A por

1
Re (A) = (A + A )
2
e a parte imagin
aria de A por

1
(A A ).
2i

E claro que essas definicoes foram inspiradas nas relacoes analogas para n
umeros complexos. Note
tambem que
A = Re (A) + iIm (A) .
Im (A) =

E. 3.21 Exerccio. Por que?

importante notar que para qualquer operador linear A em n sua parte real e imaginaria sao
E
ambas operadores Hermitianos: (Re (A)) = Re (A) e (Im (A)) = Im (A).
E. 3.22 Exerccio. Mostre isso.

Para operadores normais tem-se a seguinte proposicao, que sera u


til adiante e serve como caracterizacao alternativa do conceito de operador normal.
Proposi
c
ao 3.17 Um operador linear agindo em
com sua parte imagin
aria.

e normal se e somente se sua parte real comuta


2

Deixamos a demonstracao (elementar) como exerccio para o leitor.


A importancia das definicoes acima reside no seguinte fato, que demonstraremos adiante: matrizes
Hermitianas e matrizes normais sao diagonalizaveis. Antes de tratarmos disso, vamos discutir algumas
propriedades do espectro de matrizes Hermitianas e de matrizes unitarias.
Os Autovalores de Matrizes Hermitianas e de Matrizes Unit
arias
Os seguintes teoremas tem importancia fundamental para o estudo de propriedades de matrizes
Hermitianas e de matrizes unitarias.
Teorema 3.8 Os autovalores de uma matriz Hermitiana s
ao sempre n
umeros reais.

Prova. Seja A Hermitiana, um autovalor de A e v 6= 0 um autovetor de A com autovalor . Como


A e Hermitiana tem-se
hv, Avi = hAv, vi .
Como v e um autovetor, o lado esquerdo vale hv, vi e o lado direito vale hv, vi. Logo, ()hv, vi =
0. Como v 6= 0 isso implica = , ou seja, e real.
Note-se que a recproca desse teorema e falsa. A matriz
nao e Hermitiana.

2 1
0 3

tem autovalores reais (2 e 3) mas

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

183/1304

Para matrizes unitarias temos


Teorema 3.9 Os autovalores de uma matriz unit
aria s
ao sempre n
umeros complexos de m
odulo 1. 2
Prova. Seja A unitaria, um autovalor de A e v 6= 0 um autovetor de A com autovalor . Como A e
unitaria tem-se
hAv, Avi = hv, vi .

Como v e um autovetor, o lado esquerdo vale hv, vi. Assim, (||2 1)hv, vi = 0. Como v 6= 0 isso
implica || = 1.
Operadores Sim
etricos e Unit
arios. Ortogonalidade de Autovetores

Teorema 3.10 Os autovetores associados a autovalores distintos de uma matriz simetrica s


ao ortogonais entre si.
2
Prova. Seja A simetrica e 1 , 2 dois de seus autovalores, que suporemos distintos. Seja v1 autovetor
de A com autovalor 1 e v2 autovetor de A com autovalor 2 . Temos, por A ser simetrico,
hv1 , Av2 i = hAv1 , v2 i .
O lado esquerdo vale 2 hv1 , v2 i e o lado direito 1 hv1 , v2 i (lembre-se que 1 e real). Assim
(2 1 )hv1 , v2 i = 0 .
Como 2 6= 1 , segue que hv1 , v2 i = 0, que e o que se queria provar.
Teorema 3.11 Os autovetores associados a autovalores distintos de uma matriz unit
aria s
ao ortogonais entre si.
2
Prova. Seja U unitaria e sejam 1 , 2 dois de seus autovalores, sendo que suporemos 1 6= 2 . Seja v1
autovetor de U com autovalor 1 e v2 autovetor de U com autovalor 2 . Temos, por U ser unitario,
hU v1 , U v2 i = hv1 , U U v2 i = hv1 , v2 i .
O lado esquerdo vale 2 1 hv1 , v2 i = 21 (lembre-se que 1 e um n
umero complexo de modulo 1 e,
1
portanto 1 = 1 ). Assim


2
1 hv1 , v2 i = 0 .
1
Como 2 6= 1 , segue que hv1 , v2 i = 0, que e o que se queria provar.

Projetores Ortogonais

JCABarata. Curso de Fsica-Matem


atica

Um operador linear E agindo em

Vers
ao de 29 de setembro de 2005.

Captulo 3

184/1304

e dito ser um projetor ortogonal se E 2 = E e se E = E.

Projetores ortogonais sao importantes na decomposicao espectral de matrizes auto-adjuntas, como


veremos.
Note-se que nem todo projetor e ortogonal. Por exemplo


1 0
E =
1 0
e um projetor (E 2 = E) mas nao e ortogonal (E =
6 E). O mesmo vale para


1 0
.
E =
2 0
Um exemplo importante de projetor ortogonal e representado por projetores sobre sub-espacos unidimensionais
gerados por vetores. Seja v um vetor cuja norma assumiremos ser 1, ou seja, kvk =
p
hv, vi = 1. Definimos o projetor Pv sobre o sub-espaco gerado por v por
Pv u := hv, ui v ,

(3.51)

para todo vetor u. Provemos que Pv e um projetor ortogonal. Por um lado, tem-se
Pv2 u = hv, ui Pv v = hv, ui hv, vi v = hv, ui v = Pv u ,
o que mostra que Pv2 = Pv . Por outro lado, para quaisquer vetores a e b, usando as propriedades de
linearidade, anti-linearidade e conjugacao complexa do produto escalar, tem-se
ha, Pv bi = ha, hv, bi vi = hv, bi ha, vi = hha, vi v, bi = hhv, ai v, bi = hPv a, bi ,
provando que Pv = Pv . Isso mostra que Pv e um projetor ortogonal.
Um fato crucial sobre projetores como Pv e o seguinte. Se u e v sao dois vetores ortogonais, ou seja,
se hu, vi = 0 entao Pu Pv = Pv Pu = 0. Para provar isso notemos que para qualquer vetor a vale
Pu (Pv a) = Pu (hv, ai v) = hv, ai Pu v = hv, ai hu, vi u = 0 .
O mesmo se passa para Pv (Pu a).
Matrizes Auto-adjuntas e Diagonalizabilidade
Vamos aqui demonstrar a seguinte afirmacao importante: toda matriz auto-adjunta e diagonalizavel.
Uma outra demonstracao (eventualmente mais simples) dessa afirmacao pode ser encontrada na Secao
3.8.2, pagina 210. Vide Teorema 3.23, pagina 212.
Teorema 3.12 Se A Mat ( , n) e auto-adjunta, ent
ao A possui n autovetores mutuamente ortonormais v1 , . . . , vn , com autovalores 1 , . . . , n , respectivamente, e pode ser representada na forma
espectral
A = 1 Pv 1 + + n Pv n .
(3.52)
Portanto, se A e auto-adjunta, ent
ao A e diagonaliz
avel, sendo que e possvel encontrar uma matriz
1
unit
aria P que diagonaliza A, ou seja, tal que P AP e diagonal e P 1 = P .
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

185/1304

Note-se que se 1 , . . . , r com 1 r n sao os autovalores distintos de A, entao (3.52) pode ser
reescrita como A = 1 P1 + + r Pr , onde cada Pk e o projetore ortogonal dado pela soma dos Pvj s
de mesmo autovalor k . A Proposicao 3.12, pagina 169, garante a unicidade dessa representacao para
A.
Prova do Teorema 3.12. A demonstracao que A e diagonalizavel sera feita construindo-se a representacao
espectral (3.52) para A. Seja 1 um autovalor de A e v1 um autovetor de A com autovalor 1 normalizado
de tal forma que kv1 k = 1. Vamos definir um operador A1 por
A 1 = A 1 Pv 1 .
Como A e Pv1 sao auto-adjuntos e 1 e real, segue que A1 e igualmente auto-adjunto.
Afirmamos que A1 v1 = 0 e que [v1 ] e um sub-espaco invariante por A1 . De fato,
A1 v1 = Av1 1 Pv1 v1 = 1 v1 1 v1 = 0 .
Fora isso, se w [v1 ] tem-se

hA1 w, v1 i = hw, A1 v1 i = 0 ,

mostrando que A1 w e tambem elemento de [v1 ] .

O operador A1 restrito a [v1 ] e tambem auto-adjunto (por que?). Seja 2 um de seus autovalores
com autovetor v2 [v1 ] , que escolhemos com norma 1. Seja
A 2 = A 1 2 Pv 2 = A 1 Pv 1 2 Pv 2 .
Como 2 tambem e real A2 e igualmente auto-adjunto. Fora isso afirmamos que A2 anula os vetores
do sub-espaco [v1 , v2 ] e mantem [v1 , v2 ] invariante. De fato,
A2 v1 = Av1 1 Pv1 v1 2 Pv2 v1 = 1 v1 1 v1 2 hv2 , v1 iv2 = 0 ,
pois hv2 , v1 i = 0. Analogamente,
A 2 v 2 = A 1 v 2 2 Pv 2 v 2 = 2 v 2 2 v 2 = 0 .
Por fim, para quaisquer ,

e w [v1 , v2 ] tem-se

hA2 w, (v1 + v2 )i = hw, A2 (v1 + v2 )i = 0 ,


que e o que queramos provar.
Prosseguindo indutivamente, construiremos um conjunto de vetores v1 , . . . , vn , todos com norma
1 e com va [v1 , . . . , va1 ] e um conjunto de n
umeros reais 1 , . . . , n tais que
A n = A 1 Pv 1 n Pv n
anula-se no sub-espaco [v1 , . . . , vn ]. Ora, como estamos em um espaco de dimensao n e os vetores vk
sao mutuamente ortogonais, segue que [v1 , . . . , vn ] deve ser o espaco todo, ou seja, An = 0. Provamos
entao que
(3.53)
A = 1 Pv 1 + + n Pv n .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

186/1304

Vamos provar agora que essa e a representacao espectral de A. Como os v k s sao mutuamente
ortogonais, e evidente que Pvk Pvl = k, l Pvk . Resta-nos provar que Pv1 + + Pvn = . Como
v1 , . . . , vn formam uma base, todo vetor x pode ser escrito como uma combinacao linear
x = 1 v1 + + n vn .

(3.54)

Tomando-se o produto escalar com va , e usando o fato que os vk s sao mutuamente ortogonais, tem-se
a = hva , xi .
E. 3.23 Exerccio. Verifique.

Assim, (3.54) pode ser escrita como


x = hv1 , xiv1 + + hvn , xivn = Pv1 x + + Pvn x = (Pv1 + + Pvn ) x .
Como isso vale para todo vetor x, segue que
Pv 1 + + P v n =

Assim, A possui uma representacao espectral como (3.27). Pelo Teorema Espectral 3.4, A e diagonalizavel.
Por (3.53), vemos que Ava = a va (verifique!). Logo os a s sao autovalores de A e os va s
seus autovetores. Assim, se A e auto-adjunto, podemos escontrar n autovetores de A mutuamente
ortogonais, mesmo que sejam autovetores com o mesmo autovalor. Isso generaliza o Teorema 3.10.
hh
ii

Pelo que ja vimos A e diagonalizada por P 1 AP , onde podemos escolher P = v 1 , . . . , v n . E


facil verificar, porem, que P e unitaria. De fato, e um exerccio simples (faca!) mostrar que

hv1 , v1 i hv1 , vn i

..
..
..
P P =
.
.
.
.
hvn , v1 i hvn , vn i

Como hva , vb i = a, b , a matriz do lado direito e igual a , mostrando que P P = P P =


portanto, P e unitaria.

e que,

Para concluir essa discussao, temos:


Proposi
c
ao 3.18 Uma matriz A Mat ( , n) e auto-adjunta, se e somente se for diagonaliz
avel por
uma transformaca
o de similaridade unit
aria e se seus autovalores forem reais.
2
Prova. Se A Mat ( , n) e diagonalizavel por uma transformacao de similaridade unitaria e seus
autovalores sao reais, ou seja, existe P unitaria e D diagonal real com P AP = D, entao A = P DP
e A = P D P . Como D e diagonal e real, vale D = D e, portanto, A = P DP = A, provando que
A e auto-adjunta. A recproca ja foi provada acima.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

187/1304

Matrizes Normais e Diagonalizabilidade


O teorema que afirma que toda matriz simetrica e diagonalizavel tem a seguinte conseq
uencia:
Teorema 3.13 Se A Mat ( , n) e normal ent
ao A e diagonaliz
avel.

Prova. Ja vimos que toda matriz A pode ser escrita na forma A = Re (A) + iIm (A) onde Re (A)
e Im (A) sao auto-adjuntas. Vimos tambem que se A e normal Re (A) e Im (A) comutam entre si
(Proposicao 3.17). Pelo Teorema 3.7, Re (A) e Im (A) podem ser simultaneamente diagonalizados.
Observa
c
ao. Como no caso auto-adjunto, o operador que faz a diagonalizacao pode ser escolhido
unitario. De fato, vale uma afirmativa ainda mais forte.
Teorema 3.14 Uma matriz A Mat ( , n) e normal se e somente se for diagonaliz
avel por um
operador unit
ario.
2
Prova. Resta provar apenas que se A e diagonalizavel por um operador unitario P entao A e normal.
Seja D = P AP . Tem-se D = P A P (por que?). Assim,
A A AA = P D P P DP P DP P D P = P (D D DD )P = 0 ,
ja que D e D comutam por serem diagonais (duas matrizes diagonais quaisquer sempre comutam. Por
que?). Isso completa a prova que A e normal.
Uma outra demonstracao (eventualmente mais simples) dessa afirmacao pode ser encontrada na
Secao 3.8.2, pagina 210. Vide Teorema 3.24, pagina 212.

3.5.1

Matrizes Positivas

Uma matriz A Mat ( , n) e dita ser uma matriz positiva se hw, Awi 0 para todo vetor w
A seguinte proposicao e relevante9 :

ao A e Hermitiana e tem autovalores n


aoProposi
c
ao 3.19 Se A Mat ( , n) e positiva, ent
negativos. Reciprocamente, se A e Hermitiana e tem autovalores n
ao-negativos, ent
ao A e positiva.
2
Prova. A expressao (u, v) := hu, Avi, u, v n , define uma forma sesquilinear que, por hipotese, e
positiva, ou seja, satisfaz (u, u) 0 para todo u n . Pelo Teorema 2.6, pagina 114, e Hermitiana,
ou seja, (u, v) = (v, u) , para todos os vetores u e v. Mas isso significa que hu, Avi = hv, Aui, ou
seja, hu, Avi = hAu, vi para todos os vetores u e v e assim provou-se que A = A . Uma outra forma
de demonstrar isso usa a desigualdade de polarizacao. Se A e positiva entao, para quaisquer vetores
u, v n vale h(u + in v), A(u + in v)i 0 para todo n e, portanto, h(u + in v), A(u + in v)i e um
9

V
arios dos resultados que seguem podem ser generalizados para operadores lineares positivos agindo em espacos de
Hilbert. Vide Teorema 26.21, p
agina 1179.

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

188/1304

n
umero real. Usando a identidade de polarizacao, eqs. (2.23)-(2.24), pagina 126, vale, para quaisquer
vetores u, v n ,
hAv, ui = hu, Avi

1 X n
1X n
i h(u + in v), A(u + in v)i =
i h(u + in v), A(u + in v)i
4 n=0
4 n=0

1 X n n n
i i i h(u + in v), A(u + in v)i
4 n=0

(2.23)

1 X n n
i hi (u + in v), Ain (u + in v)i
4 n=0

1 X n
i h(v + in u), A((1)n v + in u)i
4 n=0

1X
(1)n in h(v + in u), A(v + in u)i
4 n=0

1X n
i h(v + in u), A(v + in u)i
4 n=0

sesquilin.

(2.24)

hv, Aui .

Assim, hAv, ui = hv, Aui para todos u, v n , o que significa que A e Hermitiana. Portanto,
por (3.52), podemos escrever A = 1 Pv1 + + n Pvn , onde v1 , . . . , vn sao autovetores mutuamente
ortonormais de A com autovalores 1 , . . . , n , respectivamente. Disso segue que hvj , Avj i = j para
todo j = 1, . . . , n. Como o lado esquerdo e 0, por hipotese, segue que j 0 para todo j = 1, . . . , n.
Se, reciprocamente, A for auto-adjunta com autovalores nao-negativos, segue de (3.52) e da definicao
n
X
de Pvj em (3.51) que hw, Awi =
j |hw, vj i|2 0, para todo w n , provando que A e positiva.
j=1

O seguinte corolario e imediato.


Corol
ario 3.2 Uma matriz A Mat ( , n) positiva se somente se existe uma matriz positiva B
(unvoca!) tal que A = B 2 . As matrizes A e B comutam: AB = BA.
2
Demonstracao. Se A = B 2 com B positiva, entao, como B e auto-adjunta (pela Proposicao 3.19), segue
que para todo w n vale hw, Awi = hw, B 2 wi = hBw, Bwi = kBwk2 0, provando que A e
positiva. Provemos agora a recproca.
Se A e positiva entao, como comentamos na demonstracao da Proposicao 3.19, A e autoadjunta
com representacao espectral A = 1 Pv1 + + n Pvn , onde v1 , . . . , vn sao autovetores mutuamente
ortonormais de A com autovalores 1 , . . . , n , respectivamente, todos nao-negativos. Defina-se a matriz
p
p
(3.55)
B :=
1 P v 1 + + n P v n .

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

189/1304

Como, pela ortonormalizade dos vj s, vale Pvj Pvk = j, k Pvj , e facil ver que B 2 = 1 Pv1 + +n Pvn = A.
A unicidade de B segue da unicidade da decomposicao espectral, Proposicao 3.12, pagina 169. A
igualdade (B 2 )B = B(B)2 significa AB = BA, provando que A e B comutam.
Defini
c
ao. Se A e uma matriz positiva, a (
unica!) matriz positiva B satisfazendo B 2 = A e freq
uen

temente denotada por A e denominada raz quadrada da matriz A. Como vimos, A A = AA.
Lema
ao
Se A Mat ( , n) e uma matriz positiva e C Mat ( , n) satisfaz CA = AC ent
3.2
C A = AC.
2
Prova. Se C comuta com A, entao A comuta com qualquer polinomio em A. Vimos na Proposicao
3.11, pagina 169, que os projetores espectrais de A podem ser
escritos como polinomios em A. Assim,
C comuta com os projetores espectrais de A e, portanto, com A, devido a (3.55).
Uma conseq
uencia interessante das consideracoes acima e a seguinte proposicao:
Proposi
c
ao 3.20 Toda matriz Hermitiana pode ser escrita como combinaca
o linear de ate duas matrizes unit
arias. Toda matriz pode ser escrita como combinaca
o linear de ate quatro matrizes unit
arias.
2
Demonstracao. Seja A Mat ( , n). Se A e Hermitiana (vamos supor que A 6= , pois de outra
umero
forma nao ha o que se provar), entao, para todo w n , o produto escalar hw A2 wi e um n
2
2
2
2
real e, pela desigualdade de Cauchy-Schwarz, |hw A wi| kA k kwk n . Assim, kA k kwk2 n
hw, ( A2 /kA2 k)wi = kwk2 n
hw, A2 wi kA2 k kwk2 n Logo, a matriz A2 /kA2 k e positiva, pois
p
hw, A2 wi/kA2 k kwk2 n kwk2 n = 0. Conseq
A2 /kA2 k existe e e positiva e
uentemente,
Hermitiana. Trivialmente, podemos escrever
s
s
! p
!
p
2
2
2
kA k
kA k
A
A
A
A2
p
p
A =

.
(3.56)
+i
i
2
kA2 k
2
kA2 k
kA2 k
kA2 k


Agora, as matrizes A 2 i
kA k

e que

A
p
+i
kA2 k
A

p
+i
kA2 k

A2
kA2 k

sao unitarias. Para ver isso, notemos que

A2
kA2 k

A2

kA2 k

A
p
i
kA2 k

p
i
kA2 k

A2

kA2 k

A2

kA2 k

Para provar a u
ltima igualdade basta expandir o produto e notar que, pelo Lema 3.2, A e
comutam, ja que A e

A2
kA2 k

comutam.

A2
kA2 k

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

190/1304

Assim, vemos de (3.56) que uma matriz Hermitiana A e combinacao linear de ate duas unitarias,
provando a primeira parte da Proposicao 3.20. Para provar a segunda parte, basta notar que se
M Mat ( , n) e uma matriz qualquer, podemos escrever




M + M
M M
M =
+i
.
2
2i
Ambas as matrizes entre parenteses sao Hermitianas e, portanto, podem cada uma ser escritas como
combinacao linear de ate duas unitarias, totalizando ate quatro unitarias para M .

3.6

Matrizes Triangulares

Uma matriz S Mat ( , n) e dita ser uma matriz triangular superior se forem nulos os elementos
abaixo da diagonal principal, ou seja, se Sij = 0 sempre que i > j. Note que esses nao precisam ser
necessariamente os u
nicos elementos nulos de S.
Uma matriz I Mat ( , n) e dita ser uma matriz triangular inferior se forem nulos os elementos
acima da diagonal principal, ou seja, se Iij = 0 sempre que i < j. Note que esses nao precisam ser
necessariamente os u
nicos elementos nulos de I.
Proposi
c
ao 3.21 Matrizes triangulares superiores possuem as seguintes propriedades:
1. A matriz identidade

e uma matriz triangular superior.

2. O produto de duas matrizes triangulares superiores e novamente uma matriz triangular superior.
3. O determinante de uma matriz triangular superior e o produto dos elementos da sua diagonal.
Assim, uma matriz triangular superior e invertvel se e somente se n
ao tiver zeros na diagonal.
4. Se uma matriz triangular superior e invertvel, sua inversa e novamente uma matriz triangular
superior.
As afirmaco
es acima permanecem verdadeiras trocando matriz triangular superior por matriz triangular inferior.
2
Prova. Os tres primeiros itens sao elementares. Para provar o item 4, usa-se a regra de Laplace,
expressao (3.8), pagina 145. Como e facil de se ver, Cof(S)ji = 0 se i > j. Logo, S 1 e triangular
superior, se existir.
As propriedades acima atestam que o conjunto das matrizes n n triangulares superiores invertveis
forma um grupo, denominado por alguns autores Grupo de Borel10 de ordem n e denotado por GBn ( ).
O seguinte resultado sobre matrizes triangulares superiores sera usado diversas vezes adiante.
10

Armand Borel (1923-2003).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

191/1304

Lema 3.3 Uma matriz triangular superior S Mat ( , n) e normal (ou seja, satisfaz SS = S S) se
e somente se for diagonal.
2
Prova. Se S e diagonal, S e obviamente normal pois S e tambem diagonal e matrizes diagonais sempre
comutam entre si. Provaremos a recproca, o que sera feito por inducao. Para n = 1 nao ha o que
provar. Se n = 2, S e da forma S = ( a0 cb ), com a, b, c . A condicao SS = S S significa
 2

 2

|a| + |b|2 bc
|a|
ba
=
,
cb
|c|2
ab |b|2 + |c|2
o que implica b = 0, provando que S e diagonal. Procedemos agora por inducao, supondo n > 2 e que
o lema seja valido para matrizes (n 1) (n 1) triangulares superiores normais. Se S Mat ( , n)
e triangular superior, S e da forma


b
0


1
a bT
..
..
S=
, sendo a , b = . ,
= . ,
C
0
bn1
ambas b e com n 1 linhas, sendo C uma matriz (n 1) (n 1) triangular superior. A condicao
SS = S S significa
 2


 2
abT
|a|
|a| + bT b bT C
,
=
ab B + C C
CC
Cb

sendo B a matriz cujos elementos sao Bij = bi bj . Disso extramos que bT b = 0, ou seja, |b1 |2 + +
|bn1 |2 = 0 e, portanto, b = . Com isso, ficamos com CC = C C, ou seja, C e normal. Como C e
triangular superior entao, pela hipotese indutiva, C e diagonal. Isso, mais o fato provado que b e nulo,
implica que S e diagonal, provando o lema.

3.7

O Teorema de Decomposi
c
ao de Jordan e a Forma Can
onica
de Matrizes

Nas secoes anteriores demonstramos condicoes que permitem diagonalizar certas matrizes. Nem todas
as matrizes, porem, podem ser diagonalizadas. Podemos nos perguntar, no entanto, quao proximo
podemos chegar de uma matriz diagonal.
Mostraremos nesta secao que toda matriz A pode ser levada (por uma transformacao de similaridade) a` uma forma proxima a` diagonal, denominada forma can
onica de Jordan 11 . Resumidamente
(a afirmacao precisa sera apresentada mais adiante), mostraremos que existe uma matriz P tal que
11

Marie Ennemond Camille Jordan (1838-1922). A forma can


onica de matrizes foi originalmente descoberta por
Weierstrass (Karl Theodor Wilhelm Weierstrass (1815-1897)) e redescoberta por Jordan em 1870.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

192/1304

P 1 AP tem a seguinte forma:

1 1 0 0
0 2 2 0

0 0 3 3

0 0 0 4
.
..
..
..
..
.
.
.

0 0 0 0
0 0 0 0

onde 1 , . . . , n sao os autovalores de A e onde


diagonal

1 0 0 0
0 2 0 0

0 0 3 0

0 0 0 4
.
..
..
..
..
.
.
.

0 0 0 0
0 0 0 0
e a matriz supra-diagonal

comutam entre si.

0 1 0 0
0 0 2 0

0 0 0 3

0 0 0 0
. . . .
.. .. .. ..

0 0 0 0
0 0 0 0

0
0

0
0

0
0

..

.
0
0 ,
..
..
..
.
.
.

n1 n1

0
n

(3.57)

0
0

0
0

0
0

..

.
0
0 ,
..
..
..
.
.
.

n1 0

0
n

(3.58)

os i valem 1 ou 0, mas que forma que a matriz

..
.
..
.

0
0
0

0
0
0

0
0 ,
..
..
.
.

0 n1
0
0

(3.59)

O resultado central que provaremos, e do qual as afirmativas feitas acima seguirao, diz que toda
matriz A pode ser levada por uma transformacao do tipo P 1 AP a uma matriz da forma D + N , onde
D e diagonal e N e nilpotente (ou seja, tal que N q = 0 para algum q) e tais que D e N comutam:
DN = N D. Essa e a afirmativa principal do celebre Teorema da Decomposicao de Jordan, que
demonstraremos nas paginas que seguem.
Esse Teorema da Decomposicao de Jordan generaliza os teoremas sobre diagonalizabilidade de
matrizes: para matrizes diagonalizaveis tem-se simplesmente N = 0 para um P conveniente.
Antes de nos dedicarmos a` demonstracao desses fatos precisaremos de alguma preparacao.

3.7.1

Resultados Preparat
orios

Somas Diretas de Sub-Espa


cos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

193/1304

Seja V um espaco vetorial e V1 e V2 dois de seus sub-espacos. Dizemos que V e a soma direta de V1
e V2 se todo vetor v de V puder ser escrito de modo u
nico da forma v = v1 + v2 com v1 V1 e v2 V2 .
Se V e a soma direta de V1 e V2 escrevemos V = V1 V2 .

Sub-espa
cos Invariantes
Um subespaco E de

e dito ser invariante pela aca


o de uma matriz A, se Av E para todo v E.

Se V = V1 V2 e tanto V1 quanto V2 sao invariantes pela acao de A, escrevemos A = A1 A2 onde


Ai e A restrita a Vi . Se escolhermos uma base em V da forma {v1 , . . . , vm , vm+1 , . . . , vn }, onde
{v1 , . . . , vm } e uma base em V1 e {vm+1 , . . . , vn } e uma base em V2 , entao nessa base A tera a forma


A1
m, nm
.
(3.60)
A =
A2
nm, m
onde A1 Mat ( , m) e A2 Mat ( , n m).
E. 3.24 Exerccio. Justifique a forma (3.60).

A representacao (3.60) e dita ser uma representaca


o em blocos diagonais de A, os blocos sendo as
sub-matrizes A1 e A2 .
Um fato relevante que decorre imediatamente de (3.60) e da Proposicao 3.1, pagina 146, e que
usaremos freq
uentemente adiante, e que se A = A1 A2 entao
det(A) = det(A1 ) det(A2 ) .
Operadores Nilpotentes
Seja V um espaco vetorial e N : V V um operador linear agindo em V . O operador N e dito ser
um operador nilpotente se existir um inteiro positivo q tal que N q = 0. O menor q para o qual N q = 0
e dito ser o ndice de N .
Vamos a alguns exemplos.

e uma matriz nilpotente de ndice 3.

0 1 0
N = 0 0 1
0 0 0

E. 3.25 Exerccio. Verifique.

0 a c
N = 0 0 b
0 0 0

com a 6= 0 e b 6= 0 e uma matriz nilpotente de ndice 3.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

E. 3.26 Exerccio. Verifique.

194/1304

0 0 0
N = 0 0 1
0 0 0

sao matrizes nilpotentes de ndice 2.

0 1 0
N = 0 0 0
0 0 0

E. 3.27 Exerccio. Verifique.

O seguinte fato sobre os autovalores de operadores nilpotentes sera usado adiante.


Proposi
c
ao 3.22 Se N Mat ( , n) e nilpotente ent
ao seus autovalores s
ao todos nulos. Isso implica
n
que seu polin
omio caracterstico e qN (x) = x , x . Se o ndice de N e q ent
ao o polin
omio mnimo
de N e mN (x) = xq , x .
2
No Corolario 3.3, pagina 200, demonstraremos que uma matriz e nilpotente se e somente se seus
autovalores forem todos nulos.
Prova da Proposicao 3.22. Se N = 0 o ndice e q = 1 e tudo e trivial. Seja N 6= 0 com ndice q > 1.
Seja v 6= 0 um autovetor de N com autovalor : N v = v. Isso diz que 0 = N q v = q v. Logo q = 0
claro entao que qN (x) = xn . Que o polinomio mnimo e mN (x) = xq segue
e, obviamente, = 0. E
do fato que mN (x) deve ser um divisor de qn (x) (isso segue do Teorema 3.1 junto com o Teorema de
Hamilton-Cayley, Teorema 3.2), pagina 158). Logo mN (x) e da forma xk para algum k n. Mas o
menor k tal que mN (N ) = N k = 0 e, por definicao, igual a q. Isso completa a prova.
Mais sobre matrizes nilpotentes sera estudado na Secao 3.7.3 onde, em particular, discutiremos a
chamada forma can
onica de matrizes nilpotentes.
O N
ucleo e a Imagem de um Operador Linear
Seja V um espaco vetorial e A : V V um operador linear agindo em V .

O n
ucleo de A e definido como o conjunto de todos os vetores que sao anulados por A:
N(A) = {x V | Ax = 0} .

A imagem de A e definida por


R(A) = {x V | y V tal que x = Ay} .
Afirmamos que N(A) e R(A) sao dois sub-espacos de V . Note-se primeiramente que 0 N(A) e
0 R(A) (por que?). Fora isso, se x e y N(A) entao, para quaisquer escalares e ,
A(x + y) = Ax + Ay = 0 ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

195/1304

provando que combinacoes lineares x+x0 tambem pertencem a N(A). Analogamente se x e x0 R(A)
entao existem y e y 0 V com x = Ay, x0 = Ay 0 . Logo
x + x0 = A(y + y 0 ) ,
provando que combinacoes lineares x + y tambem pertencem a R(A).
Para um operador A fixado, e k


, vamos definir
Nk = N(Ak )

e
Rk = R(Ak ) .
Esses sub-espacos Nk e Rk sao invariantes por A. De fato, se x Nk , entao Ak (Ax) = A(Ak x) = A0 = 0,
mostrando que Ax Nk . Analogamente, se x Rk entao x = Ak y para algum vetor y. Logo,
Ax = A(Ak y) = Ak (Ay), mostrando que Ax Rk .
Afirmamos que

e que

Nk Nk+1

(3.61)

Rk Rk+1 .

As demonstracoes dessas afirmativas sao quase banais. Se x Nk entao Ak x = 0. Isso obviamente


implica Ak+1 x = 0. Logo x Nk+1 e, portanto, Nk Nk+1 . Analogamente, se x Rk+1 entao existe y
tal que x = Ak+1 y. Logo x = Ak (Ay), o que diz que x Rk . Portanto Rk+1 Rk .
Isso diz que os conjuntos Nk formam uma cadeia crescente de conjuntos:
{0} N1 N2 Nk V ,

(3.62)

e os Rk formam uma cadeia decrescente de conjuntos:


V R1 R2 Rk {0} .

(3.63)

Consideremos a cadeia crescente (3.62). Como os conjuntos Nk sao sub-espacos de V , e claro que a
cadeia nao pode ser estritamente crescente se V for um espaco de dimensao finita, ou seja, deve haver
um inteiro positivo p tal que Np = Np+1 . Seja p o menor n
umero inteiro para o qual isso acontece.
Afirmamos que para todo k 1 vale Np = Np+k .

Vamos provar isso. Se x Np+k entao Ap+k x = 0, ou seja, Ap+1 (Ak1 x) = 0. Logo, Ak1 x Np+1 .
Dado que Np = Np+1 , isso diz que Ak1 x Np , ou seja, Ap (Ak1 x) = 0. Isso, por sua vez, afirma que
x Np+k1 . O que fizemos entao foi partir de x Np+k e concluir que x Np+k1 . Se repetirmos
a argumentacao k vezes concluiremos que x Np . Logo, Np+k Np . Por (3.61) tem-se, porem, que
Np Np+k e, assim, Np+k = Np .
Assim, a cadeia (3.62) tem, no caso de V ter dimensao finita, a forma

{0} N1 N2 Np = Np+1 = = Np+k = V .

(3.64)

Como dissemos, p sera daqui por diante o menor inteiro para o qual Np = Np+1 . O lema e o teorema
que seguem tem grande importancia na demonstracao do Teorema de Decomposicao de Jordan.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

196/1304

Lema 3.4 Com as definico


es acima, Np Rp = {0}, ou seja, os sub-espacos Np e Rp tem em comum
apenas o vetor nulo.
2
Demonstracao. Seja x tal que x Np e x Rp . Isso significa que Ap x = 0 e que existe y tal que
x = Ap y. Logo, A2p y = Ap x = 0, ou seja, y N2p . Pela definicao de p tem-se que N2p = Np . Assim,
y Np . Logo Ap y = 0. Mas, pela propria definicao de y valia que Ap y = x. Logo x = 0.
Esse lema tem a seguinte conseq
uencia importante.
Teorema 3.15 Com as definico
es acima vale que V = Np Rp , ou seja, cada x V pode ser escrito
de modo u
nico na forma x = xn + xr , onde xn Np e xr Rp .
2
Demonstracao. Seja m a dimensao de Np e seja {u1 , . . . , um } uma base em Np . Vamos estender essa
base, incluindo vetores {vm+1 , . . . , vn } de modo que {u1 , . . . , um , vm+1 , . . . , vn } seja uma base
em V . Afirmamos que {Ap vm+1 , . . . , Ap vn } e uma base em Rp . Seja x Rp e seja y V tal que
x = Ap y. Como todo vetor de V , y pode ser escrito como combinacao linear de elementos da base
{u1 , . . . , um , vm+1 , . . . , vn }:
n
m
X
X
i ui +
i v i .
y =
i=m+1

i=1

Logo,

x =

m
X

n
X

i A ui +

i A v i =

i=m+1

i=1

n
X

i A p v i .

(3.65)

i=m+1

Os vetores {Ap vm+1 , . . . , Ap vn } sao linearmente independentes. Isso se mostra com o seguinte argumento. Se existirem escalares m+1 , . . . , n tais que
n
X

i A p v i = 0 ,

i=m+1

entao teramos

n
X

Ap

i v i

i=m+1

ou seja,

n
X

i=m+1

= 0,

i v i N p .

Isso implica que existem constantes 1 , . . . , m tais que


n
X

i=m+1

i v i =

m
X

i ui ,

i=1

pois os vetores {u1 , . . . , um } sao uma base em Np . Ora, como {u1 , . . . , um , vm+1 , . . . , vn } sao linearmente independentes, segue que os i s e os j s sao todos nulos. Isso prova que {Ap vm+1 , . . . , Ap vn }
sao linearmente independentes e, portanto, por (3.65), formam uma base em Rp .

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

197/1304

Isso incidentalmente provou que a dimensao de Rp e n m. Temos, portanto, que


dim (Np ) + dim (Rp ) = dim (V ) .
Para i = m + 1, . . . , n defina-se ui = Ap vi . Afirmamos que o conjunto de vetores
{u1 , . . . , um , um+1 , . . . , un } = {u1 , . . . , um , Ap vm+1 , . . . , Ap vn }
e tambem linearmente independente e, portanto, forma uma base em V . Suponhamos que haja constantes escalares 1 , . . . , n tais que
!
n
m
n
X
X
X
0 =
i ui =
i ui + A p
i v i .
i=1

i=1

i=m+1

Isso implica, obviamente,

m
X
i=1

i ui = Ap

n
X

i v i

i=m+1

O lado esquerdo dessa igualdade e um elemento de Np (pois u1 , . . . , um sao uma base em Np ), enquanto
que o lado esquerdo e obviamente um elemento da imagem de Ap , ou seja, de Rp . Contudo, ja vimos
(Lema 3.4) que o u
nico vetor que Np e Rp tem em comum e o vetor nulo. Logo,
m
X

i ui = 0

(3.66)

i=1

n
X

i A p v i = 0 .

(3.67)

i=m+1

A relacao (3.66) implica 1 = = m = 0, pois {u1 , . . . , um } e uma base em Np . A relacao (3.67)


implica m+1 = = n = 0, pois {Ap v1 , . . . , Ap vm } e uma base em Rp . Assim, todos os i s sao
nulos, provando que {u1 , . . . , um , um+1 , . . . , un } = {u1 , . . . , um , Ap vm+1 , . . . , Ap vn } e um
conjunto de n vetores linearmente independentes.
Conseq
uentemente, todo x V pode ser escrito na forma
x =

n
X
i=1

i ui =

m
X

i ui + A p

i=1

| {z }
xn Np

n
X

i=m+1

{z

xr Rp

i v i

Provar a unicidade dessa decomposicao fica como exerccio. Isso completa a demonstracao.
Uma das coisas que o teorema que acabamos de demonstrar diz e que, dado um operador A, o
espaco V pode ser decomposto em uma soma direta de dois sub-espacos, invariantes por A: um onde
A e nilpotente, Np , e outro onde A e invertvel, Rp . A e nilpotente em Np pois Ap x = 0 para todo
elemento x de Np . A e invertvel em Rp pois se x Rp e tal que Ax = 0 isso implica x N1 Np .
Mas x so pode pertencer a Np e a Rp se for nulo. Logo, em Rp , Ax = 0 se e somente se x = 0, provando
que A e invertvel12 . Para referencia futura formulemos essa afirmativa na forma de um teorema:
12

Lembre-se que esse argumento s


o funciona em espacos vetoriais V que tenham dimens
ao finita, o que estamos supondo
aqui.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

198/1304

ao e
Teorema 3.16 Se A e um operador linear n
ao-nulo agindo em um espaco vetorial V = n ent
possvel decompor V em dois sub-espacos invariantes por A, V = S T, de forma que A restrito a S e
nilpotente, enquanto que A restrito a T e invertvel.
2
Esse sera o teorema basico do qual extrairemos a demonstracao do Teorema de Decomposicao de
Jordan.

3.7.2

O Teorema da Decomposi
c
ao de Jordan

Chegamos agora ao resultado mais importante desta secao, o Teorema da Decomposicao de Jordan 13 ,
um importante teorema estrutural sobre matrizes de importancia em varios campos, por exemplo na
teoria das equacoes diferenciais ordinarias. Para tais aplicacoes, vide Captulo 7, pagina 306.
O Teorema da Decomposicao de Jordan tambem tem certa relevancia na Teoria de Grupos, e o
usaremos para provar que toda matriz n n complexa invertvel (ou seja, todo elemento do grupo
GL( , n)) pode ser escrita como exponencial de outra matriz (Proposicao 4.11, pagina 236). No
Captulo 4 usaremos o Teorema da Decomposicao de Jordan para provar a identidade u
til det(e A ) =
eTr(A) , valida para qualquer matrix n n real ou complexa. (Proposicao 4.7, pagina 234).
Enunciado e Demonstra
c
ao do Teorema da Decomposi
c
ao de Jordan
Teorema 3.17 (Teorema da Decomposi
c
ao de Jordan) Seja A um operador linear agindo no
ao existem r
espaco V = n e seja {1 , . . . , r } o conjunto de seus autovalores distintos. Ent
sub-espacos S1 , . . . , Sr tais que V = S1 . . . Sr e tais que cada Si e invariante por A. Ou seja,
A = A1 . . . Ar , onde Ai e A restrita a Si . Fora isso, cada Ai , e da forma Ai = i i + Ni , onde i e
a matriz identidade em Si e onde Ni e nilpotente. Por fim, a dimens
ao si de cada subespaco Si e igual
a
` multiplicidade algebrica do autovalor i .
2
Demonstracao. Seja {1 , . . . , r } o conjunto dos autovalores distintos de A e seja ni a multiplicidade
algebrica do autovalor i . Seja A1 = A 1 . Pelo Teorema 3.16, pagina 198, V pode ser escrito como
V = S1 T1 , onde S1 e T1 sao invariantes por A1 , sendo A1 nilpotente em S1 e invertvel em T1 . Assim,
A1 e da forma A1 = N1 M1 com N1 nilpotente e M1 invertvel. Logo
A = 1 + A1 = (1

S1

+ N1 ) (1

T1

+ M1 ) ,

(3.68)

onde S1 e a matriz identidade em S1 etc. Vamos mostrar que a dimensao de S1 e igual a` multiplicidade
algebrica de 1 . Por (3.68) o polinomio caracterstico de A e
qA () = det( A) = det(( 1 )

S1

N1 ) det(( 1 )

T1

M1 ) .

Se qN1 denota o polinomio caracterstico de N1 , tem-se


det(( 1 )
13

S1

N1 ) = qN1 ( 1 ) = ( 1 )s1 ,

Marie Ennemond Camille Jordan (1838-1922). A forma can


onica de matrizes (que ser
a discutida mais adiante) foi
originalmente descoberta por Weierstrass (Karl Theodor Wilhelm Weierstrass (1815-1897)) e redescoberta por Jordan
em 1870.

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

199/1304

onde, na u
ltima igualdade, usamos a Proposicao 3.22, pagina 194, sobre a forma do polinomio caracterstico de uma matriz nilpotente. Da, segue que
qA () = ( 1 )s1 qM1 ( 1 ) ,
sendo qM1 o polinomio caracterstico de M1 . Como M1 e invertvel, M1 nao tem o zero como autovalor.
Logo, qM1 (0) 6= 0. Portanto s1 e igual a` multiplicidade de 1 como raiz de qA , ou seja, e igual a n1 , a
multiplicidade algebrica de 1 .
A ideia agora e prosseguir decompondo agora o operador 1
mesma maneira como fizermos acima com A.
Seja A0 = 1
A 2 T1 .
0

T1

T1

+ M1 que aparece em (3.68) da

+ M1 e que age em T1 , que e um espaco de dimensao n n1 . Definimos A2 =

Evocando novamente o Teorema 3.16, pagina 198, T1 pode ser escrito como T1 = S2 T2 , onde S2
e T2 sao invariantes por A2 , sendo A2 nilpotente em S2 e invertvel em T2 . Assim, V = S1 S2 T2 .
Agindo em T1 = S2 T2 , A2 e da forma A2 = N2 M2 com N2 nilpotente e M2 invertvel. Logo
A0 = 2

T1

+ A2 = (2

S2

+ N2 ) (2

T2

+ M2 ) .

(3.69)

Vamos, como acima, mostrar que a dimensao de S2 e igual a` multiplicidade algebrica de 2 .


Pela definicao,
A = (1

S1

+ N1 ) A0 = (1

S1

+ N1 ) (2

S2

+ N2 ) (2

T2

+ M2 ) .

Logo,
qA () = det (( 1 )

S1

N1 ) det (( 2 )

Portanto, pelos mesmos argumentos usados acima,

S2

N2 ) det (( 2 )

T2

M2 ) .

qA () = ( 1 )n1 ( 2 )s2 qM2 ( 2 ) .


Como M2 e invertvel, M2 nao tem autovalor zero e, assim, qM2 (0) 6= 0. Logo, s2 = n2 . T2 e assim um
sub-espaco de dimensao n n1 n2 .

Prosseguindo nas mesmas linhas, apos r passos chegaremos a um sub-espaco Tr de dimensao n


n1 nr = 0 (por (3.13), pagina 148). A, teremos V = S1 Sr , onde cada Si tem dimensao
ni e
A = (1 S1 + N1 ) (r Sr + Nr ) ,
onde os Ni s sao todos nilpotentes. Isso completa a demonstracao.

Um corolario importante do Teorema de Decomposicao de Jordan e o seguinte:


Teorema 3.18 Para toda matriz A Mat ( , n) existe uma matriz invertvel P Mat ( , n) tal que
P 1 AP = D + N , onde D e uma matriz diagonal formada pelos autovalores de A e N e uma matriz
nilpotente e de tal forma que D e N comutam: DN = N D.
Conseq
uentemente, toda matriz A Mat ( , n) pode ser escrita na forma A = A d + An com
Ad An = An Ad , sendo Ad diagonaliz
avel e An nilpotente, a saber, Ad = P DP 1 e An = P N P 1 , com
D e N dados acima.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

200/1304

Demonstracao do Teorema 3.18. O Teorema 3.17 esta dizendo que, numa base conveniente, A tem a
forma de blocos diagonais

1 s 1 + N 1
0

A1 0 0

0
2 s2 + N 2
0
0 A2 0

(3.70)
A = ..
,
.. . .
.. =

.
. .
..
..
..
.
.
.

.
.
.
.

0 0 Ar

0
0
r sr + N r

ou seja,

A = D+N ,
onde

1 s 1
0

0
2 s2

D = ..
. . , 1 , . . . , r , . . . , r
..
.. = diag |1 , .{z
.
.
}
| {z }
.
.
.
.
s1 vezes
sr vezes
0
0
r sr

N1 0 0
0 N2 0

N = ..
.. . .
.. .
.
. .
.
0
0 Nr

(3.71)

Acima si e a dimensao do sub-espaco Si .


facil de se ver que N e uma matriz nilpotente, pois se o ki e o ndice de Ni (ou seja, ki e o menor
E
inteiro positivo para o qual Niki = 0), entao para k := max (k1 , . . . , kr ) tem-se

(N1 )k
0

0
0
(N2 )k
0

k
N = ..
.. = 0 .
..
.
.
.
.
.
.
0
0
(Nr )k
Em verdade, k = max (k1 , . . . , kr ) e o ndice de N (por que?).
Por fim, como cada Ni comuta com i
tracao.

si ,

fica claro que D e N comutam. Isso completa a demons-

Corol
ario 3.3 Uma matriz M Mat ( , n) e nilpotente se e somente se todos os seus autovalores
forem nulos.
2
Prova. A Proposicao 3.22, pagina 194, afirma que se M e nilpotente todos os seus autovalores sao
nulos. O Teorema 3.18, pagina 199, afirma que se os autovalores de M sao nulos, entao existe P tal
que P 1 M P = N , nilpotente. Isso implica que M e nilpotente.

JCABarata. Curso de Fsica-Matem


atica

3.7.3

Vers
ao de 29 de setembro de 2005.

Captulo 3

201/1304

Matrizes Nilpotentes e sua Representa


c
ao Can
onica

Os teoremas que estudamos acima nesta secao revelam a importancia de matrizes nilpotentes. Um fato
relevante e que elas podem ser representadas de uma forma especial, denominada forma canonica, da
qual traremos logo abaixo. Antes, alguma preparacao se faz necessaria.
Seja N Mat ( , n) uma matriz nilpotente de ndice q, ou seja, N q = 0, mas N q1 6= 0. Para uso
futuro, provemos o seguinte lema:
Lema 3.5 Seja N uma matriz nilpotente de ndice q. Est
ao existe um vetor v 6= 0 tal que os q vetores
v,

N v,

N 2 v,

...,

N q1 v ,

(3.72)

s
ao linearmente independentes. Fora isso, o subespaco q-dimensional J v, q := hv, N v, N 2 v, . . . , N q1 vi
de V gerado por esses q vetores e invariante por N .
2
Prova. Se q = 1, entao N = 0 e nao ha nada a provar, pois a afirmacao e trivialmente verdadeira para
qualquer v 6= 0. Seja entao q > 1 (em cujo caso N 6= 0, trivialmente). Sabemos, por hipotese, que
a matriz N q1 e nao-nula. Isso significa que existe pelo menos um vetor v 6= 0 tal que N q1 v 6= 0.
imediato que os vetores N v, N 2 v, . . . , N q1 v sao todos nao-nulos pois,
Fixemos um tal vetor. E
se tivessemos N j v = 0 para algum 1 j < q 1, entao, aplicando-se N q1j a` esquerda, teramos
N q1 v = 0, uma contradicao.
Sejam agora 1 , . . . , q escalares tais que
1 v + 2 N v + 3 N 2 v + + q N q1 v = 0 .

(3.73)

Aplicando-se N q1 nessa igualdade e lembrando que N q = 0, conclumos que 1 N q1 v = 0. Como


N q1 v 6= 0, segue que 1 = 0 e, com isso, (3.73) fica
2 N v + 3 N 2 v + + q N q1 v = 0 .

(3.74)

Aplicando agora N q2 nessa igualdade conclumos que 2 = 0. Prosseguindo, conclumos depois de


q passos que todos os escalares j sao nulos. Isso prova que os q vetores de (3.72) sao linearmente
independentes.
Que o subespaco Jv, q definido acima e invariante por N e evidente pois, para quaisquer escalares
1 , . . . , q , tem-se

N 1 v + 2 N v + + q N q1 v = 1 N v + 2 N 2 v + + q1 N q1 v Jv, q .
O seguinte teorema e central para o que segue.
Teorema 3.19 Se N e uma matriz nilpotente de ndice q agindo em V e v um vetor com a propriedade
que N q1 v 6= 0, ent
ao existe um subespaco K de V tal que Jv, q K = {0}, tal que V = Jv, q K e tal
que K e tambem invariante por N .
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

202/1304

Prova.14 A prova e feita por inducao em q. Note-se que se q = 1, entao N = 0 e a afirmativa e trivial,
pois podemos tomar como v qualquer vetor nao-nulo, Jv, q seria o subespaco gerado por esse v e K o
subespaco complementar a v, que e trivialmente invariante por N , pois N = 0.
Vamos supor entao que a afirmacao seja valida para matrizes nilpotentes de ndice q 1 e provar
que a mesma e valida para matrizes nilpotentes de ndice q. O que desejamos e construir um subespaco
K com as propriedades desejadas, ou seja, tal que V = Jv, q K, sendo K invariante por N .

Seja V0 = R(N ) o conjunto imagem de N . Sabemos que V0 e um subespaco de V e que e invariante


por N . Fora isso, N e nilpotente de ndice q 1 agindo em V0 (por que?)
claro que N q2 v0 = N q1 v 6= 0. Assim, pelo Lema 3.72, o subespaco
Seja v0 = N v V0 . E
(q 1)-dimensional
Jv0 , q1 = hv0 , N v0 , . . . , N q2 v0 i = hN v, N 2 v, . . . , N q1 vi = JN v, q1 ,
que e um sub-espaco de V0 , e invariante por N e, da hipotese indutiva, conclumos que existe um
subespaco K0 de V0 que e invariante por N tal que JN v, q1 K0 = {0} e tal que V0 = JN v, q1 K0 .
Seja agora K1 := {x V | N x K0 }. Vamos provar a seguinte afirmacao:

I. Todo vetor x de V pode ser escrito na forma x = y + z onde y Jv, q e z K1 .

Para provar isso, notemos que para qualquer x V vale certamente que N x V0 . Portanto,
como pela hipotese indutiva V0 = JN v, q1 K0 , podemos escrever N x = y 0 + z 0 , com y 0 JN v, q1
e z 0 K0 . Como y 0 JN v, q1 , y 0 e da forma de uma combinacao linear y 0 = 1 N v + +
q1 N q1 v = N y, onde y := 1 v + 2 N v + + q1 N q2 v e um elemento de Jv, q . Logo,
z 0 = N (x y). Como z 0 K0 , segue que z := x y K1 . Assim, x = y + z, com y Jv, q e
z K1 . Isso provou I.

Note que a afirmacao feita em I nao significa que V = Jv, q K1 , pois os sub-espacos Jv, q e K1
podem ter uma interseccao nao-trivial. Tem-se, porem, o seguinte:
II. Jv, q K0 = {0}.

Provemos essa afirmacao. Seja x Jv, q K0 . Como x Jv, q , x e da forma x = 1 v + 2 N v +


+ q N q1 v. Logo N x = 1 N v + 2 N 2 v + + q1 N q1 v JN v, q1 . Agora, como x K0 e,
por hipotese, K0 e invariante por N , segue que N x K0 . Logo, N x JN v, q1 K0 . Todavia,
mencionamos acima que JN v, q1 K0 = {0}. Logo, N x = 0, ou seja, 0 = N x = 1 N v + 2 N 2 v +
+ q1 N q1 v. Como os vetores N v, . . . , N q1 v sao linearmente independentes, conclumos
que 1 = q1 = 0. Logo, x = q N q1 v. Isso significa que x JN v, q1 . Demonstramos,
entao, que se x Jv, q K0 entao x JN v, q1 K0 mas, como JN v, q1 K0 = {0}, segue que
x = 0. Isso conclui a prova de II.

III. K0 e Jv, q K1 , sao dois sub-espacos disjuntos de K1 .


evidente que Jv, q K1 e subespaco de K1 . Como K0 e
A demonstracao e muito simples. E
invariante pela acao de N , segue que se x K0 entao N x K0 . Pela definicao, isso diz que
x K1 e conclumos que K0 e um subespaco e K1 .
14

Extrada, com modificaco


es, de [54].

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

203/1304

Que K0 e Jv, q K1 sao sub-espacos disjuntos, segue do fato que


II

K0 (Jv, q K1 ) = K1 (Jv, q K0 ) = K1 {0} = {0} .


A afirmacao III implica que K1 = (Jv, q K1 ) K0 K00 para algum subespaco K00 de K1 (nao
necessariamente u
nico). Seja agora K := K0 K00 . Note que K1 = (Jv, q K1 ) K e, portanto,
(Jv, q K1 ) K = {0} .

(3.75)

Provaremos que esse K possui as propriedades desejadas, ou seja, que V = Jv, q K, sendo K invariante
por N . Isso e feito em tres passos.
1. Jv, q e K sao sub-espacos disjuntos, ou seja, Jv, q K = {0}, pois, como K K1 , segue que
K = K K1 e, portanto,
Jv, q K = Jv, q (K K1 ) = (Jv, q K1 ) K

(3.75)

{0} .

2. Jv, q K contem os vetores de Jv, q e de (Jv, q K1 )K = K1 . Por I, isso implica que Jv, q K = V .
3. K e invariante por N , pois o fato que K K1 , implica, pela definicao de K1 , que N K N K1
K0 K.
A prova do Teorema 3.19 esta completa
A principal conseq
uencia do Teorema 3.19 e a seguinte.
ao existem
Proposi
c
ao 3.23 Seja N Mat ( , n) uma matriz nilpotente de ndice q. Ent
1. um inteiro positivo r, com 1 r n,
2. r n
umeros inteiros positivos n q1 q2 qr 1, com q1 + + qr = n,
3. r vetores v1 , . . . , vr satisfazendo N qj vj = 0 mas N qj 1 vj 6= 0, j = 1, . . . , r,
tais que
V = J v1 , q1 J vr , qr .
2
Prova. Se q = 1 entao N = 0. Basta tomar r = n e escolher v1 , . . . , vn uma base qualquer em V . Os
qj s sao todos iguais a 1.
Consideremos entao q > 1 com N 6= 0. Tomemos q1 = q. Pelo Teorema 3.19, existem um vetor
v1 6= 0 e um subespaco K 1 , invariante por N tais que
V = J v1 , q1 K 1 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

204/1304

Como K 1 e invariante por N , podemos tambem dizer que a matriz N e nilpotente quando restrita
claro
a K 1 (ja que e nilpotente em todo V ). Denotemos por q2 o ndice de N quando restrita a K 1 . E
que q2 q = q1 .

Assim, podemos aplicar o Teorema 3.19 para a matriz N restrita a K 1 e concluir que existe v2 6= 0
em K 1 e um subespaco K 2 de K 1 , invariante por N , tais que K 1 = Jv2 , q2 K 2 . Note que N q2 v2 = 0,
pois v2 K 1 .
Com isso, temos

V = J v1 , q1 J v2 , q2 K 2 .

Novamente K 2 e invariante por N e, como K 2 e um sub-espaco de K 1 . O ndice de N em K 2 sera


q3 q 2 q 1 .
O espaco V tem dimensao finita. Assim, a prova se conclu repetindo o procedimento acima um
n
umero finito r de vezes. Note que N qj vj = 0, pois N q1 v1 = 0, e vj K j1 para todo j = 2, . . . , r.
Pela construcao acima, e claro que q1 + + qr = n, a dimensao de V , e que os n vetores
v1 , N v1 , . . . , N q1 1 v1 , v2 , N v2 , . . . , N q2 1 v2 , . . . , vr , N vr , . . . , N qr 1 vr
sao linearmente independentes e formam uma base em V . Vamos denota-los (na ordem em que aparecem
acima) por b1 , . . . , bn .
Note agora que, pela construcao, N bj = bj+1 , para j em cada um dos conjuntos
{1, . . . , q1 1},

{1 + q1 , . . . , q1 + q2 1},
...

{1 + q1 + q2 , . . . , q1 + q2 + q3 1} ,
{1 + q1 + + qr1 , . . . , q1 + + qr 1} , (3.76)

com l = 0, . . . , r 1, sendo que N bj = 0 para todo j na forma q1 + + ql , l = 1, . . . , r.


ltimas afirmacoes.
E. 3.28 Exerccio impotante para compreender o que segue. Justifique as u

Isso significa que na base b1 , . . . , bn os elementos de matriz de N sao todos nulos exceto aqueles na
forma Nj, j+1 com j em algum dos conjuntos listados em (3.76), em cujo caso Nj, j+1 = 1. Pictoriamente,
isso diz-nos que na base b1 , . . . , bn a matriz N assume uma forma genericamente ilustrada na Figura
3.1. Essa e a denominada forma can
onica da matriz nilpotente N ou representaca
o can
onica da matriz
nilpotente N , que descrevemos mais detalhadamente no que segue.
Os elementos da diagonal principal sao todos nulos. Os u
nicos elementos nao-nulos da matriz
podem estar localizados apenas na diagonal imediatamente acima da principal, ou seja, aquela diagonal
formada por elementos de matriz do tipo Nj, j+1 com j = 1, . . . , n 1. Chamaremos essa diagonal de
primeira supra-diagonal. Os elementos da primeira supra-diagonal podem ser 0 ou 1, da forma seguinte:
a primeira supra-diagonal possuira r fileiras. As primeiras r 1 fileiras sao formadas por q j elementos,
j = 1, . . . , n 1, sendo os primeiros qj 1 elementos iguais a 1 e o u
ltimo igual a 0. A u
ltima fileira
tera qr 1 elementos iguais a 1. Assim, se qr = 1, o u
ltimo elemento da primeira supra-diagonal sera
nulo, proveniente da (r 1)-esima fileira (essa e a u
nica forma de aparecer um zero no u
ltimo elemento
da primeira supra-diagonal).

JCABarata. Curso de Fsica-Matem


atica

205/1304

(q 1) vezes

Captulo 3

Vers
ao de 29 de setembro de 2005.

(q 1) vezes

N =
0

1
1

(q 1) vezes
r

Figura 3.1: Forma canonica tpica de uma matriz nilpotente N . Os elementos da primeira supradiagonal podem valer 0 ou 1. Todos os demais elementos de matriz sao nulos.

Note que zeros consecutivos podem ocorrer, se tivermos alguns qj s iguais a 1. Note tambem que
os elementos da primeira supra-diagonal podem ser todos nulos (o que valera se r = n, em cujo caso
q1 = = rn = 1. Isso so pode ocorrer se N = 0 e, nesse caso, q = 1) ou todos iguais a 1 (o que valera
se r = 1, em cujo caso q1 = n).

3.7.4

A Forma Can
onica de Matrizes

Finalizamos esta secao e nossa discussao sobre o Teorema da Decomposicao de Jordan e suas conseq
uencias reunindo o que descobrimos ate aqui.
Se A Mat ( , n) o Teorema 3.17, pagina 198 ensinou-nos que numa base conveniente (ou seja,

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

por uma transformacao de similaridade P01 AP0 ), toda matriz A tem

1 n1 + N 1
0

A1 0 0

0
2 n2 + N 2

0 A2 0

1
P0 AP0 = ..
. =
.. . .

.
. ..
..
..
.

.
.

0 0 Ar

0
0

206/1304

a forma de blocos diagonais:

(3.77)
,

..
..

.
.

r nr + N r

sendo 1 , . . . , r os autovalores distintos de A. O j-esimo bloco e de tamanho nj nj , sendo que nj


e a multiplicidade algebrica do autovalor j . As matrizes Nj sao nilpotentes.

Cada matriz Nj pode ser levada a` sua forma canonica Njc (tal como explicado em (3.1) e no que se
lhe segue) em uma base conveniente, ou seja, por uma transformacao de similaridade Pj1 Nj Pj . Assim,
definindo

P1 0 0
0 P2 0

P = ..
(3.78)
.. . .
.. ,
.
. .
.
0 0 Pr
vemos que P 1 (P01 AP0 )P = (P0 P )1 A(P0 P ), sendo que, por (3.77),
1
0
P1 (1 n1 + N1 ) P1

0
P21 (2 n2 + N2 ) P1

P 1 (P01 AP0 )P =

..
..

.
.

0
0

n1

+ N1c

+ N2c

0
2

n2

..
.

..
.

..

E. 3.29 Exerccio. Complete os detalhes.

..
.

.
nr

+ Nrc

..

..
.

Pr1 (r

nr

+ N r ) Pr

(3.79)

A matriz final de (3.79) e denominada forma can


onica da matriz A, ou forma can
onica de Jordan
da matriz A. Como dissemos, toda matriz A assume essa forma numa certa base. Devido ao fato de
todos as sub-matrizes nilpotentes Njc terem a forma canonica, os u
nicos elementos nao-nulos da forma
canonica da matriz A podem estar ou na diagonal principal (sendo estes os autovalores de A, cada

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

207/1304

um aparecendo em uma fileira de nj elementos), ou na primeira supra-diagonal, sendo que estes valem
apenas 0 ou 1 e seguem as regras descritas acima. Isso e ilustrado na Figura 3.2,
A Figura 3.2, mostra a forma canonica de uma matriz que possui 4 autovalores distintos 1 , 2 , 3
e 4 . A primeira supra-diagonal e formada pela seq
uencia de n
umeros
11 , . . . , 1a , 0, 11 , . . . , 1b , 0, 11 , . . . , 1c , 0, 11 , . . . , 1d ,

(3.80)

sendo que os ij assumem apenas os valores 0 ou 1, de acordo com as regras explicadas acima quando
discutimos a forma canonica de matrizes nilpotentes. Todos os elementos fora da diagonal principal e
da primeira supradiagonal sao nulos. O primeiro bloco e de dimensao (a + 1) (a + 1), o segundo bloco
e de dimensao (b + 1) (b + 1) etc., sendo a + 1 a multiplicidade algebrica de 1 , b + 1 a multiplicidade
algebrica de 2 etc.
interessante notar que na primeira supra-diagonal, sempre ocorrem zeros nos pontos localizados
E
fora dos blocos, ou seja, nos pontos onde ocorrem transicoes entre dois autovalores distintos (indicados
por setas na Figura 3.2). Esses sao os zeros que ocorrem explicitamente na lista (3.80).
Por fim, comentamos que a forma canonica nao e exatamente u
nica, pois e possvel ainda fazer
transformacoes de similaridade que permutem os blocos de Jordan da matriz. Alem disso, dentro de
cada sub-espaco invariante (onde cada bloco age) e possvel fazer certas permutacoes dos elementos da
base, de modo a preservar a diagonal e permutar os i s da primeira supradiagonal.

3.8

Algumas Representa
co
es Especiais de Matrizes

Nas secoes anteriores apresentamos algumas formas especiais de representar matrizes com determinadas
caractersticas, como aquelas expressas no Teorema Espectral e no Teorema de Jordan. Nesta secao
apresentaremos outras representacoes, relevantes em certos contextos, como a decomposicao polar.

3.8.1

A Decomposi
c
ao Polar de Matrizes

bem conhecido o fato de que todo n


E
z pode ser escrito na forma polar z = |z|e i , onde
umeroi complexo
1
|z| 0 e . Tem-se que |z| = zz e e = z|z| . Ha uma afirmacao analoga valida para matrizes
A Mat ( , n), a qual e muito u
til, e da qual trataremos nesta secao. Antes de enunciarmos esse
resultado de forma mais precisa (o Teorema da Decomposicao Polar, Teorema 3.20, abaixo), facamos
algumas observacoes preliminares.


Seja A Mat ( , n) e seja a matriz A A. Notemos primeiramente que (A A) = A A = A A, ou


seja, A A e auto-adjunta. Pelo Teorema 3.12, pagina 184, e possvel encontrar um conjunto ortonormal
{vk , k = 1, . . . , n} de autovetores de A A, com autovalores dk , k = 1, . . . , n, respectivamente, sendo
que a matriz
hh
ii
P := v1 , . . . , vn
(3.81)
(para a notacao, vide (3.1)) e unitaria e diagonaliza A A, ou seja, P (A A)P = D, sendo D a matriz
diagonal D := diag (d1 , . . . , dn ), cujos elementos da diagonal sao os autovalores de A A. Os autovalores
dk sao todos maiores ou iguais a zero. De fato, se vk 6= 0 e um autovetor de A A com autovalor dk ,

JCABarata. Curso de Fsica-Matem


atica

teremos dk kvk k2 = dk hvk , vk i


dk = kAvk k2 /kvk k2 0.

= hvk , Bvk i

= hvk , A Avk i


Captulo 3

Vers
ao de 29 de setembro de 2005.

= hAvk , Avk i


208/1304

= kAvk k2 . Logo,

Com esses fatos a` mao, vamos definir uma matriz diagonal, que denotaremos sugestivamente por
2

D , por D 1/2 := diag ( d1 , . . . , dn ). Tem-se que D 1/2 = D, uma propriedade obvia15 . Note-se


tambem que D 1/2 = D 1/2 , pois cada dk e real.

Definamos agora a matriz A A, por

A A := P D 1/2 P .
(3.82)



A A = P D 1/2 P = P D 1/2 P = A A. Observemos


Essa matriz A A e auto-adjunta, pois
2

A A = P (D 1/2 )2 P = P DP = A A. Disso segue que
que
1/2

det

A A

2

= det



A A

2 

= det(A A) = det(A ) det(A) = det(A) det(A) = | det(A)|2 .

A A = | det(A)| e, portanto, A A e invertvel se e somente se A o for.

Alguns autores denotam a matriz A A por |A|, por analogia com o modulo de um n
umero complexo. Podemos agora formular e demonstrar o resultado que procuramos:

Provamos assim que det

ao existe uma maTeorema 3.20 (Teorema da Decomposi


c
ao Polar) Seja A Mat ( , n). Ent
triz unit
aria U Mat ( , n) tal que

A = U A A .
(3.83)
Se A e invertvel, ent
ao U e univocamente determinada. A representaca
o (3.83) e denominada representacao polar de A.
2
Prova. Sejam, como acima, dk , k = 1, . . . , n os autovalores de A A com autovetores respectivos vk ,
k = 1, . . . , n. Sabemos pelo Teorema 3.12, pagina 184 que podemos escolher os vk s de forma que
hvk , vl i = k l .


Como vimos acima, os autovalores dk satisfazem dk 0. Sem perda de generalidade, vamos supo-los
ordenados de forma que dk > 0 para todo k = 1, . . . , r e dk = 0 para todo k = r + 1, . . . , n. Com essa
escolha, tem-se que
Avk = 0 para todo k = r + 1, . . . , n ,
(3.84)
pois de A Avk = 0, segue que 0 = hvk , A Avk i = hAvk , Avk i = kAvk k2 .


Para k = 1, . . . , r, sejam wk os vetores definidos da seguinte forma:


1
wk := Avk ,
dk

k = 1, . . . , r .

(3.85)

Essa n
ao e a u
nica matriz com essa propriedades, pois qualquer matriz do tipo diag ( d1 , . . . , dn ), com os
sinais escolhidos independentemente uns dos outros, tambem tem como quadrado a matriz D.
15

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

209/1304

facil ver que


E
hwk , wl i


1
hAvk , Avl i
dk dl


1
hA Avk , vl i
dk dl


dk
=
hvk , vl i
dk dl


dk
=
k l = k l ,
dk dl

para todos k, l = 1, . . . , r. Assim, o conjunto de vetores {wk , k = 1, . . . , r} forma um conjunto


ortonormal. A eles podemos acrescentar um novo conjunto {wk , k = r + 1, . . . , n}, escolhido arbitrariamente, de vetores ortonormais pertenentes ao complemento ortogonal do sub-espaco gerado por
{wk , k = 1, . . . , r} e construir assim, um conjunto ortonormal {wk , k = 1, . . . , n}.
Sejam agora a matriz P , definida em (3.81) e as seguintes matrizes de Mat ( , n):
hh
ii
Q := w1 , . . . , wn ,
U := QP

(para a notacao, vide (3.1)). Como {vk , k = 1, . . . , n} e {wk , k = 1, . . . , n} sao dois conjuntos
ortonormais, segue que P e Q sao matrizes unitarias (por que?) e, portanto, U tambem e unitaria.


facil ver que AP = QD 1/2 , onde D 1/2 = diag


d1 , . . . , dn , De fato,
E
AP

(3.81)

hh
ii
A v1 , . . . , vn

(3.4)

(3.84)

(3.85)

(3.6)

hh

Av1 , . . . , Avn

ii

hh

Av1 , . . . , Avr 0, . . . , 0

ii

hh

ii
w1 , . . . , wn D 1/2 = QD 1/2 .

hhp
ii
p
d1 w1 , . . . , dr wr 0, . . . , 0

(3.82)
Agora, de AP = QD 1/2 , segue que A = QD 1/2 P = U P D 1/2 P = U A A, que e o que queramos
provar.
Para mostrar
determinado se A for
invertvel, suponhamos que exista U 0

que U e univocamente
0

tal que A = U A A = U A A. Como comentamos


A A e invertvel se e somente se A
acima,

o for. Logo, se A e invertvel, a igualdade U A A = U 0 A A implica U = U 0 , estabelecendo a


unicidade. Caso A nao seja invertvel a arbitrariedade de U reside na escolha dos vetores ortogonais
{wk , k = r + 1, . . . , n}.
O seguinte corolario e elementar:
Teorema 3.21 Seja A Mat ( , n). Ent
ao existe uma matriz unit
aria V Mat ( , n) tal que

A = AA V .
(3.86)
Se A e invertvel, ent
ao V e univocamente determinada.

) A = U
(A
AA para alguma matriz
Prova. Para a matriz
A
,
(3.83)
diz-nos
que
A
=
U
0
0

unitaria U0 . Como AA e auto-adjunta, segue que A = AA U0 . Identificando V = U0 , obtemos o


que desejamos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

210/1304

O Teorema da Decomposicao Polar pode ser generalizado para abranger operadores limitados agindo
em espacos de Hilbert (vide Teorema 26.22, pagina 1182) e mesmo para abranger operadores naolimitados agindo em espacos de Hilbert (vide [103]).

3.8.2

O Teorema da Triangulariza
c
ao de Schur

O teorema que apresentamos abaixo, devido a Schur16 , e semelhante, mas nao identico, ao Teorema de
Jordan: toda matriz de Mat ( , n) pode ser levada por uma transformacao de similaridade induzida
por uma matriz unitaria a uma matriz triangular superior (para a definicao, vide Secao 3.6, pagina
190). Esse teorema e alternativamente denominado Teorema da Triangularizaca
o de Schur ou Teorema
da Decomposica
o de Schur. Como veremos, esse teorema pode ser usado para fornecer uma outra
demonstracao (eventualmente mais simples) da diagonalizabilidade de matrizes auto-adjuntas e de
matrizes normais por matrizes unitarias.
Teorema 3.22 (Teorema da Decomposi
c
ao de Schur) Seja A Mat ( , n). Ent
ao existe U

Mat ( , n), unit


aria, e S Mat ( , n), triangular superior, tais que A = U SU . Os elementos da
diagonal de S s
ao os autovalores de A.
2
Antes de provarmos esse teorema, mencionemos um corolario evidente:
ao existe V Mat ( , n), unit
aria, e I Mat ( , n),
Corol
ario 3.4 Seja A Mat ( , n). Ent

triangular inferior, tais que A = V IV . Os elementos da diagonal de I s


ao os autovalores de A.
2
Prova do Corolario 3.4. Pelo Teorema 3.22, a matriz A pode ser escrita da forma A = V SV , com V
unitaria e S triangular superior. Logo, A = V S V . Porem, S I e triangular inferior.

Tambem pelo Teorema 3.22, os autovalores de A sao os elementos diagonais de S, que sao o
complexo conjugado dos elementos diagonais de S I. Mas os autovalores de A sao o complexo
conjugado dos autovalores de A (pela Proposicao 3.16, pagina 181) e, portanto, sao os elementos
diagonais de I.

Prova do Teorema 3.22. Comecemos observando que se A = U SU com U unitario, entao A e S tem o
mesmo polinomio caracterstico e, portanto, os mesmos autovalores, incluindo a multiplicidade (vide a
discuss
ao em torno de (3.15), pagina 149). Mas o polinomio caracterstico de S e p S (x) = det(x S) =
Qn
(x
Skk ), pois S e triangular superior e, portanto, os autovalores de S sao os elementos de sua
k=1
diagonal. Passemos a` demonstracao da afirmativa principal, ou seja, que A = U SU com U unitario e
S triangular superior.
16

Issai Schur (1875-1941).

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

211/1304

Seja n 2hhe v1 um autovetor


de A com autovalor 1 e kv1 k = 1. Seja U (1) uma matriz unitaria da
ii
(1)
(1)
(1)
forma U (1) = u1 , . . . , un com u1 = v1 , ou seja, cuja primeira coluna e o vetor v1 . Entao,
AU

(1)

h
h
i
i
h
h
i
i
0
(3.4)
(1)
(1)
(1)
=
Au1 , . . . , Au(1)
= 1 u1 , Au2 , . . . , Au(1)
= U (1)
n
n
..
.
0

(1)

(1)

..
.

b1
(1)
a11
..
.

(1)

(1)

a(n1)1 a(n1)(n1)

(1)

para certos bk e akl , k, l = 1, . . . , n 1, onde


(1)

Auk

(1) (1)

= b k u1 +

n1
X

(1) (1)

alk ul+1 ,

(1)

bn1
(1)
a1(n1)
..
.

k = 2, . . . , n .

(3.87)

l=1

Para simplificar a notacao, definimos


(1)

b1
0
..
..
(1)
b
= . ,
n1 = . ,
(1)
0
bn1
n1

(1)
(1)
a11

a1(n1)

..
..
= ...
,
.
.
(1)
(1)
a(n1)1 a(n1)(n1)

A(1)

tendo n 1 linhas) e escrevemos a identidade (3.87) como



T
1 b(1)
(1)
(1)
.
U AU
=
(1)
n1 A

(3.88)

Para n = 2 isso demonstra o teorema, pois afirma que


U

(1)

(1)

1 b 1
(1)
0 a11

AU (1) =

sendo o lado direito uma matriz triangular superior. Para n > 2 procedemos por inducao. Supondo a
afirmacao valida para matrizes (n 1) (n 1), entao existe uma matriz unitaria V Mat ( , n 1)
tal que V A(1) V = S (1) ,sendo S (1) triangular superior. Assim, definindo a matriz unitaria U (2)
T
1
n1
Mat ( , n) por U (2) :=
, teremos por (3.88),
V
n1


U (1) U (2) AU (1) U (2) = U (2) U (1) AU (1) U (2)


=

n1

n1

n1

T
n1



1
n1

T 
V T b(1)
V A(1) V
V T b(1)
S (1)

T 

T

b(1)
A(1)

T
n1

n1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

212/1304

que e triangular superior, pois S (1) o e. Como U (1) U (2) e unitaria (pois U (1) e U (2) o sao), o teorema
esta provado.
Coment
ario. Toda matriz triangular superior S pode ser escrita na forma D + N , sendo D a matriz
diagonal formada pela diagonal de S (ou seja, Dii = Sii para todo i = 1, . . . , n) e N e nilpotente (pois
e triangular superior, mas com diagonal nula). Assim, o Teorema 3.22 afirma que toda matriz A pode
ser levada a` forma D + N por uma transformacao de similaridade unitaria. Porem, o Teorema 3.22 nao
garante (nem e verdade, em geral) que D e N comutem. Assim, o Teorema 3.22 e distinto do Teorema
de Jordan, Teorema 3.18, pagina 199.
O Teorema 3.22 tem por corolario o seguinte teorema, ja provado anteriormente por outros meios
(Teorema 3.12, pagina 184, e Proposicao 3.18, pagina 186).
Teorema 3.23 Uma matriz A Mat ( , n) e auto-adjunta, se e somente se for diagonaliz
avel por
uma transformaca
o de similaridade unit
aria e se seus autovalores forem reais.
2
Prova. Pelo Teorema 3.22, existe uma matriz unitaria U tal que U AU = S, sendo S triangular superior
cujos elementos diagonais sao os autovalores de A. Assim, se A = A , segue que S = (U AU ) =
U A U = U AU = S. Mas para uma matriz triangular superior S, a igualdade S = S implica que S
e diagonal e os elementos da diagonal sao reais.
Reciprocamente, se A Mat ( , n) e diagonalizavel por uma transformacao de similaridade unitaria
e seus autovalores sao reais, ou seja, existe U unitaria e D diagonal real com U AU = D, entao
A = U DU e A = U D U . Como D e diagonal e real, vale D = D e, portanto, A = U DU = A,
provando que A e auto-adjunta.
Pelo Teorema 3.22, se A Mat ( , n) e uma matriz normal e U AU = S, com U unitaria e S
triangular superior, entao S e normal (justifique!). Assim, junto com o Lema 3.3, pagina 191, provamos
o seguinte:
Teorema 3.24 Uma matriz A Mat ( , n) e normal se e somente se for diagonaliz
avel por uma
transformaca
o de similaridade unit
aria.
2
Essas afirmacoes foram demonstradas por outros meios no Teorema 3.14, pagina 187.

3.8.3

A Decomposi
c
ao QR e a Decomposi
c
ao de Iwasawa (KAN)

O proposito desta secao e apresentar a chamada decomposica


o de Iwasawa 17 , ou decomposica
o KAN 18 ,
de matrizes invertveis, Teorema 3.26. Esse teorema tem relacao com a teoria dos grupos de Lie, como
17

Kenkichi Iwasawa (1917-1998).


Infelizmente n
ao h
a uniformidade na literatura quanto a
` denominaca
o dessa decomposica
o. Vamos cham
a-la de
decomposica
o de Iwasawa pois a mesma e um caso particular (para o grupo GL( , n) das matrizes complexas n n
invertveis) de um teorema mais geral da teoria dos grupos de Lie, denominado Teorema da Decomposica
o de Iwasawa,
que afirma que todo elemento g de um grupo de Lie semi-simples pode ser escrito como produto de um elemento k de
um sub-grupo compacto maximal, por um elemento a de um subgrupo Abeliano (real) e por um elemento n de um
sub-grupo nilpotente (ou seja, cuja a
lgebra de Lie e nilpotente): g = kan. Em Alem
ao, as palavras compacto, Abeliano e
18

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

213/1304

discutiremos brevemente ao final. Os dois primeiros resultados preparatorios abaixo, Proposicao 3.24
e Teorema 3.25 (Decomposicao QR), tem interesse por si so.
Proposi
c
ao 3.24 Seja R Mat ( , n) uma matriz triangular superior cujos elementos diagonais s
ao
n
ao-nulos (i.e., R e invertvel). Ent
ao, podemos escrever R = AN , onde A Mat ( , n) e a matriz
diagonal formada com a diagonal de R: A = diag (R11 , . . . , Rnn ), e N Mat ( , n) e uma matriz
triangular superior cujos elementos diagonais s
ao iguais a 1.
2
facil constatar que (abaixo m n 1)
Prova. E

R12

1 R11
R11 0
0
R11 R12 R1n

..
.
.
.
0 R22 . .
0 R22 . .
0 0 1
R2n

.
.
.
..
..
..
..
..
..
. ... ...

..
..
R =
.
.
.
.
.
.
..
..
= ..

..
..
..
0
0
. Rmm 0 0
. Rmm Rmn
.
0
0
Rnn
0
0
Rnn
0
|
{z
}|
{z

..
1
0

R1n
R11
R2n
R22

..
.
.

Rmn

Rmm

O estudante deve comparar as afirmacoes do teorema a seguir com o Teorema da Decomposicao


Polar, Teorema 3.20, pagina 208, e com o Teorema da Decomposicao de Schur, Teorema 3.22, pagina
210.
Teorema 3.25 (Teorema da Decomposi
c
ao QR) Seja M Mat ( , n) uma matriz invertvel.
Ent
ao M pode ser escrita na forma M = QR, onde Q Mat ( , n) e unit
aria e R Mat ( , n) e
triangular superior, sendo que os elementos diagonais de R s
ao estritamente positivos.


Prova do Teorema 3.25. Seja M = m1 , . . . , mn . Como M e invertvel, os vetores mk , k =
1, . . . , n, sao linearmente independentes, ou seja, formam uma base em n . Podemos, portanto, usar
o procedimento de ortogonalizacao de Gram19 -Schmidt20 e construir uma nova base ortonormal de
vetores qj , j = 1, . . . , n, a partir dos vetores ml , l = 1, . . . , n. Tais vetores sao definidos por

m1
q1 =
,
km1 k

mj

j1
X

hql , mj i ql


l=1
,
qj =
j1


X


hql , mj i ql
m j

j = 2, . . . , n .

l=1

nilpotente s
ao Kompakt, Abelsch e Nilpotent, da a denominaca
o decomposica
o KAN para essa decomposica
o,
denominaca
o essa encontrada em alguns textos.
19
Jrgen Pedersen Gram (1850-1916).
20
Erhard Schmidt (1876-1959).

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

214/1304

Como e facil verificar, tem-se hqi , qj i = i j para todos i, j = 1, . . . , n. As relacoes acima implicam
trivialmente
j1

j1

X
X


j = 2, . . . , n ,
m1 = q1 km1 k ,
m j = q j m j
hql , mj i ql +
ql hql , mj i ,




l=1

l=1

relacoes estas que podem ser escritas em forma matricial como

R11 hq1 , m2 i

0
R22

hh
ii
hh
ii
.
..
m1 , . . . , mn = q1 , . . . , qn R , onde R :=
.
..

com
R11 = km1 k ,

Rjj



j1


X


hql , mj i ql ,
= m j




..

..

..

..

. R(n1)(n1)

hq1 , mn i

hq2 , mn i

..
,
.

hqn1 , mn i

Rnn
(3.89)


j = 2, . . . , n .

l=1

E. 3.30 Exerccio. Convenca-se da validade da relacao (3.89).



Definindo Q := q1 , . . . , qn , a relacao (3.89) diz-nos que M = QR, sendo R triangular superior
(como se ve) e Q unitaria (pois os vetores ql , l = 1, . . . , n, sao ortonormais). Isso completa a prova do
Teorema 3.25.
Chegamos assim ao importante Teorema da Decomposicao de Iwasawa para matrizes invertveis:
Teorema 3.26 (Teorema da Decomposi
c
ao de Iwasawa, ou Decomposi
c
ao KAN ) Seja M
Mat ( , n) uma matriz invertvel. Ent
ao M pode ser escrita de modo u
nico na forma M = KAN ,
onde K Mat ( , n) e uma matriz unit
aria, A Mat ( , n) e a uma matriz diagonal, tendo elementos
diagonais estritamente positivos, e N Mat ( , n) e uma matriz triangular superior cujos elementos
diagonais s
ao iguais a 1.
2
Prova. A afirmacao que M pode ser escrita na forma M = KAN , com K, A e N com as propriedades
acima segue imediatamente da Proposicao 3.24 e do Teorema 3.25, dispensando demonstracao. O u
nico
ponto a se demonstrar e a unicidade dessa decomposicao.
Vamos entao supor que para algum M Mat ( , n) existam K, K0 Mat ( , n), matrizes
unitarias, A, A0 Mat ( , n), matrizes diagonais, tendo elementos diagonais estritamente positivos, e
N, N0 Mat ( , n) matrizes triangulares superiores cujos elementos diagonais sao iguais a 1, tais que
M = KAN = K0 A0 N0 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

215/1304

Segue imediatamente disso que K01 K = A0 N0 N 1 A1 . O lado esquerdo dessa igualdade e uma
matriz unitaria e, portanto, normal. O lado direito e uma matriz triangular superior (pela Proposicao
3.21, pagina 190). Pelo Lema 3.3, pagina 191, A0 N0 N 1 A1 deve ser uma matriz diagonal D. Assim,
temos que K01 K = D e A0 N0 N 1 A1 = D. A primeira dessas relacoes diz-nos que D e unitaria.
1
A segunda diz-nos que N0 N 1 = A1
e diagonal (por
0 DA, ou seja, N0 = D0 N , onde D0 := A0 DA
ser o produto de tres matrizes diagonais). Agora, N e N0 sao matrizes triangulares superiores cujos
elementos diagonais sao iguais a 1. Portanto, a relacao N0 = D0 N com D0 diagonal so e possvel se
D0 = (de outra forma haveria elementos na diagonal de N ou de N0 diferentes de 1), estabelecendo
que N = N0 .
1
Provamos, assim, que A1
ao diagonais, tendo na
0 DA = , ou seja, D = A0 A . Agora, A e A0 s
diagonal n
umeros reais positivos. Logo, D tambem e diagonal e tem na diagonal n
umeros reais positivos

e, portanto, D = D . Como D e unitaria (como observado linhas acima), segue que D 2 = . Logo,
os elementos Dkk da diagonal de D satisfazem Dkk = 1, para todo k = 1, . . . , n (os sinais podendo
ser distintos para ks distintos). Agora, como A0 = DA e como A e A0 tem na diagonal n
umeros reais
uentemente, K = K0
positivos, nao podemos ter Dkk = 1 para algum k e, portanto, D = . Conseq
e A = A0 , estabelecendo a unicidade desejada.

Note o leitor que o conjunto das matrizes unitarias de Mat ( , n) forma um sub-grupo de GL( , n)
(o grupo das matrizes complexas n n invertveis). O conjunto das matrizes diagonais de Mat ( , n)
tendo elementos diagonais estritamente positivos e igualmente um sub-grupo de GL( , n). Por fim,
o conjunto das matrizes triangulares superiores de Mat ( , n) cujos elementos diagonais sao iguais
a 1 e tambem um sub-grupo de GL( , n). Assim, o Teorema 3.26 afirma que cada elemento de
GL( , n) pode ser escrito de modo u
nico como produto de elementos de cada um desses tres subgrupos. Esse e um caso particular de um teorema da teoria dos grupos de Lie conhecido como Teorema
da Decomposica
o de Iwasawa.

3.9
3.9.1

Propriedades Especiais de Determinantes


Expans
ao do Polin
omio Caracterstico

P
Seja A Mat ( , n) e seja pA () = det( A) = nm=0 cm m , , seu polinomio caracterstico.
Desejamos obter uma formula explicita para os coeficientes cm em termos de determinantes de submatrizes de A (vide abaixo). Vamos designar por ak a k-esima coluna de A, de sorte que, pela notacao
introduzida em (3.1), pagina 143, vale A = a1 , . . ., an . Recordando as defini
 cao de base canonica
(3.2) e (3.3), pagina 143, fica claro que pA () = det e1 a1 , . . . , en an . Usando a propriedade
de multilinearidade do determinante (linearidade em relacao a cada coluna), segue que
!
n
ii
hh
X
X
+ (1)n det(A) ,
pA () =
(1)nm m
det a1 , . . . , ej1 . . . , ejm . . . , an
m=1

1j1 <<jm n



onde, para 1 j1 < < jm n, a1 , . . . , ej1 . . . , ejm . . . , an e a matriz obtida a partir da matriz
A substituindo sua jl -esima coluna por ejl para cada l = 1, . . . , m. Note que no caso
 m = n, tem-se

forcosamente jl = l para cada l = 1, . . . , n e a1 , . . . , ej1 . . . , ejm . . . , an = e1 , . . . , en = .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

216/1304

Com isso, escrevemos


pA () = n +

n1
X

(1)nm m

det a1 , . . . , ej1 . . . , ejm . . . , an

1j1 <<jm n

m=1

hh

ii

+ (1)n det(A) .

Como cada vetor-coluna ejl contem 1 na jl -esima linha, as demais linhas sendo nulas, as bemconhecidas regras de calculo de determinantes ensinam-nos que, para todo m = 1, . . . , n 1,

hh
ii

det a1 , . . . , ej1 . . . , ejm . . . , an = det Aj1 , ..., jm ,

Aj1 , ..., jm sendo a matriz de Mat ( , nm) (ou seja (nm)(nm)) obtida a partir de A eliminando-lhe
as jl -esimas linhas e colunas para todo l = 1, . . . , m. Assim, obtemos
!
n1


X
X
pA () = n +
(1)nm m
det Aj1 , ..., jm
+ (1)n det(A) ,
(3.90)
m=1

1j1 <<jm n

onde e possvel reconhecer os coeficientes de pA ().


Pelo Teorema de Hamilton-Cayley, Teorema 3.2, pagina 158, pA (A) = e, portanto,
!
n1


X
X
Am + (1)n det(A) = .
An +
(1)nm
det Aj1 , ..., jm
m=1

1j1 <<jm n

Como comentamos em (3.23), pagina 161, se A for invertvel, obtem-se disso


#
!
"
n1


X
X
1
Am1 .
det Aj1 , ..., jm
(1)nm
A1 =
An1 +
(1)n+1 det(A)
m=1
1j <<j n
1

3.9.2

(3.91)

A Desigualdade de Hadamard

Vamos nesta secao demonstrar uma desigualdade para determinantes de matrizes, a qual e muito u
til,
21
a chamada desigualdade de Hadamard .
Teorema 3.27 (Teorema do Determinante de Hadamard) Seja A Mat ( , n). Ent
ao,
| det(A)|2

n
n X
Y
j=1 i=1

|Aij |2 ,

sendo Aij o elemento ij da matriz A. Segue disso que para toda matriz A Mat ( , n) vale

n
n/2
.
| det(A)| n
max |Aij |
ij

(3.92)

(3.93)
2

21

Jacques Salomon Hadamard (1865-1963). A referencia ao trabalho de Hadamard e: J. Hadamard, Resolution dune
question relativ aux determinants, Bull. Sci. Math. 28, 240-246 (1893).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3

217/1304

O importante na estimativa (3.93) e o tipo de dependencia em n que se tem do lado direito. Ela
sera usada, por exemplo, em estimativas de convergencia da serie de determinantes de Fredholm na
Secao 12.7, pagina 634.
Prova do Teorema 3.27. A prova de (3.93) e elementar, por (3.92). Passemos a` prova de (3.92).
Seja A Mat ( , n). Se A nao tem inversa, entao det(A) = 0 e a desigualade (3.92) e trivialmente
satisfeita, nao havendo o que se provar. Vamos entao supor que A tenha inversa.
Seja A o conjunto de todas as matrizes M de Mat ( , n) com a propriedade que
n
X
i=1

|Mij | =

n
X
i=1

|Aij |2

tambem claro que A e um subconjunto compacto


para todo j = 1, . . . , n. Claro esta que A A. E
2
de Mat ( , n) (visto aqui como n ). A funcao | det(M )| e contnua como funcao de M e, portanto,
assume ao menos um maximo absoluto (nao necessariamente u
nico) em A, por este ser compacto
(teorema de Weierstrass). Seja T A um desses maximos. Note-se que | det(T )| | det(A)| > 0 e,
portanto, T tem inversa.
n
X
Para todo i = 1, . . . , n vale por (3.9), pagina 145, que det(T ) =
Tij Cof(T )ij , onde Cof(T ),
j=1

chamada de matriz dos cofatores de T , foi definida a` pagina 144. Seja fixo esse i. Pela desigualdade
de Cauchy-Schwarz, vale
!
! n
!
! n
n
n
X
X
X
X
|Cof(T )ij |2 .
(3.94)
|Aij |2
|Cof(T )ij |2 =
|Tij |2
| det(T )|2
j=1

j=1

j=1

Au
ltima igualdade sendo devida ao fato que T A.
Como e bem sabido, para o produdo escalar ha, bi :=

n
X

j=1

ak bk , a desigualdade de Cauchy-Schwarz

k=1

|ha, bi| kakkbk e uma igualdade se e somente se os vetores a e b forem proporcionais. Assim, tem-se
a igualdade em (3.94) se e somente se existir i tal que Tij = i Cof(T )ij para todo j, ou seja, se a
i-esima linha de T for proporcional a` i-esima linha de Cof(T ).
O ponto importante agora e notar que se se tivermos a desigualdade estrita
!
! n
n
X
X
|Cof(T )ij |2 ,
| det(T )|2 <
|Aij |2
j=1

(3.95)

j=1

entao T nao pode maximizar o modulo de determinante entre as matrizes de A. De fato, considere a
matriz T 0 que e igual a` matriz T , exceto sua i-esima linha, que e dada por
X
1/2
n
2
|Aij |

j=1
0
Cof(T )ij ,
Tij :=
n
X

|Cof(T )ij |2
j=1

JCABarata. Curso de Fsica-Matem


atica

claro que
j = 1, . . . , n. E

n
X
j=1

|Tij0 |2

Vers
ao de 29 de setembro de 2005.

n
X
j=1

Captulo 3

218/1304

|Aij |2 ,

o que mostra que T 0 A (para as demais linhas T 0 concide com T e nao ha o que provar, pois T A).
n
X
0
Fora isso, det(T ) =
Tij0 Cof(T )ij , pois Cof(T 0 )ij = Cof(T )ij , ja que T 0 e T so diferem na i-esima
j=1

linha. Assim,

n
X

1/2

|Aij |

j=1
0

det(T ) = n

2
|Cof(T )ij |

n
X
j=1

|Cof(T )ij |2 =

n
X
j=1

|Aij |2

!1/2

n
X
j=1

|Cof(T )ij |2

!1/2

j=1

e conclumos por (3.95) que teramos | det(T )| < det(T 0 ), contrariando a hipotese que | det(T )| e
maximo. Assim, devemos ter a igualdade em (3.94) e, pelos comentarios de acima, isso implica que
existe i
tal que Tij = i Cof(T )ij para todo j, ou seja, a i-esima linha de T e proporcional a`
i-esima linha de Cof(T ). Como i e arbitrario, isso vale para todo i.
Agora, como as linhas de T sao proporcionais a`s de Cof(T ), segue que
det(T ) =

n
X

Tij Cof(T )ij

j=1

n
n
1 X
1 X
2
=
|Tij | , =
|Aij |2
i j=1
i j=1

e pela multilineaidade do determinante, que


det(T ) = det(T ) = 1 n det(Cof(T )) .
Dessas duas relacoes extramos
det(T )

n X
n
n
n
Y
det(Cof(T )) Y X
1
2
|Aij | =
=
|Aij |2 .
1 n i=1 j=1
det(T ) i=1 j=1

Como a relacao (3.11) vale para qualquer matriz invertvel, tem-se det(Cof(T )) = det(T ) n1 e,
n X
n
Y
2
portanto, | det(T )| =
|Aij |2 . Por construcao, T maximiza | det(T )| em A. Como A A, segue
que

i=1 j=1

| det(A)|2
Isso prova o teorema.

n X
n
Y
i=1 j=1

|Aij |2 .

(3.96)

JCABarata. Curso de Fsica-Matem


atica

3.10

Vers
ao de 29 de setembro de 2005.

Captulo 3

219/1304

Exerccios Adicionais

E. 3.31 Exerccio. a) Determine o polinomio caracterstico da matriz

5 2
7
A = 0 2 3i 5i .
0
0
1 4i
b) Verifique explicitamente a validade do Teorema de Hamilton-Cayley para a matriz A.
c) Usando o Teorema de Hamilton-Cayley calcule A1 .
6
E. 3.32 Exerccio. Repita o exerccio anterior para as matrizes

2
1
3
2
1
3
i ,
i .
A1 = 0 4 + i
A2 = 0 4 + i
0
0
2 7i
0
0
2 7i
E. 3.33 Exerccio. Considere em

o seguinte produto escalar


hu, vip =

n
X

ua v a p a ,

a=1

onde pa > 0 para a = 1, . . . , n. Seja uma matriz A, com elementos de matriz A ij . Mostre que, com o
produto escalar h, ip o elemento de matriz (Ap )ij da adjunta Ap da matriz A e dado por
(Ap )ij =

pj
Aji .
pi

(3.97)

(Lembre-se que Ap e definida de sorte que hu, Avip = hAp u, vip para todos u, v

).

E. 3.34 Exerccio. Para a matriz adjunta definida em (3.97), verifique a validade das regras (A p )p = A
e (AB)p = B p Ap , para quaisquer matrizes A, B Mat ( , n). Calcule p .
6
E. 3.35 Exerccio. Mostre que para quaisquer u, v n vale hu, vip = hu, P vi , onde hu, vi =
Pn
e o produto escalar usual em n e P = diag (p1 , . . . , pn ). Conclua disso que Ap = P 1 A P ,
a=1 ua va

onde A e a adjunta usual: (A )ij = Aji .


6



4 i/2
E. 3.36 Exerccio. Determine os autovalores da matriz A =
. Essa matriz nao e auto2i
5
adjunta em relacao ao produto escalar usual em 2 , mas possui autovalores reais. Justifique esse fato
mostrando, pelos exerccios anteriores, que A e auto-adjunta em relacao ao produto escalar hu, vi p =

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 3


220/1304


4 i/2
2u1 v1 + u2 v2 /2. Mostre a adjunta A em relacao a esse produto escalar e A =
= A e
2i
5
constate explicitamente que hu, Avip = hAu, vip para todos u, v 2 . Determine os autovetores de A e
constate que os mesmos sao ortogonais em relacao ao produto escalar h, i p .
6
p

JCABarata. Curso de Fsica-Matem


atica

Captulo 3

Vers
ao de 29 de setembro de 2005.

0
a

221/1304

Figura 3.2: Forma canonica de uma matriz com 4 autovalores distintos 1 , 2 , 3 e 4 . Os s


assumem apenas os valores 0 ou 1, de acordo com as regras explicadas acima. Todos os elementos fora
da diagonal principal e da primeira supradiagonal sao nulos. As setas indicam zeros que ocorrem na
primera supradiagonal nos pontos onde ocorre transicao entre os blocos, conseq
uencia do fato de esses
elementos estarem fora dos blocos.

Captulo 4

T
opicos de Algebra
Linear II
Conte
udo
4.1

Uma Topologia M
etrica em Mat ( , n) . . . . . . . . . . . . . . . . . . . . . 223

4.2

Exponenciais, Logaritmos e Fun


co
es Analticas de Matrizes . . . . . . . . 228
4.2.1

A Exponenciacao de Matrizes e os Grupos GL( , n) e GL( , n) . . . . . . . 236




4.3

A F
ormula de Lie-Trotter e a F
ormula do Comutador . . . . . . . . . . . 239

4.4

Aplica
co
es Lineares em Mat ( , n) . . . . . . . . . . . . . . . . . . . . . . . . 242

4.5

A F
ormula de Baker, Campbell e Hausdorff . . . . . . . . . . . . . . . . . 248

4.6

A F
ormula de Duhamel e Algumas de suas Conseq
u
encias

. . . . . . . . 254

presente captulo diferencia-se do anterior por explorar aspectos mais topologicos de algebras
de matrizes. Portanto, uma certa familiaridade com as nocoes basicas de espacos metricos
(vide Captulo 16) e u
til. Discutiremos a definicao de funcoes analticas de matrizes, em
particular, a exponencial e o logaritmo. Nosso principal objetivo, porem, e provar as seguintes
relacoes: para matrizes A, B Mat ( , n), valem:
F
ormula de Lie-Trotter1 :

exp (A + B) = lim

exp



m
1
1
A exp
B
.
m
m

(4.1)

F
ormula do comutador:









m2
1
1
1
1
exp ([A, B]) = lim exp
.
A exp
B exp A exp B
m
m
m
m
m

(4.2)

Serie de Lie:

X
1
[B, [B, . . . , [B , A] .
exp(B)A exp(B) = A +
|
{z
}
m!
m=1
m vezes
F
ormula de Baker-Campbell-Hausdorff2 (sobre a convergencia, vide comentario adiante):


1
1
1
exp(A) exp(B) = exp A + B + [A, B] + [A, [A, B]] + [B, [B, A]] + .
2
12
12

F
ormula de Duhamel3 :
exp(A + B) = exp(A) +

1
0



exp (1 s)(A + B) B exp sA ds ,

da qual se obtem a serie de Duhamel:


"
Z t
Z t Z t1 Z
X
t1 A
t1 A
t(A+B)
tA

e
Be dt1 +
e
= e
+
0

m=2

m
tm1 Y

k=1

etk A Betk


A

222

(4.4)

(4.5)
#

dtm dt1 . (4.6)

Marius Sophus Lie (1842-1899). Hale Freeman Trotter (1931-).


Henry Frederick Baker (1866-1956). John Edward Campbell (1862-1924). Felix Hausdorff (1868-1942).
3
Jean Marie Constant Duhamel (1797-1872).
2

(4.3)

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

223/1304

A serie dentro da exponencial no lado direito de (4.4) e um tanto complexa, mas envolve apenas
comutadores m
ultiplos de A e B. A expressao completa encontra-se em (4.46), pagina 249. Ao contrario
das formulas que lhe precedem e sucedem, a formula de Baker-Campbell-Hausdorff nao e valida para
quaisquer matrizes A e B pois, no caso geral, a convergencia da serie do lado direito so pode ser
estabelecida para matrizes suficientemente pequenas, a saber, tais que kAk e kBk sejam ambas

menores que 21 ln 2 22 0, 12844 . . . (a definicao da norma operatorial k k de matrizes sera


apresentada adiante). Claro e que, nos casos felizes em que os comutatores m
ultiplos das matrizes A e
B se anulam a partir de uma certa ordem, a serie do lado direito sera finita e, portanto, convergente.


Comentamos ao leitor mais avancado que as expressoes acima (e suas demonstracoes abaixo) valem
nao apenas para algebras de matrizes, mas tambem no contexto mais geral de algebras- de Banach.
As formulas acima sao empregadas em varias areas da Fsica (como na Mecanica Quantica, na
Mecanica Estatstica e na Teoria Quantica de Campos) e da Matematica (como na Teoria de Grupos).
Faremos uso delas, por exemplo, nos Captulos 13 e 14. Suas provas serao apresentadas, pela ordem,
na Proposicao 4.12, pagina 239, na Proposicao 4.13, pagina 244, no Teorema 4.1 da Secao 4.5, pagina
248 e na Secao 4.6, pagina 254. A u
nica demonstracao que se pode classificar como complexa e a da
formula de Baker-Campbell-Hausdorff, as demais sao simples. No correr das paginas seguintes outras
identidades u
teis, nao listadas acima, serao obtivas.

4.1

Uma Topologia M
etrica em Mat ( , n)

Discutiremos nesta secao uma topologia metrica natural em Mat ( , n) a qual usaremos na Secao 4.2
para definir certas funcoes analticas de matrizes, tais como a exponencial e o logaritmo.
Recordando, Mat ( , n) e o conjunto de todas as matrizes complexas nn e GL( , n) Mat ( , n)
e o conjunto de todas as matrizes complexas n n invertveis. Como ja observamos, GL( , n) e um
grupo.
Normas de Matrizes. A Norma Operatorial
, dotado de uma norma k kV . Para
Seja V um espaco vetorial de dimensao finita, como n ou np
3 u = (u1 , . . . , un ), por exemplo, podemos adotar kuk n := |u1 |2 + + |un |2 . Vamos denotar
bem sabido que L(V ) e igualmente
por L(V ) o conjunto de todas as aplicacoes lineares de V em V . E
n
n
um espaco vetorial. Por exemplo, L( ) = Mat ( , n) e L( ) = Mat ( , n).


Com uso da norma de V e possvel definir uma norma tambem em L(V ). Para A L(V ) define-se
kAkL(V ) := sup
uV
u6=0

E. 4.1 Exerccio.
6

kAukV
.
kukV

Mostre que k kL(V ) assim definida e, de fato, uma norma no espaco vetorial L(V ).

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

224/1304

Observaca
o. Note que
kAkL(V ) =

sup kAukV .

uV
kukV =1

Para A L(V ), a norma kAkL(V ) definida acima e denominada norma operatorial. Como comentaremos abaixo, ha outras normas em L( n ) e L( n ) que nao a norma operatorial, mas que sao
equivalentes a`quela.
uma conseq
Observaca
o. E
uencia imediata da definicao de norma operatorial que


kAukV kAkL(V ) kukV

(4.7)

para todo vetor u V .

A norma operatorial tem a seguinte propriedade importante: para A, B L(V ) quaisquer, tem-se
kABkL(V ) kAkL(V ) kBkL(V ) .

E. 4.2 Exerccio importante. Mostre isso. Sugestao: use (4.7).

Observaca
o. Em Mat ( , n) e possvel provar que kA kMat ( , n) = kAkMat ( , n) . Vide Teorema
26.11, pagina 1144.
importante comentar que o procedimento de construcao de normas em L(V ) pode ser repetido.
E
Como L(V ) e igualmente um espaco vetorial normado e de dimensao finita, podemos definir uma norma
em L(L(V )) (o conjunto de todas as aplicacoes lineares de L(V ) em L(V )) definindo para A L(L(V ))


kAkL(L(V )) :=

sup
AL(V )
A6=0

kAAkL(V )
.
kAkL(V )

E assim por diante para todos os espacos de aplicacoes L(L( L(V )) ).

Vamos a um exemplo. Tomemos V = n , L(V ) = Mat ( , n). Seja uma matriz X Mat ( , n)
fixa. Com ela poderemos definir um elemento denotado por ad[X] de L(Mat ( , n)) por
ad[X]A := [X, A] = XA AX,

A Mat ( , n).

evidente que ad[X] e uma aplicacao linear de Mat ( , n) em Mat ( , n), ou seja, um elemento de
E
L(Mat ( , n)). Note-se que
kad[X]kL(Mat (


, n))

sup
AL(V )
A6=0

kXA AXkMat (
kAkMat ( , n)

, n)


kXAkMat ( , n) + kAXkMat (
kAkMat ( , n)


sup
AL(V )
A6=0

2kXkMat (

, n)

, n)

(4.8)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

225/1304

Daqui para a frente denotaremos a norma operatorial de matrizes em n por k k ou simplesmente


por k k. Alem da norma operatorial, ha outras normas que podem ser definidas em L( n ). Para
A Mat ( , n) podemos, por exemplo, definir as seguintes normas:


kAk :=
kAk1 :=

|Aab |,

max

a, b = 1, ..., n
n X
n
X
a=i b=1

(4.9)

|Aab |,

kAk2 :=

n X
n
X

kAkp :=

n X
n
X

a=i b=1

a=i b=1

(4.10)

|Aab |2

!1/2

|Aab |p

!1/p

(4.11)

com p 1.

(4.12)

A expressao (4.12) generaliza (4.10) e (4.11).

E. 4.3 Exerccio. Mostre que (4.9)-(4.12) de fato definem normas em Mat ( , n). (Note que (4.10)(4.11) sao casos particulares de (4.12)). Use a desigualdade de Minkowski (pagina 860) para (4.12).
6
E. 4.4 Exerccio. A norma (4.11) tem uma interpretacao interessante. Mostre que,
hA, Bi = Tr (A B),

A, B Mat ( , n),

define um produto
Mat ( , n). Mostre que (4.11) e a norma associada a esse produto escalar,
pescalar em p
ou seja, kAk2 = hA, Ai = Tr (A A).
6

importante lembrar o Teorema 2.7, mencionado a` pagina 122, que afirma que em
Observaca
o. E
espacos vetoriais de dimensao finita todas as normas sao equivalentes. Assim, em Mat ( , n) a norma
operatorial kAk e as normas kAk e kAkp com p 1 sao todas equivalentes. Note-se, porem, que
a propriedade da norma operatorial kABk kAk kBk nao e necessariamente compartilhada por
outras normas. Em geral, tem-se kABk ckAk kBk para alguma constante c > 0.


E. 4.5 Exerccio. Seja D Mat ( , n) uma matriz diagonal: D = diag (d1 , . . . , dn ) com dk .
Mostre que kDk = max{|d1 |, . . . , |dn |}, ou seja, para matrizes diagonais kDk = kDk .
6


Equival
encia entre normas matriciais
Aqui denotaremos a norma operatorial de uma matriz A por kAk.

Sejam ei , i = 1, . . . , n os vetores da base canonica de n , ou seja, os vetores cuja j-esima


componente e (ei )j = ij . Se A Mat ( , n), e claro que a i-esima componente do vetor Aej e
(Aej )i = Aij . Da,
n
X
kAej k2
=
|Aij |2 .
2
kej k
i=1


JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

226/1304

Logo, para todo j,


kAvk2
kAk2 := sup

kvk2
v n


v6=0

kAej k2
max
=
j=1, ..., n kej k2


max

j=1, ..., n

n
X
i=1

|Aij |2

(4.13)

Pn
Tem-se tambem o seguinte. Para qualquer vetor v n , vale (Av)i =
j=1 Aij vj . Assim, pela
desigualdade de Cauchy-Schwarz (2.15), pagina 121,
!
!
! n
n
n
X
X
X
2
2
2
2
|Aij |
kvk2 .
|vk |
=
|Aij |
|(Av)i |


j=1

j=1

k=1

Da,
n
X

kAvk2 =


Logo,

i=1

|(Av)i |2

n X
n
X
i=1 j=1

|Aij |2

kvk2 .


n X
n
X
kAvk2

|Aij |2 .
kAk := sup
kvk2
v n
i=1 j=1
2

(4.14)

v6=0

Como

n
X
i=1

|Aij |2 max

i=1, ..., n


|Aij |2 , segue de (4.13) que
kAk2

max

max |Aij |2 .

j=1, ..., n i=1, ..., n

Logo, para todo i, j vale |Aij | kAk, ou seja,


kAk kAk.
De (4.14) vemos tambem que
kAk2

n X
n
X
i=1 j=1

|Aij |2

n X
n
X
i=1 j=1

kAk2 = n2 kAk2 .

Conclumos assim que em Mat ( , n)


kAk kAk nkAk .

(4.15)

A expressao (4.15) mostra-nos que caso tenhamos uma seq


uencia de matrizes A m com kAm k 0
quando m , entao cada elemento de matriz (Am )ij tambem converge a zero quando m . E
vice-versa: Se (Am )ij 0 para todos ij quando m , entao kAm k 0 quando m .
Nota. Antes de prosseguirmos, comentemos tambem que as duas desigualdades (4.15) sao optimais,
ou seja, nao podem ser melhoradas para matrizes genericas. Por exemplo, e evidente que k k = 1
e que k k = 1. Assim, pelo menos nesse caso tem-se a igualdade na primeira desigualdade de (4.15).
Ha tambem um caso em que se tem a igualdade na segunda desigualdade de (4.15). Considere-se a

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

227/1304

matriz M cujos elementos de matriz sao todos iguais a 1, ou seja, Mij = 1 para todos i, j. Seja o
elementar ver
vetor u de n cujas componentes sao todas iguais a 1, ou seja, ui = 1 para todo i. E
kM uk
que M u = nu. Logo
= n. Portanto, kM k n e kM k = 1. Assim, kM k nkM k e, da
kuk
segunda desigualdade de (4.15), conclumos que, nesse caso, kM k = nkM k .


A desigualdade (4.14) significa que kAk kAk2 . Ao mesmo tempo, a desigualdade (4.13) mostra
que
n
n X
n
X
X
2
2
nkAk =
kAk
|Aij |2 = kAk22 .
j=1

j=1 i=1

Logo, conclumos que em Mat ( , n)

1
kAk2 kAk kAk2 .
n

(4.16)

E. 4.6 Exerccio. Mostre que em Mat ( , n)


1
kAk1 kAk nkAk1 .
n2
n
X

Sugest
ao: Mostre primeiro que kAk

i, j=1

(4.17)

|Aij | n2 kAk ou seja

kAk kAk1 n2 kAk .


e, entao, use (4.15).

(4.18)
6

E. 4.7 Exerccio. Mostre que as desigualdades (4.18) tambem nao podem ser melhoradas.

Nota. As expressoes (4.15), (4.16), (4.17) e (4.18) mostram-nos de modo explcito que em Mat ( , n)
as normas kk, kk, kk1 e kk2 sao equivalentes (vide definicao a` pagina 122). Como ja mencionamos,
em espacos de dimensao finita todas as normas matriciais sao equivalentes.
*
A importancia de se introduzir uma norma em L(V ) e que podemos dessa forma introduzir uma
nocao de distancia entre elementos desse conjunto, ou seja, podemos definir uma metrica em L(V )
por d(A, B) = kA Bk. Deixamos para o leitor a tarefa de demonstrar que isso de fato define uma
metrica em L(V ). Com isso, fazemos de L(V ) um espaco dotado de uma topologia metrica. Fora
isso, o importante Teorema 26.2 demonstrado a` pagina 1122 afirma que L(V ) sera um espaco metrico
completo se V o for. Logo, como n e n sao sabidamente espacos vetoriais completos, assim o serao
possvel dessa forma falar de convergencia de
Mat ( , n), Mat ( , n), assim como L(Mat ( , n)) etc. E
seq
uencias e series de matrizes de Mat ( , n), Mat ( , n), assim como de elementos de L(Mat ( , n))
etc. Abaixo faremos uso repetido desse fato fundamental.


JCABarata. Curso de Fsica-Matem


atica

4.2

Captulo 4

Vers
ao de 29 de setembro de 2005.

228/1304

Exponenciais, Logaritmos e Fun


co
es Analticas de Matrizes

No estudo da teoria de grupos e em outras areas e muito conveniente definir certas funcoes de operadores
lineares, tais como exponenciais, logaritmos etc. Ja abordamos a definicao da exponenciacao de matrizes
nos captulos 3 e 7. Vamos aqui tentar uma abordagem mais geral.
S
eries de Pot
encias de Matrizes
Seja A Mat ( , n) uma matriz n n complexa e seja {am m
complexos. A expressao

am Am = lim

m=0

N
X

m=0

} uma seq
uencia de n
umeros

am Am = a 0 + a 1 A + a 2 A2 + a 3 A3 +

e dita ser uma serie de potencias convergente, caso o limite acima exista em Mat ( , n).
Nota. Adotaremos sempre a convencao que A0 = .
A seguinte proposicao e fundamental:
Proposi
c
ao 4.1 A seria de potencias

am A e convergente se

m=0

m=0

A importancia dessa proposicao reside no fato que


mais simples de lidar.
Prova. Sejam as somas parciais SN :=

N
X

m=0

|am | kAkm < .




|am |kAkm e uma serie numerica e, portanto,




am Am . Teremos para M < N ,

m=0

kSN SM k




N

X

m
am A
=


m=M +1

N
X

m=M +1

|am | kAkm .


P
PN
m
m
Agora, como a serie numerica
|a
|
kAk
converge,
s
:=
e uma seq
uencia de
m
N
m=0 |am | kAk
m=0
PN
m
Cauchy. Logo m=M +1 |am | kAk pode ser feito menor que qualquer  > 0 dado, desde que escolhamos
M e N grandes o suficiente. Logo SN e tambem uma seq
uencia de Cauchy no espaco metrico completo
Mat ( , n). Portanto, SN converge em Mat ( , n) quando N .


Fun
co
es Analticas de Matrizes
A Proposicao 4.1 conduz a` seguinte definicao. Seja r > 0 e Dr = {z | |z| < r} o disco aberto
de raio r centrado em 0 no plano complexo. Seja f : Dr uma funcao analtica em Dr . Como bem
sabemos, f pode ser expressa em termos de uma serie de potencias (serie de Taylor centrada em z 0 = 0):

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

229/1304

P
m
bem sabido tambem que essa serie e absolutamente
f (z) =
onde fm = f (m) (0)/m!. E
m=0 fm z ,P

m
convergente em Dr : m=0 |fm | |z| < , se |z| < r. Podemos entao definir
f (A) :=

fm Am

m=0

para toda a matriz A com kAk < r, pois a proposicao acima garante que a serie de matrizes do lado
direito converge a alguma matriz de Mat ( , n), que denotamos por f (A), fazendo uma analogia obvia
com a funcao numerica f .


A seguinte proposicao sobre essas funcoes de matrizes sera freq


uentemente usada no que seguira.
Proposi
c
ao 4.2 I. Sejam f e g duas funco
es analticas no mesmo domnio D r . Definamos (f +
g)(z) := f (z) + g(z) e (f g)(z) := f (z)g(z), z Dr . Ent
ao, para A Mat ( , n) com kAk < r
teremos f (A) + g(A) = (f + g)(A) e f (A)g(A) = g(A)f (A) = (f g)(A).


II. Sejam f e g duas funco


es analticas, com domnios Drf e Drg , respectivamente, e tais que a
imagem de g esteja contida no domnio de f . Podemos ent
ao definir f g(z) := f (g(z)). Ent
ao, para
A Mat ( , n) com kAk < rg teremos f (g(A)) = f g(A).
2


Prova. Exerccio.

Note-se que a parte I da proposicao acima afirma que existe um homomorfismo da algebra das
funcoes analticas em um domnio Dr e Mat ( , n).

Vamos mais adiante usar o seguinte resultado, que essencialmente afirma que as matrizes f (A)
definidas acima, com f analtica em um domnio Dr , dependem continuamente de A.

Proposi
c
ao 4.3 Seja f funca
o complexa anal
tica em um domnio Dr , com f tendo a serie
P

k
de Taylor absolutamente convergente f (z) =
em Bm , m , uma
k=0 fk z , |z| < r. Seja tamb
seq
uencia de matrizes de Mat ( , n) tais que limm kBm k = 0. Ent
ao, para todo A Mat ( , n)
com kAk < r tem-se
lim f (A + Bm ) = f (A).


2
Prova. Comecemos com um comentario sobre o enunciado do teorema. Para que f (A + B m ) esteja
definido e necessario que kA + Bm kC < r. Como kA + Bm kC kAk + kBm k e kAk < r, a condicao
e satisfeita para m grande o suficiente, pois limm kBm k = 0. Assim, estaremos supondo que m e
grande o suficiente de modo que kBm k <  para algum  tal que kAk +  < r. Feita essa ressalva,
passemos a` demonstracao.


A prova da proposicao segue como conseq


uencia das duas observacoes seguintes. A primeira e que
para quaisquer matrizes X, Y Mat ( , n) e qualquer k inteiro positivo tem-se a seguinte identidade
algebrica:
k1
X
k
k
X Y =
X p (X Y ) Y k1p .
(4.19)
p=0

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

230/1304

Para provar isso, basta expandir a soma do lado direito e mostrar, apos alguns cancelamentos, que
obtem-se o lado esquerdo (faca!).
observacao e que se f e analtica em Dr , sua
derivada tambem o e. Assim, f 0 (z) =
P
PA segunda
k1
k1
< sempre que |z| < r.
converge absolutamente para |z| < r, ou seja,
k=0 k|fk | |z|
k=0 kfk z
Assim,

f (A + Bm ) f (A) =

k=0

Usando (4.19) com X = A + Bm e Y = A, teremos


f (A + Bm ) f (A) =

X
k=0



fk (A + Bm )k Ak .

k1
X
fk
(A + Bm )p Bm Ak1p .
p=0

Logo,
kf (A + Bm ) f (A)k


kBm k


X
k=0

|fk |

k1
X
p=0

kA + Bm kp kAkk1p .


Agora, como dissemos, kA + Bm k < kAk +  < r e, obviamente, kAk < kAk +  < r. Portanto,


kf (A + Bm ) f (A)k


kBm k


X
k=0

|fk |

k1

X
X
(kAk + )k1 = kBm k
k|fk | (kAk + )k1 .


p=0

k=0

Como comentamos acima, a soma do lado direito e finita. Como, porem, kBm k 0 para m ,
teremos limm kf (A + Bm ) f (A)k = 0, que e o que queramos provar.


Exponenciais e Logaritmos de Matrizes


Com as definicoes apresentadas acima, podemos definir exponenciais e logaritmos de matrizes.
Temos,

X
1 m
A
exp(A) e :=
A
(4.20)
m!
m=0
para toda matriz A Mat ( , n), pois a serie de Taylor da funcao exponencial converge absolutamente
em todo o plano complexo.
Analogamente, podemos definir

X
(1)m1 m
ln( + A) =
A
m
m=1

(4.21)

para toda matriz A Mat ( , n) com kAk < 1, pois a serie de Taylor da funcao ln(1 + z) converge
absolutamente em D1 .


Nota. Para kA k < 1 podemos definir ln(A) por ln(A) := ln( + (A )).


JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

231/1304

E. 4.8 Exerccio.
Usando a Proposicao 4.2, mostre que (exp(A)) m = exp(mA) para toda matriz
A Mat ( , n) e todo m . Mostre tambem que
exp(ln( + A)) =

+A

para toda matriz A Mat ( , n) com kAk < 1 e que




ln (exp(B)) = B
para toda matriz B Mat ( , n) com k exp(B) k < 1.


Note que

k exp(B) k


X
1 m


=
B
m=1 m!

X
1

kBkm = ekBk 1.
m!
m=1


Assim, a condicao k exp(B) k < 1 e satisfeita se kBk < ln 2.




Sobre a exponencial de matrizes temos o seguinte:


Proposi
c
ao 4.4 Existe uma bola aberta Br (0) de raio r > 0 centrada em 0 em Mat ( , n) tal que
a aplicaca
o exp : Mat ( , n) Mat ( , n) definida acima e um homeomorfismo (em verdade, um
difeomorfismo) entre Br (0) e sua imagem, exp(Br (0)), a qual e uma vizinhanca aberta da matriz
identidade .
2
Prova. Temos que, para todo A Mat ( , n), exp(A)

X
1 m
= A + (A), onde (A) :=
A .E
m!
m=2

facil ver que k(A)k


0 para kAk 0. exp(A) e contnua e diferenciavel em uma vizinhanca de 0
kAk
(em verdade, em toda parte) e sua derivada em 0 e a identidade. A afirmacao da Proposicao 4.4 segue
entao do bem conhecido Teorema da Aplicacao Inversa (vide, por exemplo, [88]).
Junto com o u
ltimo exerccio, isso prova a seguinte proposicao:
Proposi
c
ao 4.5 Para toda matriz A Mat ( , n) com kA k < 1 tem-se


exp(ln(A)) = A.
Para toda matriz B Mat ( , n) com kBk < ln 2 tem-se


ln (exp(B)) = B.

(4.22)
2

Exponenciais de Matrizes. Comutatividade


Para dois n
umeros complexos z e w e bem conhecida a validade da propriedade exp(z) exp(w) =
exp(z + w) da funcao exponencial. Podemos nos perguntar: sera essa propriedade valida tambem

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

232/1304

para matrizes? A resposta e que em geral tal relacao n


ao e valida, apenas em certos casos especiais.
A questao de determinar o produto de exponenciais de matrizes tem grande importancia em varias
manipulacoes algebricas e muito do que seguira abordara esse problema.
Lembremos a primeiramente a seguinte proposicao.
Proposi
c
ao 4.6 Se A, B Mat ( , n) s
ao duas matrizes que comutam, ou seja, AB = BA, ent
ao
eA+B = eA eB = eB eA .

(4.23)
2

A propriedade (4.23) e familiar quando A e B sao n


umeros, mas nao e obvia quando A e B sao
matrizes. De fato a relacao acima e geralmente falsa caso A e B sejam matrizes que nao comutam.
No caso em que A e B nao comutam o produto eA eB pode ser computado com uso da formula de
Baker-Campbell-Hausdorff, discutida na Secao 4.5, pagina 248.
Prova de (4.23). Pela definicao
e

A+B

X
X
1
1
m
(A + B) =
(A + B)m ,
+
m!
m!
m=0
m=1

onde convencionamos que (A + B)0 = . Como A e B comutam, vale a regra do binomio de Newton4
m  
X
m p mp
m
(A + B) =
AB
.
p
p=0
E. 4.9 Exerccio. Por que? Vale a regra do binomio de Newton no caso de A e B nao comutarem?
Teste alguns exemplos.
6
Assim,
e

A+B

 
X
m
X
m
X
X
1
1 m p mp
A B
=
=
Ap B mp .
m! p
(m p)!p!
m=0 p=0
m=0 p=0

Agora, vale a seguinte regra de mudanca de ordem de somas:


X
m
X

m=0 p=0

( ) =

p=0 m=p

( ).

E. 4.10 Exerccio. Por que?

Logo,
eA+B
4

X
1
1 p
p mp
=
AB
=
A
(m

p)!p!
p!
p=0 m=p
p=0

Isaac Newton (1643-1727).

1
B mp
(m

p)!
m=p

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

233/1304

Agora, com a mudanca de variavel l = m p,

X
1 l
1
mp
B
=
B = eB .
(m p)!
l!
m=p

l=0

Assim,
e

A+B

Analogamente se prova que eA+B = eB eA .

X
1 p B
A e = e A eB .
=
p!
p=0

*
Podemos nos perguntar: o que ocorre se A e B nao comutarem? Ha alguma maneira de calcular
exp(A + B) em termos de produtos de exp(A) e exp(B) nesse caso? A resposta a essas questoes e dada
por tres formulas muito importantes, a formula de Lie-Trotter, a formula do comutador e a formula de
Baker-Campbell-Hausdorff, das quais trataremos mais adiante.
Algumas Propriedades de Fun
co
es Analticas de Matrizes
Os exerccios seguintes, os quais sao muito simples de provar, apresentam afirmativas freq
uentemente
usadas sobre funcoes analticas de matrizes.
E. 4.11 Exerccio. Usando a definicao (4.20), mostre que
P 1 exp(A)P = exp P 1 AP
para matrizes n n reais ou complexas A e P , sendo P invertvel.

(4.24)
6

E. 4.12 Exerccio. Usando a definicao (4.20), mostre que



exp(A)T = exp AT
e que
exp(A) = exp (A )

para A Mat ( , n) ou A Mat ( , n).




Os exerccios acima podem ser facilmente generalizados:


E. 4.13 Exerccio. Seja f (z) :=

m=0

fm z m uma serie de potencias convergente para |z| < r0 para algum

r0 > 0. Entao para A Mat ( , n) com kAk < r0 tem-se

m=0

fm A

!T

m=0

fm A


T m

m=0

fm A

m=0

fm (A )m ,

JCABarata. Curso de Fsica-Matem


atica

ou seja, f (A) = f A
Prove tambem que

Captulo 4

Vers
ao de 29 de setembro de 2005.

e f (A) = f (A ), onde f (z) :=

234/1304

fm z m = f (z). Prove essas afirmativas.

m=0

fm A

m=0

ou seja, P 1 f (A)P = f (P 1 AP ).

P =

fm P 1 AP

m=0

m

,
6

Tambem muito u
til e a afirmacao contida no seguinte exerccio:
E. 4.14 Exerccio. Sejam f (z) =

fm z m e g(z) =

m=0

gm z m duas series de potencias convergentes

m=0

em |z| < r1 e |z| < r2 , respectivamente. Sejam A e B Mat ( , n) duas matrizes com kAk < r 1 e
kBk < r2 tais que AB = BA. Entao f (A)g(B) = g(B)f (A). Prove isso.
6
O Determinante de Exponenciais de Matrizes
O Teorema de Decomposicao de Jordan (Teorema 3.18, pagina 199) permite-nos demonstrar o
seguinte resultado muito u
til sobre o determinante de exponenciais de matrizes.
Proposi
c
ao 4.7 Seja A Mat ( , n) ou A Mat ( , n). Ent
ao vale que

det eA = eTr(A) .


(4.25)
2

suficiente que provemos (4.25) para matrizes complexas primeiro, pois matrizes reais podem ser
E
obtidas de matrizes complexas do limite quando a parte imaginaria dos elementos de matriz vai a zero
e a continuidade, tanto do lado direito quanto do lado esquerdo de (4.25) em relacao aos elementos de
matriz de A, garante a validade daquela expressao para matrizes reais tambem.
Para a prova precisamos de um lema preparatorio simples.
Lema 4.1 Se D Mat ( , n) e uma matriz diagonal complexa n n, ent
ao
det eD

= eTr(D) .

Igualmente, se N Mat ( , n) e uma matriz nilpotente complexa n n, ent


ao
det eN

= eTr(N ) = 1.
2

Prova. A parte referente a` matriz diagonal e a mais facil. Suponhamos que D e a matriz diagonal
D = diag (d1 , . . . , dn ), sendo que os elementos da diagonal sao os autovalores de D. Segue que eD

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

235/1304



e a matriz diagonal D = diag ed1 , . . . , edn . Assim, pela Proposicao 3.2, pagina 148, det eD =
ed1 ++dn = eTr(D) .
Tratemos agora da parte referente a` matriz nilpotente N . Iremos provar provar que se N e nilpotente
todos os autovalores de eN sao iguais a 1. Pela Proposicao 3.22, pagina 194, os autovalores de N sao
todos nulos, Assim, se e um autovetor de N teremos eN = , ou seja, e autovetor de eN com
autovalor 1. Infelizmente isso nao nos permite concluir diretamente que todos os demais autovetores
de eN tem a mesma propriedade, mas, como veremos, isso e verdade.
Vamos supor que o ndice de N seja k, ou seja, N k+1 = 0. Assim,
e

k
X
1 m
+
N .
m!
m=1

Seja 6= 0 um autovetor de eN com autovalor e suponhamos que 6= 1. De eN = tem-se


k
X
1 m
( 1) =
N
m!
m=1

(4.26)

e, assim, aplicando N k a ambos os lados, conclumos que

( 1)N k = 0,

ja que no lado direito aparecem potencias como N k+1 , N k+2 etc., todas nulas. Como 6= 1, devemos
ter N k = 0. Retornando a (4.26), podemos reescreve-la como
k1
X
1 m
( 1) =
N
m!
m=1

eliminando o termo com N k . Aplicando N k1 a ambos os lados, conclumos que


( 1)N k1 = 0,

ja que no lado direito aparecem potencias como N k , N k+1 etc., todas nulas. Como 6= 1, devemos
ter N k1 = 0. Prosseguindo dessa forma concluiremos por fim que N = 0. Assim, eN = = ,
provando que = 1, uma contradicao.
A conclus
ao e que todos os autovalores de eN sao iguais a 1, e pela Proposicao 3.2, pagina 148,

det eN = 1. Notemos que, pela Proposicao 3.22, pagina 194, os autovalores de N sao todos nulos e,
assim, Tr(N ) = 0. Logo, det eN = 1 = eTr(N ) . Isso completa a prova do lema.

Prova da Proposi
c
ao 4.7. Pelo Teorema de Decomposicao de Jordan, existe uma matriz invertvel
T tal que A = T 1 (D + N )T , onde D e diagonal, N e nilpotente e DN = N D. Logo,

eA = exp T 1 (D + N )T = T 1 exp(D + N )T = T 1 exp(D) exp(N )T.

Portanto,

det eA

= det T 1 eD eN T






= det T 1 det eD det eN det (T ) = det eD det eN ,

pois det (T 1 ) = 1/ det (T ). Assim, pelo Lema 4.1, pela Proposicao 3.7 e pela propriedade (3.16),

1
det eA = eTr(D) eTr(N ) = eTr(D+N ) = eTr(T (D+N )T ) = eTr(A) ,
completando a prova.

JCABarata. Curso de Fsica-Matem


atica

4.2.1

Vers
ao de 29 de setembro de 2005.

Captulo 4

236/1304

A Exponencia
c
ao de Matrizes e os Grupos GL( , n) e GL( , n)


Recordemos que GL( , n) (respectivamente, GL( , n)) designa o grupo das matrizes invertveis
complexas (reais) n n. Aqui discutiremos a relacao entre a exponenciacao de matrizes e esses grupos.
Essa discussao tera um papel mais relevante quando tratarmos da teoria dos grupos de Lie e algebras
de Lie nos Captulos 13 e 14.


Em primeiro lugar, tem-se a seguinte proposicao elementar:


Proposi
c
ao 4.8 A aplicaca
o exp definida em (4.20) e uma aplicaca
o de Mat ( , n) em GL( , n)
(ou, correspondentemente, de Mat ( , n) em GL( , n)).
2


evidente pela definicao (4.20) que exp(0) = . Tudo o que se deseja provar e que para
Prova. E
qualquer A Mat ( , n) entao exp(A) e invertvel. Ora, por (4.23), e elementar constatar que
exp(A)1 = exp(A).
Tem-se tambem o seguinte:
Proposi
c
ao 4.9 Para n 2 as aplicaco
es exp : Mat ( , n) GL( , n) e exp : Mat ( , n)
GL( , n) n
ao s
ao injetoras.
2


Prova. Para matrizes complexas, basta constatar que, no exemplo das matrizes diagonais na forma
D = diag (2k1 i, . . . , 2kn i, ) com kl , tem-se exp(D) = .


0 1
Para matrizes reais, considere-se a matriz real A() := J onde J :=
, . Como
1 0
facilmente se ve, tem-se para m , A()2m = (1)m ()2m e A()2m+1 = (1)m ()2m+1 J. Da,
como facilmente se verifica por (4.20),


cos
sen
exp(A()) = cos() + sen ()J =
.
sen cos


Logo, exp(A(2k)) = para todo k . Assim a exponenciacao de matrizes reais 2 2 nao pode ser
facil, a partir desse exemplo, construir outros para matrizes reais n n com n 2.
injetora. E
Agora veremos duas proposicoes nas quais as matrizes reais e complexas se diferenciam.
Proposi
c
ao 4.10 As aplicaco
es exp : Mat ( , n) GL( , n), n 1, n
ao s
ao sobrejetoras.

Proposi
c
ao 4.11 As aplicaco
es exp : Mat ( , n) GL( , n), n 1, s
ao sobrejetoras.

Prova da Prop. 4.10. Pela Proposicao 4.25, o determinante da exponencial de qualquer matriz real e
positivo. Ora, existem em GL( , n) matrizes com determinante negativo. Logo, a exponenciacao de
matrizes reais nao pode ser sobrejetora.


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

237/1304

Coment
ario. Sobre matrizes reais e possvel dizer mais que o enunciado da Proposicao 4.10 e sua
prova. Em verdade, nao sao apenas as matrizes com determinante negativo que estao fora da imagem
da exponenciacao de matrizes reais. Ha algumas com determinante positivo que tambem estao fora.
Se M e uma matriz real invertvel entao seus autovalores sao as razes do polinomio caracterstico
p(x) = det(x M ). Como M e real, esse polinomio tem coeficientes reais e, como e bem sabido, as
razes de polinomios com coeficientes reais ou sao n
umeros reais ou sao pares de n
umeros complexos
complexo-conjugados
uns dos outros. Por exemplo, as razes do polinomio caracterstico da matriz


0 1
sao i. De qualquer forma, uma matriz com determinante positivo pode, digamos, ter duas
1 0
razes negativas distintas simples, como e, por exemplo, o caso da matriz

1 0
0
0 1 0 .
(4.27)
0 0 2
Isso posto, estudemos os autovalores das matrizes da forma eA com A real. Esses sao as razes do
polinomio caracterstico p(x) = det(x eA ). Como toda matriz real e tambem membro de Mat ( , n)
podemos aplicar o Teorema da Decomposicao de Jordan (Teorema 3.18, pagina 199) e afirmar que
existe uma matriz invertvel complexa P tal que P 1 AP = D + N com D diagonal, N nilpotente,
DN = N D, sendo que D tem na diagonal os autovalores da matriz real A. Assim, pela propriedade
do determinante,

p(x) = det(x eA ) = det P 1 (x eA )P = det(x eD eN ).

facil de ver da5 que os autovalores de eA sao os elementos da diagonal da matriz diagonal eD , que
E
sao, como comentamos acima, exponenciais dos autovalores da matriz real A. Podemos nos perguntar:
podem os elementos da diagonal de eD serem n
umeros negativos? A resposta e sim, mas para isso e
necessario que A tenha um autovalor complexo cuja parte imaginaria seja da forma (2k + 1), com k
inteiro. Ora, como A e real, existe pelo que comentamos acima, um outro autovalor complexo de A cuja
parte imaginaria e da forma (2k + 1), pois os autovalores complexos aparecem em pares complexoconjugados. Isso diz-nos que os autovalores negativos de eA tem multiplicidade par! Ora, isso nem
sempre e o caso para matrizes invertveis, como mostra o exemplo do u
ltimo paragrafo. Assim, matrizes
reais com determinante positivo e com pelo menos um autovalor negativo com multiplicidade mpar
nao estao na imagem da exponencial de nenhuma matriz real. Tal e o caso da matriz de (4.27). Em
verdade, mesmo matrizes com determinante positivo e com autovalores negativos com multiplicidade
a
par podem nao estar na imagem da exponencial. Tal e o caso das matrizes 1
0 1 com a 6= 0 (mostre
isso).
Prova da Prop. 4.11. A Proposicao 4.11 afirma que toda matriz complexa invertvel n n pode ser
escrita como exponencial de outra matriz complexa n n. Provemos isso. Seja A GL( , n). Pelo
Teorema da Decomposicao de Jordan (Teorema 3.18, pagina 199) existe uma matriz invertvel P tal que
P 1 AP = D + N com D diagonal, N nilpotente, DN = N D, sendo que D tem na diagonal principal
os autovalores da matriz A. Esse u
ltimo fato diz-nos que D nao tem autovalores nulos e, portanto, e
tambem invertvel.
5

Pois numa base conveniente a matriz eD eN e uma matriz triangular superior, tendo na diagonal principal os elementos
da diagonal de eD .

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

238/1304

Podemos assim escrever D + N = D( + D 1 N ). O que faremos agora e provar os seguintes fatos:


1. D pode ser escrita como D = eF para alguma matriz F conveniente. 2. + D 1 N pode ser escrita
como + D 1 N = eG para alguma matriz G conveniente. 3. Podemos escolher F e G de modo que
F G = GF . Desses tres fatos conclumos que P 1 AP = exp(F + G) e, portanto, A = exp (M ), onde
M = P (F + G)P 1 . Isso prova o que desejamos.
Prova de 1. Sejam 1 , . . . , l os autovalores distintos de D. Pelo Teorema Espectral (vide Teorema
l
X
3.4, pagina 166, ou Teorema 3.6, pagina 171) podemos escrever D =
j Ej , onde as matrizes Ej
j=1

satisfazem (3.35) e (3.36) e, de acordo com (3.37), podem ser expressas como polinomios em D (um fato
1
que sera usado mais abaixo): Ej = mj (
mj (D). (Os polinomios mj foram definidos na demonstracao
j)
do Teorema 3.6). Seja, para cada j, um n
umero complexo fj escolhido de forma que exp(fj ) = j .
Encontrar tais fj s sempre e possvel pois os j s sao nao-nulos, ja que D e invertvel. Se definirmos
F :=

l
X

fj Ej

j=1

e facil constatar por (3.35) e (3.36) que exp(F ) = D (faca!). Isso prova 1. Note que, pelo que
comentamos acima, vale
l
X
fj
F =
mj (D) ,
(4.28)
mj (j )
j=1
ou seja, F pode ser expressa como um polinomio em D.

Prova de 2. Como D 1 e N comutam (por que?), segue que D 1 N e nilpotente de ordem, digamos,
k+1
k, ou seja (D 1 N )
= 0. Assim, para z escolhido de modo que kzD 1 N k < 1, o logaritmo de
1
+ zD N esta bem definido e vale (vide (4.21))
k
X
m
(z)m
G(z) =
D 1 N
.
m
m=1

(4.29)

Sabemos pela Proposicao 4.5 que nesse caso em que kzD 1 N k < 1, ou seja, |z| < 1/kD 1 N k, temos
exp(G(z)) =

+ zD 1 N .

(4.30)

Queremos agora provar que essa igualdade vale para todo z. Usando novamente o fato que as matrizes
k+1
D 1 e N comutam entre si, o fato que (D 1 N )
= 0 e o fato que a soma em (4.29) e finita, teremos
!
k
X

(z)m
m
exp(G(z)) = exp
D 1 N
m
m=1
k
Y

m
(z)m
=
exp
D 1 N
m
m=1
=

k
Y

m=1

"

k
X
(1)l (z)ml
l=1

l!

ml

D 1 N

ml

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

239/1304

Como as somas a produtos acima sao finitos (conseq


uencia da nilpotencia de D 1 N ), constatamos que
exp(G(z)) e um polinomio em z para todo z . Ora, ja verificamos acima que, quando |z| e pequeno,
exp(G(z)) e igual ao polinomio em z dado por + zD 1 N . Como polinomios sao funcoes analticas
em toda parte isso implica que exp(G(z)) = + zD 1 N para todo z . Em particular, para z = 1,
o que significa que + D 1 N = exp(G), onde
k
X
(1)m+1
G G(1) =
m
m=1

D 1 N

m

E. 4.15 Exerccio. Usando a definicao (4.31), prove explicitamente que exp(G) =

(4.31)

+ D 1 N .

Prova de 3. Por (4.28), F e um polinomio em D. Assim, F comuta com D 1 e com N . Logo,


por (4.31), F comuta com G. Isso e o que queramos provar e, assim, a prova da Proposicao 4.11 esta
completa.

4.3

A F
ormula de Lie-Trotter e a F
ormula do Comutador

Ha duas expressoes envolvendo produtos de exponenciais de matrizes que sao bastante u


teis. Sao as
6
formulas conhecidas como f
ormula de Lie-Trotter e f
ormula do comutador. A formula de Lie-Trotter
e importante nao apenas no estudo de grupos de Lie matriciais mas tambem na Mecanica Estatstica
e na Mecanica Quantica, onde e freq
uentemente empregada. A formula de Lie-Trotter, por exemplo, e
usada na Mecanica Estatstica para relacionar sistemas quanticos de spin a sistemas classicos de spin.
Proposi
c
ao 4.12 Para quaisquer matrizes A, B Mat ( , n) valem:

F
ormula de Lie-Trotter:

exp (A + B) = lim

exp



m
1
1
A exp
B
.
m
m

(4.32)

F
ormula do Comutador:
exp ([A, B]) = lim

exp







m2
1
1
1
1
A exp
B exp A exp B
.
m
m
m
m

(4.33)
2

A f
ormula de Lie-Trotter foi originalmente demonstrada por Lie (Marius Sophus Lie (1842-1899)) e posteriormente
generalizada por v
arios autores, entre eles Trotter (Hale Freeman Trotter (1931-)) em On the Product of Semi-Groups

of Operators. ProcAmer.
Math. Soc. 10, 545-551 (1959). O leitor poder
a encontrar v
arias dessas generalizaco
es (por
exemplo para operadores auto-adjuntos n
ao-limitados agindo em espacos de Hilbert) em [103]. O assunto e ainda hoje
objeto de pesquisa.

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

240/1304

Prova. Vamos primeiramente provar a formula de Lie-Trotter7 e posteriormente passar a` formula do


comutador. Comecamos definindo, para m ,




1
1
Sm := exp
A exp
B ,
m
m


1
(A + B) .
Tm := exp
m


Note-se que (Tm )m = exp (A + B) e que tudo o que desejamos e provar que (Sm )m converge a
exp (A + B), ou seja,
lim k(Sm )m (Tm )m k = 0.


Precisamos, portanto, estudar (Sm )m (Tm )m . Para isso, e u


til empregarmos a identidade algebrica
(4.19). Daquela relacao e das propriedades da norma operatorial, segue que
m

k(Sm ) (Tm ) k


m1
X
p=0

kSm kp kSm Tm k kTm km1p .

(4.34)

Pela definicao, temos para qualquer matriz M Mat ( , n)



X
X
1 k
1


k exp (M ) k =
M
kM kk = ekM k .


k!
k!
k=0
k=0


Assim,

kSm k
e kTm k e(kAk

+kBk )/m

k(Sm ) (Tm ) k







1


exp m A






1
exp
B


m

e(kAk


+kBk )/m

. Retornando a (4.34), teremos


e

(kAk +kBk )(m1)/m

m1
X
p=0

kSm Tm k


mkSm Tm k e(kAk

+kBk )

Na u
ltima desigualdade usamos que (m 1)/m < 1 e que kSm Tm k nao depende de p.


Como se ve da u
ltima expressao, tudo que que temos que fazer para provar k(S m )m (Tm )m k vai
a zero quando m e provar que kSm Tm k vai a zero com 1/m2 quando m cresce. Isso e feito
escrevendo as expressoes explcitas para Sm e Tm em termos da serie de Taylor da funcao exponencial:







1
1
1
A exp
B exp
(A + B)
Sm Tm = exp
m
m
m
"
#"
# "
#

X
X
X
mk k
mk k
mk
1
1
1
=
+ A+
A
+ B+
B
+ (A + B) +
(A + B)k .
m
k!
m
k!
m
k!
k=2
k=2
k=2


Para a f
ormula de Lie-Trotter seguiremos aqui a demonstraca
o de [103].

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

241/1304

Expandindo-se a u
ltima linha, e identificando os termos em 1/m, e facil constatar que
Sm T m =

1
1
1
1
1
A + B (A + B) + 2 Sm =
Sm ,
m
m
m
m
m2

onde Sm e uma serie, um tanto complicada, mas convergente em norma e tal que lim m kSm k =
finito. Assim,
1
mkSm Tm k
kSm k
m
e, portanto,
lim k(Sm )m (Tm )m k = 0.


Isso demonstrou a formula de Lie-Trotter. O estudante mais avancado pode facilmente convencer-se
que precisamente a mesma demonstracao se aplica ao contexto de operadores limitados agindo em
espacos de Banach.
Para a formula do comutador usaremos outro procedimento. Definimos








1
1
1
1
A exp
B exp A exp B
Um := exp
m
m
m
m
e teremos

Um =

"

1 2 X mk k
1
A +
A
+ A+
m
2m2
k!
k=3

"

#"

X
mk k
1
1
2
B
+
B
+ B+
m
2m2
k!
k=3

1
1 2 X (m)k k
A+
A +
A
m
2m2
k!
k=3

#"

k
X
1
1
(m)
B+
B2 +
Bk .
m
2m2
k!
k=3

Com um pouco de paciencia podemos expandir o produto dos quatro fatores do lado direito e constatar
(faca!) que os termos envolvendo 1/m se cancelam e o termo proporcional a 1/m 2 e AB BA (outros
termos como (1/m2 )A2 e (1/m2 )B 2 tambem se cancelam. Verifique!). Ou seja, ficamos com
Um =

1
1
(AB

BA)
+
Rm ,
m2
m3

(4.35)

onde m13 Rm sao os termos restantes da expansao. Rm e uma expressao complicada, mas envolvendo
series convergentes e de tal forma que limm kRm k e finito.


Isso diz que para m grande o suficiente a norma de Um e pequena e, assim, podemos tomar o
logaritmo de Um , definido por ln(Um ) = ln( + (Um )). Por (4.35) e pela expansao do logaritmo
teremos
ln(Um ) = ln( + (Um ))


1
1
+ 2 (AB BA) + 3 Rm
= ln
m
m
=

1
1 0
(AB

BA)
+
R ,
m2
m3 m

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

242/1304

ou seja,

1 0
R ,
(4.36)
m m
onde R0m e novamente uma expressao complicada, mas envolvendo series convergentes e de tal forma
que limm kR0m k e finito. Como limm m1 R0m = 0 podemos escrever, pela Proposicao 4.3,


1 0
exp([A, B]) = lim exp [A, B] + Rm .
m
m
m2 ln(Um ) = [A, B] +

Agora, por (4.36),





2
1 0
2
exp [A, B] + Rm = exp m2 ln(Um ) = (exp (ln(Um )))m = (Um )m .
m

Logo,

exp([A, B]) = lim (Um )m .


m

Isso e o que desejavamos provar8 .


E. 4.16 Exerccio.
comutador.

4.4

Demonstre a formula de Lie-Trotter usando as ideias da prova da formula do


6

Aplica
co
es Lineares em Mat ( , n)

O conjunto de matrizes Mat ( , n) e naturalmente um espaco vetorial complexo de dimensao finita n 2 ,


pois combinacoes lineares de matrizes complexas n n sao novamente matrizes complexas n n e a
matriz nula faz o papel de vetor nulo. Como tal, ha varias aplicacoes lineares agindo em Mat ( , n).
Vamos nesta secao exibir e estudar algumas dessas aplicacoes e discutir suas relacoes. Os resultados aos
quais chegaremos sao de interesse por si so, mas nossa intencao e tambem a de preparar a demonstracao
da formula de Baker-Campbell-Hausdorff.
As Aplica
co
es ad
Dada uma matriz X Mat ( , n) fixa podemos definir uma aplicacao linear ad[X] em Mat ( , n),
ad[X] : Mat ( , n) Mat ( , n) por
ad[X](A) := [X, A] = XA AX.
para toda matriz A Mat ( , n).
8

O estudante pode estar curioso (ou perplexo) sobre o por que de n


ao finalizamos a demonstraca
o partindo de (4.36),
2
m2
escrevendo m ln(Um ) = ln((Um ) ) e tomando diretamente da o limite m . A raz
ao e que o fato de Um ser pr
oximo
2
2
de em norma n
ao garante que (Um )m tambem o seja. Assim, o logaritmo de (Um )m pode n
ao fazer sentido. Para
evitar esse transtorno l
ogico e mais conveniente finalizar a demonstraca
o com uso da funca
o exponencial de matrizes,
para a qual tais problemas de definica
o n
ao ocorrem.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

243/1304

As Aplica
co
es Ad
Analogamente, seja G GL( , n) uma matriz invertvel fixa. Podemos definir uma aplicacao linear
Ad[G] em Mat ( , n), Ad[G] : Mat ( , n) Mat ( , n) por
Ad[G](A) := GAG1 .

Definindo a Exponencia
c
ao de ad
Denotaremos por (ad[X])p ou ad[X]p a p-esima potencia de ad[X]:
ad[X]p (A) = [X, [X, . . . , [X , A].
|
{z
}
p vezes

Aqui, p = 1, 2, . . .. Para facilitar a notacao em aplicacoes futuras, convencionaremos que ad[X] 0 (A) =
A para toda matriz A Mat ( , n).

Dado que ad[X] e uma aplicacao linear em um espaco vetorial de dimensao finita, sua exponencial
e bem definida. Definimos Exp[ad[X]] como sendo a aplicacao linear no espaco das matrizes complexas
n n, Exp[ad[X]] : Mat ( , n) Mat ( , n) dada por
Exp[ad[X]](A) :=

X
X
1
1
(ad[X])m (A) := A +
(ad[X])m (A),
m!
m!
m=1
m=0

= A+

X
1
[X, [X, . . . , [X , A]
|
{z
}
m!
m=1
m vezes

para toda A Mat ( , n). A convergencia da serie e automaticamente garantida pelas observacoes da
Secao 4.2.
A Rela
c
ao entre ad e Ad
Ha uma relacao elegante entre as aplicacoes ad e Ad, a qual se expressa na seguinte proposicao:
Proposi
c
ao 4.13 Seja X Mat ( , n) qualquer. Ent
ao
Ad[exp(X)] = Exp[ad[X]] ,

(4.37)

ou seja, para toda matriz A Mat ( , n) vale

ou seja,

X
1
(ad[X])m (A),
exp(X)A exp(X) = A +
m!
m=1

X
1
exp(X)A exp(X) = A +
[X, [X, . . . , [X , A]
{z
}
|
m!
m=1
m vezes

= A + [X, A] +

1
1
[X, [X, A]] + [X, [X, [X, A]]] + .
2!
3!

(4.38)

(4.39)

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

244/1304

2
Coment
ario 1. A expressao (4.38) ou (4.39) e comummente denominada serie de Lie, mas alguns
autores tambem a denominam f
ormula de Baker-Campbell-Hausdorff. Reservaremos esse nome apenas
para a expressao (4.46), adiante.
Coment
ario 2. As expressoes (4.38) e (4.39) sao empregadas de varias formas na Mecanica Quantica,
na Mecanica Estatstica Quantica e na Teoria Quantica de Campos, especialmente na Teoria de Perturbacoes e nas Teorias de Calibre.
Prova. Seja t


e sejam A e X matrizes complexas n n fixas quaisquer. Definamos

X
tm
1 (t) := Exp[ad[tX]](A) = A +
(ad[X])m (A)
m!
m=1

e
2 (t) := Ad[exp(tX)](A) = exp(tX)A exp(tX).
Vamos mostrar que 1 (t) = 2 (t) para todo t provando para isso que ambas satisfazem a mesma
equacao diferencial linear com a mesma condicao inicial.
trivial constatar que 1 (0) = 2 (0) = A. Pela definicao tem-se
E

X
tm1
d
1 (t) =
(ad[X])m (A)
dt
(m

1)!
m=1

tm1
= ad[X]
(ad[X])m1 (A)
(m 1)!
m=1

X
tm
= ad[X]
(ad[X])m (A)
m!
m=0

= ad[X] (Exp[ad[tX]](A))
= ad[X](1 (t)).
Em resumo, 1 (t) satisfaz

d
1 (t) = ad[X](1 (t)).
dt

JCABarata. Curso de Fsica-Matem


atica

Analogamente, calculemos

d
(t).
dt 2

Vers
ao de 29 de setembro de 2005.

Captulo 4

245/1304

Aplicando a regra de Leibniz9 ,

d
d
2 (t) =
(exp(tX)A exp(tX))
dt
dt
= X exp(tX)A exp(tX) exp(tX)A exp(tX)X
= ad[X](exp(tX)A exp(tX))
= ad[X](2 (t)).
Em resumo, 2 (t) satisfaz

d
2 (t) = ad[X](2 (t)).
dt

Constatamos assim que 1 (t) e 2 (t) satisfazem a mesma equacao diferencial com a mesma condicao
inicial. Pelo Teorema de existencia e unicidade de solucoes de sistemas de equacoes diferenciais lineares
com coeficientes constantes discutido na Secao 7.2, isso implica que 1 (t) = 2 (t) para todo t e,
em particular para t = 1, que e a afirmacao do teorema.


Coment
ario. O teorema acima e sua demonstracao exemplificam uma situacao nao muito incomum,
onde apresenta-se um resultado que e muito difcil de ser provado por um procedimento mas muito
facil de ser demonstrado por outro. Tente o leitor demonstrar a identidade (4.38) expandindo as
exponenciais do lado direito em suas series de Taylor, ou seja, escrevendo
exp(X)A exp(X) =

X
(1)l
k=0 l=0

k!l!

X k AX l

e reordenando as somas de modo a obter o lado esquerdo de (4.38)! Ainda que seja possvel provar
(4.38) dessa forma, um tal procedimento e muitssimo mais complexo que aquele que empregamos, e
que faz apenas uso de um fato basico bem conhecido da teoria das equacoes diferenciais.
E. 4.17 Exerccio. Tenha a ideia certa antes de tentar resolver qualquer problema.

A Aplica
c
ao Diferencial Exponencial dexp
Seja F (t) uma matriz complexa n n cujos elementos de matriz (F (t))ij sao funcoes diferenciaveis
em relacao a t. Seja tambem F 0 (t) a matriz cujo elemento ij e dtd (F (t))ij . Em palavras, F 0 (t) e obtida
diferenciando cada elemento de matriz de F (t).
Vamos nos colocar o seguinte problema: como calcular dtd exp(F (t))? O estudante apressado poderia
imaginar que dtd exp(F (t)) = exp(F (t))F 0 (t). Isso e, todavia, em geral falso, pois essa regra de derivacao
nao vale para matrizes! Isso e assim, pois a matriz F 0 (t) nao necessariamente comuta com a matriz
9

Gottfried Wilhelm von Leibniz (1646-1716).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

246/1304

F (t). Tem-se, em verdade, que para todo m = 1, 2, 3, . . .,

m1
X
d
d
m

F (t) F (t) =
F (t)k F 0 (t)F (t)mk1 .
(F (t)) =
{z
}
dt
dt |
k=0
m vezes

Conseq
uentemente,

X
n1
X
d
1
exp(F (t)) =
F (t)k F 0 (t)F (t)nk1 .
dt
n!
n=1

(4.40)

k=0

Isso motiva a seguinte definicao. Para X Mat ( , n) fixo, definimos uma aplicacao linear
dexp[X] : Mat ( , n) Mat ( , n), denominada aplicaca
o diferencial exponencial, por
X
n1
X
1 k
X AX nk1 ,
dexp[X](A) :=
n!
n=1 k=0

(4.41)

para todo A Mat ( , n).


E. 4.18 Exerccio. Mostre que a serie do lado direito esta bem definida, ou seja, que e convergente para
todos X e A.
6
Com essa definicao podemos, por (4.40), escrever
d
exp(F (t)) = dexp[F (t)](F 0 (t)).
(4.42)
dt
Para uma expressao alternativa para a derivada da exponencial de uma matriz dependente de um
parametro, vide equacao (4.61), pagina 255.
Por razoes que ficarao claras adiante quando provarmos a formula de Baker, Campbell e Hausdorff,
e conveniente expressar dexp[X] em termos de ad[X]. Como veremos, e possvel fazer isso e o resultado
esta expresso na Proposicao 4.14 que apresentaremos e demonstraremos a seguir.
Antes, porem, duas definicoes. Para z

definimos a funcao complexa (z) por

X
1 ez
(1)m m
(z) :=
=
z .
z
(m
+
1)!
m=0

(4.43)

Como a serie de Taylor do lado direito converge para todo z , (z) e uma funcao inteira, ou seja, e
analtica em toda parte.
Pelos nossos comentarios da Secao 4.2, podemos definir para todo X Mat ( , n) uma aplicacao
linear [X] : Mat ( , n) Mat ( , n) dada por
[X] := (ad[X]),

(4.44)

ou seja, [X] e a aplicacao que a todo A Mat ( , n) associa a matriz [X](A) dada por

X
(1)m
ad[X]m (A).
[X](A) =
(m + 1)!
m=0

Pelos comentarios da Secao 4.2 a serie do lado direito converge para todos X, A Mat ( , n).

(4.45)

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

247/1304

Proposi
c
ao 4.14 Com as definico
es apresentadas acima, vale para todos A, X Mat ( , n) a
express
ao
dexp[X](A) = exp(X) [ad[X]](A) ,
ou seja,

X
(1)m
ad[X]m (A) .
dexp[X](A) = exp(X)
(m
+
1)!
m=0

Tambem como comentado acima, e in


util tentar provar a proposicao partindo de (4.41) e aplicando
forca-bruta. A demonstracao usara uma serie de truques elegantes.
Prova. Vamos definir, para A, X Mat ( , n) fixas e t


H(t) := t dexp[tX](A).
A ideia e descobrir uma equacao diferencial que H(t) satisfaz e, em seguida, resolve-la. Note-se que,
pela definicao, H(0) = 0. Como veremos, resolver a equacao diferencial e tarefa relativamente facil.
Um pouco mais trabalhoso e encontrar a equacao diferencial. Para isso temos que calcular a derivada
de H(t) em relacao a t.
Pela definicao de H(t) e de dexp[tX](A) em (4.41), tem-se
X
n1 n
X
t

d
d
d
H(t) =
(t dexp[tX](A)) =
dt
dt
dt

n1
X
X
n=1 k=0

= A+

X
n
X
tn

X k AX nk1

n
X
X
tn k
tn1
k
nk1
X AX
=
X AX nk
(n 1)!
n!
n=0 k=0

n=1 k=0

= A

n=1 k=0

n!

n!

n
X
t
n=1

n!

X AX

= A exp(tX) + tX

nk

n=1

X
n
X
tn
n=1 k=1

n!

X
n
X
tn1
n=1 k=1

= A exp(tX) + tX

= A+

X
tn

n!

X
n1 n1
X
t
n=1 k=0

n!

X AX

n!

AX +

nk

X
n
X
tn
n=1 k=1

n!

X k AX nk

= A exp(tX) +

X
n
X
tn
n=1 k=1

X k1 AX nk

X k AX nk1

= A exp(tX) + X (t dexp[tX](A)) = A exp(tX) + XH(t) .

n!

X k AX nk

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

248/1304

Em resumo, H(t) satisfaz a equacao diferencial


d
H(t) = XH(t) + A exp(tX),
dt
com a condicao inicial H(0) = 0.
Como estudamos a` pagina 315 da Secao 7.2.2, a solucao geral da equacao matricial
d
M(t) = XM(t) + G(t)
dt
e
M(t) = exp(tX)M(0) +

t
0

exp((t s)X)G(s)ds.

Assim, como H(0) = 0 e G(t) = A exp(tX), teremos


Z t
H(t) =
exp((t s)X)A exp(sX) ds
0

=
(4.37)

exp(tX)

exp(tX)

exp(sX)A exp(sX) ds = exp(tX)


0
t
0

Ad[exp(sX)](A) ds
0

Z tX

(s)m
ad[X]m (A) ds
Exp[ad[sX]](A) ds = exp(tX)
m!
0 m=0

Z t

X
X
(1)m tm+1
(1)m
m
m
s ds = exp(tX)
exp(tX)
ad[X] (A)
ad[X]m (A)
m!
(m
+
1)!
0
m=0
m=0

t exp(tX)

(4.45)

X
(1)m tm
ad[X]m (A)
(m
+
1)!
m=0

t exp(tX) [tX](A) .

Essa expressao vale para todo t




. Tomando t = 1, teremos H(1) = exp(X)[X](A), ou seja,

dexp[X](A) = exp(X) [X](A),


que e o que queramos provar.
Reunindo todos esses resultados, estamos agora preparados para provar a formula de Baker, Campbell e Hausdorff.

4.5

A F
ormula de Baker, Campbell e Hausdorff

A presente secao e dedicada a demonstracao do seguinte teorema.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

249/1304

Teorema 4.1 (F
ormula de Baker-Campbell-Hausdorff
) Para A, B Mat ( , n) tais que kAk


1
2
e kBk sejam ambas menores que 2 ln 2 2 0, 12844 . . ., vale


exp(A) exp(B) = exp(A B),

com

AB = A+B+

k, l0 a1 , b1 0
k+l>0 a1 +b1 >0

ak , bk 0
ak +bk >0

(1)k
l!(k + 1)(b1 + + bk + 1)

k
Y
i=1

1
ai !bi !

ad[A]a1 ad[B]b1 ad[A]ak ad[B]bk ad[A]l (B). (4.46)


Os primeiros termos de (4.46) s
ao
1
1
1
A B = A + B + [A, B] + [A, [A, B]] + [B, [B, A]] +
2
12
12

(4.47)
2

Coment
ario. A expressao (4.46) e a celebre formula de Baker10 , Campbell11 e Hausdorff12 , que desempenha um papel importante no estudo de grupos de Lie e outras areas. Advertimos que, devido a` sua
complexidade e devido a` restricao quanto a` norma das matrizes A e B, a formula de Baker-CampbellHausdorff tem um escopo de aplicacoes relativamente limitado no que concerne a computos de produtos
de exponenciais. A mesma formula, porem, presta-se a` demonstracao de varios teoremas, especialmente
na teoria dos grupos de Lie. Uma situacao interessante na qual a formula de Baker-Campbell-Hausdorff
pode ser empregada e aquela na qual comutadores de ordem suficientemente grande das matrizes A e
B se anulam, pois a o lado direito de (4.46) ou (4.47) tem um n
umero finito de termos. Tal ocorre nas
chamadas a
lgebras de Lie nilpotentes. O leitor que procura um exemplo simples do uso de (4.47) pode
interessar-se em ler sobre o chamado grupo de Heisenberg na Secao 13.2.2, pagina 676.
Prova do Teorema 4.1. A estrategia que empregaremos para provar a formula de Baker, Campbell
e Hausdorff e muito semelhante a`quela empregada na demonstracao da Proposicao 4.14. Seja, para
A, B Mat ( , n) fixas tais que kAk < ln(2)/2 e kBk < ln(2)/2, a matriz13


G(t) := ln (exp(A) exp(tB)) ,

(4.48)

para t [1, 1]. Vamos identificar uma equacao diferencial satisfeita por G(t), e em seguida resolve-la.

Comecemos procurando calcular a derivada de G(t) em relacao a t. Isso e uma tarefa mais difcil do
conveniente calcular primeiro a derivada de exp(G(t)).
que parece e procederemos de modo indireto. E
Por um lado temos que
exp(G(t)) = exp(A) exp(tB)
10

Henry Frederick Baker (1866-1956).


John Edward Campbell (1862-1924).
12
Felix Hausdorff (1868-1942).
13
A condica
o kAk < ln(2)/2 e kBk < ln(2)/2 garante que k exp(A) exp(tB) k < 1 para todo t [1, 1]. Assim,
o logaritmo de exp(A) exp(tB) em (4.48) est
a definido.
11

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

250/1304

e, portanto,

d
d
exp(G(t)) = exp(A) exp(tB) = exp(A) exp(tB)B.
dt
dt
Por outro tem-se, pela definicao da aplicacao dexp, que
d
exp(G(t)) = dexp[G(t)](G0 (t)).
dt
Portanto,
dexp[G(t)](G0 (t)) = exp(A) exp(tB)B.
Usando a Proposicao 4.14 essa u
ltima igualdade pode ser escrita como
exp(G(t)) [G(t)](G0 (t)) = exp(A) exp(tB)B,
o que implica que
[G(t)](G0 (t)) = exp(G(t)) exp(A) exp(tB)B = exp(tB) exp(A) exp(A) exp(tB)B = B.
Resumindo, tem-se
[G(t)](G0 (t)) = B.

(4.49)
0

A ideia que agora perseguiremos e tentar inverter essa expressao de modo a obter G (t) (que aparece
no argumento de no lado esquerdo).
Para isso faremos uso do seguinte lema:
Lema 4.2 Sejam as funco
es complexas
(z) :=

1 ez
,
z

z ,

j
a definida em (4.43) e
(z) :=
Ent
ao vale

z ln(z)
,
z1

|z 1| < 1.

(ez )(z) = 1
para todo z tal que |z| < ln 2.

Prova. Usando a expansao em serie de Taylor da funcao ln, podemos escrever

X (1)k1
ln(1 + (z 1))
ln(z)
= z
= z
(z 1)k1 .
(z) := z
z1
z1
k
k=1
Isso mostra que (z) e analtica na regiao |z 1| < 1.

X
1 m
z e
Agora, se |z| < ln 2, tem-se que |e 1| < 1, pois e 1 =
m!
m=1
z

X
X
1 m
1
|e 1|
|z| <
(ln 2)m = eln 2 1 = 1.
m!
m!
m=1
m=1
z

(4.50)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

251/1304

Assim, ez esta dentro da regiao onde e analtica, onde vale que


 z 

e z
1 ez
z
(e )(z) =
= 1,
ez 1
z
que e o que queramos provar.
O uso que faremos desse lema e o seguinte. Seja X Mat ( , n) qualquer. Por analogia com a
definicao de [X] em (4.44), definimos
[X] := (Exp[ad[X]]) = (Ad[exp(X)])
Assim,
[X][X] := (Exp[ad[X]])(ad[X]) = id,
onde id e a aplicacao identidade: id(A) := A, para toda A Mat ( , n). Portanto, aplicando [G(t)]
a (4.49), teremos
G0 (t) = [G(t)](B).
Essa e a equacao diferencial procurada e que e satisfeita por G(t), com a condicao inicial G(0) = A.
Para prosseguir devemos escreve-la de forma mais conveniente.
Pela definicao da aplicacao Ad, e bem facil ver que
Ad[eX eY ] = Ad[eX ]Ad[eY ].
E. 4.19 Exerccio. Verifique.

Assim,
[G(t)] = (Ad[exp(G(t)))]) = (Ad[exp(A) exp(tB))])
= (Ad[exp(A)] Ad[exp(tB))]) = (Exp[ad[A]] Exp[ad[tB]]) .
A equacao diferencial para G(t) assume, portanto, a forma
G0 (t) = (Exp[ad[A]] Exp[ad[tB]]) (B),

(4.51)

com G(0) = A.
Antes de passarmos a` resolucao dessa equacao, comentemos brevemente que o lado direito de (4.51)
esta bem definido desde que a norma de Exp[ad[A]] Exp[ad[tB]] seja menor que ln(2), devido a` definicao
de . Uma conta simples, mas que omitiremos
aqui, garante que isso se da desde que kAk e kBk

1
2
sejam ambas menores que 2 ln 2 2 0, 12844 . . ..


Isto posto, nossa tarefa agora e resolver (4.51), o que pode ser feito por uma simples integracao.
Teremos, portanto,
Z t
Z t
0
(Exp[ad[A]] Exp[ad[sB]]) (B) ds.
G (s) ds =
G(t) G(0) =
0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

252/1304

Tomando-se t = 1 teremos
A B

ln e e

= A+

(Exp[ad[A]] Exp[ad[sB]]) (B) ds.

(4.52)

Estando ja na reta final, resta-nos calcular a integral do lado direito, o que pode ser feito com o uso
o que faremos.
da expansao em serie de dada em (4.50) e um pouco de paciencia. E
Por (4.50), teremos
(Exp[ad[A]] Exp[ad[sB]]) (B)
= (Exp[ad[A]] Exp[ad[sB]])

X
(1)k1
k=1

"

X
(1)k1
k=1

(Exp[ad[A]] Exp[ad[sB]] id)k1 (B)


#

(Exp[ad[A]] Exp[ad[sB]] id)k1 Exp[ad[A]] Exp[ad[sB]](B)


"

X
(1)k1
k=1

(Exp[ad[A]] Exp[ad[sB]] id)

k1

Exp[ad[A]](B), (4.53)

onde, na u
ltima passagem usamos o fato obvio que
Exp[ad[sB]](B) = Ad[exp(sB)](B) = exp(sB)B[exp(sB) = B.
Desejamos escrever esta u
ltima expressao diretamente em termos das aplicacoes ad[A]] e ad[sB].
Ou
ltimo fator, Exp[ad[A]], e simplesmente

X
1
ad[A]l .
Exp[ad[A]] =
l!
l=0

(4.54)

Fora isso,
X

X
X
1
1
Exp[ad[A]] Exp[ad[sB]] id =
ad[A]a ad[sB]b id =
sb
ad[A]a ad[B]b .
a!b!
a!b!
a, b0
a=0 b=0
a+b>0

Com isso,
(Exp[ad[A]] Exp[ad[sB]] id)k1
=

a1 , b1 0
a1 +b1 >0

ak1 , bk1 0
ak1 +bk1 >0

sb1 ++sk1
ad[A]a1 ad[B]b1 ad[A]ak1 ad[B]bk1 . (4.55)
a1 !b1 ! ak1 !bk1 !

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

253/1304

Inserindo-se (4.54) e (4.55) em (4.53) tem-se


Z

(Exp[ad[A]] Exp[ad[sB]]) (B) ds


0

1X
k=1 l=0

a1 , b1 0
a1 +b1 >0

(1)

ak1 , bk1 0
ak1 +bk1 >0

k1
Y

k1 b1 ++bk1

s
l!k

i=1

1
ai !bi !

ad[A]a1 ad[B]b1 ad[A]ak1 ad[B]bk1 ad[A]l (B) ds. (4.56)


Trocando-se a integral pelas somas
Z

(Exp[ad[A]] Exp[ad[sB]]) (B) ds


0
X

X
X

k=1 l=0

a1

a1 , b1 0
a1 +b1 >0

b1

ad[A] ad[B] ad[A]


=

X
X
k=1 l=0

a1 , b1 0
a1 +b1 >0

ak1 , bk1 0
ak1 +bk1 >0

ak1

ak1 , bk1 0
ak1 +bk1 >0

ad[B]

(1)k1
l!k

bk1

k1
Y
i=1

ad[A] (B)

1
ai !bi !

sb1 ++bk1 ds
0

(1)k1
l!k(b1 + + bk1 + 1)

k1
Y
i=1

1
ai !bi !

1
ai !bi !

ad[A]a1 ad[B]b1 ad[A]ak1 ad[B]bk1 ad[A]l (B)


=

X
X
k=0 l=0

a1 , b1 0
a1 +b1 >0

ak , bk 0
ak +bk >0

(1)k
l!(k + 1)(b1 + + bk + 1)

k
Y
i=1

ad[A]a1 ad[B]b1 ad[A]ak ad[B]bk ad[A]l (B). (4.57)


Na u
ltima igualdade fizemos apenas a mudanca de variaveis k k + 1.

Retornando a (4.52), temos entao ln eA eB = A B, onde
AB = A+

X
X
k=0 l=0

a1 , b1 0
a1 +b1 >0

ak , bk 0
ak +bk >0

(1)k
l!(k + 1)(b1 + + bk + 1)

k
Y
i=1

1
ai !bi !

ad[A]a1 ad[B]b1 ad[A]ak ad[B]bk ad[A]l (B) (4.58)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

254/1304

facil ver que o termo com k = l = 0 nas somas do lado direito e igual a B. Com essa identificacao,
E
finalmente chega-se a (4.46).
Como
ja comentamos a convergencia e garantida se kAk e kBk forem


ambas menores que 12 ln 2 22 0, 12844 . . ..


E. 4.20 Exerccio importante. Colecionando os termos com a1 + b1 + + ak + bk + l 2 em (4.46),


mostre que os primeiros termos de A B sao aqueles dados em (4.47), pagina 249.
6
*
Coment
ario. Um comentario que adiantamos e que, como discutiremos melhor no Captulo 14, o
produto expresso em (4.46), define uma estrutura de grupo em sub-algebras de Lie nilpotentes de
Mat ( , n). De fato, e possvel provar que e um produto associativo (pois o produto de exponenciais
de matrizes e associativo) e e facil ver que A 0 = A e que A (A) = 0 para toda matriz A. Com
isso, a matriz nula e o elemento neutro do grupo e A e a inversa de A. Isso tambem mostra que e por
vezes possvel construir um produto associativo a partir de outro nao-associativo, como o comutador
de matrizes.

4.6

A F
ormula de Duhamel e Algumas de suas Conseq
u
encias

Nesta secao demonstraremos a F


ormula de Duhamel14 :
Z 1


exp(A + B) = exp(A) +
exp (1 s)(A + B) B exp sA ds ,

(4.59)

uencias. A
valida para quaisquer matrizes A, B Mat ( . n), e estudaremos algumas de suas conseq
demonstracao e simples. Diferenciando-se es(A+B) esA em relacao a s, tem-se






d sA
d
d s(A+B) sA
s(A+B)
s(A+B) sA
e
e
+e
e
e
e
=
ds
ds
ds




s(A+B)
sA
s(A+B)
sA
=
e
(A + B) e
+e
(A) e
= es(A+B) B esA .
Integrando-se ambos os lados entre 0 e t, obtem-se
Z t
t(A+B) tA
e
e
=
es(A+B) B esA ds ,
0

de onde segue que


e
14

t(A+B)

= e

Jean Marie Constant Duhamel (1797-1872).

tA

es(A+B) B e(st)A ds ,
0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 4

255/1304

A mudanca de variavel de integracao s t s conduz a


Z t
t(A+B)
tA
e(ts)(A+B) B esA ds .
e
= e +

(4.60)

Para t = 1, isso reduz-se a (4.59), que e o que queramos provar. De (4.60) podem ser extradas varias
relacoes u
teis, que trataremos agora.
Derivada de uma exponencial em rela
c
ao a um par
ametro

Uma das conseq


uencias mais u
teis da formula de Duhamel e uma relacao para a derivada da exponencial de uma matriz que depende de um parametro. Seja A() Mat ( . n) uma matriz que
depende contnua e diferenciavelmente de um parametro . Entao vale


Z 1
d A() 
d
(1s)A()
A() esA() ds .
(4.61)
e
e
=
d
d
0

Essa relacao tem aplicacoes em equacoes diferenciais e na Mecanica Estatstica, dentro e fora do
equilbrio. Alguns autores tambem denominam-na f
ormula de Duhamel. O leitor deve compara-la
a` expressao alternativa (4.42). Passemos a` demonstracao.
Sendo A() diferenciavel, vale, para todo  suficientemente pequeno,
A( + ) = A() + 
onde

1
lim R(, ) = 0 .
0 

Tem-se, entao,
d
exp(A())
d

d
A() + R(, ),
d

def.

(4.62)

(4.59)



1
lim exp(A( + )) exp(A())
0 




1
d
lim
exp A() +  A() + R(, ) exp (A())
0 
d

lim

0

Z

0

(4.63)

(4.63)





Z 1
1 A()
dA
(1s)(A()+ dA
()+R(, ))
sA()
A()
d
lim
e
+
e
ds e
 () + R(, ) e
0 
d
0

+ lim

(4.62)

()+R(, ))
(1s)(A()+ dA
d

Z



dA
sA()
() e
ds
d

(1s)(A()+ dA
()+R(, ))
d

(1s)A()

(1s)A()

0
1
0



1
sA()
R(, ) e
ds



Z 1



1
dA
sA()
sA()
(1s)A()
() e
ds +
ds
e
lim R(, ) e
0 
d
0

dA
() esA() ds ,
d

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

256/1304

como queramos demonstrar.


Iterando a f
ormula de Duhamel
Na expressao (4.60) exponenciais do tipo e(A+B) aparecem em ambos os lados. Isso sugere que
podemos inserir iterativamente (4.60) dentro de si mesma de modo a obter outras expressoes recorrentes,
como apresentado nas passagens auto-explicativas abaixo. Partindo de (4.60) e repetindo a iteracao
duas vezes, tem-se
Z t
t(A+B)
tA
e
= e +
e(ts1 )(A+B) B es1 A ds1
0

= e

tA

Z t

(ts1 )A

= e

= e

tA

tA

Z tZ
0

= e

tA

Z tZ
0

(ts1 s2 )(A+B)

(ts1 )A

Be

Be

s2 A

ds2

s1 A

ds1 +

Z tZ
0

ts1

B es1 A ds1

e(ts1 s2 )(A+B) B es2 A B es1 A ds2 ds1

e(ts1 )A B es1 A ds1 +


0

ts1

ts1

(ts1 s2 )A

ts1 s2

Be

s1 A

ds1 +

Z tZ
0

ts1 Z

ts1 s2

Be

t
(ts1 )A

(ts1 s2 s3 )(A+B)

ts1

s3 A

ds3

B es2 A B es1 A ds2 ds1

e(ts1 s2 )A B es2 A B es1 A ds2 ds1

e(ts1 s2 s3 )(A+B) B es3 A B es2 A B es1 A ds3 ds2 ds1 .

Repetindo-se N vezes o procedimento, teremos


"
Z t
t(A+B)
tA
e
= e
+
es1 A B es1 A ds1
0

N Z tZ
X

m=2

Z tZ
0

ts1

ts1
0

ts1 sm1
0

ts1 sm
0

e(s1 ++sm )A

m1
Y
k=0

e(ts1 sm+1 )(A+B)

m
Y

k=0

B esmk


A

dsm ds1


B esm+1k A dsm+1 ds1 ,(4.64)

, N 2, sendo que convencionamos definir a produtoria de matrizes da esquerda


L
Y
para a direita, ou seja, na forma
Mk = M1 ML (e necessario fixar uma convencao devido a`
para todo N

k=1

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

257/1304

nao-comutatividade do produto de matrizes). Com as mudancas de variaveis


= t s1
= t (s1 + s2 )
..
.

t1
t2

= t t1
= t1 t2
..
.

s1
s2

sm = tm1 tm

tm = t (s1 + + sm )

podemos reescrever as integrais entre colchetes acima na forma


"
#
Z t
Z tm1 m1
N Z t Z t1
X
Y

+
et(A+B) =
etmk A B etmk A dtm dt1 etA
et1 A B et1 A dt1 +

Z tZ
0

m=2

ts1

ts1 sm

k=0

(ts1 sm+1 )(A+B)

m
Y

k=0


B esm+1k A dsm+1 ds1 .

(4.65)

E. 4.21 Exerccio. Verifique!

Substituindo A A e B B na expressao acima, tomando a adjunta da expressao resultante e


usando o fato que, para qualquer matriz M Mat ( , n), vale (exp (M )) = exp(M ), obtem-se
#
"
Z tm1 Y
Z t
m
N Z t Z t1
X

etk A B etk A dtm dt1

et1 A B et1 A dt1 +


et(A+B) = etA +
0

Z tZ
0

ts1

m=2

ts1 sm
0

"m+1
Y

esk A B

k=1

k=1

e(ts1 sm+1 )(A+B) dsm+1 ds1 .

E. 4.22 Exerccio. Verifique!

(4.66)

Para matrizes ou elementos de uma algebra- de Banach e possvel tomar o limite N nas
expressoes (4.64)-(4.66), como na proposicao que segue.
Proposi
c
ao 4.15 Sejam matrizes A, B Mat ( , n). Ent
ao,
e

t(A+B)

= e

tA

"

es1 A B es1 A ds1


0

Z tZ
X

m=2

ts1
0

ts1 sm1
0

k=0

ou, equivalentemente,
"
Z t
Z tZ
X
t(A+B)
tA
t1 A
t1 A
e
= e
+
e
B e dt1 +
0

e(s1 ++sm )A

m1
Y

m=2

t1
0

m
tm1 Y

k=1

B esmk


A

etk A B etk

dsm ds1 , (4.67)


A

dtm dt1 , (4.68)

JCABarata. Curso de Fsica-Matem


atica

Captulo 4

Vers
ao de 29 de setembro de 2005.

258/1304

para todo t , a convergencia sendo uniforme para t em compactos. As expans


oes em serie acima
s
ao denominadas series de Duhamel.
2


Prova. A prova consiste em mostrar que o limite N de (4.64) ou (4.66) existe. Tomemos
provisoriamente t [T, T ] para
algum T > 0. Para [T, T ], tem-se ke A k e| |kAk eT kAk .

Seja M := max eT kAk , eT kA+Bk . Tem-se

Z Z
Z tm1 Y
m

t t1



tk A
tk A
dtm dt1
e
Be



0 0
0
k=1

2m

kBk

Z tZ
0

t1
0

tm1
0

dtm dt1 =

(M 2 kBk|t|)
m!

e, analogamente,

Z Z
Z ts1 sm
m

t ts1
Y

(M kBk|t|)m+1


sm+1k A
t(s1 ++sm+1 )(A+B)
Be
dsm+1 ds1 M
.

e


0 0
(m + 1)!
0
k=0

As duas desigualdades provam a convergencia uniforme para t [T, T ]. Como T e arbitrario, a


convergencia se da para todo t .


Na Secao 7.4, pagina 327, apresentamos uma generalizacao da expressao (4.68), a chamada serie de
Dyson para da teoria de perturbacoes (vide, em particular, a expressao (7.26)).
Outros resultados an
alogos
O metodo de demonstracao da formula de Duhamel apresentado acima pode ser empregado na
obtencao de outros resultados. Sejam novamente matrizes A, B Mat ( , n). Entao, vale
Z t
tB
[A, e ] =
e(ts)B [A, B]esB ds .
(4.69)
0

Para a prova, observamos que


lados de 0 a t, obtem-se

d
ds

esB Ae

tB

Ae

tB


sB

= esB [A, B]esB (justifique!). Integrando-se ambos os

A =

esB [A, B]esB ds .

(4.70)

Multiplicando-se a` esquerda por etB chega-se a` expressao (4.69). Expressoes como (4.69) sao empregadas na teoria de perturbacoes na Mecanica Quantica.

Parte III
Equaco
es Diferenciais

259

Captulo 5
Equaco
es Diferenciais Ordin
arias. Uma Introduc
ao
Conte
udo
5.1

Defini
ca
o e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . 261
5.1.1

Equacoes Diferenciais Ordinarias Lineares . . . . . . . . . . . . . . . . . . . . 263

5.1.2

Equacoes Ordinarias de Segunda Ordem. Exemplos de Interesse . . . . . . . 267

5.2

Sistemas de Equa
co
es Diferenciais Ordin
arias . . . . . . . . . . . . . . . . 269

5.3

Discuss
ao sobre Problemas de Valor Inicial . . . . . . . . . . . . . . . . . . 274
5.3.1

Problemas de Valor Inicial. Patologias e Exemplos a se Ter em Mente . . . . 276

5.3.2

Teoremas de Existencia e Unicidade de Solucoes . . . . . . . . . . . . . . . . 280

5.3.3

Solucoes Globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282

5.3.4

Dependencia Contnua de Condicoes Iniciais e de Parametros . . . . . . . . . 284

este captulo apresentaremos uma breve introducao a` teoria das equacoes diferenciais ordinarias, abordando varios assuntos que serao aprofundados em outros captulos. Na Fsica,
equacoes diferenciais sao representacoes matematicas diretas ou indiretas de leis naturais e
nao e de surpreender, portanto, o papel central que as mesmas nela desempenham. Pode-se,
sem medo de exagero, afirmar que o desenvolvimento da Fsica moderna pos-Newtoniana so se tornou
possvel quando se compreendeu a importancia de se expressar as leis basicas da natureza em termos
de equacoes diferenciais e quando se desenvolveram metodos de resolucao das mesmas. Desde o seculo
XVIII as equacoes diferenciais tornaram-se nao apenas um dos principais instrumentos teoricos de
trabalho dos fsicos, mas a linguagem mesma pela qual as leis da Fsica se expressam.
Um exemplo basico e segunda lei de Newton da Mecanica Classica, que popularmente consiste na
afirmacao que para uma partcula de massa m (movendo-se em, digamos, em uma dimensao, do ponto
de vista de um referencial inercial) o produto de sua massa por sua aceleracao e igual a` forca que age
sobre ela. Se y(t) e a posicao da partcula (em um sistema de referencia inercial) e a forca F que age
sobre ela em um instante de tempo t depender apenas do tempo t, da posicao y(t) no instante t e
da velocidade y(t)

no mesmo instante t, entao a segunda lei de Newton assume a forma da equacao


diferencial ordinaria de segunda ordem
m
y (t) = F (t, y(t), y(t))

.
A Fsica apresenta outros exemplos de leis que se expressam em termos de equacoes diferenciais (parciais), tais como as leis do Eletromagnetismo (equacoes de Maxwell), da Mecanica dos Fluidos (equacoes
de Euler e de Navier-Stokes), da Mecanica Quantica (equacoes de Schrodinger, de Klein-Gordon e de
Dirac), na Teoria da Relatividade Geral (equacao de Einstein) etc.
Atualmente, o estudo das equacoes diferenciais e suas aplicacoes estende-se a outras sub-areas da
Fsica, tais como a qumica, a biologia, a economia, financas etc. , Para excelentes introducoes, legveis
profundas e abrangentes, a` teoria das equacoes diferenciais ordinarias, recomendamos [5] e [65].
260

JCABarata. Curso de Fsica-Matem


atica

5.1

Vers
ao de 29 de setembro de 2005.

Captulo 5

261/1304

Defini
c
ao e Alguns Exemplos

Vamos iniciar nossa discussao tentando, de um modo geral e abstrato, definir o que se entende por uma
equacao diferencial ordinaria (que, seguindo a praxe, abreviaremos por EDO).
Defini
c
ao geral de EDOs
Seja n 1 um n
umero natural e seja G(x1 , . . . xn+2 ) uma funcao (real ou complexa) de n + 2
variaveis (reais ou complexas). Entende-se por uma equaca
o diferencial ordin
aria de ordem n de uma
funcao (incognita) y de uma variavel t associada a` funcao G a equacao
G(t, y(t), y 0 (t), . . . , y (n) (t)) = 0 .

(5.1)

Assim sendo, o n
umero n e dito ser a ordem da equaca
o.
Um exemplo (escolhido arbitrariamente, sem aplicacao pratica conhecida) seria o caso da funcao de
tres variaveis
G(x1 , x2 , x3 ) = x21 + sen (x2 ) 3x1 cos(x3 ) .
(5.2)

A equacao diferencial ordinaria de primeira ordem associada a essa funcao seria


t2 + sen (y(t)) 3t cos(y 0 (t)) = 0 .

(5.3)

evidente que so faz sentido associar uma equacao diferencial a uma funcao G de n + 2 variaveis,
E
como acima, se a mesma possuir zeros, ou seja, se a equacao algebrica G(x 1 , . . . , xn+2 ) = 0 possuir
solucoes (reais ou complexas, dependendo do interesse). Por exemplo, se G(x1 , x2 , x3 ) e uma funcao
de tres variaveis reais ou complexas da forma G(x1 , x2 , x3 ) = |x1 |2 + |x2 |2 + |x3 |2 + 1 entao nao ha
nenhuma equacao diferencial associada a` mesma, ja que nao ha n
umeros reais ou complexos tais que
G(x1 , x2 , x3 ) = 0 e, portanto, a equacao |t|2 + |y(t)|2 + |y 0 (t)|2 + 1 = 0, ainda que possa ser escrita,
trivialmente nao possui qualquer solucao.
Em muitos casos a equacao algebrica G(x1 , . . . xn+2 ) = 0 permite escrever de modo u
nico (ao menos
em uma regiao finita) a variavel xn+2 em termos das demais:
xn+2 = F (x1 , . . . xn+1 ) ,

(5.4)

onde F e alguma funcao de n+1 variaveis. Condicoes para isso sao garantidas pelo importante Teorema
da Funca
o Implcita (vide Secao 17.4, pagina 907, ou qualquer bom livro-texto sobre funcoes de varias
variaveis). Nesses casos felizes, a equacao diferencial para G equivale (ao menos localmente) a` equacao
y (n) (t) = F (t, y(t), . . . , y (n1) (t)) .

(5.5)

Nos casos em que G e tal que nao permite a separacao global da dependencia de x n+2 como em (5.4)
a equacao diferencial e dita ser uma equaca
o diferencial implcita. Equacoes implcitas sao por vezes
difceis de lidar. Trataremos da solucao de algumas delas no Captulo 6, pagina 286. Um exemplo de
uma equacao implcita foi apresentado em (5.2)-(5.3). Outro exemplo e a equacao diferencial (associada
a` conservacao de energia mecanica de uma partcula de massa m se movendo em uma dimensao sob a
acao de um potencial U ):
m
2
(y(t))

+ U (y(t)) = E ,
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

262/1304

onde E e uma constante.


Daqui por diante estaremos mais freq
uentemente interessados em equacoes diferenciais de ordem
n da forma (5.5) para alguma funcao de n + 1 variaveis F . Para ilustrar equacoes do tipo (5.5),
apresentemos mais alguns exemplos.
Exemplo 5.1 Sejam m, e k constantes positivas e f uma funcao de uma variavel. Seja G a funcao
de quatro variaveis
G(x1 , x2 , x3 , x4 ) = mx4 + kx2 + x3 f (x1 ) .
evidente que para a equacao algebrica G(x1 , x2 , x3 , x4 ) = 0 podemos escrever
E
x4 = F (x1 , x2 , x3 ) ,
onde
F (x1 , x2 , x3 ) =

1
(kx2 + x3 f (x1 )) .
m

A equacao diferencial (de segunda ordem) associada a essa funcao F e y(t) = F (t, y(t) y(t)),

ou
seja
m
y (t) + y(t)
+ ky(t) = f (t) .
O estudante pode imediatamente reconhecer que se trata da equacao do oscilador harmonico amortecido
submetido a uma forca dependente do tempo f (t).

Vamos a outros exemplos escritos diretamente em termos da funcao F .

Exemplo 5.2 Sejam g e l duas constantes positivas e seja F a funcao


F (x1 , x2 , x3 ) =

g
sen (x2 ) .
l

A equacao diferencial (de segunda ordem) associada a essa funcao F e


y(t) =

g
sen (y(t)) .
l

O estudante pode imediatamente reconhecer que se trata da equacao do pendulo simples.


Exemplo 5.3 (Equacao de van der Pol) Sejam e k constantes e

F (x1 , x2 , x3 ) = x3 (x22 1) kx2 .


A equacao diferencial (de segunda ordem) associada a essa funcao F e
y 00 (t) + y 0 (t)(y(t)2 1) + ky(t) = 0 .
Esta equacao e conhecida como equaca
o de van der Pol 1 , em honra ao engenheiro que a propos como
a equacao basica para o triodo (uma especie de avo do transistor).

Balthazar van der Pol (1889-1959). Os trabalhos originais de van der Pol sobre a equaca
o que leva seu nome s
ao: B.
van der Pol, Radio Rev. 1, 704-754, (1920) e B. van der Pol, Forced oscillations in a circuit with non-linear resistance
(reception with reactive triode), Phil. Mag. 3, 65-80, (1927).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

263/1304

Exemplo 5.4 Sejam e constantes e


F (x1 , x2 ) = x2 + x22 .
A equacao diferencial (de primeira ordem) associada a essa funcao F e
y 0 (t) = y(t) + y(t)2 .
Essa equacao aparece em varios problemas, por exemplo no estudo da evolucao de populacoes.
Varios outros exemplos serao apresentados adiante.

5.1.1

Equa
co
es Diferenciais Ordin
arias Lineares

No estudo das equacoes diferenciais e muito u


til classificar equacoes que possuam certas propriedades
comuns. Uma classificacao muito importante e aquela que separa as equacoes diferenciais em lineares
e n
ao-lineares e as primeiras em homogeneas e n
ao-homogeneas.
Equa
co
es diferenciais ordin
arias lineares
Seja a equacao diferencial ordinaria de ordem n
y (n) (t) = F (t, y(t), . . . , y (n1) (t)) .

(5.6)

Se a funcao F (x1 , . . . xn+1 ) for uma funcao linear das variaveis x2 , . . . xn+1 , entao (5.6) e dita ser
linear. Em um tal caso, F (x1 , . . . xn+1 ) e da forma
F (x1 , . . . xn+1 ) = f1 (x1 ) + f2 (x1 )x2 + + fn+1 (x1 )xn+1 ,
para certas funcoes de uma variavel f1 , . . . , fn+1 .
facil constatar que toda equacao diferencial ordinaria e linear de ordem n e da forma
E
y (n) (t) + an1 (t)y (n1) (t) + + a1 (t)y 0 (t) + a0 (t)y(t) = f (t) ,

(5.7)

para funcoes reais ou complexas a0 , . . . , an1 e f . Veremos in


umeros exemplos adiante (vide Secao
5.1.2).
Equacoes que nao sao lineares sao (obviamente) ditas ser n
ao-lineares. Exemplos sao a equacao do
pendulo simples
x(t) + sen (x(t)) = 0
e a de van der Pol
2
y(t) + y(t)(y(t)

1) + ky(t) = 0 .

Equacoes nao-lineares sao em muitos sentidos mais complexas que equacoes lineares e tem sido objeto de intenso estudo nas u
ltimas decadas, especialmente no que concerne ao comportamento caotico
observado em muitas delas. Nos captulos que seguem, nossa enfase sera o desenvolvimento de metodos

JCABarata. Curso de Fsica-Matem


atica

Captulo 5

Vers
ao de 29 de setembro de 2005.

264/1304

de resolucao de equacoes lineares, mas trataremos de metodos de resolucao de algumas equacoes naolineares no Captulo 6, pagina 286, e tambem no Captulo 17 quando desenvolvermos metodos recursivos
no tratamento das equacoes integrais de Fredholm e de Volterra.
Equa
co
es diferenciais ordin
arias lineares a coeficientes constantes
Caso as funcoes a0 , . . . , an1 em (5.7) sejam constantes, a equacao (5.7) e dita ser a equaca
o
a coeficientes constantes. Como discutiremos, ha um metodo geral para obter solucoes de equacoes
diferenciais ordinarias lineares a coeficientes constantes (para qualquer ordem n).
Equa
co
es lineares homog
eneas e n
ao-homog
eneas
Caso a funcao f seja identicamente nula, a equacao (5.7) e dita ser uma equaca
o diferencial homogenea. De outra forma, se f nao for identicamente nula, equacao (5.7) e dita ser uma equaca
o
diferencial n
ao-homogenea.
Equacoes lineares e homogeneas tem uma propriedade de grande importancia, o chamado princpio
de sobreposica
o, do qual trataremos agora.
O princpio de sobreposi
c
ao para equa
co
es lineares homog
eneas
Seja uma equacao diferencial ordinaria linear e homogenea de ordem n
y (n) (t) + an1 (t)y (n1) (t) + + a1 (t)y 0 (t) + a0 (t)y(t) = 0 .

(5.8)

O chamado princpio de sobreposica


o e a afirmativa que se y a e yb sao duas solucoes de (5.8) entao
combinacoes lineares arbitrarias ya + yb sao tambem solucoes de (5.8). Aqui e sao n
umeros reais
(k)
(k)
ou complexos arbitrarios. A prova e simples. A k-esima derivada de ya + yb e ya + yb . Assim,
substituindo-se y por ya + yb no lado esquerdo de (5.8), teremos
(ya + yb )(n) + an1 (t)(ya + yb )(n1) + + a1 (t)(ya + yb )0 + a0 (t)(ya + yb ) =
(n1)

(n)

(ya(n) + yb ) + an1 (t)(ya(n1) + yb

) + + a1 (t)(ya0 + yb0 ) + a0 (t)(ya + yb ) =

ya(n) + an1 (t)ya(n1) + + a1 (t)ya0 + a0 (t)ya


|
{z
}
=0

(n)

(n1)

+ yb + an1 (t)yb
|

+ + a1 (t)yb0 + a0 (t)yb = 0 .
{z
}
=0

Uma conclusao importante que se extrai do princpio de sobreposicao e que o conjunto de todas
as solucoes de uma equacao diferencial ordinaria linear e homogenea e um espaco vetorial, real ou
complexo, dependendo do caso.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

265/1304

Como o estudante facilmente percebe, o princpio de sobreposicao vale tambem para sistemas de
equacoes diferenciais ordinarias lineares e homogeneas, assim como para equacoes diferenciais parciais
lineares e homogeneas, tais como as equacoes de difusao, de onda, de Laplace, as equacoes de Maxwell no
vacuo, a equacao de Schrodinger e muitas outras equacoes da Fsica. Nelas o princpio de sobreposicao
e amplamente empregado.
Historicamente, o princpio de sobreposicao era conhecido desde os primeiros estudos sobre equacoes
diferenciais no seculo XVIII, mas foi atraves dos trabalhos de Helmholtz2 sobre ac
ustica que sua importancia foi inteiramente percebida na resolucao de equacoes diferenciais (ordinarias e parciais) lineares
de interesse fsico. A influencia de Helmholtz nao pode ser subestimada, mesmo no que concerne a
aplicacoes praticas: a leitura de Helmholtz, que tambem inventara um dispositivo eletromecanico para
a producao artificial do som de vogais, inspirou Bell3 a realizar experiencias de transmissao simultanea
de m
ultiplos sinais de codigo Morse4 em uma u
nica linha telegrafica, empregando freq
uencias distintas
para cada mensagem. Tais experiencias conduziram Bell em 1876 a` invencao do telefone.
O caso de equa
co
es lineares n
ao-homog
eneas
Vamos colocar a seguinte questao. Vale o princpio de sobreposicao para equacoes diferenciais
ordinarias lineares nao-homogeneas? Para tentar responder isso, considere-se a equacao nao-homogenea
y (n) (t) + an1 (t)y (n1) (t) + + a1 (t)y 0 (t) + a0 (t)y(t) = f (t)

(5.9)

e sejam ya e yb duas solucoes. Como acima, consideremos uma combinacao linear ya + yb e tentemos
repetir o que fizemos no caso homogeneo. Assim, substituindo-se y por ya + yb no lado esquerdo de
(5.9), teremos
(ya + yb )(n) + an1 (t)(ya + yb )(n1) + + a1 (t)(ya + yb )0 + a0 (t)(ya + yb ) =
(n1)

(n)

(ya(n) + yb ) + an1 (t)(ya(n1) + yb

) + + a1 (t)(ya0 + yb0 ) + a0 (t)(ya + yb ) =

ya(n) + an1 (t)ya(n1) + + a1 (t)ya0 + a0 (t)ya


|
{z
}
= f (t)

(n)

(n1)
+ + a1 (t)yb0 + a0 (t)yb = ( + )f (t) .
+ yb + an1 (t)yb
|
{z
}
= f (t)

O que conclumos e que ya + yb somente e uma nova solucao de (5.9) se + = 1. Portanto, se ya


e yb sao solucoes de (5.9) entao ya + (1 )yb e tambem solucao de (5.9) para qualquer .

Vimos que o princpio de sobreposicao para equacoes nao-homogeneas nao se da para e arbitrarios. Nao se pode mais, portanto, dizer que o conjunto de solucoes de uma equacao nao-homogenea
como (5.9) e um espaco vetorial, mas sim um espaco convexo.
2

Hermann Ludwig Ferdinand von Helmholtz (1821-1894).


Alexander Graham Bell (1847-1922).
4
Samuel Finley Breese Morse (1791-1872).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

266/1304

Ha ainda uma outra propriedade importante satisfeita pelas solucoes de equacoes nao-homogeneas.
Seja ynh uma solucao particular da equacao nao-homogenea (5.9) e yh solucao particular da equacao
homogenea (5.8), a qual difere de (5.9) apenas pelo fato de ter-se f (t) = 0. Entao tem-se que
y = yh + ynh

(5.10)

e tambem solucao da equacao nao-homogenea (5.9) para qualquer constante . Para ver isso, inserimos
y = yh + ynh no lado esquerdo de (5.9) e teremos
(ya + ynh )(n) + an1 (t)(yh + ynh )(n1) + + a1 (t)(yh + ynh )0 + a0 (t)(yh + ynh ) =
(n)

(n)

(n1)

(yh + ynh ) + an1 (t)(yh

(n1)

+ ynh

(n)

0
) + + a1 (t)(yh0 + ynh
) + a0 (t)(yh + ynh ) =

(n1)

yh + an1 (t)yh
|

+ + a1 (t)yh0 + a0 (t)yh
{z
}
=0

(n)

(n1)
0
+ ynh + an1 (t)ynh + + a1 (t)ynh
+ a0 (t)ynh = f (t) .
|
{z
}
= f (t)

O que aprendemos com isso e que se tivermos uma solucao particular de uma equacao linear naohomogenea obtemos uma outra solucao mais geral adicionando a esta uma solucao da equacao linear
homogenea associada. Essa propriedade e muito u
til na solucao de equacoes nao-homogeneas.
Equa
co
es diferenciais ordin
arias com retardo
Apenas por curiosidade informamos que nao apenas equacoes diferenciais do tipo (5.1) ou (5.5)
sao objeto de interesse e de pesquisa. Um outro tipo sao as chamadas equaco
es com retardo, as quais
existem em diversas formas. Uma dessas forma e a seguinte. Sejam T0 , . . . , Tn1 constantes positivas.
Uma equacao com retardo (fixo) e uma equacao da forma
y (n) (t) = F (t, y(t T0 ), . . . , y (n1) (t Tn1 )).

(5.11)

A diferenca com relacao a (5.5) e que aqui y (n) no instante t nao depende de y, . . . , y n1 no mesmo
instante t, mas em instantes anteriores.
Um exemplo interessante e o seguinte. Suponha que y(t) designe a populacao de uma especie de
seres vivos vivendo em um certo habitat. O n
umero de falecimentos por causas naturais (como doencas)
no intervalo t e t+dt e tipicamente proporcional a y(t) (justifique!). Assim, se a especie nao se reproduz,
a variacao dy da populacao no intervalo t e t + dt sera dy = y(t)dt para uma certa constante ,
ou seja, y satisfara a equacao diferencial y 0 (t) = y(t), que e uma equacao de primeira ordem sem
retardo. Agora, admitamos que a especie se reproduz. O n
umero de cruzamentos entre elementos da
especie no intervalo t e t + dt e tipicamente proporcional a y(t)2 (justifique!). Se admitirmos que o
n
umero de nascimentos no intervalo entre t e t + dt e proporcional ao de cruzamentos ocorridos em

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

267/1304

t T0 (descontando assim o tempo de gestacao T0 ) a equacao diferencial para y tera que ser modificada
para
y 0 (t) = y(t) + (y(t T0 ))2
para uma certa constante . Esta e uma equacao de primeira ordem com retardo.
Ha varios outros tipos de equacoes com retardo, por exemplo, aquelas onde os tempos de retardo
Ti nao sao fixos, mas dependem de t ou mesmo de y. Tais equacoes aparecem no Eletromagnetismo,
onde o retardo e devido a` finitude da velocidade da luz.
O estudo de equacoes com retardo requer outros metodos que nao aqueles que discutiremos aqui e
e atualmente assunto ativo de pesquisa, encontrando aplicacoes mesmo fora da Fsica, em areas tais
como a Epidemiologia - como o exemplo acima ilustra - onde os retardos sao tipicamente conseq
uencia
quer de tempos de gestacao quer de tempos de latencia (de doencas).

5.1.2

Equa
co
es Ordin
arias de Segunda Ordem. Exemplos de Interesse

Para futura referencia vamos aqui listar uma serie de equacoes diferenciais lineares de segunda ordem
de particular interesse.
1. A Equaca
o linear de segunda ordem e homogenea (forma geral):
a(t)
y + b(t)y + c(t)y = 0 ,
com a(t) nao-identicamente nula.
2. Equaca
o linear de segunda ordem n
ao-homogenea (forma geral):
a(t)
y (t) + b(t)y(t)
+ c(t)y(t) = f (t) ,
com a(t) e f (t) nao-identicamente nulas.
3. A Equaca
o de Euler5 :
t2 y(t) + at y(t)
+ by(t) = 0 ,
onde a e b sao constantes.
4. A Equaca
o de Hill6 :
y(t) + ( + P (t))y(t) = 0 ,
onde P (t) e uma funcao periodica e constante. Um caso particular importante e o da equacao
de Mathieu:
5. A Equaca
o de Mathieu7 :
y(t) + (a + b cos(t))y(t) = 0 ,
com a, b e constantes.
5

Leonhard Euler (1707-1783).


George William Hill (1838-1914).
7
Emile-Leonard Mathieu (1835-1890).
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

6. A Equaca
o de Bessel8 :

x2 y 00 (x) + xy 0 (x) + (x2 2 )y(x) = 0 ,

.


7. A Equaca
o de Legendre9 :
(1 x2 )y 00 (x) 2xy 0 (x) + ( + 1)y(x) = 0 ,

, e a equaca
o de Legendre associada


(1 x2 )y 00 (x) 2xy 0 (x) + ( + 1)y(x)


,


2
y(x) = 0 ,
1 x2

8. A Equaca
o de Hermite10 :

y 00 (x) 2xy 0 (x) + y(x) = 0 ,

.


9. A Equaca
o de Airy11 :
y 00 (x) xy(x) = 0 .
10. A Equaca
o de Laguerre12 :
xy 00 (x) + (1 x)y 0 (x) + y(x) = 0 ,

, e a Equaca
o de Laguerre associada


xy 00 + (m + 1 x)y 0 + (n m)y = 0 ,
m, n constantes.
11. A Equaca
o de Chebyshev13 :
(1 x2 )y 00 (x) xy 0 (x) + 2 y(x) = 0 ,

12. A Equaca
o Hipergeometrica14 , ou Equaca
o de Gauss15 :
z(1 z)y 00 (z) + [c (1 + a + b)z]y 0 (z) aby(z) = 0 ,
a, b, c constantes.
8

Friedrich Wilhelm Bessel (1784-1846).


Adrien-Marie Legendre (1752-1833).
10
Charles Hermite (1822-1901).
11
George Biddell Airy (1801-1892).
12
Edmond Nicolas Laguerre (1834-1886).
13
Pafnuty Lvovich Chebyshev (1821-1894).
14
Assim denominada pois uma de suas soluca
o envolve uma generalizaca
o da serie geometrica.
15
Carl Friedrich Gau (1777-1855).
9

268/1304

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

269/1304

13. A Equaca
o Hipergeometrica Confluente, ou Equaca
o de Kummer 16 :
zy 00 (z) + [c z]y 0 (z) ay(z) = 0 ,
a, c constantes.
O leitor interessado podera encontrar no Captulo 10, pagina 544, problemas fsicos dos quais
emergem algumas das equacoes listadas acima.

5.2

Sistemas de Equa
co
es Diferenciais Ordin
arias

Um sistema de equacoes diferenciais ordinarias envolvendo m funcoes desconhecidas y 1 , . . . , ym de


uma variavel e um conjunto de equacoes do tipo
(n )

y1 1 (t)
(n )
y2 2 (t)

(n 1)

(n 1)

0
= F1 (t; y1 , y10 , . . . , y1 1 ; . . . ; ym , ym
, . . . , ym m ) ,
(n 1)
(n 1)
0
= F2 (t; y1 , y10 , . . . , y1 1 ; . . . ; ym , ym
, . . . , ym m ) ,
..
.
(n1 1)

(n )

ym m (t) = Fm (t; y1 , y10 , . . . , y1

(n 1)

0
; . . . ; ym , ym
, . . . , ym m

(5.12)

),

onde cada Fi e uma funcao de um certo n


umero de variaveis e nk sao n
umeros inteiros maiores ou
iguais a 1. Para cada yj tem-se, portanto, uma equacao de ordem nj , na qual comparecem tambem as
demais funcoes yk e suas derivadas de ordem ate nk 1.
Sistemas de equacoes diferenciais ordinarias sao muito freq
uentes em Fsica. Considere-se, por
exemplo, um sistema isolado de m partculas de massas Mi e coordenadas x~i , i = 1, . . . , m, interagindo
de forma que a partcula j exerce sobre a partcula i uma forca F~ij (x~i x~j ). A segunda lei de Newton
fica
X
Mi x~i (t) =
F~ij (x~i (t) x~j (t)) ,
j6=i

i = 1, . . . , m, que e um sistema de equacoes diferenciais ordinarias.


O sistema de Lotka-Volterra

Um outro exemplo de sistema de equacoes diferenciais e o chamado sistema de caca-presa de Lotka 17


e Volterra18 , empregado no estudo de evolucao de populacoes19 . Esse sistema e da forma
p 1 (t) = 1 p1 (t) + 1 p1 (t)p2 (t)
,
p 2 (t) = +2 p2 (t) 2 p1 (t)p2 (t)
16

(5.13)

Ernst Eduard Kummer (1810-1893).


Alfred James Lotka (1880-1949).
18
Vito Volterra (1860-1940).
19
O modelo foi proposto em 1920 por Lotka para o estudo de certas reaco
es qumicas e em 1926 por Volterra, em uma
tentativa de modelar a evoluca
o de populaco
es de peixes e tubar
oes do mar Adri
atico. Para uma referencia hist
orica,
vide V. Volterra Lecons sur la Theorie Mathematique de la Lutte pour la Vie. Gauthier-Villars et Cie., Paris, 1931.
17

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

270/1304

onde i e i , i = 1, 2 sao constantes positivas. O sistema de Lotka-Volterra descreve a evolucao de duas


populacoes de acordo com um modelo de interacao entre caca (a populacao p 1 ) e presa (a populacao
p2 ).
A ideia do modelo e a seguinte: p1 representa uma populacao que se alimenta da populacao p2 . Esta,
alimenta-se de recursos do habitat. Tenha-se em mente, por exemplo, a situacao onde p 1 representa
uma populacao de raposas que se alimentam de coelhos, representados por p2 . Estes, sendo herbvoros,
alimentam-se de plantas de seu habitat. Se as duas populacoes estao isoladas, p1 tende a desaparecer
(por falta de alimento) exponencialmente com uma taxa 1 . Ja p2 cresce exponencialmente com uma
taxa 2 , por nao ter inimigos naturais. Assim, quando as duas populacoes estao isoladas, suas evolucoes
sao descritas pelo sistema
p 1 (t) = 1 p1 (t)
.
(5.14)
p 2 (t) = +2 p2 (t)
Postas em contato, as populacoes comecam a interagir, e de modo que p1 tem uma chance de sobrevivencia por se alimentar de p2 , que ganha agora um predador. As chances de sobrevivencia de p1 sao
proporcionais ao n
umero de encontros entre elementos de p1 e de p2 no habitat, pois em um encontros
um elemento de p1 pode eventualmente matar um elemento de p2 e, assim, alimentar-se. Esse n
umero
de encontros e grosseiramente proporcional ao produto das duas populacoes p 1 p2 (por que?). Assim, a
taxa de sobrevivencia de p1 deve ser acrescida de um termo como 1 p1 (t)p2 (t), enquanto que a taxa de
sobrevivencia de p2 deve ser subtrada de um termo como 2 p1 (t)p2 (t). Esses termos levam ao sistema
de Lotka-Volterra acima. O resultado da evolucao de um tal sistema e ilustrado na Figura 5.1.

Figura 5.1: A evolucao do sistema de Lotka-Volterra para tres condicoes iniciais distintas. O eixo
horizontal e a populacao p1 e o vertical p2 . Note que a evolucao se da em ciclos periodicos fechados,
uma caracterstica especial do sistema de Lotka-Volterra.
Tambem estudado em modelos de ecologia e o modelo de competica
o de Lotka-Volterra, descrito

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

271/1304

pelo sistema
p 1 (t) = 1 p1 (t) 1 p1 (t)2 1 p1 (t)p2 (t)
.
(5.15)
p 2 (t) = 2 p2 (t) 2 p2 (t)2 2 p1 (t)p2 (t)
Acima i e i sao positivos, mas i podem ser positivos ou negativos. Na primeira equacao, o termo
+1 p1 (t) descreve o crescimento (ou decrescimento) da populacao p1 por consumir recursos de seu
habitat (supostamente ilimitados), se reproduzir e morrer. O termo 1 p1 (t)2 descreve, por exemplo,
a taxa de propagacao de doencas fatais entre elementos da populacao p 1 , que e proporcional ao n
umero
de encontros de elementos da especie p1 com elementos da especie p1 . Esse n
umero e grosseiramente
proporcional a p21 (por que?). O termo 1 p1 (t)p2 (t) descreve a competicao entre as duas especies cujas
populacoes sao p1 e p2 .
Tambem muito estudados20 sao os modelos do tipo Lotka-Volterra com n especies, caracterizados
pelo sistema de equacoes
n
X
pj (t) = j pj (t) +
jk pj (t) pk (t) ,
j = 1, . . . , n .
k=1

Mais generalidades sobre o modelo de Lotka-Volterra e sobre outras aplicacoes de equacoes diferenciais em modelos ecologicos e epidemiologicos podem ser encontradas, por exemplo, em [10] e [2]. Para
outra referencia sobre o modelo de Lotka-Volterra e assuntos correlatos, vide [68].
Comparados a` realidade dos sistemas biologicos os modelos apresentados acima sao bastante simplificados, deixando de lado varios efeitos possivelmente relevantes, tais como reproducao sexuada
(machos so se reproduzem com femeas, nao com outros machos, femeas idem), imunidade ou nao a
doencas por parte das populacoes, tempos de gestacao, ausencia de reproducao durante a gestacao,
tempos de latencia de doencas, limitacao dos recursos do habitat, surgimento aleatorio de mutacoes e
varios outros fatores. Ha toda uma area de pesquisa voltada a` modelagem realista de sistemas biologicos
e eco-sistemas. Alguns modelos estudados chegam a ser extremamente complexos, envolvendo dezenas
de equacoes e de incognitas. Para uma referencia atualizada sobre modelagem de sistemas biologicos,
vide [10] ou [68].
Sistemas de primeira ordem
O sistema de equacoes diferenciais ordinarias mais basico e o de primeira ordem:
y1 (t)
y2 (t)

= F1 (t, y1 , . . . , ym ) ,
= F2 (t, y1 , . . . , ym ) ,
..
.

(5.16)

ym (t) = Fm (t, y1 , . . . , ym ) ,
conveniente simplificarmos um pouco a expressao
onde cada Fi e uma funcao de m + 1 variaveis. E
(5.16). Introduzindo os vetores de m componentes

y1
..
Y = . m
ym


20

Para um trabalho recente, vide P. Duarte R. L. Fernandez e W. M. Oliva Dynamics on the attractor of the LotkaVolterra equations. J. Diff. Equations 149, 143-189 (1998) e referencias l
a citadas.

JCABarata. Curso de Fsica-Matem


atica

e as funcoes F :

m+1


a expressao (5.16) fica

Vers
ao de 29 de setembro de 2005.

Captulo 5

272/1304

m


F1 (t, Y )
F1 (t, y1 , . . . , ym )

..
..
F (t, Y ) =

=
.
.
Fm (t, Y )
Fm (t, y1 , . . . , ym )

Y (t) = F (t, Y (t)) .

(5.17)

Como veremos logo adiante, todo sistema de equacoes diferenciais ordinarias pode ser escrito como
um sistema equacoes diferenciais ordinarias de primeira ordem, escrito quer na forma (5.16), quer na
forma (5.17), para algum m e para alguma funcao F : m+1 m .


Sistemas lineares de primeira ordem


Muito importantes sao os sistemas de m equacoes diferenciais ordinarias lineares de primeira ordem,
os quais tem a forma
y 1 (t)
y 2 (t)

= a11 (t)y1 (t) + + a1m (t)ym (t) + b1 (t) ,


= a21 (t)y1 (t) + + a2m (t)ym (t) + b2 (t) ,
..
.

(5.18)

y m (t) = am1 (t)y1 (t) + + amm (t)ym (t) + bm (t) ,


para certas funcoes aij e bj de t.
No casos em que as funcoes bj acima sao identicamente nulas o sistema e dito ser homogeneo. Caso
contrario, e dito ser n
ao-homogeneo.
Representa
c
ao matricial de sistemas lineares
Como veremos, e muito conveniente escrever o sistema linear (5.18) acima em notaca
o matricial.
De fato, definindo,

y1 (t)
a11 (t) a1m (t)
b1 (t)

.. ,
..
Y (t) = ... ,
A(t) := ...
B(t) = ... ,
.
.
ym (t)
am1 (t) amm (t)
bm (t)

podemos escrever o sistema (5.18) como

Y (t) = A(t)Y (t) + B(t) ,


como facilmente se ve. Sistemas lineares de primeira ordem serao estudados em detalhe no Captulo 7
onde, em particular, faremos uso abundante da notacao matricial acima.
Equival
encia entre equa
co
es de ordem n e sistemas de EDOs

JCABarata. Curso de Fsica-Matem


atica

Captulo 5

Vers
ao de 29 de setembro de 2005.

273/1304

Provaremos agora um fato simples, mas de grande relevancia, tanto teorica quanto em aplicacoes
(analticas ou numericas), a saber, que toda equacao diferencial ordinaria de ordem n e equivalente a
um sistema de n equacoes de primeira ordem.
Seja a equacao diferencial ordinaria de ordem n
y (n) (t) = F (t, y(t), . . . , y (n1) (t)) .

(5.19)

Definindo yk (t) := y (k1) (t), para todo k = 1, . . . , n, teremos y1 (t) = y(t) e


y 1 (t)
y 2 (t)

= y2 (t) ,
= y3 (t) ,
..
.

(5.20)

y n1 (t) = yn (t) ,
y n (t)
= F (t, y1 (t), . . . , yn (t)) .
E. 5.1 Exerccio. Verifique!

Este e um sistema como (5.16), onde, aqui,


F1 (t, y1 , . . . , yn )
F2 (t, y1 , . . . , yn )

= y2 ,
= y3 ,
..
.

Fn1 (t, y1 , . . . , yn ) = yn ,
Fn (t, y1 , . . . , yn )
= F (t, y1 (t), . . . , yn (t)) .
Isso mostra que toda equacao diferencial ordinaria de ordem n, como (5.19), equivale a um sistema de
n equacoes de primeira ordem, como (5.20).
E. 5.2 Exerccio importante. Seja a equacao diferencial ordinaria linear de ordem n
y (n) (t) + an1 (t)y (n1) (t) + + a1 (t)y 0 (t) + a0 (t)y(t) = f (t) .
Determine o sistema linear de n equacoes de primeira ordem equivalente e mostre que o mesmo pode ser
escrito na forma matricial
Y (t) = A(t)Y (t) + B(t) ,
onde

y(t)
y 0 (t)
..
.

Y (t) :=
,
(n2)
y
(t)
(n1)
y
(t)

0
0
..
.

B(t) :=

0
f (t)

JCABarata. Curso de Fsica-Matem


atica

e A(t) e a matriz n n

A(t)

:=

Captulo 5

Vers
ao de 29 de setembro de 2005.

..
.

..
.

..

0
0

0
..
.

..

..

..

a0 (t) a1 (t) a2 (t)

an2 (t) an1 (t)

Equacao matriciais como a de acima serao estudadas com mais detalhe no Captulo 7.

274/1304

E. 5.3 Exerccio. Mostre que todo sistema de equacoes diferenciais ordinarias como (5.12) equivale
a um sistema de equacoes de primeira ordem. Sugest
ao: use a mesma ideia de acima, dando nomes `as
(nj )

derivadas yi

5.3

que aparecem no lado direito de (5.12).

Discuss
ao sobre Problemas de Valor Inicial

Problemas de valor inicial


Como e bem sabido, a solucao da equacao diferencial y(t)

= y(t) e dada por y(t) = cet, onde c e


uma constante, a qual pode ser fixada, por exemplo, prescrevendo-se o valor da funcao y em t = 0: y(0).
Ha outros exemplos simples em que a necessidade de fixacao de certos valores para a funcao y pode ser
vista de modo explcito. Considere-se a equacao do oscilador harmonico simples x + 02 x = 0. A solucao
geral dessa equacao e x(t) = A cos(0 t) + B sen (0 t), onde A e B sao duas constantes arbitrarias. Para
determina-las e preciso fornecer duas informacoes extra sobre a funcao, por exemplo, sua posicao e sua
velocidade em um instante de tempo. Se x0 e v0 forem a posicao e velocidade no instante t = 0, entao
e facil constatar que A = x0 e B = v0 /0 . Outro par de informacoes e tambem eventualmente possvel.
Por exemplo, podemos fornecer posicao e velocidade em outro instante de tempo que nao t = 0, ou
em dois instantes de tempo distintos, um para a posicao, outro para a velocidade. Em muitos casos e
possvel fixar a solucao desejada informando apenas a posicao em dois instantes de tempo distintos ou
as velocidades em dois instantes de tempo distintos.
De modo geral, para a determinacao completa da solucao de uma equacao diferencial ordinaria
de ordem n e preciso fornecer n informacoes sobre o valor da funcao e/ou suas derivadas em certos
instantes21 .
21
Uma exceca
o not
avel e a equaca
o de Clairaut, discutida na Seca
o 6.8, p
agina 301, que possui uma soluca
o, dita
soluca
o singular, n
ao depende de nenhum par
ametro livre.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

275/1304

O tipo de situacao mais comum para a determinacao completa da solucao de uma equacao diferencial
ordinaria de ordem n, especialmente em problemas da Mecanica, e aquele na qual sao fornecidas
informacoes sobre a funcao e suas n 1 primeiras derivadas em um u
nico instante de tempo, digamos
t = 0. Tais problemas sao conhecidos como problemas de valor inicial, ou problemas de Cauchy 22 .
O exemplo do oscilador harmonico acima e um tpico problema de valor inicial: qual e a funcao que
satisfaz a equacao diferencial x + 02 x = 0 e satisfaz x(0) = x0 e v(0) = v0 , para certos n
umeros x0 e v0
dados? Resposta: x(t) = x0 cos(0 t) + (v0 /0 ) sen (0 t).
Assim, o problema de valor inicial associado a` equacao de ordem n
y (n) (t) = F (t, y(t), . . . , y (n1) (t)) .
consiste em determinar a solucao dessa equacao que satisfaca
y(0) = y1 ,

y(0)

= y2 ,

y(0) = y3 , . . . , y (n1) (0) = yn ,

para certos n
umeros dados y1 , . . . , yn , os quais sao denominados condico
es iniciais ou dados iniciais.
Apos definirmos o que se entende por problema de valor inicial, uma serie de questoes se coloca.
1. Todo problema de valor inicial tem solucao? 2. Se tiver, e u
nica? 3. Ha condicoes suficientes para
garantir que uma solucao exista? 4. E para que seja u
nica? 5. E se existir solucao, sera ela valida
para todo t? 6. Ha condicoes suficientes para garantir que uma solucao exista para todo t? 7. Ha
condicoes suficientes para garantir continuidade da solucao em relacao a`s condicoes iniciais? 8. Ha
condicoes suficientes para garantir continuidade da solucao em relacao aos parametros que ocorrem na
equacao?
Por varias razoes as questoes acima sao muito importantes. Naturalmente, a melhor maneira de
mostrar que um problema de valor inicial tem solucao e exibindo a solucao. Isso, porem, nem sempre
e factvel, pois muitas equacoes sao difceis, ou mesmo impossveis, de se resolver de modo explcito.
Por exemplo, a equacao do pendulo simples + gl sen () = 0 tem solucao para quaisquer condicoes
iniciais, mas essa solucao nao pode ser apresentada de forma fechada em termos de funcoes elementares
conhecidas, apenas em termos de expansoes ou das chamadas funcoes elpticas. Vide, por exemplo,
[78]. (Para um tratamento da equacao do pendulo em termos de equacoes integrais, vide Secao 17.2,
pagina 889, destas Notas). Da a importancia da questao 3: e muitas vezes necessario saber a priori
se uma solucao existe antes de tentar encontra-la.
Saber a priori se um problema de valor inicial tem solucao e se essa solucao e u
nica pode ser
importante para justificar metodos de solucao. Muitas vezes, ao encontrarmos a solucao de um problema
de valor inicial perguntamo-nos se a solucao encontrada e u
nica. Por exemplo, pode-se facilmente
constatar que as funcoes x(t) = x0 cos(0 t) + (v0 /0 ) sen (0 t) sao solucoes da equacao do oscilador
harmonico simples x + 02 x = 0 com as condicoes iniciais x(0) = x0 e v(0) = v0 . O que, porem, garante
que nao ha outras funcoes que tambem sejam solucao dessa equacao para essas condicoes iniciais? Nisso
reside a importancia da questao 4: em se sabendo a priori que a solucao e u
nica (esse e o caso para a
equacao do oscilador harmonico simples) nao e necessario procurar outras solucoes.
Equacoes diferenciais de interesse em Fsica tipicamente dependem de certos parametros. Por
exemplo, a equacao do oscilador harmonico simples, acima, depende do parametro 0 , a equacao do
pendulo simples depende de g/l. Saber se a dependencia de uma solucao depende continuamente
22

Augustin Louis Cauchy (1789-1857).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

276/1304

de condicoes iniciais ou de parametros e importante em aplicacoes, por exemplo em Fsica, pois em


problemas reais tais dados sao freq
uentemente fornecidos com imprecisoes e e, portanto, importante
poder garantir que erros pequenos no conhecimento dessas grandezas tem efeitos igualmente pequenos
nas solucoes (ao menos para tempos nao muito afastados do instante inicial).
Comecemos por dizer que a resposta a`s questoes 1 e 2 e negativa. Veremos exemplos logo adiante.
Uma resposta a`s questoes 3 e 4 sera apresentada na forma de dois teoremas importantes, o de Peano
(Teorema 5.1, pagina 280), que fornece condicoes suficientes para garantir existencia de solucoes, e o
de Picard-Lindelof (Teorema 5.2, pagina 281. Vide tambem sua generalizacao para espacos de Banach,
Teorema 17.3, pagina 898), que fornece condicoes suficientes para garantir existencia e unicidade de
solucoes. Mostraremos em exemplos que a resposta a` questao 5 e tambem negativa. Uma resposta
parcial a` questao 6 (que e chamado de problema da existencia de solucoes globais) sera discutida na
Secao 5.3.3, pagina 282, e as demonstracoes dos resultados la apresentados encontram-se na Secao
17.3.2, pagina 902. As questoes 7 e 8 sao discutidas a` pagina 284 e, com mais detalhe, na Secao 17.3.3,
pagina 903. Vide Teorema 17.6, pagina 904, sua demonstracao e os comentarios que se lhe seguem.
Referencias para varias dessas questoes sao [1], [39], [23], [11] e [62].
Problemas bem-postos
Um comentario sobre nomenclatura. Na literatura sobre a teoria das equacoes diferenciais (ordinarias ou parciais), um problema no qual se possa garantir existencia, unicidade e continuidade de
solucoes em relacao a condicoes iniciais e de contorno em alguma topologia (estabilidade) e dito ser um
problema bem-posto23 .
Outros problemas que n
ao de valor inicial
Como ja mencionamos acima, ha outros problemas que nao o de valor inicial. Pode-se querer fixar
a funcao em dois pontos, por exemplo. Problemas desse tipo sao muito comuns em equacoes ordinarias
obtidas pelo metodo de separacao de variaveis em problemas de equacoes diferenciais parciais com
certas condicoes de contorno. Trataremos abundantemente desse tipo de problema quando discutirmos
o Problema de Sturm-Liouville no Captulo 12, pagina 606.
Outros problemas envolvem outros tipos de exigencia sobre a solucao. Por exemplo, que ela seja
finita em certos pontos, ou de quadrado integravel. Esse u
ltimo caso e comummente encontrado na
Mecanica Quantica.

5.3.1

Problemas de Valor Inicial. Patologias e Exemplos a se Ter em


Mente

Nesta secao listaremos alguns exemplos instrutivos de problemas de valor inicial que exibem comportamento patologico, como inexistencia ou nao-unicidade de solucao ou inexistencia de solucao global,
instrutivo ter alguns desses exemplos em
ou seja, inexistencia de solucao valida em toda a reta real. E
23

A noca
o de prolema bem-posto foi introduzida por Jacques Salomon Hadamard (1865-1963) ao listar propriedades
que modelos matem
aticos de sistemas fsicos devem idealmente possuir. Jaques Hadamard: Sur les probl`emes aux
derivees partielles et leur signification physique. Princeton University Bulletin, 4952 (1902).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

277/1304

mente. Na Secao 5.3.2, pagina 280, e na Secao 5.3.3, pagina 282, apresentaremos condicoes suficientes
para evitar essas patologias.
Inexist
encia de solu
c
ao
Exemplo 5.5 (Inexistencia de solucao) Considere-se o problema de valor inicial no qual procura-se a
solucao da equacao
1
y(t)

=
t
que satisfaca a condicao inicial y(0) = 0. Esse problema nao possui nenhuma solucao.

E. 5.4 Exerccio. Mostre isso.

Exemplo 5.6 (Inexistencia de solucao) Considere-se o problema de valor inicial no qual procura-se a
solucao da equacao
1
y(t)

=
y(t)
que satisfaca a condicao inicial y(0) = 0. Esse problema nao possui nenhuma solucao que seja real para
t > 0.

E. 5.5 Exerccio. Mostre isso.

Exemplo 5.7 (Inexistencia de solucao) Considere-se o problema de valor inicial no qual procura-se a
solucao da equacao
p
y(t)

=
1 y(t)2

que satisfaca a condicao inicial y(0) = 2. Esse problema nao possui nenhuma solucao real.
E. 5.6 Exerccio. Mostre isso.

Exemplo 5.8 (Inexistencia de solucao) (De [65]) Considere-se o problema de valor inicial no qual
procura-se a solucao da equacao
y(t)

= H(y(t)) ,
onde
H(y) :=

1, y < 0
,
1, y 0

com a condicao inicial y(0) = 0. Esse problema nao possui nenhuma solucao. Para entender por que,
observe que se y(0) = 0 entao, pela equacao diferencial, y 0 (0) = 1, o que implica y(t) e decrescente
para t proximo de 0, tornando-se negativa para t positivo proximo de 0. Mas para y negativo y(t)
vale
1 e y e crescente, uma contradicao.

E. 5.7 Exerccio. Certo?

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

278/1304

Exemplo 5.9 (Inexistencia de solucao) Considere-se o problema de valor inicial no qual procura-se a
solucao da equacao
y(t)

= 2(y(t))3/2
que satisfaca a condicao inicial y(0) = 1. Esse problema nao possui nenhuma solucao real.
E. 5.8 Exerccio. Mostre isso.

N
ao-unicidade de solu
co
es
Exemplo 5.10 (Nao-unicidade de solucoes) Considere-se o problema de valor inicial no qual procurase a solucao da equacao
y(t)

= 3(y(t))2/3
que satisfaca a condicao inicial y(0) = 0. Esse problema nao tem solucao u
nica. Por exemplo, as
funcoes
y1 (t) 0
e
y2 (t) = t3
ambas satisfazem a equacao diferencial e y1 (0) = y2 (0) = 0.
E. 5.9 Exerccio. Verifique!

O Exemplo 5.10, acima, foi encontrado por Peano em 1890. Ha varias outras solucoes, como vemos
na seguinte generalizacao.
Exemplo 5.11 (Nao-unicidade de solucoes) Seja 0 < < 1. Considere-se o problema de valor inicial
no qual procura-se a solucao da equacao
y(t)

1
|y(t)|
1

que satisfaca a condicao inicial y(0) = 0. Esse problema nao tem solucao u
nica: a funcao y(t) 0,
t , assim como, para todos c1 0, c2 0, as funcoes

(c1 t) 1 , t c1

0,
c1 < t < c 2 ,
yc1 , c2 (t) =
(5.21)

1
(t c ) 1
,
t c2
2

1
t < c2
(c1 t) 1 , t c1
0,
yc1 (t) =
,
yc2 (t) =
(5.22)
1

1
0,
t > c1
(t c2 ) , t c2


satisfazem a equacao diferencial e anulam-se em t = 0.

E. 5.10 Exerccio. Verifique! Desenhe graficos de varias funcoes y c1 , c2 (t), yc1 (t) e yc2 (t) para varios
valores de c1 0, c2 0.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

279/1304

Inexist
encia de solu
co
es globais
Exemplo 5.12 (Solucao que so existe em um intervalo finito) A equacao diferencial e aquela apresentada no Exemplo 5.8, acima, com condicao inicial y(0) = y0 > 0. Para < t < y0 a solucao e
y(t) = y0 t mas para t y0 surge a contradicao discutida no Exemplo 5.8 e a equacao diferencial nao
mais possui solucao.

Exemplo 5.13 (Solucao que diverge em tempo finito) Considere-se o problema de valor inicial no qual
procura-se a solucao real da equacao
y(t)

= y(t)2 ,
t

, que satisfaca a condicao inicial y(0) = y0




y(t) =

, y0 6= 0. A solucao e
1
y0

1
t

a qual diverge para t = 1/y0 .


Exemplo 5.14 (Solucao que diverge em tempo finito) Considere-se a equacao diferencial

(5.23)

y(t)

= 1 + y(t)2 ,
t . Sua solucao e y(t) = tan(t + k), onde k e fixada por uma condicao inicial. Se, por exemplo,
tomarmos y(0) = y0 , entao k = arctan(y0 ). Essa solucao, porem, existe apenas no intervalo aberto
(k 2 , k + 2 ), pois tan(t + k) diverge nos extremos.

Exemplo 5.15 (Solucao que diverge em tempo finito) Considere-se uma partcula de massa m que se
move em uma dimensao sob a acao de um potencial repulsivo U (x) = k4 x4 , com k > 0, com condicao
inicial x(0) = 0, x(0)

= v0 > 0. Sua equacao de movimento (a segunda lei de Newton) e


x(t) k 0 x(t)3 = 0 ,
onde k 0 = k/m. Qual o tempo que essa partcula leva para, partindo de x(0) = 0, chegar ao infinito?
A resposta e
Z
dx
q
T0 =
,
2
k 4
0
E
+
x
m
4
mv02
2

> 0 e a energia mecanica da partcula.

E. 5.11 Exerccio. Justifique a expressao dada acima para T 0 .

onde E =

Para E > 0 a integral acima e finita (Justifique!). Logo, a partcula leva um tempo finito para chegar
ao infinito, ou seja, x(t) diverge em tempo finito. Isso mostra que a solucao da equacao diferencial
x(t) k 0 x(t)3 = 0, com k 0 > 0 e v0 > 0, existe apenas em um intervalo finito de valores de t.
E. 5.12 Exerccio. Mostre que o mesmo se passa com as equacoes diferenciais x(t) k 0 x(t)d = 0, para
todo d > 1, desde que k 0 > 0. O que acontece se k 0 < 0? O que acontece se k 0 > 0 mas d 1?
6

JCABarata. Curso de Fsica-Matem


atica

5.3.2

Vers
ao de 29 de setembro de 2005.

Captulo 5

280/1304

Teoremas de Exist
encia e Unicidade de Solu
co
es

Os varios exemplos dados acima nao devem causar uma impressao negativa sobre problemas de valor
inicial pois, em verdade, os mesmos refletem patologias nem sempre encontradas na pratica (entendase, na Fsica). No caso da Mecanica, por exemplo, assim como em outras areas da Fsica, pode-se
garantir existencia e unicidade de solucao da maioria dos problemas de valor inicial. Os exemplos
de acima advertem-nos, porem, da necessidade de alguns teoremas gerais que fornecam pelo menos
condicoes suficientes para garantir existencia e/ou unicidade de problemas de valor inicial. Na teoria
das equacoes diferenciais ordinarias os mais importantes desses teoremas sao os de Peano 24 e de Picard25 Lindelof26 , os quais enunciaremos agora.
Teorema 5.1 Teorema de Peano (Exist
encia de Solu
co
es). Seja a equaca
o diferencial ordin
aria
real de primeira ordem
y(t)

= F (t, y(t))
(5.24)
(F sendo n
ao-identicamente nula) com a condica
o inicial
y(t0 ) = y0 .
com y0


. Seja F :

2


(5.25)

contnua no ret
angulo fechado

R = { (t, y) : |t t0 | a, |y y0 | b } ,

(5.26)

com a, b > 0, sendo, portanto, limitada em R. Seja


M := max |F (t, y)| .
(t, y)R

(5.27)

Ent
ao, o problema de valor inicial descrito pelas relaco
es (5.24) e (5.25) apresenta pelo menos uma
soluca
o. Alem disso, essa soluca
o existe pelo menos no intervalo fechado [t 0 , t0 + ], onde


b
:= min a,
.
(5.28)
M
2
Em essencia, o que esse teorema afirma e que se pode garantir a existencia de solucoes do problema
de valor inicial descrito pelas relacoes (5.24) e (5.25) se pelo menos a funcao F for contnua em um
retangulo centrado na condicao inicial.
A prova desse teorema, que e baseada no importante teorema de Ascoli-Arzel`a, nao sera apresentada
aqui e remetemos os estudantes aos bons livros (por exemplo, [39], [1], [23], [11] ou [62]).
O estudante pode (deve) verificar que os Exemplos 5.5 a 5.9, pagina 277, nao satisfazem as condicoes
do Teorema de Peano, da nao haver solucao naqueles casos.
24

Giuseppe Peano (1858-1932). O Teorema de Peano data de 1886.

Charles Emile
Picard (1856-1941).
26
Ernst Leonard Lindel
of (1870-1946). Seus trabalhos sobre existencia e unicidade de soluco
es de equaco
es diferenciais
ordin
arias datam de 1890.
25

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

281/1304

O teorema de Peano garante condicoes suficientes para existencia, mas nao para unicidade de
solucao. O estudante tambem pode (deve) verificar que os Exemplos 5.10 e 5.11, pagina 278 acima,
preciso requerer
satisfazem as condicoes do teorema de Peano, mas para eles nao vale a unicidade. E
mais da funcao F para ter-se unicidade da solucao. Isso e obtido com o proximo teorema.
Teorema 5.2 Teorema de Picard-Lindel
of (Exist
encia e Unicidade de Solu
co
es). Seja a
equaca
o diferencial ordin
aria real de primeira ordem
y(t)

= F (t, y(t))
(F :

2


(5.29)

sendo n
ao-identicamente nula) com a condica
o inicial
y(t0 ) = y0 ,

com y0


. Seja F :

2


(5.30)

contnua no ret
angulo fechado

R = { (t, y) : |t t0 | a, |y y0 | b } ,

(5.31)

com a, b > 0, sendo, portanto, limitada em R. Seja


M := max |F (t, y)| .

(5.32)

(t, y)R

o ao seu segundo argumento, ou seja,


Suponha ainda que F seja Lipschitz contnua em R com relaca
existe uma constante k (denominada constante de Lipschitz) tal que para todos (t, y), (t, v) R valha
|F (t, y) F (t, v)| k |y v| .

(5.33)

Ent
ao, o problema de valor inicial descrito pelas relaco
es (5.29) e (5.30) apresenta uma u
nica soluca
o.
Alem disso, essa soluca
o existe pelo menos no intervalo fechado [t 0 , t0 + ], onde


b
:= min a,
.
(5.34)
M
Uma condica
o suficiente para que a condica
o de Lipschitz acima se cumpra e que y f (t, y) exista e
seja limitada em todo R , em cujo caso a constante de Lipschitz seria dada por k := sup |y f (t, y)|.
(t, y)R

2
A prova do Teorema de Picard-Lindelof sera apresentada com bastante generalidade no Captulo
17, pagina 881. Vide Teorema 17.3, pagina 898.
importante notar que a condicao de F ser Lipschitz27 contnua em R com relacao ao seu segundo
E
argumento pode ser obtida de uma condicao mais forte, a saber, que a derivada parcial y F (t, y) de
F em relacao ao segundo argumento seja contnua em R. De fato, da relacao
Z v
F (t, v) F (t, u) =
y F (t, y) dy ,
u

27

Rudolf Otto Sigismund Lipschitz (1832-1903).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

282/1304



segue facilmente que F (t, v) F (t, u) k|v u|, onde k := max |y F (t, y)|, que e uma constante
(t, y)R

finita se y F (t, y) for contnua em R. Assim, em essencia, o que o Teorema de Picard-Lindelof afirma
e que se pode garantir a existencia e a unicidade de solucoes do problema de valor inicial descrito pelas
relacoes (5.29) e (5.30) se pelo menos a funcao F e sua derivada parcial y F (t, y) forem contnuas em
um retangulo centrado na condicao inicial.
Como comentario final, afirmamos que os teoremas de Peano e Picard-Lindelof podem ser facilmente
estendidos para sistemas de equacoes diferenciais de primeira ordem (em verdade, o Teorema 17.3,
pagina 898, ja e enunciado com essa generalidade). Como toda equacao diferencial de ordem n e
equivalente a um tal sistema, essas generalizacoes garantem condicoes suficientes para existencia ou
unicidade de solucao de equacoes diferenciais ordinarias de qualquer ordem.
No caso de equacoes diferenciais parciais nao existem teoremas tao fortes relativos a` existencia
e unicidade de problemas de valor inicial como ha no caso de equacoes diferenciais ordinarias. Um
dos resultados mais importantes nessa direcao, porem, e o Teorema de Cauchy-Kovalevskaya 28 . Seu
enunciado e sua demonstracao podem ser encontrados, por exemplo, em [27, 28].

5.3.3

Solu
co
es Globais

Vimos nos Exemplos 5.12 a 5.15 (pagina 279) que ha equacoes diferencias cujas solucoes, ainda que
existam e sejam eventualmente u
nicas, nao sao globais, ou seja, nao podem ser definidas em toda
reta real. A questao que naturalmente se coloca e a de encontrar condicoes suficientes para garantir
a existencia de solucoes globais. Essa e uma vasta questao e nos limitaremos aqui a apresentar o
resultado mais simples, o Teorema 5.3, abaixo. Igualmente importante e a questao de se demonstrar
que uma determinada equacao diferencial nao possui solucoes globais (se tal puder ser o caso). Um dos
principais resultados da Teoria da Relatividade Geral e da Cosmologia, a existencia do chamado big
bang em uma classe bastante grande de modelos para o universo, foi tratado como um problema de
nao-existencia de solucoes globais de determinadas equacoes diferenciais. Vide [56].
O seguinte teorema, cuja demonstracao e apresentada com mais generalidade na Secao 17.3.2, pagina
902, apresenta condicoes suficientes para a existencia de solucoes globais.
Teorema 5.3 (Exist
encia e unicidade de solu
co
es globais) Seja F : 2 contnua em todo
2
. Suponhamos tambem que para todo a > 0, a funca
o F seja Lipschitz contnua em relaca
o ao seu
segundo argumento na faixa


Fa, t0 = (t, y) 2 : |t t0 | a , y arbitr
ario ,


ou seja, para cada a > 0 existe uma constante ka (eventualmente dependente de a e denominada
constante de Lipschitz) tal que para todos (t, y), (t, v) Fa, t0 vale |F (t, y) F (t, v)| ka |y v|.
Ent
ao, para qualquer x0 , o problema de valor inicial x(t)

= F (t, x(t)) com x(t0 ) = x0 apresenta


uma soluca
o u
nica v
alida para todo t .


Uma condica
o suficiente para que a condica
o de Lipschitz acima se cumpra e que y F (t, y) exista
em todo 2 e seja limitada em cada faixa Fa, t0 , em cujo caso as constantes de Lipschitz podem ser
escolhidas como ka := sup |y F (t, y)|.
2


(t, y)Fa, t0

28

Sofia Vasilyevna Kovalevskaya (1850-1891).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

283/1304

E. 5.13 Exerccio. Mostre que a equacao diferencial nao-linear x = cos(x) satisfaz as condicoes do
Teorema 5.3 e, portanto, possui solucoes globais. Mostre explicitamente, por integracao, que as solucoes
sao dadas por x(t) = arctan ( senh (t + c)), onde c e uma constante a ser fixada pela condicao inicial. Por
6
essa expressao explcita contata-se claramente que as solucoes existem para todo t .


E. 5.14 Exerccio(de [22]). Mostre que a equacao diferencial nao-linear


x =

x3 e t
+ t2 cos(x)
1 + x2

satisfaz as condicoes do Teorema 5.3. Sugestao: mostre que para esse caso
(y 4 + 3y 2 ) t
F
(t, y) =
e t2 sen (y) e, portanto, em cada faixa Fa, t0 ,
2
y
(1 + y )
e podemos adotar ka = 3ea + a2 para cada a > 0.



F


3ea + a2 ,
(t,
y)
y

E. 5.15 Exerccio. A equacao diferencial nao-linear x = x 2 nao satisfaz as condicoes do Teorema 5.3,
pois a condicao de Lipschitz requerida nao e satisfeita em nenhuma faixa F a, t0 . Mostre isso. Com efeito,
vimos no Exemplo 5.13, da pagina 279 que essa equacao nao possui solucoes globais. Vide tambem os
comentarios da pagina 284 sobre esse problema.
6
E. 5.16 Exerccio. Faca o mesmo para o Exemplo 5.14, pagina 279.

Coment
arios sobre solu
co
es globais. O Exemplo 5.10
Analisemos agora o Exemplo 5.10, pagina 278 sob a luz dos Teoremas de Peano e de Picard-Lindelof.
Aqui, F (t, y) = 3y 2/3 , t0 = 0, y0 = 0. Tomando-se um retangulo fechado centrado em (t0 , y0 ) = (0, 0),
ou seja, R = { (t, y) : |t| a, |y| b }, constata-se elementarmente que F e contnua e que
M := max |F (t, y)| =
(t, y)R

max 3y 2/3 = 3b2/3 .

y[b, b]

Assim, o Teorema de Peano


n garante
o a existencia de solucao para o intervalo fechado [, ], onde


b
b1/3
:= min a, M = min a, 3
(vide (5.28)). Os valores de a e de b podem ser escolhidos arbitrariamente grandes, sem violar a condicao de continuidade de F . Conclui-se disso que podemos tomar
arbitrariamente grande. Assim, nesse particular exemplo, o Teorema de Peano garante-nos a existencia
de uma solucao global, para todo t. Isso condiz com a observacao que a solucao identicamente nula,
bem como as solucoes (5.21) e (5.22) existem para todo t.
Por fim, e facil verificar que a funcao F (t, y) = 3y 2/3 nao satisfaz a condicao de Lipschitz |F (t, y)
F (t, v)| k|y v| para nenhum k em nenhum retangulo centrado em (0, 0). Para isso observe que
se tomassemos v = 0 e y 0, a condicao de Lipschitz diria que 3y 2/3 ky, ou seja, 3y 1/3 k. Mas
uma tal desigualdade e impossvel, pois para y 0 o lado esquerdo diverge!

Isso justifica por que nao se pode aplicar Picard-Lindelof nesse caso (e a solucao, de fato, nao e
u
nica).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

284/1304

Coment
arios sobre solu
co
es globais. O Exemplo 5.13
O fato de o Teorema de Peano em princpio garantir apenas uma regiao conservadora de validade
de solucao, a saber o intervalo [t0 , t0 + ], onde e dado pela expressao (5.28), nao esta em
desacordo com os exemplos: ha sistemas satisfazendo as condicoes do Teorema de Peano para os quais
nao ha solucoes globais, ou seja, solucoes que existem para todo t . O Exemplo 5.13, pagina
279, e um tal caso. Vamos reanalisa-lo sob a luz dos Teoremas de Peano e Picard-Lindelof, estudando
particularmente o que o Teorema de Peano nos diz sobre a regiao de existencia de solucao.
bastante claro que no Exemplo 5.13 tem-se F (t, y) = y 2 , e t0 = 0 com y0 > 0. Tomando-se
E
um retangulo fechado centrado em (t0 , y0 ) = (0, y0 ), ou seja, R = { (t, y) : |t| a , |y y0 | b },
constata-se elementarmente que F e contnua e que


M := max |F (t, y)| =


(t, y)R

max

y[y0 b, y0 +b]

y 2 = (y0 + b)2 .

O Teorema de Peano
n garante ao existencia de solucao para o intervalo fechado [, ], onde :=


b
b
min a, M = min a, (y0 +b)
. O valor de a pode ser escolhido arbitrariamente grande, sem alterar
2
o valor de M e sem violar a condicao de continuidade de F . Conclui-se disso que podemos tomar
=

b
.
(y0 + b)2

um exerccio facil (faca-o!) mostrar


Para qual escolha de b a constante assume seu maior valor? E
que o lado direito da u
ltima expressao assume seu maximo em b = y0 , em cujo caso
=

1
.
4y0

Assim, o Teorema de Peano garante existencia de solucao no intervalo [ 4y10 , 4y10 ]. Sabemos, porem
que a solucao (5.23) existe em um intervalo maior (e que contenha t = t0 = 0), a saber (, y10 ).
O que se aprende disso e que o intervalo de solucao obtido pela estimativa (5.28) nem sempre e
maximal, mas nem por isso contradiz-se o fato de nesse caso nao haver solucao valida para todo t.
Para sabermos se a solucao e u
nica, devemos estudar as condicoes do Teorema de Picard-Lindelof.
Sabemos que F (t, y) F (t, v) = y 2 v 2 = (y + v)(y v) . Logo, |F (t, y) F (t, v)| = |y + v| |y v|
e, para y e v no intervalo [y0 b, y0 + b], tem-se |y + v| 2(y0 + b). Assim, adotando-se k = 2(y0 + b),
vale a condicao de Lipschitz
|F (t, y) F (t, v)| k|y v|
para todos (t, y), (t, v) R. Assim, a solucao do problema do Exemplo 5.13 sera u
nica para quaisquer
a e b que se tome.

5.3.4

Depend
encia Contnua de Condi
co
es Iniciais e de Par
ametros

Conforme mencionamos na pagina 275, e importante determinarmos condicoes sob as quais a solucao
de um problema de valor inicial e contnua em relacao a`s condicoes iniciais e a parametros que ocorram
na equacao diferencial. Essas questoes sao respondidas com bastante generalidade e detalhe na Secao

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 5

285/1304

17.3.3, pagina 903. Vide Teorema 17.6, pagina 904, sua demonstracao e comentarios que se lhe seguem.
Os resultados encontram-se resumidos nos dois teoremas abaixo, os quais valem tambem para sistemas
de equacoes diferenciais ordinarias.
Teorema 5.4 Seja a equaca
o diferencial ordin
aria real de primeira ordem y(t)

= F (t, y(t)) (F :
2
ao-identicamente nula) com a condica
o inicial y(t0 ) = y0 , com y0 , e suponhamos
sendo n
que sejam satisfeitas as condico
es descritas no Teorema 5.2, p
agina 281, de modo que se garanta a
existencia de uma soluca
o u
nica y(t, y0 ) do problema de valor inicial em um intervalo [t0 , t0 + ].
Ent
ao, existe uma vizinhanca J de y0 onde a soluca
o y(t, y0 ) depende continuamente de y0 . Mais
precisamente, existe uma constante > 0 e uma vizinhanca T de t0 contida em [t0 , t0 + ] tal que
vale |y(t, y0 ) y(t, y00 )| |y0 y00 |e|tt0 | para todo y00 J e todo t T .
2


Teorema 5.5 Seja a equaca


o diferencial ordin
aria real de primeira ordem e dependente de um par
ametro
p: y(t)
= F (t, y(t), p) (F : 2 sendo n
ao-identicamente nula) com a condica
o inicial y(t0 ) = y0 ,
com y0 , e suponhamos que sejam satisfeitas as condico
es descritas no Teorema 5.2, p
agina 281,
de modo que se garanta a existencia de uma soluca
o u
nica y(t, p) do problema de valor inicial em um
intervalo [t0 , t0 + ]. Suponhamos tambem que F seja contnua e continuamente diferenci
avel em
relaca
o a p em alguma vizinhanca. Ent
ao, y(t, p) depende continuamente de p nessa vizinhanca. 2


Captulo 6
Alguns M
etodos de Resoluc
ao de Equaco
es
Diferenciais Ordin
arias
Conte
udo
6.1

Solu
ca
o de Equa
co
es Ordin
arias Lineares de Primeira Ordem . . . . . . . 286

6.2

As Equa
co
es de Bernoulli e de Riccati . . . . . . . . . . . . . . . . . . . . . 287

6.3

Integra
ca
o de Equa
co
es Separ
aveis . . . . . . . . . . . . . . . . . . . . . . . 290

6.4

O M
etodo de Varia
ca
o de Constantes . . . . . . . . . . . . . . . . . . . . . 291

6.5

O M
etodo de Substitui
ca
o de Pr
ufer . . . . . . . . . . . . . . . . . . . . . . 293

6.6

O M
etodo de Invers
ao

6.7

Solu
ca
o de Equa
co
es Exatas e o M
etodo dos Fatores Integrantes . . . . . 296

6.8

Solu
co
es das Equa
co
es de DAlembert-Lagrange e Clairaut . . . . . . . . 301

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295

problema de encontrar de metodos de resolucao de equacoes diferenciais ordinarias tem cativado a imaginacao e instigado a engenhosidade de geracoes de cientistas e matematicos.
Muitas informacoes sobre o comportamento de solucoes de equacoes diferenciais ordinarias
podem ser obtidas sem que essas solucoes sejam conhecidas explicitamente, mas esse conhecimento explcito e muitas vezes desejavel, pois assim o poder de previsao de teorias e modelos torna-se
evidentemente maior. Neste captulo apresentaremos algumas das diversas situacoes felizes nas quais
metodos de resolucao de equacoes diferenciais ordinarias foram encontrados. Todos os metodos apresentados tem sua validade e sua eficacia limitadas a certas classes de equacoes. No Captulo 8, pagina 394,
desenvolveremos com bastante detalhe metodos de solucao de equacoes lineares baseados em expansoes,
a saber, o metodo de expansao em series de potencias e o metodo de Frobenius, validos para equacoes
diferenciais lineares gozando de certas propriedades de analiticidade. Com o proposito de centrar a
discussao nos metodos de solucao, nao trataremos aqui de questoes relativas a` continuidade de solucoes
em relacao a parametros e condicoes iniciais e ao domnio de validade de solucoes. Essas questoes sao
discutidas na Secao 5.3, pagina 274. Metodos iterativos, perturbativos ou numericos tambem nao serao
discutidos aqui. Dada a profusao de metodos de solucao de equacoes diferenciais (uma ciencia que se
desenvolve ja ha mais de trezentos anos!), nossa apresentacao sera, reconhecidamente, limitada. Para
um texto introdutorio sobre equacoes diferenciais ordinarias centrado em metodos de solucao, vide [14].

6.1

Solu
c
ao de Equa
co
es Ordin
arias Lineares de Primeira Ordem

Equacoes diferenciais ordinarias lineares de primeira ordem sao particularmente interessantes pois, sob
hipoteses simples, e possvel apresentar solucoes gerais para as mesmas e de modo relativamente facil.
286

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

287/1304

Infelizmente a mesma facilidade nao e encontrada para o caso das equacoes diferenciais lineares de
ordem dois ou maior. Considere-se a equacao diferencial ordinaria linear de primeira ordem
y(t)
+ a(t)y(t) = b(t) ,
para funcoes a e b :
defina-se


(6.1)

, contnuas. Vamos mostrar como resolver uma tal equacao. Para tal,

Z t
a( )d .
p(t) := exp
0

Multiplicando-se (6.1) por p(t) e usando o fato que p(t)


= a(t)p(t), teremos
d
[p(t)y(t)] = p(t)b(t) ,
dt
donde conclui-se que
1
y(t) =
p(t)

y(0) +

p(s)b(s) ds
0

= p(t) y(0) +

t
0


p(t)1 p(s) b(s) ds .

E. 6.1 Exerccio. Complete os detalhes.

(6.2)

Essa expressao representa a solucao geral de (6.1), a qual depende do valor de y(0), a ser especificado
(condicao inicial).
E. 6.2 Exerccio. A solucao (6.2) e daR forma (5.10), pois p(t) 1 e solucao da equacao homogenea
t
y(t)
+ a(t)y(t) = 0 enquanto que p(t)1 0 b( )p( ) d e solucao particular da equacao nao-homogenea
(6.1). Verifique essas afirmacoes.
6

Rt
Naturalmente, para o calculo explcito de y e necessario calcular a integral 0 a( )d que aparece
Rt
na definicao de p, assim como, numa segunda etapa, a integral 0 b( )p( )d . Como essas funcoes sao
conhecidas, isso pode ser possvel, em princpio, mas nem sempre obtem-se formulas explcitas para as
mencionadas integrais. Ainda assim, (6.2) representa a solucao completa do problema. Na pior das
hipoteses as integrais mencionadas podem ser calculadas numericamente de modo aproximado.

A solucao (6.2) de (6.1) pode ser reobtida com o metodo dos fatores integrantes, tal como descrito
no Exemplo 6.3, pagina 299.

6.2

As Equa
co
es de Bernoulli e de Riccati

A equa
c
ao de Bernoulli
Para a e b :
primeira ordem


, ambas contnuas, a equacao diferencial ordinaria nao-linear homogenea de


y(t)
+ a(t)y(t) + b(t)y(t)2 = 0

(6.3)

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

288/1304

e denominada equaca
o de Bernoulli1 . Apesar desta equacao ser um dos representantes mais simples
da classe das equacoes diferenciais nao-lineares, a nao-linearidade da mesma nao acrescenta nenhuma
barreira a` sua solubilidade, pois a simples substituicao y(t) = 1/v(t) conduz a` equacao
v(t)
a(t)v(t) b(t) = 0
que e linear e tem por solucao (vide acima)
1
v(t) =
p(t)
onde

v(0) +

b( )p( ) d
0

 Z t

p(t) := exp
a( ) d .
0

Portanto, a solucao geral de (6.3) e

y(t) = 

v(0) +

p(t)
t

b( )p( ) d
0

.

E. 6.3 Exerccio. Complete os detalhes.

E. 6.4 Exerccio. Determine a solucao geral da equacao de Bernoulli generalizada


y(t)
+ a(t)y(t) + b(t)y(t)n = 0 ,
1

n 6= 1. Sugestao: Defina v por y(t) = v(t) 1n e proceda como acima.

As equacoes de Bernoulli sao um caso particular de uma classe maior de equacoes diferenciais
ordinarias nao-lineares, as chamadas equaco
es de Riccati generalizadas.
A equa
c
ao de Riccati generalizada
Para a, b e c :
primeira ordem


, contnuas, a equacao diferencial ordinaria nao-linear nao-homogenea de


y(t)
+ a(t)y(t) + b(t)y(t)2 + c(t) = 0

(6.4)

e denominada equacao de Riccati2 .


Ao contrario da equacao de Bernoulli, a equacao de Riccati generalizada nao e, em geral, sol
uvel.
Apenas em casos particulares ha solucoes mais ou menos explcitas para as mesmas, normalmente em
termos de expansoes em serie, como expansoes em serie de potencias.
Apesar de sua nao-solubilidade generica (em contraposicao com a equacao de Bernoulli, que e
tambem nao-linear mas sol
uvel), e possvel obter a solucao geral de (6.4) se uma solucao particular sua
1
2

Jacob Bernoulli (1654-1705). Vide nota hist


orica a
` p
agina 289.
Jacopo Francesco Riccati (1676-1754).

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

289/1304

for conhecida. De fato, se u e uma solucao particular conhecida de (6.4) entao a solucao geral e da
forma
y(t) = u(t) + v(t) ,
onde v obedece a` equacao de Bernoulli
v(t)
+ [a(t) + 2b(t)u(t)]v(t) + b(t)v(t)2 = 0 .
E. 6.5 Exerccio.
de (6.4).

Verifique isso, substituindo y = u + v em (6.4) e usando a hipotese que u e solucao


6

Assim, conhecida a funcao u, a solucao geral da equacao de Riccati generalizada e


y(t) = u(t) +
w0

p1 (t)
t

b( )p1 ( ) d
0

onde w0 = 1/(y(0) u(0)), para y(0) 6= u(0), e uma constante e onde


Z t

p1 (t) := exp
[a( ) + 2b( )u( )] d .
0

E. 6.6 Exerccio. Complete os detalhes.

Observemos que qualquer equacao diferencial ordinaria linear homogenea de segunda ordem associase naturalmente a uma equacao de Riccati generalizada. De fato, dada a equacao

com a e b :


w(t)
+ a(t)w(t)
+ b(t)w(t) = 0 ,
Z t

contnuas, o Ansatz w(t) = exp
y( )d conduz a
0

y(t)
+ a(t)y(t) + y(t)2 + b(t) = 0 ,
que e uma equacao de Riccati generalizada.
E. 6.7 Exerccio. Complete os detalhes.

Nota Hist
orica
A equacao de Riccati generalizada deve seu nome ao matematico e conde veneziano Iacopo Francesco
Riccati (1676-1754), que estudou a equacao diferencial

y 0 (x) = y 2 (x) + xn ,
(6.5)
com constante e n

, em monografia publicada em 1724 sem, no entanto, resolve-la. A equacao


y 0 (x) = y 2 (x) + x2

(6.6)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

290/1304

fora previamente estudada por Johann Bernoulli (1667-1748) em trabalho de 1694, sem que este apresentasse solucao para a mesma. Jacob Bernoulli (1654-1705), que honrou com seu nome a equacao (6.3),
resolvida por ele em 1696, tambem estudara (6.6) e encontrara em 1703 uma solucao para a mesma em
termos de uma razao de serie de potencias, que entao expressou como uma serie de potencias simples.
Somente em 1841 Joseph Liouville (1809-1882) demonstrou que a solucao de (6.6) nao pode ser expressa
em termos de funcoes elementares. Em notacao moderna a solucao geral de (6.6) e
 2 
 2

x
x
+
J
AJ
3/4
3/4

2
2
 2 
 2
,
y(x) = x

x
x
J1/4
AJ1/4
2
2

onde A e uma constante e J sao funcoes de Bessel de primeiro tipo e ordem .

Equacoes do tipo (6.5) sao hoje denominadas simplesmente equaco


es de Riccati. A associacao
do nome de Riccati a tais equacoes (e nao dos nomes de Johann Bernoulli ou Jacob Bernoulli) e
parcialmente devida ao fato de (6.5) ser ligeiramente mais geral que (6.6) e a`s referencias ao trabalho
de Riccati feitas por outro Bernoulli, Daniel Bernoulli (1700-1782), que estudou as equacoes (6.5) em
trabalho datado de 1725. Daniel Bernoulli menciona que solucoes de equacoes como (6.5) foram obtidas
anteriormente por Johann Bernoulli, Nicolaus Bernoulli e Nicolaus Bernoulli II. A desconsideracao de
Daniel Bernoulli pela contribuicao previa de seu tio Jacob Bernoulli deve-se talvez a` rivalidade deste
com seu irmao Johann Bernoulli, pai de Daniel Bernoulli, mas talvez seja meramente conseq
uencia do
fato de sua epoca nao estar ainda preparada para aceitar solucoes de equacoes diferenciais em termos
de series infinitas. De fato, em seu trabalho, Daniel Bernoulli preocupou-se em apontar casos em que
(6.5) pode ser resolvida por series finitas, a saber, quando n e a forma 4m/(2m 1), com m inteiro.
O metodo acima descrito de obter a solucao geral da equacao de Riccati generalizada a partir de
uma solucao particular e devido a Leonhard Euler (1707-1783) e publicado em 1764.

Para mais notas historicas sobre as equacoes (6.5) e (6.6) e sua relacao com as funcoes de Bessel,
vide por exemplo [131], Captulo I.

6.3

Integra
c
ao de Equa
co
es Separ
aveis

Entre as equacoes diferenciais de resolucao mais simples encontram-se as chamadas equacoes separaveis.
Uma equacao diferencial ordinaria de primeira ordem e dita ser uma equaca
o separ
avel 3 se for da forma
y 0 (x) = f (x)g(y(x)) ,

(6.7)

para funcoes f e g convenientes. Consideremos a condicao inicial y(x0 ) = y0 para algum x0 . Definindo,
Z x
Z x
1
A(x) :=
ds
e
B(x) :=
f (s)ds ,
x0 g(s)
x0
3

H
a tambem uma noca
o de equaca
o separ
avel na teoria das equaco
es diferenciais parciais (vide Seca
o 11.2, p
agina
587), mas trata-se de outra coisa.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

291/1304

caso as integrais existam, teremos,


1
d
A(y(x)) = A0 (y(x))y 0 (x) =
y 0 (x)
dx
g(y(x))

B 0 (x) = f (x) .

d
A(y(x)) = B 0 (x) e A(y(x)) = B(x) + c, c sendo uma constante. Como B(x0 ) = 0, segue que
Logo, dx
c = A(y0 ). Se a funcao A possuir uma inversa em algum aberto em torno de y0 , teremos

y(x) = A1 (B(x) + A(y0 ))


como solucao de (6.7) em um aberto em torno de x0 .
interessante notar que, pelo Teorema da Funcao Inversa4 , A e invertvel em um aberto torno de
E
y0 se A for contnua e A0 (y0 ) 6= 0. Assim, a condicao g(y10 ) 6= 0 garante a existencia da solucao y dada
acima em uma vizinhanca de x0 .
E. 6.8 Exerccio. Determine a solucao de
y 0 (x) =

3x7 5x2 1
,
1 + y2

com y(0) = 0.

E. 6.9 Exerccio. Determine a solucao de


y 0 (x) =

(1 + x2 )
,
cos(y(x))

com y(0) = y0 . Estude os varios casos.

6.4

O M
etodo de Varia
c
ao de Constantes

Seja a equacao linear nao-homogenea


y 00 (x) + a(x)y 0 (x) + b(x)y(x) = f (x) ,

(6.8)

definida em um certo intervalo aberto I , com f contnua por partes, e vamos supor que sejam
conhecidas duas solucoes independentes y1 e y2 da equacao homogenea y 00 (x)+a(x)y 0 (x)+b(x)y(x) = 0.
O metodo de variaca
o de constantes consiste em determinar funcoes v 1 e v2 tais que a combinacao


yv (x) = v1 (x)y1 + v2 (x)y2 (x) ,

(6.9)

seja solucao da equacao nao-homogenea (6.8). A denominacao do metodo como de variacao de constantes, uma contradicao em termos, provem do fato de que, como e bem sabido, a solucao geral da
equacao homogenea e v1 y1 (x) + v2 y2 (x) para v1 e v2 constantes.
Substituindo (6.9) em (6.8), e usando as hipoteses que y100 + ay10 + by1 = 0 e y200 + ay20 + by2 = 0,
obtem-se
[v10 y1 + v20 y2 ]0 + a[v10 y1 + v20 y2 ] + [v10 y10 + v20 y20 ] = f .
(6.10)
4

Vide Seca
o 17.4, p
agina 907, ou qualquer bom livro de C
alculo de funco
es de v
arias vari
aveis, por exemplo, [26, 87, 88].

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

292/1304

E. 6.10 Exerccio. Complete os detalhes que levam `a u


ltima expressao.

Para determinar as duas funcoes v1 e v2 e preciso acrescentar mais uma equacao diferencial envolvendo ambas as funcoes. A escolha dessa equacao extra e essencialmente arbitraria, mas uma analise
de (6.10) mostra ser muito conveniente impor a relacao v10 y1 + v20 y2 = 0 pois a expressao v10 y1 + v20 y2
aparece nos dois primeiros termos. Com isso, chegamos ao sistema de equacoes
v10 y1 + v20 y2 = 0 ,
v10 y10 + v20 y20 = f ,
que sao equacoes algebricas para v10 e v20 , fornecendo
v10 =

y1 f
,
y10 y2

v20 = +

y1 y20

cujas solucoes sao


Z x
y2 (s)f (s)
v1 (x) =
ds + c1 ,
0
0
x0 y1 (s)y2 (s) y1 (s)y2 (s)

y2 f
,
y10 y2

y1 y20

v2 (x) = +

x
x0

y1 (s)f (s)
ds
0
y1 (s)y2 (s) y10 (s)y2 (s)

+ c2 ,

sendo x0 I e c1 , c2 duas constantes de integracao. A expressao Wy1 , y2 (x) := y1 (x)y20 (x) y10 (x)y2 (x)
e denominada determinante Wronskiano5 e nao se anula pois, por hipotese, y1 e y2 sao independentes.
Assim, a solucao procurada yv (x) = v1 (x)y1 (x) + v2 (x)y2 (x) tem a forma

Z x
y1 (s)y2 (x) y1 (x)y2 (s)
yv (x) = [c1 y1 (x) + c2 y2 (x)] +
f (s) ds
y1 (s)y20 (s) y10 (s)y2 (s)
x0
= [c1 y1 (x) + c2 y2 (x)] +

x
x0

y1 (s)y2 (x) y1 (x)y2 (s)


Wy1 , y2 (s)

f (s) ds ,

para um ponto x0 I arbitrario e constantes arbitrarias c1 e c2 a serem fixadas por condicoes iniciais
em x0 . O estudante deve observar que o termo [ ] da u
ltima expressao acima e uma solucao da
equacao homogenea e o u
ltimo e uma solucao particular da equacao nao-homogenea.
Uma observacao simples permite reescrever a u
ltima expressao de uma forma por vezes mais conveniente. Se a e contnua por partes, e facil constatar que
d
ds
=


"

Wy1 , y2 (s) exp

y200 (s)

Z

a( ) d
x0

a(s)y20 (s)


i

+ b(s)y2 (s) y1 (s)

y100 (s)

a(s)y10 (s)

+ b(s)y1 (s) y2 (s) exp

Z

a( ) d
x0

= 0,
5

Conde Josef Hoene de Wronski (1778-1853).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

293/1304

pois y1 e y2 sao solucoes da equacao homogenea. Com isso, conclumos que


 Z s

Wy1 , y2 (s) = Wy1 , y2 (x0 ) exp
a( ) d .
x0

Sempre podemos escolher as funcoes y1 e y2 de forma que satisfacam y1 (x0 ) = 1, y10 (x0 ) = 0, y2 (x0 ) = 0,
y20 (x0 ) = 1. Nesse caso Wy1 , y2 (x0 ) = 1 e conclumos que
Z s

Z x

yv (x) = [c1 y1 (x) + c2 y2 (x)] +
exp
a( ) d
y1 (s)y2 (x) y1 (x)y2 (s) f (s) ds .
x0

x0

Com essas escolhas, e facil ver que yv (x0 ) = c1 e yv0 (x0 ) = c2 .


No Captulo 7, pagina 306, o metodo de variacao de constantes sera reencontrado por outros caminhos e sera tratado com mais generalidade, de modo a tambem incluir equacoes de ordem n e nao
apenas de segunda ordem, como fizemos acima.

6.5

O M
etodo de Substitui
c
ao de Pr
ufer

Esse elegante metodo aplica-se a` solucao de certas equacoes diferenciais ordinarias e lineares e homogeneas de segunda ordem da forma

0
p(x)y 0 (x) + q(x)y(x) = 0 ,
(6.11)

para x [a, b] , sendo p contnua e diferenciavel, p(x) > 0 e q contnua. O chamado metodo de
substituica
o de Pr
ufer6 consiste em definir duas novas funcoes e por


y(x) = (x) sen ((x)) ,

p(x)y 0 (x) = (x) cos((x))

(6.12)

e transformar o problema de resolver a equacao diferencial de segunda ordem para y no problema de


resolver um sistema de duas equacoes diferenciais de primeira ordem para e . Como o leitor pode
perceber, a mudanca acima pode ser interpretada como a passagem a coordenadas polares no espaco de
fase bidimensional definido por (y(x), p(x)y 0 (x)). Obtemos o sistema equacoes para e da seguinte
forma. Em primeiro lugar, observamos que diferenciando a equacao do lado esquerdo de (6.12), tem-se
y 0 (x) = 0 (x) sen ((x)) + (x) cos((x)) 0 (x) .
Multiplicando-se por p e usando a equacao do lado direito de (6.12), obtemos
0 (x)p(x) sen ((x)) + (x)p(x) cos((x)) 0 (x) = (x) cos((x)) .
Em segundo lugar, inserindo-se a equacao do lado direito de (6.12) em (6.11), tem-se
0 (x) cos((x)) (x) sen ((x)) 0 (x) = q(x)(x) sen ((x)) .
6

Ernst Paul Heinz Pr


ufer (1896-1934). A referencia para trabalho de Pr
ufer e H. Pr
ufer, Neue Herleitung der
Sturm-Liouvilleschen Reihenentwicklung stetiger Funktionen. Math. Ann., 95, 499-518 (1926).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

Dessas duas u
ltimas igualdades podemos facilmente obter 0 e 0 :

2
2
1 
0
(x) = q(x) sen ((x)) +
cos((x)) ,
p(x)


1
(x)
0
q(x) sen (2(x)) ,
(x) =
2
p(x)
E. 6.11 Exerccio. Verifique!

294/1304

(6.13)

(6.14)
6

Esse e o sistema de equacoes procurado. Um aspecto notavel do mesmo e que a primeira equacao
envolve apenas . Se for possvel resolver essa equacao, obtendo a funcao (x), a solucao da segunda
equacao seria


 Z x
1
1
q(y) sen (2(y)) dy ,
(6.15)
(x) = (a) exp
2 a
p(y)
e, pela pela primeira equacao de (6.12), teramos a solucao


 Z x
1
1
q(y) sen (2(y)) dy sen ((x)) .
y(x) = (a) exp
2 a
p(y)
Uma feliz situacao particular na qual a equacao para pode ser resolvida facilmente e aquela na
1
qual p(x)
= q(x), em cujo caso ficamos com 0 (x) = q(x), 0 (x) = 0, ou seja,
Z x
(x) = (a) +
q(y) dy
(x) = (a) .
a

Assim, teramos pela primeira equacao de (6.12) a solucao geral


Z x

y(x) = c1 sen
q(y) dy + c2 ,
a

para duas constantes c1 e c2 (aqui, c1 (a) e c2 (a)).


E. 6.12 Exerccio. Resolva a equacao do oscilador harmonico simples x + 02 x = 0 usando o metodo
acima. Sugestao: reescreva a equacao tomando p(x) = 01 e q(x) = 0 .
6
E. 6.13 Exerccio. Obtenha a solucao da equacao

0
x y 0 (x) + x y(x) = 0 ,

, em um intervalo (a, b).

Zeros de solu
co
es
Outro aspecto interessante do metodo de substituicao de Pr
ufer reside no fato de que com a representacao de Pr
ufer y(x) = (x) sen ((x)), pode-se realizar um estudo mais detalhado do zeros de y.
Algumas propriedades desses zeros sao relevantes para o estudo de solucoes certas equacoes diferenciais
de interesse.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Proposi
c
ao 6.1 Seja a equaca
o diferencial

0
p(x)y 0 (x) + q(x)y(x) = 0 ,

Captulo 6

295/1304

(6.16)

avel, p(x) > 0 e q contnua. Seja y uma


para x [a, b] , sendo p e q reais, p contnua e diferenci
soluca
o n
ao-identicamente nula dessa equaca
o e y(x) = (x) sen ((x)) sua representaca
o de Pr
ufer.
Ent
ao, um ponto [a, b] e um zero de y se e somente se () = n para algum n . Alem disso,
se y tem um zero em [a, b] esse zero e simples.
2


Prova. Claro e que se () = n, entao y() = () sen (()) = 0. Reciprocamente, se y() = 0 entao,
como () > 0 (por (6.15)), segue que sen (()) = 0, o que so e possvel se () = n para algum
n .

Se e um zero de y, segue por (6.12) que y 0 () = () cos(())/p() = (1)n ()/p() provando


que y 0 () 6= 0. Isso estabelece que e um zero simples de y.

6.6

O M
etodo de Invers
ao

Esse metodo pode ser aplicado quando a solucao y de uma equacao diferencial ordinaria for uma funcao
invertvel em algum aberto do seu domnio de definicao. A ideia e transformar a equacao para y em
uma equacao para a inversa de y, que pode eventualmente ser de resolucao mais simples.
Se f e invertvel em um aberto A e f 1 e sua inversa, entao f (f 1 (z)) = z. Supondo ambas diferenciaveis, a regra da cadeia diz-nos que f 0 (f 1 (z))(f 1 )0 (z) = 1 e, portanto, f 0 (f 1 (z)) = 1/(f 1 )0 (z).
diferenciando-se mais uma vez tem-se f 00 (f 1 (z)) = (f 1 )00 (z)/[(f 1 )0 (z)]3 . Prosseguindo assim, e
possvel sucessivamente expressar todas as derivadas de f em funcao de derivadas de f 1 .
Com essas relacoes, vemos que uma equacao diferencial de primeira ordem F (x, y(x), y 0 (x)) = 0
transforma-se na equacao


1
1
F y (z), z, 1 0
= 0.
(y ) (z)

e uma equacao diferencial de segunda ordem F (x, y(x), y 0 (x), y 00 (x)) = 0 transforma-se na equacao


1
(y 1 )00 (z)
1
F y (z), z, 1 0 , 1 0
= 0,
(y ) (z)
[(y ) (z)]3

e assim analogamente para equacoes de ordem superior. Em alguns casos tais equacoes transformadas
podem ser mais faceis de resolver que a original e a solucao y pode ser obtida ao menos localmente
invertendo a solucao y 1 . Ilustraremos o metodo em dois exemplos.
Exemplo 6.1 Seja a equacao diferencial de primeira ordem
y 0 (x) =

1
,
a(y(x)) x + b(y(x)) x

JCABarata. Curso de Fsica-Matem


atica

onde a e b sao duas funcoes contnuas e


1
(y 1 )0 (z)

a(z) y 1 (z)

1
,
+ b(z) (y 1 (z))

Vers
ao de 29 de setembro de 2005.

Captulo 6

296/1304

. Pela transformacao acima, essa equacao equivale a


ou seja,

(y 1 )0 (z) = a(z) y 1 (z) + b(z) (y 1 (z)) ,

que se trata de uma equacao de Bernoulli generalizada para y 1 . A solucao de equacoes de Bernoulli
foi apresentada na Secao 6.2, pagina 287.

Exemplo 6.2 Considere a equacao de segunda ordem y 00 (x) + xy(x)(y 0 (x))3 = 0. Pela transformacao
de acima, essa equacao equivale a
3

1
(y 1 )00 (z)
1
= 0 ou seja, (y 1 )00 (z) zy 1 (z) = 0 ,
+ y (z) z
1 0
[(y ) (z)]3
(y 1 )0 (z)
que se trata da equacao de Airy para y 1 . A solucao da equacao de Airy pode ser obtida pelo metodo
de expansao em serie de potencias. Vide Secao 8.1.4, pagina 404.

6.7

Solu
c
ao de Equa
co
es Exatas e o M
etodo dos Fatores Integrantes

Equa
co
es exatas de primeira ordem
Seja D 2 e um domnio aberto e simplesmente conexo e sejam definidas em D duas funcoes
diferenciaveis A1 (x1 , x2 ) e A2 (x1 , x2 ). A equacao diferencial


A1 (x, y(y)) + A2 (x, y(x))y 0 (x) = 0

(6.17)

A1
A2
(x1 , x2 )
(x1 , x2 ) = 0
x2
x1

(6.18)

e dita ser uma equaca


o exata se

para todo (x1 , x2 ) D. Uma equacao exata pode ser resolvida em termos de uma equacao implcita
pelo metodo que segue.
~ = (A1 , A2 ) e irrotacional. Como D e
A condicao (6.18) diz-nos que o campo bidimensional A
~
simplesmente conexo, A pode ser escrito como o gradiente de uma funcao U . Essa situacao e analoga
ao que ocorre na Mecanica Classica quando se lida com forcas conservativas, as quais podem ser
expressas como o gradiente de um potencial.
De fato, sejam (a, b), (x1 , x2 ) D e seja C uma curva diferenciavel orientada de (a, b) a (x1 , x2 )
inteiramente contida em D: C = {(w1 (s), w2 (s)) D, s [0, 1]}, onde as funcoes w1 (s) e w2 (s) sao
contnuas e diferenciaveis e satisfazem (w1 (0), w2 (0)) = (a, b), (w1 (1), w2 (1)) = (x1 , x2 ). Defina-se a
~ ao longo de C do ponto (a, b) ao ponto
funcao U : D como sendo a integral de linha do campo A


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

297/1304

(x1 , x2 ):
U (x1 , x2 ) :=

Z
Z

(x1 , x2 )
(a, b) C
1
0

~ w)
A(
~ dw
~ =

(x1 , x2 )
(a, b) C

A1 (w1 , w2 )dw1 + A2 (w1 , w2 )dw2

dw1
dw2 
A1 (w1 (s), w2 (s))
+ A2 (w1 (s), w2 (s))
ds .
ds
ds


(6.19)

Como D e simplesmente conexa, o Teorema de Green e a condicao (6.18) implicam que essa integral
nao depende da particular curva C adotada, mas apenas dos pontos extremos (a, b) e (x 1 , x2 ). Pela
definicao de U e imediato que
U
(x1 , x2 ) = A1 (x1 , x2 )
x1

U
(x1 , x2 ) = A2 (x1 , x2 )
x2

(6.20)

em todo D. Assim, a equacao (6.17) pode ser escrita como


U
U
(x, y(x)) +
(x, y(x))y 0 (x) = 0,
x1
x2

ou seja,

d
U (x, y(x)) = 0 .
dx

Dessa forma, conclumos que a solucao da equacao (6.17) e a solucao da equacao implcita
U (x, y(x)) = U0 ,
caso essa exista. Aqui U0 e uma constante. Se estivermos interessados na condicao inicial y(x0 ) =
y0 , para (x0 , y0 ) D, teremos U0 = U (x0 , y0 ). Pelo Teorema da Funcao Implcita7 , a equacao
U (x, y(x)) = U (x0 , y0 ) tera uma solucao y(x) em uma vizinhanca de x0 satisfazendo y(x0 ) = y0 se U
U
for contnua e diferenciavel em torno de (x0 , y0 ) e se x
(x0 , y0 ) 6= 0, ou seja, se A2 (x0 , y0 ) 6= 0.
2
E. 6.14 Exerccio. Mostre que a equacao diferencial
(3x2 y(x)2 7) (ey(x) + 2xy(x) + 1)y 0 (x) = 0
e exata e mostre que suas solucoes sao solucoes da equacao implcita
y(x) y(x)2 + ey(x) + 7x x3 = constante.
6
M
etodo dos Fatores Integrantes
Dada uma equacao diferencial como
B1 (x, y(x)) + B2 (x, y(x))y 0 (x) = 0 ,

(6.21)

com B1 (x1 , x2 ) e B2 (x1 , x2 ) definidas em um domnio D 2 , aberto e simplesmente conexo, nem


1
2
sempre ocorre de a condicao de exatidao B
(x1 , x2 ) B
(x1 , x2 ) = 0 ser satisfeita. Em alguns casos,
x2
x1


Vide Seca
o 17.4, p
agina 907, ou qualquer bom livro de C
alculo de funco
es de v
arias vari
aveis, por exemplo, [26, 87, 88].

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

298/1304

porem, ao multiplicarmos a equacao (6.21) por uma fator (x, y(x)) convenientemente escolhido, a
equacao pode transformar-se em uma equacao exata, a qual pode, entao, ser resolvida pelo metodo
descrito acima. Um tal , se existir, sera denominado fator integrante da equacao (6.21).
Definindo A1 (x1 , x2 ) := (x1 , x2 )B1 (x1 , x2 ) A2 (x1 , x2 ) := (x1 , x2 )B2 (x1 , x2 ), desejamos
determinar quais funcoes tornam valida a condicao (6.18), ou seja, desejamos determinar a solucao
da equacao diferencial parcial linear de primeira ordem



B1
B2
B1 (x1 , x2 )
(x1 , x2 ) B2 (x1 , x2 )
(x1 , x2 ) + (x1 , x2 )
(x1 , x2 )
(x1 , x2 ) = 0 .
x2
x1
x2
x1
(6.22)
Resolver essa equacao pode nao ser possvel, ou pode ser uma tarefa ainda mais difcil que resolver
a equacao original (6.21) por outros meios. Em certos casos ela pode ser resolvida pelo metodo das
caractersticas, do qual falaremos adiante, mas ha duas situacoes especiais que tornam a solucao simples:
1
I.
B2 (x1 , x2 )

B2
B1
(x1 , x2 )
(x1 , x2 )
x2
x1

Nesse caso, (6.22) fica

= (x1 ), uma funcao apenas da variavel x1 .

B1 (x1 , x2 )
(x1 , x2 )
(x1 , x2 ) + (x1 , x2 )(x1 ) = 0 .
B2 (x1 , x2 ) x2
x1
Escolhendo (x1 , x2 ) = (x1 ), uma funcao apenas da variavel x1 , essa equacao simplifica-se para
0 (x1 ) (x1 )(x1 ) = 0 ,
cuja solucao e

 Z
(x1 ) = c exp +

x1

()d
a

sendo a e c arbitrarios (sem perda, podemos escolher c = 1).




1
B1
B2
II.
(x1 , x2 )
(x1 , x2 ) = (x2 ), uma funcao apenas da variavel x2 .
B1 (x1 , x2 ) x2
x1
Nesse caso, (6.22) fica

B2 (x1 , x2 )

(x1 , x2 )
(x1 , x2 ) + (x1 , x2 )(x2 ) = 0 .
x2
B1 (x1 , x2 ) x1
Escolhendo (x1 , x2 ) = (x2 ), uma funcao apenas da variavel x2 , essa equacao simplifica-se para
0 (x2 ) + (x2 )(x2 ) = 0 ,
cuja solucao e

 Z
(x2 ) = d exp

x2

()d
b

sendo b e d arbitrarios (sem perda, podemos escolher d = 1).

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

299/1304

Exemplo 6.3 Revisitando a equaca


o (6.1) e reencontrando sua soluca
o (6.2).
A equacao y 0 (x)+a(x)y(x) = b(x) pode serescrita na forma (6.21) comB1 (x1 , x2 ) = a(x1 )x2 b(x1 )
1
2
(x1 , x2 ) B
(x1 , x2 ) = a(x1 ) e vale, portanto, a
e B2 (x1 , x2 ) = 1. Tem-se aqui que B2 (x11 , x2 ) B
x2
x1
condicao do item I, acima, sendo o fator integrante dado por

 Z x1
a()d
(x1 ) = exp
x0

com x0 arbitrario. Assim,


 Z x1


A1 (x1 , x2 ) = exp
a()d a(x1 )x2 b(x1 )

A2 (x1 , x2 ) = exp

x0

Com

U (x1 , x2 ) = x2 exp
constata-se que
A1 (x1 , x2 ) =

Z

x1
x0

a()d

U
(x1 , x2 )
x1

x1

b() exp
x0

Z

A2 (x1 , x2 ) =

a()d
x0



Z

x1

a()d
x0

U
(x1 , x2 ) .
x2

E. 6.15 Exerccio. Obtenha U calculando a integral em (6.19) para alguma curva C conveniente.

Pelo que vimos, a solucao da equacao diferencial satisfaz a equacao implcita U (x, y(x)) = U 0 ,
sendo U0 uma constante. Para uma condicao inicial y(x0 ) = y0 , tem-se U0 = U (x0 , y0 ) = y0 e a
equacao implcita U (x, y(x)) = y0 fica


Z
 Z x
Z x
a()d
d = y0 ,
b() exp
a()d
y(x) exp
x0

x0

x0

cuja solucao e
 Z
y(x) = exp

x
x0


Z
a()d y0 +

b() exp
x0

Z

a()d
x0

d ,

que e precisamente a solucao dada em (6.2), como facilmente se constata.

Equa
co
es exatas de ordem n
Veremos agora como as ideias de acima podem ser generalizadas para equacoes de ordem n.
Seja F (x, x0 , x1 , . . . , xn ) uma funcao de n + 2 variaveis que define uma equacao diferencial
ordinaria de ordem n:


0
(n)
F x, y(x), y (x), . . . , y (x) = 0 .
(6.23)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

300/1304

Essa equacao e dita ser uma equaca


o diferencial exata se existir uma funcao diferenciavel U (x, x 0 , x1 , . . . , xn
de n + 1 variaveis tal que
F (x, x0 , x1 , . . . , xn ) =
U
U
U
(x, x0 , x1 , . . . , xn1 ) + x1
(x, x0 , x1 , . . . , xn1 ) + + xn
(x, x0 , x1 , . . . , xn1 ) ,
x
x0
xn1
(6.24)
entao a equacao (6.23) torna-se


U 
U 
x, y(x), y 0 (x), . . . , y (n1) (x) + y 0 (x)
x, y(x), y 0 (x), . . . , y (n1) (x)
x
x0
+ + y (n) (x)
ou seja,


U 
x, y(x), y 0 (x), . . . , y (n1) (x) = 0 ,
xn1


d 
U x, y(x), y 0 (x), . . . , y (n1) (x) = 0 e, portanto, vale
dx


U x, y(x), y 0 (x), . . . , y (n1) (x) = U0 ,

(6.25)

onde U0 e uma constante,


fixada pelos n valores iniciais
y(x0 ), y 0 (x0 ), . . . , y (n1) (x0 ), para algum


ponto x0 : U0 = U x0 , y(x0 ), y 0 (x0 ), . . . , y (n1) (x0 ) .

A expressao (6.25) e uma nova equacao diferencial para y, mas de ordem no maximo igual a n 1.
Assim, toda equacao exata de ordem n pode ser transformada em uma equacao de ordem menor, a
qual podera eventualmente ser resolvida por algum dos metodos disponveis.
Claro e por (6.24) que a equacao (6.23) e da forma




A1 x, y(x), y 0 (x), . . . , y (n1) (x) + A2 x, y(x), y 0 (x), . . . , y (n1) (x) y (n) (x) = 0 ,

(6.26)

onde

A1 (x, x0 , x1 , . . . , xn1 ) =

U
U
(x, x0 , x1 , . . . , xn1 ) + x1
(x, x0 , x1 , . . . , xn1 ) (6.27)
x
x0
+ + xn1

A2 (x, x0 , x1 , . . . , xn1 ) =

U
(x, x0 , x1 , . . . , xn1 ) ,
xn2

U
(x, x0 , x1 , . . . , xn1 ) .
xn1

(6.28)

As expressoes (6.26)-(6.28) generalizam (6.17)-(6.20), do caso de equacoes exatas de ordem n = 1.


Naquele caso sabamos que a relacao (6.18) e necessaria e suficiente (caso D seja simplesmente conexo)
para garantir exatidao, ou seja, a existencia de uma funcao U com as propriedades desejadas. No caso
n > 1, infelizmente nao ha modo simples de expressar as condicoes necessarias e suficientes para que
A1 e A2 tenham a forma dada em (6.27) e (6.28), respectivamente.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

301/1304

Exemplo 6.4 Seja V diferenciavel e f = V 0 . A equacao diferencial de segunda ordem my 00 (x)


f (y(x)) = 0 nao e exata, mas multiplicando-a por y 0 (x), ficamos com y 0 (x)(my 00 (x) f (y(x))) = 0, que
pode ser escrita como F (x, y(x), y 0 (x), y 00 (x)) = 0 para F (x, x0 , x1 , x2 ) = x1 (mx2 f (x0 )) e para
essa F , podemos encontrar uma funcao U (x, x0 , x1 ) tal que a condicao de exatidao (6.24) e satisfeita.
De fato, essa funcao e U (x, x0 , x1 ) = m2 x21 + V (x0 ) (verifique!). A nova equacao (6.25) fica nesse caso
m 0
(y (x))2 + V (y(x)) = U0 = constante.
2
O estudante pode reconhecer nisso a equa
cao da conservacao da energia em uma dimensao. Podeq
0
mos entao, localmente, escrever y (x) = m2 (U0 V (y(x))), cuja solucao, apos integracao, e obtida
invertendo localmente
Z
dy
x = q
+ constante.
2
(U

V
(y))
0
m

E. 6.16 Exerccio. Use o procedimento descrito acima para resolver a equacao do oscilador harmonico
simples my 00 (x) + ky(x) = 0, m > 0, k > 0
6

6.8

Solu
co
es das Equa
co
es de DAlembert-Lagrange e Clairaut

Uma equacao diferencial de primeira ordem da forma


xA(y 0 (x)) + B(y 0 (x)) y(x) = 0 ,

(6.29)

com A e B contnuas e diferenciaveis, e denominada equaca


o de DAlembert 8 ou equaca
o de Lagrange9 .
10
No caso em que A(z) z, a equacao e conhecida como equaca
o de Clairaut :


xy 0 (x) y(x) + B(y 0 (x)) = 0 .
(6.30)

Diferenciando a equacao (6.29) em relacao a x, obtem-se




0
0 0
0 0
A(y (x)) + xA (y (x)) + B (y (x)) y 00 (x) y 0 (x) = 0 .

Definindo v(x) = y 0 (x), isso diz que



A(v(x)) v(x) + xA0 (v(x)) + B 0 (v(x)) v 0 (x) = 0 .

(6.31)

No que segue apresentaremos solucoes das equacoes de acima, comecando com a equacao de Clairaut
(6.30) e depois tratando da equacao de DAlembert-Lagrange (6.29).
8

Jean Le Rond dAlembert (1717-1783).


Joseph-Louis Lagrange (1736-1813).
10
Alexis Claude Clairaut (1713-1765).
9

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

302/1304

Solu
co
es da equa
c
ao de Clairaut. A solu
c
ao singular
No caso em que A(z) z (equacao de Clairaut) a equacao (6.31) reduz-se a

x + B 0 (v(x)) v 0 (x) = 0 .

(6.32)

Ha duas formas de satisfazer essa equacao: a. impondo v 0 (x) = 0 ou, b. impondo x + B 0 (v(x)) = 0.
a. Impondo-se v 0 (x) = 0, tem-se y(x) = c0 x + c1 , com c0 e c1 constantes. Essas constantes, porem,
nao sao independentes, pois (6.30) tem que ser satisfeita. Inserindo y(x) = c0 x + c1 em (6.30)
obtem-se c1 = B(c0 ). Assim, uma solucao de (6.30) e
y1 (x) y1 (x, c0 ) = c0 x + B(c0 ) ,
que depende de um parametro livre c0 .
b. Aqui impomos x + B 0 (v(x)) = 0, obtendo localmente v(x) = (B 0 )1 (x). Lembramos, porem,
que (6.30) impoe uma relacao entre y e v: y(x) = xv(x) + B(v(x)). Assim, uma segunda solucao
de (6.30) e dada (localmente) por
y2 (x) = x(B 0 )1 (x) + B((B 0 )1 (x)) .
O fato notavel sobre a solucao y2 e que a mesma nao depende de nenhum parametro livre (que poderia ser fixado, eventualmente, por uma condicao inicial). Solucoes desse tipo sao denominadas soluco
es
11
singulares de equacoes diferenciais. Tecnicamente, a definicao de soluca
o singular e a seguinte. Uma
solucao ys de uma equacao diferencial ordinaria de primeira ordem e dita ser uma soluca
o singular se
for tangente a cada solucao geral yg dessa equacao, ou seja, se para todo x no domnio de definicao da
equacao houver uma solucao geral yg tal que ys (x) = yg (x) e ys0 (x) = yg0 (x).
E. 6.17 Exerccio. Mostre que a solucao y2 (x) = x(B 0 )1 (x) + B((B 0 )1 (x)) e tangente `as solucoes
y1 (x) = c0 x + B(c0 ). Sugestao: use o fato (e prove-o!) que x(B 0 )1 (x) + B((B 0 )1 (x)) e uma primitiva
de (B 0 )1 (x).
6
Geometricamente, uma solucao singular pode ser visualizada da seguinte forma. Desenha-se no
plano (x, y) a famlia de todas as curvas (x, yg (x)), x , para todas as solucoes gerais yg . A solucao
singular corresponde a` curva envolt
oria dessa famlia de curvas.


A equacao de Clairaut, com sua solucao singular, foi resolvida pelo mesmo em 1734.
Uma terceira solucao de (6.31) poderia ser obtida procedendo de modo ligeiramente distinto do
que foi feito na segunda solucao. Resolvendo localmente em v a equacao x + B 0 (v(x)) = 0, obtem-se
v(x) = (B 0 )1 (x). Como v(x) = y 0 (x), obtem-se aparentemente uma terceira solucao por integracao:
y3 (x) = C(x) + c2 , c2 sendo uma constante e C(x) sendo uma primitiva de (B 0 )1 (x), ou seja, tal que
C 0 (x) = (B 0 )1 (x). Essa solucao aparenta ter um parametro livre e aparenta ser distinta da solucao
preciso ainda impor que y3 satisfaca (6.30), ou seja, devemos impor que
y2 , mas isso nao e verdade. E
x(B 0 )1 (x) C(x) c2 + B((B 0 )1 (x)) = 0 .
11

Trata-se de uma nomenclatura infeliz, pois o a express


ao singular e usada com v
arios outros significados na
literatura das equaco
es diferenciais.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 6

303/1304

0 1
0 1
0 1
(O leitor
 deve observar que x(B ) (x)
 + B((B ) (x)) e tambem uma primitiva de (B ) (x),
d
pois dx
x(B 0 )1 (x) + B((B 0 )1 (x)) = (B 0 )1 (x) como facilmente se verifica). Da, devemos ter

c2 = C(x) (x(B 0 )1 (x) + B((B 0 )1 (x))) e, portanto, y3 (x) = x(B 0 )1 (x) + B((B 0 )1 (x)), que
coincide com a solucao y2 .
Exemplo 6.5 Considere a equacao de Clairaut
xy 0 (x) y(x) + (y 0 (x))2 = 0 .

(6.33)

Nesse caso, B(z) = z 2 , B 0 (z) = 2z e (B 0 )1 (w) = w/2. Assim, as duas solucoes encontradas acima sao
y1 (x) y1 (x, c0 ) = c0 x + (c0 )2 e y2 (x) = x2 /4, como facilmente se constata.

E. 6.18 Exerccio. Verifique que as solucoes y1 (x, c0 ) e y2 (x) dadas no exemplo acima sao de fato
solucoes de (6.33). Mostre explicitamente que y2 (x) = x2 /4 e uma solucao singular no sentido da
definicao dada acima, ou seja, para todo x existe c0 tal que y2 (x) = y1 (x, c0 ) e y20 (x) = y10 (x, c0 ). Desenhe
varias das curvas (x, y1 (x, c0 )), x , para varios valores de c0 e visualize a curva envoltoria dessa
6
famlia de curvas, a qual correspondera `a curva (x, y 2 (x)), x , da solucao singular.


E. 6.19 Exerccio. Determine as solucoes y1 e y2 da equacao de Clairaut


xy 0 (x) y(x) + (y 0 (x))4 = 0 ,
e resolva as mesmas questoes propostas no Exerccio E. 6.18.

Solu
co
es da equa
c
ao de DAlembert-Lagrange
Daqui por diante suporemos que A(z) 6 z. Como veremos, a equacao (6.31) pode ser resolvida
com o uso do metodo dos fatores integrantes para obter uma equacao exata e depois resolve-la como
tal. Assim como (6.29), a equacao (6.31) e uma equacao de primeira ordem, mas a dependencia em v 0
e muito mais simples. Em verdade, identificando
B1 (x, v(x)) = A(v(x)) v(x)

B2 (x, v(x)) = xA0 (v(x)) + B 0 (v(x)) ,

B2 (x1 , x2 ) = x1 A0 (x2 ) + B 0 (x2 ) ,

ou seja, para,
B1 (x1 , x2 ) = A(x2 ) x2

a equacao (6.31) tem a forma (6.21). A condicao de exatidao (6.18) nao e satisfeita (verifique!) e
facil ver que nesse caso
desejamos saber se um fator integrante pode ser encontrado. E


B1
B2
1
1
(x1 , x2 )
(x1 , x2 ) =
=: (x2 ) ,
B1 (x1 , x2 ) x2
x1
A(x2 ) x2
uma funcao apenas da variavel x2 . Vale, assim, o caso II da pagina 298, e o fator integrante e
 Z x2

1
(x2 ) = exp
d .
(A() )
b

JCABarata. Curso de Fsica-Matem


atica

Assim, definindo

Captulo 6

Vers
ao de 29 de setembro de 2005.

304/1304


1
d
A1 (x1 , x2 ) := (x2 )B1 (x1 , x2 ) = (A(x2 ) x2 ) exp
(A() )
b
 Z x2

1
0
0
A2 (x1 , x2 ) := (x2 )B2 (x1 , x2 ) = (x1 A (x2 ) + B (x2 )) exp
d
(A() )
b
Z

x2

a equacao A1 (x, v(x)) + A1 (x, v(x))v 0 (x) = 0, obtida multiplicando (6.31) por (v(x)), e exata. E
facil verificar que nesse caso
 Z x2
 Z x2
Z

1
1
0
U (x1 , x2 ) = x1 (A(x2 ) x2 ) exp
d +
B () exp
d d .
(A() )
b
b (A() )
b
(6.34)
E. 6.20 Exerccio. Prove isso!

Assim, a solucao para (6.31) e dada por U (x, v(x)) = c0 , c0 sendo uma constante. Agora, para a
obtencao das solucoes desejadas de (6.29) ha dois procedimentos:
a. Observa-se que a equacao (6.29) pode ser lida como xA(v(x)) + B(v(x)) = y(x), que relaciona v
e y. Ao menos em princpio, podemos resolver essa equacao para v e obter v(x) = I(x, y(x)).
Inserindo isso em U (x, v(x)) = c0 , obtemos U (x, I(x, y(x))) = c0 . Essa equacao pode ser, ao
menos em princpio, resolvida em y para fornecer uma solucao y1 (x), dependente de um parametro
livre c0 .
b. Resolve-se localmente a equacao U (x, v(x)) = c0 para v, obtendo-se v(x) = H(x, c0 ) para alguma
funcao H. Observa-se que a equacao (6.29) pode ser lida como y(x) = xA(v(x)) + B(v(x)), que
fornece y se v e dado. Assim, y2 (x) = xA(H(x, c0 )) + B(H(x, c0 )) e uma segunda solucao de
de se notar que a solucao y2 depende de um parametro livre c0 .
(6.29). E
Um terceiro procedimento seria resolver localmente a equacaRo U (x, v(x)) = c 0 para v, obtendo
v(x) = H(x, c0 ) para alguma funcao H, donde se extrai y3 (x) = H(x, c0 )dx + c1 , c1 sendo uma nova
constante. Para que se tenha uma solucao de (6.29) e preciso inserir essa solucao naquela equacao, o
que implica y3 (x) = xA(H(x, c0 )) + B(H(x, c0 )), mostrando que essa terceira solucao e identica a` y2 .
0
Exemplo 6.6 A equacao diferencial (2x +
1)y (x) y(x) = 0 pode ser facilmente resolvida por integracao, fornecendo a solucao y0 (x) = k 2x + 1, k sendo uma constante. Para ilustrar o metodo
de solucao desenvolvido acima, escrevemos essa equacao diferencial na forma de uma equacao de
DAlembert-Lagrange:
2xy 0 (x) y(x) + y 0 (x) = 0 .
(6.35)

Aqui temos A(z) = 2z, B(z) = z, B 0 (z) = 1. Para a funcao U tem-se por (6.34) (tomamos aqui b = 1,
sem perda de generalidade)
Z
 Z x2

Z x2
1
1
exp
d +
d d
U (x1 , x2 ) = x1 x2 exp

1
1
1


Z x2
1
1
2
= x 1 x2 +
d = x1 +
x22 .
2
2
1

JCABarata. Curso de Fsica-Matem


atica

Captulo 6

Vers
ao de 29 de setembro de 2005.

c00

305/1304
q

c00

c0

0
A equacao U (x, v(x)) = c0 fica, entao, (2x + 1)v(x) = (com = 2c0 + 1). Assim, v(x) = 2x+1
.
q 0
p
c0
Assim, H(x, c00 ) = 2x+1
e a solucao y2 fica y2 (x) = c00 (2x + 1), que coincide em forma com a
solucao y0 .

Para a solucao y1 comecamos por notar que (6.35) diz-nos que y(x) = (2x + 1)v(x) e, portanto,
v(x) = I(x, y(x)) = p
y(x)/(2x + 1). A equacao U (x, I(x, y(x))) = c0 fica y(x)2 /(2x + 1) 1 = c0 , cuja
solucao e y1 (x) = c00 (2x + 1), tambem identica em forma a` solucao y0 . O fato de as solucoes y1 e y2
coincidirem decorre de (6.35) ser uma equacao linear, apresentando apenas uma solucao, dependente
de um parametro (vide Secao 6.1, pagina 286).

Exemplo 6.7 Considere a equacao diferencial

2xy 0 (x) y(x)

0
(y (x))3 = 0 ,
3

(6.36)

6= 0 sendo uma constante. Essa e uma equacao de DAlembert-Lagrange com A(z) = 2z, B(z) =
3 z 3 , B 0 (z) = z 2 . Para a funcao U tem-se, por (6.34) (tomamos aqui b = 1, sem perda de
generalidade),
 Z x2

Z

Z x2
1
1
2
d
exp
d d
U (x1 , x2 ) = x1 x2 exp

1
1
1
Z x2

2
= x 1 x2
3 d = x1 x22 (x42 1) .
4
1
A equacao U (x, v(x)) = c0 fica v(x)4 4x
v(x)2 c00 = 0 (com c00 = 4c0 1) cujas quatro solucoes sao

v(x) =

2x

x2
+ (c00 )2 .
2


Por (6.36), y(x) = v(x) 2x 3 v(x)2 e, assim, obtem-se quatro solucoes
y2 (x) =

4x ()

3
3

4x2
2

+ (c00 )2

!s

2x

4x2
+ (c00 )2 ,
2

(6.37)

sendo que os dois u


ltimos sinais devem ser escolhidos iguais.

Para obter as solucoes y1 e preciso primeiro resolver em v a equacao de terceiro grau y(x) =
2xv(x) 3 v(x)3 . Para solucoes de equacoes de terceiro grau, vide, por exemplo, [123].

E. 6.21 Exerccio. Verifique que (6.37) e, de fato, uma solucao de (6.36).

Captulo 7
Sistemas de Equaco
es Diferenciais Ordin
arias
Lineares
Conte
udo
7.1

Introdu
ca
o

7.2

Unicidade e Exist
encia de Solu
co
es . . . . . . . . . . . . . . . . . . . . . . . 308

7.3

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307

7.2.1

Unicidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 308

7.2.2

Existencia. A Serie de Dyson . . . . . . . . . . . . . . . . . . . . . . . . . . . 311

7.2.3

Propriedades de D(s, t) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 316

Equa
co
es com Coeficientes Constantes . . . . . . . . . . . . . . . . . . . . . 320
7.3.1

Alguns Exemplos e Aplicacoes

. . . . . . . . . . . . . . . . . . . . . . . . . . 322

7.4

Teoria de Perturba
co
es de Sistemas Lineares . . . . . . . . . . . . . . . . . 327

7.5

Mais sobre a S
erie de Dyson. Produtos de Tempo Ordenado . . . . . . . 330

7.6

Sistemas de Equa
co
es Diferenciais Lineares no Plano Complexo . . . . . 333

7.7

7.8

7.9

7.6.1

O Caso Analtico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334

7.6.2

Resolucao por Series de Potencias

7.6.3

Sistemas com Pontos Singulares. Monodromia . . . . . . . . . . . . . . . . . 342

7.6.4

Sistemas com Pontos Singulares Simples . . . . . . . . . . . . . . . . . . . . . 352

. . . . . . . . . . . . . . . . . . . . . . . . 340

Sistemas Provenientes de EDOs de Ordem m

. . . . . . . . . . . . . . . . 357

7.7.1

Pontos Singulares Simples em EDOs de Ordem m . . . . . . . . . . . . . . . 358

7.7.2

Singularidades no Infinito . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 362

7.7.3

Alguns Exemplos de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . . 364

Equa
co
es Fuchsianas. Smbolos de Riemann . . . . . . . . . . . . . . . . . 370
7.8.1

Equacoes Fuchsianas de Primeira Ordem

. . . . . . . . . . . . . . . . . . . . 370

7.8.2

Equacoes Fuchsianas de Segunda Ordem . . . . . . . . . . . . . . . . . . . . . 375

7.8.3

Smbolos de Riemann. Simetrias de Equacoes Fuchsianas de Segunda Ordem

382

Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 389

remos neste captulo estudar sistemas de equacoes diferenciais lineares ordinarias, com particular atencao a sistemas de equacoes diferenciais lineares associados a equacoes diferenciais
lineares de ordem n. Demonstraremos alguns teoremas basicos e apresentaremos metodos de
solucao, com particular destaque para a serie de Dyson. Alguns exemplos de interesse fsico
serao discutidos com certo detalhe. Inicialmente trataremos sistemas dependentes de uma variavel real
e mais adiante generalizaremos nossos resultados para sistemas dependentes de uma variavel complexa.
Tal generalizacao e particularmente importante para o tratamento de sistemas de equacoes diferenciais
306

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

307/1304

provenientes de equacoes diferenciais ordinarias lineares de ordem n, ja que metodos de resolucao de


tais equacoes, como o metodo de Frobenius, estao intimamente relacionados a propriedades analticas
dos coeficientes da equacao. O presente captulo sera continuado no Captulo 8, onde discutiremos a
solucao de equacoes diferenciais ordinarias lineares de ordem 2 utilizando o metodo de expansoes em
serie, e utilizando o metodo de Frobenius. Em seguida, no Captulo 9, estudaremos propriedades de
algumas das solucoes de maior interesse em Fsica.

7.1

Introdu
c
ao

Seja t uma variavel real, A(t) uma matriz m m cujos elementos Aij (t), i, j = 1, . . . , m, sao funcoes
contnuas (reais ou complexas) dadas de t e seja F (t) um vetor coluna

f1 (t)

F (t) = ...
fm (t)
onde fi (t), i = 1, . . . , m sao igualmente funcoes contnuas (reais ou complexas) dadas de t.
Se Y (t) e um vetor coluna

a equacao diferencial

y1 (t)

Y (t) = ...
ym (t)

Y (t) = A(t)Y (t) + F (t)

(7.1)

e denominada um sistema linear de equaco


es diferenciais de primeira ordem, cujas incognitas sao as m
funcoes y1 (t), . . . , ym (t).
Caso F for identicamente nula o sistema e dito ser um sistema homogeneo e, caso contrario, e dito
ser um sistema n
ao-homogeneo.
Estaremos aqui interessados em estudar esses sistemas de equacoes diferenciais quando uma condica
o
inicial e fornecida, ou seja, quando o valor de Y (t) em um ponto t0 e especificado, tipicamente o valor
de Y (t) em t = 0: Y (0) = Y0 , com

y10

Y0 = ... ,
0
ym
0
y10 , . . . ym
sendo constantes (reais ou complexas).

JCABarata. Curso de Fsica-Matem


atica

7.2
7.2.1

Vers
ao de 29 de setembro de 2005.

Captulo 7

308/1304

Unicidade e Exist
encia de Solu
co
es
Unicidade

Iremos mais adiante mostrar que, sob as hipoteses acima, o sistema (7.1), submetido a uma condicao
inicial Y (0) = Y0 , sempre possui solucao. Iremos em verdade exibir um metodo aproximativo para o
calculo da solucao.
Para preparar essa discussao devemos primeiramente demonstrar a unicidade da solucao, ou seja,
precisamos mostrar que se houver uma funcao Y (t) satisfazendo Y (t) = A(t)Y (t) + F (t) e Y (0) = Y0 ,
entao nao ha outra funcao distinta de Y com essas propriedades. O fato de a solucao ser u
nica sera de
importancia quando discutirmos um metodo para calcular a solucao.
Vamos considerar primeiro o caso mais simples onde a equacao e homogenea Y (t) = A(t)Y (t) e a
condicao inicial e Y (0) = 0. Partiremos desse caso mais simples para poder tratar melhor depois o caso
geral. Integrando-se ambos os lados da igualdade Y (t) = A(t)Y (t) entre 0 e t e usando que Y (0) = 0,
tem-se
Z t
Y (t) =
A(t1 )Y (t1 ) dt1 .
(7.2)
0

Essa relacao e uma identidade a ser satisfeita pela funcao Y (t) que eventualmente e solucao da equacao
Y (t) = A(t)Y (t) com a condicao inicial Y (0) = 0. Observemos que a funcao Y aparece no lado esquerdo
e tambem dentro da integral. Como a identidade acima vale para todo t, tem-se tambem que
Z t1
Y (t1 ) =
A(t2 )Y (t2 ) dt2 .
0

Inserindo-se isso na pen


ultima identidade, tem-se
Z t
Z
Y (t) =
A(t1 )
0

ou seja,
Y (t) =

Z tZ
0

t1

A(t2 )Y (t2 ) dt2 dt1 ,


0

t1

A(t1 )A(t2 ) Y (t2 ) dt2 dt1 .


0

Repetindo-se esse procedimento n vezes chega-se a` seguinte identidade:


Z t Z t1
Z tn1
Y (t) =

A(t1 )A(t2 ) A(tn ) Y (tn ) dtn dtn1 dt1 .


0

(7.3)

Lembrando que Y (t) e um vetor cujas componentes sao funcoes yi (t) essa u
ltima identidade significa
para a a-esima componente
ya (t) =

m Z tZ
X
b=1

t1
0

tn1
0

(A(t1 )A(t2 ) A(tn ))ab yb (tn ) dtn dtn1 dt1 .

(7.4)

Acima, (A(t1 )A(t2 ) A(tn ))ab e o elemento ab da matriz A(t1 )A(t2 ) A(tn ), formada pelo produto
de n matrizes.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

309/1304

De acordo com a regra de produto de matrizes, (A(t1 )A(t2 ) A(tn ))ab e dado por
(A(t1 )A(t2 ) A(tn ))ab =

m X
m
X

k1 =1 k2 =1

m
X

kn1 =1

Aak1 (t1 )Ak1 k2 (t2 ) Akn1 b (tn ).

A relacao (7.4) fica entao


ya (t) =

m X
m X
m
X

b=1 k1 =1 k2 =1

Z tZ
m
X

kn1 =1

t1
0

tn1
0

Aak1 (t1 )Ak1 k2 (t2 ) Akn1 b (tn ) yb (tn ) dtn dtn1 dt1 .

Essa relacao implica a seguinte desigualdade


Z t Z t1
Z tn1
m
m X
m X
m
X
X

|Aak1 (t1 )| |Ak1 k2 (t2 )| |Akn1 b (tn )||yb (tn )|dtn dtn1 dt1 .

|ya (t)|
kn1 =1

b=1 k1 =1 k2 =1

(7.5)

Vamos agora supor (provisoriamente) que t e limitado a um intervalo [0, T ] para algum T > 0
finito. Vamos definir
= max
max
|Aij (t)|
(7.6)
t[0, T ] i, j{1, ..., m}

e
M = max

max

t[0, T ] i{1, ..., m}

|yi (t)|,

ou seja e o maximo valor alcancado pelo modulo dos elementos de matriz A ij (t) quando t varia
no intervalo [0, T ] e M e o maximo valor alcancado pelo modulo de todas as componentes y i (t) de
Y quando t varia no intervalo [0, T ]. Note-se que as mencionadas funcoes sao limitadas pois, por
hipotese, sao contnuas, e o intervalo [0, T ] e finito.
Retornando a (7.5), como todos os |Aij (tk )| sao menores ou iguais a e todos os |yb (tn )| sao menores
ou iguais a M , tem-se que
Z t Z t1
Z tn1
m X
m X
m
m
X
X
|ya (t)|

n M dtn dtn1 dt1 .


(7.7)
b=1 k1 =1 k2 =1

kn1 =1

O fator n deve-se ao fato que

Claramente, vale que


Z tZ
m X
m
m
X
X

b=1 k1 =1

kn1 =1

} = n .
|Aak1 (t1 )| |Ak1 k2 (t2 )| |Akn1 b (tn )|
| {z
n vezes
t1
0

tn1
0

M dtn dt1 = M

m X
m
X

b=1 k1 =1

Z tZ
m
X

kn1 =1

pois e M sao constantes. Fora isso, e bem facil constatar que


Z t Z t1
Z tn1
tn

dtn dtn1 dt1 =


.
n!
0
0
0

t1
0

tn1
0

dtn dt1 ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

310/1304

E. 7.1 Exerccio importante. A u


ltima igualdade pode ser facilmente provada por inducao. Faca-o. 6
Assim, a desigualdade (7.7) fica
m

X
tn X X

1.
|ya (t)| M
n! b=1 k =1 k =1
n

evidente, agora, que


E

m X
m
X

b=1 k1 =1

m
X

n1

1 = mn

kn1 =1

pois ha n somas sucessivas, em cada uma o ndice assume m valores e o somando e sempre constante
(nao depende dos ndices).
Conclumos que
|ya (t)| M

(mt)n
.
n!

(7.8)

Essa desigualdade deve ser satisfeita para t [0, T ] pela a-esima componente da solucao Y da
importante notar, porem, que o lado esquerdo
equacao Y = A(t)Y (t) com condicao inicial Y (0) = 0. E
nao depende de n, que e simplesmente o n
umero de vezes que repetimos a identidade (7.2) para obter
bem sabido que para qualquer x 0 fixo tem-se
(7.3). O que ocorre, porem, se tomarmos n ? E
xn
= 0.
n n!
lim

Assim, tomando-se em (7.8) o limite n em ambos os lados, conclui-se que ya (t) = 0 para todo a
e todo t [0, T ]. Como T foi escolhido arbitrario, segue que ya (t) = 0 para todo t e todo a.
Em resumo, conclumos que se Y e solucao da equacao Y = A(t)Y (t) com condicao inicial Y (0) = 0
entao Y (t) = 0 para todo t. Nao ha, portanto, outra solucao que nao a funcao nula para a equacao
homogenea Y = A(t)Y (t) com condicao inicial Y (0) = 0.
O que podemos dizer do caso geral da equacao Y = A(t)Y (t) + F (t) com uma condicao inicial
Y (0) = Y0 ? Vamos supor que Y e X sao duas solucoes satisfazendo a mesma condicao inicial, ou seja,
Y (0) = X(0) = Y0 . Definindo Z(t) = Y (t) X(t) tem-se Z(0) = Y (0) X(0) = Y0 Y0 = 0 e

Z(t)
= Y (t) X(t)
= A(t)Y (t) + F (t) (A(t)X(t) + F (t)) = A(t)(Y (t) X(t)) = A(t)Z(t).

Assim, Z e solucao da equacao homogenea Z(t)


= A(t)Z(t) com a condicao inicial Z(0) = 0. Pelo
que acabamos de ver, Z e identicamente nula, o que prova que Y = X.
Isso provou entao que a equacao Y = A(t)Y (t) + F (t) com uma condicao inicial Y (0) = Y0 tem
tambem solucao u
nica, se houver. Provaremos adiante que ha uma solucao e mostraremos como calculala.
Finalmente, observamos que todas as conclusoes apresentadas acima permanecem se a condicao
inicial for fixada nao em t = 0 mas num ponto t0 qualquer.
Uma propriedade da solu
c
ao das equa
co
es homog
eneas

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

311/1304

As demonstracoes que apresentamos acima tem mais uma conseq


uencia para as solucoes das equacoes
homogeneas Y (t) = A(t)Y (t), conseq
uencia essa da qual faremos uso mais adiante. Tem-se, a saber,
o seguinte: a solucao Y (t) de uma equacao homogenea Y (t) = A(t)Y (t) anula-se em um ponto t0 ,
Y (t0 ) = 0 se e somente se Y (t) for nula para todo t.
A prova disso segue da seguinte observacao. Se Y (t0 ) = 0 entao
Z t
Y (t) =
A(t1 )Y (t1 ) dt1 .
t0

Como em (7.3), conclumos que


Z
Z t Z t1

Y (t) =
t0

t0

tn1

A(t1 )A(t2 ) A(tn ) Y (tn ) dtn dtn1 dt1 .

t0

Prosseguindo como antes, concluiremos que


|ya (t)| M

(m|t t0 |)n
,
n!

(7.9)

onde
= max

max

t[0, T ] i, j{1, ..., m}

|Aij (t)|

e
M = max

max

t[0, T ] i{1, ..., m}

|yi (t)|

o intervalo [0, T ] sendo escolhido grande o suficiente para conter t e t0 .


Tomando o limite n em (7.9), conclumos que ya (t) = 0. Como isso vale para um t arbitrario,
segue que Y (t) e identicamente nula, que e o que queramos provar.

7.2.2

Exist
encia. A S
erie de Dyson

Uma vez demonstrada a unicidade da eventual solucao de uma equacao como Y = A(t)Y (t) + F (t)
com condicao inicial Y (0) = Y0 precisamos demonstrar que a solucao existe. E a melhor maneira de
demonstrar a existencia de solucao de uma equacao diferencial e exibindo uma.
Para s e t reais, seja D(t, s) a matriz m m definida por
D(t, s) :=

Z tZ
X
s

n=1

t1
s

tn1
s

A(t1 )A(t2 ) A(tn ) dtn dtn1 dt1 .

(7.10)

Seja tambem D(t) definida por D(t) = D(t, 0), ou seja,


D(t) =

Z tZ
X
n=1

t1
0

tn1
0

A(t1 )A(t2 ) A(tn ) dtn dtn1 dt1 .

(7.11)

Algumas paginas adiante (pagina 319) provaremos que vale entre D(t, s) e D(t) a seguinte relacao:
D(t, s) = D(t)D(s)1 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

312/1304

A serie do lado direito de (7.10) e (7.11) e freq


uentemente denominada serie de Dyson 1 , denominacao
esta empregada especialmente em textos sobre Mecanica Quantica e Teoria Quantica da Campos.
Afirmamos que a equacao Y = A(t)Y (t) + F (t) com uma condicao inicial Y (0) = Y0 tem solucao,
a qual e dada por
Z
t

Y (t) = D(t)Y0 +

D(t, s)F (s) ds .

(7.12)

A demonstracao sera feita provando-se que o lado direito satisfaz a equacao diferencial e a condicao
inicial. Como a solucao e u
nica (pelo provado acima), infere-se que nao pode haver outra que nao
(7.12). Note-se, em particular, que pelo dito acima, a equacao homogenea Y = A(t)Y (t) com condicao
inicial Y (0) = Y0 tem por solucao
Y (t) = D(t)Y0 .
O estudante deve ter em mente que a expressao (7.12) generaliza o metodo de variacao de constantes
apresentado na Secao 6.4, pagina 291. De fato, como veremos adiante, D(t, s) e identica a` matriz
Wronskiana das solucoes linearmente independentes da equacao homogenea.

Comecemos por mostrar que as series que aparecem em (7.10) e (7.11) sao convergentes, sem o que
ambas as expressoes nao fariam sentido. Denotando por Dab (t, s) o elemento ab da matriz D(t, s),
temos
Z tn1
Z t Z t1
X
Dab (t, s) = ab +

(A(t1 )A(t2 ) A(tn ))ab dtn dtn1 dt1


n=1

= a b +

X
m X
m
X

n=1 k1 =1 k2 =1

Z tZ
m
X

kn1 =1

t1
s

tn1
s

Aak1 (t1 )Ak1 k2 (t2 ) Akn1 b (tn ) dtn dt1 .

Limitando provisoriamente t e s a um intervalo finito [0, T ] e usando a definicao de dada em (7.6),


1

Freeman J. Dyson (1923-). Denominamos a serie de (7.10) e (7.11) serie de Dyson, pois essa nomenclatura e
comummente empregada na Mec
anica Qu
antica e na Teoria Qu
antica de Campos. Dyson chegou a essa serie estudando
problemas de teoria de perturbaco
es na Teoria Qu
antica de Campos. Sua origem, porem, remonta pelo menos a trabalhos
de Volterra de 1890. Em Teoria Qu
antica de Campos aquelas series s
ao tambem denominadas exponenciais de tempo
ordenado.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

313/1304

temos
|Dab (t, s)| 1 +

X
m
X

n=1 k1 =1

1+

1+

1+

= 1+

n=1

m
X

k1 =1

n=1

Z tZ
m
X

kn1 =1

n=1

Z tZ
m
X

kn1 =1

tn1
s

t1
s



|Aak1 (t1 )| |Ak1 k2 (t2 )| Akn1 b (tn ) dtn dt1

tn1
s

dtn dt1

m
m
X
|t s|n X

1
n! k =1
k
=1
1

t1

n1

|t s|n n1
m
n!


1 m|ts|
e
1
m

Isso mostra que, para cada elemento de matriz ab, a serie do lado direito de (7.10) e absolutamente
convergente, e isso para todo s e t.
Para mostrar que (7.12) representa de fato a solucao procurada, vamos mostrar que

Isso, em particular, diz que

D(t, s) = A(t)D(t, s).


t

(7.13)

d
D(t) = A(t)D(t).
dt

(7.14)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

314/1304

De fato,

D(t, s) =
t
t

d
=
dt

Z tZ
X
s

n=1

A(t1 ) dt1 +
s

Z tZ

= A(t)

tn1

A(t1 )A(t2 ) A(tn ) dtn dtn1 dt1 .

Z tZ
s

= 0 + A(t) +

= A(t)

t1

Z
Z

t1
s

t1

A(t1 )A(t2 ) dt2 dt1


s

t2

A(t1 )A(t2 )A(t3 ) dt3 dt2 dt1 +

A(t)A(t2 ) dt2 +
s

Z tZ
s

A(t2 ) dt2 +

Z tZ
s

s
t

A(t1 ) dt1 +

Z tZ
s

t2
s

A(t)A(t2 )A(t3 ) dt3 dt2 +

t2

A(t2 )A(t3 ) dt3 dt2 +

s
t1
s

A(t1 )A(t2 ) dt2 dt1 +




= A(t)D(t, s),
como queramos provar. Acima, na passagem da quarta para a quinta linha, fizemos uma serie de
mudancas de nomes das variaveis de integracao, chamando t2 de t1 , t3 de t2 etc.
De maneira analoga prova-se tambem que

D(t, s) = D(t, s)A(s).


s
E. 7.2 Exerccio. Faca isso.

tambem evidente pela definicao (7.10) que para todo t vale D(t, t) = . Analogamente, vale
E
D(0) = . Retornando a` equacao (7.12), notemos que calculando o lado direito em t = 0 temos
Z 0
Y (0) = D(0)Y0 +
D(0, s)F (s) ds = Y0 + 0 = Y0
0

mostrando que o lado direito de (7.12) satisfaz a condicao inicial Y (0) = Y0 . Derivando o lado direito

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

315/1304

de (7.12) em relacao a t, tem-se


Y (t) =

d
d
D(t)Y0 +
dt
dt

D(t, s)F (s) ds


0

= A(t)D(t)Y0 + D(t, t)F (t) +

= A(t)D(t)Y0 + F (t) +


= A(t) D(t)Y0 +

t
0

D(t, s)F (s) ds


t

A(t)D(t, s)F (s) ds


0

D(t, s)F (s) ds + F (t).


0

= A(t)Y (t) + F (t),


provando que lado direito de (7.12) satisfaz a equacao diferencial. Como a solucao e u
nica, ela deve ser
aquela dada em (7.12).
Observa
co
es
A serie de Dyson em (7.10) e (7.11) fornece a solucao do sistema de equacoes Y (t) = A(t)Y (t)+F (t)
atraves de (7.12). Devemos fazer notar, porem, que a serie de Dyson nao e o u
nico meio de obter solucoes
dessas equacoes. Em alguns casos particulares outros metodos podem ser mais eficazes, especialmente
se estivermos interessados em obter solucoes em termos de funcoes conhecidas ou de expansoes em
serie. Tal e o caso, por exemplo, se os elementos de matriz de A(t) e F (t) sao funcoes analticas de t
ou possuem singularidades fracas, quando o chamado metodo de expans
ao em serie de potencias ou
o metodo de Frobenius podem ser empregados (vide para tal o Captulo 8, pagina 394,). Em muitos
casos a serie de Dyson nao e u
til quando se pretende obter solucoes explcitas, devido a` complexidade
de se calcular explicitamente os produtos de matrizes A(t1 ) A(tn ) e suas integrais.
A serie de Dyson e, porem, bastante eficiente quando o interesse e obter solucoes por metodos
numericos, ja que a mesma e rapidamente convergente. A serie de Dyson e tambem muito u
til quando
se tem pela frente problemas de teoria de perturbacoes. Isso sera discutido com mais detalhe na Secao
7.4. Foi, alias, estudando problemas de teoria de perturbacoes na Teoria Quantica de Campos que
Dyson chegou a`quela serie, inspirado provavelmente nos metodos iterativos de solucao da equacao
integral de Volterra (o leitor interessado pode estudar o tratamento da equacao integral de Volterra
feito na Secao 17.2, pagina 889, mas isso e dispensavel para o que segue).

A serie de Dyson possui generalizacoes para espacos de Hilbert e de Banach e mesmo quando A(t)
e uma famlia de operadores nao-limitados. O leitor interessado podera estuda-las em [104].
Um caso particular importante da solucao via serie de Dyson e aquele no qual a matriz A(t) e
constante, ou seja, nao depende da variavel t. Trataremos disso na Secao 7.3. Outras representacoes e
propriedades da serie de Dyson sao apresentadas no Apendice 7.5, pagina 330.
Equa
co
es Matriciais

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

316/1304

Ate agora estudamos equacoes da forma Y (t) = A(t)Y (t) + F (t), com condicao inicial Y (0) = Y0 ,
onde A(t) e uma matriz m m e onde Y e F sao vetores coluna com m componentes:

y1 (t)
f1 (t)

Y (t) = ... ,
F (t) = ... .
ym (t)
fm (t)

Consideremos agora a equacao M(t)


= A(t)M(t)+G(t), com condicao inicial M(0) = M0 , onde A(t),
G(t) e M(t) sao matrizes m m, a incognita sendo a matriz M(t). Veremos facilmente que podemos
tratar esse problema com os mesmos metodos do anterior, onde a incognita era um vetor coluna Y de
m componentes e nao uma matriz quadrada.
De fato, como toda matriz m m, as matrizes M(t) e G(t) sao da forma (para notacao, vide pagina
143)
hh
ii
hh
ii
M(t) = M1 (t), . . . , Mm (t) ,
G(t) = G1 (t), . . . , Gm (t) ,

onde Mi (t) e Gi (t) sao vetores coluna com m componentes, representando a i-esima coluna das matrizes
M(t) e G(t), respectivamente.

Nessa notacao a equacao diferencial M(t)


= A(t)M(t) + G(t) fica
hh
ii
hh
ii hh
ii
M 1 (t), . . . , Mm (t) = A(t)M1 (t), . . . , A(t)Mm (t) + G1 (t), . . . , Gm (t) ,

ou seja, tem-se um conjunto de m sistemas de equacoes independentes


M i (t) = A(t)Mi (t) + Gi (t),

i = 1, . . . , m

(7.15)

do tipo que tratamos acima, onde as incognitas sao vetores coluna.


Para cada uma dessas equacoes vale o teorema de unicidade de solucoes que provamos acima. Assim

conclumos que a equacao matricial M(t)


= A(t)M(t) + G(t), com condicao inicial M(0) = M0 tem
solucao u
nica.
A solucao de cada equacao (7.15) e
Mi (t) = D(t)Mi (0) +

D(t, s)Gi (s) ds,

i = 1, . . . , m.

Reunindo as colunas Mi novamente na matriz M, temos


Z t
M(t) = D(t)M0 +
D(t, s)G(s) ds
0

como solucao u
nica de M(t)
= A(t)M(t) + G(t), com condicao inicial M(0) = M0 .

7.2.3

Propriedades de D(s, t)

Consideremos novamente a equacao homogenea Y (t) = A(t)Y (t) com a condicao inicial Y (0) = Y0 .
Sabemos que sua solucao e dada por Y (t) = D(t)Y0 , onde D(t) e dada em (7.11).

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

Sejam ek os vetores da base canonica




1
0
0
1




e 1 = 0 , e 2 = 0 ,
..
..
.
.
0
0

...,

em

317/1304


0
0


= ... .

0
1

Definimos
Y k (t) = D(t)ek
para k = 1, . . . , m. Cada Y k (t) e solucao da equacao homogenea Y (t) = A(t)Y (t) com a condicao
inicial Y (0) = ek .
Um vetor Y0 representando uma condicao inicial generica

y10
..
Y0 = .

(7.16)

0
ym

pode ser escrita na base canonica como

Y0 =

m
X

yk0 ek .

k=1

Assim, se Y (t) e solucao da equacao homogenea Y (t) = A(t)Y (t) com a condicao inicial Y (0) = Y0
temos que
m
m
X
X
0
k
Y (t) = D(t)Y0 =
yk D(t)e =
yk0 Y k (t).
(7.17)
k=1

k=1

Em resumo, todas as solucoes da equacao homogenea Y (t) = A(t)Y (t) podem ser escritas como combinacoes lineares das funcoes Y 1 (t), . . . , Y m (t), os coeficientes sendo as componentes yk0 do vetor Y0
na base canonica.
Em virtude dessas e de outras propriedades que ainda estudaremos e importante estudar as funcoes
Y (t). O conjunto de funcoes {Y 1 (t), . . . , Y m (t)} e denominado sistema fundamental ou sistema integral ou ainda base integral de solucoes da equacao Y (t) = A(t)Y (t). O conceito de sistema fundamental
de solucoes foi introduzido por Fuchs2 em 1866.
k

Importante nesse contexto e a matriz cujas colunas sao formadas pelos vetores coluna Y k . Defina-se
(para a notacao vide apendice 3.1, pagina 143)
hh
ii
W (t) = Y 1 (t), . . . , Y m (t) .
Essa matriz e denominada matriz Wronskiana3 ou matriz fundamental.
2
3

Lazarus Immanuel Fuchs (1833-1902).


Conde Josef Hoene de Wronski (1778-1853).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

Tem-se, porem, o seguinte. Pela definicao Y k (t) = D(t)ek . Portanto,


hh
ii
hh
ii
hh
ii
Y 1 (t), . . . , Y m (t) = D(t)e1 , . . . , D(t)em = D(t) e1 , . . . , em = D(t)

hh
ii
pois e1 , . . . , em = .
O fato que

D(t) =

hh

Y (t), . . . , Y (t)

ii

318/1304

= D(t) ,

(7.18)

mostra que a matriz de Dyson (7.11) e identica a` matriz Wronskiana e, portanto, podemos determinar
D(t) calculando-se os vetores Y 1 (t), . . . , Y m (t). Esse procedimento para determinar D(t) pode ser
mais facil que calcular a serie de Dyson do lado direito de (7.11).
A identidade (7.18) sera tambem usada para outros propositos, um deles sera mostrar que D(t) e
uma matriz invertvel.
Vamos, de fato, mostrar que para todo t o conjunto {Y 1 (t), . . . , Y m (t)} e um conjunto de vetores
linearmente independente. Suponhamos o oposto, ou seja, que haja constantes 1 , . . . , m nem todas
nulas, tais que
1 Y 1 (t0 ) + + m Y m (t0 ) = 0
para algum t0 . Sabemos por (7.16)-(7.17) que a funcao
Y (t) = 1 Y 1 (t) + + m Y m (t)
e solucao de Y (t) = A(t)Y (t) com a condicao inicial

1

Y (0) = Y0 = ... .
m

Pela hipotese, Y (t0 ) = 0. Pelo observado no topico Uma propriedade da solucao das equacoes homogeneas da pagina 311, isso implica que Y (t) = 0 para todo t. Logo 1 = = m = 0, uma
contradicao que prova que os vetores {Y 1 (t), . . . , Y m (t)} devem ser linearmente independentes para
todo t.
Se os vetores {Y 1 (t),hh . . . , Y m (t)} sao linearmente
independentes para todo t, entao o determinante
ii
da matriz Wronskiana Y 1 (t), . . . , Y m (t) nunca se anula.
O determinante

hh
ii
W(t) = det Y 1 (t), . . . , Y m (t)

e dito ser o Wronskiano do sistema linear homogeneo Y (t) = A(t)Y (t). Como acabamos de ver W(t) 6= 0
para todo t.
Como a matriz Wronskiana e identica a` matriz de Dyson (7.11), conclumos que o determinante
daquela matriz nunca se anula. Isso significa que a matriz inversa D(t)1 existe para todo t.
A rela
c
ao entre D(t, s) e D(t)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

319/1304

Com o fato em maos que existem as inversas D(t)1 para todo t, vamos demonstrar agora a seguinte
identidade importante: para todo s e todo t vale
D(t, s) = D(t)D(s)1 .

(7.19)

A prova e simples. Seja s fixo daqui por diante. Sejam A(t) = D(t, s) e B(t) = D(t)D(s)1 .
Queremos provar que A(t) = B(t) para todo t. Observemos que A(s) = D(s, s) = e que B(s) =
D(s)D(s)1 = . Logo, A e B sao iguais no ponto t = s. Fora isso,
d

A(t) =
D(t, s)
dt
t
e

d
B(t) =
dt

(7.13)


d
D(t) D(s)1
dt

A(t)D(t, s) = A(t)A(t)

(7.14)

A(t)D(t)D(s)1 = A(t)B(t).

Assim, A e B sao iguais no ponto t = s e satisfazem a mesma equacao homogenea M (t) = A(t)M (t).
Pelos teoremas de unicidade que estabelecemos, segue que A(t) = B(t) para todo t, que e o que
queramos provar.
Com isso, podemos escrever a solucao (7.12) de Y (t) = A(t)Y (t) + F (t), com a condicao inicial
Y (0) = Y0 , como
Z t
Y (t) = D(t)Y0 +
D(t)D(s)1 F (s) ds
0

= D(t) Y0 +

t
1

D(s) F (s) ds .
0

Outro fato que se pode agora provar e o seguinte. Se Y (t) e solucao da equacao homogenea

Y (t) = A(t)Y (t) com a condicao inicial Y (0) = Y0 , entao para todo s e todo t
Y (t) = D(t, s)Y (s).
De fato, Y (s) = D(s)Y0 . Portanto, D(t, s)Y (s) = D(t)D(s)1 D(s)Y0 = D(t)Y0 = Y (t).
A regra de composi
c
ao para D(t, s)
A relacao (7.19) tem a seguinte conseq
uencia, cuja prova e agora elementar: para todos r, s e t vale
D(t, s) = D(t, r)D(r, s).

(7.20)

Essa expressao e denominada regra de composica


o para as matrizes de Dyson D(t, s). Note que e
muito mais difcil prova-la usando apenas a definicao (7.10)!
E. 7.3 Exerccio para masoquistas. Prove (7.20) usando apenas (7.10).
Solu
c
ao para condi
c
ao inicial em instante arbitr
ario

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

320/1304

Uma conseq
uencia das u
ltimas observacoes e que se para a equacao Y (t) = A(t)Y (t) + F (t) for
dada uma condicao inicial nao em t = 0, mas em t = t0 , Y (t0 ) = Yt0 , a solucao e entao dada por
Z t
Y (t) = D(t, t0 )Yt0 +
D(t, s)F (s) ds.
(7.21)
t0

E. 7.4 Exerccio. Verifique!

Mais propriedades da serie de Dyson sao discutidas no Apendice 7.5, pagina 330.

7.3

Equa
co
es com Coeficientes Constantes

Vamos aqui estudar sistemas de equacoes lineares de primeira ordem com coeficientes constantes como
Y (t) = AY (t) + F (t), com condicao inicial Y (0) = Y0 , onde A e uma matriz constante, ou seja, seus
elementos de matriz nao dependem da variavel t. Esse e um caso particular do que vimos acima.
A serie de Dyson nesse caso fica
D(t, s) =

Z tZ
X
n=1

Z tZ
s

n=1

t1

X
(t s)n

n!

n=1

tn1
s

t1

An dtn dtn1 dt1

tn1
s

dtn dtn1 dt1

An .

Por analogia com a bem conhecida serie de Taylor da funcao exponencial, define-se, para uma matriz
A,
exp(A) = e

X
1 n
+
A .
n!
n=1

Assim,

(7.22)

D(t, s) = eA(ts)
e
D(t) = eAt .
A convergencia de (7.22) ja foi provada quando tratamos da convergencia da serie de Dyson no caso
geral.
Assim, a solucao de Y (t) = AY (t) + F (t), com a condicao inicial Y (0) = Y0 , e dada, segundo (7.12),
por
Z
t

At

eA(ts) F (s)ds.

Y (t) = e Y0 +

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

321/1304

O que se pode dizer sobre a dependencia em t dos elementos de matriz de eAt ? Ha dois casos
basicos a considerar. O primeiro e o caso em que A e diagonalizavel; o segundo caso em que A nao e
diagonalizavel.
Caso diagonaliz
avel
Se A e diagonalizavel entao existe uma matriz P tal que P 1 AP = D onde D e uma matriz diagonal,
tendo na diagonal os autovalores de A. Assim,
e

At

X
tn
n=1

= P

= P

= P

n!

An

n
X
t
n=1

n
X
t
n=1

n!

n!

n
X
t
n=1

n!

P 1 An P

(P 1 AP )n

Dn

P 1

P 1

P 1

= P eDt P 1 .
claro pela igualdade
Agora, se D = diag (1 , . . . , m ), entao eDt = diag (e1 t , . . . , em t ). E
At
Dt 1
At
e = P e P que os elementos de matriz de e serao da forma
eAt

ab

m
X

ckab ek t ,

k=1

ou seja, serao combinacoes lineares de exponenciais do produto de autovalores de A com t. Os coeficientes ckab sao constantes e dados em funcao dos elementos de matriz de P e P 1 .
Caso n
ao-diagonaliz
avel
Caso A nao seja diagonalizavel, o Teorema da Decomposicao de Jordan (na forma do Teorema 3.18,
pagina 199) nos garante que existe uma matriz P tal que P 1 AP = D + N , onde: 1) D e uma matriz
diagonal, cujos elementos da diagonal sao os autovalores de A; 2) N e uma matriz nilpotente com
ndice, digamos, q; 3) D e N comutam.
Portanto, como D e N comutam,
exp(At) = P exp(P 1 AP t)P 1 = P exp(Dt + N t)P 1 = P exp(Dt) exp(N t)P 1 ,
onde aqui usamos a Proposicao 4.6, da pagina 232. Agora,
exp(Dt) = diag (e1 t , . . . , em t )

JCABarata. Curso de Fsica-Matem


atica

e
exp(N t) =

n
X
t

Captulo 7

Vers
ao de 29 de setembro de 2005.

n=1

n!

q1 n
X
t
n=1

n!

322/1304

N n.

Observe-se que a serie do lado direito e truncada em n = q pois N q = 0, ja que N e nilpotente com
ndice q. Assim, eN t e uma matriz cujos elementos sao polinomios em t de grau menor que q.
Fica claro, fazendo-se o produto eDt eN t , que os elementos de matriz de eAt serao agora da forma
e

At

ab

m
X

ckab (t) ek t ,

k=1

ou seja, serao combinacoes lineares de exponenciais do produto de autovalores de A com t. Ha, porem,
uma diferenca em relacao ao caso diagonalizavel, a saber, os coeficientes c kab (t) nao sao mais constantes,
mas sao agora polinomios em t de grau menor que q e sao dados em funcao dos elementos de matriz
de P e P 1 .

7.3.1

Alguns Exemplos e Aplica


co
es

Vamos aqui tratar um exemplo simples e bem conhecido proveniente da Mecanica Classica e que ilustra
bem conceitos que introduzimos nas secoes anteriores. Trata-se do problema do oscilador harmonico
amortecido forcado.
Como e bem sabido, esse sistema e descrito pela equacao diferencial linear de segunda ordem
m
x(t) = kx(t) x(t)
+ f (t)
que nada mais e que a segunda lei de Newton para uma partcula de massa m ligada a uma mola de
constante k e se movendo em um meio (viscoso) que exerce sobre a partcula uma forca do tipo v(t)
(v(t) e a velocidade da partcula no instante t). Fora isso age sobre a partcula mais uma forca externa
que depende apenas do tempo: f (t). Acima m > 0, k 0 e 0.
Dividindo a equacao acima por m, podemos escreve-la como

x(t) = 02 x(t) x(t)


+ g(t)
onde
0 =

k
,
m

,
m

g(t) =

1
f (t).
m

Podemos, por um metodo comummente usado, transformar essa equacao de segunda ordem em um
sistema de duas equacoes de primeira ordem. Definindo v(t) = x(t),

ficamos com
x(t)

= v(t)
v(t)

= 02 x(t) v(t) + g(t)


Isso pode ser escrito na seguinte forma matricial:
Y (t) = AY (t) + F (t),

(7.23)

JCABarata. Curso de Fsica-Matem


atica

onde
Y (t) =


x(t)
,
v(t)

A =

Captulo 7

Vers
ao de 29 de setembro de 2005.


0
1
,
02

F (t) =

323/1304


0
.
g(t)

A matriz A tem coeficientes constantes. Aprendemos nas secoes anteriores que a solucao dessa
equacao, com uma condicao inicial que fixa a posicao e a velocidade da partcula em t = 0


 
x(0)
x0
Y (0) =
=
,
v(0)
v0
e dada por
At

Y (t) = e Y0 +

eA(ts) F (s) ds.

(7.24)

Como se ve, precisamos calcular agora eAt para a matriz A dada acima.
A primeira questao que devemos nos colocar e se a matriz A e diagonalizavel ou nao. Seus autovalores sao
p
p
+ 2 402
2 402
1 =
e 2 =
.
2
2
E. 7.5 Exerccio. Verifique!

Os autovetores associados podem ser escolhidos na forma


p
p

2 402
+ 2 402

202
202
,
.

v1 =
v
=
2

1
1
E. 7.6 Exerccio. Verifique!

p
Como facilmente se ve, caso 2 402 6= 0, ou seja, caso 6= 20 , a matriz A tem dois autovalores
distintos e e, portanto, diagonalizavel. Se, porem, = 20 , tem-se v1 = v2 e a matriz A nao e mais
simples e, portanto, nao e diagonalizavel.
Vamos tratar esses dois casos separadamente. O leitor e convidado a fazer como exerccio todos os
calculos que forem deixados indicados.
O caso 6= 20

hh

ii

Nesse caso A e diagonalizavel pela matriz P = v1 , v2 , ou seja

P 1 AP = D =

1 0
0 2

2 402
2

0 2

402
2

JCABarata. Curso de Fsica-Matem


atica

onde
P =

hh

v1 , v2

Calculando-se a inversa, tem-se

P 1

Da, segue que


eAt = P eDt P 1 = P

1 t

ii

Vers
ao de 29 de setembro de 2005.

p
2 402
202
1

02

p 2

402

2
p 0
2 402

Captulo 7

324/1304

2 402

202
.

+ 2 402
p

2 2 402

.
p

+ 2 402
p
2 2 402

2 e1 t + 1 e2 t

1
0

P 1 = p

2
e 2 t
402
02 e1 t + e2 t

e 1 t e 2 t
1 e

1 t

2 e

2 t

(7.25)
Alternativamente, usando as expressoes (3.32)-(3.33), obtemos para A a representacao espectral A =
1 E1 + 2 E2 com




1
1
2 1
1 1
E1 =
,
E2 =
,
1 2 02 1
2 1 02 2
de onde, usando eAt = e1 t E1 + = e2 t E2 , obtem-se novamente a expressao (7.25).
E. 7.7 Exerccio. Verifique as afirmacoes acima. Em particular, verifique que E 1 e E2 sao projetores e
satisfazem E1 E2 = e E1 + E2 = .
6
O leitor e convidado agora a escrever as formulas explcitas para x(t) e v(t) que advem de (7.24) e
(7.25). Para x(t), por exemplo, obtem-se


Z t
1
x0 + 2v0
t/2
sen (1 t) +
e(ts)/2 sen (1 (t s))f (s) ds,
x(t) = e
x0 cos(1 t) +
21
m1 0
onde
1 =

02

2
.
4

Essa expressao vale tanto para 0 > /2 quanto para 0 < /2. Nesse segundo caso 1 torna-se um
n
umero imaginario puro:
1 = i2 ,
onde
2 =

2
02
4

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

325/1304

e real. A solucao para x(t) fica




Z t
x0 + 2v0
1
t/2
x0 cosh(2 t) +
x(t) = e
e(ts)/2 senh (2 (t s))f (s) ds.
senh (2 t) +
22
m2 0
O caso = 20 > 0
Nesse caso a matriz A fica

A =


0
1
2
.
4

A pode ser levada a` sua forma de Jordan (vide Secao 3.7.4, pagina 205 e antecedentes) J = P 1 AP ,
onde


4
0
2
1

1
,
,

J =
P
=
P
=

2
2
0

0
1
2
4

Note-se que J = D + N , onde

2
D =

N =

facil verificar que D e N comutam e que N 2 = 0. Assim,


E
eAt = P e(D+N )t P 1 = P eDt eN t P 1 ,
sendo que

eDt =

eN t =
Portanto,

At

t
1+
2

e 2

t
2

+ Nt =

t/2

2 t
et/2
4

te


t/2

t
1
2

et/2

O leitor e convidado agora a escrever as formulas explcitas para x(t) e v(t) que advem de (7.24).
Para x(t), por exemplo, obtem-se

JCABarata. Curso de Fsica-Matem


atica

x(t) = e

t/2



Vers
ao de 29 de setembro de 2005.

 1

1 + t x0 + t v 0 +
2
m

Captulo 7

326/1304

t
0

(t s)e(ts)/2 f (s) ds.

O caso = 0
Analisemos tambem o caso = 0, que corresponde a` ausencia do termo de amortecimento v(t)
na equacao de movimento da partcula. Nesse caso


0 1
A =
02 0
1 = i0 , 2 = i0 e, por (7.25),

eAt =

cos(0 t)
0 sen (0 t)

1
sen (0 t)

0
.
cos(0 t)

O leitor e convidado agora a escrever as formulas explcitas para x(t) e v(t) que advem de (7.24).
Para x(t), por exemplo, obtem-se


Z t
1
v0
sen (0 (t s))f (s) ds,
sen (0 t) +
x(t) = x0 cos(0 t) +
0
m0 0
O caso k = 0, = 0. Partcula submetida a for
ca externa dependente do tempo
Nesse caso, usando a notacao anterior,
x(t) = g(t),
ou seja,

Y (t) = AY (t) + F (t)

com
A =
A e nilpotente com A2 = 0. Logo
e

At


0 1
.
0 0

+ At =


1 t
.
0 1

O leitor e convidado agora a escrever as formulas explcitas para x(t) e v(t) que advem de (7.24).
Para x(t), por exemplo, obtem-se
Z
1 t
(t s)f (s) ds .
x(t) = (x0 + v0 t) +
m 0
Por exemplo, no caso de f ser constante, segue disso a conhecidssima relacao x(t) = x 0 + v0 t +

f 2
t .
2m

JCABarata. Curso de Fsica-Matem


atica

7.4

Vers
ao de 29 de setembro de 2005.

Captulo 7

327/1304

Teoria de Perturba
co
es de Sistemas Lineares

Existem muitos problemas, especialmente na Mecanica Classica e na Mecanica Quantica, que tem a
seguinte estrutura. Procura-se encontrar a solucao de uma equacao linear homogenea Y (t) = A(t)Y (t),
com a condicao inicial Y (0) = Y0 , sendo que A(t) e da forma
A(t) = L + I(t)
onde L e uma matriz constante e I(t) pode depender do tempo mas e, em um sentido a ser precisado,
pequena. Por exemplo, I(t) pode ser da forma I(t) = J(t), onde e uma constante pequena.
Se I fosse zero a solucao seria Y (t) = eLt Y0 . Deve-se esperar que se I for pequena a solucao de
Y (t) = A(t)Y (t) nao deve estar muito afastada de Y (t) = eLt Y0 e a presenca de I(t) deve perturbar a
solucao Y (t) = eLt Y0 apenas ligeiramente. Como determinar a perturbacao que I provoca? Esse tipo
de problema e muito freq
uentemente encontrado em Fsica.
Vamos usar aqui a serie de Dyson para tratar esse problema no contexto acima de sistemas lineares.
O primeiro passo consiste em definir um novo vetor coluna X(t) por
X(t) = eLt Y (t).
Vamos verificar qual condicao inicial e qual equacao diferencial X(t) obedece. Tem-se que X(0) =
Y (0) = Y0 . Fora isso

d Lt
e Y (t)
dt

X(t)
=

= LeLt Y (t) + eLt Y (t)


= LeLt Y (t) + eLt A(t)Y (t)
= LeLt Y (t) + eLt (L + I(t))Y (t)
= eLt I(t)Y (t)
= eLt I(t)eLt X(t).
Assim, definindo-se

I(t)
= eLt I(t)eLt ,

conclumos que X(t) satisfaz

X(t)
= I(t)X(t).

Pela serie de Dyson, a solucao dessa equacao com a condicao inicial X(0) = Y 0 e
( Z Z
)
Z tn1
X t t1
1 )I(t
2 ) I(t
n ) dtn dtn1 dt1 Y0 .
X(t) = Y0 +

I(t
n=1

JCABarata. Curso de Fsica-Matem


atica

Retornando a Y (t) = eLt X(t), temos


( Z Z
X t
Lt
Lt
Y (t) = e Y0 + e
0

n=1

t1
0

Vers
ao de 29 de setembro de 2005.

tn1
0

Captulo 7

1 )I(t
2 ) I(t
n ) dtn dtn1 dt1
I(t

328/1304

Y0 .

(7.26)

De modo mais explcito, isso e


Y (t) = eLt Y0
+eLt

( Z Z
X t
0

n=1

t1

tn1
0

eLt1 I(t1 )eL(t1 t2 ) I(t2 )eL(t2 t3 ) eL(tn1 tn ) I(tn )eLtn dtn dt1

Vamos supor que I(t) seja da forma I(t) = J(t). Substituindo na u


ltima expressao obtemos a
solucao expressa em termos de uma serie de potencias em :
Y (t) = eLt Y0
+ eLt

(
X

n=1

Lt

= e Y0 +e

Z tZ

Lt

Z

t1
0

tn1
0

eLt1 J(t1 )eL(t1 t2 ) J(t2 )eL(t2 t3 ) eL(tn1 tn ) J(tn )eLtn dtn dt1

Lt1

J(t1 )e

Lt1

2 Lt

dt1 Y0 + e

Z t Z
0

t1

Lt1

J(t1 )e

L(t1 t2 )

J(t2 )e

Lt2

Y0

dt2 dt1 Y0 + .

Nessa forma e possvel ver as correcoes que o termo I(t) = J(t) adiciona a` solucao e Lt Y0 quando
e uma constante pequena. A correcao de primeira ordem em e

Z t
Lt
Lt1
Lt1
e
J(t1 )e dt1 Y0 .
e
0

A de segunda ordem em e
2 Lt

Z t Z
0

t1

Lt1

J(t1 )e

L(t1 t2 )

J(t2 )e

Lt2

dt2 dt1 Y0

etc.
Todas essa expressoes sao empregadas em Mecanica Quantica.
Um problema de teoria de perturba
co
es
Consideremos o problema de uma partcula de massa m presa a uma mola de constante k(t) =
k0 + k1 (t) onde e um n
umero pequeno, e sem nenhuma forca adicional agindo sobre a partcula. Ou
seja, a constante de mola tem uma pequena dependencia temporal e desejamos estudar o efeito dessa
pequena perturbacao sobre a solucao obtida quando = 0, a qual e, sabidamente,
x0 cos(0 t) +

v0
sen (0 t),
0

Y0 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

329/1304

onde 02 = k0 /m.
A equacao de movimento e m
x(t) = k(t)x(t), ou seja,


k1 (t)
2
x(t) = 0 +
x(t),
m
que em forma de um sistema de duas equacoes de primeira ordem fica
Y (t) = A(t)Y (t),
onde
Y (t) =
e


x(t)
,
v(t)

A(t) = A + J(t),
com
A =
e
J(t) =

0 1
02 0


0
0
.
m1 k1 (t) 0

Pelas expressoes obtidas na Secao 7.4, a solucao em primeira ordem em e



Z t
At1
At
At
At1
J(t1 )e dt1 Y0 .
e Y0 + e
e
0

De modo mais explcito, isso e igual a

cos(0 t)
0 sen (0 t)

cos(0 t)x0 +

1
sen (0 t)v0
0

0 sen (0 t)x0 + cos(0 t)v0

1
1
sen 2 (0 t1 )v0

sen
(
t
)
cos(
t
)x
+
0
1
0
1
0
Z
sen (0 t)

t
m
0

0
k1 (t1 )

0
1
cos(0 t)
cos2 (0 t1 )x0 + sen (0 t1 ) cos(0 t1 )v0
m

Para a posicao x(t), a correcao de primeira ordem em a` solucao nao perturbada


cos(0 t)x0 +
e

"

cos(0 t)

t
0

1
sen (0 t)v0
0

1
sen 2 (0 t1 )v0
k1 (t1 ) sen (0 t1 ) cos(0 t1 )x0 +
m0

dt1

dt1 .

JCABarata. Curso de Fsica-Matem


atica

1
+
sen (0 t)
0

t
0

Vers
ao de 29 de setembro de 2005.

Captulo 7

330/1304

#


1
k1 (t1 ) cos2 (0 t1 )x0 + sen (0 t1 ) cos(0 t1 )v0 dt1 .
m

O calculo explcito dessas integrais depende da forma de k1 (t).


O leitor e convidado nesse momento a ler nos bons livros de Mecanica Classica (por ex., Arnold [6],
Landau-Lifchitz [78]) algo sobre o assunto ressonancia parametrica.
Coment
ario final sobre as s
eries perturbativas
Se for pequeno e t nao for muito grande a aproximacao de primeira ordem em e uma aproximacao
razoavelmente boa para a solucao. As correcoes de ordem superior em podem tambem ser calculadas,
embora seu computo fique cada vez mais complexo, como se ve pela expressoes (7.26) e seguintes.
Para t os termos individuais da serie perturbativa (7.26) podem divergir com t, sem que a
solucao x(t) seja ela mesmo divergente. Esse tipo de comportamento nao e tao estranho assim se nos
lembrarmos, por exemplo, do que acontece com a serie da Taylor da funcao seno (ou co-seno):

X
(1)n 2n+1 2n+1

t
sen (t) =
(2n + 1)!
n=0

Os primeiros termos sao

3 3
5 5
t +
t + .
6
120
Cada um deles diverge quanto t (para qualquer 6= 0 fixo, nao importa o quao grande ou
pequeno) mas a funcao sen (t) permanece limitada.
t

A licao a se aprender e que certas expansoes podem nao ser boas quando se deseja estudar o
comportamento para t grande das solucoes. Tal e o caso da serie de Taylor acima e da serie de Dyson
(em muitos casos). Para estudar o comportamento para t grande e preciso procurar expansoes que
sejam uniformemente convergentes em t para toda a reta real.

7.5

Mais sobre a S
erie de Dyson. Produtos de Tempo Ordenado

A fun
c
ao degrau, ou fun
c
ao de Heaviside
Define-se a chamada funca
o degrau ou funca
o de Heaviside4 , (s), s

1, se s 0
(s) :=
.
0, se s < 0
Defina-se tambem, para t1 , . . . , tm


, por

m (t1 , . . . , tm ) := (tm1 tm )(tm2 tm1 ) (t1 t2 ) .


4

Oliver Heaviside (1850-1925).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

bastante facil de constatar pela definicao que


E

1, se tm tm1 t1
m (t1 , . . . , tm ) :=
0, de outra forma

331/1304

(7.27)

Seja Sm o grupo de permutacoes de m ndices {1, . . . , m}. Os elementos de Sm sao bijecoes


de {1, . . . , m} em si mesmo. Ha um importante fato sobre a funcao m : se os m n
umeros reais
t1 , . . . , tm forem todos distintos entre si, entao
X
m (t(1) , . . . , t(m) ) = 1 .
(7.28)
Sm

Para prova-la, observe-se que, devido ao fato de ser totalmente ordenado, para uma m-upla t 1 , . . . , tm
composta de elementos distintos existe um e somente um elemento 0 Sm tal que t0 (m) < . . . <
t0 (1) . Assim, por (7.27), segue que ha no lado esquerdo de (7.28) apenas um termo nao-nulo: aquele
que corresponde a 0 , e esse termo vale 1, tambem devido a (7.27). A condicao de os pontos t1 , . . . , tm
serem todos distintos entre si e importante nesse raciocnio, mas o conjunto dos pontos que nao a
satisfazem e um conjunto de medida nula em m . Da, podemos afirmar que (7.28) vale quase em toda
a parte em m (ou seja, vale em todo m , exceto em um sub-conjunto de medida nula).


Reescrevendo a s
erie de Dyson.
Pretendemos apresentar uma outra maneira de representar a serie de Dyson (7.11):
D(t) =

Z tZ
X

m=1

t1
0

tm1
0

A(t1 )A(t2 ) A(tm ) dtm dtm1 dt1 .

(7.29)

da qual certas conseq


uencias podem ser mais facilmente extradas. O leitor ha de notar que nas integrais
em (7.29) as variaveis t1 , . . . , tm aparecem ordenadas na forma 0 tm tm1 t1 t. Dessa
forma, no produto de matrizes A(t1 )A(t2 ) A(tm ) os fatores aparecem ordenados (da esquerda para
a direita) de acordo com a ordem temporal decrescente dos argumentos.
Devido a` propriedade (7.27) de m (t1 , . . . , tm ), podemos reescrever (7.29) na forma
D(t) =

Z
X

m=1

t
0

t
0

m (t1 , . . . , tm )A(t1 )A(t2 ) A(tm ) dtm dtm1 dt1 .

(7.30)

Note o leitor que uma diferenca entre (7.29) e (7.30) esta nos limites superiores das integracoes, que
passam a ser todos iguais a t, o que e permitido pela introducao dos fatores m (t1 , . . . , tm ) nos
integrandos, fatores esses que se anulam caso a restricao tm tm1 t1 seja violada.
Se F (t1 , . . . , tm ) e uma funcao de m variaveis, tem-se evidentemente que
Z t
Z t
Z t
Z t

F (t1 , . . . , tm ) dtm dtm1 dt1 =

F (t(1) , . . . , t(m) ) dtm dtm1 dt1 ,


0

para qualquer permutacao Sm .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

332/1304

E. 7.8 Exerccio. Justifique! Sugestao: mudanca de variaveis mais a observacao que o hipercubo [0, t] m
e invariante por permutacoes das coordenadas.
6
Assim, como Sm possui m! elementos, segue trivialmente que
Z t
Z t
Z
Z t
1 X t
F (t(1) , . . . , t(m) ) dtm dtm1 dt1 ,
F (t1 , . . . , tm ) dtm dtm1 dt1 =

m! S 0
0
0
0
m

pois os termos somados no lado direito sao todos iguais. Aplicando essa simples identidade a (7.30),
tem-se
Z
Z t

X
1 X t
D(t) = +

m (t(1) , . . . , t(m) )A(t(1) )A(t(2) ) A(t(m) ) dtm dtm1 dt1 .


m!
0
0
m=1
S
m

(7.31)

Vamos definir


X
T A(t1 )A(t2 ) A(tm ) :=
m (t(1) , . . . , t(m) )A(t(1) )A(t(2) ) A(t(m) ) .

(7.32)

Sn

Para uma m-upla (t1 , . . . , tm ) [0, t]m composta de elementos distintos, existe um e somente
um elemento 0 Sm tal que t0 (m) < . . . < t0 (1) . Segue disso que o lado direito de (7.32) vale
A(t0 (1) )A(t0 (2) ) A(t0 (m) ). O leitor deve observar que esse produto aparece ordenado da esquerda
para a direita na ordem decrescente dos argumentos. Por essa razao a expressao do lado esquerdo de
(7.32) e denominada produto de tempo ordenado das matrizes A, denotada por T (A(t 1 ) A(tm )):
Com essa notacao podemos escrever (7.31) na forma
D(t) =

Z t
Z t 


X
1
+

T A(t1 )A(t2 ) A(tm ) dtm dtm1 dt1 .


m! 0
0
m=1

(7.33)

Essa forma de representar a serie de Dyson e freq


uentemente empregada na Teoria Quantica de
Campos, sendo que la as matrizes A(t) sao substitudas por operadores com valores em distribuicoes
e os produtos de tempo ordenado sao definidos em um sentido distribucional e de forma iterativa, de
modo a permitir um tratamento de problemas de renormalizacao. Para uma referencia moderna sobre
tais assuntos, vide [116].
O caso comutativo
Uma situacao particular de interesse e aquela na qual as matrizes A(s) comutam para valores
distintos do argumento, ou seja, A(s)A(s0 ) = A(s0 )A(s) para todos s, s0 . Tal e o caso, por exemplo,
se A(s) forem matrizes 1 1, ou se forem diagonais, ou ainda se forem da forma A(s) = f (s)B para
alguma matriz constante B e alguma funcao real ou complexa f . Sob essa hipotese de comutatividade,
tem-se que para todo Sm
A(t(1) )A(t(2) ) A(t(m) ) = A(t1 )A(t2 ) A(tm )

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

333/1304

pois a ordem dos fatores nao importa, devido a` comutatividade. A expressao (7.31) fica, entao,
#
Z t"X
Z t

X
1
m (t(1) , . . . , t(m) ) A(t1 )A(t2 ) A(tm ) dtm dtm1 dt1

D(t) =
+
m! 0
0
m=1
S
m

(7.28)

comut.

def.

Z t
Z t

X
1
+

A(t1 )A(t2 ) A(tm ) dtm dtm1 dt1


m!
0
0
m=1
m
Z t

X
1
A( )d
+
m!
0
m=1
exp

Z

A( )d
0

(7.34)

Usando que D(t, s) = D(t)D(s)1 , obtem-se


D(t, s) = exp

Z

A( )d
s

(7.35)

Conclumos que no caso comutativo, a solucao da equacao Y = A(t)Y (t) + F (t) com uma condicao
inicial Y (0) = Y0 dada em (7.12) fica
Z t R
Rt
t
A(
)d
Y (t) = e 0
e s A( )d F (s) ds .
Y0 +
(7.36)
0

O estudante pode constatar que no caso n = 1 (um sistema com uma u


nica equacao de primeira ordem)
a expressao acima corresponde precisamente a` solucao dada em (6.2), pagina 287.

7.6

Sistemas de Equa
co
es Diferenciais Lineares no Plano Complexo

Em (7.1), e em tudo que vimos ate aqui, consideramos sistemas lineares de equacoes diferenciais onde a
variavel t e assumida real. Para muitos propositos importantes, alguns dos quais discutiremos abaixo, e
conveniente alargar um pouco o domnio de nossas consideracoes e discutir sistemas lineares de equacoes
diferenciais definidas no plano complexo.
Por simplicidade trataremos apenas equacoes homogeneas, caso em que se encontra a maioria das
aplicacoes. A Secao 7.7.3, pagina 364, discute exemplos. Para referencias gerais sobre o assunto,
recomendamos [122] e [64].
Seja A(z) uma matriz m m complexa cujos elementos Aij (z), i, j = 1, . . . , m, sao funcoes de uma
variavel complexa z em um certo domnio aberto e simplesmente conexo comum D do plano complexo:
D . Consideremos a equacao diferencial linear e homogenea
Y 0 (z) = A(z)Y (z),

(7.37)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

334/1304

onde Y (z) denota um vetor coluna de funcoes complexas

y1 (z)

Y (z) = ... .
ym (z)
Estaremos aqui interessados em estudar esses sistemas de equacoes diferenciais quando uma condica
o
inicial e fornecida, ou seja, quando o valor de Y (z) em um ponto z0 D e especificado:

y10

Y (z0 ) =: Y0 = ... ,
0
ym

0
com y10 , . . . , ym
sendo constantes complexas. Notemos que ao procurarmos solucoes Y (z) de (7.37)
e implicitamente sub-entendido que as mesmas funcoes Y (z) sejam analticas, pois apenas funcoes
analticas sao diferenciaveis.

7.6.1

O Caso Analtico

Comecemos pelo caso no qual a matriz A(z) e analtica em um domnio aberto simplesmente conexo
D, ou seja, todos os seus elementos de matriz Aij (z) sao funcoes analticas de z em D. Uma primeira
pergunta importante diz respeito a` unicidade da solucao da equacao diferencial Y 0 (z) = A(z)Y (z),
z D, com a condicao Y (z0 ) = Y0 para algum z0 D. Essa pergunta pode ser respondida usando
nosso resultado anterior (do comeco deste captulo) que garante unicidade de solucao de sistemas
lineares de equacoes diferenciais com variaveis reais.
De fato, seja z(t), t [0, 1], uma curva arbitraria contnua e diferenciavel em D e tal que z(0) = z 0 .
Sejam Y1 e Y2 duas solucoes analticas de Y 0 (z) = A(z)Y (z), z D, com a mesma condicao Y1 (z0 ) =
Y2 (z0 ) = Y0 . Sejam X1 (t) := Y1 (z(t)) e X2 (t) := Y2 (z(t)). Definamos tambem B(t) := z(t)A(z(t)).

Notemos que B(t) e uma matriz contnua em t, pois A(z) e analtica.


facil, entao, constatar que X1 e X2 sao ambos solucoes da equacao diferencial
E

X(t)
= B(t)X(t),

t [0, 1],

com a condicao X(0) = Y0 . Pelas nossas consideracoes anteriores, isso implica X1 (t) = X2 (t), t
[0, 1], ou seja, Y1 (z(t)) = Y2 (z(t)), t [0, 1]. Como a curva z(t) e arbitraria e sua imagem pode
estar em todo D, isso implica Y1 (z) = Y2 (z) para todo z D. Isso prova a unicidade da solucao de
Y 0 (z) = A(z)Y (z), z D, com condicao Y1 (z0 ) = Y2 (z0 ) = Y0 .
Uma vez garantida a unicidade da solucao, tentemos exib-la. O que faremos e seguir a inspiracao
fornecida pela serie de Dyson, estudada anteriormente, e tentar generaliza-la para o plano complexo.
A s
erie de Dyson no plano complexo
Seja entao D um domnio aberto simplesmente conexo do plano complexo e A(z) analtica em D e
limitada em D. Seja tambem z0 D.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

335/1304

Uma vez demonstrada a unicidade da eventual solucao de uma equacao como Y 0 (z) = A(z)Y (z)
com condicao Y (z0 ) = Y0 precisamos demonstrar que a solucao existe. O que faremos e generalizar
nossas consideracoes anteriores sobre a serie de Dyson para o plano complexo.
Para z e w D , seja D(z, w) a matriz m m definida por
D(z, w) =

Z
X
n=1

z
w

z1
w

zn1
w

A(z1 )A(z2 ) A(zn ) dzn dzn1 dz1 .

(7.38)

Acima, todas as integracoes complexas sao feitas em uma curva C, simples, orientada de w a z e
inteiramente contida em D. Para cada n os pontos z1 , . . . , zn sao ordenados em sentido crescente
ao longo de C. Mais precisamente, denotamos por C a curva contnua e diferenciavel C : [0, 1] D
parametrizada por t [0, 1] com w = C(0), z = C(1). Entao, para cada n, tem-se zk = C(tk ),
1 k n, com 0 t1 tn 1.
Devido ao fato de A ser analtica no domnio simplesmente conexo D, a matriz D(z, w) nao depende
da particular curva orientada C adotada que conecta w a z (justifique isso!).

Afirmamos que a equacao Y 0 (z) = A(z)Y (z) com uma condicao Y (z0 ) = Y0 tem solucao, a qual e
dada por
Y (z) = D(z, z0 )Y0
(7.39)
A demonstracao sera feita provando-se que o lado direito satisfaz a equacao diferencial e a condicao
inicial. Como a solucao e u
nica (pelo provado acima), infere-se que nao pode haver outra.
Comecemos por mostrar que a serie que aparece em (7.38) e convergente, sem o que aquela expressao
nao faria sentido. O leitor facilmente constatara que o que faremos e uma simples imitacao da prova
anterior para a reta real, dado que somente faremos uso da hipotese de que A(z) e limitada em D.
Sejam z e w dois pontos de um domnio D sob as hipoteses acima (D e aberto e simplesmente
conexo) e seja Cwz uma curva contnua, diferenciavel, orientada, ligando w a z e inteiramente contida
em D. Para z 0 Cwz , denotemos por l(z 0 ) lCwz (z 0 ) o comprimento medido de w a z 0 ao longo
da curva Cwz . A funcao l : Cwz + e bijetora e, portanto, possui uma inversa, o que nos
permite parametrizar os pontos de Cwz pelo comprimento l medido ao longo de Cwz a partir de w.
Denotaremos por z 0 (l) essa parametrizacao, ou seja, z 0 (l) e o ponto de Cwz cuja distancia a w ao longo
de Cwz e l + .
um fato bem conhecido da teoria das funcoes de variaveis complexas que se f : D e ao menos
E
Z
5
contnua , entao
f (z 0 )dz 0 , a integral de f de w a z ao longo da curva Cwz , pode ser estimada


por

Cwz


Z

f (z )dz
0

Cwz

Essa condica
o pode ser enfraquecida.

l(z)
0

|f (z 0 (l))| dl .

(7.40)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

336/1304

Denotando por Dab (z, w) o elemento ab da matriz D(z, w), temos


Z zn1
Z z Z z1
X
Dab (z, w) = ab +

(A(z1 )A(z2 ) A(zn ))ab dzn dzn1 dz1


n=1

= a b +

X
m X
m
X

n=1 k1 =1 k2 =1

Z
m
X

kn1 =1

z
w

z1

zn1

Aak1 (z1 )Ak1 k2 (z2 ) Akn1 b (zn ) dzn dz1 .

Definindo como antes


:= max max |Aab (z)| ,
a, b

zD

aplicando (7.40) e escrevendo l1 l(zj ), j = 1, . . . , n, temos


Z ln1
Z l(z) Z l1
X
m
m
X
X

|Dab (z, w)| 1 +

n=1 k1 =1

1+

1+

1+

n=1

m
X

k1 =1

n l(z)

n=1

n=1

kn1 =1

n!

Z
m
X

kn1 =1

m
X

k1 =1



|Aak1 (z 0 (l1 ))| |Ak1 k2 (z 0 (l2 ))| Akn1 b (z 0 (ln )) dln dl1

l(z)
0

m
X

l1

ln1

dln dl1

kn1 =1

l(z)n n1
m
n!


1 ml(z)
e
1 .
m
Acima, usamos o fato, demonstravel por inducao, que
Z l(z) Z l1
Z ln1
l(z)n
.

dln dl1 =
n!
0
0
0
= 1+

(7.41)

Como mencionamos, l(z) e a distancia de w a z ao longo da curva de integracao, ou seja, e o comprimento


total dessa curva. Se D for um domnio convexo, podemos tomar a curva de integracao como sendo
a linha reta que une w a z, em cujo caso teremos l(z) = |z w|. Nao precisamos, no entanto, supor
convexidade de D.
Provamos entao que, para cada elemento de matriz ab, a serie do lado direito de (7.38) e absolutamente convergente, e isso para todo w e z D. Como, para cada N , as funcoes
Z z Z z1
Z zn1
N X
m X
m
m
X
X
fN (z, w) = ab +

Aak1 (z1 )Ak1 k2 (z2 ) Akn1 b (zn ) dzn dz1 .




n=1 k1 =1 k2 =1

kn1 =1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

337/1304

sao analticas em D (pois integrais de funcoes analticas sao tambem analticas), conclumos do exposto
acima que cada elemento de matriz Dab (z, w) e o limite uniforme (por que?) da seq
uencia de funcoes
analticas fN (z, w). Um teorema importante da analise complexa (vide e.g. [126]) afirma que sob essas
circunstancias Dab (z, w) e tambem analtica em D.
Para mostrar que (7.39) representa de fato a solucao procurada, vamos mostrar que

D(z, w) = A(z)D(z, w).


z

(7.42)

De fato,

D(z, w) =
z
z

=
z

Z
X

Z
Z

z1
w

z
w
z

= 0 + A(z) +

= A(z)

A(z1 ) dz1 +

n=1

= A(z)

Z
Z

z1
w

zn1

A(z1 )A(z2 ) A(zn ) dzn dzn1 dz1 .

w
z
w

z1

A(z1 )A(z2 ) dz2 dz1


w

z2
w

A(z1 )A(z2 )A(z3 ) dz3 dz2 dz1 +

A(z)A(z2 ) dz2 +
w
z

A(z2 ) dz2 +
w
z

A(z1 ) dz1 +
w

Z
Z

z
w
z
w

Z
Z

z
w

z2
w

A(z)A(z2 )A(z3 ) dz3 dz2 +

z2
w

A(z2 )A(z3 ) dz3 dz2 +

z1
w

A(z1 )A(z2 ) dz2 dz1 +




= A(z)D(z, w),
como queramos provar. Acima, na passagem da quarta para a quinta linha, fizemos uma serie de
mudancas de nomes das variaveis de integracao, chamando z2 de z1 , z3 de z2 etc.
De maneira analoga prova-se tambem que

D(z, w) = D(z, w)A(w).


w
E. 7.9 Exerccio. Faca!

tambem evidente pela definicao (7.38) que para todo z vale D(z, z) = . Notemos que, por (7.39),
E
Y (z0 ) = D(z0 , z0 )Y0 = Y0 , mostrando que o lado direito de (7.39) satisfaz a condicao Y (z0 ) = Y0 .
Derivando o lado direito de (7.39) em relacao a z, tem-se
Y 0 (z) =

D(z, z0 )Y0 = A(z)D(z, z0 )Y0 = A(z)Y (z) ,


z

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

338/1304

provando que o lado direito de (7.39) satisfaz a equacao diferencial. Como a solucao e u
nica, ela deve
ser aquela dada em (7.39).
De maneira analoga ao caso real podemos igualmente provar que vale a regra de composicao
D(z1 , z3 ) = D(z1 , z2 )D(z2 , z3 ) ,

(7.43)

para quaisquer z1 , z2 e z3 contidos no domnio simplesmente conexo onde A e analtica.


E. 7.10 Exerccio. Prove (7.43) mostrando que ambos os lados satisfazem as mesmas equacoes diferenciais e as mesmas condicoes iniciais.
6
A equa
c
ao n
ao-homog
enea
E. 7.11 Exerccio importante. Para A e F analticas em um domnio aberto e simplesmente conexo D
e limitadas em D, mostre que a solucao geral da equacao nao-homogenea Y 0 (z) = A(z)Y (z) + F (z) com
condicao Y (z0 ) = Y0 , z0 D e
Z z
Y (z) = D(z, z0 )Y0 +
D(z, w)F (w)dw ,
(7.44)
z0

onde D(z, z0 ) foi definida acima e a integracao do lado direito e tomada em qualquer curva simples,
contnua e diferenciavel em D, pois D e F sao analticas em D.
6
Analiticidade da solu
c
ao
Uma importante conclusao que tiramos da analise acima e que, sob a hipotese que A e analtica
em D e limitada em D, entao a solucao Y da equacao homogenea Y 0 (z) = A(z)Y (z) com condicao
Y (z0 ) = Y0 , z0 D e igualmente analtica em D pois, como vimos, D(z, z0 ) e analtica em z.
Solu
co
es nulas
Ha uma conseq
uencia das consideracoes acima que e bastante elementar, possuindo, porem, implicacoes profundas, como veremos, por exemplo, quando discutirmos equacoes com pontos singulares.
Expressaremos essa conseq
uencia em forma de uma proposicao:
Proposi
c
ao 7.1 Seja a equaca
o homogenea Y 0 (z) = A(z)Y (z) onde A(z) e analtica em um domnio
aberto e simplesmente conexo D. Ent
ao, se Ys (z) e uma soluca
o dessa equaca
o que se anula em um
ponto z0 D, ou seja, Ys (z0 ) = 0, vale Ys (z) = 0 para todo z D.
2
Essa proposicao diz que se a solucao de uma equacao linear homogenea Y 0 (z) = A(z)Y (z) anula-se
em algum ponto de D (com A(z) analtica em um domnio aberto e simplesmente conexo D), entao
ela anula-se em todo D. A prova e a simples observacao que, pelo que vimos, a solucao e dada por
Y (z) = D(z, z0 )Y (z0 ).
Equa
co
es Matriciais Complexas

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

339/1304

Ate agora estudamos equacoes da forma Y 0 (z) = A(z)Y (z), com condicao Y (z0 ) = Y0 , onde A(z) e
uma matriz m m analtica em um domnio aberto e simplesmente conexo D que contem z0 e onde Y
e um vetor coluna com m componentes:

y1 (z)

Y (z) = ... .
ym (z)
Consideremos agora a equacao M0 (z) = A(z)M(z), com condicao M(z0 ) = M0 , onde A(z) e M(z)
sao matrizes m m, a incognita sendo a matriz M(z) e a matriz A(z) sendo analtica em um domnio
aberto e simplesmente conexo D. Veremos facilmente que podemos tratar esse problema com os mesmos
metodos do anterior, onde a incognita era um vetor coluna Y de m componentes e nao uma matriz
quadrada. De fato, como toda matriz m m, a matriz M(z) e da forma (para notacao, vide pagina
143)
hh
ii
M(z) = M1 (z), . . . , Mm (z) ,
onde Mi (z) sao vetores coluna com m componentes, representando a i-esima coluna da matriz M(t).
Nessa notacao a equacao diferencial M0 (z) = A(z)M(z) fica
hh
ii
hh
ii
0
M10 (z), . . . , Mm
(z) = A(z)M1 (z), . . . , A(z)Mm (z) ,

ou seja, tem-se um conjunto de m sistemas de equacoes independentes


Mi0 (z) = A(z)Mi (z),

i = 1, . . . , m

(7.45)

do tipo que tratamos acima, onde as incognitas sao vetores coluna.


Para cada uma dessas equacoes valem todas as afirmacoes provadas acima. Assim conclumos que
a equacao matricial M0 (z) = A(z)M(z), com condicao M(z0 ) = M0 , tem solucao u
nica, a qual e dada
por
Mi (z) = D(z, z0 )Mi (z0 ), i = 1, . . . , m.
Reunindo as colunas Mi novamente na matriz M, temos
M(z) = D(z, z0 )M0
como solucao u
nica de M0 (z) = A(z)M(z), com condicao M(z0 ) = M0 .
A partir do exposto acima e facil demonstrar a validade da composicao D(z, z 0 ) = D(z, z1 )D(z1 , z0 )
para quaisquer pontos z0 , z1 e z do domnio aberto e simplesmente conexo D. Como D(z0 , z0 ) = ,
isso em particular diz que toda matriz D(z, z0 ) e invertvel com D(z, z0 )1 = D(z0 , z).
Uma simples mas importante observacao que se pode fazer e que, como a matriz fundamental
D(z, z0 ) e invertvel, M(z) sera invertvel para todo z D se e somente se M0 o for. Ou seja, se
a solucao da equacao M0 (z) = A(z)M(z), com A(z) analtica em um domnio aberto simplesmente
conexo D e analtica em um ponto de D, entao o e em todo D.
Vamos aqui discutir propriedades dessas equacoes diferenciais matriciais homogeneas, com A(z)
uma matriz m m analtica em um domnio aberto e simplesmente conexo D. Se M1 (z) e uma

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

340/1304

solucao desta equacao, constata-se trivialmente que, para qualquer matriz m m constante C, a
matriz M2 (z) = M1 (z)C e igualmente solucao de M0 (z) = A(z)M(z), bastando para tal multiplicar a
equacao a` direita por C.
A seguinte afirmacao recproca e tambem verdadeira:
Proposi
c
ao 7.2 Se M1 (z) e M2 (z) s
ao duas soluco
es invertveis de M0 (z) = A(z)M(z), com A(z)
analtica em um domnio aberto e simplesmente conexo D, ent
ao existe uma matriz constante invertvel
C tal que M2 (z) = M1 (z)C para todo z D.
2
Prova. Para ver isso, seja z0 um ponto arbitrario de D e defina-se M01 = M1 (z0 ) e M02 = M2 (z0 ). Seja
entao C := (M01 )1 M02 . Entao, teremos que M3 (z), definida por M3 (z) = M2 (z) M1 (z)C e tambem
solucao da equacao M0 (z) = A(z)M(z), mas que obviamente anula-se em z0 . Com isso, pela Proposicao
7.1, M3 (z) e identicamente nula em todo D, ou seja, M2 (z) = M1 (z)C para todo z D.
Conseq
uencias dessas observacoes serao discutidas na Secao 7.6.3.

7.6.2

Resolu
c
ao por S
eries de Pot
encias

A possibilidade, revelada acima, de se apresentar a solucao da equacao homogenea Y 0 (z) = A(z)Y (z)
com condicao Y (z0 ) = Y0 , z0 D, em termos da matriz D(z, w) (a qual depende apenas de A) e
interessante do ponto de vista teorico mas nem sempre do ponto de vista pratico, pois nem sempre e
possvel computar a serie infinita de integrais de produtos de matrizes que compoe D(z, w) (a serie de
Dyson). No entanto, uma das conclusoes teoricas da analise acima, a saber, o fato de Y ser analtica,
aponta para um outro metodo de resolucao, esse sim mais simples de ser usado em aplicacoes. Trata-se
do Metodo de Series de Potencias que descreveremos agora.
O fato de Y ser analtica nos diz a priori que Y pode ser expressa por uma serie de Taylor
convergente centrada em z0 :

X
Y (z) =
(z z0 )n Yn ,
(7.46)
n=0

onde Yn sao vetores-coluna constantes com m componentes, tal qual Y (z). Note-se que, pela expressao
acima, Y (z0 ) = Y0 . Para ver isso, tome z = z0 em ambos os lados da expressao.

Como a matriz A e igualmente analtica em torno de z0 , A pode ser expressa por uma serie de
Taylor convergente centrada em z0 :
A(z) =

X
n=0

(z z0 )n An ,

onde An sao igualmente matrizes m m constantes. Com isso, a equacao diferencial Y 0 (z) = A(z)Y (z)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

341/1304

fica

X
n=0

X
(z z0 )k Ak

(n + 1)(z z0 )n Yn+1 =
=

k=0

X
k=0 l=0

X
n=0

X
l=0

(z z0 )l Yl

(z z0 )k+l Ak Yl

(z z0 )n

n
X

Anp Yp ,

(7.47)

p=0

o que nos leva a concluir que


n

Yn+1

1 X
Anp Yp ,
=
n + 1 p=0

n 0.

E. 7.12 Exerccio importante. Complete os detalhes das deducoes que levam a (7.47) e (7.48).

(7.48)

A expressao (7.48) nos permite obter os vetores Yn recursivamente a partir de Y0 . Com isso, a
solucao Y (z) fica determinada por sua serie de Taylor (7.46). Esse e o metodo de resolucao por series
de potencias. Por exemplo, para n = 0, (7.48) nos da
Y1 = A 0 Y0 .
Para n = 1, (7.48) nos da
Y2 =


1
1
(A1 Y0 + A0 Y1 ) =
A1 + A20 Y0 ,
2
2

e assim por diante. Os primeiros termos da solucao Y (z) sao, entao,


(z z0 )2
A1 + A20 Y0 +
2



(z z0 )2
2
+ (z z0 )A0 +
A 1 + A 0 + Y0 .
=
2

Y (z) = Y0 + (z z0 )A0 Y0 +

(7.49)

Isso permite-nos identificar a expressao entre colchetes { } como sendo a expansao em serie de
Taylor de D(z, z0 ).
E. 7.13 Exerccio. Determine Y3 e Y4 em termos de Y0 .

E. 7.14 Exerccio importante. Desenvolva o metodo de expansao em serie de potencias para a resolucao
da equacao nao-homogenea Y 0 (z) = A(z)Y (z) + F (z) com condicao Y (z0 ) = Y0 , z0 D, onde A e F sao
analticas em um domnio simplesmente conexo D e limitadas em D.
6

JCABarata. Curso de Fsica-Matem


atica

7.6.3

Vers
ao de 29 de setembro de 2005.

Captulo 7

342/1304

Sistemas com Pontos Singulares. Monodromia

Nas paginas anteriores consideramos equacoes diferenciais como Y 0 (z) = A(z)Y (z) onde A(z) era
suposta ser analtica em um certo domnio aberto e simplesmente conexo D. Ha in
umeros problemas
importantes nos quais essa situacao nao e encontrada, de modo que devemos afrouxar um pouco as
condicoes sobre a analiticidade de A(z). Consideraremos aqui a situacao na qual A e analtica dentro
de um anel aberto Az0 , a, b centrado em z0 com raio interno a e raio externo b definido por
n
o


Az0 , a, b := z
a < |z z0 | < b ,

sendo 0 a < b (os casos em que a = 0 e/ou b = podem ser tambem permitidos). Vide Figura
7.1. Uma tpica situacao na qual isso ocorre se da quando A(z0 ), ou seja, alguns de seus elementos de
matriz, tem uma singularidade tipo polo ou essencial6 em um ponto z0 . Em verdade, interessaremo-nos
mais pelo caso de singularidades tipo polo, caso que, felizmente, corresponde a` maioria das aplicacoes.
Notemos que a hipotese de A(z) ser analtica em um anel Az0 , a, b significa que A(z) pode ser expressa
em uma serie de Laurent7 convergente (vide e.g. [21]) em Az0 , a, b :
A(z) =

m=

(z z0 )m Am .

Notemos que um anel Az0 , a, b e a uniao domnios abertos e simplesmente conexos do tipo Sz0 , a, b (1 , 2 ),
com 0 < 2 1 < 2, onde


Sz0 , a, b (1 , 2 ) := z | z z0 = ei , com a < < b e 1 < < 2 .
Denominaremos essas regioes setores. Vide Figura 7.2.
Monodromia
Se tomarmos z1 e z dentro do anel Az0 , a, b , podemos encontrar um setor Sz0 , a, b (1 , 2 ) que contem
ambos os pontos (se, por exemplo, na representacao polar, z1 = 1 ei1 e z = ei , podemos tomar
1 < min{1 , } mod 2 e 2 < max{1 , } mod 2). Como A e analtica dentro de um tal setor
e o mesmo e simplesmente conexo, podemos representar a matriz de Dyson D(z, z1 ) na forma (7.38)
com as integrais tomadas em um caminho orientado de z1 a z inteiramente contido no interior de
Sz0 , a, b (1 , 2 ) (e, portanto, de Az0 , a, b ). Isso permite definir D(z, z1 ) dentro de cada setor.
Uma questao muito importante para o que segue e saber o que ocorre com a matriz D(z, z 1 ) se,
fixando z1 , fizermos z dar uma volta de 2 em torno do ponto z0 . Mais precisamente, consideremos os
pontos z() definidos por z() := (z z0 )ei + z0 . Como e facil constatar, ao variarmos entre 0 e 2,
z() move-se em um crculo de raio |z z0 | centrado em z0 e orientado em sentido anti-horario, sendo
que z(0) = z(2) = z. Para 0 < 2, os pontos z1 e z() estao dentro de algum setor simplesmente
conexo de Az0 , a, b e podemos escrever, por (7.43), D(z(), z1 ) = D(z(), z)D(z, z1 ).
Consideremos a matriz D(z(), z). A mesma pode ser expressa na forma (7.38), sendo que podemos
tomar como caminho de integracao o arco de crculo orientado no sentido anti-horario C() que vai de
z a z() (lembremo-nos que |z() z0 | = |z z0 |). Vide Figura 7.3. A para a matriz D(z, z1 ) podemos
6
7

Para o estudante que queira recordar esses conceitos sugerimos, por exemplo, [21].
Pierre Alphonse Laurent (1813-1854).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

343/1304

a
z0

Figura 7.1: Um anel do tipo Az0 , a, b .

tomar o caminho de integracao C1 da Figura 7.3. A medida em que aproxima-se de 2, o caminho


de integracao aproxima-se do crculo fechado de raio |z z0 | (indicado por C na Figura 7.3), orientado
de z a z no sentido anti-horario. Vemos assim que
lim D(z(), z1 ) = M D(z, z1 )

onde

M := lim D(z(), z) .
2

Pela definicao e pela representacao (7.38),


Z wn1
I Z w1
X
M = +

A(w1 )A(w2 ) A(wn ) dwn dwn1 dw1 ,


n=1

(7.50)

H
onde por z entende-se a integracao (na variavel w1 ) de z a z tomada ao longo do crculo fechado C de
raio |z z0 |, orientado de z a z no sentido anti-horario. Como se percebe, esse crculo corresponde ao
arco C(2).
Devido a` expressao (7.50), e facil constatar que M , nao depende da particular curva C tomada
unindo z a z, desde que essa curva de exatamente uma volta em torno de z0 sentido anti-horario
sem abandonar Az0 , a, b . Devido ao fato de o integrando ser analtico dentro de todos os setores de
Az0 , a, b , podemos deformar continuamente o caminho de integracao sem alterar seu valor, desde que
nao se abandone Az0 , a, b . Podemos, assim, tomar como caminho de integracao em (7.50) qualquer curva
fechada que de uma volta completa no sentido anti-horario em torno de z0 ao longo do anel Az0 , a, b ,
sem sair do mesmo. Em particular, vemos com esse argumento que M tambem nao depende do ponto
z.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

344/1304

z0

Figura 7.2: Em cinza, um setor Sz0 , a, b (1 , 2 ) no interior do anel Az0 , a, b .

A matriz M e denominada matriz de monodromia associada a` matriz A(z) em Az0 , a, b . Se M 6= ,


dizemos que D(z, z1 ) possui uma monodromia n
ao-trivial.
Caso M 6= (veremos exemplos logo adiante), a matriz de Dyson D(z, z1 ) nao e uma funcao
unvoca, ou seja, quando a variavel z da uma volta de 2 em torno de z0 , D(z, z1 ) nao volta ao
mesmo valor. Esse fenomeno e bem conhecido na teoria das funcoes de variavel complexa e e associado
a` presenca de singularidades do tipo ponto de ramificacao. Por exemplo, para a funcao complexa
ln(z), z 6= 0, vale lim ln(zei ) = ln(z) + 2i e para a funcao complexa z , z 6= 0, com 6 , vale
i

lim (ze ) = e

2
2i

z .

Mais propriedades da matriz de monodromia


Um comentario que sera importante e que toda matriz de monodromia e invertvel. Para vermos isso, notemos que pela definicao, M = lim2 D(z(), z). Assim, considerando o ponto z()
(escolhido de forma arbitraria, porem conveniente), tem-se pela formula de composicao (7.43) que
M = lim2 D(z(), z) = lim2 D(z(), z())D(z(), z) = Db (z, z())Da (z(), z), sendo que
Da (z 0 , z) envolve integracoes ao longo de um arco Ca , orientado de z a z(), e Db (z, z()) envolve
integracoes ao longo do arco Cb , orientado de z() a z. Ambos os arcos estao contidos em Az0 , a, b . A
uniao Ca Cb e uma curva fechada que da exatamente uma volta completa no sentido anti-horario em
torno de z0 ao longo do anel Az0 , a, b , sem sair do mesmo. Ambas as matrizes Da (z 0 , z) e Db (z, z 0 ) sao
invertveis. Portanto, a matriz M tambem o e.
Um segundo comentario e que a matriz de monodromia comuta com D(z, z1 ) e com A(z) para

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

345/1304

C1
C()
z1

z0
z()

Figura 7.3: O arco de crculo orientado no sentido anti-horario C() que vai de z a z().

todos z, z1 Az0 , a, b . Para ver isso, considere a curva C, fechada, orientada, inteiramente contida em
Az0 , a, b , indicada na Figura 7.4. Essa curva e a fronteira deH uma regiao simplesmente conexa, portanto,
se f (z) e uma funcao analtica em Az0 , a, b , sua integral C f (w) dw ao longo de C e nula. Por essa
razao, tem-se que
+

I Z
X
n=1

w1
z

wn1
z

A(w1 )A(w2 ) A(wn ) dwn dwn1 dw1 =

(7.51)

pois todas as integrais ao lado direito se anulam (os integrandos sao analticos). A curva C pode
ser continuamente deformada a` curva fechada indicada na Figura 7.5 sem alterar a igualdade (7.51).
Tem-se agora, porem, que o percurso ao longo de C pode ser caminhado pelo seguinte conjunto de
percursos sucessivos: 1) partindo do ponto z1 ao longo da curva C1 ate o ponto z; 2) partindo de z ao
longo da curva fechada C2 , orientada no sentido anti-horario, ate de volta a z; 3) partindo de z ate z1 ,
ao longo da curva C3 ; 4) partindo de z1 ao longo da curva fechada C4 , orientada no sentido horario, ate
de volta a z1 . Essas consideracoes e a expressao para M em (7.50) em termos de integracoes ao longo
de um circuito arbitrario fechado que da uma volta no sentido anti-horario em torno de z 0 , levam-nos
a concluir que (7.51) significa que
M 1 D(z1 , z)M D(z, z1 ) =

Como D(z1 , z) = D(z, z1 )1 , conclumos que M D(z, z1 ) = D(z, z1 )M , ou seja, M e D(z, z1 )


comutam para quaisquer z, z1 Az0 , a, b . Derivando em relacao a z, obtemos M A(z)D(z, z1 ) =

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

346/1304

A(z)D(z, z1 )M e tomando z1 = z, segue que M A(z) = A(z)M , ou seja, M e A(z) comutam para
qualquer z Az0 , a, b .

C
z0

Figura 7.4: A curva fechada orientada C.

Os dois exerccios que seguem exibem mais propriedades de matrizes de monodromia em certos
casos.
E. 7.15 Exerccio. Monodromia no caso comutativo. Considere o caso em que A(z) e uma matriz
analtica no anel Az0 , a, b e tal que A(z)A(z 0 ) = A(z 0 )A(z) para todos z, z 0 Az0 , a, b . Usando (7.35),
pagina 333, e (7.50), mostre que
I

M = exp

A(w) dw

(7.52)

H
a integral sendo tomada ao longo de qualquer curva fechada que de exatamente uma volta completa no
sentido anti-horario em torno de z0 ao longo do anel Az0 , a, b , sem sair do mesmo.
6

E. 7.16 Exerccio. Sejam A(z) matrizes n n analticas no anel A z0 , a, b . Suponha que dentro de
Az0 , a, b existam n2 pontos distintos z1 , . . . , zn2 com a propriedade que as n2 matrizes A(z1 ), . . . , A(zn2 )
sao linearmente independentes. Mostre que isso implica que M = para algum , 6= 0. Sugestao:
explore o fato que M A(z) = A(z)M para todo z Az0 , a, b .
6
*

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

347/1304

C1

C3
z1

C2
z0
C4

Figura 7.5: A curva fechada orientada C composta dos segmentos orientados C 1 , C2 , C3 e C4 . Os


pontos z1 e z.

Antes de examinarmos as conseq


uencias da existencia de uma monodromia nao-trivial para a matriz
D(z, z1 ) , devemos mostrar exemplos concretos onde se tem M 6= .
Monodromia n
ao trivial. Um exemplo
O seguinte exemplo8 e ilustrativo. Seja A(z) = z 1 R, onde R e a matriz constante


1
R =
,
0

(7.53)

sendo um n
umero complexo fixo arbitrario. Claramente A(z) e singular em z0 = 0 e analtica em
todo anel A0, b = {z | 0 < |z| < b}, com qualquer b > 0. Tomando z1 A0, b , fixo, a matriz de
Dyson D(z, z1 ) e dada por9
 !
 
z
1 ln zz1
D(z, z1 ) =
,
(7.54)
z1
0
1
pois, como facilmente se constata, essa matriz satisfaz
8

D(z,
z

z1 ) = A(z)D(z, z1 ) e D(z1 , z1 ) = .

Esse exemplo e extrado com pequenas modificaco


es de [122].
Em tudo o que segue utilizaremos o chamado ramo principal do logaritmo de uma vari
avel complexa z. Ou seja, se
z tem a decomposica
o polar z = |z|ei com < , ent
ao ln(z) = ln |z| + i.
9

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

348/1304

E. 7.17 Exerccio. As matrizes A(z) = z 1 R, acima, comutam para valores diferentes de z. Por essa
razao, D(z, z1 ) pode ser calculada com o uso da expressao (7.35), pagina 333. Obtenha (7.54) dessa forma.
6
Fixando-se z1 , e facil verificar que
lim D(zei , z1 ) = lim

ze
z1

zei
z1

1 ln
0
1

!

= e2i

z
z1

1 ln
0

 
z
z1

+ 2i

= M D(z, z1 ) ,

com a matriz de monodromia M sendo dada por


M = e

2i

1 2i
0 1

(7.55)

E. 7.18 Exerccio. Obtenha (7.55) fazendo uso da relacao (7.52), valida no caso comutativo. Verifique
explicitamente que M A(z) = A(z)M para todo z A0, b . Vide Exerccio E. 7.15.
6
E. 7.19 Exerccio. Mostre, fazendo uso da relacao (7.52), que para qualquer matriz R a matriz de
monodromia associada `as funcoes A(z) = z p R, com p , p =
6 1, e M = , ou seja, a monodromia e
trivial.
6
*
A existencia de monodromias nao-triviais em equacoes singulares do tipo que consideramos aqui e
um fato relevante que, como veremos, tem conseq
uencias sobre a forma geral das solucoes.
Um coment
ario sobre a matriz de monodromia
Como ja observamos, toda matriz de monodromia M e invertvel. Vamos mostrar que para cada
M existe uma matriz tal que M = e2i . Por exemplo, para a M dada em (7.55) podemos tomar
= R, onde R e dada em (7.53) (verifique!). Para a prova geral, vamos primeiro escrever M na sua
forma de Jordan (vide Teorema 3.18, pagina 199): seja T invertvel tal que T 1 M T = D + N onde D
e diagonal, N e nilpotente e DN = N D. Definimos, entao,
:=



1
T ln D + ln( + D 1 N ) T 1 .
2i

Antes de prosseguirmos comentemos que essa expressao esta bem definida. De fato, D e uma matriz
diagonal D = diag (d1 , . . . , dm ), tendo na diagonal os autovalores de M . Como M e invertvel, nenhum
desses autovalores e nulo, assim ln D esta bem definida como ln D = diag (ln(d1 ), . . . , ln(dm )). Fora
P
k
1 k
k
isso, ln( + D 1 N ) e dada (ja que D e N comutam) por
e uma soma finita,
k=0 (1) (D ) N , que
pois N e nilpotente.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

349/1304

Isto posto, dado que ln D e ln( + D 1 N ) comutam (por que?), e facil entao ver que

e2i = T exp ln D + ln( + D 1 N ) T 1

= T exp (ln D) exp ln( + D 1 N ) T 1
= T D( + D 1 N )T 1 = T (D + N )T 1
= M,
como queramos provar.
Logo abaixo usaremos a matriz e o fato agora provado que M = e2i para extrair algumas
conclusoes sobre a forma geral das solucoes com pontos singulares do tipo aqui tratado. Para isso,
faremos uso da matriz eln(zz0 ) . Vamos discutir sua forma geral. Como toda matriz, pode ser
conduzida a` sua forma de Jordan por uma transformacao de similaridade: existe matriz Q invertvel
tal que QQ1 = D0 + N0 onde D0 e diagonal, N0 e nilpotente e D0 N0 = N0 D0 . Com isso,
eln(zz0 ) = Q1 eln(zz0 )(D0 +N0 ) Q = Q1 eln(zz0 )D0 eln(zz0 )N0 Q.
Se a matriz D0 for a matriz diagonal diag (1 , . . . , m ) entao a matriz eln(zz0 )D0 e a matriz diagonal
diag ((z z0 )1 , . . . , (z z0 )m ). Por outro lado, como N0 e nilpotente de ndice menor ou igual a m
(ou seja N0m = 0), os elementos de matriz de eln(zz0 )N0 sao polinomios em ln(z z0 ) de ordem menor
ou igual a m 1. Conseq
uentemente, cada elemento de matriz eln(zz0 ) ab e da forma
e


ln(zz0 )

ab

m1
X
k=0

m
X
l=1

kl
(z z0 )l Cab

(ln(z z0 ))k

(7.56)

kl
para certas constantes complexas Cab
(algumas podendo ser nulas).

Note-se que os l sao, em geral, n


umeros complexos: os autovalores de .
E. 7.20 Exerccio importante. Complete os detalhes que levam a (7.56).

Observaca
o importante. Como a expansao de eln(zz0 )N0
e

ln(zz0 )N0

m1
X
k=1

(ln(z z0 ))k N0k

contem o termo , a expansao (7.56) sempre contem um termo nao-nulo do tipo (ln(z z 0 ))k com
k = 0, ou seja, ha um termo nao-nulo que nao envolve potencias de ln(z z0 ). Essa observacao sera
lembrada adiante.
A Forma Geral das Solu
co
es
Essa discuss
ao e baseada na referencia [122], cuja leitura recomendamos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

350/1304

Seja a equacao Y 0 (z) = A(z)Y (z) com A(z) analtica no anel Az0 , a, b e seja como antes D(z, z1 ),
z, z1 Az0 , a, b , uma matriz fundamental dessa equacao com uma matriz de monodromia M = e2i .
Para z1 fixo, seja S(z) a matriz definida por
S(z) = e ln(zz0 ) D(z, z1 ) .
Pelas hipoteses sobre D(z, z1 ) e pelas propriedades da funcao logaritmo, S(z) e analtica em cada setor
Sz0 , a, b (1 , 2 ) com 0 < 2 1 < 2.

Consideremos o que ocorre com S(z) quando a variavel z da uma volta de 2 em torno de z 0 , ou
seja, comparemos S(z) com10 lim2 S (z z0 )ei + z0 . Temos que
!

 


i
i
i
lim S (z z0 )e + z0 = lim exp ln((z z0 )e ) D (z z0 )e + z0 , z1
2

ln((zz0 ))

lim e



lim D (z z0 )e + z0 , z1

= e ln((zz0 )) e2i M D(z, z1 )

= e ln((zz0 )) M 1 M D(z, z1 )
= e ln((zz0 )) D(z, z1 )
= S(z) .
Isso diz-nos que S(z) e contnua no anel Az0 , a, b . Como e analtica em cada setor Sz0 , a, b (2 , 1 ) com
0 < 2 1 < 2, conclumos que S(z) e analtica em Az0 , a, b . Se pudermos tomar o raio interno do
anel arbitrariamente pequeno, S(z) pode ser singular em z0 . Essa singularidade, porem, se houver,
sera do tipo polo ou do tipo singularidade essencial, mas nao do tipo ponto de ramificacao, pois isso
contrariaria o fato de S(z) ser analtica em qualquer anel centrado em z0 .
Resumimos nossos conclusoes em forma de uma proposicao.
Proposi
c
ao 7.3 Seja a equaca
o Y 0 (z) = A(z)Y (z) com A(z) matriz m m analtica no anel Az0 , a, b
e seja como antes D(z, z1 ), com z, z1 Az0 , a, b , uma matriz fundamental dessa equaca
o com matriz
de monodromia M = e2i . Ent
ao, para z1 fixo, D(z, z1 ) e da forma
D(z, z1 ) = eln(zz0 ) S(z),

(7.57)

onde S(z) e analtica no anel Az0 , a, b . Se pudermos tomar o raio interno do anel arbitrariamente
pequeno, S(z) pode ser singular em z0 , a singularidade, se houver, sendo do tipo p
olo ou do tipo
singularidade essencial.
Conseq
uentemente, por (7.56), cada elemento de matriz D(z, z1 )ab , para z1 fixo, e da forma
D(z, z1 )ab =

m1
m
XX
k=0 l=1

10

kl
(z) ,
(z z0 )l (ln(z z0 ))k Fab

(7.58)

Note que, para z e z0 fixos, quando varia de 0 a 2 os pontos (z z0 )ei + z0 descrevem um crculo orientado no
sentido anti-hor
ario no plano complexo e centrado em z0 . Esse crculo tem raio |z z0 |, inicia-se e termina em z.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

351/1304

kl
a, b = 1, . . . , m, onde cada funca
o Fab
(z) e analtica no anel Az0 , a, b . Novamente, se pudermos
kl
tomar o raio interno do anel arbitrariamente pequeno, cada Fab
(z) pode ser singular em z0 . Essa
singularidade, se houver, e do tipo p
olo ou do tipo singularidade essencial. As constantes complexas l
s
ao os autovalores de . Os termos com k = 0 s
ao n
ao-nulos.
2

E. 7.21 Exerccio importante. Complete os detalhes que conduzem a (7.58).

E. 7.22 Exerccio. Qual a relacao entre os expoentes l e os autovalores da matriz de monodromia M ?


Sugestao: pela construcao acima, os expoentes l sao os autovalores de e M = e2i .
6
O M
etodo de Frobenius
A forma geral das matrizes fundamentais apresentada acima sugere e justifica um metodo de solucao
para o caso de sistemas de equacoes lineares provenientes de uma equacao diferencial ordinaria de ordem
m (vide Secao 7.7):
y (m) (z) + am1 (z)y (m1) (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0,

(7.59)

onde as funcoes a0 (z), . . . , am1 (z) sao analticas em


Az0 , b := {z | 0 < |z z0 | < b}.
O metodo consiste em procurar solucoes na forma y(z) = (z z0 ) (ln(z z0 ))k f (z), para algum ,
algum k = 0, . . . , m 1, inteiro e f (z) analtica no anel Az0 , b . Como f possui uma singularidade tipo
polo ou essencial em z0 , ela pode ser representada em Az0 , b por uma serie de Laurent convergente (vide
e.g. [21]):

X
f (z) =
cn (z z0 )n .
n=

A tarefa consiste em determinar , k = 0, . . . , m 1, e os coeficientes cn de modo que a equacao


(7.59) seja satisfeita.

Esse metodo e conhecido como metodo de Frobenius11 . Em certos casos esse metodo e muito eficaz,
fornecendo solucoes para uma classe muito grande de equacoes diferenciais de interesse. Mais sobre ele,
adiante.
Note-se que, pela observaca
o importante da pagina 349, sempre ha pelo menos uma solucao que
nao envolve potencias de ln(z z0 ).
Singularidades tipo p
olo de S(z). Pontos Singulares Regulares
Retornando a` (7.57), facamos alguns comentarios sobre as singularidades de S(z) em z 0 .
Como dissemos, caso z0 seja um ponto singular de A(z), a matriz S(z), sendo analtica em Az0 , b , ou
possui uma singularidade do tipo polo em z0 ou uma singularidade essencial. No caso de a singularidade
11

Ferdinand Georg Frobenius (1849-1917).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

352/1304

ser do tipo polo (de qualquer ordem), z0 e dito ser um ponto singular regular12 da equacao Y 0 (z) =
A(z)Y (z).
No caso de z0 ser um ponto singular regular uma simplificacao importante pode ser feita.
Se S(z) tem um polo de ordem l em z0 , entao S(z) = (z z0 )l S0 (z), onde S0 (z) e analtica em z0 .
Com isso, a forma geral (7.57) pode ser reescrita como
0

D(z, z1 ) = S0 (z) eln(zz0 ) ,


onde 0 = l .
E. 7.23 Exerccio. Verifique!

Como se constata, e a mesma forma de (7.57), envolvendo apenas uma redefinicao da matriz ,
sendo que agora o fator S0 (z) e uma matriz analtica. O ponto importante e que a conclusao (7.58)
sobre a forma geral dos elementos de matriz de D(z, z1 ) e igualmente valida, sendo que agora, porem,
kl
as funcoes Fab
(z) sao funcoes analticas de z em z0 e nao apenas no anel Az0 , b .
Nesse caso, entao, o metodo de Frobenius discutido acima adquire o seguinte aspecto: procura-se
solucoes na forma

k
y(z) = (z z0 ) (ln(z z0 ))
cn (z z0 )n
n=0

e tenta-se determinar , k e os coeficientes cn de modo que a equacao diferencial seja satisfeita. Esse
metodo e eficaz e, em muitos casos, pratico, fornecendo solucoes para varias equacoes diferenciais de
interesse na Fsica. Mais sobre o metodo de Frobenius pode ser encontrado nos bons livros sobre
equacoes diferenciais e Fsica-Matematica ou no Captulo 8, com exemplos.

A questao que se coloca entao e: quando ocorre que S(z) possui apenas singularidades do tipo
polo em z0 ? A resposta depende do tipo de singularidade que a propria matriz A(z) possui em z0 .
Comecaremos a discutir isso na Secao 7.6.4.

7.6.4

Sistemas com Pontos Singulares Simples

Nesta secao seguiremos muito proximamente a discussao da Secao 2 do captulo V da referencia [122],
cuja leitura recomendamos fortemente.
De especial importancia em aplicacoes sao equacoes diferenciais Y 0 (z) = A(z)Y (z) nas quais A(z)
possui um polo simples em z0 , ou seja, A(z) e da forma A(z) = (z z0 )1 A0 (z), onde A0 (z) e analtica
em z0 . Nesse caso, em que z0 e um polo simples de A(z), dizemos que z0 e um ponto singular simples
da equacao diferencial.
Essa situacao e tambem particularmente feliz pois, como veremos, nesse caso z 0 e um ponto singular
regular. Isso e o conte
udo do seguinte teorema:
12

Coment
ario. A express
ao ponto singular regular parece conter uma contradica
o em termos pois, na teoria das
funco
es de vari
aveis complexas, os adjetivos singular e regular s
ao comummente empregados como ant
onimos. A
express
ao ponto singular regular aparentemente provem de uma traduca
o imprecisa do Alem
ao, mas manteve-se, por
raz
oes hist
oricas, em v
arias lnguas. Na express
ao ponto singular regular o adjetivo regular deve ser entendido no
sentido de comum, ordin
ario. Com isso pretende-se dizer que a singularidade em z 0 n
ao e do tipo mais grave, como
no caso de singularidades essenciais.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

353/1304

Teorema 7.1 Se z0 e um ponto singular simples da equaca


o diferencial Y 0 (z) = A(z)Y (z), ou seja,
A0 (z) := (z z0 )A(z) e analtica em z0 , ent
ao z0 e um ponto singular regular dessa equaca
o, ou seja,
S(z) (definida acima) tem no m
aximo uma singularidade tipo p
olo em z 0 .
2
Prova. (Extrada de [122], com ligeiras modificacoes). Comecemos com alguns comentarios preparatorios.
1. Para uma matriz complexa mm qualquer K denotamos por kKk sua norma operatorial, definida
por
kKvk
kKk :=
sup
,
m
, v6=0 kvk
v
p
onde, para v = (v1 , . . . , vm ) m , definimos a norma vetorial kvk := |v1 |2 + + |vm |2 .


2. Para qualquer elemento ab de uma matriz K vale


v
u m
uX
|Kab | t
|Kcb |2 = kKeb k ,


c=1

onde eb e o vetor da base canonica cuja b-esima componente e 1 e as demais sao nulas. Como e
obvio, keb k = 1. Assim,


|Kab |

kKeb k
keb k


kKvk
m , v6=0 kvk

sup
v


=: kKk.

E. 7.24 Exerccio. Justifique a segunda desigualdade.

(7.60)

3. Da definicao da norma operatorial de uma matriz K, e evidente que vale kKvk kKk kvk
para qualquer vetor v. Pela definicao, e bem facil constatar desse fato que norma operatorial de
um produto de matrizes satisfaz
kKLk kKk kLk,
(7.61)


para quaisquer matrizes complexas m m K e L.


E. 7.25 Exerccio. Prove isso.

Agora passemos a` demonstracao do teorema. Com z, z1 Az0 , b e z1 fixo, vamos denotar D(z, z1 )
por (z). Obviamente, (z) satisfaz
0 (z) = A(z)(z) = (z z0 )1 A0 (z)(z).

(7.62)

Vamos escrever, para z Az0 , b , z = z0 + rei . Assim, r > 0 mede a distancia de z a z0 . Vamos tambem
definir, para r > 0,




f (r, ) := k (z)k = z0 + rei = D z0 + rei , z1 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

354/1304

Temos que (abaixo z = z0 + rei e w = ei )








f

i

(r, )

=
r z0 + re

r






z0 + (r + )ei z0 + rei

=
lim

0

=
por

(2.19)

lim





i
i

z
+
(r
+
)e

z
+
re


0
0




z0 + (r + )ei z0 + rei
lim
0





z0 + (r + )ei z0 + rei


lim

0






i

z
+
e

(z)
i

e lim

0

ei





i
i

z
+
e

(z)


e lim

i

e
|{z} 0
=1

=
por

por

(7.62)

(7.61)

(z
+
w)

(z)
lim

w0

w



(z z0 )1 A0 (z)(z)
1
kA0 (z)k k(z)k
r

1
kA0 (z)k f (r, )
r

C
f (r, ) ,
r

k0 (z)k

1
kA0 (z)(z)k
r



1
kA0 (z)k z0 + rei
r

onde C := sup kA0 (z)k. Note-se que C e finito pois, por hipotese, A0 (z) e analtica em torno de z0 .
|zz0 |<a

C
f (r, ) implica
Obviamente, o fato que f
(r,
)
r
r
f
C
(r, ) + f (r, ) 0 .
r
r

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

355/1304

Obviamente, essa relacao diz que


C
1 f
(r, ) +
0,
f (r, ) r
r
ou seja,

ln r C f (r, ) 0 .
r
Integrando essa expressao entre r e r1 (com 0 < r < r1 < a. Doravante, r1 estara fixo.), temos
 C

r1 f (r1 , )
ln
0.
r C f (r, )
Para x positivo, ln x 0 implica x 1. Assim, r1C f (r1 , ) r C f (r, ). Isso implica
f (r, )

d
,
rC

com d := max r1C f (r1 , ). Com o que vimos, estabelecemos que


02

k (z)k

d
|z z0 |C

para todo z Az0 , b com |z z0 | < r1 . Sabemos que S(z) = e ln(zz0 ) (z). Logo, com |z z0 | < r1 ,


kS(z)k k (z)k e ln(zz0 )

ln(zz )
d
0
.
e
|z z0 |C

(7.63)



Vamos agora concentrar-nos em e ln(zz0 ) . Como e facil de se ver, vale para qualquer matriz B e
qualquer n
umero complexo



k
X
X
X
B
||k k
||k


k
e = +
B 1+
kB k 1 +
kBkk = e|| kBk .

k!
k!
k!
k=1

k=1

k=1

E. 7.26 Exerccio. Complete os detalhes.

Para qualquer n
umero complexo w = |w|ei , tem-se ln w = ln |w| + i (vide nota-de-rodape 9, a`
pagina 347) e, portanto, | ln w|2 = (ln |w|)2 + ()2 (| ln |w|| + ||)2 . Logo, | ln w| | ln |w|| + ||
| ln |w|| + . Se |w| < 1 isso pode ser escrito como
| ln w| ln |w| + .
Assim, escolhendo |z z0 | < 1, teremos
ln(zz )
0
e
e| ln(zz0 )|kk =

e| ln(zz0 )|

kk

e ln |zz0 | e

kk

ekk
.
|z z0 |kk

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

356/1304

Retornando a (7.63), conclumos que para |z z0 | < r1 e |z z0 | < 1, tem-se


kS(z)k

d0
,
|z z0 |p

onde p := C + kk 0 e d0 = dekk . Logo, por (7.60), vale para cada elemento de matriz S(z)ab de
S(z)
lim |z z0 |p |S(z)ab | d0 ,
zz0

sendo, portanto, finito. Isso implica que para qualquer inteiro k maior que p tem-se que a matriz
(z z0 )k S(z) e analtica em z0 , implicando que S(z) tem uma singularidade tipo polo em z0 .
Um coment
ario
A recproca do Teorema 7.1 nao e verdadeira: um contra-exemplo (de [122]) sendo o caso em que


0
1
A(z) =
,
2z 2 0
que claramente tem um polo de ordem dois em z0 = 0. Nao se trata, portanto, de uma singularidade
simples. Para esse caso, porem, tem-se, para todo z, z1 Az0 , b ,
1

2z z1 + z 2 z12 z 2 z11 z 1 z12


1
.
D(z, z1 ) =
3
2
1
2
2 2
2(zz1 z z1 ) 2zz1 + z z1

Claramente z0 = 0 e um ponto singular regular, ja que D(z, z1 ) tem um polo de ordem 2 em z0 = 0.

Para A e D dados acima, verifique que z


D(z, z1 ) = A(z)D(z, z1 ) e que
E. 7.27 Exerccio.
D(z1 , z1 ) = . Verifique que a matriz de monodromia de D(z, z1 ) e .
6

A forma geral das solu


co
es no caso de singularidades simples
A conclusao mais importante do Teorema 7.1, pagina 353, diz respeito a` forma geral das solucoes
de equacoes com pontos singulares simples. Resumimos tudo no seguinte teorema.
Teorema 7.2 Seja a equaca
o Y 0 (z) = A(z)Y (z) com A(z) matriz m m analtica no anel Az0 , b
(para algum b > 0), z0 sendo um ponto singular simples dessa equaca
o diferencial, ou seja, A 0 (z) :=
(z z0 )A(z) e analtica em z0 . Seja como antes D(z, z1 ), z, z1 Az0 , b , uma matriz fundamental
dessa equaca
o com matriz de monodromia M = e2i . Ent
ao, para z1 fixo, D(z, z1 ) e da forma
ln(zz0 )
D(z, z1 ) = e
S(z), onde S(z) e analtica no anel Az0 , b e tem no m
aximo uma singularidade
l
tipo p
olo em z0 . Isso significa que S(z) e da forma S(z) = (z z0 ) S0 (z), para algum inteiro l 0,
onde S0 e analtica em z0 . Com isso, definindo 0 = l , conclumos que D(z, z1 ) e da forma
0

D(z, z1 ) = eln(zz0 ) S0 (z) ,

(7.64)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

357/1304

Conseq
uentemente, cada elemento de matriz D(z, z1 )pq , para z1 fixo, e da forma
D(z, z1 )pq =

m1
m
XX
k=0 l=1

kl
(z z0 )l (ln(z z0 ))k Fpq
(z) ,

(7.65)

kl
p, q = 1, . . . , m, onde as funco
es Fpq
(z) s
ao analticas em z0 , podendo, portanto, ser expressas por
series de Taylor centradas nesse ponto. As constantes complexas l s
ao os autovalores de 0 . Os termos
com k = 0 s
ao n
ao-nulos.
2

7.7

Sistemas Provenientes de EDOs de Ordem m

Considere-se a equacao diferencial linear homogenea complexa de ordem m


y (m) (z) + am1 (z)y (m1) (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0,

(7.66)

onde as m funcoes a0 , . . . , am1 sao analticas em um domnio aberto simplesmente conexo comum D.
facil constatar (faca!) que essa equacao equivale ao sistema
E
Y 0 (z) = A(z)Y (z),
onde

e A(z) e a matriz m m

A(z)

:=

Y (z) :=

y(z)
y 0 (z)
..
.
y (m1) (z)

..
.

..
.

..

0
0
.

..

(7.67)

..

..
.

..

a0 (z) a1 (z) a2 (z)

am2 (z) am1 (z)

(7.68)

a qual e analtica em D, por assim o serem as funcoes a0 , . . . , am1 , em cujo caso aplicam-se as
conclusoes supra-citadas, ou seja, a solucao y(z) e igualmente analtica em D. Para futura referencia
coletamos essa conclusao no seguinte teorema

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

358/1304

Teorema 7.3 Seja a equaca


o diferencial linear homogenea complexa de ordem m
y (m) (z) + am1 (z)y (m1) (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0
e suponhamos que as funco
es a0 , . . . , am1 s
ao todas analticas em um domnio aberto e simplesmente
conexo D. Ent
ao as soluco
es da equaca
o s
ao igualmente analticas em D. Em particular, se D contiver
um disco aberto Daz0 := {z | |z z0 | < a}, centrado em z0 e de raio a > 0, ent
ao as soluco
es da
equaca
o podem ser expressas em termos de uma serie de potencias
y(z) =

X
n=0

cn (z z0 )n ,

a qual converge (absolutamente) pelo menos no disco aberto D az0 , ou seja, pelo menos para todo z
tal que |z z0 | < a.
2

7.7.1

Pontos Singulares Simples em EDOs de Ordem m

Introdu
c
ao e motiva
c
ao
Seja o sistema de equacoes Y 0 (z) = A(z)Y (z) procedente de uma EDO linear complexa homogenea
de ordem m como (7.66), com Y (z) como em (7.67) e A(z) dada em (7.68), definida em um domnio
D do plano complexo. Seja tambem z0 D.

Vamos supor que z0 seja um ponto singular de A(z), ou seja, A(z) nao e analtica em z = z0 . E
bastante claro que se as funcoes ak (z), k = 0, . . . , m 1, tiverem no maximo um polo de ordem 1 em
z0 = 0, ou seja, se as funcoes (z z0 )ak (z), k = 0, . . . , m 1, forem todas analticas em z0 , entao z0
sera um ponto singular regular de Y 0 (z) = A(z)Y (z), pois, teremos Y 0 (z) = (z z0 )1 A0 (z)Y (z), onde
A0 (z) := (z z0 )A(z) e analtica em z0 . Assim, nesse caso, valeriam todas as importantes conclusoes
a que chegamos na Secao 7.6.4, pagina 352, especialmente aquelas expressas no Teorema 7.2, pagina
357.
Sucede que ha condicoes ainda menos restritivas sobre as funcoes ak (z), k = 0, . . . , m 1, para as
quais as importantes conclusoes sobre a forma geral da solucao, expressas no Teorema 7.2, tambem se
aplicam. A saber, tal e o caso se as funcoes (z z0 )mk ak (z), k = 0, . . . , m 1, forem todas analticas
em z0 , ou seja, se cada funcao ak (z) tiver no maximo um polo de ordem m k em z0 .
No que segue iremos primeiramente justificar as afirmativas do u
ltimo paragrafo para depois extrair
as conclusoes pertinentes. Esse caminho nos conduzira a uma nocao mais abrangente do conceito de
ponto singular simples de equaco
es diferenciais lineares complexas homogeneas de ordem m como (7.66).
A no
c
ao de ponto singular simples para EDOs de ordem m
Seja entao Y 0 (z) = A(z)Y (z) com Y (z) como em (7.67) e com A(z) dada em (7.68), definida em
um domnio aberto e simplesmente conexo D com z0 D. Vamos definir um novo vetor coluna
Y (z) := E(z)Y (z),

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

onde E(z) e a matriz diagonal m m

E(z)

:=

0 (z z0 )
0

0
(z z0 )2 . .
0
0

.
..
..
..
..
..
.
.
.
.

0
0
0
(z z0 )m2

0
0
0
..
.
0
(z z0 )m1

359/1304

(7.69)

ou seja, E(z) e a matriz diagonal com E(z)kk = (z z0 )k1 , 1 k m.


O porque de procedermos essa mudanca de Y para Y atraves dessa matriz E ficara claro logo
abaixo. Diferenciando-se Y (z), teremos, para z 6= z0 ,
Y 0 (z) = E(z)Y 0 (z) + E 0 (z)Y (z)
= E(z)A(z)Y (z) + E 0 (z)E(z)1 Y (z)
= E(z)A(z)E(z)1 Y (z) + E 0 (z)E(z)1 Y (z),
ou seja, definindo
obtemos,

i
h

A(z)
:= (z z0 ) E(z)A(z)E(z)1 + E 0 (z)E(z)1 ,

(7.70)

Y (z).
Y 0 (z) = (z z0 )1 A(z)

(7.71)

Para prosseguirmos (e para finalmente entendermos por que fizemos a mudanca de Y para Y ), e

muito importante calcularmos explicitamente a matriz A(z)


definida acima.

definida acima. Use (7.70),


E. 7.28 Exerccio muito importante. Calcule explicitamente a matriz A(z)
(7.68) e (7.69).
6

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

360/1304

O resultado e

A(z)

..
.

..
.

b0 (z) b1 (z) b2 (z)

..

..

0
..

..
.

m3

m2

bm3 (z) bm2 (z) bm1 (z)

onde
b0 (z) := (z z0 )m a0 (z),
b1 (z) := (z z0 )m1 a1 (z),
b2 (z) := (z z0 )m2 a2 (z),
..
.
bm2 (z) := (z z0 )2 am2 (z),
bm1 (z) := (z z0 )am1 (z) + (m 1).
Como exemplo, tem-se no caso de particular interesse fsico das equacoes de segunda ordem
y 00 (z) + a1 (z) y 0 (z) + a0 (z) y(z) = 0



y(z)
1
0
, e
que E(z) =
, Y (z) =
0 z z0
0
(z z0 )y (z)

0
1
Y (z), com A(z)

.
Y 0 (z) = (z z0 )1 A(z)
=
2
(z z0 ) a0 (z) (z z0 )a1 (z) + 1
De volta ao caso geral, vemos que se as funcoes bk (z), 0 k m 1, forem todas analticas em

torno de z0 , entao A(z)


sera analtica em torno de z0 e, portanto, o sistema (7.71) sera um sistema com
um ponto singular simples em z0 . Coloquemos, assim, a seguinte definicao:

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

361/1304

Defini
c
ao. Seja a equaca
o diferencial linear homogenea complexa de ordem m
y (m) (z) + am1 (z)y (m1) (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0.

(7.72)

o se pelo
Um ponto z0 e dito ser um ponto singular simples, ou ponto singular regular dessa equaca
menos uma das funco
es ak (z) for singular em z0 mas de modo que todas as funco
es (z z0 )mk ak (z),
k = 0, . . . , m 1, sejam analticas em z0 . Isso significa que cada funca
o ak (z) ou e analtica em z0 ou
tem um p
olo em z0 cuja ordem deve no m
aximo ser m k, sendo que supostamente pelo menos uma
das funco
es ak (z) e singular em z0 .
Isso significa que um ponto z0 e um ponto singular simples se A(z) nao e analtica em z = z0 mas

se A(z)
e analtica em z = z0 .
Assim, por exemplo, dizemos que z0 e um ponto singular simples da equaca
o de segunda ordem (ou
00
0
seja, para m = 2) dada por y (z) + a1 (z) y (z) + a0 (z) y(z) = 0 se a0 (z) tiver um polo de ordem no
maximo 2 em z0 ou se a1 (z) tiver um polo de ordem no maximo 1 em z0 , ou ambos. Varios exemplos
sao apresentados e discutidos na Secao 7.7.3.
No caso de z0 ser um ponto singular simples de uma equacao como (7.72), aplicam-se os resultados
da Secao 7.6.4, pagina 352, a`s solucoes de (7.71). Discutiremos adiante as implicacoes deste fato.
Solu
co
es de equa
co
es com pontos singulares simples
Unindo as observacoes acima com o Teorema 7.2 chegamos a` seguinte importante conclusao.
Teorema 7.4 Seja a equaca
o diferencial linear homogenea complexa de ordem m
y (m) (z) + am1 (z)y (m1) (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0
e seja z0 um ponto singular simples dessa equaca
o, ou seja pelo menos uma das funco
es a k (z) e singular
mk
em z0 mas de modo que todas as funco
es (z z0 )
ak (z), k = 0, . . . , m 1, sejam analticas em z0 .
Ent
ao as soluco
es da equaca
o diferencial s
ao combinaco
es lineares de soluco
es da forma
y, k (z) = (z z0 ) (ln(z z0 ))k f, k (z),
para certos , k = 0, . . . , m 1 e f, k analtica em torno de z0 .

Por fim, pela observaca


o importante da p
agina 349, sempre h
a pelo menos uma soluca
o que n
ao
envolve potencias de ln(z z0 ), ou seja, h
a sempre pelo menos uma soluca
o com k = 0.
2
A equa
c
ao de Euler

Um exemplo-prototipo de uma equacao com um ponto singular simples e a equaca


o de Euler de
ordem m:
z m y (m) (z) + z m1 bm1 y (m1) (z) + zb1 y 0 (z) + b0 y(z) = 0 ,

onde bm1 , . . . , b0 sao constantes. Nesse caso tem-se


am1 (z) =

bm1
,
z

am2 (z) =

bm2
,
z2

...,

a0 (z) =

b0
zm

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

362/1304

e, claramente, essa equacao possui um ponto singular simples em z0 = 0. No caso m = 2 a equacao de


Euler e
z 2 y 00 (z) + zb1 y 0 (z) + b0 y(z) = 0 ,
cujas solucoes sao, caso (1 b1 )2 4b0 6= 0,
y(z) = z + + z
onde
=
ou, caso (1 b1 )2 4b0 = 0,

1 b1

(7.73)

p
(1 b1 )2 4b0
2

y(z) = z 0 + ln(z) z 0

(7.74)

onde

1 b1
.
2
Acima, e sao constantes arbitrarias. Essas solucoes ilustram as afirmacoes do Teorema 7.4.
0 =

E. 7.29 Exerccio importante. Verifique todas as afirmacoes feitas acima.

Um Teorema de Fuchs
Ha um importante teorema, devido a Fuchs, que estabelece uma recproca do Teorema 7.4: se toda
solucao da equacao
y (m) (z) + am1 (z)y (m1) (z) + + a1 (z)y 0 (z) + a0 (z)y(z) = 0

(7.75)

for uma combinacao linear de funcoes da forma (z z0 ) (ln(z z0 ))k f, k (z), para certos ,
k = 0, . . . , m 1 e f, k analticas em torno de z0 , entao z0 e um ponto singular simples de (7.75), ou
seja, todas as funcoes (z z0 )mk ak (z), k = 0, . . . , m 1, sao analticas em z0 . Uma demonstracao
pode ser encontrada em [122].

7.7.2

Singularidades no Infinito

Seja a equacao diferencial linear homogenea complexa de ordem m


y (m) (z) + am1 (z)y (m1) (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0.
Em muitas situacoes deseja-se estudar o comportamento dessas equacoes e suas solucoes para |z| tendendo a infinito e, para tal, presta-se muitas vezes estudar propriedades das solucoes como funcoes de
1/z. Com isso poderamos, por exemplo, perguntar-nos se a solucao pode ser expressa em termos de
uma serie de potencias em 1/z etc., e usar os metodos ja discutidos para obter essa expansao, caso ela
exista, e, dessa forma, conhecer a solucao para |z| grande.
Por simplicidade limitaremos nossa discussao a equacoes de segunda ordem13
y 00 (z) + a1 (z) y 0 (z) + a0 (z) y(z) = 0.
13

Para uma discuss


ao mais geral, vide [122] ou [64].

(7.76)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

363/1304

Facamos a mudanca de variaveis w = 1/z. Definindo u(w) = y(z) = y(1/w), teremos




a0 (1/w)
a1 (1/w)
2
00
u0 (w) +

u(w) = 0.
u (w) +
2
w
w
w4

(7.77)

Vers
ao de 29 de setembro de 2005.

E. 7.30 Exerccio. Confira.

Chamaremos essa equacao versao no infinito da equacao (7.76). Claramente essa equacao equivale
a
U 0 (w) = C(w)U (w),
com
U (w) :=
onde


u(w)
,
u0 (w)

C(w) :=


0
1
,
c0 (w) c1 (w)

c0 (w) :=

a0 (1/w)
,
w4

c1 (w) :=

2
a1 (1/w)

.
w
w2

Analogamente ao que fizemos anteriormente, podemos transformar esse sistema no sistema equivalente
1
(w),
U
U 0 (w) = C(w)
w
onde


(w) := E(w)U (w),

U
C(w)
:= w E(w)C(w)E(w)1 + E 0 (w)E(w)1 ,



u(w)
1 0
e
com E(w) =
, U (w) =
0 w
wu0 (w)

0
1
0
1

=


C(w)
=
1
1 .

a0 w
a1 w
w 2 c0 (w)
wc1 (w) + 1

1
+
w2
w
Por analogia com nossas nocoes previas, facamos as seguintes definicoes:

1. Diremos que a equacao (7.76) e uma equaca


o analtica no infinito se C(w) for analtica em torno
de w = 0.
2. Diremos que a equacao (7.76) tem uma singularidade no infinito se C(w) nao for analtica em
torno de w = 0.
3. Diremos que a equacao (7.76) tem uma singularidade simples no infinito (ou que z 0 = e um

ponto singular simples de (7.76)) se C(w) nao for analtica em torno de w = 0 mas C(w)
o for,
ou seja, se c0 (w) tiver um polo de ordem no maximo 2 em w = 0 ou se c1 (w) tiver um polo de
ordem no maximo 1 em w = 0, ou ambos.
Varios exemplos sao discutidos na Secao 7.7.3.

JCABarata. Curso de Fsica-Matem


atica

7.7.3

Vers
ao de 29 de setembro de 2005.

Captulo 7

364/1304

Alguns Exemplos de Interesse

Nesta secao analisaremos algumas equacoes diferenciais de importancia na Fsica-Matematica previamente mencionadas na Secao 5.1.2, pagina 267, a` luz do que discutimos neste captulo.
E. 7.31 Exerccio importante.
que seguem.

Complete os detalhes de todos os calculos apresentados nos exemplos


6

1. A equa
c
ao de segunda ordem com coeficientes constantes
y 00 (z) + by 0 (z) + cy(z) = 0,
onde b e c sao constantes, corresponde a

A(z) =

Assim, a equacao e regular em todo z0 .

Ponto no infinito. A versao no infinito da equacao de segunda ordem com coeficientes constantes
e


c
b
2
00
2 u0 (w) + 4 u(w) = 0.
u (w) +
w w
w
Claramente, z0 = e um ponto singular irregular da equacao de segunda ordem com coeficientes
constantes, exceto no caso em que b = c = 0, onde z0 = e um ponto singular regular.

2. A equa
c
ao de Euler
z 2 y 00 (z) + az y 0 (z) + b y(z) = 0,
ou seja,
y 00 (z) +

a 0
b
y (z) + 2 y(z) = 0,
z
z

onde a e b sao constantes, corresponde a

b
2
z

a + 1

A(z) =
Para z0 = 0 tem-se

A(z)
=

Assim, z0 = 0 e um ponto singular simples da equacao de Euler, exceto se a = b = 0, em cujo


caso z0 = 0 e um ponto regular.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

365/1304

Ponto no infinito. A versao no infinito da equacao de Euler e


u00 (w) +

b
2a 0
u (w) + 2 u(w) = 0 .
w
w

Claramente, z0 = e um ponto singular simples da equacao de Euler, exceto se a = 2 e b = 0,


em cujo caso z0 = e um ponto regular.
3. A equa
c
ao de Bessel
z 2 y 00 (z) + z y 0 (z) + (z 2 2 ) y(z) = 0,

ou seja,



1 0
2
y (z) + y (z) + 1 2 y(z) = 0,
z
z
00

onde


, corresponde a

A(z) =

Para z0 = 0 tem-se

1
z2

A(z)
=

0
2 z2

1
z

1
.
0

Assim, z0 = 0 e um ponto singular simples da equacao de Bessel.


Ponto no infinito. A versao no infinito da equacao de Bessel e


1 0
1
2
00
u (w) + u (w) +
u(w) = 0.

w
w4 w2
Claramente, c0 tem um polo de ordem 4 em w = 0. Assim, z0 = e um ponto singular irregular
da equacao de Bessel.
4. A equa
c
ao de Legendre
(1 z 2 ) y 00 (z) 2z y 0 (z) + ( + 1) y(z) = 0,
ou seja,
y 00 (z)
onde , corresponde a

( + 1)
2z
y 0 (z) +
y(z) = 0,
2
1z
1 z2

A(z) =

( + 1)
1 z2

1
2z
1 z2

Claramente percebe-se que a equacao de Legendre e analtica no domnio simplesmente conexo


D formado pelo disco aberto de raio 1: D = {z : |z| < 1}. Conclumos que as solucoes da
equacao de Legendre sao analticas nesse domnio D.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

366/1304

Os pontos z0 = 1 sao pontos singulares da equacao de Legendre.


Para z0 = 1 teremos

que e analtica em z0 = 1.
Para z0 = 1 teremos

que e analtica em z0 = 1.

A(z)
=

A(z)
=

( + 1)(z 1)
1+z

1z
1+z

( + 1)(z + 1)
z1

1+z
1z

Vemos entao que os pontos z0 = 1 sao pontos singulares simples da equacao de Legendre.
Ponto no infinito. A versao no infinito da equacao de Legendre e




1 (1 + )
2w
0
00
u (w) + 2
u(w) = 0.
u (w) +
w2 1
w
w2 1

Claramente, z0 = e um ponto singular simples da equacao de Legendre.


5. A equa
c
ao de Hermite
y 00 (z) 2z y 0 (z) + y(z) = 0,
onde


, corresponde a
A(z) =


0
1
.
2z

Conclumos que a equacao de Hermite e analtica em todo o plano complexo, assim sendo tambem
as suas solucoes.
Ponto no infinito. A versao no infinito da equacao de Hermite e


2

2
00
u (w) +
+ 3 u0 (w) + 4 u(w) = 0.
w w
w
Claramente, c0 tem um polo de ordem 4 em w = 0 e c1 tem um polo de ordem 3 em w = 0.
Assim, z0 = e um ponto singular irregular da equacao de Hermite.
6. A equa
c
ao de Airy
y 00 (z) z y(z) = 0.
corresponde a
A(z) =


0 1
.
z 0

Conclumos que a equacao de Airy e analtica em todo o plano complexo, assim sendo tambem
as suas solucoes.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

367/1304

Ponto no infinito. A versao no infinito da equacao de Airy e


u00 (w) +

1
2 0
u (w) 5 u(w) = 0.
w
w

Claramente, c0 tem um polo de ordem 5 em w = 0. Assim, z0 = e um ponto singular irregular


da equacao de Airy.
7. A equa
c
ao de Laguerre
zy 00 (z) + (1 z) y 0 (z) + y(z) = 0,
ou seja,
00

y (z) +
onde

, corresponde a


1
1
z

A(z) =

Para z0 = 0 teremos

y 0 (z) +

y(z) = 0,
z

A(z)
=

1
0

1
z

Assim, z0 = 0 e um ponto singular simples da equacao de Laguerre.


Ponto no infinito. A versao no infinito da equacao de Laguerre e


1
1

00
u (w) +
+ 2 u0 (w) + 3 u(w) = 0.
w w
w
Claramente, c0 tem um polo de ordem 3 em w = 0 e c1 tem um polo de ordem 2 em w = 0.
Assim, z0 = e um ponto singular irregular da equacao de Laguerre.
8. A equa
c
ao de Chebyshev
(1 z 2 ) y 00 (z) z y 0 (z) + 2 y(z) = 0,
ou seja,
y 00 (z)
onde


, corresponde a

z
2
0
y
(z)
+
y(z) = 0,
1 z2
1 z2

A(z) =

1 z2

1
z
1 z2

Claramente percebe-se que a equacao de Chebyshev e analtica no domnio simplesmente conexo


D formado pelo disco aberto de raio 1: D = {z : |z| < 1}. Conclumos que as solucoes da
equacao de Chebyshev sao analticas nesse domnio D.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

368/1304

Os pontos z0 = 1 sao pontos singulares da equacao de Chebyshev.


Para z0 = 1 teremos

A(z)
=

que e analtica em z0 = 1.
Para z0 = 1 teremos

A(z)
=

que e analtica em z0 = 1.

(z 1)
1+z

1
1+z

(z + 1)
z1

1
1z

Vemos entao que os pontos z0 = 1 sao pontos singulares simples da equacao de Chebyshev.
Ponto no infinito. A versao no infinito da equacao de Chebyshev e




1
2
1
1
00
0
u (w) +
2
u(w) = 0.
u (w) + 2
w
1 w2
w
w2 1

Claramente, z0 = e um ponto singular simples da equacao de Chebyshev.


9. A equa
c
ao hipergeom
etrica
z(1 z) y 00 (z) + [c (1 + a + b)z] y 0 (z) ab y(z) = 0,
ou seja,
00

y (z) +

c (1 + a + b)z
z(1 z)

com a, b, c constantes, corresponde a

A(z) =

0
ab
z(1 z)

y 0 (z)

ab
y(z) = 0,
z(1 z)
1

.
(1 + a + b)z c
z(1 z)

Seus pontos singulares sao z0 = 0 e z0 = 1.


Para z0 = 0 teremos

que e analtica em z0 = 0.

A(z)
=

abz
1z

(a + b)z c + 1
1z

JCABarata. Curso de Fsica-Matem


atica

Para z0 = 1 teremos

que e analtica em z0 = 1.

A(z)
=

Vers
ao de 29 de setembro de 2005.

ab(z 1)
z

(a + b)z + c
z

Captulo 7

369/1304

Assim, z0 = 0 e z0 = 1 sao pontos singulares simples da equacao hipergeometrica.


Ponto no infinito. A versao no infinito da equacao hipergeometrica e


1 (2 c)w + a + b 1
ab
00
u (w) +
u0 (w) 2
u(w) = 0.
w
w1
w (w 1)
Claramente, z0 = e um ponto singular simples da equacao hipergeometrica.
10. A equa
c
ao hipergeom
etrica confluente
z y 00 (z) + [c z] y 0 (z) a y(z) = 0,
ou seja,
00

y (z) +
com a, c constantes, corresponde a

c
z

1 y 0 (z)

A(z) = a
z
Para z0 = 0 teremos

A(z)
=

a
y(z) = 0,
z
1

c.
1
z

az

zc+1

que e analtica em z0 = 0. Assim, z0 = 0 e um ponto singular simples da equacao de hipergeometrica confluente.


Ponto no infinito. A versao no infinito da equacao hipergeometrica confluente e


1
a
2c
00
+ 2 u0 (w) 3 u(w) = 0.
u (w) +
w
w
w
Claramente, c0 tem um polo de ordem 3 em w = 0 e c1 tem um polo de ordem 2 em w = 0.
Assim, z0 = e um ponto singular irregular da equacao hipergeometrica confluente.

JCABarata. Curso de Fsica-Matem


atica

7.8

Vers
ao de 29 de setembro de 2005.

Captulo 7

370/1304

Equa
co
es Fuchsianas. Smbolos de Riemann

Nesta secao apresentaremos propriedades das chamadas equaco


es Fuchsianas (definidas abaixo), mas
nos restringiremos a`s equacoes de primeira e de segunda ordem por serem de maior interesse (especialmente as de segunda ordem). Para um tratamento mais abrangente, vide [64]. O estudo das equacoes
Fuchsianas despertou grande interesse na Matematica da segunda metade do Seculo XIX e do incio do
Seculo XX, tendo alimentado muitos desenvolvimentos na teoria das funcoes de variaveis complexas.
Esta secao e dispensavel para o estudo do material que segue nos captulos seguintes, mas pode
servir, em uma segunda leitura, para esclarecer a relevancia das equacoes hipergeometricas no contexto
das equacoes diferenciais lineares de segunda ordem no plano complexo.
Equa
co
es Fuchsianas
Uma equacao diferencial linear de ordem n e dita ser uma equaca
o Fuchsiana 14 se possuir um n
umero
finito de pontos singulares, todos simples (incluindo eventualmente, mas nao necessariamente, um ponto
singular simples no infinito). A equacao Euler, a equacao de Legendre e a equacao hipergeometrica
sao exemplos de equacoes Fuchsianas (vide Secao 7.7.3, acima). Equacoes com tal propriedade podem
ser resolvidas em todo o plano complexo pelo metodo de Frobenius, atraves de expansoes em torno
dos pontos singulares simples. Alem disso, equacoes Fuchsianas possuem algumas de propriedades de
transformacao que facilitam seu estudo. Por exemplo, toda equacao Fuchsiana de segunda ordem com
exatamente tres pontos singulares pode ser transformada em uma equacao hipergeometrica. Equacoes
Fuchsianas podem ser classificadas de forma mais ou menos sistematica de acordo com o n
umero de
singularidades e e nosso proposito fazer essa classificacao de modo a obter a forma geral de equacoes
Fuchsianas de primeira e de segunda ordem com uma, duas ou tres singularidades (que, no caso de
equacoes de segunda ordem, correspondem a` maioria das equacoes encontradas em aplicacoes).

7.8.1

Equa
co
es Fuchsianas de Primeira Ordem

Como pre-aquecimento consideremos as equacoes de primeira ordem. Seja a equacao diferencial


y 0 (z) + a0 (z) y(z) = 0

(7.78)

u0 (w) + b0 (w)u(w) = 0 ,

(7.79)

e sua versao no infinito


onde w = 1/z, u(w) = y(z) = y(1/w) e
b0 (w) :=

a0 (1/w)
.
w2

No que segue vamos procurar a forma geral de uma tal equacao que possua um certo n
umero
de singularidades, todas simples, ou seja, de modo que a equacao seja Fuchsiana. Comecamos nos
perguntando se ha equacoes sem quaisquer pontos singulares, nem no infinito.
14

Lazarus Immanuel Fuchs (1833-1902).

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

371/1304

Equa
co
es sem pontos singulares
Se (7.78) nao possui pontos singulares finitos, entao a0 (z) e uma funcao inteira de z (ou seja, e

X
(n)
analtica em toda parte) e, portanto, possui uma serie de Taylor centrada em 0: a 0 (z) =
0 z n ,
n=0

convergente para todo z . Com isso vemos que


b0 (w) =

(n)

n=0

(7.80)

w n+2

que convege para todo w , w 6= 0. Para que (7.78) tambem nao possua uma singularidade no
(n)
infinito, e necessario e suficiente que b0 seja analtica em 0. Isso so e possvel se 0 = 0 para todo n,
ou seja, se a0 for identicamente nula. Assim, a equacao y 0 (z) = 0, cuja versao no infinito e u0 (w) = 0,
e a u
nica equacao diferencial de primeira ordem sem qualquer singularidade. Como veremos na Secao
7.8.2, nao ha equacoes de segunda ordem com essa caracterstica.
Equa
co
es com apenas um ponto singular simples no infinito
De (7.80) vemos tambem que nao existem equacoes de primeira ordem que sejam regulares em toda
parte mas possuam uma singularidade simples no infinito. De fato, vemos por (7.80) que b0 tem um
polo de ordem maior ou igual a dois em w = 0 e nao de primeira ordem, como seria necessario para
que a singularidade no infinito fosse simples.
Equa
co
es Fuchsianas de primeira ordem. Caso geral
Consideremos agora o caso geral em que (7.78) e Fuchsiana e seus pontos singulares finitos sao um
subconjunto de {z1 , . . . , zk } formado por k 1 pontos distintos. Isso significa que a0 (z) tem no
maximo um polo de ordem 1 nos pontos z1 , . . . zk com k 1, sendo portanto da forma
a0 (z) =

c0 (z)
,
(z z1 ) (z zk )

onde c0 e uma funcao inteira de z (para que um certo za seja de fato singular simples e necessario que
c0 nao tenha um zero em za ). Obtemos disso que
w k2 c0 (1/w)
b0 (w) =
(1 wz1 ) (1 wzk )
Como funcao inteira, c0 possui uma expansao de Taylor centrada em 0: c0 (z) =

(n)

0 z n , a qual

n=0

converge para todo z . Assim, obtemos

b0 (w) =

X
n=0

(n)

1
w nk+2

(1 wz1 ) (1 wzk )

(7.81)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

372/1304

Para que o ponto no infinito seja regular e necessario e suficiente que b0 (w) seja analtica em w = 0.
(n)
1
Pelo fato de (1wz1 )(1wz
ser analtica em w = 0, isso requer que 0 = 0 para todo n > k 2. Para
k)
k = 1 isso requer que a0 e b0 sejam identicamente nulas, nao havendo, entao, qualquer singularidade.
Para k 2 isso requer que a0 (z) e b0 (w) sejam da forma
k2
X
n=0

a0 (z) =
e

b0 (w) =

k2
X
n=0

(z z1 ) (z zk )
k2
X

(n)

(n)

0 z n

w nk+2

nk2n

(1 wz1 ) (1 wzk )

(k2n)

wn

n=0

(1 wz1 ) (1 wzk )

Retornando a (7.81), para que o ponto no infinito seja singular simples e necessario que b 0 (w) tenha
(n)
um polo simples em w = 0. Uma condicao necessaria e suficiente para tal e que 0 = 0 para todo
(k1)
n > k 1 com 0
6= 0. Nesse caso a0 e b0 sao da forma
k1
X
n=0

a0 (z) =
e

b0 (w) =
ou seja

k1
X
n=0

(n)
0

(n)

0 z n

(z z1 ) (z zk )

1
w nk+2

nk1n

(1 wz1 ) (1 wzk )
(k1)

b0 (w) =

0
w

k1
X

k1
X

(k1n)

w n1

n=0

(1 wz1 ) (1 wzk )

(k1n)

w n1

n=1

(1 wz1 ) (1 wzk )

Analisando alguns casos explcitos


Analisemos o que ocorre concretamente para k = 1 e k = 2.
(n)

1. Caso k = 1. Nessa situacao a equacao sera analtica no infinito apenas se 0 = 0 para todo
n > 1, ou seja, se c0 for identicamente nula. Assim, a0 e b0 sao tambem identicamente nulas e
as equacoes reduzem-se a y 0 (z) = 0 e u0 (w) = 0 e nao ha quaisquer singularidades.
Para que (7.78) tenha uma singularidade simples no infinito e outra singularidade simples em z1
devemos ter
(0)
(0)
0
0
a0 (z) =
e
b0 (w) =
.
(z z1 )
w(1 wz1 )

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

373/1304

Assim, a u
nica equacao Fuchsiana com uma singularidade simples em z1 e uma singularidade
simples no infinito e da forma
(0)

(0)

0
y(z) = 0 ,
y (z) +
(z z1 )
0

cuja versao no infinito e

0
u (w)
u(w) = 0 . (7.82)
w(1 wz1 )
0

(n)

2. Caso k = 2. Para que a equacao seja regular no infinito devemos ter 0


Assim, nesse caso a0 e b0 serao da forma
(0)

= 0 para todo n > 0.

(0)

0
a0 (z) =
(z z1 )(z z2 )

0
b0 (w) =
.
(1 wz1 )(1 wz2 )

Assim, a forma geral de uma equacao de primeira ordem regular no infinito e com exatamente
dois pontos singulares simples em z1 e z2 e
(0)

(0)

0
0
y (z)+
y(z) = 0 , cuja versao no infinito e u0 (w)
u(w) = 0.
(z z1 )(z z2 )
(1 wz1 )(1 wz2 )
0

Para que a equacao tenha um ponto singular simples no infinito devemos ter
(1)

a0 (z) =

(0)
0

0
w
b0 (w) =
.
(1 wz1 )(1 wz2 )
(0)

(1)
0 z

+
(z z1 )(z z2 )

0 +

Conclumos que a forma geral de uma equacao Fuchsiana com um ponto singular simples no
infinito e no maximo dois pontos singulares simples em z1 e z2 e
(0)

(1)

(1)

(0)

0 + 0 z
y (z) +
y(z) = 0 ,
(z z1 )(z z2 )
0

cuja versao no infinito e


0 + 0 w
u(w) = 0 .
u (w)
w(1 wz1 )(1 wz2 )
0

(0)

(1)

Caso 0 = 0 z2 essas equacoes ficam


(1)

y 0 (z) +

0
y(z) = 0 ,
(z z1 )

(1)

u0 (w)

0
u(w) = 0
w(1 wz1 )

e agora z2 nao e mais uma singularidade da equacao diferencial. Essas equacoes tem a mesma
forma de (7.82), o que nao e de surpreender pois aqui temos apenas singularidades simples em z 1
e no infinito.
*
Para futura referencia resumamos os resultados obtidos ate o momento na forma de uma proposicao.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

374/1304

Proposi
c
ao 7.4 Para a equaca
o diferencial linear de primeira ordem no plano complexo
y 0 (z) + a0 (z)y(z) = 0

(7.83)

valem as seguintes afirmaco


es:
I. Para que (7.83) n
ao tenha qualquer singularidade finita ou no infinito e necess
ario e suficiente
0
0
que seja da forma y (z) = 0, cuja vers
ao no infinito e u (w) = 0.
II. N
ao h
a equaco
es Fuchsianas de primeira ordem como (7.83) que tenham apenas uma singularidade simples, finita ou no infinito.
III. Para que (7.83) seja Fuchsiana tendo uma singularidade simples em z 1 e outra no infinito e
necess
ario e suficiente que seja da forma
(0)

(0)

y 0 (z) +

0
y(z) = 0 ,
(z z1 )

cuja vers
ao no infinito e

u0 (w)

0
u(w) = 0
w(1 wz1 )

(0)

com 0 6= 0.
IV. Para que (7.83) seja Fuchsiana, tendo o infinito como ponto regular e no m
aximo k singularidades
simples nos pontos z1 , . . . , zk com k 2, e necess
ario e suficiente que seja da forma

k2
X

(n)

0 z n

n=0
0

y(z) = 0 ,
y (z) +

(z

z
)

(z

z
)
1
k

cuja vers
ao no infinito e

k2
X

(k2n) n
0
w

n=0

u (w)
(1 wz1 ) (1 wzk ) u(w) = 0 .

V. Para que (7.83) seja Fuchsiana, tendo o infinito como ponto singular simples e no m
aximo k
singularidades simples nos pontos z1 , . . . , zk com k 2, e necess
ario e suficiente que seja da
forma

k1
X
(n)
0 z n

n=0
0
y(z) = 0 ,

y (z) +

(z

z
)

(z

z
)
1
k

JCABarata. Curso de Fsica-Matem


atica

(k1)

com 0

Captulo 7

Vers
ao de 29 de setembro de 2005.

375/1304

6= 0, cuja vers
ao no infinito e

k1
(k1)
X
0
(k1n) n1
0
w
w +

n=1

u0 (w)
(1 wz1 ) (1 wzk ) u(w) = 0 .

7.8.2

Equa
co
es Fuchsianas de Segunda Ordem

Muito mais relevante que as equacoes Fuchsianas de primeira ordem sao as equacoes Fuchsianas de
segunda ordem, as quais estudaremos agora. Consideremos a equacao diferencial linear de segunda
ordem
y 00 (z) + a1 (z) y 0 (z) + a0 (z) y(z) = 0
(7.84)
e sua versao no infinito
u00 (w) + b1 (w)u0 (w) + b0 (w)u(w) = 0
(vide (7.76) e (7.77)), onde w = 1/z, u(w) = y(z) = y(1/w) e


a0 (1/w)
2
a1 (1/w)
b0 (w) :=
.
,
b1 (w) :=

w4
w
w2

(7.85)

(7.86)

No que segue vamos procurar a forma geral de uma tal equacao que possua um certo n
umero
de singularidades, todas simples, ou seja, de modo que a equacao seja Fuchsiana. Comecamos nos
perguntando se ha equacoes sem quaisquer pontos singulares, nem no infinito.
Equa
co
es sem pontos singulares
Se (7.84) nao possuir pontos singulares finitos, entao as funcoes a0 e a1 devem ser funcoes inteiras
(analticas em todo ) e, portanto, possuem series de Taylor centradas em 0
a0 (z) =

(n)
0 z n

a1 (z) =

n=0

(n)

1 z n

n=0

convergentes para todo z . Com isso, vemos que


b0 (w) =

X
n=0

(n)
0

1
w n+4

2 X (n) 1
b1 (w) =

,
w n=0 1 w n+2

onde as series convergem para todo w , w 6= 0. Trata-se claramente de series de Laurent centradas
em w = 0 para b0 e b1 . Para que (7.84) tambem nao possua uma singularidade no infinito, seria
(n)
necessario que b0 e b1 fossem analticas em 0. Para b0 isso so seria possvel se 0 = 0 para todo n mas

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

para b1 nao ha como alcancar essa condicao devido ao termo


(n)
pode ser anulado por qualquer escolha dos coeficientes 1 .

2
w

376/1304

de sua expansao de Laurent, o qual nao

Conclumos disso que nao existem equacoes diferenciais lineares de segunda ordem sem quaisquer
pontos singulares finitos ou no infinito.
Equa
co
es com apenas um ponto singular simples no infinito
Se (7.84) nao tiver pontos singulares finitos, vimos que possuira um ponto singular no infinito. Sob
quais circunstancias esse ponto no infinito e singular simples? Para tal e necessario que b 0 (w) tenha
em w = 0 um polo de ordem no maximo 2 e b1 (w) tenha em w = 0 um polo de ordem no maximo 1.
(n)
(n)
Assim, conclumos que devemos ter 0 = 1 = 0 para todo n. Em um tal caso as funcoes a0 , a1 e
b0 sao identicamente nulas, enquanto que b1 (w) = 2/w. Conclumos que a u
nica equacao diferencial de
segunda ordem com apenas um ponto singular simples no infinito e a equacao
y 00 (z) = 0 ,

u00 (w) +

cuja versao no infinito e

2 0
u (w) = 0 .
w

(7.87)

Equa
co
es com apenas um ponto singular simples finito em z = 0
Procuremos agora saber a forma geral de uma equacao diferencial com apenas um ponto singular
finito em z = 0 e regular no infinito. Em tal caso, a0 (z) tem no maximo um polo duplo em z = 0 e a1
tem no maximo um polo simples z = 0, esse sendo se u
nico ponto singular. Assim, a0 (z) e a1 (z) tem
as representacoes de Laurent
(2)

a0 (z) =

(1)

0
0
+
z2
z

(1)

(n)

0 z n ,

a1 (z) =

n=0

1
z

(n)

1 z n

n=0

as quais convergem para todo z , z 6= 0. Com isso, temos

X (n) 1
0
0
+
+
0
,
n+4
w2
w3
w
n=0
(2)

b0 (w) =

(1)

(1)

b1 (w) =

2 1
w

(n)

n=0

1
w n+2

Para que o ponto no infinito seja regular e necessario que b0 (w) e b1 (w) sejam analticas em w = 0.
(n)
Como se constata das expansoes de Laurent dadas acima dessas funcoes, isso requer que 0 = 0 para
(n)
(1)
todo n 2, 1 para todo n 0 e 1 = 2. Nesse caso as funcoes b0 e b1 sao identicamente nulas,
assim como a funcao a0 , sendo que a1 (z) = 2/z. Conclumos que a u
nica equacao diferencial que possui
um u
nico ponto singular simples finito em z = 0 e tem o infinito como ponto regular e a equacao
2
y 00 (z) + y 0 (z) = 0 ,
z

cuja versao no infinito e

u00 (w) = 0 .

Essa equacao sera generalizada em (7.92) para uma singularidade que nao seja no ponto z = 0.
Equa
co
es Fuchsianas de segunda ordem. Caso geral

(7.88)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

377/1304

Consideremos agora o caso geral em que (7.84) e Fuchsiana e seus pontos singulares finitos sao um
subconjunto de {z1 , . . . , zk } formado por k 1 pontos distintos. Isso significa que a0 (z) tem no
maximo um polo de ordem 2 e a1 (z) no maximo um polo de ordem 1 nos pontos z1 , . . . zk com k 1.
Assim, ambas sao da forma
c0 (z)
(z z1 (z zk )2

a0 (z) =

)2

a1 (z) =

c1 (z)
,
(z z1 ) (z zk )

onde c0 e c1 sao funcoes inteiras de z (para que um certo za seja de fato singular simples e necessario
que c0 nao tenha um zero de ordem 2 em za e c1 nao tenha um zero de ordem 1 em za ). Obtemos disso
que
2
w k2 c1 (1/w)
w 2k4 c0 (1/w)
e
b
(w)
=

.
b0 (w) =
1
(1 wz1 )2 (1 wzk )2
w (1 wz1 ) (1 wzk )

Como funcoes inteiras, c0 e c1 possuem expansoes de Taylor centradas em 0

c0 (z) =

(n)
0 z n

c1 (z) =

n=0

as quais convergem para todo z

b0 (w) =

(n)
0

n=0

(n)

1 z n

n=0

e, portanto,

1
w n+42k

)2

(1 wz1 (1 wzk

)2

b1 (w) =

(n)

w n+2k

2
n=0

.
w (1 wz1 ) (1 wzk )

Perguntemo-nos agora sob quais circunstancias o infinito e tambem no maximo um ponto singular
simples da equacao. Para tal, b0 deve ter no maximo um polo de ordem 2 e b1 no maximo um polo de
1
1
ordem 1 em w = 0. Como as funcoes (1wz1 )2 (1wz
ao analticas em w = 0 e nao
2 e (1wz )(1wz ) s
1
k)
k
se anulam nesse ponto, conclumos que a condicao procurada exige que w 2k4 c0 (1/w) tenha no maximo
um polo de ordem 2 em w = 0 e w k2 c1 (1/w) tenha no maximo um polo de ordem 1 em w = 0. Agora,
w

2k4

c0 (1/w) =

(n)
0

n=0

(n)

donde conclumos que 0

1
w n+42k

k2

(n)

2k2
X

(n)

0 z n

(n)

n=0

= 0 para todo n > 2k 2 e 1

c0 (z) =

c1 (1/w) =

w n+2k

= 0 para todo n > k 1. Assim,

c1 (z) =

n=0

k1
X

(n)

1 z n ,

n=0

que sao polinomios de grau menor ou igual a 2k 2 e k 1, respectivamente. Para a versao no infinito
da equacao diferencial teremos nesse caso

b0 (w) =

2k2
X
n=0

(n)

1
w n+42k

(1 wz1 )2 (1 wzk )2

n2k2n

2k2
X

(2k2n)

w n2

n=0

(1 wz1 )2 (1 wzk )2

(7.89)

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

378/1304

b1 (w)

k1
X

(n)

w n+2k

2
n=0

w (1 wz1 ) (1 wzk )

2(1 wz1 ) (1 wzk )

k1
X

k1
X

(n)

n=0

w n+1k

w(1 wz1 ) (1 wzk )


2(1 wz1 ) (1 wzk )

nk1n

(k1n)

n=0

wn
.

w(1 wz1 ) (1 wzk )

(7.90)

Das expressoes (7.89) e (7.90) podemos identificar as condicoes para que b 0 (w) e b1 (w) sejam regu1
lares em w = 0, ou seja, para que o infinito seja um ponto regular de (7.96): como (1wz1 )2 (1wz
2
k)
1
e (1wz1 )(1wzk ) sao analticas em w = 0 e nao se anulam nesse ponto, para que b0 (w) e b1 (w) se2k2
X (2k2n)
jam regulares em w = 0 e necessario e suficiente que
0
w n2 seja analtica em w = 0 e
n=0

2(1 wz1 ) (1 wzk )

k1
X

(k1n)

w n seja analtica em w = 0 (o que sempre e o caso) e tenha um

n=0

zero de ordem pelo menos 1 nesse ponto (observar o fator w no denominador de (7.90)).
(2k3)

(2k2)

Para a primeira condicao e necessario e suficiente que 0


= 0
= 0 (se k = 1, e necessario
(0)
(k1)
e suficiente que 0 = 0). Para a segunda condicao, e necessario e suficiente que 1
= 2.
Analisando alguns casos explcitos
Vamos analizar explicitamente os casos k = 1, k = 2 e k = 3.
1. Caso k = 1. Nesse caso, para que (7.84) seja Fuchsiana com no maximo um ponto singular
simples no infinito e em z1 , temos que c0 e c1 devem ser polinomios e grau zero (ou seja, constantes)
e (7.84) e da forma
!
!
(0)
(0)

1
0
y 0 (z) +
y(z) = 0 ,
(7.91)
y 00 (z) +
z z1
(z z1 )2
cuja versao no infinito e
(0)

u00 (w) +

2 1 2wz1
w(1 wz1 )

(0)

u0 (w) +

0
2
w (1 wz1 )2

u(w) = 0 .
(0)

(0)

O ponto z1 e um ponto singular simples (exceto no caso trivial em que 1 = 0 = 0, quando


z1 e um ponto regular). Note que (7.91) e uma equacao de Euler.

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

(0)

379/1304

(0)

Para que o infinito seja regular e necessario e suficiente que 0 = 0 e 1 = 2. Compare com a
discussao sobre a equacao de Euler a` pagina 364. Conclumos que a equacao de Euler




2z1
2
0
00
00
y (z) = 0 , cuja versao no infinito e u (w)
u0 (w) = 0 ,
y (z) +
z z1
1 wz1
(7.92)
e a u
nica equacao Fuchsiana com um u
nico ponto singular, a saber z1 . Essa expressao generaliza
(7.88) e a ela se reduz para z1 = 0. Como vimos em (7.87), a equacao y 00 (z) = 0 e a u
nica equacao
Fuchsiana com um u
nico ponto singular no infinito.
Note-se que a equacao y 00 (z) = 0 e sua versao no infinito u00 (w) + 22 u0 (w) = 0 (vide (7.87))
sao obtidas formalmente de (7.92) tomando-se o limite |z1 | . Tal processo e por vezes
denominado confluencia de singularidades e sera reencontrado quando tratarmos da relacao entre
a equacao hipergeometrica e a equacao hipergeometrica confluente (vide discussao do comeco da
Secao 8.2.7, pagina 447).
(0)

(0)

A equacao de Euler (7.91) com 0 6= 0 ou 1 6= 2 e a u


nica equacao Fuchsiana com dois pontos
singulares simples, um em z1 e o segundo no infinito. Logo abaixo veremos a forma geral das
equacoes Fuchsianas com com dois pontos singulares simples finitos.
2. Caso k = 2. Nesse caso, para que (7.84) seja Fuchsiana com no maximo pontos singulares
simples em z1 , z2 e no infinito, c0 e c1 devem ser polinomios de grau menor ou igual a 2 e 1,
respectivamente e (7.84) deve ser da forma
!
!
(0)
(1)
(2) 2
(0)
(1)

z
+

z
0
0
0
1
1
y 0 (z) +
y 00 (z) +
y(z) = 0 .
(7.93)
(z z1 )(z z2 )
(z z1 )2 (z z2 )2
Os pontos z1 e z2 serao pontos singulares simples desde que os dois polinomios dos numeradores
dos coeficientes nao tenham zeros de ordem 1 ou 2, respectivamente, nesses pontos. Por exemplo,
(0)
(1)
(0)
(1)
(2)
se 1 + 1 z = (z z2 ) e 0 + 0 z + 0 z 2 = (z z2 )2 a equacao torna-se





0
00
y (z) +
y(z) = 0 ,
y (z) +
(z z1 )
(z z1 )2

que tem a mesma forma da equacao de Euler (7.91), a qual, como vimos, e a u
nica equacao
Fuchsiana com um u
nico ponto singular finito, a saber z1 (e eventualmente um outro no infinito).
(1)

Voltando a (7.93), para que o ponto no infinito seja regular e necessario e suficiente que 0 =
(2)
(1)
0 = 0 e 1 = 2. Assim, a forma geral da equacao Fuchsiana com no maximo dois pontos
singulares simples finitos z1 e z2 e regular no infinito e
!
!
(0)
(0)
0
1 + 2z
0
00
y (z) +
y(z) = 0 .
y (z) +
(z z1 )(z z2 )
(z z1 )2 (z z2 )2
(0)

(0)

Se escolhermos 1 = 2z2 e 0 = 0 o ponto z2 deixa de ser singular e essa equacao reduz-se a


(7.92).
(1)

(2)

(1)

A equacao (7.93) com 0 6= 0 ou 0 6= 0 ou 1 6= 2 e a u


nica equacao Fuchsiana com um ponto
singular simples no infinito e com no maximo dois pontos singulares simples finitos, em z1 e z2 .
Mais adiante mostraremos que uma tal equacao sempre pode ser transformada em uma equacao
hipergeometrica.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

380/1304

3. Caso k = 3. Nesse caso, para que (7.84) seja Fuchsiana com no maximo pontos singulares
simples em z1 , z2 , z3 e no infinito, c0 e c1 devem ser polinomios de grau nenor ou igual a 4 e 2,
respectivamente e (7.84) deve ser da forma

4
X
(n) n
!
0 z

(0)
(1)
(2) 2

z
+

z
n=0
1
1
1
00
0
y(z) = 0 . (7.94)
y (z) +
y (z) +

2
2
2
(z z1 )(z z2 )(z z3 )
(z z1 ) (z z2 ) (z z3 )
Os pontos z1 , z2 e z3 serao singulares simples se os dois polinomios dos numeradores dos coeficientes acima nao possuirem neles zeros de ordem 1 ou 2, respectivamente.
(3)

(4)

Para que o ponto no infinito seja regular e necessario e suficiente que 0 = 0 = 0 e que
(2)
1 = 2. Nesse caso, (7.94) assume a forma
!
!
(0)
(1)
(2) 2
(0)
(1)
2

z
+

z
+
2z
0
0
0
1
1
y 0 (z) +
y(z) = 0 . (7.95)
y 00 (z) +
(z z1 )(z z2 )(z z3 )
(z z1 )2 (z z2 )2 (z z3 )2
Mais adiante mostraremos que, assim como a equacao (7.93), que tambem tem tres pontos singulares simples, esta equacao tambem pode ser transformada em uma equacao hipergeometrica.
(3)

(4)

(2)

Se 0 6= 0, 0 6= 0 ou 1 6= 2, o infinito sera um ponto regular simples de (7.94).


A forma geral das equacoes Fuchsianas com tres pontos singulares simples (7.93) e (7.95) foi primeiramente estudada por Papperitz15 e especialmente por Riemann16 , o qual demonstrou diversos fatos
relevantes sobre essas equacoes. Sobre esses desenvolvimentos falaremos mais adiante na Secao 7.8.3.
*
Para futura referencia capturamos os diversos resultados obtidos ate agora na seguinte proposicao:
Proposi
c
ao 7.5 Para a equaca
o diferencial linear de segunda ordem no plano complexo
y 00 (z) + a1 (z)y 0 (z) + a0 (z)y(z) = 0

(7.96)

valem as seguintes afirmaco


es:
I. A equaca
o (7.96) sempre possui ao menos um ponto singular (eventualmente no infinito).
II. Para que (7.96) seja Fuchsiana e tenha apenas uma singularidade simples no infinito e necess
ario
2 0
00
00
e suficiente que seja da forma y (z) = 0, cuja vers
ao no infinito e u (w) + w u (w) = 0.
III. Para que (7.96) seja Fuchsiana, tenha apenas uma singularidade simples em z 1 e seja regular no
infinito e necess
ario e suficiente que seja da forma


2
2
00
u0 (w) = 0 .
y (z) +
y 0 (z) = 0 ,
cuja vers
ao no infinito e u00 (w)
z z1
w(1 wz1 )
15
16

Erwin Johannes Papperitz (1857-1938).


Georg Friedrich Bernhard Riemann (1826-1866).

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

381/1304

IV. Para que (7.96) seja Fuchsiana, tenha uma singularidade simples no infinito e tenha no m
aximo
singularidades simples nos pontos z1 , . . . , zk (com k 1) e necess
ario e suficiente que a0 e a1
sejam da forma

a0 (z) =
(2k3)

2k2
X

k1
X

(n)

0 z n

n=0

(z z1 )2 (z zk )2

n=0

a1 (z) =

(2k2)

(n)

1 z n

(z z1 ) (z zk )

(0)

(k1)

onde ou 0
6= 0 ou 0
6= 0 (caso k = 1, basta 0 6= 0) ou que 1
infinito de (7.96) e nesse caso

6= 2. A vers
ao no

u00 (w) + b1 (w)u0 (w) + b0 (w)u(w) = 0 ,


com

2k2
X

(2k2n)

w n2

n=0

b0 (w) =
e

2(1 wz1 ) (1 wzk )

b1 (w) =

(7.97)

(1 wz1 )2 (1 wzk )2
k1
X

(k1n)

wn

n=0

w(1 wz1 ) (1 wzk )

(7.98)

V. Para que (7.96) seja Fuchsiana e tenha no m


aximo singularidades simples nos pontos z 1 , . . . , zk
(2k3)
(2k2)
(com k 1), sendo regular no infinito, e necess
ario e suficiente que 0
= 0
= 0 (caso
(0)
(k1)
k = 1, que 0 = 0) e que 1
= 2, ou seja, e necess
ario e suficiente que

a0 (z) =

(z

2k4
X

(n)
0 z n

n=0
z1 )2 (z

zk

)2

a1 (z) =

k2
X

(n)

1 z n + 2z k1

n=0

(z z1 ) (z zk )

em cujo caso temos para a vers


ao no infinito

b0 (w) =
e

b1 (w) =

2k2
X

(2k2n)

w n2

n=2

(1 wz1 )2 (1 wzk )2
i

2 (1 wz1 ) (1 wzk ) 1

k1
X
n=1

w(1 wz1 ) (1 wzk )

(k1n)

wn
.
2

JCABarata. Curso de Fsica-Matem


atica

7.8.3

Captulo 7

Vers
ao de 29 de setembro de 2005.

382/1304

Smbolos de Riemann. Simetrias de Equa


co
es Fuchsianas de Segunda Ordem

Para continuarmos nossa discussao precisamos introduzir a importante nocao de ndices de uma equaca
o
diferencial em um ponto do plano complexo.
Indices de uma equa
c
ao diferencial em um ponto
Seja a equacao diferencial Fuchsiana (7.84) e seja . Sejam definidos os n
umeros complexos
p := lim (z )2 a0 (z)
z

q := lim (z )a1 (z) .

(7.99)

O polinomio de segundo grau


P () := 2 + (q 1) + p
e denominado polin
omio indicial da equacao diferencial Fuchsiana (7.84) em e seus zeros
p
p
2 4p
(q

1)
(q 1)2 4p
1

q
+

=
+
=

2
2

(7.100)

sao denominados ndices da equacao diferencial Fuchsiana (7.84) em .


A relevancia dessas nocoes e a seguinte. Se e um ponto singular simples da equacao diferencial
Fuchsiana (7.84), entao, para |z | pequeno a mesma pode, pela definicao de p e q , ser aproximada
pela equacao
p
q 0
y (z) +
y(z) = 0
y 00 (z) +
z
(z )2
+

que e uma equacao de Euler, cuja solucao geral e da forma (z ) + (z ) caso +


6= ou
+

ao constantes arbitrarias.
da forma (z ) + (z ) ln(z ) caso +
= . Aqui e s

Por outro lado, se e um ponto regular da equacao Fuchsiana, entao, pela definicao, p = q = 0

e teremos +
cao, na regiao onde |z | e pequeno pode ser aproximada pela
= 1, = 0. A equa
+

equacao y 00 (z) = 0, cuja solucao geral e da forma (z ) + , ou seja, da forma (z ) + (z ) ,


onde novamente e sao constantes arbitrarias.
Aprendemos, assim, que os ndices fixam as solucoes da equacao diferencial Fuchsiana (7.84) em
uma vizinhanca pequena de um ponto , quer esse ponto seja singular simples ou regular.
Para o ponto no infinito podemos, analogamente, definir ndices. A versao no infinito de (7.84) e,
como visto, dada por (7.85)-(7.86) Definimos, entao p e q por
p := lim w 2 b0 (w)
w0

q := lim wb1 (w)


w0

(7.101)

ou seja (por (7.86)),


p := lim w 2 a0 (1/w) = lim z 2 a0 (z)

(7.102)

q := 2 lim w 1 a1 (1/w) = 2 lim za1 (z) .

(7.103)

w0

e
w0

|z|

|z|

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

383/1304

Com isso definimos o polinomio indicial P () := 2 + (q 1) + p , cujos zeros sao


p
p
2 4p
1

q
+
(q

1)
(q 1)2 4p

.
+
=
=
2
2

(7.104)

Estes sao os ndices da equacao diferencial Fuchsiana (7.84) no infinito.


Indices e equa
co
es Fuchsianas
Vimos paginas acima (vide, em especial, Proposicao 7.5, pagina 380) que uma equacao diferencial
linear de segunda ordem como (7.84) tera no maximo k singularidades simples17 nos pontos finitos
z1 , . . . , zk , sendo regular no infinito, se e somente se a0 e a1 forem da forma

a0 (z) =

(z

2k4
X

(n)
0 z n

n=0
z1 )2 (z

zk

)2

a1 (z) =

k2
X

(n)

1 z n + 2z k1

n=0

(z z1 ) (z zk )

(7.105)

Para que a equacao seja singular simples no infinito e tenha no maximo k 1 singularidades simples
nos pontos finitos z1 , . . . , zk1 e necessario e suficiente que

a0 (z) =
(2k5)

onde ou 0

2k4
X

(z z1

(n)
0 z n

n=0
)2 (z

(2k4)

6= 0 ou 0

zk1

)2

(k2)

6= 0 ou que 1

a1 (z) =

k2
X

(n)

1 z n

n=0

(z z1 ) (z zk1 )

(7.106)

6= 2.

Em ambos os casos ha no maximo k singularidades, incluindo eventualmente uma no infinito.


Chama a atencao o fato de que em ambos os casos a0 depende de 2k 3 constantes livres (as constantes
(n)
(n)
0 , n = 0, . . . , 2k 4), enquanto que a1 depende de k 1 constantes livres (as constantes 1 ,
n = 0, . . . , k 2). Assim, para no maximo k singularidades simples a equacao depende de 3k 4
constantes livres.
Uma questao importante, cuja relevancia sera discutida mais adiante, e saber sob quais circunstancias
essas 3k 4 constantes podem ser inteiramente determinadas pelos ndices das singularidades simples.
Essa questao foi proposta a estudada originalmente por Riemann e, para responde-la, precisamos contar
quantos sao os ndices independentes numa situacao de no maximo k singularidades simples. Como ha
dois ndices para cada singularidade, haveria em princpio um total de 2k ndices independentes mas,
em verdade, ha apenas 2k 1. Isso se deve a fato expresso no seguinte lema.
Lema 7.1 Se a equaca
o Fuchsiana (7.84) possui no m
aximo k singularidades simples em z 1 , . . . , zk
(k 2), sendo regular no infinito, vale
k
X
l=1

17

Assumiremos aqui que k 2.

(+
zl + zl ) = k 2

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

384/1304

Se a equaca
o Fuchsiana (7.84) tem no m
aximo k 1 singularidades simples em z 1 , . . . , zk1 (k 2),
tendo tambem uma singuaridade simples no infinito, ent
ao tambem vale
+

k1
X

+
zl + zl

l=1

= k2.

ao, pela definica


o (7.99), pzl = qzl = 0, o que implica que +
Se (7.84) e regular em zl ent
zl = 1 e

zl = 0 e, portanto, que zl + zl = 1. Assim, se (7.84) possui exatamente j singularidades simples


(incluindo eventualmente uma no infinito), ent
ao a soma de todos o ndices desses pontos singulares e
igual a j 2
2
Prova. Ha dois casos a considerar: 1o os k pontos singulares simples sao finitos z1 , . . . , zk ; 2o o infinito
e um ponto singular simples e ha k 1 pontos singulares simples finitos z1 , . . . , zk1 .

1o caso. Por (7.100), +


zl + zl = 1 qzl e, portanto,

k
X

(+
zl + zl ) = k

k
X

qzl . Pela definicao em

l=1
l=1
P
(7.99), qzl e o resduo da funcao a1 em zl e, portanto, kl=1 qzl e a soma de todos os resduos de a1 em
seus pontos singulares z1 , . . . , zk . Como esses sao todos os pontos singulares de a1 , conclumos pelo
I
k
X
1
qzl =
teorema dos resduos que
a1 (z)dz, onde C e uma curva fechada orientada no sentido
2i C
l=1
anti-horario que contem todos os pontos z1 , . . . , zk na regiao que delimita. Por simplicidade adotamos
C como sendo um crculo de raio R grande o suficiente. Por (7.105),

1
2i

a1 (z) dz =
C

k2
X

(n)
1

n=0

1
2i

zn
1
dz + 2
(z z1 ) (z zk )
2i

z k1
dz; .
(z z1 ) (z zk )

H
zn
dz sao aproximadas para R
Para n = 1, . . . , k 2, as integrais C (zz1 )(zz
k)
H nk
H
H
k1
inf ty por C z dz = 0. Para R a integral C (zz1z)(zzk ) dz e aproximada por C z 1 dz = 2i.
k
X
Pk

Conclumos que l=1 qzl = 2 e, portanto, (+


zl + zl ) = k 2.
l=1

2 caso. O tratamento aqui e analogo. Novamente


k1

k1
X

qzl e novamente

Pk1
l=1

+
zl

zl

= 1 q zl

k1
X

e, portanto,
(+
zl + zl ) =
l=1

qzl e a soma dos resduos de a1 em suas singularidades finitas, que

Hl=1
1
vale 2i
a (z)dz, onde C e uma curva fechada orientada no sentido anti-horario que contem todos
C 1
os pontos z1 , . . . , zk na regiao que delimita. Por simplicidade adotamos C como sendo um crculo de
raio R grande o suficiente. Por (7.106)
I

a1 (z) dz =
C

k2
X
n=0

(n)
1

zn
dz ,
(z z1 ) (z zk1 )

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Para R as integrais acima sao aproximadas pelas integrais


Pk1
(k1)
quando n = k 1, quando vale 2i. Assim, l=1
qzl = 1
.

Captulo 7

z nk+1 dz, as quais sao nulas, exceto


(k1)

Agora, por (7.104), +


+ = 1 q e por (7.103) e (7.106), q = 2 1
(k1)
1 + 1
e, portanto,

Isso completa a prova.

k1
X
l=1

+
zl

zl

k1

(k1)
1

385/1304

1+

(k1)
1

. Assim, +
+ =

= k2.

Retomando a` discussao do paragrafo que antecede ao enunciado do lema acima, vimos que a equacao
Fuchsiana (7.84) possui 3k 4 parametros livres e 2k 1 ndices independentes. Conclumos que se
3k 4 2k 1, ou seja, se k 3, e possvel escrever todos os parametros livres em termos dos ndices.
As situacao interessante, portanto, e aquela em que se tem no maximo tres pontos singulares simples
(incluindo, eventualmente, um no infinito). Nela, a equacao Fuchsiana (7.84) e totalmente determinada
pelos ndices de suas singularidades simples e, portanto, assim sao suas solucoes. Essa conclusao foi
primeiramente obtida por Riemann por volta de 185718 . Como os ndices de uma singularidade estao
relacionados a` monodromia em torno da mesma, Riemann colocou a questao de sob quais condicoes
existe uma equacao Fuchsiana com pontos singulares e monodromias pre-determinados. Essa questao
despertou o interesse de Hilbert por volta de 1905, passando a ser conhecida como problema de RiemannHilbert. Alem de Hilbert, contribuiram para o estudo desse problema nomes como Birkhoff 19 , Plemelj20
e outros.
Equa
co
es Fuchsianas com tr
es singularidades
Como discutimos acima, ha um interesse especial na equacao Fuchsiana (7.84) com tres singularidades pois a mesma possui cinco parametros livres e tambem cinco ndices independentes associados
a`s tres pontos singulares (lembremos que, pelo Lema 7.1, a soma dos seis ndices deve ser igual a 1).
Portanto, deve ser, em princpio, possvel expressar univocamente esses cinco parametros em termos
dos ndices. Vamos mostrar que isso de fato e verdade. Para k = 3 e singularidades simples apenas nos
pontos finitos z1 , z2 e z3 , (7.84) assume a forma.
!
!
(0)
(1)
(0)
(1)
(2) 2
2

z
+
2z

z
+

z
1
1
0
0
0
y 00 (z) +
y 0 (z) +
y(z) = 0
(7.107)
(z z1 )(z z2 )(z z3 )
(z z1 )2 (z z2 )2 (z z3 )2
e para singularidades simples apenas no pontos finitos z1 , z2 e uma no infinito, (7.84) assume a forma
!
!
(0)
(1)
(0)
(1)
(2) 2
1 + 1 z
0 + 0 z + 0 z
y 00 (z) +
y 0 (z) +
y(z) = 0
(7.108)
(z z1 )(z z2 )
(z z1 )2 (z z2 )2
18

G. F. B. Riemann, Beitr
age zur Theorie der durch die Gausssche Reihe F (, , , x) darstellbaren Functionen. Abhandlungen der K
oniglichen Gesellschaft der Wissenschaften zu G
ottingen, 7, 3-32 (1857). G. F. B. Riemann,
Beitr
age zur Theorie der durch die Gausssche Reihe F (, , , x) darstellbaren Functionen. G
ottinger Nachrichten,
6-8 (1857).
19
George David Birkhoff (1884-1944).
20
Josip Plemelj (1873-1967).

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

386/1304

(1)

com 1 6= 2.

No caso (7.107) podemos escrever, de acordo com (7.99) e (7.105), para l = 1, . . . , 3,


! 3
! 3
1
2
X
Y
X
Y
1
1
(n)
(n)
n
2

(z
)
+
2(z
)
,
q
=
.
0 (zl )n
p zl =
l
l
zl
1
2
(z

z
)
(z

z
)
l
a
l
a
a=1
a=1
n=0
n=0

(7.109)

a6=l

a6=l

Como

+
zl + zl = 1 q zl

+
z l z l = p z l ,

(7.110)

vemos que as u
ltimas equacoes podem ser escritas como

+
z l z l

3
Y
a=1
a6=l

(zl za ) =

2
X

(n)
0 (zl )n

n=0

zl

l :=

+
zl

3
Y
a=1
a6=l

(zl za ) =

1
X

(n)

1 (zl )n + 2(zl )2 .

n=0

Definindo

l := +
z l z l

3
Y
a=1
a6=l

(zl za )2


1 +
zl zl

3
Y
a=1
a6=l

(zl za ) ,

para l = 1, 2, 3, as u
ltimas relacoes podem ser escritas em forma matricial

(0)

(0)
0
1
1 z1 (z1 )2
1
1 z1 (z1 )2
1
(1)
2 (1)
2 = 1 z2 (z2 )2

1
z
(z
)
e
=
.
0
2
2
2
1
2
2
(2)
3
1 z3 (z3 )
3
1 z3 (z3 )
2
0

1 z1 (z1 )2
A matriz Z := 1 z2 (z2 )2 e uma matriz de Vandermonde21, e seu determinante e
1 z3 (z3 )2
det(Z) =

1a<b3

(zb za ) = (z3 z2 )(z3 z1 )(z2 z1 ) ,

que e nao-nulo (pois os pontos z1 , z2 e z3 sao distintos). Portanto, Z possui uma inversa, o que permite
(n)
(n)
expressar univocamente os 0 s e 1 s em termos dos l s e l s e, portanto, em termos dos
zl s. O
caso de (7.108) e analogo.
Smbolos de Riemann
Como vemos, e possvel expressar univocamente a equacao Fuchsiana com tres singularidades (7.84)
em termos de z1 , z2 , z3 e seus ndices. Em seus trabalhos de 1857 (vide nota-de-rodape 18, pagina 385)
Riemann introduziu uma notacao para representar esquematicamente a dependencia da equacao (7.84)

com os pontos singulares z1 , z2 , z3 e seus respectivos ndices


z 1 , z 2 e z 3 .
21

Alexandre-Theophile Vandermonde (1735-1796).

JCABarata. Curso de Fsica-Matem


atica

Segundo Riemann o esquema

Vers
ao de 29 de setembro de 2005.

z1

z2

z3

+
+
y = P +
z 1 z 2 z 3 z ,

Captulo 7

387/1304

(7.111)

z 1 z 2 z 3

lembrando que, pelo Lema 7.1,

+
z1 + z1 + z2 + z2 + z3 + z3 = 1

(7.112)

representa uma equacao para Fuchsiana para y com tres singularidades. As tres primeiras colunas
contem os pontos singulares e os respectivos ndices (os pontos singulares sao dispostas na primeira
linha). A quarta coluna contem apenas a variavel da equacao.
tambem permitido que uma das singularicades seja o ponto no infinito, em cujo caso o smbolo
E
de Riemann para singularidades finitas em z1 e z2 fica

z1 z2

+
+
(7.113)
y = P +
z 1 z 2 z ,

z 1 z 2

sendo que, pelo Lema 7.1,

+
z1 + z1 + z2 + z2 + + = 1 .

(7.114)

Os esquemas (7.111) e (7.113) sao denominados smbolos de Riemann. Lembremos que as relacoes
(7.112) ou (7.114) sempre devem ser satisfeitos pelos ndices.
Os smbolos de Riemann podem expressar diversar simetrias, algumas triviais, outras nao, das
equacoes Fuchsianas com tres pontos singulares. Por exemplo, os smbolos de Riemann sao invariantes
por permutacao das tres primeiras colunas, expressando o fato obvio de as equacoes Fuchsianas com
tres singularidades nao mudarem quando trocamos simultaneamente as singularidades e seus ndices.
Os smbolos de Riemann sao tambem invariantes por permutacao independente das duas u
ltimas linhas
em cada uma das tres primeiras colunas, expressando o fato obvio de que as equacoes Fuchsianas com
tres singularidades dependem do par de ndices associado a cada singularidade, mas nao da forma como
estes sao ordenados.
Equa
c
ao de Riemann-Papperitz
Com o exposto acima, vemos que e possvel expressar a equacao Fuchsiana com tres singularidades
(7.84) em termos de z1 , z2 , z3 e seus ndices. O que se obtem, apos algum esforco algebrico um tanto
tedioso, sao as seguintes expressoes:

qz1
qz2
qz3
y (z) +
y 0 (z)
+
+
z z1 z z2 z z3


pz1 (z1 z2 )(z1 z3 ) pz2 (z2 z3 )(z2 z1 ) pz3 (z3 z1 )(z3 z2 )
1
+
y(z)
+
+
(z z1 )(z z2 )(z z3 )
z z1
z z2
z z3
00

= 0 , (7.115)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

388/1304

ou seja, por (7.110),


1 +
1 +
1 +
z1 z1
z2 z2
z3 z3
y (z) +
+
+
y 0 (z)
z z1
z z2
z z3
00

+
+
+
z1 z1 (z1 z2 )(z1 z3 )
z2 z2 (z2 z3 )(z2 z1 )
z3 z3 (z3 z1 )(z3 z2 )
+
+

z z1
z z2
z z3

y(z)
+

(z z1 )(z z2 )(z z3 )
= 0 . (7.116)

Essa u
ltima expressao e a representacao explcita do esquema de Riemann

z1

z2

z3

+
+
y = P +
z 1 z 2 z 3 z .

z 1 z 2 z 3

A expressao (7.116) foi encontrada primeiramente por Papperitz22 em 188523 , e e denominada


equaca
o de Papperitz, equaca
o de Riemann ou ainda equaca
o de Riemann-Papperitz.
E. 7.32 Exerccio. Obtenha as expressoes (7.115) e (7.116).

22
23

Erwin Johannes Papperitz (1857-1938).


Portanto, ap
os os trabalhos seminais de Riemann de 1857. Se Riemann a conhecia, n
ao a escreveu explicitamente.

JCABarata. Curso de Fsica-Matem


atica

7.9

Vers
ao de 29 de setembro de 2005.

Captulo 7

389/1304

Exerccios Adicionais

E. 7.33 Exerccio. Seja A uma matriz n n diagonalizavel e seja


A =

r
X

k E k

k=1

sua representacao espectral, onde


ao seus autovalores distintos e Ek sao seus projetores espectrais
1 , . . . , r s
P
r
tais que Ea Eb = a, b Ea e = k=1 Ek . Mostre que
exp(A) =

r
X

e k E k .

k=1

6
E. 7.34 Exerccio. Seja a matriz
A1 =

2 0
3 7

a) Determine seu polinomio caracterstico e seus autovalores 1 e 2 . (Para fixar uma convencao adote
1 < 2 ).
b) Determine autovetores correspondentes a esses autovalores.
c) Determine uma matriz P que diagonaliza A1 , ou seja, a matriz P tal que D = P 1 A1 P =
diag (1 , 2 ).
d) D pode ser obviamente escrita como
D = 1 K1 + 2 K2 ,
onde
K1 =
Logo,

1 0
0 0

K2 =

A1 = 1 E1 + 2 E2 ,


0 0
.
0 1
(7.117)

onde Ea = P Ka P 1 , a = 1, 2.
e) Calcule explicitamente E1 e E2 e mostre que (7.117) e a representaca
oP
espectral de A 1 , ou seja,
mostre explicitamente que Ea sao projetores e satisfazem Ea Eb = a, b Ea e = rk=1 Ek .

f ) Os projetores E1 e E2 podem ser tambem calculados usando (3.33). Obtenha-os dessa forma e
compare os resultados.
g) Usando o Exerccio E. 7.33 calcule exp(tA1 ).

JCABarata. Curso de Fsica-Matem


atica

Captulo 7

Vers
ao de 29 de setembro de 2005.

390/1304

E. 7.35 Exerccio. Repita o mesmo exerccio para as matrizes








2 5i
3 0
3 0
A2 =
,
A3 =
,
A4 =
,
0 4
3 4
3i 4




2 i
4i 3 i
A5 =
,
A6 =
.
0 5
0
2
6
E. 7.36 Exerccio. Determine explicitamente a solucao do sistemas de equacoes lineares a coeficientes

constantes X(t)
= AX(t), com X(0) = X0 , para
a)
A =

A =

b)

c)
A =

d)


3 0
,
3 4

3 0
3i 4

2 1
1 2

A =

A =

0 i
i 0

A =

e)

f)

2 1
0 2

0 1
1 0

 
1
X0 =
.
2


,

 
1
X0 =
.
2
X0 =

1
2

 
1
X0 =
.
1

 
1
X0 =
.
3
X0 =

3
1

Descreva qualitativamente o retrato de fase de cada um dos sistemas acima.

E. 7.37 Exerccio. Determine explicitamente a solucao do sistemas de equacoes lineares a coeficientes

constantes X(t)
= AX(t) + B(t), com X(0) = X0 , para
a)

0 1 0
A = 1 0 0 ,
0 0 3

1
B(t) = sen (t) ,
cos(t)

X0 = 3 .
2

JCABarata. Curso de Fsica-Matem


atica

b)

2 1 0
A = 0 2 0 ,
0 0 3

E. 7.38 Exerccio.
equacoes
,

sen (t)
B(t) = t ,
cos(t)

391/1304

X0 = 3 .
2

Um sistema formado por duas populacoes p 1 (t) e p2 (t) evolui de acordo com as
p1 (t) = p1 (t) + p2 (t) ,

Captulo 7

Vers
ao de 29 de setembro de 2005.

p2 (t) = p1 (t) p2 (t) ,

a) Sabendo que p1 (0) = n1 e p2 (0) = n2 , determine p1 (t) e p2 (t) para t 0.

b) Que relacao e devem satisfazer para que tenhamos lim p1 (t) = lim p2 (t) = 0?
t

c) Determine lim p1 (t) e lim p2 (t) no caso = > 0.


t

E. 7.39 Exerccio. Seja Pn o espaco vetorial complexo (n + 1)-dimensional de todos os polinomios


d
complexos de grau menor ou igual a n. Seja D = dx
o operador de derivacao agindo em Pn .
a) Expresse D como uma matriz (n + 1) (n + 1) agindo na base {e 0 , . . . , en }, onde ek = xk /k!.

b) Mostre que D, agindo em Pn , e nilpotente.


c) Expresse exp(tD), t

, como matriz na base {e0 , . . . , en }.

d) Seja p(x) = a0 + a1 x + + an xn um elemento de Pn . Mostre que (exp(tD)p)(x) = p(x + t).


Sugest
ao. Mostre que isso e verdade para todos os elementos da base {e 0 , . . . , en }.
6
E. 7.40 Exerccio. As chamadas matrizes de Pauli sao definidas por






0 1
0 i
1
0
1 :=
,
2 :=
e
3 :=
.
i 0
0 1
1 0

(7.118)

a) Mostre que as mesmas satisfazem as seguintes relacoes algebricas: para todos a, b = 1, 2, 3 valem
[a , b ] := a b b a = 2i

3
X

abc c ,

(7.119)

c=1

{a , b } := a b + b a = 2ab ,
a b = ab + i

(7.120)
3
X

abc c .

(7.121)

c=1

Note que as matrizes de Pauli sao auto-adjuntas: i = i .


b) Mostre que as quatro matrizes , 1 , 2 , 3 formam uma base em Mat ( , 2): toda matriz complexa
2 2 pode ser escrita como uma combinacao linear das mesmas.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

392/1304

c) Mostre que as matrizes , 1 , 2 , 3 sao ortonormais em relacao ao seguinte produto escalar definido
em Mat ( , 2): hA, Bi := 21 Tr (A B).

d) Seja ~ := (1 , 2 , 3 ) um vetor de comprimento 1 de 3 , ou seja, k~k = 1. Seja, ~ ~ :=


1 1 + 2 2 + 3 3 , onde k sao as matrizes de Pauli, definidas acima. Mostre que

exp (i~ ~ ) = cos() + i sen () ~ ~ .


e) Obtenha a representacao espectral das matrizes de Pauli.

6
E. 7.41 Exerccio. Exiba pelo menos um exemplo de um par de matrizes quadradas A e B tais que
exp(A) exp(B) 6= exp(A + B).
6
E. 7.42 Exerccio.
I. Mostre que se A(t) sao matrizes complexas n n que comutam para ts diferentes, ou seja, tais que
A(t)A(t0 ) = A(t0 )A(t) para todos t e t0 , entao a serie de Dyson
Z tn1
Z t Z t1
X
D(t) := +

A(t1 )A(t2 ) A(tn ) dtn dtn1 dt1


n=1

pode ser escrita como D(t) = exp


II. Sejam R =

Z

A( ) d .
0


1 2
, e A(t) = tR. Compute D(t), t
0 1

E. 7.43 Exerccio. Seja a matriz


A =
onde ,

i
0
i

.


a) Determine seus auto-valores e seus projetores espectrais E 1 e E2 e escreva a matriz A na forma


espectral
A = 1 E1 + 2 E2 .

Mostre explicitamente que E1 e E2 satisfazem Ea Eb = a, b Ea e E1 + E2 = .


b) Determine explicitamente a matriz eAt , t

c) Determine explicitamente a solucao da equacao

X(t)
= AX(t) + G(t) ,

onde

X(t) =

x1 (t)
x2 (t)

G(t) =

eit
e

it

0
x1
X(0) = X0 = .
x02

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 7

393/1304

E. 7.44 Exerccio. Seja a matriz

A =
0
0
0

0
0
0

0
0

0
0
0

0
0

0
,

onde , , e sao numeros complexos. Calcule exp(tA), t

E. 7.45 Exerccio. Sejam

s1 (t)

S(t) = ...
sn (t)

y1 (t)

Y (t) = ... ,
yn (t)

e M uma matriz n n complexa de coeficientes constantes. Mostre que o sistema linear


Y (t) = M Y (t) + S(t)
com condicao inicial Y (0) = Y0 tem por solucao
Y (t) = e

Mt

Y0 +

e(tu)M S(u) du .
0

Captulo 8
Soluco
es de Equaco
es Diferenciais Ordin
arias
Lineares no Plano Complexo
Conte
udo
8.1

8.2

8.3

8.4

Solu
co
es em S
eries de Pot
encias para Equa
co
es Regulares . . . . . . . . . 395
8.1.1

A Equacao do Oscilador Harmonico Simples . . . . . . . . . . . . . . . . . . . 396

8.1.2

A Equacao de Legendre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 398

8.1.3

A Equacao de Hermite . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 401

8.1.4

A Equacao de Airy . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 404

8.1.5

A Equacao de Chebyshev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 406

8.1.6

O Caso de Equacoes Regulares Gerais . . . . . . . . . . . . . . . . . . . . . . 409

Solu
ca
o de Equa
co
es Singulares Regulares. O M
etodo de Frobenius . . . 411
8.2.1

Equacoes Singulares Regulares. O Caso Geral . . . . . . . . . . . . . . . . . . 415

8.2.2

A Equacao de Euler Revisitada . . . . . . . . . . . . . . . . . . . . . . . . . . 424

8.2.3

A Equacao de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 427

8.2.4

Equacoes Relacionadas a` de Bessel. A Equacao de Bessel Esferica . . . . . . 438

8.2.5

A Equacao de Laguerre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441

8.2.6

A Equacao Hipergeometrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443

8.2.7

A Equacao Hipergeometrica Confluente . . . . . . . . . . . . . . . . . . . . . 447

Algumas Equa
co
es Associadas . . . . . . . . . . . . . . . . . . . . . . . . . . 450
8.3.1

A Equacao de Legendre Associada . . . . . . . . . . . . . . . . . . . . . . . . 450

8.3.2

A Equacao de Laguerre Associada . . . . . . . . . . . . . . . . . . . . . . . . 452

A Fun
ca
o Gama. Defini
ca
o e Propriedades . . . . . . . . . . . . . . . . . . 453

8.A Prova da Proposi


ca
o 8.1. Justificando os Polin
omios de Legendre . . . . 470
8.B Provando (8.14) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 472
8.C Justificando os Polin
omios de Hermite . . . . . . . . . . . . . . . . . . . . . 474
8.D Provando (8.20) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 476
8.E Porque deve ser um Inteiro Positivo na Equa
ca
o de Laguerre
8.6

. . . . . 477

Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 480

rataremos no presente captulo de apresentar solucoes de equacoes diferenciais ordinarias


lineares e homogeneas, regulares ou com pontos singulares regulares. Por simplicidade, e
para atender ao interesse de problemas fsicos, trataremos apenas de equacoes de segunda
ordem mas, em essencia, tudo o que faremos facilmente se generaliza para equacoes de ordem
394

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

395/1304

superior. Nossa abordagem estara centrada no chamado metodo de expansao em serie de potencias
(para equacoes regulares) e no metodo de Frobenius (para equacoes com singularidades regulares).
Estudaremos tanto casos gerais (com razoavel detalhe) quanto equacoes particulares de interesse em
Fsica.
Em um certo sentido, o presente captulo da continuidade ao Captulo 7, mas dele so utilizaremos
os Teoremas 7.3 e 7.4, das paginas 358 e 361, respectivamente. Esses teoremas fundamentais sao as
justificativas dos metodos de solucao que empregaremos.
Comentamos ainda que trataremos as equacoes diferenciais como equacoes no plano complexo ainda
que, na Fsica, o interesse tipicamente resida em equacoes na reta real pois, como discutimos no Captulo
7, a natureza das solucoes e a justificativa dos metodos de solucao sao melhor entendidas quando
abandonamos as limitacoes da reta real de modo a explorar a estrutura analtica das equacoes e suas
solucoes.
Por vezes, omitiremos detalhes de calculos e o estudante e convidado a completa-los como exerccio.
Apesar de alguns desses calculos omitidos serem reconhecidamente entediantes (nao so os omitidos,
alias), o estudante devera faze-los ao menos uma vez na vida, pois nao e possvel apoderar-se do
conhecimento aqui desenvolvido apenas por meio de leitura passiva.
O tratamento que faremos de solucoes de equacoes gerais e bastante detalhado, um tanto mais do
que o por vezes encontrado na literatura. Os resultados gerais estao resumidos nos Teoremas 8.1 e 8.2,
adiante. O tratamento de certas equacoes particulares de interesse em Fsica (como as de Legendre,
Hermite, Airy, Chebyshev, Bessel e Laguerre) e razoavelmente completo e varias propriedades especiais das solucoes, tais como relacoes de ortogonalidade, relacoes de recorrencia, formulas do tipo de
Rodrigues, representacoes integrais etc. (todas importantes na resolucao de problemas de Fsica) sao
discutidas com detalhe no Captulo 9, pagina 483. Uma omissao e um estudo detalhado do comportamento assintotico de certas solucoes. Esperamos que futuramente essa lacuna possa ser completada.
Exemplos selecionados de problemas de Fsica onde algumas das equacoes particulares que discutimos se apresentam (e a conseq
uente resolucao desses problemas) poderao ser encontrados no Captulo
10, pagina 544, ao qual remetemos os estudantes interessados em adquirir um pouco de motivacao. A
leitura daquele captulo requer um conhecimento parcial das solucoes das equacoes diferenciais e suas
propriedades, de modo que o estudante devera alternar sua leitura com a do material que a precede
nos Captulos 8 e 9.
A Secao 8.4, pagina 453, contem um tratamento detalhado das propriedades mais relevantes da
funcao Gama de Euler.
Todas as equacoes particulares tratadas, suas solucoes e propriedades dessas solucoes, sao amplamente discutidas na vasta literatura pertinente e a ela remetemos os estudantes interessados. Vide,
por exemplo, [112], [136], [83], [4], [131], [23], [66], [67], [11], [27], [28], [39], [122], [64], [62]. Para uma
abordagem da teoria das funcoes especiais sob o ponto de vista de teoria de grupos, vide [129].

8.1

Solu
co
es em S
eries de Pot
encias para Equa
co
es Regulares

Vamos na presente secao ilustrar o Teorema 7.3 da pagina 358 estudando a solucao por serie de potencias
de algumas equacoes diferenciais ordinarias, homogeneas de segunda ordem e regulares de interesse

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

396/1304

(especialmente em Fsica). Boa parte dos metodos apresentados nos exemplos aplicam-se a equacoes
de ordem maior que dois, mas nao trataremos de tais generalizacoes aqui pois elas pouco apresentam
de especial e seu interesse na Fsica e reduzido.
Na Secao 8.2, pagina 411, ilustraremos o Teorema 7.4, pagina 361, tratando de forma semelhante
varias equacoes singulares regulares de interesse pelo metodo de Frobenius.
Conforme demonstramos em paginas anteriores (Teorema 7.3, pagina 358), se a equacao diferencial
linear homogenea de segunda ordem
y 00 (z) + a(z)y 0 (z) + b(z)y(z) = 0

(8.1)

for tal que os coeficientes a(z) e b(z) sao funcoes analticas de z em torno de um ponto z 0 , entao suas
solucoes serao igualmente analticas em torno desse ponto e poderemos procurar resolve-la em termos
de series de potencia centradas em z0 :
y(z) =

X
n=0

cn (z z0 )n .

(8.2)

O chamado metodo de serie de potencias consiste precisamente em inserir o Ansatz (8.2) na equacao
(8.1) e determinar recursivamente os coeficientes cn . Pelas conclusoes obtidas anteriormente, resumidas
no Teorema 7.3 da pagina 358, a solucao obtida deve ser convergente pelo menos no maior disco aberto
centrado em z0 no qual ambas as funcoes a(z) e b(z) sejam tambem analticas.
Ilustraremos a aplicacao desse metodo na resolucao da equacao do oscilador harmonico simples e
nas equacoes de Legendre, Hermite, Airy e Chebyshev, todas equacoes de interesse em Fsica. Ao final
discutiremos a solucao do problema geral.

8.1.1

A Equa
c
ao do Oscilador Harm
onico Simples

Por razoes pedagogicas, vamos comecar discutindo uma equacao diferencial bastante simples e familiar.
Seja a bem-conhecida equacao do oscilador harmonico simples
y 00 (z) + 02 y(z) = 0 ,

(8.3)

onde 0 e uma constante. Nesse caso P


a(z) = 0 e b(z) = 02 , ambas analticas em toda parte. Procuremos
n
acil ver que
entao uma solucao da forma y(z) =
n=0 cn z (com z0 = 0). E f
y 0 (z) =

ncn z n1 =

n=0

ncn z n1

nn+1

n=1

ou seja,
0

y (z) =

(n + 1)cn+1 z n ,

n=0

(n + 1)cn+1 z n

(8.4)

n=0

e que
00

y (z) =

X
n=0

n(n + 1)cn+1 z

n1

X
n=1

n(n + 1)cn+1 z

n1 nn+1

X
n=0

(n + 1)(n + 2)cn+2 z n ,

JCABarata. Curso de Fsica-Matem


atica

ou seja,
00

y (z) =

Vers
ao de 29 de setembro de 2005.

Captulo 8

397/1304

(n + 1)(n + 2)cn+2 z n .

(8.5)

n=0

Inserindo-se (8.4) e (8.5) em (8.3), obtem-se


h
X
n=0

i
(n + 1)(n + 2)cn+2 + 02 cn z n = 0 .

Como essa u
ltima relacao supostamente vale para todo z, tem-se forcosamente que os fatores entre
colchetes sao todos nulos (por que?):
(n + 1)(n + 2)cn+2 + 02 cn = 0 ,

ou seja,

cn+2 =

02
cn
(n + 1)(n + 2)

(8.6)

para todo n 0. A solucao dessa u


ltima equacao recursiva e
c2k =

(1)k 02k
c0 ,
(2k)!

c2k+1 =

(1)k 02k
c1 .
(2k + 1)!

com k 0. Essas expressoes relacionam todos os coeficientes cn com os dois primeiros coeficientes, c0
e c1 .
P
n
Inserindo isso na expressao y(z) =
n=0 cn z , tem-se
y(z) =

c2k z 2k +

k=0

= c0

c2k+1 z 2k+1 = c0

k=0

X
(1)k
k=0

(2k)!

(0 z)

= c0 cos(0 z) +

X
(1)k 2k
0

k=0

2k

(2k)!

z 2k + c1

X
(1)k 2k
0

k=0

(2k + 1)!

z 2k+1

c1 X (1)k
+
(0 z)2k+1
0 k=0 (2k + 1)!

c1
sen (0 z) .
0

Na u
ltima passagem pudemos identificar as duas series de potencias com as series de Taylor (em
torno de 0) das funcoes seno e co-seno. Notemos que em problemas menos simples, como os que
encontraremos adiante, nem sempre sera possvel identificar as series resultantes com as series de Taylor
de funcoes previamente conhecidas, o que nos conduzira a` definicao de novas funcoes, as chamadas
funco
es especiais.
de se notar que a solucao final, y(z) = c0 cos(0 z) + c1 sen (0 z), e analtica em toda a parte como
E
0
funcao de z, o que ja era esperado do fato de as funcoes a(z) e b(z) serem funcoes analticas em toda
parte (duas constantes).
Obtivemos, assim, a bem-conhecida solucao do oscilador harmonico simples em termos de uma
combinacao linear das funcoes seno e co-seno. Os coeficientes c0 e c1 podem ser determinados se mais
condicoes forem impostas a` solucao. Por exemplo, se impusermos condicoes iniciais y(0) = y 0 e
y 0 (0) = v0 , obtemos c0 = y0 e c1 = v0 .

JCABarata. Curso de Fsica-Matem


atica

8.1.2

Captulo 8

Vers
ao de 29 de setembro de 2005.

398/1304

A Equa
c
ao de Legendre

A equacao diferencial
(1 z 2 )y 00 (z) 2zy 0 (z) + ( + 1)y(z) = 0

(8.7)

e denominada equaca
o de Legendre1 de ordem2 . Em princpio, adotamos , arbitrario, mas na
maioria das aplicacoes em Fsica apenas valores especiais de sao considerados, a saber, e tomado
um inteiro nao-negativo.
A equacao de Legendre e uma parente proxima, a equacao de Legendre associada, tratada na Secao
8.3.1, pagina 450, surgem em varios problemas de Fsica, do Eletromagnetismo a` Mecanica Quantica.
Tipicamente ambas surgem quando da resolucao da equacao de Helmholtz pelo metodo de separacao
de variaveis em coordenadas esfericas em tres dimensoes. Vide Captulo 10, pagina 544.
A equacao de Legendre acima pode ser posta na forma padrao (8.1) com
a(z) =

2z
1 z2

b(z) =

( + 1)
.
1 z2

portanto,
Claramente, ambas as funcoes sao analticas emPum disco de raio 1 centrado em z 0 = 0. E,

legtimo procurarmos solucoes na forma y(z) = n=0 cn z n (com z0 = 0). Tais solucoes serao analticas
pelo menos no disco de raio 1 centrado em z0 = 0.
Inserindo-se (8.4)-(8.5) em (8.7), obtem-se

X
n=0

(n + 1)(n + 2)cn+2 z

facil ver que


E
I

(n + 1)(n + 2)cn+2 z

|n=0

n+2

{z

(n + 1)(n + 2)cn+2 z

n+2 nn2

n=0

X
n=2

(n + 1)cn+1 z

|n=0

n+1

{z

(n 1)n cn z

X
n=0

cn z n = 0 .

n=0

II

+( + 1)

(8.8)

(n 1)n cn z n ,

(8.9)

onde, na pen
ultima igualdade, fizemos a mudanca de variaveis n n 2 e, na u
ltima, acrescentamos
os termos com n = 0 e n = 1 por estes serem nulos. Analogamente,

X
II
(n + 1)cn+1 z n+1
n=0

nn1

ncn z

n=1

ncn z n ,

(8.10)

n=0

onde, na pen
ultima igualdade, fizemos a mudanca de variaveis n n 1 e, na u
ltima, acrescentamos
o termo com n = 0 por este ser nulo. Assim, (8.8) fica

X
n=0

1
2

(n + 1)(n + 2)cn+2 z n

X
n=0

(n 1)n cn z n 2

X
n=0

ncn z n + ( + 1)

cn z n = 0 ,

n=0

Adrien-Marie Legendre (1752-1833).


Aqui a palavra ordem n
ao deve ser confundida com a ordem da equaca
o diferencial, que e dois.

JCABarata. Curso de Fsica-Matem


atica

ou seja,

X
n=0

"

Captulo 8

Vers
ao de 29 de setembro de 2005.

399/1304

(n + 1)(n + 2)cn+2 (n 1)n + 2n ( + 1) cn z n = 0 .

Como (n 1)n + 2n = n(n + 1), obtemos o seguinte conjunto de equacoes




(n + 1)(n + 2)cn+2 n(n + 1) ( + 1) cn = 0 ,
n 0 .
Essas expressoes fornecem as seguintes equacoes recursivas para os coeficientes c n :
n(n + 1) ( + 1)
cn ,
(n + 1)(n + 2)

cn+2 =

n 0 .

(8.11)

De maneira analoga ao que ocorre no caso do oscilador harmonico simples (vide eq. (8.6)), podemos
expressar todos os coeficientes cn com n par em termos de c0 e todos os coeficientes cn com n mpar
em termos de c1 . Mais precisamente, tem-se
"
#

k1
k1 
1 Y
( + 1) Y
( + 1)
c2k =
2l(2l + 1) ( + 1) c0 =
1
c0 ,
(2k)!
2k
2l(2l + 1)
l=0

c2k+1

l=1

"
#

k1
k1 
Y
1 Y
( + 1)
1
(2l + 1)(2l + 2) ( + 1) c1 =
1
c1 .
=
(2k + 1)! l=0
2k + 1 l=0
(2l + 1)(2l + 2)

Para

generico conclumos que a solucao geral da equacao de Legendre e da forma


(0)

(1)

y(z) = c0 y (z) + c1 y (z) ,


onde

k1
X
z 2k Y
=
2l(2l + 1) ( + 1)
(2k)! l=0
k=0

(0)
y (z)

(1)
y (z)

X
k=0

k1
z 2k+1 Y
(2l + 1)(2l + 2) ( + 1)
(2k + 1)! l=0

(8.12)
!

(8.13)

Conforme comentamos, sabemos a priori que ambas as series acima convergem para |z| < 1. O que
ocorre caso |z| = 1? Isso e respondido na seguinte proposicao, cuja demonstracao encontra-se no
Apendice 8.A, pagina 470 (vide tambem [112] para uma outra prova semelhante):
Proposi
c
ao 8.1 Caso
n
ao seja um inteiro n
ao-negativo par, a serie em (8.12) diverge em
z = 1. Caso n
ao seja um inteiro positivo mpar, a serie em (8.13) diverge em z = 1.


Essa proposicao ensina-nos que as solucoes (8.12) e (8.13) da equacao de Legendre serao divergentes
em z = 1 caso nao seja um inteiro nao-negativo e isso para qualquer escolha de c 0 e c1 nao-nulos.
Em aplicacoes, porem, e muito importante ter-se solucoes finitas no intervalo fechado real [1, 1] de

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

400/1304

valores de z. A u
nica esperanca que resta reside na situacao na qual e um inteiro nao-negativo e, de
(0)
(1)
fato, podemos verificar que em tal caso y e finita se for par e que y e finita se for mpar.
Os Polin
omios de Legendre
Contemplando a expressao (8.12) facilmente constata-se que no caso em que = 2n, um inteiro
nao-negativo par, tem-se
!
n
k1
2k
X
Y
z
(0)
y2n (z) :=
2l(2l + 1) 2n(2n + 1) ,
(2k)!
k=0
l=0
que e um polinomio de grau 2n em z.
Analogamente, contemplando a expressao (8.13) facilmente se constata que no caso em que =
2n + 1, um inteiro positivo mpar, tem-se
!
k1
n
2k+1
X
Y
z
(1)
(2l + 1)(2l + 2) (2n + 1)(2n + 2) ,
y2n+1 (z) :=
(2k
+
1)!
l=0
k=0
que e um polinomio de grau 2n + 1 em z.
Assim, vemos que no caso de ser um inteiro nao-negativo a equacao de Legendre tem uma solucao
(0)
(1)
finita em toda a parte, a saber, o polinomio c0 y2n (z), caso = 2n, par, ou o polinomio c1 y2n+1 (z), caso
= 2n + 1, mpar. Definimos, entao,

!
m/2
k1

2k
Y
X

(0)

c0 y m
(z) = c0
2l(2l + 1) m(m + 1) ,
m par

(2k)!

l=0
k=0
Pm (z) :=
.
!

(m1)/2
k1

z 2k+1 Y

(1)

c
y
(z)
=
c
(2l + 1)(2l + 2) m(m + 1) , m mpar
1
1

(2k + 1)!
k=0

l=0

claro pela definicao acima que Pm e um polinomio de grau m e o coeficiente do monomio de maior
E
grau, z m , vale
!
m/21
1 Y
c0
2l(2l + 1) m(m + 1) , para m par
m! l=0
e

1
c1
m!

(m3)/2

Y
l=0

(2l + 1)(2l + 2) m(m + 1) ,

para m mpar.

Por razoes historicas, convenciona-se escolher c0 e c1 de modo que o coeficiente do monomio de maior
. Como facilmente se constata apos alguns calculos entediantes, isso
grau de Pm seja igual a 2m(2m)!
(m!)2
conduz a` seguinte expressao para os polinomios Pm (z):
Pm (z) :=

bm/2c

X
a=0

(1)a (2m 2a)!


z m2a ,
m
2 (m a)! (m 2a)! a!

(8.14)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

401/1304

onde bm/2c e o maior inteiro menor ou igual a m/2, ou seja,


m
2 , m par,
jmk
:=
m1
2
, m mpar.
2

A prova de (8.14) pode ser encontrada no Apendice 8.B, pagina 472.


E. 8.1 Exerccio. Tente provar (8.14) sem ler o Apendice 8.B.

A expressao (8.14) define os assim denominados polin


omios de Legendre de grau m, cada qual e
solucao da equacao de Legendre de ordem m
(1 z 2 )y 00 (z) 2zy 0 (z) + m(m + 1)y(z) = 0 ,
com m inteiro nao-negativo. Como comentamos, essa equacao possui, para cada m inteiro nao-negativo,
uma segunda solucao que e, porem, divergente para z 1.
Os quatro primeiros polinomios de Legendre sao
P0 (z) = 1 ,

1 3
P2 (z) = + z 2 ,
2 2

P1 (z) = z ,

3 5
P3 (z) = + z 3 ,
2 2

como facilmente se ve pela definicao acima.


Os polinomios de Legendre possuem varias propriedades importantes, tais como relacoes de ortogonalidade, formulas de recorrencia etc., as quais serao discutidas na Secao 9.2.1, pagina 495. Tambem
remetemos o estudante a` literatura pertinente supracitada.

8.1.3

A Equa
c
ao de Hermite

A equacao diferencial
y 00 (z) 2zy 0 (z) + y(z) = 0,

(8.15)

o de Hermite3 . Essa equacao e famosa por surgir em um problema


com e denominada equaca
basico da Mecanica Quantica, a saber, o problema do oscilador harmonico. Vide Secao 10.4, pagina
567. Comparando a` forma padrao (8.1), constatamos que aqui
a(z) = 2z

b(z) = .

Ambas essas funcoes sao analticas em todo o plano complexo e, pelo Teorema 7.3 da pagina 358, assim
serao as solucoes da equacao de Hermite, sendo que
encontra-las atraves de uma expansao
P podemos
n
em serie de potencias em torno de z0 = 0: y(z) =
c
z
.
n=0 n
Inserindo-se (8.4)-(8.5) em (8.15), obtem-se

X
n=0

X
X
n+1
+
cn z n = 0 .
(n + 1)(n + 2)cn+2 z 2
(n + 1)cn+1 z

Charles Hermite (1822-1901).

n=0

{z
II

n=0

(8.16)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

402/1304

A soma II pode ser escrita como em (8.10) e, assim, (8.16) fica

X
n=0

ou seja,

(n + 1)(n + 2)cn+2 z 2
h
X
n=0

ncn z +

n=0

cn z n = 0 ,

n=0

i
(n + 1)(n + 2)cn+2 + ( 2n) cn z n = 0 ,

para todo z , o que implica (n + 1)(n + 2)cn+2 + ( 2n) cn = 0, n 0. Disso conclumos que
cn+2 =

2n
cn ,
(n + 1)(n + 2)

n0.

(8.17)

Assim como no caso do oscilador harmonico simples e no caso da equacao de Legendre, os coeficientes
cn com n par sao proporcionais a c0 e os coeficientes cn com n mpar sao proporcionais a c1 . Mais
precisamente, tem-se

c2 = c0 ,
2

k1

c2k = c0

Y
(4l ) ,
(2k)!
l=1

k2,

c2k+1

Y
1
(4l 2 ) ,
= c1
(2k + 1)! l=1

k1.

Desta forma, chegamos a` seguinte solucao geral da equacao de Hermite:


(0)

(1)

y(z) = c0 y (z) + c1 y (z) ,


onde
(0)
y (z)

k1

k=2

l=1

X z 2k Y

:= 1 z 2
(4l ) ,
2
(2k)!

(1)
y (z)

:= z +

X
k=1

z 2k+1 Y
(4l 2 ) .
(2k + 1)!
l=1

Conforme comentamos, o Teorema 7.3 da pagina 358 garante-nos que ambas as series acima convergem
(1)
(0)
absolutamente para todo z , fazendo de y e y funcoes inteiras de z.
Os Polin
omios de Hermite
No caso em que z e restrita a ser uma variavel real, chamemo-la x, e possvel demonstrar que se
for real e as series acima forem infinitas, entao ambas comportam-se, para |x| grande, como funcoes que
crescem mais rapido que exp(x2 /2). Isso e provado no Apendice 8.C, pagina 474, e, por outros meios,
em [83] ou em [79]. No contexto da Mecanica Quantica esse fato e indesejado, pois conduz a funcoes de
onda que nao sao de quadrado integravel (vide Secao 10.4, pagina 567). Assim, interessa-nos investigar
sob quais circunstancias as series acima podem ser reduzidas a polinomios.
Como vemos facilmente por (8.17), isso se da apenas quando for um n
umero inteiro nao-negativo
e par: = 2m, com m = 0, 1, 2, . . . etc. De fato, se = 2m, com m = 0, 1, 2, . . . etc., a expressao

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

403/1304

(0)

(8.17) diz-nos que 0 = cm+2 = cm+4 = cm+6 = etc. Assim, caso m for par, y sera um polinomio
(1)
de ordem m e caso m for mpar, y sera um polinomio de ordem m.
Defina-se, assim,

Hm (z) :=

ou seja,

Hm (z) :=




(0)
m/2

(2)
(m 1)!! y2m (z),

para m par,




(1)
(m+1)/2

(m!!) y2m (z), para m mpar,


(2)

m
2

2k k1
Y
X

2m 2
z

(4l 2m) , para m par,


(2)m/2 (m 1)!! 1
z 2m

2
(2k)!

l=1
k=2

m1

2
2k+1
X
Y

(4l 2(m + 1)) ,


(2)(m+1)/2 (m!!) z +

(2k
+
1)!
k=1
l=1

(8.18)

(8.19)

para m mpar.

De maneira compacta, podemos escrever isso da seguinte forma


Hm (z) :=

bm/2c

X
k=0

(1)k m!
(2z)m2k .
k! (m 2k)!

(8.20)

A demonstracao pode ser encontrada no Apendice 8.D, pagina 476.


E. 8.2 Exerccio. Tente mostrar isso sem ler o Apendice 8.D.

As funcoes Hm (z) sao polinomios de grau m e sao denominados polin


omios de Hermite. Os fatores
m/2
(m+1)/2
(2)
(m 1)!! e (2)
(m!!) provem de uma convencao historica sobre a normalizacao dos
polinomios de Hermite. Os quatro primeiros sao
H0 (z) = 1 ,

H1 (z) = 2z ,

H2 (z) = 2 + 4z 2 ,

H3 (z) = 12z + 8z 3 ,

como facilmente se ve pela definicao acima.


Cada polinomio de Hermite Hm e solucao da equacao de Hermite
y 00 (z) 2zy 0 (z) + 2my(z) = 0,
com m inteiro positivo. Como mencionamos, essa equacao possui ainda uma segunda solucao que,
embora finita para todo z , cresce muito rapidamente quando z e real e |z| , o que elimina seu
interesse no contexto da Mecanica Quantica (especificamente, no problema do oscilador harmonico).
Os polinomios de Hermite possuem varias propriedades importantes, tais como relacoes de ortogonalidade, formulas de recorrencia etc., que serao discutidas na Secao 9.2.3, pagina 511. Tambem
remetemos o estudante a` literatura pertinente supracitada.

JCABarata. Curso de Fsica-Matem


atica

8.1.4

Captulo 8

Vers
ao de 29 de setembro de 2005.

404/1304

A Equa
c
ao de Airy

A equacao diferencial
y 00 (z) zy(z) = 0.

e denominada equaca
o de Airy4 . Essa equacao surge em varios contextos, como por exemplo no
estudo da propagacao de ondas eletromagneticas em meios com ndice de refracao variavel, no estudo
da reflexao de ondas de radio na atmosfera e, de especial importancia, na Mecanica Quantica, mais
especificamente, na equacao de Schrodinger de uma partcula que se move em uma dimensao sob um
potencial que cresce linearmente com a posicao (i.e., sob uma forca constante). Na Secao 10.2.3,
pagina 560, tratamos com detalhe de um outro problema fsico onde ocorre a equacao de Airy, a saber,
o problema de determinar os modos de vibracao de uma corda nao-homogenea cuja densidade varia
linearmente com a posicao.
Comparando a` forma padrao (8.1), constatamos que aqui a(z) = 0 e b(z) = z. Ambas essas
funcoes sao analticas em todo o plano complexo e, pelo Teorema 7.3 da pagina 358, assim serao as
solucoes da equacao de Airy, sendo que
encontra-las atraves de uma expansao em serie de
P podemos
n
potencias em torno de z0 = 0: y(z) =
c
z
.
n=0 n
Inserindo-se (8.5) em (8.15), obtem-se

X
n=0

(n + 1)(n + 2)cn+2 z

A expressao III pode ser escrita como


III =

cn z

n+1

n=0

X
n=0

cn z n+1 = 0 .
{z

III

(8.21)

cn1 z n

n=1

pela mudanca n n 1. Assim, a equacao de Airy diz-nos que

X
n=0

(n + 1)(n + 2)cn+2 z

ou seja,
2c2 +

h
X
n=1

Com isso, devemos ter


c2 = 0 ,

cn1 z n = 0 ,

n=1

i
(n + 1)(n + 2)cn+2 cn1 z n = 0 .

(n + 1)(n + 2)cn+2 cn1 = 0,

ou seja,
c2 = 0 ,

cn+3 =

cn
,
(n + 2)(n + 3)

n1.

n0.

(8.22)

4
George Biddell Airy (1801-1892). A equaca
o de Airy surgiu originalmente em seus estudos sobre a Teoria do ArcoIris. Vide tambem On the diffraction of an object-glass with circular aperture, G. B. Airy, in Transactions of the
Cambridge Philosophical Society (1835).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

405/1304

O conjunto de coeficientes {cn , n = 0, 1, 2, . . .} e a uniao dos seguintes tres conjuntos disjuntos:


{c3k , k = 0, 1, 2, . . .} = {c0 , c3 , c6 , c9 , . . .}
{c3k+1 , k = 0, 1, 2, . . .} = {c1 , c4 , c7 , c10 , . . .}
{c3k+2 , k = 0, 1, 2, . . .} = {c2 , c5 , c8 , c11 , . . .}
As relacoes de recorrencia de (8.22) implicam que os coeficientes do primeiro conjunto acima sao
proporcionais a c0 , que os coeficientes do segundo conjunto acima sao proporcionais a c1 e que os
coeficientes do terceiro conjunto acima sao proporcionais a c2 . Porem, como c2 = 0, conclumos que os
coeficientes do terceiro conjunto sao todos nulos. Logo,
y(z) =

c3k z

3k

k=0

1
c0 ,
3k k! (3k 1)!!!

c3k+1 z 3k+1 .

k=0

As relacoes de recorrencia de (8.22) dizem-nos que


c3k =

1
c1
3k k! (3k + 1)!!!

c3k+1 =

c3k+2 = 0 ,

para todo k 0. Assim, a solucao geral da equacao de Airy e


"
#
"
#
X
X
z 3k
z 3k+1
y(z) = c0
+ c1
.
k k! (3k 1)!!!
k k! (3k + 1)!!!
3
3
k=0
k=0

(8.23)

Como 3k k! = (3k)!!! (por que?), podemos reescrever isso como


"
#
"
#
X
X
z 3k
z 3k+1
y(z) = c0
+ c1
.
(3k)!!!
(3k

1)!!!
(3k)!!!
(3k
+
1)!!!
k=0
k=0
As fun
co
es de Airy de primeiro e de segundo tipo
Ha ainda uma outra maneira de reescrever (8.23), a saber, usando as identidades


3k k + 32
3k k + 43


(3k 1)!!! =
,
(3k + 1)!!! =
,
32
34

sendo, para x 0,

(x) :=

et tx1 dt

(8.24)

(8.25)

a bem conhecida Funca


o Gama de Euler, a qual satisfaz
(x + 1) = x(x) .

(8.26)

assim como a assim denominada f


ormula de duplicaca
o

(x)(x + 1/2) = 212x (2x) .

(8.27)

A funcao Gama de Euler e suas propriedades sao discutidas com mais detalhe na Secao 8.4, pagina
453.

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

406/1304

E. 8.3 Exerccio. Usando (8.26) prove (8.24).

Com isso, podemos escrever a solucao (8.23) da equacao de Airy como


#
#
  "X
  "X

z 3k
z 3k+1
4
2
 + c1
 .
y(z) = c0
2k k! k + 2
2k k! k + 4
3
3
3
3
3
3
k=0
k=0

(8.28)

Essa expressao pode ser escrita como combinacao linear das seguintes funcoes:
Ai(z) :=

X
k=0

Bi(z) := 31/2

X
z 3k+1
z 3k

,

2k+4/3 k! k + 4
32k+2/3 k! k + 23
3
3
k=0

"

3k

32k+2/3

k=0

z
 +
k! k + 23

X
k=0

3k+1

32k+4/3

(8.29)
(8.30)

z

k! k + 43

(8.31)

as quais sao denominadas funco


es de Airy de primeiro tipo e de segundo tipo, respectivamente. As
funcoes Ai(z) e Bi(z) foram definidas como acima por convencao historica. Ambas sao analticas
para todo z e representam solucoes da equacao de Airy. Propriedades dessas funcoes podem ser
estudadas em [83].
Como veremos com um pouco mais de detalhe a` pagina 439, a equacao de Airy pode ser transformada
em uma equacao de Bessel de ordem 1/3 e as funcoes de Airy Ai(z) e Bi(z) podem ser escritas em
termos das funcoes de Bessel J1/3 . Vide expressoes (8.123) e (8.124).

8.1.5

A Equa
c
ao de Chebyshev

A equacao diferencial
(1 z 2 )y 00 (z) z y 0 (z) + 2 y(z) = 0
5

e denominada equaca
o de Chebyshev . Em princpio adotamos
estara no caso em que e um inteiro nao-negativo.

(8.32)
arbitrario, mas o maior interesse

A equacao de Chebyshev acima pode ser posta na forma padrao (8.1) com
a(z) =

z
1 z2

b(z) =

2
.
1 z2

portanto,
Claramente, ambas as funcoes sao analticas emPum disco de raio 1 centrado em z 0 = 0. E,

legtimo procurarmos solucoes na forma y(z) = n=0 cn z n (com z0 = 0). Tais solucoes serao analticas
pelo menos no disco de raio 1 centrado em z0 = 0.
Inserindo-se (8.4)-(8.5) em (8.32), obtem-se

X
n=0

(n + 1)(n + 2)cn+2 z

|n=0

(n + 1)(n + 2)cn+2 z

Pafnuty Lvovich Chebyshev (1821-1894).

{z
I

n+2

|n=0

(n + 1)cn+1 z
{z
II

n+1

X
n=0

cn z n = 0 . (8.33)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

407/1304

Novamente, I e II sao dadas como em (8.9) e (8.10), respectivamente, e, portanto, (8.33) fica

X
n=0

(n + 1)(n + 2)cn+2 z

ou seja,
2c2 + 2 c0 +

X
n=1

"

X
n=1

(n 1)n cn z

ncn z +

cn z n = 0 ,

n=0

n=1

(n + 1)(n + 2)cn+2 (n 1)n + n 2 cn z n = 0 .

Como (n 1)n + n = n , obtemos o seguinte conjunto de equacoes


2c2 + 2 c0 = 0 ,


(n + 1)(n + 2)cn+2 n2 2 cn = 0 ,

n 1 .

Essas expressoes fornecem as seguintes equacoes recursivas para os coeficientes c n :


cn+2 =

n2 2
cn ,
(n + 1)(n + 2)

n 0 .

(8.34)

De maneira analoga ao que fizemos em exemplos anteriores, podemos expressar todos os coeficientes c n
com n par em termos de c0 e todos os coeficientes cn com n mpar em termos de c1 . Mais precisamente,
tem-se
"
#
k1
1 Y
(2l)2 2 c0 ,
c2k =
(2k)! l=0

c2k+1
Para

"
#
k1
Y
1
=
(2l + 1)2 2 c1 .
(2k + 1)! l=0

generico conclumos que a solucao geral da equacao de Chebyshev e da forma


(1)

(0)

y(z) = c0 y (z) + c1 y (z) ,


onde
"
#

k1
2k
X
Y
z
(0)
y (z) = 1 +
(2l)2 2 ,
(2k)!
k=1

(1)

y (z) = z +

X
k=1

Os Polin
omios de Chebyshev

(8.35)

l=0

#
"
k1
z 2k+1 Y
(2l + 1)2 2 .
(2k + 1)! l=0

(8.36)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

408/1304

Como mencionamos, o principal interesse reside no caso em que e um inteiro nao-negativo: = m.


(0)
(1)
Nesse caso e facil ver que ym (z) sera um polinomio de grau m, caso m seja par e ym (z) sera um
polinomio de grau m, caso m seja mpar. Esses polinomios sao
"
#
m/2
k1
X
z 2k Y
(0)
2
2
ym (z) = 1 +
(2l) m , m par,
(2k)! l=0
k=1
(m1)/2
(1)
ym
(z) = z +

X
k=1

#
"
k1
z 2k+1 Y
(2l + 1)2 m2 , m mpar.
(2k + 1)! l=0

Por uma convencao historica, costuma-se redefinir esses polinomios multiplicando-os por uma constante
dependente de m de modo a fazer o coeficiente do monomio de maior grau, z m , igual a 2m1 . Apos
alguns calculos entediantes o estudante podera convencer-se que, com essa convencao, os polinomios
acima podem ser escritos de uma forma compacta como
bm/2c
m X (1)k (m k 1)!
(2z)m2k ,
Tm (z) :=
2 k=0
k! (m 2k)!

ou ainda como
Tm (z) =

bm/2c

X
p=0

(1)

m
2p

z m2p 1 z 2

p

(8.37)

(8.38)

ambas validas para todo m = 0, 1, 2, 3, 4, . . .. Os polinomios assim definidos sao denominados


polin
omios de Chebyshev, os quais desempenham um papel central na teoria da aproximacao. Vide,
por exemplo, [31], [125], [117] ou [91].
Os quatro primeiros polinomios de Chebyshev sao
T0 (z) = 1 ,

T1 (z) = z ,

T2 (z) = 2z 2 1 ,

T3 (z) = 4z 3 3z .

Uma das mais curiosas e importantes propriedades dos polinomios de Chebyshev Tm e a seguinte
identidade:

Tm (z) = cos m arccos(z) ,
(8.39)

a qual pode ser facilmente demonstrada a partir da expressao (8.38). Vide exerccio abaixo.

Demonstrar diretamente a validade das expressoes (8.37), (8.38) e (8.39) pode ser trabalhoso, por
envolver o uso de varias identidades combinatorias um tanto complicadas. O procedimento mais pratico
e provar que todas essas expressoes satisfazem a equacao de Chebyshev e as mesmas condicoes iniciais,
por exemplo em z = 0.
De (8.39) segue a interessante propriedade de composicao
Tn (Tm (z)) = Tnm (z),
valida para todos n, m nao-negativos.

(8.40)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

409/1304

E. 8.4 Exerccio resolvido. Prove (8.38) a partir de (8.39). Sugestao: defina y = arccos(z) e escreva
o lado direito como

cos m arccos(z) = cos(my)
=


1  imy
e
+ eimy
2

1
[(cos y + i sen y)m + (cos y i sen y)m ]
2
m 
m i

1 h
=
z + i 1 z2
+ z i 1 z2
2
#
" m  

m 
p X

p
1 X m mp 
m
=
.
z mp i 1 z 2
i 1 z2 +
z
2 p=0 p
p
p=0
=

muito facil ver que nas duas somas acima os termos com p mpar cancelam-se mutuamente. Assim,
E
ficamos com
 
bm/2c
X
p

m
p
(1)
cos m arccos(z) =
z m2p 1 z 2 ,
2p
p=0

que e o que queramos. Para provar (8.39) a partir de (8.38), basta ler as linhas acima do fim para o comeco.
6

8.1.6

O Caso de Equa
co
es Regulares Gerais

Nas paginas acima resolvemos em varios exemplos particulares a equacao


y 00 (z) + a(z)y 0 (z) + b(z)y(z) = 0

(8.41)

em casos em que os coeficientes a(z) e b(z) sao funcoes analticas de z em torno de um ponto z 0 . Para
tal, evocando o Teorema 7.3, pagina 358, procuramos solucoes na forma de series de potencias:
y(z) =

X
n=0

cn (z z0 )n .

(8.42)

Vamos agora mostrar como o metodo que descrevemos se aplica ao caso geral no qual as funcoes a(z)
e b(z) sao tambem dadas em termos de series de potencias:
a(z) =

X
n=0

an (z z0 ) ,

b(z) =

X
n=0

bn (z z0 )n .

Usando novamente (8.4) e (8.5) a equacao (8.41) fica (adotamos daqui para frente z 0 = 0, sem perda
de generalidade)
!
!
!
!

X
X
X
X
X
n
n
n
n
n
. (8.43)
cn z
(n + 1)(n + 2)cn+2 z +
an z
(n + 1)cn+1 z
+
bn z
n=0

n=0

n=0

n=0

n=0

JCABarata. Curso de Fsica-Matem


atica

Para o produto de duas series de potencia

p z

p=0

q z

q=0

Captulo 8

Vers
ao de 29 de setembro de 2005.

p=0

p z p e

p q z

q=0

p+q

410/1304

q z q vale

p=0 q=0

n=0

n
X

nm m

m=0

zn .

(8.44)

E. 8.5 Exerccio. Mostre isso.

Assim, (8.43) fica

(n + 1)(n + 2)cn+2 z n +

n=0

ou seja,

X
X
n=0

h
X

o que implica

m=0

(n + 1)(n + 2)cn+2 +

n=0

anm (m + 1)cm+1

n
X

zn +

n=0

(m + 1)anm cm+1 +

m=0

cn+2

n
X

m=0

n
X

bnm cm

m=0

z n = 0,

bnm cm z n = 0,

n
X

1
=
(m + 1)anm cm+1 + bnm cm
(n + 1)(n + 2) m=0

(8.45)

para todo n 0. Observe que essa expressao determina cn+2 em termos de c0 , c1 , . . . , cn+1 . Assim,
apenas fixando c0 e c1 podemos determinar todos os demais coeficientes cn atraves da expressao recursiva
acima.
Como dissemos,
que nos conduziram ao Teorema 7.3, pagina 358, garantem-nos que
P os resultados
n
a serie y(z) =
e convergente na mesma regiao em que convergem as series
n=0 cn z assim obtida
de a(z) e b(z), de modo que nao precisamos provar isso. Alguns autores (por exemplo,
usam
P [112])
n
as expressoes recursivas (8.45) para demonstrar a convergencia da serie y(z) =
n=0 cn z . Como
dissemos, pelo nosso proceder isso nao e mais necessario, mas o estudante interessado e convidado a
estudar essa outra (elegante) demonstracao no texto supracitado.
Para futura referencia, resumimos nossas conclusoes sobre equacoes regulares no seguinte teorema.
Teorema 8.1 (Solu
c
ao de equa
co
es regulares por expans
ao em s
erie de pot
encias) Considerese a equaca
o diferencial
y 00 (z) + a(z)y 0 (z) + b(z)y(z) = 0 ,
(8.46)
z , com a(z) e b(z) analticas em torno de z0 e expressas em termos de suas series de Taylor em
torno de z0 como

X
X
n
a(z) =
an (z z0 ) ,
b(z) =
bn (z z0 )n ,
n=0

n=0

series estas supostas absolutamente convergentes em |z z0 | < r, para algum r > 0. Ent
ao a soluca
o
geral da equaca
o (8.46) pode ser expressa em termos de uma expans
ao em serie de potencias em z z 0 :
y(z) =

X
n=0

cn (z z0 )n ,

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

411/1304

onde os coeficientes cn podem ser obtidos atraves das relaco


es recursivas
cn+2

n
X

1
=
(m + 1)anm cm+1 + bnm cm ,
(n + 1)(n + 2) m=0

n0,

a partir dos dois primeiros coeficientes c0 e c1 , arbitr


arios. A expans
ao em serie de potencias para y(z)
converge absolutamente pelo menos na regi
ao |z z0 | < r, onde representa uma funca
o analtica. 2

8.2

Solu
c
ao de Equa
co
es Singulares Regulares. O M
etodo de
Frobenius

Na presente secao ilustraremos o Teorema 7.4, pagina 361, estudando a solucao, por um metodo
devido a Frobenius6 , de algumas equacoes diferenciais ordinarias, homogeneas de segunda ordem e
singulares regulares de interesse (especialmente em Fsica). Boa parte dos metodos apresentados nos
exemplos aplicam-se a equacoes de ordem maior que dois, mas nao trataremos de tais generalizacoes
aqui pois elas pouco apresentam de especial e seu interesse na Fsica e reduzido.
Vale aqui novamente a advertencia sobre a omissao de alguns detalhes de calculos, sendo o estudante
novamente convidado a completa-los como exerccio (todos merecem ser feitos ao menos uma vez na
vida). Todas as equacoes particulares tratadas e suas solucoes sao amplamente discutidos na vasta
literatura pertinente, por exemplo, aquela listada a` pagina 395.
Conforme demonstramos em paginas anteriores (Teorema 7.3, pagina 358), se a equacao diferencial
linear homogenea de segunda ordem
y 00 (z) +

b(z)
a(z) 0
y (z) +
y(z) = 0
(z z0 )
(z z0 )2

(8.47)

for tal que a(z) e b(z) sao funcoes analticas de z em torno de um ponto z0 , entao o coeficiente

a(z)
(zz0 )

b(z)
tem no maximo uma singularidade de tipo polo de ordem 1 em z0 e o coeficiente (zz
aximo
2 tem no m
0)
uma singularidade de tipo polo de ordem 2 em z0 . Assim, pelas nossas definicoes previas, z0 e um ponto
singular regular da equacao (8.47). Nesse caso, o Teorema 7.3, pagina 358, diz-nos que ou a equacao
(8.47) tem duas solucoes independentes da forma

y(z) = (z z0 )

X
n=0

cn (z z0 )n .

(8.48)

P
n
onde e a serie
e absolutamente convergente para |z z0 | < r (e, portanto, repren=0 cn (z z0 )
senta uma funcao analtica em torno de z0 ) ou entao a equacao (8.47) tem duas solucoes independentes,
uma da forma (8.48) e outra da forma
y(z) = (z z0 ) (ln(z z0 ))
6

Ferdinand Georg Frobenius (1849-1917).

X
n=0

cn (z z0 )n + (z z0 )

X
n=0

vn (z z0 )n .

(8.49)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

412/1304

P
P
n
n
onde, novamente as series
ao absolutamente convergentes para
n=0 cn (z z0 ) e
n=0 vn (z z0 ) s
|z z0 | < r (e, portanto, representam funcoes analticas em torno de z0 ). Em ambos os casos acima
r > 0 e o raio do maior disco aberto centrado em z0 dentro do qual a(z) e b(z) sao analticas.
O chamado metodo de Frobenius consiste precisamente em inserir-se o Ansatz (8.48) na equacao
(8.47) e determinar recursivamente os coeficientes cn , assim como o expoente . Caso duas solucoes
distintas sejam encontradas dessa forma, o problema esta resolvido. Caso se encontre apenas uma
solucao, entao uma segunda solucao da forma (8.49) deve ser procurada atraves da determinacao
recursiva dos coeficientes cn e vn , assim como dos expoentes e 0 .
Ao contrario do que fizemos no caso de equacoes regulares, quando primeiro exploramos exemplos
particulares para depois tratarmos do caso geral, e mais conveniente no presente contexto que nos apoderemos primeiramente da analise geral para depois tratarmos de equacoes especficas, pois uma visao
previa das complicacoes envolvidas nos auxiliara a evitar certas armadilhas ocultas no tratamento
de equacoes singulares regulares particulares7 . Ilustraremos o metodo de Frobenius apresentando a
resolucao da equacao de Euler, da equacao de Bessel, da equacao de Laguerre e das equacoes hipergeometrica e hipergeometrica confluente, todas de interesse em Fsica.
O principal teorema que demonstraremos, o qual resume os resultados do metodo de Frobenius e
expressa a solucao de uma equacao singular regular homogenea de segunda ordem geral, e o seguinte:
Teorema 8.2 (Solu
c
ao de equa
co
es singulares regulares pelo m
etodo de Frobenius) Seja a
equaca
o diferencial
(z z0 )2 y 00 (z) + (z z0 )a(z)y 0 (z) + b(z)y(z) = 0 ,
(8.50)
z , com a(z) e b(z) analticas em torno de z0 e expressas em termos de suas series de Taylor em
torno de z0 como

X
X
n
a(z) =
an (z z0 ) ,
b(z) =
bn (z z0 )n ,
n=0

n=0

series estas supostas absolutamente convergentes em |z z0 | < r, para algum r > 0.


Seja definido o polin
omio de segundo grau

f (x) := x(x 1) + a0 x + b0 = x2 + (a0 1)x + b0 ,


e considere-se a equaca
o algebrica
f (x) = 0 ,

(8.51)

a qual e denominada equacao indicial. Sejam as soluco


es dessa equaca
o no plano complexo:
=

1 a0

(a0 1)2 4b0


2

+ =

1 a0 +

p
(a0 1)2 4b0
.
2

Ent
ao a equaca
o (8.50) possui duas soluco
es independentes y 1 (z) e y2 (z), v
alidas pelo menos na regi
ao
0 < |z z0 | < r. A forma dessas soluco
es varia conforme as seguintes condico
es complementares sobre
e + : 1. + 6 , 2. + = 0 ou 3. + \ {0}, como enumeramos a seguir:
7

O estudante e convidado a n
ao entrar em p
anico diante da aparente complexidade de algumas express
oes que
obteremos. Na maioria das equaco
es diferenciais de interesse as funco
es a(z) e b(z) s
ao apenas polin
omios de grau 0, 1
ou 2 e as express
oes obtidas no tratamento geral se simplificam um tanto.

JCABarata. Curso de Fsica-Matem


atica

1. Caso + 6

Vers
ao de 29 de setembro de 2005.

Captulo 8

413/1304

Nesse caso tem-se


y1 (z) = (z z0 )

X
n=0

cn ( )(z z0 )

onde
cn ( ) =

y2 (z) = (z z0 )

X
n=0

cn (+ )(z z0 )n , (8.52)

n1 h
i
X
1
(m + )anm + bnm cm ( ) ,
f ( + n) m=0

(8.53)

para todo n 1. Essas express


oes recursivas permitem-nos obter todos os c n ( ) a partir de um
c0 ( ) n
ao-nulo arbitr
ario e, respectivamente, todos os cn (+ ) a partir de um c0 (+ ) n
ao-nulo
arbitr
ario.
2. Caso + = 0.
p
Neste caso (a0 1)2 4b0 = 0 e = + = 0 com
0 :=

1 a0
2

e tem-se
y1 (z) = (zz0 )

cn (0 ) (zz0 )

y2 (z) = y1 (z) ln(zz0 )+(zz0 )

n=0

onde

para todo n 1, e

vn (0 ) (zz0 )n ,

n=0

n1 h
i
X
1
(m + 0 )anm + bnm cm (0 )
cn (0 ) =
f (0 + n) m=0

"
n
X


1
vn (0 ) =
2(n + 0 ) 1 cn (0 )
anm cm (0 )
f (0 + n)
m=0
+

n1 h
X

m=0

(m + 0 )anm + bnm vm (0 ) ,

(8.54)
(8.55)

n 1 , (8.56)

onde os coeficientes cn (0 ) s
ao obtidos recursivamente a partir de um c0 (0 ) n
ao-nulo arbitr
ario
e os coeficientes vn (0 ) s
ao obtidos recursivamente a partir dos coeficientes cm (0 ) e a partir de
um v0 (0 ) arbitr
ario (mas que pode ser escolhido igual a zero).
3. Caso +

\ {0}.
p
Neste caso + = (a0 1)2 4b0 e um inteiro n
ao-nulo. Definamos ent
ao

p


n0 = (a0 1)2 4b0 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

414/1304

Claro est
a que n0 {1, 2, 3, 4, . . .}. Definamos tambem
1 := ,

2 := + ,

1 := + ,

2 := ,

caso + 1,

ou
(8.57)

caso + 1.

Com essas definico


es tem-se
1 = 2 + n0 .
Ent
ao,
y1 (z) = (z z0 )
onde

X
n=0

cn (1 )(z z0 )

y2 (z) = Ay1 (z) ln(z z0 )+(z z0 )

X
n=0

vn (z z0 )n ,

n1 h
i
X
1
(m + 1 )anm + bnm cm (1 ) ,
cn (1 ) =
f (1 + n) m=0

para n 1 e

n1 

X

(m + 2 )anm + bnm vm ,

f (2 + n) m=0

arbitrario ,
vn =

"
#

n1


1

(m + 2 )anm + bnm vm ,

f ( + n) Agnn0 +
2
m=0

(8.58)
(8.59)

para 1 n n0 1 ,
para n = n0 ,
para n > n0 ,
(8.60)

onde,

nX
0 1
1
[(m + 2 )an0 m + bn0 m ] vm
A =
c0 (1 ) n0 m=0

gn = [2(n + 1 ) 1] cn (1 ) +

n
X

m=0

anm cm (1 ) ,

n0.

(8.61)

(8.62)

As express
oes recursivas para cn (1 ) dependem de um c0 (1 ) n
ao-nulo e arbitr
ario e as express
oes
recursivas para vn dependem tambem de um v0 arbitr
ario.
Todas as series de potencia em z z0 apresentadas acima convergem absolutamente pelo menos na
regi
ao |z z0 | < r e nela representam, portanto, funco
es analticas.
2
Para a demonstracao desse teorema devotaremos toda a Secao 8.2.1. Em uma primeira leitura o
estudante podera dispensar-se de um estudo detalhado da demonstracao e passar mais rapidamente
aos exemplos discutidos na Secao 8.2.2, pagina 424, e seguintes.

JCABarata. Curso de Fsica-Matem


atica

8.2.1

Captulo 8

Vers
ao de 29 de setembro de 2005.

415/1304

Equa
co
es Singulares Regulares. O Caso Geral

Daqui para frente, sem perda de generalidade, adotaremos z0 = 0.


Seja, entao, a equacao (8.47) escrita agora na forma
z 2 y 00 (z) + za(z)y 0 (z) + b(z)y(z) = 0

(8.63)

com a(z) e b(z) analticas em torno de z0 = 0 e expressas em termos de suas series de Taylor em torno
de 0 como

X
X
n
a(z) =
an z ,
b(z) =
bn z n .
n=0

n=0

Sob a luz do Teorema 7.4, pagina 361, procuraremos primeiramente uma solucao na forma

y(z) =

cn z n+ .

(8.64)

n=0

Antes de iniciarmos nossa analise, comentemos que, sem perda de generalidade, podemos sempre adotar
o primeiro coeficiente, c0 , como nao-nulo: c0 6= 0. Isso se deve ao seguinte. Se cm fosse o primeiro
coeficiente nao-nulo, teramos

X
y(z) =
cn z n+ .
n=m

Agora, com a mudanca de variavel n0 = n m ficaramos com

y(z) =

cn0 +m z n +(+m)

n0 =0

redefinindo c0n0 := cn0 +m e 0 = + m, ficaramos com


y(z) =

0
0
c0n0 z n +

n0 =0

c0n z n+ .

n=0

A u
ltima expressao possui a mesma estrutura de (8.64) mas, como se ve, o primeiro coeficiente e
0
c0 = cm , que e nao-nulo, por hipotese.
Isto posto, passemos a analisar o que se passa inserindo a expressao (8.64) em (8.63). Para (8.64)
valem

X
y 0 (z) =
(n + )cn z n+1
(8.65)
n=0

00

y (z) =

X
n=0

a equacao (8.63) fica

X
n=0

(n + )(n + 1)cn z

n+

X
n=0

(n + )(n + 1)cn z n+2 ,

an z

X
n=0

(n + )cn z

n+

X
n=0

(8.66)

bn z

X
n=0

cn z n+ = 0.

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

416/1304

Usando novamente (8.44), isso fica

X
n=0

(n + )(n + 1)cn z n+ +

n
X
X
n=0

anm (m + )cm

m=0

z n+ +

X
n=0

n
X

bnm cm

m=0

z n+ = 0.

ou seja,

X
n=0

"

n
X

(n + )(n + 1)cn +

anm (m + )cm

m=0

n
X

bnm cm

m=0

!#

z n+ = 0

que implica

i
( 1) + a0 + b0 c0 = 0 ,
i

(n + )(n + 1) + a0 (n + ) + b0 cn =

n1 h
X

m=0

i
anm (m + ) + bnm cm ,

n 1 .

para todo n 0. Como c0 6= 0, temos que


( 1) + a0 + b0 = 0 ,
h

(8.67)

n1 h
i
i
X
(n + )(n + 1) + a0 (n + ) + b0 cn =
anm (m + ) + bnm cm ,
m=0

n 1 . (8.68)

A equacao (8.67) e denominada na literatura equaca


o indicial, por ser uma equacao algebrica (de
segundo grau) para o ndice . Antes de escrevermos a solucao dessa equacao, denotemos por f o
polinomio de segundo grau
f (x) = x(x 1) + a0 x + b0 = x2 + (a0 1)x + b0 .
As equacoes (8.67) e (8.68) podem, claramente, ser reescritas como
f () = 0 ,
f ( + n) cn =

n1 h
X

m=0

(8.69)
i
anm (m + ) + bnm cm ,

n 1 .

(8.70)

A equacao f () = 0 e uma equacao algebrica de segundo grau, cujas solucoes sao


p
p
1 a0 (a0 1)2 4b0
1 a0 + (a0 1)2 4b0
=
e
+ =
.
2
2
Assim, a equacao indicial f () = 0 obriga o ndice a ser ou + . Ha dois casos a considerar: o
caso + 6 e o caso + . Trataremos primeiramente do caso + 6 , que e o mais
simples.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

417/1304

O caso + 6
Como a diferenca + nao e um n
umero inteiro, tem-se em particular que 6= + . Fora isso,
como e + sao os dois u
nicos zeros (distintos) do polinomio f (x), tem-se que f ( + n) 6= 0 para
todos n 1 inteiros. Se assim nao fosse e houvesse n0
com, digamos, f (+ + n0 ) = 0 valeria
= + + n0 , ou seja, + = n0 , que e inteiro: uma contradicao. Com isso, podemos de (8.70)
obter
n1 h
i
X
1
anm (m + ) + bnm cm ( )
cn ( ) =
f ( + n) m=0
n1 h
i
X
1
=
a
(m
+

)
+
b
nm

nm cm ( ) ,
( + n)2 + (a0 1)( + n) + b0 m=0

(8.71)

para todo n 1. Essas expressoes recursivas permitem-nos obter todos os c n ( ) a partir de um c0 ( )


nao-nulo arbitrario e, respectivamente, todos os cn (+ ) a partir de um c0 (+ ) nao-nulo arbitrario.
Conclumos assim, que no caso + 6 a equacao diferencial (8.63) (com z0 = 0) possui duas
solucoes linearmente independentes y1 (z) e y2 (z), dadas por
y1 (z) =

X
n=0

cn ( )z n+

y2 (z) =

cn (+ )z n++ ,

n=0

com cn ( ) dadas por (8.71), a solucao geral sendo uma combinacao linear de ambas. As constantes
c0 ( ) e c0 (+ ) sao nao-nulas e arbitrarias.
O caso +
O caso +
com o primeiro.

subdivide-se em dois: o caso + = 0 e o caso +

\{0}. Comecemos

O caso = +
O caso = + ocorre se e somente se (a0 1)2 4b0 = 0 e, portanto, tem-se = + = 0 , com
0 :=

1 a0
.
2

(8.72)

Note-se que se (a0 1)2 4b0 = 0 a equacao f (x) = 0 tem apenas 0 por raiz e, portanto, f (n + 0 ) 6= 0
para todo n 1. Conseq
uentemente, os coeficientes cn com n 1 serao dados recursivamente por
(vide (8.70))
n1 h
i
X
1
anm (m + 0 ) + bnm cm (0 )
cn (0 ) =
f (0 + n) m=0

1
2
(0 + n) + (a0 1)(0 + n) + b0

 X
n1 h
m=0

anm (m + 0 ) + bnm cm (0 ) ,

(8.73)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

418/1304

para todo n 1. Como se constata, a u


ltima expressao relaciona cn com os coeficientes anteriores
cn1 , . . . , c0 . Assim, fixando apenas c0 todos os demais estao determinados. Obtemos dessa forma,
para o caso (a0 1)2 4b0 = 0 a solucao
y1 (z) =

cn (0 ) z n+0 ,

(8.74)

n=0

onde os coeficientes cn (0 ) sao obtidos recursivamente de (8.73) a partir de um c0 arbitrario. Pelo


Teorema 7.4, pagina 361, a serie acima sera convergente (ao menos na regiao onde as series de a(z) e
b(z) convergem).
Com esse proceder obtivemos apenas uma solucao da equacao diferencial (8.63). Como a mesma
e de segunda ordem, uma segunda solucao devera existir. Novamente, o Teorema 7.4, pagina 361,
indica-nos que essa segunda solucao pode ter uma singularidade logartmica. Podemos procurar essa
segunda solucao seguindo um procedimento devido a DAlembert8 , que consiste em procurar solucoes
da forma
y2 (z) = Ay1 (z) ln(z) + v(z) ,
(8.75)
sendo y1 (z) a solucao ja conhecida em (8.74) e onde A e uma constante a ser determinada, assim como
a funcao v(z). Note-se que o Ansatz (8.75) esta de acordo com o Teorema 7.4, pagina 361, que preve a
ocorrencia de solucoes com uma singularidade logartmica. A especialidade do Ansatz de DAlembert
esta em espertamente9 prever que o fator que multiplica ln(z) e a primeira solucao y1 (z).
Substituindo (8.75) na equacao (8.63), obtem-se a seguinte equacao para v(z):


z 2 v 00 (z) + za(z)v 0 (z) + b(z)v(z) = A 2zy10 (z) + (a(z) 1)y1 (z) .
E. 8.6 Exerccio. Verifique!

(8.76)
6

Como facilmente se verifica, o lado direito e dado pela expansao


A

fn z n+0 ,

(8.77)

n=0

onde
fn = [2(n + 0 ) 1] cn (0 ) +

n
X

anm cm (0 ) .

(8.78)

m=0

P
n+0
.
A equacao (8.77) sugere que uma solucao para v(z) deve ser procurada na forma v(z) =
n=0 vn z
Inserindo isso em (8.76) tem-se
"
#

n h
i
X
X
X
fn z n+0 ,
(n + 0 )(n + 0 1)vn +
(m + 0 )anm + bnm vm z n+0 = A
n=0

m=0

n=0

Jean Le Rond dAlembert (1717-1783).


Na literatura matem
atica o truque e por vezes denominado metodo de reduca
o de DAlembert e pode ser usado em
v
arias equaco
es diferenciais de segunda ordem para se obter uma segunda soluca
o da equaca
o a partir de uma primeira
soluca
o conhecida.
9

JCABarata. Curso de Fsica-Matem


atica

que implica
(n + 0 )(n + 0 1)vn +

n h
X

m=0

Captulo 8

Vers
ao de 29 de setembro de 2005.

419/1304

(m + 0 )anm + bnm vm = Afn

para todo n 0. Para n = 0 a relacao acima e


h
i
0 (0 1) + a0 0 + b0 v0 = Af0 ,

que e uma identidade trivial, ja que 0 (0 1) + a0 0 + b0 = 0 e que f0 = 0 [20 1 + a0 ] c0 (0 ) = 0,


por (8.72). Para n 1 tem-se, porem,
#

 "
n1 h
i
X
1
vn =
Afn +
(m + 0 )anm + bnm vm , n 1 ,
(0 + n)2 + (0 + n)(a0 1) + b0
m=0
(8.79)
o que permite obter recursivamente todos os vn a partir de v0 . Expressando-se os fn s como em (8.78),
tem-se

vn (0 ) =

1
2
(0 + n) + (0 + n)(a0 1) + b0

 "

[2(n + 0 ) 1] cn (0 )

n1 h
X

n
X

(m + 0 )anm + bnm vm ,

m=0

anm cm (0 )

m=0

n 1 , (8.80)

que expressa os vn s em termos dos coeficientes cn (0 ) de y1 (z), os quais, por sua vez, sao dados pelas
relacoes recursivas (8.73)10 , e de v0 (0 ) arbitrario.
Observemos, por fim, que A deve, nesse caso, ser forcosamente nao-nulo, pois se tomassemos A = 0
veramos por (8.80) que os coeficientes vn satisfazem as mesmas relacoes de recorrencia dos cn (0 ).
Assim, v(z) e y1 (z) nao seriam linearmente independentes. Podemos, portanto, adotar sem perda de
generalidade A = 1.
Resumindo nossas conclusoes, caso (a0 1)2 4b0 = 0, a solucao da equacao diferencial (8.63) (com
z0 = 0) possui duas solucoes linearmente independentes y1 (z) e y2 (z), dadas por
y1 (z) =

cn (0 )z

n+0

n=0

y2 (z) = y1 (z) ln(z) +

vn (0 )z n+0 ,

n=0

com 0 = (1 a0 )/2, com os cn (0 )s dados em (8.73) e com os vn (0 )s dados em (8.80), tomando-se


A = 1. As constantes c0 () e v0 () sao nao-nulas e arbitrarias.
de se notar que, como A e nao-nulo, uma das solucoes possui uma singularidade logartmica.
E
O caso +
10

\ {0}

Vide nota de rodape da p


agina 412.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

420/1304

Esse u
ltimo caso, com a generalidade com que o abordamos aqui, e o mais complexo e o estudante podera dispensar seu estudo detalhado em uma primeira leitura, atendo-se preferencialmente aos
exemplos das equacoes de Bessel e Laguerre, das quais trataremos adiante.
O caso + \ {0} e semelhante ao caso anterior onde = + , a principal diferenca sendo
que aqui podem ocorrer situacoes onde A = 0, de modo que ambas as solucoes podem ser livres de
singularidades logartmicas. De fato, sabe-se de equacoes particulares onde tem-se A = 0 (um exemplo
sendo a equacao de Bessel de ordem 1/2) e de equacoes particulares onde tem-se A 6= 0 (um exemplo
sendo a equacao de Bessel de ordem 1).
p
Comecemos com algumas definicoes. O caso + \ {0} so pode ocorrer se (a0 1)2 4b0
for um inteiro nao nulo. Definamos entao
p



n0 = (a0 1)2 4b0 .
Claro esta que n0 {1, 2, 3, 4, . . .}. Como + e um inteiro nao-nulo, definamos tambem
1 := ,

2 := + ,

caso + 1,

1 := + ,

2 := ,

caso + 1.

ou
(8.81)

Com essas definicoes, esta sempre garantido que


1 = 2 + n0 .
Isso diz-nos que para todo n 1 a expressao f (1 +n) nao pode se anular, pois se assim o fosse teramos
forcosamente 1 + n = 2 , ou seja, n = n0 , um absurdo, ja que n0 1. Por outro lado, existe um
u
nico valor de n para o qual f (2 + n) se anula, a saber n = n0 .
Com isso em mente, vemos que para a solucao = 1 da equacao indicial, a expressao (8.70)
permite-nos obter todos os coeficientes cn a partir de um c0 nao nulo:
n1 h
i
X
1
anm (m + 1 ) + bnm cm (1 )
cn (1 ) =
f (1 + n) m=0

n1 h
i
X
1
a
(m
+

)
+
b
nm
1
nm cm (1 ) ,
(1 + n)2 + (a0 1)(1 + n) + b0 m=0

(8.82)

para todo n 1. Isso fornece-nos a primeira solucao da equacao diferencial (8.63) (com z 0 = 0):
y1 (z) =

cn (1 )z n+1 ,

(8.83)

n=0

com os cn (1 ) dados em (8.82) em termos de c0 (1 ), arbitrario mas nao-nulo.


Passemos a procurar a segunda solucao independente da equacao diferencial (8.63).
O caso da solucao = 2 da equacao indicial requer cuidado pois, como comentamos, vale que
f (2 + n0 ) = 0. Assim, para n = n0 a equacao (8.70) so faz sentido se o lado direito for igualmente
nulo:
nX
0 1h
i
an0 m (m + 2 ) + bn0 m cm (2 ) = 0 .
(8.84)
m=0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

421/1304

Essa relacao pode ou nao ser satisfeita, dependendo da equacao diferencial tratada. Por exemplo, no
caso da equacao de Bessel de ordem semi-inteira (ou seja, de ordem 1/2, 3/2, 5/2 etc.) verifica-se que
a relacao (8.84) e satisfeita. Ja no caso da equacao de Bessel de ordem inteira verifica-se que a relacao
(8.84) n
ao e satisfeita. Isso sera discutido explicitamente na Secao 8.2.3, pagina 427.
Devemos, portanto, separar provisoriamente os dois casos: aquele no qual (8.84) e satisfeita e aquele
no qual nao e. Posteriormente veremos que essa separacao e superflua, mas por ora ela e logicamente
necessaria.
Na situacao feliz em que (8.84) e satisfeita, o coeficiente cn0 (2 ) fica indeterminado e pode ser
escolhido livremente, ja que as equacoes recursivas (8.70) nao o fixam e nada mais ha para fixa-los.
Com isso, as equacoes recursivas (8.70) determinam todos os demais coeficientes c n (2 ), n 1, n 6= n0 ,
a partir de um c0 (2 ) nao-nulo mas arbitrario. Assim, obtemos a solucao
y2 (z) =

cn (2 )z n+2 ,

(8.85)

n=0

com
cn (2 ) =

n1 h
i
X
1
anm (m + 2 ) + bnm cm (2 )
f (2 + n) m=0

n1 h
i
X
1
=
anm (m + 2 ) + bnm cm (2 ) ,
(2 + n)2 + (a0 1)(2 + n) + b0 m=0

(8.86)

para todo n 1, n 6= n0 e cn0 (2 ) = constante arbitraria11 .

Resta-nos ainda tratar do caso em que a relacao (8.84) n


ao e satisfeita. Aqui, devemos proceder
como fizemos no caso = + e procurar uma solucao na forma y2 (z) = Ay1 (z) ln(z) + v(z), com A
sendo uma constante e y1 sendo a solucao ja conhecida (8.83). Substituindo isso na equacao (8.63),
obtem-se novamente a equacao (8.76) para v(z).
Como facilmente se verifica, o lado direito de (8.76) e dado pela expansao
= A

gn (1 ) = [2(n + 1 ) 1] cn (1 ) +

n
X

gn (1 )z

n+1

n=0

gn (1 )z n+n0 +2 ,

(8.87)

n=0

onde, como antes,

m=0

anm cm (1 ) ,

n0,

(8.88)

os coeficientes cm (1 ) sendo dados por (8.82).


11

O que ocorre se, por opca


o, escolhermos cn0 (2 ) n
ao-nulo? Nesse caso teramos um termo a mais em y2 (z) do tipo
o y1 (z), ou
o geral ao termo c0 (1 )z 1 proveniente da soluca
cn0 z n0 +2 = cn0 z 1 . Esse termo se adicionaria na soluca
seja, corresponderia a uma nova escolha da constante arbitr
aria c0 (1 ), n
ao representando, assim, nenhuma mudanca na
soluca
o geral.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

422/1304

A equacao (8.87) sugere que uma solucao para v(z) deve ser procurada na forma
v(z) =

vn z n+2 .

n=0

Inserindo isso em (8.76) tem-se

X
n=0

"

n
X

(n + 2 )(n + 2 1)vn +

anm (m + 2 )vm

m=0

n
X

bnm vm

m=0

!#

z n+2

= A

gnn0 (1 )z n+2 ,

n=n0

o que implica
(n + 2 )(n + 2 1)vn +

(n + 2 )(n + 2 1)vn +

n h
X

m=0

n h
X

m=0

i
(m + 2 )anm + bnm vm = 0,

n = 0, . . . , n0 1 ,

(m + 2 )anm + bnm vm = Agnn0 (1 ),

(8.89)

n n0 . (8.90)

Para n = 0 a relacao (8.89) tem a forma


h
i
2 (2 1) + a0 2 + b0 v0 = 0,

mas como o fator entre colchetes e f (2 ) = 0, conclumos que essa relacao e trivialmente satisfeita e,
assim, v0 pode ser escolhido livremente. Para 1 n n0 1, (8.89) implica que
vn

n1 h
i
X
1
(m + 2 )anm + bnm vm
=
f (2 + n) m=0
n1 h
i
X
1
=
(m
+

)a
+
b
2 nm
nm vm
(2 + n)2 + (a0 1)(2 + n) + b0 m=0

(8.91)

Para n = n0 a relacao (8.90) e


h

(n0 + 2 )(n0 + 2 1) + a0 (n0 + 2 ) + b0 vn0 +

nX
0 1h
m=0

i
(m + 2 )an0 m + bn0 m vm
= A[21 1 + a0 ] c0 (1 ) .

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

423/1304

Como (n0 + 2 )(n0 + 2 1) + a0 (n0 + 2 ) + b0 = f (n0 + 2 ) = f (1 ) = 0, ficamos apenas com


nX
0 1
m=0

[(m + 2 )an0 m + bn0 m ] vm = A[21 1 + a0 ] c0 (1 ) = A

p
(a1 1)2 4b0 c0 (1 ) , (8.92)

facil ver, porem, que em


o sinal dependendo
de se ter 1 = + ou 1 = , respectivamente. E
p
2
qualquer caso (a1 1) 4b0 = n0 . A relacao (8.92) fixa A:

 nX
0 1
1
A =
[(m + 2 )an0 m + bn0 m ] vm ,
(8.93)
c0 (1 ) n0 m=0
com os vm fixados na expressao (8.91) em funcao de v0 6= 0 arbitrario.

O coeficiente vn0 nao e fixado por nenhuma das relacoes anteriores e pode ser escolhido livremente.
Sua presenca adiciona um termo do tipo vn0 z n0 +2 = vn0 z 1 a` solucao geral e aplica-se novamente o
comentario de rodape da pagina 421.
Para n > n0 , tem-se ainda por (8.90)
"
#
n1 h
i
X
1
Agnn0 (1 ) +
anm (m + 2 ) + bnm vm
vn =
f (2 + n)
m=0

1
2
(2 + n) + (2 + n)(a0 1) + b0

 "

Agnn0 (1 ) +

n1 h
X

anm (m + 2 ) + bnm vm

m=0

(8.94)
com os gn (1 ) fixados em (8.88) em termos dos coeficientes cm (1 ) da solucao y1 (z).
As expressoes (8.91), (8.93) e (8.94) permitem fixar todos os vn s e a constante A em termos de v0 6= 0
e de vn0 , arbitrarios. Observemos, A nao e forcosamente nulo, nem pode ser escolhido arbitrariamente.
Sobre a constante A vale ainda uma observacao importante.
A condi
c
ao (8.84) e a constante A
Observe o leitor que as relacoes de recorrencia (8.91), que fixam os v m s com m = 0, . . . , n0 1, sao
identicas a`s de (8.86), que fixam todos os cm (2 )s, em particular aqueles com m = 0, . . . , n0 1. Os
vm s sao fixados por um v0 inicial nao-nulo e os cm (2 )s por um c0 (2 ) inicial nao-nulo. Contemplando
aquelas relacoes de recorrencia, um minuto de meditacao nos leva a perceber que todos os v m sao
proporcionais a v0 e que todos os cm (2 ) sao proporcionais a c0 (2 ). Como as relacoes de recorrencia
sao identicas, conclumos que
v0
vm =
cm (2 ) para todo m = 0, . . . , n0 1 .
c0 (2 )
Agora, pela expressao (8.93), A e proporcional a
nX
0 1
m=0

[(m + 2 )an0 m + bn0 m ] vm

n0 1
v0 X
=
[(m + 2 )an0 m + bn0 m ] cm (2 ) .
c0 (2 ) m=0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

424/1304

Au
ltima soma, porem, e identica a`quela de (8.84)! Assim, percebemos que, sob a hipotese que (8.84)
nao e satisfeita, tem-se que A 6= 0.

Por outro lado, se (8.84) e satisfeita, entao A = 0. Mas se A = 0, as relacoes de recorrencia (8.94)
tornam-se tambem identicas a`quelas de (8.86), que fixam todos os cm (2 )s. Conclumos entao, que
nesse caso em que A = 0 (ou seja, sob (8.63)) vale tambem
vm =

v0
cm (2 ) ,
c0 (2 )

mas agora para todo m 0. Assim, para A = 0 a solucao y2 (z) = A ln(z)y1 (z)+v(z) reduz-se (a menos
de uma constante multiplicativa trivial) a` solucao para y2 (z) dada em (8.85), obtida sob a condicao
(8.84).
Nesse sentido, a condicao (8.84) e superflua e podemos unificar as solucoes que obtivemos nos casos
em que (8.84) e ou nao e satisfeita e resumir nossas conclusoes da seguinte forma:
Para + 6 \ {0}, a equacao diferencial (8.63) (com z0 = 0) tem duas solucoes independentes
y1 (z) e y2 (z), onde:
y1 (z) =

cn (1 )z

n+1

y2 (z) = Ay1 (z) ln(z) +

n=0

vn z n+2 ,

n=0

onde os cn (1 ), n 1, tambem estao definidos em (8.82) a partir de um c0 (1 ) nao-nulo arbitrario e


onde os vn s com n 1, n 6= n0 , e a constante A sao fixados em (8.91), (8.93) e (8.94) em termos de
v0 6= 0 e de vn0 , arbitrarios.

Como mencionamos, ha casos em que A = 0, exemplos sendo as equacao de Bessel de ordem


semi-inteira e a equacao de Euler, para certos parametros.
Com tudo isso a demonstracao do Teorema 8.2 esta completa e podemos passar ao estudo de
exemplos particulares.

8.2.2

A Equa
c
ao de Euler Revisitada

A equaca
o de Euler12 (de segunda ordem) e a equacao diferencial
z 2 y 00 (z) + azy 0 (z) + by(z) = 0,
onde a e b sao constantes. Comparando com a forma (8.50), vemos que z0 = 0 e um ponto singular
regular da equacao, vemos que a(z) = a e que b(z) = b. Assim, no presente caso tem-se


a, para n = 0
b, para n = 0
an =
,
bn =
.
0, para n 1
0, para n 1
12

Leonhard Euler (1707-1783). Um dos matem


aticos mais prolficos e influentes de todos os tempos, Euler foi um dos
fundadores da teoria das equaco
es diferenciais e deixou contribuico
es seminais em in
umeros campos da Matem
atica e
da Fsica. A equaca
o de Euler apresentada abaixo e uma das v
arias que levam seu nome. H
a uma outra equaca
o de
Euler na Mec
anica dos Fluidos, assim como f
ormulas de Euler, invariantes de Euler, metodos de Euler, Ans
atze de Euler,
multiplicadores de Euler, constantes de Euler, a
ngulos de Euler, problemas de Euler, conjecturas de Euler, teoremas de
Euler etc. Boa parte da notaca
o matem
atica usada atualmente e tambem sua invenca
o (por exemplo, o smbolo f 0 para
denotar a derivada de uma funca
o f ou o uso da letra e para designar o n
umero 2, 7182818 . . .).

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

425/1304

A equacao de Euler ja foi resolvida a` pagina 361, onde encontramos as solucoes (7.73) e (7.74).
Vamos trata-la aqui sob a luz do Teorema 8.2, pagina 412. Se procurarmos uma solucao na forma

cn z n+ ,

(8.95)

(n + )cn z n+1

(8.96)

(n + )(n + 1)cn z n+2 ,

(8.97)

y(z) =

n=0

com
0

y (z) =

X
n=0

e
00

y (z) =

X
n=0

a equacao de Euler fica

X
n=0

ou seja,

(n + )(n + 1)cn z n+ +
h
X
n=0

o que implica

a(n + )cn z n+ +

n=0

bcn z n+ = 0

n=0

(n + )(n + 1)cn + a(n + )cn + bcn z n+ = 0,


f (n + ) cn = 0

onde f e o polinomio de segundo grau.

n 0.

f (x) := x(x 1) + ax + b = x2 + (a 1)x + b .


Sem perda de generalidade,
podemos sempre adotar c0 6=
pois se cm fosse o primeiro coeficiente
P
P0,
0

n+
nao-nulo, a serie n=0 cn z
poderia ser reescrita como n=0 c0n z n+ com c0n := cn+m e 0 = + m,
que tem a mesma forma generica mas com c00 6= 0.
Assim, devemos impor f () = 0, o que possui duas solucoes:
p
p
1 a (a 1)2 4b
1 a + (a 1)2 4b
=
e
+ =
.
2
2

Se + nao for um inteiro, a equacao f ( + n) = 0 nao e satisfeita para nenhum n 1 inteiro.


A razao e a seguinte: f e um polinomio de segundo grau e, portanto, possui apenas duas solucoes.
Assim, se f ( + n) = 0 teramos + n = , o que implica que + e inteiro, uma contradicao.
Nesse caso, entao, temos que adotar cn = 0 para todo n 1 e as solucoes da equacao de Euler ficam
y1 (z) = z

y2 (z) = z + .

(8.98)

No caso de = + = 0 = (1 a)/2, tem-se por (8.54) uma solucao na forma


y1 (z) = z

X
n=0

cn (0 )z

e uma segunda na forma

y2 (z) = y1 (z) ln(z) + z

X
n=0

vn (0 )z n ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

426/1304

com os cn dados em (8.55) e os vn dados em (8.56). Observando (8.55), constata-se que nesse caso
cn (0 ) = 0 para todo n, exceto n = 0, pois apenas a0 e b0 podem ser nao-nulos. Igualmente, observando
(8.56) constata-se que vn (0 ) e proporcional a cn (0 ) para todo n 1 e, com isso, apenas v0 pode ser
nao-nulo. Assim, temos nesse caso, tomando c0 = v0 = 1,
y1 (z) = z 0

y2 (z) = z 0 ln(z) + z 0 .

O termo z 0 na expressao de y2 (z) e o proprio y1 (z), de modo que podemos tomar como solucoes
linearmente independentes as seguintes:
y1 (z) = z 0

y2 (z) = z 0 ln(z) .

(8.99)

Por fim, consideremos


o caso em que + e um inteiro nao-nulo. Definamos 1 e 2 como em
p
(8.57), com n0 = | (a 1)2 4b|.
P
1
n
Ent
a
o
uma
solu
c
a

o
ser
a
y
(z)
=
z
a a forma y2 (z) = Ay1 (z) ln(z) +
1
n=0 cn (1 )z e a outra ter
P
2
n
z
v
z
onde
aqui
os
c
s
a
o
dados
em
(8.59),
os
v
s
a
o
dados
em
(8.60) e A e dada em (8.61).
n
n
n=0 n

Contemplando (8.59) constata-se que cn (1 ) = 0 para todo n 1, pois apenas a0 e b0 podem


ser nao-nulos, sendo que podemos escolher c0 = 1, livremente. Disso conclumos que y1 (z) = z 1 . Por
(8.61) tem-se que A = 0 pois, no caso da equacao de Euler, an0 m = bn0 m = 0 para m = 0, . . . , n0 1.
Por (8.60), tem-se analogamente

para 1 n n0 1 ,
0,
arbitrario , para n = n0 ,
vn =

0,
para n > n0 ,
Assim, apenas v0 e vn0 sao arbitrarios, sendo que v0 deve ser nao-nulo. Escolhendo v0 = 1 e vn0 = 0,
segue que y2 (z) = z 2 . Concluindo, vale aqui que
y1 (z) = z 1

y2 (z) = z 2 .

(8.100)

Todos esses resultados coincidem, como deveria ser, com aqueles obtidos em (7.73) e (7.74), pagina
361 e seguintes.
O estudo das solucoes da equacoes de Euler e u
til na resolucao de equacoes com singularidades
regulares mais gerais como
z 2 y 00 (z) + za(z)y 0 (z) + b(z)y(z) = 0
pela seguinte razao. Proximo ao ponto singular z0 = 0, podemos aproximar a(z) a0 e b(z) b0 , ja
que esses sao os primeiros termos das expansoes de Taylor de a(z) e b(z). Assim, para |z| pequeno o
suficiente, a equacao aproxima-se de
z 2 y 00 (z) + a0 z y 0 (z) + b0 y(z) = 0
que e uma equacao de Euler com a = a0 e b = b0 . Com isso, vemos que as solucoes da equacao
geral se aproximam para |z| pequeno daquelas encontradas em (8.98), (8.99) ou (8.100), dependendo
do caso. Esse proceder permite-nos, face a uma equacao singular regular geral, estudar qual tipo de
singularidade deve ocorrer proximo ao ponto singular e, com isso, perceber qual das solucoes descritas
no Teorema 8.2, pagina 412, se aplica. Em verdade, a resolucao da equacao indicial (8.51) fornece o
mesmo tipo de informacao.

JCABarata. Curso de Fsica-Matem


atica

8.2.3

Vers
ao de 29 de setembro de 2005.

Captulo 8

427/1304

A Equa
c
ao de Bessel

Uma das equacoes diferenciais mais importantes dentro da classe que temos estudado e a equacao
de Bessel, a qual surge em varios problemas aplicados. A mesma pode ser encontrada, por exemplo,
quando da resolucao da equacao de Helmholtz em duas dimensoes em coordenadas polares ou em tres
dimensoes em coordenadas esfericas (levando a`s chamadas funco
es de Bessel esfericas). Vide para tal
o Captulo 10, pagina 544. Para alguns comentarios historicos sobre a origem das equacoes de Bessel
e das funcoes de Bessel, vide pagina 523.
A equacao diferencial
z 2 y 00 (z) + zy 0 (z) + (z 2 2 )y(z) = 0,

com z , onde e uma constante, e denominada equaca


o de Bessel13 de ordem . Comparando
com a forma (8.50), vemos que z0 = 0 e um ponto singular regular da equacao, vemos que a(z) = 1 e
que b(z) = z 2 2 . Assim, no presente caso tem-se


2 , para n = 0
1, para n = 0
1, para n = 2
an =
,
bn =
.
0, para n 1

0, para n = 1 ou n 3
A equacao indicial (8.51) conduz a`s solucoes

+ = .

Ha, portanto, tres casos a considerar: 1. o caso em que 2 6 , 2. o caso em que 2 = 0 e 3. o caso
em que 2 \ {0}. Observe o leitor que as condicoes 2 e 3 correspondem a semi-inteiro ou inteiro.
Os dois casos sao os mais relevantes em Fsica. O caso de inteiro conduz a`s chamadas funco
es de
Bessel e o caso de semi-inteiro conduz a`s chamadas funco
es de Bessel esfericas as quais surgem, por
exemplo, em problemas de propagacao de ondas em duas ou tres dimensoes, respectivamente. Vide
Secao 8.2.4, pagina 438. Para a origem das funcoes de Bessel, vide nota historica a` pagina 523.
Caso 1. 2 6

Nesse caso tem-se duas solucoes


y =

cn ()z n ,

n=0

com cn () dados por (8.53):


n1 h
i
X
1
cn () =
(m )anm + bnm cm () .
n(n + 2) m=0

Podemos nos concentrar apenas nos coeficientes cn (+), pois os coeficientes cn () podem ser obtidos
fazendo-se . Vale
n1 h
i
X
1
cn () =
(m + )anm + bnm cm () ,
n(n + 2) m=0

13

Friedrich Wilhelm Bessel (1784-1846).

(8.101)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

428/1304

e tem-se
c1 () = 0 ,
c2 () =

1
c0 () ,
2(2 + 2)

cn () =

1
cn2 (),
n(n + 2)

n 3.

Com isso, fica claro que


(1)k
c0 () ,
(2k)!! (2 + 2)(4 + 2) (2k + 2)

c2k () =

k0.

k0.

c2k+1 () = 0 ,

E. 8.7 Exerccio importante. Mostre isso!

Au
ltima expressao pode ser reescrita como
c2k () =

(1)k
c0 () ,
k! 22k (1 + )(2 + ) (k + )

c2k+1 () = 0 ,

k0.

k0,

onde usamos que (2 + 2)(4 + 2) (2k + 2) = 2k (1 + )(2 + ) (k + ) e tambem que (2k)!! = 2k k!.
Como a funcao definida em (8.25)-(8.26) satisfaz
(k + 1 + ) = (1 + )(1 + )(2 + ) (k + ) ,
podemos ainda escrever
c2k () =

(1)k (1 + )
c0 () ,
k! 22k (k + 1 + )

c2k+1 () = 0 ,

k0.

k0.

Por convencao historica adota-se


c0 () =

1
(1 + )

e chega-se com isso a` expressao


J (z) :=

X
k=0

 z 2k+
(1)k
.
k! (k + 1 + ) 2

(8.102)

Essa funcao representa uma das solucoes da equacao de Bessel de ordem para o caso considerado e
e denominada funca
o de Bessel de primeiro tipo e ordem . Como comentamos, uma segunda solucao
e obtida fazendo-se :

 z 2k
X
(1)k
.
J (z) :=
k! (k + 1 ) 2
k=0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

429/1304

Conclumos, assim, com a constatacao que a solucao geral da equacao de Bessel de ordem para o
caso 2 6 e
1 J (z) + 2 J (z) ,
onde 1 e 2 sao constantes arbitrarias.
Por convencao historica, e costume considerar-se tambem uma combinacao linear particular de
J (z), a saber a seguinte:
J (z) cos() J (z)
.
(8.103)
N (z) :=
sen ()
Essa funcao N (z) tambem representa uma das solucoes da equacao de Bessel de ordem (por ser uma
combinacao linear de duas outras) e e denominada funca
o de Bessel de segundo tipo e ordem , ou
14
ainda funca
o de Neumann de ordem .
Conclumos, assim, que a solucao geral da equacao de Bessel de ordem para o caso 2 6
pode ser escrita em termos das funcoes J e N na forma

tambem

1 J (z) + 2 N (z) ,
onde 1 e 2 sao constantes arbitrarias.
O estudante deve notar que as funcoes J (z) e N (z), para 2 nao-inteiro, sao analticas em toda
a parte, exceto em z = 0, onde possuem um ponto de ramificacao devido ao fator z = exp( ln(z)).
Caso 2. 2 = 0.
No caso em questao aplicam-se
as solucoes (8.54), (8.55) e (8.56). Aqui tem-se 0 = (1 a0 )/2 = 0
P
n
e para y1 tem-se y1 (z) =
c
(0)z
, com (por (8.55))
n=0 n
n1
i
1 Xh
manm + bnm cm (0) .
cn (0) = 2
n m=0

Essas relacoes sao identicas a`quelas de (8.101) (tomando-se aqui = 0) e, assim, tem por solucao
c2k (0) =

(1)k (1)
(1)k
c
(0)
,
=
c0 (0) ,
0
k! 22k (k + 1)
(k!)2 22k

c2k+1 (0) = 0 ,

k0,

k0

onde usamos que (1) = 1 e (k + 1) = k!. Por convencao historica adota-se


c0 (0) = 1
e chega-se com isso a` expressao
J0 (z) =

X
(1)k  z 2k
.
2
(k!)
2
k=0

(8.104)

Essa funcao representa uma das solucoes da equacao de Bessel de ordem 0 e e denominada funca
o de
Bessel de primeiro tipo e ordem 0.
14

Carl Neumann (1832-1925).

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

430/1304

Para a segunda solucao y2 teremos, por (8.54),


y2 (z) = J0 (z) ln(z) +

vn z n ,

n=0

com os vn dados em (8.56). Como o estudante pode facilmente verificar, adotando-se v0 = 0, obtem-se
para esses coeficientes as seguintes expressoes:
v2k =

(1)k+1
hk ,
(k!)2 22k

v2k+1 = 0 ,

k0,

k0

onde
h0 := 0 ,
hn

(8.105)

n
X
1 1
1
1
:= 1 + + + +
=
,
2 3
n
l
l=1

n1.

(8.106)

Note-se que v0 = 0.
E. 8.8 Exerccio importante. Verifique!

Com isso, a segunda solucao y2 (z) sera


y2 (z) = J0 (z) ln(z) +

X
(1)k+1
k=1

(k!)2

hk

 z 2k
2

(8.107)

Por convencao historica, costuma-se considerar tambem uma particular combinacao das solucoes
J0 (z) e y2 (z):
!


 z 
X
(1)k+1 hn  z 2k
2 
2
y2 (z) + ( ln(2))J0 (z) =
+ ln
J0 (z) +
,
N0 (z) :=

2
(k!)2
2
k=1
(8.108)
15
16
onde e a chamada constante de Euler-Mascheroni , definida por :


1 1
1
:= lim (hn ln(n)) = lim 1 + + + + ln(n) 0, 5772156649 . . . .
n
n
2 3
n
Essa funcao N0 (z) tambem representa uma das solucoes da equacao de Bessel de ordem 0 (por ser
uma combinacao linear de duas outras) e e denominada funca
o de Bessel de segundo tipo e ordem 0,
ou ainda funca
o de Neumann de ordem 0.
15

Leonhard Euler (1707-1783). Lorenzo Mascheroni (1750-1800).


Essa constante foi introduzida por Euler em 1735, o qual calculou seus 16 primeiros dgitos decimais. Em 1790,
Mascheroni calculou seus 32 primeiros dgitos decimais, dos quais apenas os primeiros 19 estavam corretos.
16

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

431/1304

Conclumos, assim, com a constatacao que a solucao geral da equacao de Bessel de ordem 0 e
1 J0 (z) + 2 N0 (z) ,
onde 1 e 2 sao constantes arbitrarias.
O estudante deve notar que a primeira solucao J0 (z) e uma funcao analtica para todo z (pois
a serie em (8.104) converge absolutamente para todo z (mostre isso!)). Ja a solucao N 0 (z) e tambem
analtica em toda parte, exceto em z = 0, onde possui uma singularidade logartmica.
Caso 3. 2

\ {0}.

Como a equacao de Bessel e invariante por , podemos sem perda de generalidade tomar
aqui 2 um inteiro positivo. Como veremos, ha dois casos a considerar: a. e um inteiro positivo e
b. e um semi-inteiro positivo, ou seja, no caso a. tem-se = 1, 2, 3, 4, . . . enquanto que no caso
b. tem-se = 1/2, 3/2, 5/2, . . ..
Caso a. = 1, 2, 3, 4, . . ..
Vamos aqui escrever = p, com p sendo um inteiro positivo: p = 1, 2, 3, 4, . . ..
Com essas convencoes, tem-se que 1 = p, 2 = p e n0 = 2p. As solucoes y1 e y2 sao aquelas dadas
em (8.58), (8.59) e (8.60):
y1 (z) = z

cn (p)z

y2 (z) = Ay1 (z) ln(z) + z

n=0

vn z n ,

n=0

onde, segundo (8.59), as constantes cn (p) satisfazem


n1 h
i
X
1
(m + p)anm + bnm cm (p)
cn (p) =
f (p + n) m=0

para n 1. Novamente, essas relacoes sao identicas a`quelas de (8.101) e, assim, suas solucoes sao
c2k (p) =

(1)k (1 + p)
(1)k p!
c
(p)
=
c0 (p) ,
0
k! 22k (k + 1 + p)
k! 22k (k + p)!

c2k+1 (p) = 0 ,

k0.

k0,

onde usamos que (1 + p) = p! e (k + 1 + p) = (k + p)!. Por convencao historica adota-se


c0 (p) =

1
p!

2p

e chega-se com isso a` expressao


Jp (z) =

X
k=0

 z 2k+p
(1)k
.
k! (k + p)! 2

Essa funcao representa uma das solucoes da equacao de Bessel de ordem p (com p = 1, 2, 3, 4, . . .) e
e denominada funca
o de Bessel de primeiro tipo e ordem p.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

432/1304

O leitor e convidado a constatar que a expressao (8.104) para J0 (z) e identica a essa se tomarmos
p = 0.
Procuremos agora a segunda solucao y2 (z):
y2 (z) = AJp (z) ln(z) + z p

vn (p)z n .

n=0

Por (8.60),

n1 

X

(m p)anm + bnm vm (p) ,

f (n p) m=0

arbitrario ,
vn (p) =

#
"

n1


1

(m p)anm + bnm vm (p) ,

f (n p) Agn2p +
m=0

para 1 n 2p 1 ,
para n = 2p ,
para n > 2p,

A constante A e dada em (8.61) e, para o presente caso, tem-se

2p1
X
1
2p p!
A =
v2p2 (p) .
[(m p)a2pm + b2pm ] vm (p) =
2p c0 (p) m=0
2p

Agora, por (8.60),


2p3

X
1
v2p2 (p) =
(m p)a2p2m + b2p2m vm (p) ,
f (p 2) m=0

de onde se ve imediatamente que


v2p2 (p) =
e, portanto,
v2p2 (p) =

1
v2p4 (p),
1)

p2,

22 (p

1
v0 (p),
22(p1) (p 1)!

p2.

Logo, A = 4v0 (p). Adotando-se v0 (p) = 1/4 teremos A = 1 e


y2 (z) = Jp (z) ln(z) + z

X
n=0

vn (p)z n .

(8.109)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

433/1304

com

n1 

X

(m

p)a
+
b

nm
nm vm (p) ,

f (n p) m=0

vn (p) =
arbitrario ,

"
#

n1


1

(m p)anm + bnm vm (p) ,

f (n p) gn2p +
m=0

para 1 n 2p 1 ,
para n = 2p ,
para n > 2p,
(8.110)

com os gn dados em (8.62) em termos de cn (p).

Um calculo um pouco trabalhoso, que nos poupamos de apresentar em detalhe, conduz ao seguinte
resultado:
1 X (p n 1)!  z 2np 1 X (1)n (hn + hn+p )  z 2n+p

,
y2 (z) = Jp (z) ln(z)
2 n=0
n!
2
2 n=0
n! (n + p)!
2
p1

com p = 1, 2, 3, 4, . . ..
E. 8.9 Exerccio. Tome uma hora livre e mostre isso.

O leitor e convidado
a constatar que a expressao (8.107) e identica a essa se tomarmos p = 0 (com
P
(
a convencao que 1
n=0 ) = 0).

Por convencao historica, costuma-se considerar tambem uma particular combinacao das solucoes
Jp (z) e y2 (z):

Np (z) :=
2

+ ln


2
y2 (z) + ( ln(2))Jp (z) =

 z 
2

1 X (p n 1)!  z 2np 1 X (1)n (hn + hn+p )  z 2n+p


Jp (z)

2 n=0
n!
2
2 n=0
n! (n + p)!
2
p1

, (8.111)

onde e a constante de Euler-Mascheroni mencionada acima. Essa funcao Np (z) tambem representa
uma das solucoes da equacao de Bessel de ordem p (por ser uma combinacao linear de duas outras) e
e denominada funca
o de Bessel de segundo tipo e ordem p, ou ainda funca
o de Neumann de ordem p.
Conclumos, assim, com a constatacao que a solucao geral da equacao de Bessel de ordem p, p =
1, 2, 3, 4, . . ., e
1 Jp (z) + 2 Np (z) ,
onde 1 e 2 sao constantes arbitrarias.
O estudante deve notar que a primeira solucao Jp (z) e uma funcao analtica para todo z (pois
a serie em (8.104) converge absolutamente para todo z (mostre isso!)). Ja a solucao N p (z) e tambem
analtica em toda parte, exceto em z = 0, onde possui uma singularidade logartmica assim como um
polo de ordem p.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

434/1304

Advertencia. O estudante deve ser advertido do fato de nao haver, infelizmente, uniformidade na
literatura quanto a` definicao exata das varias funcoes de Neumann N apresentadas acima, pois alguns
textos, especialmente alguns mais antigos, adotam para N uma combinacao linear com constantes
ligeiramente diferentes daquelas de (8.103), (8.108) ou (8.111). A convencao que adotamos e a mais
freq
uente modernamente. As funcoes de Neumann sao tambem por vezes denotadas por Y .
Precisamos estudar ainda o caso em que e um n
umero semi-inteiro onde, diferentemente do caso
que acabamos de estudar, as solucoes independentes sao ambas livres de singularidades logartmicas.
Caso b. = 1/2, 3/2, 5/2, . . ..
Vamos convencionar escrever = q + 1/2, com q = 0, 1, 2, . . .. Teremos aqui n 0 = (2q + 1),
1 = = q + 1/2 e 2 = = q 1/2. As solucoes y1 e y2 sao aquelas dadas em (8.58), (8.59) e
(8.60):

X
X
q+1/2
n
q1/2
y1 (z) = z
cn (q)z
e y2 (z) = Ay1 (z) ln(z) + z
vn (q)z n ,
n=0

n=0

onde, segundo (8.59), as constantes cn (q) satisfazem



n1 
X
1
1

m+q+
anm + bnm cm (q) ,
cn (q) =
2
f n + q + 21 m=0

(8.112)

para n 1. Novamente, essas relacoes sao identicas a`quelas de (8.101) com substitudo por q + 1/2
e, assim, suas solucoes sao

(1)k 1 + q + 21
 c0 (q) , k 0 .
c2k (q) =
k! 22k k + 1 + q + 12
c2k+1 (q) = 0 ,

k0,

onde usamos (1 + q + 1/2) = q!(1/2) e (k + 1 + q + 1/2) = (k + q)!(1/2). Adotando


c0 (q) =
chegamos a` expressao
Jq+1/2 (z) :=

X
k=0

2q+1/2

1
,
1 + q + 12

 z 2k+q+1/2
(1)k
.
k! (k + 1 + q + 1/2) 2

Essa funcao representa uma das solucoes da equacao de Bessel de ordem q + 1/2 com q = 0, 1, 2, . . .
e e denominada funca
o de Bessel de primeiro tipo e ordem q + 1/2.
Passemos agora a` segunda solucao
y2 (z) = AJq+1/2 (z) ln(z) +

X
n=0

vn (q)z nq1/2 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

435/1304

Por (8.60),



n1 
X

1
1


mq
anm + bnm vm (q) ,
1 n 2q ,

2
f n q 21 m=0

arbitrario ,
n = 2q + 1 ,
vn (q) =

(
)



n1 

1
1

mq
anm + bnm vm (q) , n > 2q + 1,

f n q 1  Agn2q1 +
2
2
m=0

onde,



2q 
X
1
1
A =
a2q+1m + b2q+1m vm (q)
mq
c0 (q) (2q + 1) m=0
2

Para 1 n 2q tem-se

vn (q) =

Porem,
1
v1 (q) =
1
f ( 2 q)

1
vn2 (q) .
f (n q 21 )



1
0q
2

(8.113)

(8.114)

a1 + b1 v0 (q) = 0 ,

pois a1 = b1 = 0. Conjuntamente com (8.114), isso diz-nos que vn (q) = 0 para todo n mpar com
1 n 2q. A importancia dessa observacao reside no seguinte. Por (8.113) ve-se facilmente que
A =

1
v2q1 (q) .
c0 (q) (2q + 1)

Portanto, tem-se no caso presente que A = 0 e, assim, a segunda solucao e livre de singularidades
logartmicas. Alem disso, com A = 0 as expressoes recursivas para vn (q) simplificam-se para



n1 
X

1
1


anm + bnm vm (q) ,
1 n 2q ,
mq

2
f n q 21 m=0

arbitrario ,
n = 2q + 1 ,
(8.115)
vn (q) =

( n1 
)




1
1

mq
anm + bnm vm (q) , n > 2q + 1.

f n q 1
2
2
m=0

Como ja vimos, para 1 n 2q os vn (q) com n mpar sao nulos. Como v2q+1 e arbitrario, e
conveniente escolhe-lo igual a zero tambem. Com isso, as relacoes (8.115) ficam identicas a`quelas de
(8.101) com substitudo por (q + 1/2) e, assim, suas solucoes sao

(1)k 1 q 21
 v0 (q) , k 0 .
v2k (q) =
k! 22k k + 1 q 21
v2k+1 (q) = 0 ,

k0,

JCABarata. Curso de Fsica-Matem


atica

Adotando
v0 (q) =

2q1/2

chagamos a` seguinte expressao:


Jq1/2 (z) =

X
k=0

Captulo 8

Vers
ao de 29 de setembro de 2005.

436/1304

1
,
1 q 12

 z 2kq1/2
(1)k

.
2
k! k + 1 q 12

Essa funcao representa uma segunda solucao da equacao de Bessel de ordem q+1/2 com q = 0, 1, 2, . . .
e e denominada funca
o de Bessel de primeiro tipo e ordem (q + 1/2).

Conclumos, assim, que a solucao geral da equacao de Bessel de ordem q+1/2 com q = 0, 1, 2, 3, . . .,

e
1 Jq+1/2 (z) + 2 Jq1/2 (z) ,
onde 1 e 2 sao constantes arbitrarias.
Podemos definir tambem as funco
es de Neumann de ordem q + 1/2 em analogia com (8.103), mas
aqui, tem-se
Nq+1/2 (z) :=

Jq+1/2 (z) cos((q + 1/2)) Jq1/2 (z)


= (1)q+1 Jq1/2 (z) .
sen ((q + 1/2))

(8.116)

De qualquer forma, a solucao geral da equacao de Bessel de ordem q + 1/2 com q = 0, 1, 2, 3, . . ., e


1 Jq+1/2 (z) + 2 Nq+1/2 (z) ,
onde 1 e 2 sao constantes arbitrarias.
O estudante e convidado a constatar que Jq+1/2 (z) e uma funcao analtica para todo z , z 6= 0,
mas em z = 0 possui uma singularidade como z q+1/2 , que e uma singularidade do tipo ponto ramificacao
(de grau 2). Paralelamente, Jq1/2 (z) (e, portanto, Nq+1/2 (z)) e analtica para todo z 6= 0, mas possui
em z = 0 uma singularidade como z q1/2 , que e uma singularidade do tipo ponto ramificacao (de grau
2). Essas afirmacoes sao ilustradas no proximo exerccio.
E. 8.10 Exerccio semi-resolvido. Com q = 0 tem-se pelas nossas definicoes acima
J1/2 (z) =

X
k=0

 z 2k+1/2
(1)k
k! (k + 1 + 1/2) 2

Usando as identidades
(3/2) (2k + 1)!!
=
(k + 1 + 1/2) =
2k
2k k! = (2k)!! ,

J1/2 (z) =

X
k=0

 z 2k1/2
(1)k

.
2
k! k + 12

(2k + 1)!!
,
2
2k

(2k + 1)!!(2k)!! = (2k + 1)! ,

(2k)!!(2k 1)!! = (2k)! ,

(prove-as!) teremos,
J1/2 (z) = z

1/2

2 X (1)k
z 2k+1 ,
k=0 (2k + 1)!

J1/2 (z) = z

1/2

2 X (1)k 2k
z ,
k=0 (2k)!

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

437/1304

e reconhecemos que
J1/2 (z) =

2 sen (z)
z 1/2

Observe ainda que


J1/2 (z) = z
sendo que

sen (z)
z

1/2

J1/2 (z) =
r

2 cos(z)
.
z 1/2

(8.117)

2 sen (z)
,

e uma funcao analtica para todo z , inclusive em z = 0 (por que?).

Complete os detalhes faltantes de todos os calculos indicados acima.

E. 8.11 Exerccio. Verifique por calculo explcito que as funcoes sen (z)/z 1/2 e cos(z)/z 1/2 sao, de fato,
solucoes da equacao de Bessel de ordem = 1/2.
6
Para futura referencia, reunimos nossos resultados sobre as solucoes da equacao de Bessel no seguinte
teorema:
Teorema 8.3 (Solu
co
es da equa
c
ao de Bessel) Seja a equaca
o de Bessel de ordem
z 2 y 00 (z) + zy 0 (z) + (z 2 2 )y(z) = 0,
com z .
1. Caso 6

duas soluco
es independentes s
ao J (z) e J (z), onde
J (z) :=

X
k=0

 z 2k+
(1)k
.
k! (k + 1 + ) 2

(8.118)

Definindo
N (z) :=

J (z) cos() J (z)


,
sen ()

as funco
es J (z) e N (z) s
ao tambem duas soluco
es independentes.
2. Caso
podemos, sem perda de generalidade, adotar 0, pois a equaca
o de Bessel e
invariante pela mudanca . Com essa convenca
o, duas soluco
es independentes s
ao J (z)
e N (z), onde
J (z) :=

X
k=0

 z 2k+
 z 2k+
X
(1)k
(1)k
=
k! (k + 1 + ) 2
k! (k + )! 2
k=0

(8.119)

N (z) :=
2

+ ln

 z 
2

1 X ( n 1)!  z 2n 1 X (1)n (hn + hn+ )  z 2n+

J (z)
2 n=0
n!
2
2 n=0
n! (n + )!
2
1

JCABarata. Curso de Fsica-Matem


atica

sendo que
h0 := 0 ,

hn

Captulo 8

Vers
ao de 29 de setembro de 2005.

n
X
1
1
1 1
=
,
:= 1 + + + +
2 3
n
l
l=1

438/1304

n1.

e e a constante de Euler-Mascheroni: := lim (hn ln(n)) 0, 5772156649 . . ..


n

As funco
es J (z), , s
ao denominadas funcoes de Bessel de primeiro tipo e ordem , ou
simplesmente funcoes de Bessel de ordem . As funco
es N (z), , s
ao denominadas funcoes de
Bessel de segundo tipo e ordem , ou funcoes de Neumann de ordem .
2
Coment
ario. O caso em que e semi-inteiro esta includo no caso 1, acima: 6

Nota sobre as fun


co
es de Bessel de ordem inteira negativa
Ate o momento definimos as funcoes de Bessel J atraves das expressoes (8.118) e (8.119), mas
apenas para s que nao sejam inteiros negativos. A expressao (8.118) contem uma funcao (x) no
denominador e (x) diverge se x for inteiro negativo. Por isso, em princpio (8.118) nao esta definida
para s inteiros negativos.
A experiencia mostrou, porem, que e conveniente definir J para s que sejam inteiros negativos
atraves da seguinte expressao:
Jm (z) := (1)m Jm (z) ,
(8.120)
para todo m e todo z . Note que, como a equacao de Bessel e invariante pela troca ,
Jm definida acima e solucao da equacao de Bessel de ordem m. A conveniencia dessa convencao nao
pode ser apreciada no momento, mas ira manifestar-se quando discutirmos algumas propriedades das
funcoes de Bessel na Secao 9.2.6, que inicia-se na pagina 522, tais como as relacoes de recorrencia e a
funcao geratriz.


E. 8.12 Exerccio. Mostre que com a convencao acima vale


Jm (z) = Jm (z),

m


Sugestao: Jm (z) e uma soma de monomios da forma z 2k+m e vale (z)2k+m = (1)m z 2k+m .

8.2.4

Equa
co
es Relacionadas `
a de Bessel. A Equa
c
ao de Bessel Esf
erica

Diversas equacoes diferenciais podem ser transformadas na de Bessel e podem ter suas solucoes expressas em termos de funcoes de Bessel e de Neumann. Uma classe bastante geral e composta pelas
equacoes da forma


z 2 y 00 (z) + (1 2)zy 0 (z) + 2 2 z 2 + 2 2 2 y(z) = 0 ,
(8.121)
com , , e constantes (com 6= 0), cuja solucao mais geral e
az J (z ) + bz N (z ) ,
onde a e b sao constantes arbitrarias.

(8.122)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

439/1304

E. 8.13 Exerccio. Prove as afirmacoes acima, ou seja, prove que (8.122) e asolucao geral de (8.121).
Sugestao: defina a funcao v por y(z) =: z v(z ) e, substituindo em (8.121), mostre que v satisfaz a
equacao de Bessel de ordem .
6
Dois casos particulares de interesse, dentro da classe definida em (8.121), sao a equacao de Airy (que
corresponde a = 1/2, = 2/3, = 3/2 e = 1/3) e a equacao de Bessel esferica (que corresponde a
= 1/2, = 1, = 1 e = + 1/2). Trataremos desses casos logo abaixo.

O estudante deve observar que, caso 2 nao seja um inteiro positivo ou zero, a equacao (8.121) nao
e singular regular em z0 = 0 (compare a` (8.47)) e, portanto, a ela nao se aplica o metodo de Frobenius.
A solucao dada em (8.122), de fato, nao e como aquelas obtidas pelo metodo de Frobenius, que seriam
da forma z (z) ou da forma z ln(z)(z), para alguma constante e com analtica em torno de
z0 = 0. Por exemplo, tem-se
z J (z ) =

 z + X
(1)k 2k+  z 2k
,
2
k! (k + 1 + ) 2
k=0

que nao e da forma z (z) com analtica em torno de z0 = 0, pois a serie do lado direito nao e uma
serie de potencias em z.
A equa
c
ao de Airy e a equa
c
ao de Bessel
Como dissemos acima, varias equacoes diferenciais podem ser transformadas em equacoes de Bessel.
Um exemplo e o da equacao de Airy: y 00 (z) zy(z) = 0, cujas solucoes foram apresentadas na Secao
17
8.1.4, pagina 404. A maneira mais simples de ver isso
. Se y e uma solucao da equacao de

e a seguinte
2 3/2
Airy, entao a funcao v(z) definida por por y(z) =: zv 3 z
satisfaz a equacao de Bessel de ordem
= 1/3, como facilmente se constata.
E. 8.14 Exerccio. Verifique isso!

Conclumos da que
as solucoes y(z)
da equacao de Airy podem ser escritas como combinacoes
lineares das funcoes zJ1/3 32 z 3/2 e zJ1/3 32 z 3/2 . Com efeito, pelas definicoes (8.29)-(8.31) e
(8.118) (para = 1/3) pode-se facilmente constatar a validade das relacoes





2 3/2
2 3/2
z 1/2
+ J1/3
,
(8.123)
J1/3
Ai(z) =
z
z
3
3
3





z 1/2
2 3/2
2 3/2
Bi(z) =
z
J1/3
z
.
J1/3
3
3
3

(8.124)

que permitem expressar as funcoes de Airy Ai e Bi em termos das funcoes J1/3 .


E. 8.15 Exerccio. Prove as relacoes (8.123)-(8.124) usando (8.29)-(8.31) e (8.118).

Na Secao 10.2.3, pagina 560, veremos uma aplicacao dessas consideracoes sobre as solucoes da
equacao de Airy.
17

Uma outra maneira usa propriedades de simetria da equaca


o hipergeometrica confluente.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

440/1304

A equa
c
ao de Bessel esf
erica
A equacao diferencial
z 2 y 00 (z) + 2zy 0 (z) + (z 2 ( + 1))y(z) = 0 ,
para z , com , constante, e denominada equaca
o de Bessel esferica de ordem .

A equacao de Bessel esferica surge, por exemplo, quando da resolucao da equacao de Helmholtz em
tres dimensoes em coordenadas esfericas (vide Captulo 10, pagina 544) e, portanto, e importante para
o estudo da propagacao de ondas ou de fenomenos de difusao em tres dimensoes.
Se definirmos v(z) = z 1/2 y(z), obtemos para v a equacao diferencial
2 !

1
v(z) = 0 ,
z 2 v 00 (z) + zv 0 (z) + z 2 +
2
uentemente as solucoes da
que nada mais e que a equacao de Bessel usual de ordem + 12 . Conseq
equacao de Bessel esferica sao da forma
y(z) = A

J+ 1 (z)
N+ 1 (z)
2
+ B 2
,
z
z

onde A e B sao constantes arbitrarias.


Em funcao disso, definem-se as chamadas funco
es de Bessel esfericas de ordem por
r

j (z) :=
J 1 (z) ,
2z + 2
e as chamadas funco
es de Neumann esfericas de ordem por
r

N 1 (z) .
n (z) :=
2z + 2

(8.125)

(8.126)

bastante claro que as funcoes n (z) sao singulares em z = 0, enquanto que as funcoes j (z) nao
E
divergem em z = 0, sendo ate mesmo funcoes inteiras (analticas em toda parte) para inteiro naonegativo.
Um caso de particular interesse e aquele no qual = l
geral da equacao de Bessel esferica na forma


. Nesse caso, podemos escrever a solucao

y(z) = ajl (z) + bnl (z) ,


com a e b constantes arbitrarias, onde
r

jl (z) :=
J 1 (z) ,
e
2z l+ 2
r
r

(8.116)
l+1
1 (z) .
Nl+ 1 (z) = (1)
J
nl (z) :=
2
2z
2z (l+ 2 )

(8.127)

(8.128)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

441/1304

Note que, por (8.117), tem-se


sen (z)
z

j0 (z) =

n0 (z) =

cos(z)
.
z

(8.129)

Algumas propriedades das funcoes de Bessel esfericas serao estudadas na Secao 9.2.7, pagina 537.

8.2.5

A Equa
c
ao de Laguerre

A equaca
o de Laguerre18 e a equacao diferencial
zy 00 (z) + (1 z)y 0 (z) + y(z) = 0,
com z , onde

e uma constante.

A equacao de Laguerre, e uma parente proxima, a equacao de Laguerre associada, apresentada


na Secao 8.3.2, pagina 452, emergem em um dos problemas mais importantes da Fsica, a equacao
de Schrodinger para o atomo de hidrogenio em coordenadas esfericas. Vide Secao 10.5, pagina 568.
A equacao de Laguerre e tambem um caso particular da equacao hipergeometrica confluente, a ser
discutida na Secao 8.2.7, pagina 447.
Comparando com a forma (8.50), vemos que z0 = 0 e um ponto singular regular da equacao, vemos
que a(z) = 1 z e que b(z) = z. Assim, no presente caso tem-se


1, para n = 0
, para n = 1
1, para n = 1 ,
an =
bn =
.
0, para n = 0 ou n 2

0, para n 2

elementar constatar-se que, para essa equacao, = + = 0 e, portanto, estamos no caso 2 do


E
Teorema 8.2 da pagina 412 com f (x) = x2 , 0 = 0,
y1 (z) =

cn z

y2 (z) = y1 (z) ln(z) +

n=0

onde
cn
e
vn

18

vn z n ,

n1
i
1 Xh
n+1
= 2
manm + bnm cm =
cn1 ,
n m=0
n2

1
= 2
n

"

2n 1 cn

1
= 2
n

"

n
X

m=0

2n cn + cn1

Edmond Nicolas Laguerre (1834-1886).

(8.130)

n=0

anm cm +

n1 h
X

manm + bnm vm

m=0

n+1
vn1 ,
n2

n2,

n 1 ,

#
(8.131)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

442/1304

Adotando-se c0 = 1, obtem-se para n 1


cn

n1
(1)n Y
(1)n ( + 1)
=
(

l)
=
(n!)2 l=0
(n!)2 ( n + 1)

e y1 (z) fica
y1 (z) = 1 +

X
(1)n
n=1

(n!)2

n1
Y
l=0

( l)

X
(1)n ( + 1)
= 1+
zn .
2
(n!) ( n + 1)
n=1

(8.132)

A situacao de maior interesse em Fsica e aquela na qual e um inteiro positivo: = m . A


razao disso sera explicada detalhadamente no Apendice 8.E, pagina 477, mas adiantamos que nos casos
em que nao e um inteiro positivo a solucao y1 cresce muito rapidamente (exponencialmente) quando
z e restrito ao semi-eixo real positivo. Esse comportamento e inadequado em varias aplicacoes, por
exemplo no classico problema do atomo de hidrogenio da Mecanica Quantica, o que leva ao descarte
de tais solucoes.


Ja no caso em que e um inteiro positivo, = m , a solucao dada em (8.132) reduz-se a um


polinomio de grau m:
!
m
m
n1
X
X
(1)n
(1)n Y
m!
n
(m

l)
z
=
1
+
y1 (z) = 1 +
zn
2
2
(n!)
(n!)
(m

n)!
n=1
n=1
l=0


 
m
X
(1)n m
zn
=
n
n!
n=0

Os chamados polin
omios de Laguerre, denotados por Lm (z), sao definidos como m! vezes o polinomio
19
acima :
 
m
X
m
n m!
Lm (z) :=
(1)
zn .
(8.133)
n!
n
n=0

Os quatro primeiros sao


L0 (z) = 1,

L1 (z) = 1 z,

L2 (z) = 2 4z + z 2 ,

L3 (z) = 6 18z + 9z 2 z 3 .

facil provar, tambem, que a seguinte expressao e valida (vide pagina 516):
E
Lm (z) = ez

dm  m z 
z e
.
dz m

(8.134)

Os polinomios de Laguerre Lm (z) sao, portanto, uma das solucoes da equacao de Laguerre (com
= m)
zy 00 (z) + (1 z)y 0 (z) + my(z) = 0,
(8.135)
19
O fator de normalizaca
o m! tem origem hist
orica. O leitor deve ser advertido do fato, j
a lamentado p
aginas acima,
que em alguns textos outra normalizaca
o e empregada.

JCABarata. Curso de Fsica-Matem


atica

com z , onde m


Vers
ao de 29 de setembro de 2005.

Captulo 8

443/1304

. De acordo com (8.130), uma segunda solucao e dada na forma


y2 (z) = Lm (z) ln(z) +

vn z n ,

n=0

onde os coeficientes vn sao dados em (8.131) em termos dos coeficientes cn dos polinomios de Laguerre.
Apos calculos um tanto macantes, chega-se a` seguinte expressao:
m
X

m!
y2 (z) = Lm (z) ln(z) +
(1)
k!
k=1
k

 
m
(hmk hm 2hk ) z k
k
+ (1)

X
k=1

(m +

(k 1)!
z m+k ,
+ 2)2 (m + k)2

1)2 (m

onde hn esta definido em (8.105)-(8.106).


E. 8.16 Exerccio. Mostre isso. Sugestao: tire uma tarde livre.

E. 8.17 Exerccio. Caso o leitor nao deseje fazer o exerccio anterior, podera contentar-se com a tarefa
mais simples de verificar que a expressao acima e, de fato, uma solucao de (8.135).
6
Essa segunda solucao e raramente empregada em problemas de Fsica, especialmente devido a`
singularidade logartmica que apresenta.
Mais propriedades dos polinomios de Laguerre serao estudadas na Secao 9.2.4, pagina 515.

8.2.6

A Equa
c
ao Hipergeom
etrica

A equacao diferencial
z(1 z)y 00 (z) + [ (1 + + )z]y 0 (z) y(z) = 0,

(8.136)

para z
e com , e
constantes, e denominada equaca
o hipergeometrica, ou equaca
o de
20
Gau , quem a primeiro estudou. A razao do interesse nessa equacao reside em tres fatos. Primeiro, a
equacao hipergeometrica e (a menos de multiplicacao trivial por uma constante) a u
nica equacao linear
homogenea de segunda ordem com apenas tres pontos singulares regulares em 0, 1 e (vide discussao
a` pagina 368). Segundo, ha varias equacoes diferenciais de interesse que podem ser transformadas em
equacoes hipergeometricas e, com isso, pode-se estudar certas propriedades de varias funcoes especiais, tais como seu comportamento assintotico, a partir das propriedades correspondentes de funcoes
hipergeometricas. Terceiro, suas solucoes possuem muitas simetrias. A equacao hipergeometrica e uma
20

Carl Friedrich Gau (1777-1855). Um dos maiores e mais influentes matem


aticos de todos os tempos, Gau dedicouse tambem intensamente a problemas de Fsica, Astronomia, Matem
atica Aplicada e mesmo Engenharia (e um dos
co-inventores do telegrafo) e encontrou as equaco
es hipergeometricas em estudos de Geodesia, assunto a que se dedicou
quando da construca
o das primeiras linhas ferreas da Alemanha. Seus trabalhos nessa a
rea tambem inspiraram uma das
suas muitas contribuico
es importantes a
` matem
atica pura: a formulaca
o de geometrias n
ao-Euclidianas.

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

444/1304

das equacoes diferenciais ordinarias mais estudadas, sendo suas solucoes riqussimas em propriedades.
Sua abordagem completa esta muito alem das pretensoes destas Notas e, para um tratamento detalhado, recomendamos as referencias [66], [122], [136], [83], [64] e outras. Propriedades combinatorias
envolvendo as series hipergeometricas e suas generalizacoes podem ser encontradas em [50].
Vamos aqui apresentar as solucoes da equacao hipergeometrica (8.136) em termos de expansoes em
torno de seu ponto singular regular z0 = 0. O leitor podera encontrar em [122] solucoes de (8.136)
expressas como expansoes em torno dos outros pontos singulares regulares z 0 = 1 e z0 = . O interesse
nessas u
ltimas expansoes e um tanto menor, especialmente pois as mesmas podem ser expressas em
termos das solucoes obtidas em torno de z0 = 0. Reescrevemos (8.136) na forma
b(z)
a(z) 0
y (z) + 2 y(z) = 0,
z
z
sendo a(z) e b(z) analticas em |z| < 1, a saber,
y 00 (z) +

(8.137)

X
X
(1 + + )z
n
a(z) =
=
an z = +
( 1 )z n ,
1z
n=0
n=1

X
X
z
n
=
bn z =
()z n .
b(z) =
1z
n=0
n=1

A equacao indicial, neste caso, e

f (x) = x(x 1) + x = x(x + 1) = 0


e temos
= 1
Ha, assim, tres casos a considerar: 1. 1 6
seja, mas 6= 1.

Caso 1. 1 6

, ou seja, 6

+ = 0 .

, ou seja, 6

. 2. = 1. 3. 1

\ {0}, ou

Aqui, de acordo com (8.52) e (8.53), as solucoes sao


y1 (z) = z 1

cn z n

y2 (z) =

n=0

onde
cn =

dn z n ,

(8.138)

n=0

n1 h
i
X
1
(m + 1 )anm + bnm cm ,
f (1 + n) m=0

dn =

n1
i
1 Xh
manm + bnm dm ,
f (n) m=0

para todo n 1. Nesse caso, porem, nao e tao simples resolver recursivamente essas equacoes, pelo
muito mais facil obter as relacoes recursivas de
menos na maneira como estao expressas acima. E
outra forma: inserindo (8.138) na equacao diferencial ainda na forma (8.136). Com esse procedimento,
comecando pela solucao y2 (z), obtem-se alegremente para os coeficientes dn a seguinte relacao recursiva:
dn+1 =
para todo n 0.

( + n)( + n)
dn ,
(n + 1)( + n)

(8.139)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

445/1304

E. 8.18 Exerccio importante. Verifique!

Convencionando-se tomar d0 = 1, chegamos a


dn =

()n ()n
,
n!()n

onde, para n 1,
(x)n := x(x + 1) (x + n 1) =

n1,
n1
Y

(x + l) =

l=0

(x + n)
,
(x)

sao os denominados smbolos de Pochhammer21 . Com isso, obtemos para a solucao y2 a expressao
F (, , , z) := 1 +

X
()n ()n
n=1

n!()n

() X ( + n)( + n) z n
=
.
()() n=0
( + n)
n!

(8.140)

Essa funcao, introduzida por Gau em cerca de 1812, e denominada funca


o hipergeometrica, denominacao aparentemente criada por Kummer22 em 1836. Contriburam a` teoria das funcoes hipergeometricas nomes como Euler, Gau, Kummer e Riemann. Na literatura F (, , , z) e muitas
vezes denotada por 2 F1 (, , , z)23 .
Repetindo consideracoes anteriores, F (, , , z) e analtica como funcao de z pelo menos na
regiao |z| < 1. No caso em que ou sao inteiros nao-positivos, e facil ver que F (, , , z)
reduz-se a um polinomio e e, portanto, analtica em toda parte. Exceto nesses casos, a serie que define
F (, , , z) e divergente para |z| > 1, como se ve pelo teste da razao, pois
()n+1 ()n+1 n+1


| + n| | + n|
(n+1)!()n+1 z

|z| ,
()n ()n
=
n


(n + 1) | + n|
z
n!()n

que para n grande aproxima-se de |z| > 1. Casualmente, o mesmo argumento prova convergencia da
serie hipergeometrica (8.140) para |z| < 1.

Fazemos ainda notar que a expressao acima para F (, , , z) esta definida mesmo para o caso em
que e um inteiro positivo e, portanto, representa uma solucao da equacao hipergeometrica naquele
caso. Para nulo ou um inteiro negativo, digamos = m, o denominador ()n anula-se para n > m
e a expressao para F (, , , z) deixa de fazer sentido.
Para obtermos a outra solucao inserimos y1 de (8.138) na equacao diferencial ainda na forma (8.136)
e obtemos alegremente para os coeficientes cn a relacao
cn+1 =
para todo n 0.
21

(n + + 1 )(n + + 1 )
cn ,
(n + 1)(n + 2 )

Leo August Pochhammer (1841-1920).


Ernst Eduard Kummer (1810-1893).
23
A explicaca
o da notaca
o 2 F1 e a seguinte: o 2 a
` esquerda indica a presenca de dois smbolos de Pochhammer no
numerador dos termos da serie hipergeometrica (8.140). O 1 a
` direita indica a presenca de um smbolo de Pochhammer
no denominador. H
a generalizaco
es da serie (8.140) que definem as chamadas funco
es hipergeometricas generalizadas, denotadas por k Fl , e que contem k smbolos de Pochhammer no numerador e l no denominador. Mais abaixo encontraremos
as funco
es hipergeometricas confluentes, que s
ao do tipo 1 F1 .
22

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

446/1304

E. 8.19 Exerccio importante. Verifique!

Alguns segundos de contemplacao nos levam a concluir que essas relacoes sao identicas a`quelas de
(8.139), desde que la facamos as seguintes modificacoes: + 1 , + 1 e 2 .
Por tras dessa aparente coincidencia residem propriedades de simetria da equacao hipergeometrica. O
leitor podera encontrar essa discussao nos textos supra-citados.
Assim, tomando-se tambem c0 = 1, conclumos que a outra solucao e
z 1 F ( + 1 , + 1 , 2 , z) .
Fazemos ainda notar que F ( + 1 , + 1 , 2 , z) esta definida mesmo para o caso em que
e um inteiro nao-positivo e, portanto, z 1 F ( + 1 , + 1 , 2 , z) representa uma solucao
da equacao hipergeometrica naquele caso.
Resumindo nossas conclusoes, para o caso 6 a solucao geral da equacao hipergeometrica (8.136)
expressa em termos de uma expansao em torno do ponto singular regular z0 = 0 e
A1 z 1 F ( + 1 , + 1 , 2 , z) + A2 F (, , , z) .
onde A1 e A2 sao constantes arbitrarias.
Caso 2. = 1.
Aqui = + = 0 = 0. Nesse caso a primeira solucao e da forma y1 (z) =
analogo, obtemos
( + n)( + n)
cn ,
cn+1 =
(n + 1)2
para todo n 0. Assim, a primeira solucao e
F (, , 1, z) = 1 +

X
()n ()n
n=1

(n!)2

n=0 cn

z n e, de modo
(8.141)

X
zn
1
( + n)( + n)
=
.
()() n=0
(n!)2

Pelo mesmo argumento de acima, a expansao em serie do lado direito converge para |z| < 1 e diverge
para |z| > 1.
Pelo Teorema 8.2, pagina 412, a segunda solucao tem a forma
F (, , 1, z) ln(z) +

vn z n ,

n=0

com os vn dados em (8.56) em termos dos cn de acima. A expressao que se obtem e um tanto complexa
e evitamos coloca-la aqui. O leitor podera encontra-la, por exemplo, em [122].
Caso 3. 1

\ {0}, ou seja,

mas 6= 1.

Ha dois casos a distinguir: a. > 1 e b. 0.

No caso a, = m, com m > 1 inteiro. Aqui tem-se n0 = m 1, 1 = + = 0 e 2 = = 1 m.


Como ja observamos acima, uma solucao e dada por F (, , m, z). Uma segunda solucao sera da
forma

X
1m
vn z n ,
AF (, , m, z) ln(z) + z
n=0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

447/1304

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de F (, , m, z). Novamente,
a expressao que se obtem e complexa e remetemos o estudante a, e.g., [122].
No caso b, = m, com m 0 inteiro. Aqui tem-se n0 = m + 1, 1 = = 1 + m e 2 = + = 0.
Como ja observamos acima, uma solucao e dada por z 1+m F ( + 1 + m, + 1 + m, 2 + m, z). Uma
segunda solucao sera da forma
Az

1+m

F ( + 1 + m, + 1 + m, 2 + m, z) ln(z) +

vn z n ,

n=0

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de z 1+m F ( + 1 + m, +


1 + m, 2 + m, z). Novamente, a expressao que se obtem e complexa e remetemos o estudante a, e.g.,
[122].
Com isso encerramos nossa breve excursao a`s funcoes hipergeometricas e remetemos o estudante
interessado em um maior aprofundamento a` literatura supra-citada.

8.2.7

A Equa
c
ao Hipergeom
etrica Confluente

A equacao diferencial
zy 00 (z) + [ z]y 0 (z) y(z) = 0,

(8.142)

o hipergeometrica confluente ou equaca


o
para z e com e constantes, e denominada equaca
de Kummer. A mesma pode ser obtida da equacao hipergeometrica por um procedimento de limite
no qual a singularidade regular de z0 = 1 daquela equacao e feita imergir (confluir, da o nome)
na singularidade regular de z0 = . Esse processo pode ser descrito da seguinte forma. Facamos na
equacao hipergeometrica
z(1 z)y 00 (z) + [ (1 + + )z]y 0 (z) y(z) = 0
a mudanca de variaveis = z. A mesma assume a forma (verifique!)




 
d2 y
++1
dy
y = 0 .
1
+

2
d

d
Tomando-se agora o limite || obtemos a forma (8.142). Vide, e.g., [122] ou [66]. A equacao
hipergeometrica confluente possui uma singularidade regular em z0 = 0 e uma irregular em z0 =
(vide discussao a` pagina 369).
Assim como no caso da equacao hipergeometrica, ha varias equacoes diferenciais de interesse que
podem ser transformadas em equacoes hipergeometricas confluentes. Os exemplos mais evidentes sao
a equacao de Laguerre, Secao 8.2.5, pagina 441, que corresponde a = 1 e = , e a equacao de
Laguerre associada, Secao 8.3.2, pagina 452, que corresponde a = m + 1 e = (n m). Com
isso, pode-se estudar certas propriedades de varias funcoes especiais, tais como seu comportamento
assintotico, a partir das propriedades correspondentes de funcoes hipergeometricas confluentes.
Para a equacao hipergeometrica confluente tem-se
y 00 (z) +

[ z] 0
z
y (z) 2 y(z) = 0
z
z

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

448/1304

e assim, comparando com a forma padrao (8.47), temos


a(z) = z,
Logo,
an

,
1,
=

0,

b(z) = z .

para n = 0
para n = 1 ,
para n 2

bn =

,
0,

para n = 1
.
para n = 0 ou n 2

A equacao indicial e, portanto,

f (x) = x(x + 1) ,

cujas razes sao

= 1

+ = 0 ,

tal como para a equacao hipergeometrica. Ha, assim, tres casos a considerar: 1. 1 6
6 . 2. = 1. 3. 1 \ {0}, ou seja, mas 6= 1.

Caso 1. 1 6

, ou seja, 6

, ou seja,

Aqui, de acordo com (8.52) e (8.53), as solucoes sao


y1 (z) = z

cn z

y2 (z) =

n=0

dn z n ,

(8.143)

n=0

onde
cn =

n1 h
i
X
1
(m + 1 )anm + bnm cm ,
f (1 + n) m=0

dn =

n1
i
1 Xh
manm + bnm dm ,
f (n) m=0

para todo n 1. Assim,


cn =

n+
cn1 ,
n(n + 1 )

dn =

n+1
dn1 ,
n(n + 1)

o que conduz a
cn =

( + 1 )n
c0 ,
n!(2 )n

dn =

()n
d0 ,
n!()n

(8.144)

Tomando d0 = 1 a solucao y2 assume a forma

X
()n n
() X ( + n) z n
z =
.
1 F1 (, , z) := 1 +
n!()n
() n=0 ( + n) n!
n=1

(8.145)

Esta funcao e denominada funca


o hipergeometrica confluente ou, por vezes, funca
o de Kummer.
E. 8.20 Exerccio. Prove, usando diretamente as definicoes, a seguinte relacao entre as funcoes hipergeometricas confluentes e as funcoes hipergeometricas:


z
, , ,
.
1 F1 (, , z) = lim F
||

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

449/1304

Aplicando o teste da razao a` serie de (8.145)


()n+1

n+1

| + n|
(n+1)!()n+1 z

|z| ,

=
()
n
n


(n + 1) | + n|
z
n!()n

vemos que a mesma converge para todo z, pois para cada z fixo o lado direito torna-se menor que 1
para n grande o suficiente. Assim, 1 F1 (, , z) e analtica para todo z .

Fazemos ainda notar que a expressao acima para 1 F1 (, , z) esta definida mesmo para o caso em
que e um inteiro positivo e, portanto, representa uma solucao da equacao hipergeometrica confluente
naquele caso. Para nulo ou um inteiro negativo, digamos = m, o denominador () n anula-se para
n > m e a expressao para F (, , z) deixa de fazer sentido.
Passemos agora a` solucao y1 . Alguns segundos de contemplacao das expressoes de (8.144) conduzemnos a` percepcao que a relacao entre cn e c0 equivale a` relacao entre dn e d0 com a troca + 1
e 2 (tal como se fez no caso da equacao hipergeometrica, acima). Assim, convencionando-se
tambem c0 = 1 tem-se que a solucao y1 (z) e dada por
z 1 1 F1 ( + 1 , 2 , z) .
Fazemos ainda notar que 1 F1 ( + 1 , 2 , z) esta definida mesmo para o caso em que e
um inteiro nao-positivo e, portanto, z 1 1 F1 ( + 1 , 2 , z) representa uma solucao da equacao
hipergeometrica confluente naquele caso.
Resumindo, para o caso 6

a solucao geral da equacao hipergeometrica confluente (8.142) e

A1 z 1 1 F1 ( + 1 , 2 , z) + A2 1 F1 (, , z) ,
onde A1 e A2 sao constantes arbitrarias.
Caso 2. = 1.
Esse e o caso da equacao de Laguerre.
Aqui = + = 0 = 0. Nesse caso a primeira solucao e da forma y1 (z) =
analogo, obtemos
( + n)
cn ,
cn+1 =
(n + 1)2

n=0 cn

z n e, de modo
(8.146)

para todo n 0. Assim, a primeira solucao e


1 F1 (, 1, z) = 1 +

X
zn
()n n
1 X
(
+
n)
z
=
.
2
2
(n!)
()
(n!)
n=1
n=0

Pelo Teorema 8.2, pagina 412, a segunda solucao tem a forma


1 F1 (, 1, z) ln(z) +

vn z n ,

n=0

com os vn dados em (8.56) em termos dos cn de acima. A expressao que se obtem e um tanto complexa
e evitamos coloca-la aqui.

JCABarata. Curso de Fsica-Matem


atica

Caso 3. 1

\ {0}, ou seja,

Captulo 8

Vers
ao de 29 de setembro de 2005.

450/1304

mas 6= 1.

Esse e o caso da equacao de Laguerre associada.

Ha dois casos a distinguir: a. > 1 e b. 0.

No caso a, = m, com m > 1 inteiro. Aqui tem-se n0 = m 1, 1 = + = 0 e 2 = = 1 m.


Como ja observamos acima, uma solucao e dada por 1 F1 (, m, z). Uma segunda solucao sera da forma
A 1 F1 (, m, z) ln(z) + z 1m

vn z n ,

n=0

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de 1 F1 (, m, z). Novamente,
a expressao que se obtem e complexa e a omitimos aqui.
No caso b, = m, com m 0 inteiro. Aqui tem-se n0 = m + 1, 1 = = 1 + m e 2 = + = 0.
Como ja observamos acima, uma solucao e dada por z 1+m 1 F1 ( + 1 + m, 2 + m, z). Uma segunda
solucao sera da forma
Az 1+m 1 F1 ( + 1 + m, 2 + m, z) ln(z) +

vn z n ,

n=0

com os vn e A dados como em (8.60) e (8.61) a partir dos coeficientes cn de z 1+m 1 F1 (+1+m, 2+m, z).
Novamente, a expressao que se obtem e complexa e e omitida aqui.
Com isso encerramos nossa breve excursao a`s funcoes hipergeometricas confluentes. Para um tratamento extensivo da equacao hipergeometrica confluente e propriedades de suas solucoes, vide [121],
[66] ou [136].

8.3

Algumas Equa
co
es Associadas

Algumas das equacoes tratadas acima possuem parentes proximos com os quais se relacionam amistosamente. Vamos estudar algumas delas.

8.3.1

A Equa
c
ao de Legendre Associada

A equaca
o de Legendre associada e equacao diferencial
(1 z 2 )y 00 (z) 2zy 0 (z) + ( + 1)y(z)

2
y(z) = 0 .
1 z2

(8.147)

Como e facil de se constatar, os pontos 1 sao pontos singulares regulares da equacao de Legendre
associada. Repare tambem que para = 0 recupera-se a equacao de Legendre usual
(1 z 2 )y 00 (z) 2zy 0 (z) + ( + 1)y(z) = 0 .

(8.148)

O principal interesse na equacao (8.147) se da no caso em que e um n


umero inteiro, = m ,
situacao que corresponde a` maioria das aplicacoes. Nesse caso, um truque feliz permite-nos encontrar
as solucoes sem termos de recorrer ao metodo de Frobenius.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

451/1304

Tudo comeca com a observacao que a equacao de Legendre usual e a equacao de Legendre associada
podem ser transformadas em uma mesma equacao. Se em (8.147) fizermos a substituicao (ja adotando
= m ) y(z) = (1 z 2 )m/2 v(z), obtemos para v a equacao


2 00
0
(1 z )v (z) 2(m + 1)z v (z) + ( + 1) m(m + 1) v(z) = 0 .
(8.149)
E. 8.21 Exerccio importante. Mostre isso. Sugestao: um pouco de paciencia.
Se, por outro lado, tomarmos a equacao (8.148) e a derivarmos m vezes, obtemos


00
0

(1 z 2 ) y (m) (z) 2(m + 1)z y (m) (z) + ( + 1) m(m + 1) y (m) (z) = 0 .

(8.150)

E. 8.22 Exerccio importante. Mostre isso. Sugestao: use a regra de Leibniz para calcular as derivadas




dm
2 00
0
(1 z )y (z) e dz m zy (z) .
6

dm
dz m

Comparando (8.149) com (8.150), constatamos que ambas sao a mesma equacao. Com isso, vemos
que se yL e a solucao geral da equacao de Legendre e yLa e a solucao geral da equacao de Legendre
(m)
associada, entao (1 z 2 )m/2 yLa (z) e yL (z) devem ser proporcionais, ja que obedecem a` mesma
equacao (8.149). Com isso, obtemos que a solucao geral da equacao de Legendre associada pode ser
obtida da solucao geral da equacao de Legendre por
(m)

yLa (z) = km (1 z 2 )m/2 yL (z) ,


km sendo constantes de normalizacao a serem convencionadas.
Coloquemo-nos agora a questao: qual solucao yL da equacao de Legendre devemos adotar? Isso
certamente depende do tipo de problema considerado, mas na maioria das aplicacoes procuramos
resolver a equacao de Legendre associada no intervalo [1, 1] e procuramos solucoes que sejam finitas
em todo esse intervalo, incluindo as bordas 1. Ora, ja vimos que as u
nicas solucoes da equacao
de Legendre usual que permanecem limitadas nos extremos 1 (assim como suas derivadas) sao os
polinomios de Legendre Pl (z), os quais ocorrem como solucao apenas no caso = l, um inteiro naonegativo. Obtemos assim que as solucoes de interesse da acao de Legendre associada que sao limitadas
em todo o intervalo fechado [1, 1] ocorrem para = l, um inteiro nao-negativo, e sao dadas por
Plm (z) := (1 z 2 )m/2

dm
Pl (z) ,
dz m

(8.151)

claro que P m (z) e nulo se m > l (pois Pl e um polinomio


onde Pl e o polinomio de Legendre de grau l. E
l
de grau l).
omios de Legendre associados, ainda que
As funcoes Plm definidas acima sao denominadas polin
nao sejam realmente polinomios em z no caso em que m e mpar (devido ao fator (1 z 2 )m/2 )24 e
24

Se, no entanto, substituirmos z por cos , com 0 , o que costumeiramente se faz em aplicaco
es, P lm (cos )
2 m/2
torna-se um polin
omio trigonometrico, ou seja, um polin
omio em cos e sen , j
a que (1 z )
torna-se ( sen ())m .
Essa e a raz
ao dessa nomenclatura. Vide express
ao (9.53), p
agina 505.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

452/1304

desempenham um papel importante na resolucao de equacoes diferenciais parciais em 3 dimensoes


em coordenadas esfericas, tais como a equacao de Laplace e de Helmholtz. A eles estao intimamente
relacionados os chamados harm
onicos esfericos, dos quais falaremos na Secao 9.2.2, pagina 501, e que
desempenham um papel na Mecanica Quantica (orbitais atomicos), na Teoria de Grupos (representacoes
do grupo SO(3)), no Eletromagnetismo (emissao de ondas eletromagneticas por antenas) etc.
As funcoes Plm estao definidas acima para l inteiro nao-negativo, ou seja l = 0, 1, 2, 3, . . ., e m
inteiro com 0 m l (pois para m > l o lado direito de (8.151) anula-se). Cada Plm e solucao da
equacao de Legendre associada
(1 z 2 )y 00 (z) 2zy 0 (z) + l(l + 1)y(z)

m2
y(z) = 0 .
1 z2

(8.152)

Na Secao 9.2.1, que se inicia a` pagina 495, mostraremos que os polinomios de Legendre podem ser
escritos como

1 dl  2
l
Pl (z) = l
(z

1)
,
2 l! dz l
expressao essa conhecida como f
ormula de Rodrigues para os polin
omios de Legendre. Assim, obtemos
Plm (z) =


l+m 
1
2 m/2 d
2
l
(1

z
)
(z

1)
,
2l l!
dz l+m

(8.153)

expressao valida para 0 m l, com l um inteiro nao-negativo: l = 0, 1, 2, 3, . . .. Caso m > l, o


lado direito se anula.
Um ponto interessante, porem, e que a expressao do lado direito de (8.153) esta bem definida para
quaisquer l e m com l + m 0, ou seja, tambem para ms negativos tais que m l. Assim, (8.153)
esta definida para todo m inteiro com l m l 25 .
Da expressao (8.153), entendida para todo l inteiro nao-negativo e l m l, e possvel mostrar
que
(l m)! m
Plm (z) = (1)m
P (z) .
(l + m)! l

Essa relacao, que e relevante para os chamados harmonicos esfericos, mostra que P lm (z) e tambem
solucao da equacao de Legendre associada (8.152), por ser proporcional a P lm (z). Trataremos disso
na Secao 9.2.2, pagina 501, onde outras propriedades dos polinomios de Legendre associados serao
apresentadas e sua relacao com os harmonicos esfericos discutida.

8.3.2

A Equa
c
ao de Laguerre Associada

A equaca
o de Laguerre associada e a equacao diferencial
xy 00 + (m + 1 x)y 0 + (n m)y = 0 .

(8.154)

O principal interesse nessa equacao reside no caso onde m e n sao inteiros satisfazendo 0 m n.
Como o leitor facilmente constata, trata-se de um caso particular da equacao hipergeometrica confluente
25

De passagem, comentamos que a relaca


o l m l desempenha um papel na teoria do momento angular na
Mec
anica Qu
antica, mas isso n
ao e nosso assunto aqui.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

453/1304

(8.142). A equacao de Laguerre associada surge da equacao de Schrodinger para o atomo de hidrogenio
quando a mesma e resolvida pelo metodo de separacao de variaveis em coordenadas esfericas.
A solucao dessa equacao pode ser obtida diretamente da solucao da equacao de Laguerre usual
xy 00 + (1 x)y 0 + ny = 0

(8.155)

pois esta, quando diferenciada m vezes em relacao a` x, transforma-se exatamente na equacao (8.154).
E. 8.23 Exerccio. Verifique! Sugestao: regra de Leibniz.

Assim, se y e solucao de (8.155) segue que y (m) e solucao de (8.154). Conclumos que as u
nicas
solucoes de (8.154) que sao regulares em x = 0 sao da forma


n
dm
dm
(m)
x d
n x
Ln (x) =
Ln (x) =
e
(x e ) .
(8.156)
dxm
dxm
dxn
au
ltima igualdade sendo proveniente de (8.134) ou de (9.86).
(m)

Os polinomios Ln sao denominados polin


omios de Laguerre associados. Os polinomios de Laguerre
associados surgem, como dissemos, na resolucao da equacao de Schrodinger para o atomo de hidrogenio
em coordenadas esfericas. Vide Secao 10.5, pagina 568. Junto com os harmonicos esfericos, definidos a`
pagina 509, os polinomios de Laguerre associados definem a forma dos orbitais eletronicos do atomo de
hidrogenio e (de forma aproximada) de atomos hidrogenoides. A forma desses orbitais e de importancia
fundamental no estudo de atomos e moleculas e suas ligacoes qumicas.
Usando (8.133), e facil constatar que
Ln(m) (x)


n
= (1)
(1)
xk .
k!
m
+
k
k=0
m

nm
X

k n!

Mais propriedades dos polinomios de Laguerre associados serao estudadas na Secao 9.2.5, pagina
519.

8.4

A Fun
c
ao Gama. Defini
c
ao e Propriedades

Apresentaremos na presente secao algumas das propriedades mais importantes da chamada funca
o gama
uentemente aparece
de Euler, ou simplesmente funca
o gama, denotada por (z), com z , a qual freq
na resolucao de equacoes diferenciais ordinarias pelo metodo de expansao em series de potencias, assim
como em varias areas da Fsica e da Matematica, por representar uma especie de generalizacao contnua
do fatorial de n
umeros inteiros, como sera precisado adiante.
Aqui nos restringiremos a`s propriedades mais relevantes da funcao gama. Para um estudo mais
extenso de propriedades dessa funcao e suas aplicacoes, recomendamos [66], [83], [136], [7], [107] ou
ainda [82]. Ainda que nem todos esses textos primem por escolher as demonstracoes mais simples para
seus resultados, vale a pena o estudante inteirar-se de abordagens diversas. A referencia [107] contem
algumas notas historicas sobre a funcao gama de Euler.

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

454/1304

Definindo a fun
c
ao gama
A funcao , pode ser definida em todo plano complexo (exceto, como veremos, para inteiros naopositivos, onde possui polos simples). No semiplano Re (z) > 0, (z) e definida por
Z
et tz1 dt .
(8.157)
(z) :=
0

A seguinte proposicao contem informacoes relevantes sobre (8.157) e sobre a estrutura analtica de :
Proposi
c
ao 8.2 A integral em (8.157) converge absolutamente para todo z com Re (z) > 0. A
funca
o definida por (8.157) e analtica no semiplano Re (z) > 0 e pode ser analiticamente estendida
a todo , exceto para os pontos z = 0, 1, 2 . . . que s
ao p
olos simples de . O resduo de em
(1)n
z = n e dado por n! para todo n = 0, 1, 2, . . ..
2
Prova. Para ver que a integral em (8.157) converge absolutamente para Re (z) > 0, escrevemos z = x+iy
com x = Re (z), y = Im (z) e escolhemos e tais que 0 < < x < < . Como |tz1 | = tx1
tem-se
Z

t z1
e t dt =

et tx1 dt

=
Agora, a integral

enquanto que
nencial tem-se

R
1

R1
0

t x1

dt +

t x1

dt

t 1

dt +

et t1 dt .

et t1 dt e finita, pois, para > 0


Z 1
Z 1
1
t 1
< .
e t dt
t1 dt =

0
0

et t1 dt e finita para qualquer




pois, devido ao rapido decaimento da expo-

lim et t1 = 0 ,

para todo > 0, o que implica que existe constante C, > 0 tal que
t1 C, , et

(8.158)

para todo t > 1. Assim, tomando 0 < < 1, vale


Z
Z
e(1)
t 1
e(1)t dt = C,
e t
dt C,
< .
1
1
1
Isso prova que a integral em (8.157) converge absolutamente se Re (z) > 0.
Para provar que (z) e analtica no semiplano Re (z) > 0, comecamos observando que, para 0 <
a < A < , a funcao
Z A
et tz1 dt
a, A (z) :=
a

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

455/1304

e analtica na regiao Re (z) > 0. Isso se deve ao fato de ser possvel verificar a validade das relacoes
de Cauchy-Riemann para a, A (z), diferenciando-a sob o smbolo de integracao e usando o fato de que
tz1 = e(z1) ln(t) e analtica em z para t > 0. Que e possvel diferenciar sob o smbolo de integracao
segue do fato de o integrando ser contnuo em t e a regiao de integracao ser o intervalo compacto [a, A].
Uma vez estabelecido que a, A (z) e analtica em Re (z) > 0, podemos provar que A (z), definida
por
A (z) := lim a, A (z) =
a0

et tz1 dt ,

(8.159)

e tambem analtica em Re (z) > 0. Para tal, tomemos z F, , onde F,

e a faixa definida por

F, = {z | < Re (z) < } ,


com 0 < < < , ou seja, tomemos 0 < < Re (z) < . Entao, para A > 0 fixo e 0 < a 0 < a < 1,
Z a
Z a
(a0 ) a
t x1
t1 dt =
e t
dt
|a, A (z) a0 , A (z)|
,

a0
a0
que pode ser feito menor que qualquer  > 0 dado, para todos a e a0 pequenos o suficiente. Dessa
forma, o limite que define A (z) em (8.159) e uniforme em F, , Assim, por ser o limite uniforme de
funcoes analticas, A (z) e igualmente analtica em F, (esse e um teorema bem-conhecido da teoria
das funcoes de variavel complexa). Como e sao arbitrarios (0 < < ), A (z) e analtica para
todo o semiplano Re (z) > 0.
Para provar que
(z) = lim A (z)

(8.160)

e analtica para todo o semiplano Re (z) > 0 temos que provar que esse limite e uniforme nas faixas
z F, e evocar o mesmo teorema da teoria das funcoes de variavel complexa mencionado acima.
Para provar uniformidade do limite, notemos que para 1 < A < B, tem-se, com 0 < < 1,
Z B

Z B
Z A


t
z1
t
z1

e t
dt
e t
dt

et tx1 dt

0

(8.158)

et t1 dt

e(1)t dt

C,


C,  (1)A
e
e(1)B ,
1

que pode ser feito menor que qualquer  > 0 prescrito para todos A e B grandes o suficiente. Isso
provou que o limite em (8.160) e uniforme em cada faixa F, com 0 < < , mostrando que (z) e
analtica em cada uma dessas faixas F, e, portanto, em todo o semiplano Re (z) > 0.
Para provar que possui uma extensao analtica para a regiao Re (z) 0 (exceto, como mencionamos, os inteiros nao-positivos), notamos que para Re (z) > 0 podemos escrever (8.157) trivialmente

JCABarata. Curso de Fsica-Matem


atica

como
(z) :=

Captulo 8

Vers
ao de 29 de setembro de 2005.

1
t z1

e t

dt +

456/1304

et tz1 dt .

Agora, a integral impropria I(z) := 1 et tz1 dt e analtica para todo z , o que pode ser visto
repetindo os argumentos de convergencia uniforme de acima: para 1 < A < A0 < , escrevendo
x = Re (z) e restringindo-nos provisoriamente a` regiao x < , para algum , temos
Z

Z 0

Z A0
A

A





et tz1 dt
et tz1 dt
=
et tz1 dt
(8.161)


1



1
A


t1

(8.158)

A0

et tx1 dt

(8.162)

et t1 dt

(8.163)

(8.164)

A
A0
A
A0

e(1)t dt

C,

e(1)A e(1)A
,
C,
1

A
0

(8.165)

que, escolhendo-se 0 < < 1, pode ser feita menor Rque qualquer  > 0 prescrito para todos A, A 0
A
grandes o suficiente. Isso prova que o limite limA 1 et tz1 dt e uniforme na regiao Re (z) < , o
que prova que a integral impropria I(z), sendo o limite uniforme de funcoes analticas em Re (z) < ,
e tambem analtica nessa regiao. Como e arbitrario, conclumos que a integral impropria I(z) e
analtica em todo o plano complexo .
R1
Ja para a integral 1 (z) = 0 et tz1 dt tem-se
!
Z 1
Z 1 X

n
(1)
tn tz1 dt
et tz1 dt =
n!
0
0
n=0


X
(1)n
n=0

n!

X
(1)n
n=0

n!

tn+z1 , dt
0

1
,
z+n

(a inversao da serie pela integral na segunda linha acima e justificada pois, como e bem sabido, a serie
de Taylor da funcao exponencial converge uniformemente em intervalos compactos, como o intervalo
de integracao [0, 1]).

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

457/1304

Dessa forma, obtemos a representaca


o de Mittag-Leffler26 da funcao :
(z) =

X
(1)n
n=0

n!

1
+
z+n

et tz1 dt .

(8.166)

Como dissemos, a integral no lado direito de (8.166) e analtica para todo z . Ja a soma no lado
direito de (8.166) converge uniformemente (devido ao n! no denominador) em regioes finitas de que
excluam os pontos 0, 1, 2, 3, . . . e, portanto, representa uma funcao analtica para todo z ,
exceto nos inteiros nao-positivos, como mencionado, onde possui polos simples. Como se constata
n
para todo n = 0, 1, 2, 3, . . .. Isso
inspecionando (8.166), o resduo de em z = n e dado por (1)
n!
completa a demonstracao.
A demonstracao acima da existencia da mencionada extensao de para argumentos com parte
real negativa mostra que essa extensao pode ser calculada por meio da representacao de Mittag-Leffler
(8.166). Como veremos mais abaixo, porem, ha uma outra forma, talvez mais conveniente, de expressar
essa extensao, a saber, com uso da chamada f
ormula dos complementos:
(z)(1 z) =

,
sen (z)

valida para z nao-inteiro e que permite escrever


(z) =

,
z(z) sen (z)

(8.167)

com a qual, caso Re (z) > 0, a extensao de para argumentos com parte real negativa (lado esquerdo)
pode ser calculada em termos de (z) com Re (z) > 0 (no lado direito), dada concretamente pela
integral (8.157).
Mais abaixo apresentaremos outro argumento, talvez mais elementar, para provar que possui uma
extensao analtica para o semiplano Re (z) 0 (exceto os inteiros nao-positivos).
Antes disso, facamos alguns comentarios importantes.

Convexidade de e de ln
imediato da definicao (8.157) que para Re (z) > 0 valem
E
Z
Z
0
t z1
00
(z) =
e t ln(t) dt
e
(z) =
0

et tz1 (ln(t))2 dt .

(8.168)

A segunda expressao acima diz-nos que se z for real e positivo (z x > 0) entao 00 (x) > 0 e, portanto,
e uma funcao convexa em + . Em verdade, vale que tambem ln e convexa em + , fato de certa
relevancia como veremos abaixo quando mencionarmos o Teorema de Bohr-Mollerup, Teorema 8.4.


26

Magnus G
osta Mittag-Leffler (1846-1927). Para a definica
o geral da noca
o de serie de Mittag-Leffler, vide [107].

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

458/1304

Para mostrar isso, notemos que, por (8.168),


0 2

((x) )

Z

Z

=
Cauchy-Schwarz

Z

t x1

e t

ln(t) dt

t/2 (x1)/2

t x1

e t

dt

2



 Z

t/2 (x1)/2

t x1

e t

ln(t) dt

ln(t) dt

2

= (x)00 (x) ,

 00 (x)(x) ((x)0 )2
d2 
0, mostrando que ln e convexa em
o que implica
ln (x) =
dx2
((x))2


+.

A fun
c
ao e o fatorial
Usando integracao por partes, segue que, para Re (z) > 0,

Z
Z

t z
t z
e t dt = e t +z
et tz1 dt ,
(z + 1) =
0
0
| {z 0}
=0

provando que

(z + 1) = z(z) .

(8.169)

A relacao (8.169) e de grande importancia e representa a razao de ser da funcao gama de Euler.
R
Por inducao finita, e pelo fato de que, por (8.157), (1) = 0 et dt = 1, segue facilmente de (8.169)
que
(n + 1) = n! ,
para todo n . Assim, a funcao e uma especie de extensao complexa do fatorial de n
umeros
inteiros positivos.


Essa u
ltima observacao merece um comentario. Ha certamente muitas funcoes f em + satisfazendo
f (n + 1) = n! para todo n . Se f e uma funcao satisfazendo f (x + 1) = xf (x) para todo x + ,
entao f (x)/(x) e periodica de perodo 1, pois f (x + 1)/(x + 1) = (xf (x))/(x(x)) = f (x)/(x) para
todo x + . Assim, f (x) = P (x)(x) com P periodica de perodo 1 e a solucao mais geral da equacao
f (x + 1) = xf (x). Se P (1) = 1 entao f (n + 1) = n! para todo n . Um celebre teorema, devido a
Bohr27 e Mollerup28 , garante que a funcao gama de Euler e u
nica em um certo sentido:
Z
et tx1 dt, x > 0, e a u
nica
Teorema 8.4 (Teorema de Bohr-Mollerup) A funca
o (x) :=


funca
o real em
27

satisfazendo

Harald August Bohr (1887-1951). H. Bohr era irm


ao mais novo do fsico Niels Bohr (Niels Henrik David Bohr
(1885-1962)). H. Bohr recebeu v
arios premios por sua obra matem
atica e foi agraciado com a medalha de prata nos
provavelmente ate hoje o
Jogos Olmpicos de 1908, em Londres, como jogador da seleca
o dinamarquesa de futebol(!) E
u
nico cientista a alcancar essa honraria.
28
Johannes Peter Mollerup (1872-1937).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

459/1304

1. f (1) = 1,
2. f (x + 1) = xf (x) para todo x > 0 (e, conseq
uentemente, satisfazendo f (n + 1) = n! para todo
n ),


3. ln f e convexa.

Uma demonstracao desse interessante teorema pode ser encontrada em [7], assim como em [26].
Revisitando a extens
ao de para Re(z) 0
A expressao (8.157) permite definir (z), mas somente se Re (z) > 0 pois, de outra forma, a integral
possvel, no entanto, estender analiticamente a funcao
no lado direito de (8.157) nao esta definida. E
a todo , exceto aos inteiros nao-positivos. Ja demonstramos esse fato acima, mas o mesmo pode
tambem ser diretamente derivado da relacao (8.169). Trataremos disso agora.
Para n = 0, 1, 3, . . ., (8.169) diz-nos que
(z + n) = (z + n 1)(z + n 2) z(z) ,
o que permite escrever
(z) =

(z + n)
.
(z + n 1)(z + n 2) z

(8.170)

Agora, (z + n) esta definida por (8.157) para Re (z + n) > 0, Assim, (8.170) permite definir (z) para
Re (z) > n. Como n e arbitrario, a formula (8.169) prolonga analiticamente (z), exceto nos pontos
z = n (n = 0, 1, 2 . . .). Note-se que, por (8.170) tem-se na regiao Re (z) > n que
(z + 1) =

(z + 1 + n)
(z + n)(z + n 1) (z + 1)

(8.169)

(z + n)(z + n)
(z + n)(z + n 1) (z + 1)
=

(z + n)
(z + n 1) (z + 1)

(8.170)

z(z) ,

provando que (8.169) permanece valida para a extensao.


Por (8.170) pode-se ver que z = 0, 1, 2 . . . sao polos simples de . De fato, pode-se calcular o
resduo de em cada ponto z = n e constatar que e nao-nulo. Por (8.170), esses resduos sao dados
por
lim (z + n)(z) = lim (z + n)

zn

zn

(z + n + 1)
(1)
(1)n
=
=
(z + n)(z + n 1) z
(1)(2) (n)
n!

como ja havamos observado.


Conclumos que possui uma extensao analtica ao plano complexo
0, 1, 2 . . ., onde possui polos simples.
Outra representa
c
ao integral equivalente

, exceto aos pontos z =

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

Fazendo a mudanca de variavel t = u2 a integral em (8.157) torna-se


Z
2
(z) = 2
eu u2z1 du .

460/1304

(8.171)

Disso segue que

 
Z

1
2
= 2
eu du = ,

2
0

identidade essa que usaremos adiante. Usando (8.169) para z = 21 , obtem-se


 





1
1
3
1
(2n 1)!!
(2n)!
1
= n
n

=
= 2n
,
n+
n
2
2
2
2
2
2
2 n!
para todo n


(8.172)

(8.173)

A representa
c
ao produto de Gauss para
A funcao pode ser expressa de diversas outras formas, muitas delas u
teis para a obtencao de
resultados mais profundos e exibiremos algumas aqui. Uma delas e uma representaca
o produto de
Gauss para a funca
o :
n! nz
,
(8.174)
(z) = lim
n z(z + 1) (z + n)
valida para todo z , z 6= 0, 1, 2 . . ..

Para mostrar que (8.157) e (8.174) sao equivalentes provemos primeiramente o seguinte lema

Lema 8.1 Para Re (z) > 0 vale


(z) = lim

n
0

t
1
n

n

tz1 dt .

(8.175)
2

Prova. (De [66] com modificacoes). Tomemos z


0 < < < .
Rn
Como (z) = limn 0 et tz1 dt, precisamos

Z n
t
lim
e 1
n

Defina-se para 0 t n,
hn (t) := 1 e
Como facilmente se constata,
h0n (t)

= e

t
1
n

n1

F, , ou seja, < Re (z) < , com e fixos,


apenas provar que
n 
t
tz1 dt = 0 .
n
t

t
1
n

t
0
n

n

para 0 t n .

(8.176)

JCABarata. Curso de Fsica-Matem


atica
Z

Captulo 8

Vers
ao de 29 de setembro de 2005.

461/1304

h0n (s) ds. Como h0n (s) 0 para 0 s n, segue disso que
0
n1
hn (t) 0 para 0 t n. Adicionalmente, como 1 ns
1 para 0 s n, tem-se tambem
Como

h0n (0)

= 0, segue que hn (t) =

hn (t) =

h0n (s) ds

Com isso, estabeleceu-se que 0 hn (t)


s n1 s
es 1
ds
n
n

s
e ds et
n

e t t2
.
2n

t
0

s
ds
n

e t t2
,
2n

o que implica

n
t2
t
t
.

0 e 1
n
2n

(8.177)

Disso segue o fato bem-conhecido de cursos de Calculo que



n
t
t
e = lim 1
,
n
n
para todo t


(8.178)

, mas segue tambem que




t
1
n

n

et ,

(8.179)

fato que usaremos adiante.


Agora,

n
0

t
1
n

n 

onde, para 1 < a < n, definimos


n 

Z a
t
t
Fa :=
e 1
tz1 dt ,
n
0

tz1 dt = Fa + Ga, n ,

Ga, n :=

n
a

t
1
n

n 

tz1 dt .

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

462/1304

Podemos afirmar que, para 1 < a < n,


|Ga, n |

(8.179)

a>1

(8.158)

2
2

n
a

t
+ 1
n

n 

tx1 dt

et tx1 dt
a
n

et t1 dt
a

2C,

e(1)t dt
a


2C, (1)a
e
e(1)n ,
1

onde x = Re (z) > 0, < x < , e usamos que |tz | = tx . A constante positiva de (8.158) e arbitraria,
mas vamos escolhe-la de sorte que 0 < < 1, o que garante o decaimento da u
ltima expressao em n e
a. Paralelamente,
n

Z a x+1
Z a
(8.177)
t
ax+1
t x1
t

t
dt

dt
=
|Fa |
e


n
2n
2n(x + 2)
0
0
Com isso, vemos que para 1 < a < n,
Z n 


n 



t
ax+1
2C, (1)a
t
z1
(1)n


e

t
dt
e

e
.

+


n
2n(x + 2) 1
0
Portanto,

Z

lim
n

t
1
n

n 

z1



2C, (1)a
e
.
dt
1

Mas o lado esquerdo nao depende de a e o lado direito pode ser feito arbitrariamente pequeno tomando
a . Isso prova (8.176), completando a demonstracao de (8.175) para z F , . Como e sao
arbitrarios (com 0 < < ), (8.175) fica provado para todo Re (z) > 0.

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

463/1304

Passemos agora a` prova de (8.174). Temos,



n
 n z n
n1
Z n
Z n
n
t
t
t
t
int. por partes
z1
t dt
=
1
tz dt
1
1
+ nz
n
n
z
n
0
0
0
1
z

t
1
n

(n 1)
nz(z + 1)

int. por partes

n1

n
0

tz dt

t
1
n

n2

tz+1 dt

..
.
n

n!
nn z(z + 1) (z + n 1)

itera
co
es

tz+n1 dt
0

n! nz
n! nz+n
=
.
nn z(z + 1) (z + n)
z(z + 1) (z + n)

(8.180)

Por (8.175), isso prova (8.174).


A representa
c
ao produto de Weierstrass para
A representaca
o produto de Weierstrass para a funca
o , valida para Re (z) > 0, e

Y
1
z  z
z
= ze
e n
1+
(z)
n
n=1

onde e o definida por


:= lim

1
1
1 + + + ln(n)
2
n

(8.181)


ate hoje um
A constante e chamada constante de Euler-Mascheroni29 e vale 0, 577215665 . . .. E
problema em aberto saber se e um n
umero racional ou nao.
Definindo,

(n)

(z) :=

n
0

t
1
n

n

tz1 dt

(8.180)

n! nz
,
z(z + 1) (z + n)

provamos no Lema 8.1 que (z) = limn (n) (z) para Re (z) > 0. Temos



1
z
nz
z
z ln(n)

1
+
=
z(z
+
1)

(z
+
n)
=
ze
(1
+
z)
1
+
(n) (z)
n!
2
n
= ze

1
ln(n))
z (1+ 12 ++ n

n 
Y
s=1

29

z z
1+
es
s

Lorenzo Mascheroni (1750-1800). Vide nota de rodape a


` p
agina 837.

(8.182)

JCABarata. Curso de Fsica-Matem


atica

e, portanto,

provando (8.181).
Por (8.181) ve-se que

Captulo 8

Vers
ao de 29 de setembro de 2005.

464/1304


Y
z  z
1
1
z
1+
= lim (n)
= ze
e s ,
n
(z)
(z)
s
s=1
1
(z)

e uma funcao inteira (i.e., analtica em toda parte), o que implica que

(z) nao tem zeros. Segue tambem de (8.181) que (z) = (z).
A representa
c
ao produto de Euler para
bastante evidente que para todo n > 1, inteiro, vale
E
n =

n1
Y
l=1

l+1
l

n1
Y
l=1

1
1+
l

(8.183)

De acordo com (8.182), podemos escrever

(n)

n! nz
(z) =
z(z + 1) (z + n)

(8.183)

z1

m=1

"n1 
Y
l=1

n 
Y

z 1
1+
m

1
1+
l

z #

n
z 1
1Y
1+
z m=1
m

z 

n 
Y
1
1
z 1
1+
,
1+
m
m
z(1 + n1 )z m=1

(8.184)

e tomando o limite n , obtemos

z 


1
z 1
1 Y
1+
1+
(z) =
z m=1
m
m

(8.185)

valida para todo z , exceto z = 0, 1, 2, 3, . . .. Esta e a representaca


o produto de Euler para
a funca
o . A expressao (8.185), obtida por Euler em 1729, foi a definicao historicamente original da
funcao , a representacao integral (8.157) tendo sido obtida posteriormente pelo mesmo autor a partir
de (8.185). Euler chegou a (8.185) propondo-a como solucao da equacao funcional f (z + 1) = zf (z)
com f (1) = 1, tentando dessa forma obter uma generalizacao contnua do fatorial de n
umeros inteiros
positivos.
E. 8.24 Exerccio. Verifique diretamente de (8.185) que satisfaz (z + 1) = z(z) com (1) = 1.
Sugestao: usando a u
ltima expressao em (8.184) considere a razao (n) (z + 1)/(n) (z) e tome o limite
n .
6
Fun
c
ao Beta. Propriedades elementares

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

465/1304

A chamada funca
o beta, denotada por B(p, q) e definida por
B(p, q) :=

(p) (q)
(p + q)

(8.186)

para p e q complexos, mas diferentes de inteiros nao-positivos.


Para Re (p) > 0 e Re (q) > 0 podemos expressar B(p, q) em uma forma integral muito u
til:
B(p, q) = 2

(cos )2p1 ( sen )2q1 d .

(8.187)

Provamo-la com uso de (8.171), que nos diz que



 Z
Z
x
v 2 2q1
u2 2p1
e v
dv = 4
e u
du
(p)(q) = 4
0

e(u

2 +v 2 )

u2p1 v 2q1 dudv .

u0, v0

Usando coordenadas polares, escrevemos u = r cos e v = r sen com 0 /2 (pois u 0 e


v 0) e obtemos
(p)(q)

 Z
2

/2

er r 2(p+q)1 (cos )2p1 (cos )2q1 dr d


0

r 2

r 2(p+q)1 dr

(8.171)

(p + q) 2

/2

(cos )2p1 (cos )2q1 d


0

/2

(cos )2p1 (cos )2q1 d

provando (8.187).
Por mudancas de variavel, obtem-se outras representacoes integrais equivalentes a (8.187) para
B(p, q). Tomando t = (cos )2 obtemos trivialmente de (8.187) que
B(p, q) =
Tomando em (8.188) u =

t
t1

tp1 (1 t)q1 dt .

(8.188)

obtem-se, por outro lado,


B(p, q) =

up1
du .
(1 + u)p+q

(8.189)

As representacoes (8.187), (8.188) e (8.189) valem para Re (p) > 0 e Re (q) > 0. Alguns textos
adotam (8.188) como definicao de B(p, q) para Re (p) > 0 e Re (q) > 0.
A f
ormula dos complementos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

466/1304

Talvez a principal aplicacao de (8.186) e das representacoes integrais (8.187), (8.188) e (8.189) seja
o estabelecimento da importante f
ormula dos complementos:
sen (z)
1
=
,
(z)(1 z)

(8.190)

valida para todo z , relacao esta que pode ser escrita em forma mais simetrica como

valida para todo z .

1
2

1

z

1
2

+z

 =

cos(z)
,

(8.191)

Antes de demonstrar (8.190) notemos que ela permite escrever, para z nao-inteiro,
(z) =

=
.
(z + 1) sen (z)
z(z) sen (z)

Essa expressao permite calcular a extensao analtica de de Re (z) > 0 para Re (z) < 0. Por exemplo,
se Re (z) > 0, o lado direito pode ser calculado usando (8.157), fornecendo a funcao gama do lado
esquerdo, cujo argumento tem parte real negativa.
Para demonstrar30 (8.190), comecamos usando (8.186) e (8.189) para obter
Z z1
u
(z)(1 z) = B(z, 1 z) =
du ,
1+u
0

(8.192)

onde a representacao integral acima e valida para Re (z) > 0 e Re (1 z) > 0, ou seja, na faixa
0 < Re (z) < 1, a qual nos restringiremos provisoriamente.
A integral acima pode ser calculada pelo metodo dos resduos, como descreveremos. Seja I a integral
Z
w z1
dw ,
I :=
C 1+w
onde C e a curva fechada no plano complexo, orientada no sentido anti-horario, indicada na figura 8.1.
A curva C e composta dos segmentos orientados (1) e (2), localizados, respectivamente, imediatamente
acima e imediatamente abaixo do semi-eixo real positivo (sendo que faremos a distancia desses segmentos a esse semi-eixo ir a zero) e dos arcos orientados e , de raios  e R, respectivamente. Escolhemos
z1
R > 1, de modo que o polo simples que a funcao f (w) = w1+w possui em w = 1 fique no interior da
regiao delimitada por C.
Vamos representar a variavel complexa w na forma w = ei , com 0 < , 0 < 2. Devido
a essa escolha do intervalo de valores de , vemos que no segmento (1) tem-se que 0, enquanto que
R R z1
no segmento (2) 2. Assim, a integral no segmento orientado (1) e aproximada por  1+ d,
R R z1
enquanto que a integral no segmento orientado (2) e aproximada por e2iz  1+ d, as aproximacoes
sendo tanto melhores quanto mais proximos os segmentos (1) e (2) encontrarem-se do semi-eixo real
positivo (lembrar que o integrando e contnuo nas regioes acima a abaixo do semi-eixo real positivo
30

Seguimos os argumentos das notas de aula da Profa. Carmen Lys Ribeiro Braga. Para uma outra demonstraca
o
igualmente elementar que faz uso da f
ormula de produto de Weierstrass (8.181), vide [66].

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

467/1304

(1)

(2)

Figura 8.1: A curva C composta pelos segmentos de integracao , , (1) e (2).

e cada integracao e feita em segmentos finitos). Assim, a contribuicao das integracoes de (1) e (2) a`
integral I e
Z
 R z1
2iz
d ,
1e
 1+

que nos limites  0, R converge a (1 e2iz ) (z)(1 z) devido a (8.192). Vamos agora
estimar as integrais sobre os segmentos e .
Em temos = , de modo que podemos escrever w = ei , com 2 , para um certo
pequeno, e dw = iei d, de forma que, escrevendo z = x + iy com x = Re (z), y = Im (z),
Z
e, portanto,

w z1
dw = iz
1+w

ei(z1) i
e d
1 + ei


Z
Z 2 |y|
2|y|

w z1
e
x
x 2e


dw


d


,

1+w
1
1

que converge a zero quando  0 (lembrar que assumimos 0 < Re (z) < 1, ou seja, 0 < x < 1).

Em temos, analogamente, = R, de modo que podemos escrever w = Rei , com 2 ,


para um certo pequeno, e dw = iRei d, de forma que, escrevendo z = x + iy com x = Re (z),

JCABarata. Curso de Fsica-Matem


atica

y = Im (z),

Captulo 8

Vers
ao de 29 de setembro de 2005.

w z1
dw = iRz
1+w

468/1304

ei(z1) i
e d
1 + Rei

e, portanto,
Z



Z 2 |y|
z1
x


w
Rx1
e
x
2|y| R
2|y|


,
d 2e
= 2e
1 + w dw R
R1
R1
1 1/R

que converge a zero quando R pois x < 1.

z1

No interior da regiao delimitada por C o integrando f (w) = w1+w possui uma u


nica singularidade:
i(z1)
i
um polo simples em w = 1, cujo resduo e e
(lembrar que 1 = e ). Assim, pelo teorema dos
resduos,
Z z1
u du
= 2ieiz
1
+
u
C

que independe de  e R. Coletando os resultados anteriores sobre as integrais em (1), (2), e


conclumos que nos limites  0 e R vale a igualdade

2ieiz = 1 e2iz (z)(1 z) ,
que conduz trivialmente a

1
sen (z)
=
.
(z)(1 z)

Ate agora assumimos que 0 < Re (z) < 1. Todavia, ambos os lados da u
ltima expressao sao funcoes
inteiras. Portanto, a igualdade acima vale em todo plano complexo .
F
ormula de duplica
c
ao de Legendre
As propriedades da funcao beta permitem provar mais uma identidade sobre as funcoes gama, a
chamada f
ormula de duplicaca
o da funca
o Gama, devida a Legendre:


22z1
1
(2z) = (z) z +
,
(8.193)
2

valida para todo z que nao seja um inteiro nao-positivo ou um semi-inteiro nao-positivo, isto e,
que nao seja da forma n ou da forma n 1/2, com n = 0, 1, 2, 3, . . .. A demonstracao e bastante
simples.
Assumindo provisoriamente Re (z) > 0, temos
(z)(z)
= B(z, z)
(2z)

(8.188)

1
0

t(1 t)

z1

dt .

Efetuamos a mudanca de variavel de integracao u = 2t 1, temos


Z +1
Z 1
1
2
(z)(z)
2 z1
= 2z1
(1 u )
du = 2z1
(1 u2 )z1 du .
(2z)
2
2
1
0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

Por fim, fazendo a mudanca de variavel de integracao v = u2 , tem-se



Z 1
(z)( 21 )
B z, 21 (8.188)
1
(z)(z)
z1 21

(1 v) v dv =
= 2z1
=
(2z)
2
22z1
22z1 z + 12
0

(8.172)

469/1304

(z)
,
22z1 z + 21

provando (8.193) para Re (z) > 0. A generalizacao para todo z segue do fato de que ambos os
lados de (8.193) possuem uma extensao analtica para todo , exceto para os pontos em que z e um
inteiro nao-positivo ou um semi-inteiro nao-positivo.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

470/1304

Ap
endices
8.A

Prova da Proposi
c
ao 8.1. Justificando os Polin
omios de
Legendre

Provaremos a Proposicao 8.1 apenas para o caso da serie

c2k z 2k , pois a demonstracao para a serie

k=0

c2k+1 z 2k+1 e, mutatis mutantis, identica.

k=0

Caso
seja um inteiro nao-negativo par, a serie em (8.12) torna-se um polinomio e e, conseq
uentemente, finita para todo z .


Consideremos, entao, que


nao e um inteiro nao-negativo par. Tomemos a serie em (8.12)
somada, para simplificar, a partir de k = 2 e calculada em z = 1 (tomamos c0 = 1, sem perda de
generalidade):

k1 

X
X
( + 1)
1 Y
1
c2k = ( + 1)
.
2k l=1
2l(2l + 1)
k=2
k=2


Consideremos, para N > 2,

N
X
k=2

Se ( + 1) 0 teremos que

c2k


N
k1 
X
1 Y
( + 1)
=
1
.
2k
2l(2l + 1)
k=2

k1
Y
l=1

l=1

( + 1)
1
2l(2l + 1)

1,

pois os fatores sao positivos e maiores que 1. Logo,


N
X
k=2

c2k


N
k1 
N
X
X
1 Y
1
( + 1)
.
=
1

2k
2l(2l
+
1)
2k
k=2
l=1
k=2

N
N
X
X
1
Portanto, como lim
c2k diverge, completando a prova.
diverge, isso prova que lim
N
N
2k
k=2
k=2

claro que existe k0


Se ( + 1) > 0 devemos proceder de outra forma. E
0 <

( + 1)
< 1,
2k0 (2k0 + 1)

, k0 > 2, tal que


(8.A.1)

JCABarata. Curso de Fsica-Matem


atica

o que implica 1
N
X

(+1)
2l(2l+1)

Captulo 8

Vers
ao de 29 de setembro de 2005.

471/1304

> 0 para todo l > k0 . Escolhendo N > k0 , podemos escrever

c2k =

k=2

k0
X

N
X

c2k +

c2k

k=2

k=k0 +1

k0
X


kY
0 1

c2k +

k=2

l=1

( + 1)
1
2l(2l + 1)

 X
N
k=k0


k1 
1 Y
( + 1)
.
1
2k
2l(2l
+
1)
+1
l=k

(8.A.2)

Podemos escrever
k1
Y

l=k0

pois 1

(+1)
2l(2l+1)



!

k1
X
( + 1)
( + 1)
ln 1
= exp
,
1
2l(2l + 1)
2l(2l
+
1)
l=k
0

> 0 para todo l k0 .

Agora, se 0 x M para algum 0 < M < 1, entao vale


ln(1 x) x

ln(1 M )
.
M

(8.A.3)

Isso pode ser provado de diversas formas, por exemplo usando a concavidade da funcao logaritmo, que
garante que


ln a + (1 )b ln(a) + (1 ) ln(b) ,
para todo 0 1 e todo 0 < a < b. Tomando a = 1 M , b = 1 e = x/M , estabelece-se (8.A.3).
Com isso, e como 0 <
exp

k1
X

l=k0

(+1)
2l(2l+1)

(+1)
2k0 (2k0 +1)

( + 1)
ln 1
2l(2l + 1)

=: M , para todo l k0 , temos que

!

exp

k1
ln(1 M ) X ( + 1)
M
2l(2l + 1)
l=k
0

Agora,
k1

X
X
( + 1)
( + 1)

< ,
2l(2l
+
1)
2l(2l
+
1)
l=k
l=k
0

X
( + 1)
, teremos que
pois a serie acima e convergente. Assim, definindo K :=
2l(2l + 1)
l=k
0

exp

k1
X

l=k0

( + 1)
ln 1
2l(2l + 1)

!

ja que, por (8.A.1), ln(1 M ) < 0.

exp

k1
ln(1 M ) X ( + 1)
M
2l(2l + 1)
l=k

Dessa forma, retornando a (8.A.2), temos que

exp

ln(1 M )
K
M

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

k 1 



k0
N
0
Y

X
X
( + 1)



1
c2k =
c2k





2l(2l + 1)
l=1
k=2
k=2



k1
X
1
( + 1)
ln 1
exp
2k
2l(2l + 1)
+1
l=k

N
X

k=k0

k 1 



0
Y
( + 1)
ln(1 M )

K

1
exp

2l(2l + 1)
M
l=1

Como o limite lim

prova.

8.B

N
X

k=k0

472/1304

N
X

k=k0 +1

1
.
2k

N
X
1
diverge, conclumos que lim
c2k tambem diverge, completando a
N
2k
+1
k=2

Provando (8.14)

Vamos considerar apenas o caso em que m e par, pois o caso em que m e mpar pode ser tratado de
forma totalmente analoga. Temos que
!
m/2
k1
2k
Y
X
z
(0)
2l(2l + 1) m(m + 1) ,
Pm (z) = c0 ym
(z) = c0
(2k)!
l=0

k=0

Como dissemos, a convencao e escolher c0 de modo que o coeficiente do monomio de maior grau do
polinomio acima seja 2m(2m)!
. Assim, devemos ter
(m!)2
m

1
2
1 Y
2l(2l + 1) m(m + 1)
c0
m! l=0

ou seja,

Com isso

(2m)!
2m (m!)2

1
2
(2m)! Y
2l(2l + 1) m(m + 1)
c0 = m
2 m! l=0
m

!1

1
m/2
2
X
z 2k (2m)! Y
2l(2l + 1) m(m + 1)
Pm (z) =
(2k)! 2m m! l=k
k=0

Facamos agora a mudanca de variavel k


Pm (z) =

m/2
X
k=0

Pm (z) =

k=0

k. Ficamos com

z m2k (2m)!
(m 2k)! 2m m!

Facamos ainda a mudanca de variavel l


m/2
X

m
2

m
2

!1

m
1
2

l= m
k
2

2l(2l + 1) m(m + 1)

!1

l. Obtemos,

k
(2m)! Y
z
(m 2l)(m 2l + 1) m(m + 1)
(m 2k)! 2m m! l=1
m2k

!1

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

473/1304

Entretanto,
(m 2l)(m 2l + 1) m(m + 1) = 2l(2m 2l + 1) ,

como facilmente se ve. Agora, com isso,


k
Y
l=1

(m 2l)(m 2l + 1) m(m + 1)

!1

k
Y

l=1

2l(2m 2l + 1)

(1)k

(1)k
(2k)!!

k
Y
1
2l
l=1
m
Y

ll+k

Assim,

Vale, porem,

m/2
X
(1)k z m2k
Pm (z) =
2m (m 2k)!
k=0

(2m)! (2(m k) 1)!!


=
m! (2k)!! (2m 1)!!

l=1

1
2m 2l + 1

(2m 2l + 1)

(2m 2l + 1)

m
Y
(1)k
(2m 2l + 1)
(2k)!! (2m 1)!! l=k+1

k
Y

l=k+1
m
Y
l=1

!1

mk
Y
(1)k
(2(m k) 2l + 1)
(2k)!! (2m 1)!! l=1

(1)k
(2(m k) 1)!! .
(2k)!! (2m 1)!!
(2m)! (2(m k) 1)!!
m! (2k)!! (2m 1)!!

(2m)! (2(m k) 1)!!


m! (2k)!! (2m 1)!!

(2(m k))!!
(2(m k))!!

(2m)! (2(m k))!


m! (2m 1)!! (2k)!! (2(m k))!!

(2m)!! (2m 2k)!


m! (2k)!! (2(m k))!!

2m m! (2m 2k)!
m! 2k k! 2mk (m k)!

(2m 2k)!
,
k! (m k)!

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

onde, na pen
ultima passagem, usamos que (2p)!! = 2p p! para todo p


474/1304

. Com isso,

m/2
X
(1)k z m2k (2m 2k)!
,
Pm (z) =
2m (m 2k)! k! (m k)!
k=0

que e a expressao (8.14) para m par.


O caso em que m e mpar e analogo e e deixado como exerccio.

8.C

Justificando os Polin
omios de Hermite

Tomaremos aqui z = x


e consideraremos apenas a serie

k1
X
2
x2k Y
:= 1 x
(4l ) ,
2
(2k)!
k=2
l=1

(0)
y (x)

com mas 6= 2m para m um inteiro positivo par (o que faz da serie acima uma serie infinita),
(1)
pois o tratamento da serie y e identico.


Seja s > 1, arbitrario mas fixo, e escolhamos k0 > 2 tal que 1 4k0 > 1s . Note que se 0, isso
e valido para todo k0 > 2 enquanto que, se > 0, devemos tomar


s
, 2 .
(8.C.4)
k0 > max
4(s 1)


Escrevemos
(0)
y (x)

k1

k1
k0
X
X
2
x2k Y
x2k Y
:= 1 x
(4l )
(4l ) .
2
(2k)! l=1
(2k)! l=1
k=k +1
k=2
0

facil verificar que


E

k=k0

k1

x2k Y
(4l ) =
(2k)! l=1
+1
=

Vamos agora nos concentrar na serie


que para l k0 , vale


k1 
1)! Y

1
(2k)! l=1
4l

k1 2k (k

k=k0 +1


k0 1 

1 Y
1
4 l=1
4l

1
4l

4 x


4 x

k=k0 +1


k1 
1)! Y

1
. Pela escolha de k0 , sabemos
(2k)! l=k
4l
0


k1 
1)! Y

1
.
(2k)! l=k
4l

k 2k (k

k 2k (k

k=k0 +1

1
4k0

>

1
s

JCABarata. Curso de Fsica-Matem


atica

e, portanto,
k1
Y

l=k0

Alem disso,

Captulo 8

Vers
ao de 29 de setembro de 2005.

1
4l

>

475/1304

skk0

(2k)! = (2k)!! (2k 1)!! = 2k k! (2k 1)!! < 22k (k!)2 ,


pois
(2k1)!! = (2k1)(2k3)(2k5) 1 = 2

1
k
2



3
k
2




5
1
k
< 2k k(k1)(k2) 1 .
2
2

Logo,

k=k0 +1


 2 k
k1 

X
1
x

1)! Y
k0
> s
1
(2k)! l=k
4l
k(k!) s
k=k +1

k 2k (k

4 x

> s

k0

k=k0

1
(k + 1)!
+1

x2
s

k

 2 k+1

1
x
s X
= s 2
x k=k +1 (k + 1)! s
k0

sk0 +1
=
x2

x2 /s

k=k
0 +1
X
k=0

1
k!

x2
s

k !

2


Kex /s p(x)
(0)
Tudo isso mostra que y (x) e maior que
, onde K e uma constante (que depende
x2
de , s e k0 ) e p(x) e um polinomio de grau 2k0 + 2 em x. Como s e arbitrario, vemos que o produto
2
(0)
y ex /2 diverge para |x| , ja que podemos escolher 1/s > 1/2, tomando31 1 < s < 2.

No contexto do problema do oscilador harmonico na Mecanica Quantica (vide Secao 10.4, pagina
2
(0)
567) esse comportamento e inaceitavel, pois o produto y ex /2 representa uma funcao de onda, que
deve ser de quadrado integravel em . Isso forca-nos a tomar = 2m com m um inteiro positivo e
(0)
par, de modo a reduzir y (x) a um polinomio.


(1)

Para y (x) as consideracoes sao analogas e nao iremos repeti-las aqui.


31

(0)

Por (8.C.4), tomar s pr


oximo de 1 aumenta o grau do polin
omio p(x), mas n
ao altera o fato que y (x)ex
para |x|

/2

diverge

JCABarata. Curso de Fsica-Matem


atica

8.D

Captulo 8

Vers
ao de 29 de setembro de 2005.

476/1304

Provando (8.20)

Consideraremos apenas o caso em que m e par, pois o caso em que m e mpar e tratado analogamente.
Para m par, tem-se

m
2
2k k1
X
Y
z
Hm (z) = (2)m/2 (m 1)!! 1 m z 2 2m
(4l 2m) .
(2k)!
k=2

Fazendo a mudanca de variaveis k

m
2

k, teremos

Hm (z) = (2)m/2 (m 1)!! 1 m z 2 2m

m
2
2

X
k=0

l=1

m2k

z
(m 2k)!

m
k1
2

Y
l=1

(4l 2m) .

Tem-se que
m
k1
2

Y
l=1

(4l 2m)

(2)

m
k1
2

m
k1
2

(m 2l)

l=1

m
1
2

(2)

m
k1
2

(m 2l)

l=1

m
1
2

k
l0 = m
2

(m 2l0 )

m
1
2

l0
l0 m
2

(2)

m
k1
2

Y
l=1

(m 2l)

k
Y

= (2) 2 k1

2l0

(m 2)!!
.
(2k)!!

l0 =1

Logo,

Hm (z) = (2)m/2 (m 1)!! 1 m z 2 2m


m
2

= (2) (m 1)!! 1 m z


2

m
2
2

X
k=0

m
2
2

X
k=0

m2k

m
(m 2)!!
z
(2) 2 k1
(m 2k)!
(2k)!!

(1)k m!
(2z)m2k
(m 2k)! k!

2
X
(1)k m!
(2z)m2k ,
=
(m 2k)! k!
k=0

(8.D.5)

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

477/1304

ja que
m (m1)!! (m2)!! = m!,

que

(2k)!! = 2k k!

(2p)!
(2p)!! (2p 1)!!
=
= 2p (2p1)!! .
p!
p!

e que

A expressao (8.D.5) coincide com (8.20) para m par. O caso em que m e mpar e analogo e e deixado
como exerccio.

8.E

Porque deve ser um Inteiro Positivo na Equa


c
ao de
Laguerre

Justificaremos aqui por que consideramos um inteiro positivo na equacao de Laguerre. Temos dois
casos a tratar: a. < 0 e b. > 0 mas nao-inteiro. Em aplicacoes, especialmente na Mecanica
Quantica, a variavel z e um n
umero real positivo (uma coordenada radial). Vamos entao doravante
tomar z real e positivo e escrever z = r > 0.
Se nao for um inteiro positivo a serie (8.132) acima e uma serie infinita. Podemos escrever
(1)

n1
Y
l=0

( l) =

n1
Y
l=1

(l ) = (n 1)!

Se < 0, a u
ltima expressao fica
||(n 1)!
e
y1 (r) = 1 + ||
Agora,

1
n

1
n+1

>

e 1+

||
l

X
n=1

n1
Y
l=1

1
n(n!)

||
1+
l

"n1 
Y
l=1

n1
Y
l=1

1
l

(8.E.6)

||
1+
l

#

rn .

> 1. Assim,

y1 (r) > 1 + ||

X
n=1

1
|| r
rn = 1 +
(e 1 r) .
(n + 1)!
r

Disso conclumos que y1 (r) cresce da ordem de er quando r . O problema com isso e que em
varias aplicacoes tal comportamento e indesejado. No problema do atomo de hidrogenio da Mecanica
Quantica, por exemplo, o produto er/2 y1 (r) representa a funcao de onda radial de um eletron de
momento angular nulo sob um potencial coulombiano32 . Pelo visto acima, se < 0 a funcao de onda
cresceria para r pelo menos como e+r/2 , nao podendo, assim, ser uma funcao de quadrado integravel em 3 , uma condicao fundamental ligada a` interpretacao probabilstica da Mecanica Quantica.
Assim, solucoes com < 0 devem ser descartadas nesse contexto.


32

Vide Seca
o 10.5, p
agina 568, ou qualquer bom livro de Mec
anica Qu
antica.

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

478/1304

Tratemos agora do caso em que e positivo, mas nao e um n


umero inteiro. Por (8.E.6), podemos
escrever, para n 1 2de,
(1)

n1
Y
l=0

( l) = (n 1)!

2de1 

Y
l=1

1
l

 n1
Y 
l=2de

onde de e o menor inteiro maior ou igual a . Assim,


y1 (r) = 1 +

2de
X
(1)n
n=1

(n!)2

"n1
Y
l=0

( l)

com
L :=

rn + L

n=2de+1
2de1 

Y
l=1

1
l

1
n (n!)

1
l

n1
Y

l=2de

n
r ,
l

A razao de escrevermos essa expressao dessa forma reside no fato que, agora,

n1
Y

l=2de

produto de termos positivos, sendo que, para l 2de tem-se


1

1
l

e um

onde

2de
de + (de )
de
1
=
=
>
=
.
2de
2de
2de
2de
2
Com isso, para a u
ltima soma do lado direito vale



n1

X
Y
X
n
1
1
1
()n2de r n
r
n (n!)
l
n (n!)
:= 1

n=2de+1

l=2de

n=2de+1

= K

n=2de+1

> K

n=2de+1

1
(r)n
n (n!)
1
(r)n
(n + 1)!



K r
=
e P (r)
r
2de+1

onde K :=

2de

, P (r) :=

X 1
(r)n e um polinomio de grau 2de + 1 e > 1/2.
n!
n=0

Disso conclumos que para r , |y1 (r)| cresce mais rapido que er com > 1/2. Assim, um
produto como er/2 y1 (r), que como dissemos representa a funcao de onda radial de um eletron de

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

479/1304

momento angular nulo sob um potencial coulombiano, nao e de quadrado integravel no espaco 3 , uma
condicao fundamental ligada a` interpretacao probabilstica da Mecanica Quantica. Assim, solucoes
com > 0, mas nao-inteiro, devem tambem ser descartadas nesse contexto.


JCABarata. Curso de Fsica-Matem


atica

8.6

Vers
ao de 29 de setembro de 2005.

Captulo 8

480/1304

Exerccios Adicionais

E. 8.25 Exerccio. Considere as equacoes diferenciais u0 (x) au(x) = 0 e u00 (x) + 02 u(x) = 0, com
a , 0 , constantes e x . Usando o metodo de expansao em serie mostre que suas solucoes
gerais sao, respectivamente, u(x) = Aeax e u(x) = A cos(0 x) + B sen (0 x), onde A e B sao constantes.
6
E. 8.26 Exerccio. Seja a bem conhecida expansao binomial
(1 + x)

X
k=0

valida para x

( + 1)
xk ,
( k + 1)(k + 1)

com |x| < 1 e para todo . Demonstre-a resolvendo a equacao diferencial


(1 + x)y 0 y = 0

com a condicao y(0) = 1. Sugest


ao. Verifique que (1+x) e solucao da equacao diferencial acima e satisfaz
y(0) = 1. Depois resolva a mesma equacao, procurando solucoes na forma de uma serie de potencias na
regiao |x| < 1.
Mostre que quando e um inteiro positivo a solucao reduz-se a um polinomio.

E. 8.27 Exerccio.
Usando o metodo de expansao em serie de potencias mostre que a solucao da
equacao diferencial y 0 (z) + zy(z) = 0 e y(z) = c exp(z 2 /2), onde c e uma constante.
6
E. 8.28 Exerccio.
equacao diferencial

Encontre, utilizando o metodo de expansao em serie, a solucao geral da seguinte


2

u00 (x) ex u0 (x) + sin(x)u(x) = 0 .


Em que regiao a serie de potencias obtida para u(x) deve ser convergente? Justifique.

E. 8.29 Exerccio. Mostre que a funcao u(x) = ( arcsen x)2 e a solucao da equacao diferencial
(1 x2 )u00 (x) xu0 (x) = 2 ,
com as condicoes iniciais u(0) = u0 (0) = 0. Usando o metodo de expansao em serie para resolver a equacao,

X
2
obtenha a expansao de ( arcsen x) em uma serie de potencias
ck xk . Essa serie coincide com a serie de
k=0

Taylor de ( arcsen x)2 em x = 0. Esse metodo de determinar a expansao em serie de Taylor dessa funcao
e muito mais simples que o metodo direto, envolvendo o computo das derivadas da funcao ( arcsen x) 2 em
x = 0, e foi descoberto por Euler. A serie obtida ja era conhecida do matematico Kowa Seki (1642-1708),
contemporaneo de Newton).
6

JCABarata. Curso de Fsica-Matem


atica

Captulo 8

Vers
ao de 29 de setembro de 2005.

481/1304

E. 8.30 Exerccio. a) Pelo metodo de Frobenius determine a solucao geral da seguinte equacao diferencial:
x2 u00 (x) (1 + x)u(x) = 0 ,
b) Qual o raio de convergencia das series encontradas? Justifique.
c) Determine a solucao da mesma equacao que satisfaz a condicao u(0) = 0. Ha solucoes para a
condicao inicial u(0) = 1? Justifique.
6
E. 8.31 Exerccio. Prove as identidades
2k k! = (2k)!! ,
k


(2k)!!(2k 1)!! = (2k)! ,

(2k + 1)!!(2k)!! = (2k + 1)! ,

E. 8.32 Exerccio. Prove as identidades


(3/2) (2n + 1)!!
(n + 1 + 1/2) =
=
2n

(2n + 1)!!
,
2
2n

(n + 1 + 1/3) = 3(n+1) (3n + 1)!!! (1/3) ,


(n + 2/3) = 3n (3n 1)!!! (2/3) ,

n


n


, n0,

, n0,

, n1.

Sugestao: use a bem-conhecida propriedade da funcao gama: (z + 1) = z(z).


E. 8.33 Exerccio. Usando (8.167) e o fato que (z) = (z), prove que para todo y
|(iy)|2 =

6
vale

y senh (y)

e usando (8.191), prove que para todo y vale



 2

1 + iy =
.


2
cosh(y)


E. 8.34 Exerccio. A funcao zeta de Riemann e definida por

X
1
(s) :=
ns
n=1

para Re (s) > 1. Mostre que, para n = 1, 2, 3, . . .,


Z
s
(s) = n

enx xs1 dx

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 8

482/1304

e, usando esta u
ltima relacao, mostre que
(s) (s) =

xs1
dx,
ex 1

Re (s) > 1.
6

Captulo 9
Propriedades de Algumas Funco
es Especiais
Conte
udo
9.1

9.2

Discuss
ao Preliminar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 483
9.1.1

Definicoes e Consideracoes Preliminares . . . . . . . . . . . . . . . . . . . . . 484

9.1.2

Relacoes de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 486

9.1.3

Formulas de Rodrigues

9.1.4

Funcoes Geratrizes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 491

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 488

Propriedades de Algumas Fun


co
es Especiais . . . . . . . . . . . . . . . . . 495
9.2.1

Propriedades dos Polinomios de Legendre . . . . . . . . . . . . . . . . . . . . 495

9.2.2

Propriedades dos Polinomios de Legendre Associados. Harmonicos Esfericos . 501

9.2.3

Propriedades dos Polinomios de Hermite . . . . . . . . . . . . . . . . . . . . . 511

9.2.4

Propriedades dos Polinomios de Laguerre . . . . . . . . . . . . . . . . . . . . 515

9.2.5

Propriedades dos Polinomios de Laguerre Associados . . . . . . . . . . . . . . 519

9.2.6

Propriedades das Funcoes de Bessel

9.2.7

Propriedades das Funcoes de Bessel Esfericas . . . . . . . . . . . . . . . . . . 537

. . . . . . . . . . . . . . . . . . . . . . . 522

9.A Provando (9.44) a


` For
ca Bruta . . . . . . . . . . . . . . . . . . . . . . . . . 541
9.2

Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 543

ste captulo da continuidade ao Captulo 8 e concentra-se no estudo de propriedades especiais


de algumas das funcoes la apresentadas como solucoes de equacoes diferenciais de interesse.
Nossos principais objetivos sao a deducao das relacoes de ortogonalidade de certas funcoes, a
deducao das chamadas formulas de Rodrigues e de relacoes de recorrencia para as mesmas e
tambem a determinacao de suas funcoes geratrizes. Essas propriedades, que serao devidamente definidas
e discutidas na Secao 9.1, sao u
teis para a resolucao de equacoes diferenciais, especialmente aquelas
provenientes de problemas envolvendo equacoes diferenciais parciais submetidas a certas condicoes
iniciais e/ou de contorno. Exemplos de aplicacoes a problemas fsicos sao discutidos no Captulo
10, pagina 544. Ainda que nosso tratamento seja tao completo quanto possvel, dentro do escopo
relativamente limitado que pretendemos, repetimos aqui a recomendacao das referencias listadas no
Captulo 8 a` pagina 395.

9.1

Discuss
ao Preliminar

Na proxima secao, a Secao 9.2, tencionamos apresentar ao leitor certas propriedades de algumas das
funcoes encontradas como solucao de equacoes diferenciais de interesse em Fsica, propriedades essas

483

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

484/1304

cuja utilidade maior manifesta-se especialmente, como mencionado, na resolucao de equacoes diferenciais parciais submetidas a certas condicoes iniciais e/ou de contorno. Na presente secao prepararemos
o terreno discutindo algumas ideias gerais.
As ideias gerais que apresentaremos envolvem 1. as chamadas relaco
es de ortogonalidade, que generalizam aquelas bem-conhecidas da teoria das series de Fourier; 2. as chamadas f
ormulas de Rodrigues,
u
teis para a obtencao de relacoes de recorrencia entre funcoes e 3. as chamadas funco
es geratrizes, das
quais outras propriedades u
teis sao extradas, como por exemplo representacoes integrais para certas
funcoes.
Os exemplos principais dos quais trataremos a seguir, na Secao 9.2, envolvem os polinomios de
Legendre, de Hermite e de Laguerre e as funcoes de Bessel, todas de importancia na resolucao de
problemas do Eletromagnetismo, de Mecanica Quantica, da Mecanica dos Fluidos e de outras areas.

9.1.1

Defini
co
es e Considera
co
es Preliminares

No Captulo 8 tratamos nossas equacoes diferenciais como equacoes no plano complexo. Para a discussao das chamadas relacoes de ortogonalidade devemos considerar apenas equacoes diferenciais de
uma variavel real. De qualquer forma, na absoluta maioria das equacoes diferenciais de interesse em
Fsica a funcao incognita y e uma funcao de uma variavel real, digamos, x, e assim consideraremos
aqui.
Em muitas das equacoes diferenciais de interesse em Fsica a variavel x e restrita a uma regiao J
da reta real, sendo J um intervalo fechado (tal como [a, b]), aberto (tal como (a, b)) ou semi-aberto
(tal como (a, b] ou [a, b)). Podem tambem ocorrer intervalos infinitos, tais como J = (, ), ou
semi-infinitos, como J = (0, ) ou J = [0, ). Denotaremos por J 0 o interior do intervalo J, ou
seja, J 0 e o maior intervalo aberto contido em J. Por exemplo, se J = [a, b] teremos J 0 = (a, b), se
J = [0, ) entao J 0 = (0, ) e se J e aberto entao J 0 = J.


Ate aqui escrevemos nossas equacoes lineares homogeneas de segunda ordem na forma
y 00 (x) + a(x)y 0 (x) + b(x)y(x) = 0

(agora ja adotando como variavel x J). Em muitos problemas de interesse essa equacao pode ser
escrita de outra forma, denominada por alguns autores de forma can
onica de Liouville, e que sera
importante para o que segue:
(p(x)y 0 (x))0 + q(x)y(x) + r(x)y(x) = 0,

(9.1)

onde,
1. p(x) e real, contnua e diferenciavel em J 0 e p(x) > 0 para todo x J 0 .
2. q e real e contnua em J.
3. r(x) e real e contnua em J 0 e r(x) > 0 para todo x J 0 .
4. e uma constante.

(9.2)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

485/1304

As condicoes de positividade de p e r em J 0 sao as mais importantes. Note-se que nao excluiremos que
p e r possam se anular (ou mesmo divergir) nos extremos do intervalo J 1 .
Como o leitor pode facilmente constatar, a relacao entre essas funcoes e a seguinte:
a(x) =

p0 (x)
,
p(x)

b(x) =

1
(q(x) + r(x)) .
p(x)

Dadas a(x) e b(x), a primeira relacao acima fixa p(x) (a menos de uma constante), a saber,
Z x

0
0
p(x) = exp
a(x )dx + const. .
0

Ja a segunda nem sempre fixa q(x) e r(x) univocamente, tudo dependendo da condicao de positividade
sobre r(x), que foi mencionada acima, ou de qual parametro se deseja tomar por . Na maioria dos
casos, porem, q e r podem ser fixados univocamente, o que ficara claro nos exemplos que seguem.
Varias das equacoes diferenciais de segunda ordem das quais tratamos no Captulo 8 podem ser
escritas na forma canonica em algum intervalo J conveniente2 . Vamos a alguns exemplos que nos
interessarao:
A equa
c
ao do oscilador harm
onico simples: y 00 (x) + y(x) = 0. Aqui p(x) = 1, q(x) = 0,
r(x) = 1 e = . Varios tipos de intervalos J aparecem em problemas. No problema da corda
vibrante, por exemplo, pode-se adotar J = [0, L], L sendo o comprimento da corda.
A equa
c
ao de Legendre (1 x2 )y 00 (x) 2xy 0 (x) + ( + 1)y(x) = 0 e tipicamente considerada
no intervalo J = [1, 1] e pode ser escrita como

0
1 x2 y 0 (x) + ( + 1)y(x) = 0.
Aqui p(x) = (1 x2 ), q(x) = 0, r(x) = 1 e = ( + 1).

Note que p(x) > 0 em J 0 = (1, 1), mas anula-se nos extremos x = 1. Ja a funcao r(x) e
positiva em todo J = [1, 1].

A equa
c
ao de Hermite y 00 (x) 2xy 0 (x) + y(x) = 0, e tipicamente considerada no intervalo
J = (, ) e pode ser escrita como
 2
0
2
ex y 0 (x) + ex y(x) = 0.
2

Aqui p(x) = ex , q(x) = 0, r(x) = ex e = .

Note que p(x) > 0 e r(x) > 0 em todo J = (, ).

A equa
c
ao de Chebyshev (1 x2 )y 00 (x) x y 0 (x) + 2 y(x) = 0 e tipicamente considerada no
intervalo J = [1, 1] e pode ser escrita como

0
1
0
2
1 x y (x) + 2
y(x) = 0.
1 x2

O caso em que p e r permanecem finitas e positivas nos extremos do intervalo J e particularmente importante no
chamado Problema de Sturm-Liouville regular, tratado no Captulo 12.
2
A conveniencia e ditada pelo problema fsico subjacente.

JCABarata. Curso de Fsica-Matem


atica

Aqui p(x) =

Vers
ao de 29 de setembro de 2005.

Captulo 9

486/1304

1 x2 , q(x) = 0, r(x) = 1/ 1 x2 e = 2 .

Note que p(x) > 0 em J 0 = (1, 1), mas anula-se nos extremos x = 1. Ja a funcao r(x) e
positiva em todo J = (1, 1), mas diverge nos extremos x = 1.
A equa
c
ao de Laguerre xy 00 (x)+(1x)y 0 (x)+y(x) = 0 e tipicamente considerada no intervalo
J = [0, ) e pode ser escrita como
0
xex y 0 (x) + ex y(x) = 0.
Aqui p(x) = xex , q(x) = 0, r(x) = ex e = .

Note que p(x) > 0 em J 0 = (0, ), mas anula-se no extremo x = 0. Ja a funcao r(x) e positiva
em todo J = [0, ).
A equacao de Bessel e a equacao de Bessel esferica tambem podem ser escritas desta forma canonica.
Porem, o tratamento das relacoes de ortogonalidade que se segue exige para elas algumas adaptacoes
e postergaremos sua discussao paras as Secoes 9.2.6 e 9.2.7, adiante.
Daqui para frente vamos escrever o intervalo J, finito ou nao, na forma J := (A, B)

Para uma funcao u definida em J que seja pelo menos duas vezes diferenciavel, vamos definir o
operador diferencial L por
(Lu)(x) := (p(x)u0 )0 + q(x)u .
(9.3)
A equacao (9.1) fica simplificada na forma
(Ly)(x) + r(x)y(x) = 0 .

(9.4)

Se for um n
umero tal que a equacao (9.4) for satisfeita para alguma funcao u (que em geral
dependera de ), entao diz-se que e um autovalor e u e dito ser a auto-funca
o associada ao autovalor
. Essa nomenclatura surge por analogia com os conceitos de autovalor e auto-vetor de matrizes na
algebra linear3 .

9.1.2

Rela
co
es de Ortogonalidade

O teorema que agora apresentamos expressa uma da mais importantes propriedades das solucoes das
equacoes diferenciais discutidas acima: as chamadas relacoes de ortogonalidade.
Teorema 9.1 Considere-se a equaca
o diferencial Lu(x) + r(x)u(x) = 0 definida no intervalo (n
ao
necessariamente finito) J = (A, B), com p, q e r satisfazendo as condico
es enumeradas em (9.2).
Sejam 1 e 2 com 1 6= 2 e suponhamos que u1 e u2 sejam funco
es n
ao-nulas que satisfazem


Lu1 (x) + 1 r(x)u1 (x) = 0

em J = (A, B) e suponhamos ainda que os limites4




lim p(b) u1 (b)u02 (b) u01 (b)u2 (b)
e
bB

Lu2 (x) + 2 r(x)u2 (x) = 0 ,




lim p(a) u1 (a)u02 (a) u01 (a)u2 (a)

aA+

1
Estritamente falando e u s
ao auto-valores, respectivamente, auto-funco
es, do operador M = r(x)
L.
Os limites lim e lim significam os limites a
` esquerda e a
` direita, respectivamente.
xY

xY+

(9.5)

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

existam e satisfacam




0
0
0
0
lim p(b) u1 (b)u2 (b) u1 (b)u2 (b) = lim p(a) u1 (a)u2 (a) u1 (a)u2 (a) .
aA+

bB

Ent
ao,

487/1304

(9.6)

u1 (x) u2 (x) r(x) dx = 0 .

(9.7)

Prova. Seja (a, b), com A < a < b < B, qualquer intervalo finito contido em J 0 . Consideremos a
expressao
Z b
(1 2 )
u1 (x) u2 (x) r(x) dx .
a

Como 1 e 2 sao reais, isso pode ser escrito por (9.5) como
Z

b
a

(1 r(x)u1 (x)) u2 (x) dx

u1 (x) (2 r(x)u2 (x)) dx


a

b
a

u1 (x) (Lu2 )(x) dx

(Lu1 )(x) u2 (x) dx .


a

Agora, para quaisquer u e v duas vezes diferenciaveis definidas em (a, b) vale, usando-se integracao
por partes,
Z b
Z b
Z b
0 0
v(x) (Lu)(x) dx =
v(x)(p(x)u ) dx +
v(x)q(x)u(x) dx
a

=
=

=
ou seja,

b
a

Assim, concluimos que


(1 2 )

b
a

v 0 (x)(p(x)u0 )
a

u(pv 0 )0
a
b
a

b Z
dx + vpu +
0

v(x)q(x)u(x) dx
a

b
b Z

0
dx + vpu v pu +
0

v(x)q(x)u(x) dx
a

b
b


(Lv)(x) u(x) dx + vpu0 v 0 pu ,

v(x) (Lu)(x) dx

(9.8)

b
b


(Lv)(x) u(x) dx = vpu0 v 0 pu .
a

b
b


u1 (x) u2 (x) r(x) dx = u1 pu02 u01 pu2
a

(9.9)





= p(b) u1 (b)u02 (b) u01 (b)u2 (b) p(a) u1 (a)u02 (a) u01 (a)u2 (a) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

488/1304

Conseq
uentemente, tem-se pelas hipoteses,

(1 2 )

u1 (x) u2 (x) r(x) dx


A





= lim p(b) u1 (b)u02 (b) u01 (b)u2 (b) lim p(a) u1 (a)u02 (a) u01 (a)u2 (a) = 0 .
aA+

bB

Como 1 6= 2 , isso implica

u1 (x) u2 (x) r(x) dx = 0, como queramos provar.


A

A relacao (9.7) diz-nos que u1 e u2 sao ortogonais em relacao ao produto escalar


hf, gir :=

f (x)g(x) r(x) dx ,

(9.10)

RB
definido no conjunto de todas as funcoes f : J tais que A |f (x)|2 r(x) dx < . Essas relacoes
de ortogonalidade sao de suma importancia em aplicacoes, especialmente na resolucao de equacoes
diferenciais parciais sob certas condicoes de contorno. O leitor interessado em exemplos pode passar
diretamente a` Secao 9.2, pagina 495. Aplicacoes a` solucao de equacoes diferenciais parciais de interesse
em Fsica serao vistas no Captulo 10, pagina 544.
Ha varias condicoes sob as quais (9.6) e satisfeita. Por exemplo, ela sera satisfeita se p(A) = p(B) =
0 e se u1 , u2 e suas derivadas nao divergirem em A e B. Outra condicao sob a qual (9.6) e satisfeita
se da, no caso em que (A, B) e um intervalo finito, sob a hipotese que p(A) e p(B) sejam finitos e que
u1 e u2 satisfacam condicoes de contorno em A e B do tipo
1 y(A) + 2 y 0 (A) = 0 ,

(9.11)

1 y(B) + 2 y 0 (B) = 0 ,

(9.12)

onde 1 , 2 , 1 , 2 sao constantes fixadas, sendo (1 , 2 ) 6= (0, 0) e (1 , 2 ) 6= (0, 0). Esse u


ltimo
tipo de situacao e discutido com detalhe no Captulo 12, pagina 606, especialmente no Lema 12.1 da
pagina 620.

9.1.3

F
ormulas de Rodrigues

As ideias desta pequena secao serao melhor ilustradas nos exemplos da Secao 9.2.
Consideremos a equacao diferencial (p(x)y 0 (x))0 + q(x)y(x) + r(x)y(x) = 0, ou seja, Ly + ry = 0,
com p, q e r satisfazendo as condicoes enumeradas em (9.2) e suponhamos tambem que r seja uma
funcao infinitamente diferenciavel de x. Consideremos que o intervalo J onde a equacao e considerada
seja J = [1, 1]. Para n = 0, 1, 2, . . ., sejam definidas as funcoes
!
1 dn
2 n
r(x)(1 x )
.
(9.13)
pn (x) :=
r(x) dxn

JCABarata. Curso de Fsica-Matem


atica

facil ver que se m < n, entao


E

Vers
ao de 29 de setembro de 2005.

Captulo 9

489/1304

xm pn (x) r(x) dx = 0 ,

(9.14)

ou seja, cada pn e ortogonal, segundo o produto escalar h, ir definido em (9.10), a todos os polinomios
de grau menor que n. Para provar (9.14), basta escrever
!
Z 1
Z 1
n
m d
m
2 n
x
x pn (x) r(x) dx =
dx
r(x)(1 x )
dxn
1
1


dk
2 n
, com k < n,
e fazer n vezes integracao por partes, lembrando que a expressao dx
r(x)(1

x
)
k

sempre contem um fator (1 x2 ) que se anula em 1.


E. 9.1 Exerccio importante. Faca isso!

Se as funcoes pn forem elas mesmas polinomios de grau n, o que ocorre em varios casos, conclumos
que
Z 1
pm (x) pn (x) r(x) dx = 0 ,
1

sempre que m 6= n. Isso significa que os polinomios pn (x) sao ortogonais dois-a-dois segundo o produto
escalar h, ir no intervalo J = [1, 1].

Varias equacoes diferenciais do tipo mencionado acima, definidas em um intervalo finito [1, 1], tem
solucoes polinomiais, como por exemplo, a equacao de Legendre e de Chebyshev. Como as mesmas,
pelo Teorema 9.1, sao ortogonais em relacao ao produto escalar h, ir no intervalo J = [1, 1]5 ,
as consideracoes acima sugerem que as solucoes polinomiais possam ser escritas, a menos de uma
constante multiplicativa, na forma (9.13). Isso e, de fato, verdade para varias equacoes importantes
(como as de Legendre e Chebyshev) e da expressao (9.13) sera possvel obter varias propriedades
daqueles polinomios. Isso sera melhor discutido nos exemplos que trataremos na Secao 9.2.
A expressao (9.13) e denominada f
ormula de Rodrigues6 .
E. 9.2 Exerccio. Generalize a formula de Rodrigues (9.13) para um intervalo J = [a, b] finito arbitrario.
Sugestao: procure uma transformacao linear que mapeie bijetivamente [1, 1] em [a, b].
6
As formulas de Rodrigues podem ser generalizadas para equacoes diferenciais definidas em intervalos
nao-finitos, como J = (0, ) ou J = (, ). Tratemos disso.

Para o caso J = (0, ) devemos supor novamente que r(x) seja infinitamente diferenciavel, mas
devemos ainda supor que r(x) seja limitada em x = 0 e que r(x) e todas as suas derivadas r (m) (x)
caiam no infinito mais rapido que qualquer potencia, ou seja lim x xk r (m) (x) = 0 para todo k 0 e
m 0. Definimos, nesse caso,

1 dn 
n
r(x)
x
.
(9.15)
pn (x) :=
r(x) dxn
5

Veremos isso explicitamente nos exemplos da Seca


o 9.2
Benjamin Olinde Rodrigues (1794-1851). Rodrigues foi banqueiro e matem
atico amador, nascido na Franca, mas de
origem judaico-portuguesa. Encontrou a f
ormula que leva seu nome apenas para o caso dos polin
omios de Legendre. A
generalizaca
o aqui apresentada e posterior. Rodrigues tambem deu contribuico
es para a teoria dos quaternions e para o
grupo SO(3) (vide Proposica
o 13.5, p
agina 695). Apesar de banqueiro, Rodrigues foi lder do partido socialista frances.
6

JCABarata. Curso de Fsica-Matem


atica

facil ver que se m < n, entao


E

Para ver isso, escrevemos novamente


Z

Vers
ao de 29 de setembro de 2005.

Captulo 9

xm pn (x) r(x) dx = 0 ,

490/1304

(9.16)

xm pn (x) r(x) dx =

xm

dn
r(x) xn
n
dx

dx

e fazemos integra
cao 
por partes, usando que limx xk r (m) (x) = 0 para todos k 0 e m 0 e que a

dk
n
, com k < n, sempre contem um fator x que se anula em 0.
expressao dx
k r(x)x
E. 9.3 Exerccio importante. Complete os detalhes.

Em certos exemplos, como na equacao de Laguerre, as funcoes pn sao polinomios na variavel x.


Nesses casos, temos entao que
Z
pm (x) pn (x) r(x) dx = 0 ,
0

sempre que m 6= n. Isso significa que os polinomios pn (x) sao ortogonais dois-a-dois segundo o produto
escalar h, ir no intervalo J = (0, ). Como antes, isso sugere que as solucoes polinomiais de certas
equacoes diferenciais definidas no intervalo J = (0, ) possam ser escritas, a menos de uma constante
multiplicativa, na forma sugerida pela formula de Rodrigues (9.15). Veremos que tal e o caso para os
polinomios de Laguerre e isso nos permitira obter algumas relacoes u
teis sobre aqueles polinomios.
Para o caso J = (, ) devemos supor novamente que r(x) seja infinitamente diferenciavel,
mas devemos ainda supor que r(x) e todas as suas derivadas r (m) (x) caiam no infinito mais rapido que
qualquer potencia, ou seja lim|x| |x|k |r (m) (x)| = 0 para todo k 0 e m 0. Definimos, nesse caso,
pn (x) :=
facil ver que se m < n, entao
E


1 dn 
r(x)
.
r(x) dxn

xm pn (x) r(x) dx = 0 ,

(9.17)

(9.18)

Para ver isso, escrevemos novamente


Z
Z
m
x pn (x) r(x) dx =

xm


dn 
r(x)
dx
dxn

e fazemos integracao por partes, usando que lim|x| |x|k |r (m) (x)| = 0 para todos k 0 e m 0.
E. 9.4 Exerccio importante. Complete os detalhes.

Em certos exemplos, como na equacao de Hermite, as funcoes pn sao polinomios na variavel x.


Nesses casos, temos entao que
Z
pm (x) pn (x) r(x) dx = 0 ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

491/1304

sempre que m 6= n. Isso significa que os polinomios pn (x) sao ortogonais dois-a-dois segundo o produto
escalar h, ir no intervalo J = (, ). Como antes, isso sugere que as solucoes polinomiais de
certas equacoes diferenciais definidas no intervalo J = (, ) possam ser escritas, a menos de uma
constante multiplicativa, na forma sugerida pela formula de Rodrigues (9.17). Veremos que tal e o caso
para os polinomios de Hermite e isso nos permitira obter algumas relacoes u
teis sobre os mesmos.

9.1.4

Fun
co
es Geratrizes

Funcoes geratrizes desempenham um elegante papel no estudo de propriedades de seq


uencias numericas,
em analise combinatoria e no estudo de certas seq
uencias de funcoes (ilustraremos essa afirmacao
estudando com elas, logo abaixo, a chamada seq
uencia de Fibonacci). Faremos adiante uso de funcoes
geratrizes para demonstrar algumas propriedades u
teis de algumas das solucoes que encontramos no
Captulo 8, como os polinomios de Legendre, de Hermite, de Laguerre, de Chebyshev e as funcoes de
Bessel.
O leitor podera encontrar na bela referencia [50] uma vasta colecao de identidades combinatorias interessantes que podem ser engenhosamente demonstradas com o uso de funcoes geratrizes de seq
uencias,
assim como outras referencias a` literatura pertinente.
Fun
co
es geratrizes
Seja {an , n } uma seq
uencia de n
umeros reais ou complexos. Define-se a funca
o geratriz da
seq
uencia {an , n } como sendo a funcao dada por


G{an } (t) :=

a n tn .

n=0

Essa definicao pressupoe que a serie de potencias em t do lado direito seja convergente em alguma
regiao do plano complexo, digamos |t| < T , para algum T > 0. Isso nem sempre e o caso. Por exemplo,
se an = n! a serie acima tem raio de convergencia nulo.
Fun
co
es geratrizes exponenciais
A funca
o geratriz exponencial da seq
uencia {an , n
E{an } (t) :=

} e definida por

X
an
n=0

n!

tn .

Essa definicao pressupoe que a serie de potencias em t do lado direito seja convergente em alguma
regiao do plano complexo, digamos |t| < T .
Fun
co
es geratrizes de Dirichlet
Para certos tipos de seq
uencias e conveniente
definir outro tipo de funcao geratriz, substituindo os
P
monomios tn por outras funcoes de t:
a
S
(t).
O exemplo mais importante desse tipo de funcao
n=0 n n
t
geratriz e aquele no qual se toma Sn (t) = 1/n , n 1. Isso nos conduz a` proxima definicao.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

A funca
o geratriz de Dirichlet7 da seq
uencia {an , n
D{an } (t) :=

492/1304

} e definida por

X
an
n=1

Captulo 9

nt

desde que a serie do lado direito convirja com a variavel t em alguma regiao do plano complexo.
A mais famosa das funcoes geratrizes de Dirichlet e a funca
o zeta de Riemann 8 , que e a funcao
geratriz de Dirichlet da seq
uencia constante an = 1, n 1:

X
1
(s) :=
.
ns
n=1

Como facilmente se ve, a serie do lado direito converge na regiao do plano complexo definida por
Re(s) > 1. A funcao zeta de Riemann desempenha um papel de grande importancia na teoria das
funcoes de variavel complexa e na teoria de n
umeros, pois varias de suas propriedades estao relacionadas
a propriedades do conjunto de n
umeros primos. Vide, e.g., [55], [126], [127] ou [34].
Os tres tipos de funcoes geratrizes definidas acima tem varias propriedades algebricas interessantes,
como mostrado nos tres exerccios que seguem.
E. 9.5 Exerccio. Se {an } e {bn } sao duas sequencias cujas funcoes geratrizes G {an } (t) e G{bn } (t) tem
uma regiao de convergencia comum, mostre que
G{an } (t) G{bn } (t) = G{cn } (t) ,
onde
cn =

n
X

anp bp .

p=0

E. 9.6 Exerccio. Se {an } e {bn } sao duas sequencias cujas funcoes geratrizes exponenciais E {an } (t) e
E{bn } (t) tem uma regiao de convergencia comum, mostre que
E{an } (t) E{bn } (t) = E{cn } (t) ,
onde
cn =

n  
X
n
p=0

anp bp .
6

E. 9.7 Exerccio. Se {an } e {bn } sao duas sequencias cujas funcoes geratrizes de Dirichlet D {an } (t) e
D{bn } (t) tem uma regiao de convergencia comum, mostre que
D{an } (t) D{bn } (t) = D{cn } (t) ,
7
8

Johann Peter Gustav Lejeune Dirichlet (1805-1859).


Georg Friedrich Bernhard Riemann (1826-1866).

JCABarata. Curso de Fsica-Matem


atica

onde

Vers
ao de 29 de setembro de 2005.

n
X

cn =

Captulo 9

493/1304

an/p bp .

p=1
n/p inteiro

6
Um exemplo. A seq
u
encia de Fibonacci
Seja an , n = 1, 2, 3, 4 . . ., a seq
uencia definida recursivamente da seguinte forma:
a0 = 1,

a1 = 1,

an+2 = an+1 + an ,

n0.

Essa seq
uencia e denominada seq
uencia de Fibonacci9 . Os primeiros elementos da seq
uencia de Fibonacci sao 1, 1, 2, 3, 5, 8, 13, 21, 34, 55... Cada elemento da seq
uencia de Fibonacci e a soma de seus
dois antecessores.
Fibonacci introduziu a seq
uencia que leva seu nome em um problema de seu livro Liber abbaci,
de 1202 (livro esse que introduziu o sistema decimal arabico na Europa, em substituicao ao sistema
de algarismos romanos, usado ate entao): Um certo homem coloca um casal de coelhos em um local
cercado de muros por todos os lados. Quantos pares de coelhos podem ser produzidos a partir daquele
casal em um ano se for suposto que a cada mes cada casal gera um novo casal, o qual se torna fertil
em um mes. A resposta (supondo que nenhum coelho morre) e que, apos n meses, tem-se a n pares de
coelhos, sendo an dado acima. Trata-se provavelmente do primeiro modelo de evolucao de populacoes.
A seq
uencia de Fibonacci e surpreendentemente rica em propriedades, sendo possivelmente uma das
mais pesquisadas da historia, existindo ate mesmo uma publicacao periodica (Fibonacci Quarterly)
dedicada a seu estudo.
No intuito de ilustrar a utilidade de funcoes geratrizes de seq
uencias, vamos demonstrar a seguinte
identidade para os elementos da seq
uencia de Fibonacci:

!n+1
!n+1
1 5
1
1+ 5
,

an =
(9.19)
2
2
5

valida para todo n 0. Essa expressao permite obter cada an diretamente em termos de n.
A funcao geratriz da seq
uencia de Fibonacci e
F (t) =

a n tn .

(9.20)

n=0

Mostremos primeiramente que a serie de potencias do lado direito tem um raio de convergencia naonulo. Pelo teste da razao vale, para n > 0,




an+1 tn+1

= an+1 |t| = an + an1 |t| = 1 + an1 |t| 2|t| ,
a n tn
an
an
an
9

Leonardo Pisano, cognominado Fibonacci (1170-1250).

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

494/1304

1, ja que a seq
uencia de Fibonacci e crescente. Logo, a serie converge absolutamente pelo
pois an1
an
menos na regiao |t| < 1/2. A verdadeira regiao de convergencia e um pouco maior (como veremos
adiante), mas nao precisaremos desse fato por ora, pois tudo o que necessitamos e da existencia de um
raio de convergencia nao-nulo, o que justifica as manipulacoes que faremos.
Facamos uso da definicao da seq
uencia de Fibonacci para obter uma formula explcita para F (t).
Temos que
F (t) = 1 + t +

a n tn

n=2

= 1+t+

(an1 + an2 ) t

= 1+t+

n=2

= 1+t+t

an1 t +

n=2

an t + t

an2 tn

n=2

a n tn

n=0

n=1

= 1 + t + t(F (t) 1) + t2 F (t) .


Assim, (1 t t2 )F (t) = 1 e, portanto,
F (t) =

1
.
1 t t2

A ideia agora e obter a expansao em serie de Taylor de F (t) em torno de t = 0 e compara-la a (9.20),
para assim obter uma expressao explcita para os an s. Para isso, ao inves de calcularmos as derivadas
de F em t = 0, e mais facil proceder da seguinte forma. Escrevemos 1 t t2 = (t 1 )(t 2 ) onde

51
5+1
,
2 =
.
1 =
2
2
Assim,


1
1
1
1
1
F (t) =
=

=
1 t t2
(t 1 )(t 2 )
1 2 1 t 2 t
"
!
!#
1
1
1
1
1

=
2 1 t2
5 1 1 t1

1 X
=
5 n=0

1
1n+1

1
2n+1

tn


1 X 
=
(2 )n+1 (1 )n+1 tn
5 n=0

!n+1

X
1 1+ 5

=
2
5
n=0

!n+1
1 5
tn ,
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

495/1304

onde usamos que 1/1 = 2 . Comparando com (9.20) obtemos (9.19), como queramos. Da u
ltima
expressao, ve-se tambem que o raio de convergencia da serie de potencias que define F e ( 5 1)/2
0, 618 . . ..

9.2

Propriedades de Algumas Fun


co
es Especiais

Vamos agora entao reunir o conhecimento acumulado acima para obter varias propriedades u
teis de
algumas das funcoes especiais que encontramos como solucoes de equacoes diferenciais de interesse.
As varias identidades que provaremos podem ser obtidas de diferentes modos, de sorte que o leitor
certamente encontrara na literatura demonstracoes alternativas a`quelas aqui apresentadas.

9.2.1

Propriedades dos Polin


omios de Legendre

Rela
co
es de ortogonalidade para os polin
omios de Legendre
0

A equacao de Legendre ((1 x2 ) y 0 (x)) + ( + 1)y(x) = 0, e tipicamente considerada no intervalo


J = [1, 1]. Aqui, p(x) = (1 x2 ), q(x) = 0, r(x) = 1 e = ( + 1). A funcao p(x) anula-se nos
extremos 1 do intervalo J = [1, 1].
Os polinomios de Legendre Pm (x) foram definidos em (8.14) por
Pm (x) :=

bm/2c

X
a=0

(1)a (2m 2a)!


xm2a ,
m
2 (m a)! (m 2a)! a!

(9.21)

onde bm/2c e o maior inteiro menor ou igual a m/2, e sao solucoes da equacao de Legendre com
= m(m + 1), sendo (as u
nicas) solucoes da equacao de Legendre que permanecem limitadas nos
pontos 1.

Como p(x) anula-se nos extremos 1 e os Pm (x) sao limitados nesses pontos, vale para os polinomios
de Legendre a relacao (9.6) e conclumos pelo Teorema 9.1 que
Z 1
Pn (x)Pm (x) dx = 0
(9.22)
1

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Notemos que isso implica


Z 1
xk Pm (x) dx = 0

(9.23)

para todo k < m, pois os monomios xk podem ser escritos como combinacoes lineares dos polinomios
Pn s com n < m. Para calcular as integrais de (9.22) no caso n = m, podemos elegantemente usar as
relacoes
0
0
Pn+1
(x) = (2n + 1)Pn (x) + Pn1
(x) ,
n0,
(9.24)

Pn (1) = 1 ,

Pn (1) = (1)n ,

n0,

(9.25)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

496/1304

as quais serao demonstradas mais abaixo (relacoes (9.30) e (9.34), respectivamente) como conseq
uencia
da formula de Rodrigues para os polinomios de Legendre. De fato, por integracao por partes, tem-se
Z 1
Z 1
1

0
Pn0 (x)Pn+1 (x) dx .
Pn (x)Pn+1 (x) dx = Pn (x)Pn+1 (x)
1

1

Por (9.25), Pn (x)Pn+1 (x)

= 1 + (1)2n = 2. Por (9.23),

R1

Pn0 (x)Pn+1 (x) dx = 0, pois Pn0 (x) e

seguramente um polinomio de grau n 1. Assim,


Z 1
Z 1


(9.24)
0
0
Pn (x) (2n + 1)Pn (x) + Pn1
(x) dx
Pn (x)Pn+1 (x) dx =
2 =
1

=
pois, novamente por (9.23),
Isso provou que

R1

(2n + 1)

Pn (x)2 dx ,
1

0
0
Pn (x)Pn1
(x) dx = 0, ja que Pn1
(x) e um polinomio de grau n 2.

Pn (x)Pm (x) dx =
1

2
n, m ,
2n + 1

(9.26)

para todos m, n 0. Estas sao as relaco


es de ortogonalidade para os polin
omios de Legendre.

Em muitas situacoes praticas e conveniente expressar (9.26) atraves da mudanca de variavel x =


cos , com 0 . Ficamos com
Z
2
n, m ,
(9.27)
Pn (cos )Pm (cos ) sen () d =
2n + 1
0
para todos m, n 0.
F
ormula de Rodrigues para os polin
omios de Legendre
Pelas nossas consideracoes gerais sobre as formulas de Rodrigues, podemos presumir que os polinomios Pm , por serem ortogonais entre si (vide (9.22)), possam ser expressos na forma (9.13) com
r(x) = 1, ou seja,

dm 
2 m
,
Pm (x) = Km m (1 x )
dx
onde Km sao constantes que dependem
cao adotada. De fato, essa pressuposicao e correta
 da normaliza
P
m
ma 2m2a
pois, escrevendo (1 x2 )m = m
(1)
x
(binomio de Newton) e notando que
a=0 a

(2m 2a)! m2a

x
, para 0 a bm/2c

dm  2m2a 
(m 2a)!
x
=
(9.28)

dxm

0,
para bm/2c + 1 a m

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

497/1304

(justifique!), conclumos facilmente que


m  

dm 
dm X m
2 m
(1 x )
(1)ma x2m2a
=
dxm
dxm a=0 a
bm/2c  
dm X m
(1)ma x2m2a
=
m
dx a=0 a

bm/2c

(1)

ma

a=0

= (1) 2 m!

 
m (2m 2a)! m2a
x
a (m 2a)!
bm/2c

X
a=0

(1)a (2m 2a)!


xm2a
m
2 (m a)!(m 2a)!a!

= (1)m 2m m! Pm (x) .
Assim, Km = (1)m /(2m m!) e
Pm (x) =


1
dm  2
m
(x

1)
,
2m m! dxm

(9.29)

como pressuposto. Essa expressao e conhecida como f


ormula de Rodrigues para os polin
omios de
Legendre e e valida para todo m 0, inteiro.
De (9.29) outras relacoes u
teis podem ser extradas, nosso proximo assunto.

Rela
co
es de recorr
encia para os polin
omios de Legendre
Vamos aqui demonstrar as seguintes relacoes validas para os polinomios de Legendre:
0
0
Pn+1
(x) = (2n + 1)Pn (x) + Pn1
(x) ,

(9.30)

0
Pn+1
(x) = xPn0 (x) + (n + 1)Pn (x) ,

(9.31)

0
nPn (x) = xPn0 (x) Pn1
(x) ,

(n + 1)Pn+1 (x) = (2n + 1)xPn (x) nPn1 (x) ,


Pn (1) = 1 ,

Pn (1) = (1)n .

(9.32)
(9.33)
(9.34)

Todas as relacoes acima tem aplicacoes (vimos isso quando provamos as relacoes de ortogonalidade para os Pn s). A relacao (9.33) e particularmente interessante por permitir determinar os P n s
recursivamente a partir dos dois primeiros: P0 (x) = 1 e P1 (x) = x.
Comecemos por provar (9.30). Como

d
(x2
dx

1)n+1 = 2(n + 1)x(x2 1)n , segue da formula de

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

498/1304

Rodrigues para Pn+1 que


i
dn+1 h
1
2
n
2(n
+
1)x(x

1)
2n+1 (n + 1)! dxn+1

0
Pn+1
(x) =

i
1 dn h 2
n
2 2
n1
(x 1) + 2nx (x 1)
= n
2 n! dxn
i
1 dn h
2
n
2
n1
= n
(2n
+
1)(x

1)
+
2n(x

1)
2 n! dxn
0
= (2n + 1)Pn (x) + Pn1
(x) ,

provando (9.30). Por outro lado, comecando pela primeira linha obtida acima, e usando-se a regra de
Leibniz, tem-se
0
Pn+1
(x) =

i
1 dn+1 h 2
n
x(x

1)
2n n! dxn+1


  p   n+1p
n+1 
1 X n+1
d
d
2
n
= n
x
(x 1)
2 n! p=0
dxp
dxn+1p
p
=

1
dn+1 2
(n + 1) dn 2
n
x
(x

1)
+
(x 1)n
2n n! dxn+1
2n n! dxn

= xPn0 (x) + (n + 1)Pn (x) ,


provando (9.31). A relacao (9.32) e obtida subtraindo-se (9.31) de (9.30). Por fim, para obter (9.33),
multiplicamos (9.30) por x e escrevemos
(2n + 1)xPn (x)

=
=
(9.32)

(9.31)

0
0
xPn+1
(x) xPn1
(x)

0
0
xPn+1
(x) Pn0 (x) + Pn0 (x) xPn1
(x)
0
(n + 1)Pn+1 (x) + Pn0 (x) xPn1
(x)

(n + 1)Pn+1 (x) + nPn1 (x) .

Disso (9.33) segue imediatamente.


Por fim, vamos provar (9.34) por inducao. Como P0 (x) = 1 e P1 (x) = x, as relacoes acima valem
para n = 0 e n = 1. Supondo-as validas para n1 e n, teremos por (9.33) que (n+1)P n+1 (1) = (2n+1)
n = (n+1), o que implica Pn+1 (1) = 1 e (n+1)Pn+1 (1) = (2n+1)(1)n +n(1)n = (n+1)(1)n+1 ,
o que implica Pn+1 (1) = (1)n+1 . Isso encerra a demonstracao de (9.30)-(9.34).
A fun
c
ao geratriz dos polin
omios de Legendre

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

499/1304

A funcao geratriz dos polinomios de Legendre e


L(x, t) :=

X
n=0

Pn (x) tn =

1
,
1 2tx + t2

(9.35)

valida para |t| < 1 e |x| 1. Essa relacao tem diversas demonstracoes, a mais elegante sendo a seguinte

(de [66]). Calculando-se t


L(x, t) e usando-se (9.33), tem-se

L(x, t) =
nPn (x) tn1
t
n=1

(n + 1)Pn+1 (x) tn

n=0

(9.33)

h
X
n=0

2x

(2n + 1)xPn (x) nPn1 (x) tn

nPn (x) t + x

n=0

2x

n=0

nPn (x) t + x

n=0

X
n=0

Pn (x) t
n

Pn (x) t

nPn1 (x) tn

n=0

(n + 1)Pn (x) tn+1

n=0

X
X
X
n
n
2
Pn (x) t t
Pn (x) t + (x t)
Pn (x) tn
2xt
t n=0
t
n=0
n=0

(2xt t2 )

L(x, t) + (x t)L(x, t) .
t

E. 9.8 Exerccio. Verifique!

Assim, L(x, t) satisfaz a equacao diferencial


1

(x t)
L(x, t) =
.
L(x, t) t
1 2xt + t2
O lado direito e


1
ln 1 2xt + t2 . Logo,
2 t
L(x, t) =

exp(l(x))
,
1 2tx + t2

onde l(x) e, em princpio, uma funcao arbitraria. Lembrando, porem, que L(x, 0) = P0 (x) = 1 para
todo x, obtem-se de imediato que l(x) = 0 para todo x. Isso estabelece (9.35), como queramos.
Representa
co
es integrais para os polin
omios de Legendre

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

500/1304

A bem-conhecida Formula Integral de Cauchy, afirma que, para uma funcao f analtica em um
domnio aberto simplesmente conexo D, vale
Z
n!
f (w)
(n)
dw ,
(9.36)
f (z) =
2i C (w z)n+1
para todo z D, onde a curva C e uma curva diferenciavel fechada inteiramente contida em D e da
precisamente uma volta no sentido anti-horario em torno de z. Combinando a formula de Rodrigues e
a Formula Integral de Cauchy, obtem-se imediatamente
Z
(w 2 1)l
1
Pl (z) = l+1
dw ,
(9.37)
2 i C (w z)l+1
onde C e uma curva fechada e diferenciavel no plano complexo dando uma volta em torno de z no sentido
anti-horario. Essa expressao e conhecida como representaca
o integral de Schl
afli 10 dos polinomios de
Legendre.
Uma conseq
uencia dessa representacao e a seguinte expressao:
Z 
l
1
z + i(1 z 2 )1/2 cos() d ,
Pl (z) =
2

(9.38)

valida para |z| < 1. A demonstracao dessa expressao sera apresentada mais adiante como caso particular de uma identidade mais geral (expressao (9.49), abaixo), valida para os polinomios de Legendre
associados. Como a equacao de Legendre e invariante pela mudanca l (l + 1) (verifique que l(l + 1)
e levado em si mesmo por essa transformacao!), vale tambem a identidade11
Z
1
1
Pl (z) =
(9.39)

l+1 d .
2
z + i(1 z 2 )1/2 cos()
Para z real no intervalo [1, 1], podemos escrever, como e comum em aplicacoes, z = cos() com
0 e com isso as duas identidades acima ficam
Z 
Z
l
1
1
1
cos() + i sen () cos() d =
Pl (cos()) =

l+1 d .
2
2
cos() + i sen () cos()

Usando o binomio de Newton podemos usar a primeira identidade para escrever Pl (cos()) como
10

Ludwig Schl
afli (1814-1895).
Esse argumento envolvendo a transformaca
o l (l + 1) e ainda incompleto, mas pode-se provar que o lado direito
de (9.39) e de fato igual ao esquerdo, pois e regular e satisfaz a equaca
o de Legendre. Deixamos os detalhes como
exerccio.
11

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

501/1304

um polinomio em cos e sen :


l  
lp 
p Z 
p
1 X l p
sen ()
Pl (cos()) =
i cos()
cos() d
2 p=0 p

l2q 
2q
X (1)q  l 2q 
cos()
sen
()
=
q
22q 2q
q=0
bl/2c

bl/2c

X
q=0


l2q 
2q
(1)q l!
.
cos()
sen
()
22q (l 2q)! (q!)2
*

E. 9.9 Exerccio. Prove que no intervalo (1, 1) vale

P0 (x) 5P2 (x) X (1)m+1 (2m 3)! (4m + 1)


|x| =
+
+
P2m (x) .
2m1 (m + 1)! (m 2)!
2
8
2
m=2
Sugestao: para calcular integrais como
partes e os fatos que Pn (1) = 1, n

(9.21).

9.2.2

(9.40)

xP2m (x)dx pode-se usar (9.30) e/ou (9.33), integracao por


0

e P2m (0) =

(1)m (2m 1)!!


, m
2m m!


, m 1, o qual segue de
6

Propriedades dos Polin


omios de Legendre Associados. Harm
onicos
Esf
ericos

Na Secao 8.3.1, pagina 450, introduzimos a equacao de Legendre associada (8.147) e mostramos que
para = l e = m a mesma possui solucoes da forma


Plm (z) := (1 z 2 )m/2

dm
Pl (z) ,
dz m

(9.41)

claro que P m (z) e nulo se


para z com |z| < 1, onde Pl e o polinomio de Legendre de grau l. E
l
m > l (pois Pl e um polinomio de grau l). A relacao (9.41), como dissemos na Secao 8.3.1, define os
chamados polin
omios de Legendre associados12 , ainda que eles nao sejam exatamente polinomios na
variavel z.
12
O leitor deve ser advertido que, lastimavelmente, n
ao h
a uniformidade na literatura quanto a
` definica
o dos polin
omios
de Legendre associados. Alguns autores (e.g., [83]) introduzem um fator (1) m no lado direito de (9.41). Assim, algumas
das express
oes que obtemos aqui podem divergir das correspondentes encontradas em alguns textos e o leitor deve
compar
a-las cuidadosamente. A definica
o que seguimos e a recomendada pela American Mathematical Society.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

502/1304

Vimos tambem que, devido a` formula de Rodrigues para os polinomios de Legendre, podemos
escrever Plm (z) como

1
dl+m 
Plm (z) = l (1 z 2 )m/2 l+m (z 2 1)l ,
(9.42)
2 l!
dz
para z com |z| < 1 e 0 m l. La notamos tambem que essa expressao faz sentido mesmo para
m inteiro negativo, mas tal que l m l. Assim, definimos
Plm (z) =
tambem com 0 m l e para z


lm 
1
2
l
2 m/2 d
,
(z

1)
(1

z
)
2l l!
dz lm

(9.43)

com |z| < 1. Afirmamos que

Plm (z) = (1)m

(l m)! m
P (z) .
(l + m)! l

(9.44)

Essa relacao e importante por mostrar que Plm (z) e tambem uma solucao da equacao de Legendre
associada, por ser proporcional a Plm (z). Fora isso a expressao acima e relevante para os chamados
harmonicos esfericos, dos quais trataremos mais abaixo.
Apresentaremos duas demonstracoes de (9.44), ambas instrutivas. Uma `a forca bruta, usando
diretamente as definicoes, e desenvolvida no Apendice 9.A, pagina 541. Uma segunda, mais gentil, sera
vista logo abaixo e usa uma representacao integral dos polinomios de Legendre associados.
Representa
co
es integrais para os polin
omios de Legendre associados
Nossa intencao agora e obter algumas representacoes integrais u
teis para os polinomios de Legendre
associados mas, en passant, encontraremos uma outra demonstracao mais gentil da identidade (9.44).
k

d
2
l
As expressoes (9.42) e (9.43) envolvem derivadas do tipo dz
k (z 1) para k = l + m e k = l m,
dk
2
l
respectivamente. Procuremos primeiramente expressar genericamente dz
k (z 1) em termos de certas
integrais. Tomemos provisoriamente z real no intervalo aberto 1 < z < 1. Pela Formula Integral de
Cauchy (9.36), podemos escrever13
Z
dk 2
(w 2 1)l
k!
l
(z

1)
=
dw ,
(9.45)
dz k
2i C (w z)k+1

onde C e uma curva fechada e diferenciavel no plano complexo, dando uma volta em torno de z no
sentido anti-horario. Escolhemos a curva C dada por C := {w | |w z| = (1 z 2 )1/2 }, de modo
que podemos escrever todo ponto w de C na forma
w = z + i(1 z 2 )1/2 ei
com . Com isso, a integral em w sobre C pode ser escrita como uma integral em e para
13

As ideias que se seguem provavelmente originam-se dos trabalhos de Schl


afli. Nossas fontes s
ao [66] e [136], que
seguimos com adaptaco
es.

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

503/1304

isso, usa-se
dw = (1 z 2 )1/2 ei d ,
w z = i(1 z 2 )1/2 ei ,
w 2 1 = (1 z 2 ) (e2i + 1) + 2iz(1 z 2 )1/2 ei


2 1/2

= 2 i(1 z )

2

2 1/2 i

= 2i(1 z )

Assim,
dk 2
k!
(z 1)l =
k
dz
2i

ei + ei
2

2 1/2

z + i(1 z )

(w 2 1)l
dw
(w z)k+1

= (1 z 2 )1/2

k!
2i

2 (lk)/2

= (1 z )

2l ilk k!
2

2 1/2

2i(1 z )
Z

cos() .

(i(1

+ 2iz(1 z 2 )1/2 ei

2 1/2

z + i(1 z )

k+1
z 2 )1/2 ei )

z + i(1 z 2 )1/2 cos()

l

cos()

l

ei d

ei(lk) d

e assim,
Z
l
l lk

k! 
dk 2
2 1/2
l
2 (lk)/2 2 i
cos
(l

k)
d ,
(9.46)
z
+
i(1

z
)
cos()
(z

1)
=
(1

z
)
dz k
2

Z
l
pois
z + i(1 z 2 )1/2 cos() sen ((l k)) d = 0, pelo fato de o integrando ser uma funcao

mpar.

Aplicando (9.46) a`s expressoes (9.42) e (9.43) de Plm e Plm (adotando k = l + m e k = l m,


respectivamente), chegamos a
Z
l

im (l + m)! 
m
2 1/2
Pl (z) =
z + i(1 z ) cos() cos m d ,
2l!

Plm (z)

i+m (l m)!
=
2l!

z + i(1 z 2 )1/2 cos()

l

e comparando-as, extramos que


Plm (z) = (1)m

(l + m)! m
P (z) .
(l m)! l


cos + m d ,

(9.47)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

504/1304

Com isso, encontramos uma segunda demonstracao de (9.44). As identidades acima foram provadas
para z real em 1 < z < 1, mas valem para todo z complexo com |z| < 1 (e mesmo em z = 1), pois
la Plm (z) e Plm (z) tem uma extensao analtica u
nica.
Coletemos o que provamos acima. Aplicando (9.45) a` definicao (9.42) de P lm (z), agora para todo
m com l m l, chegamos a` expressao
Z
(l + m)!
(w 2 1)l
2 m/2
m
(1 z )
dw ,
(9.48)
Pl (z) = l+1
l+m+1
2 i l!
C (w z)
onde C e uma curva fechada e diferenciavel no plano complexo dando uma volta em torno de z no
sentido anti-horario. Essa expressao generaliza a representacao de Schlafli (9.37) para os polinomios
de Legendre. Como conseq
uencia, estabelecemos tambem logo acima a representacao integral
Z
l

im (l + m)! 
m
z + i(1 z 2 )1/2 cos() cos m d ,
Pl (z) =
(9.49)
2l!

valida para |z| < 1 e para todo l

e todo m

com l m l.

Assim como a equacao de Legendre, a equacao de Legendre associada e invariante pela transformacao
l (l + 1). Assim, vale tambem14
Z

im l!
1
m
Pl (z) =
(9.50)

l+1 cos m d ,
2(l m)!
2
1/2
z + i(1 z ) cos()

= (l + m)(l + m 1) (l + 1) e levado pela transformacao


onde acima usamos o fato que (l+m)!
l!
l!
l (l + 1) em (1 l + m)(2 l + m) (l) = (1)m (l)(l + 1) (l m + 1) = (lm)!
.

Em aplicacoes e comum tomar-se z real no intervalo [1, 1] e escrever z = cos() com 0 .


Com isso, as duas identidades acima ficam
Z
l

im (l + m)! 
m
(9.51)
Pl (cos()) =
cos() + i sen () cos() cos m d ,
2l!

Z

im l!
1
m
Pl (cos()) =
(9.52)

l+1 cos m d .
2(l m)!
cos() + i sen () cos()

Atraves do binomio de Newton, a primeira identidade pode ser usada para expressar P lm (cos()) como
14

Esse argumento envolvendo a transformaca


o l (l + 1) e ainda incompleto, mas pode-se provar que o lado direito
de (9.50) e de fato igual ao esquerdo, pois e regular e satisfaz a equaca
o de Legendre associada. Deixamos os detalhes
como exerccio.

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

505/1304

um polinomio em cos e sen :


l

Plm (cos())

im (l + m)! X p
=
i
2l!
p=0
i

m+|m|

im+|m|

 
lp 
p Z 
p

l
cos()
sen ()
cos() cos m d ,
p

(l + m)!
2|m| l!

c
b l|m|
2
X

(1)q
22q

cos()

(l + m)!
2|m|

b l|m|
c
2
X

(1)q
22q (l 2q |m|)! (q + |m|)! q!

cos()

q=0

q=0

l
2q + |m|



2q + |m|
q

l2q|m|

l2q|m|

sen ()

sen ()

2q+|m|

2q+|m|

(9.53)
Note que im+|m| = 1 se m 0 e im+|m| = (1)m se m < 0, de modo que Plm (cos()) e real se
0 . A expressao (9.53) e por vezes utilizada na pratica para expressar os harmonicos esfericos
(que definiremos abaixo) como polinomios em cos e sen . Logo adiante faremos uso da mesma no
estudo das relacoes de ortogonalidade das funcoes Plm .
A fun
c
ao geratriz dos polin
omios de Legendre associados
Usando (9.41), (9.35) e a identidade, valida para m 0,
1
1
dm
(2m)! m
(1 2tx + t2 ) 2 = m
t (1 2tx + t2 )m 2
m
dx
2 m!

(prove-a!) e facil mostrar que

m
Pl+m
(x) tl

l=0

(2m)!
(1 x2 ) 2
= m
,
2 m! (1 2tx + t2 )m+ 21

(9.54)

valida para todo m 0.


E. 9.10 Exerccio. Mostre isso.

A expressao (9.54) e tambem denominada funca


o geratriz dos polin
omios de Legendre associados.
A expressao (9.54) tem poucas aplicacoes diretas, mas pode ser usada para demonstrar outras relacoes
sobre os polinomios de Legendre associados.
Rela
co
es de recorr
encia para os polin
omios de Legendre associados
Os polinomios de Legendre associados satisfazem uma serie de relacoes de recorrencia. Listemos as

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

506/1304

mais relevantes:


2mx
m
=
Pl (x) l(l + 1) m(m 1) Plm1 (x) ,
2
1x

m+1
m+1
(x) ,
Pl+1
(x) = (2l + 1) 1 x2 Plm (x) + Pl1
Plm+1 (x)

m1
m1
(2l + 1) 1 x2 Plm (x) = (l + m)(l + m 1)Pl1
(x) (l m + 1)(l m + 2)Pl+1
(x) ,
m
m
(2l + 1)xPlm (x) = (l + m)Pl1
(x) + (l m + 1)Pl+1
(x) ,

d
2 1 x2 Plm (x) = Plm+1 (x) (l + m)(l m + 1)Plm1 (x) .
dx
As demonstracoes podem ser obtidas da seguinte forma: 1. a partir das relacoes de recorrencia dos
polinomios de Legendre (9.30)-(9.34) com uso da definicao (9.41); 2. a partir de (9.42) ou, em alguns
casos, 3. com o uso da funcao geratriz (9.54). Deixamos as demonstracoes como exerccio.
E. 9.11 Exerccio. Prove todas as relacoes acima. Sugestao: tente por conta propria seguir as sugestoes
do u
ltimo paragrafo. Senao, consulte a literatura supracitada, mas com as seguintes precaucoes: a. diferentes textos apresentam definicoes diferentes dos Plm , o que conduz a relacoes de recorrencia distintas das
de acima; b. nem todos os livros-texto15 provam todas as relacoes e c. alguns contem erros.
6
Rela
co
es de ortogonalidade para os polin
omios de Legendre associados
Obteremos agora relacoes de ortogonalidade para os polinomios de Legendre associados, relacoes
essas de grande importancia na Analise Harmonica e que inspiram a definicao dos chamados harmonicos
esfericos.
A equacao de Legendre associada (8.147) e considerada na maioria das aplicacoes no intervalo
[1, 1], como ja mencionamos. A mesma, em analogia com a equacao de Legendre, pode ser escrita
como
m2
y(x) = 0 ,
(9.55)
((1 x2 )y 0 (x))0 + l(l + 1)y(x)
1 x2
onde aqui ja nos restringimos ao caso l , m
com l m l. Como se ve, temos aqui
p(x) = (1 x2 ), mas podemos fazer as seguintes escolhas


m2
,
1 x2

1)

q(x) =

2)

q(x) = l(l + 1),

r(x) = 1,
r(x) =

1
,
1 x2

= l(l + 1) ,
= m2 .

Analisaremos essas duas opcoes em separado. O caso 1 e o mais interessante, especialmente devido a
sua aplicacao para os harmonicos esfericos. O caso 2 nao e de grande interesse e o leitor pode dispensar
15

Segundo o Houaiss, livros-textos ou livros-texto s


ao dois plurais gramaticalmente corretos para livro-texto,
assim como espacos-tempos e espacos-tempo s
ao plurais aceit
aveis para espaco-tempo.

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

507/1304

sua leitura, se o desejar16 .


Caso 1) A primeira questao que aqui se coloca e se a condicao (9.6) e satisfeita para funcoes P lm (x) e
0
Plm
0 (x) com l l , ou seja, se

 1
0
0
m
m
m
m
= 0,
(9.56)
p(x) Pl (x) (Pl0 (x)) Pl0 (x) (Pl (x))
1

com l l . A maneira mais facil de discutir isso e escrever x = cos() e, como


d m
d m
1
Pl0 (x) =
P 0 (cos ),
dx
sen () d l

e p(x) = sen ()2 , (9.56) fica



 =
d
d m

m
sen () Plm (cos ) Plm
.
(cos
)

P
(cos
)
P
(cos
)

0
l0
l
=0
d
d

(9.57)

d
Agora, por (9.53), Plm (cos ) e um polinomio trigonometrico, e assim o e tambem d
Plm (cos ). Logo,
ambos sao finitos em = 0 e = . Como, porem, sen anula-se nesses extremos, conclumos que
(9.57) e nula, confirmando a validade de (9.6) no caso em questao. Conclumos assim, pelo Teorema
9.1, pagina 487, que deve valer
Z
1

sempre que l 6= l0 .

Plm (x) Plm


0 (x) dx = 0

(9.58)

R1
Interessamo-nos agora pelo caso l 0 = l. Caso l = l0 = 0 vale P00 (x) = 1 e 1 (P00 )2 dx = 2. Para
R1
calcular 1 (Plm (x))2 dx com l > 0 podemos proceder de diferentes maneiras, a mais direta sendo a
seguinte. Usando (9.44) e as expressoes (9.42) e (9.43) para Plm e Plm , respectivamente, escrevemos
Z 1
Z 1
m
m
m (l + m)!
Plm (x)Plm (x) dx
Pl (x) Pl (x) dx
=
(1)
(l

m)!
1
1
(1)m (l + m)!
22l (l!)2 (l m)!

=
int. por partes

16

lm

vezes

(1)l (l + m)!
22l (l!)2 (l m)!
(2l)! (l + m)!
2l
2 (l!)2 (l m)!

(2l)! (l + m)!
2l
2 (l!)2 (l m)!

2 (l + m)!
.
2l + 1 (l m)!

Z
Z
Z

1
1
1
1




dl+m 2
(x 1)l
dxl+m




dlm 2
l
(x 1) dx
dxlm


d2l 2
l
(x 1) (x2 1)l dx
dx2l

1
1

(1 x2 )l dx

2 (2l)!!
(2l + 1)!!

O caso 2 e um tanto patol


ogico (pois a funca
o r(x) diverge em 1 e n
ao e integr
avel) e e evitado por quase todos os
livros-texto.

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

508/1304

Na terceira linha aplicamos integracao por partes l m vezes. Isso e justificado pois, como facilmente
dp
2
l
ao proporcionais a (x2 1)lp e, por
se ve por inducao, derivadas como dx
p (x 1) , com 0 p < l s
(2l)!
isso, os termos de fronteira se anulam. Na u
ltima passagem usamos o fato que (2l+1)!!
= (2l)!!
e o fato
2l+1
l
que (2l)!! = 2 l!. Na pen
ultima passagem usamos a identidade
Z 1
(2l)!!
(1 x2 )l dx = 2
,
(9.59)
(2l + 1)!!
1
R1
a qual pode ser provada da seguinte forma. Seja Al := 1 (1 x2 )l dx. Entao, para l > 0,
Al :=

1
2 l

(1 x ) dx =

1
1

dx
dx

(1 x2 )l dx

int. por partes

Z 1
1
x(1 x ) +2l
x2 (1 x2 )l1 dx = 2lAl + 2lAl1 .
1
1
|
{z
}
2 l

=0

Assim, Al =

2l
A
2l+1 l1

e como A0 = 2, segue (9.59).

Demonstramos, assim, as relacoes de ortogonalidade


Z 1
2 (l + m)!
l, l0 ,
Plm (x) Plm
0 (x) dx =
2l + 1 (l m)!
1

(9.60)

por vezes u
til expressar
validas para todo l, l0 e m, m0 com l m l e l0 m0 l0 . E
essas relacoes com a mudanca de variaveis x = cos :
Z
2 (l + m)!
Plm (cos ) Plm
l, l0 .
(9.61)
0 (cos ) sen d =
2l + 1 (l m)!
0


Essa forma das relacoes de ortogonalidade dos polinomios de Legendre associados sera particularmente
relevante para os harmonicos esfericos, como veremos adiante.
Caso 2) A primeira questao que aqui se coloca e se a condicao (9.6) e satisfeita para funcoes P lm (x) e
0
Plm (x), com |m| 6= |m0 | (lembre-se o leitor que = m2 e, portanto 6= 0 equivale a |m| 6= |m0 |), ou
seja, se
 1

 0 0
0
m0
m
m
m
= 0.
(9.62)
p(x) Pl (x) Pl (x) Pl (x) (Pl (x))
0

sempre que |m| 6= |m |. A mesma analise feita para o caso 1 mostra que isso e verdadeiro, confirmando
a validade de (9.6) no caso em questao. Conclumos assim, pelo Teorema 9.1, pagina 487, que deve
valer
Z 1
Z
1
1
0
m
m0
Pl (x) Pl (x)
d = 0, (9.63)
dx = 0, ou seja,
Plm (cos ) Plm (cos )
2
1x
sen ()
1
0

sempre que |m| 6= |m0 |. A expressao (9.53) ensina-nos que Plm (cos ) e proporcional a ( sen )|m| . Logo,
0
como |m| 6= |m0 |, sempre havera no produto Plm (cos )Plm (cos ) pelo menos um fator sen para

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

509/1304

compensar o sen1 , o que mostra que o integrando em (9.63) e limitado. O caso |m0 | = |m| e um tanto
patologico (a integral diverge se m = m0 = 0), difcil de demonstrar e sem conseq
uencias praticas
17
relevantes, de modo que nos limitamos a apresentar o resultado final :

0,
se |m0 | 6= |m|,

,
se m0 = m = 0,

Z 1

1
m
m0
(9.64)
Pl (x) Pl (x)
dx =
(1)m

1 x2
,
se m0 = m > 0,
1

1 (l + m)!

, se m0 = m > 0.
m (l m)!
Note o leitor que a condicao m > 0 so pode ocorrer se l > 0.

Como ja dissemos, as relacoes (9.64) sao menos importantes na pratica que as de (9.60). Essas
inspiram uma definicao importante: a dos harmonicos esfericos.
Os Harm
onicos Esf
ericos
No espaco n , n 2, o conjunto de pontos que distam de uma unidade da origem formam a assim
chamada esfera unit
aria18 , denotada por S n1 :
n
o

S n1 := (x1 , . . . , xn ) n (x1 )2 + + (xn )2 = 1 .


O conjunto S 1 e o crculo unitario e seus pontos podem ser descritos por um u


nico angulo com
:
n
o

S 1 :=
cos , sen 2 , .


Como se ve, os pontos correspondentes a = sao identificados. O conjunto S 2 e a esfera unitaria


e seus pontos podem ser descritos por dois angulos: e , com e 0 :
n
o

S 2 :=
sen () cos(), sen () sen , cos() 3 , , 0 .


Novamente, os pontos correspondentes a = sao identificados e para os pontos correspondentes a


= 0 e = o angulo e indeterminado.
Os chamados Harm
onicos Esfericos sao as funcoes definidas por
s
2l + 1 (l m)! m
Ylm (, ) := (1)m
P (cos()) eim ,
4 (l + m)! l

onde 0 , , l

17
18

em

com l m l. Note-se que


r
2l + 1
Yl0 (, ) =
Pl (cos()) ,
4

Para uma referencia mais detalhada, vide [90], pag. 74.


H
a aqui um abuso de linguagem, pois S n1 e, estritamente falando, a superfcie da esfera.

(9.65)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

510/1304

onde Pl sao os polinomios de Legendre.


Mais uma vez o leitor deve ser advertido da existencia de outras convencoes sobre a definicao dos
harmonicos esfericos (alguns autores substituem o fator (1)m por im ).
Os harmonicos esfericos sao solucao da equacao diferencial parcial


m2 2 Y
1
Y
(, )
(, ) + l(l + 1)Y (, ) = 0 ,
( sen )
sen

( sen )2 2
que e encontrada quando da resolucao da equacao de Helmholtz ou de Laplace em tres dimensoes
em coordenadas esfericas, assim como no problema do atomo de hidrogenio na Mecanica Quantica ou
qualquer outro problema quantico em tres dimensoes no qual o potencial seja esfericamente simetrico.
Vide equacao (10.10) e seguintes.
um exerccio relevante verificar que, devido a` relacao (9.44), tem-se, com a definicao acima,
E
Ylm (, ) = (1)m Ylm (, ) .
No crculo unitario S 1 valem as bem-conhecidas relacoes de ortogonalidade
Z
Z
em0 em dl =
em0 () em () d = m, m0
S1

onde, para m

(9.66)

(9.67)

1
em () := eim ,
,
2
dl = d sendo a medida de comprimento do crculo unitario S 1 . Usando as relacoes de ortogonalidade
(9.67) e as relacoes de ortogonalidade (9.61), e facil constatar que
Z
Z Z
0
m
m
m0
Yl0 Yl d =
Ylm
(9.68)
0 (, ) Yl (, ) sen () d d = m, m0 l, l0
S2

para todos l, l0 e todos m, m0 com l0 m0 l0 e l m l, onde d = sen () d d e a


medida de area na esfera unitaria S 2 em coordenada polares. Essas sao as relaco
es de ortogonalidade dos
harm
onicos esfericos, as quais desempenham um relevante papel na resolucao de problemas envolvendo
certas equacoes diferenciais parciais em tres dimensoes que tenham simetria esferica. Os harmonicos
esfericos surgem na importante solucao de um problema fundamental da Mecanica Quantica, o problema
do atomo de hidrogenio. As formas dos orbitais eletronicos, de importancia fundamental no estudo de
atomos e moleculas e suas ligacoes qumicas, estao intimamente relacionadas a`s funcoes Y lm (, ) e
aos polinomios de Laguerre associados.


Como se percebe da comparacao de (9.67) com (9.68), os harmonicos esfericos desempenham na


esfera unitaria S 2 o mesmo papel que as funcoes em desempenham no crculo S 1 : formam um conjunto
ortonormal em relacao a` medida de area d = sen () d d. Assim como as funcoes e m formam um
conjunto ortonormal completo para as funcoes definidas em S 1 , o que nos permite expressar funcoes
f (), periodicas de perodo 2, contnuas por partes ou apenas de quadrado integravel, em termos de
uma serie de Fourier:
Z

X
f () =
cm em () com cm :=
em () f () d ,
m=

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

511/1304

os harmonicos esfericos tambem formam um conjunto ortonormal completo para as funcoes definidas
em S 2 . Assim, em um sentido a ser precisado, todas as funcoes f (, ) definidas em S 2 , e que sejam
contnuas por partes ou apenas de quadrado integravel, podem ser escritas em termos de uma serie
envolvendo harmonicos esfericos. Essa serie e dada por
f (, ) =

X
l
X

cl, m Yl (, ),

com

cl, m :=

l=0 m=l

Ylm (, ) f (, ) sen () d d ,

e e uma especie de generalizacao para a esfera S 2 da serie de Fourier. Essas consideracoes justificam a
denominacao de harmonicos esfericos para as funcoes Ylm .
Os harmonicos esfericos tambem desempenham um papel na teoria de representacoes do grupo
SO(3). Ha tambem generalizacoes dos harmonicos esfericos para as esferas S n com n 3. Essas
generalizacoes sao estudadas, por exemplo, em [66].

9.2.3

Propriedades dos Polin


omios de Hermite

Rela
co
es de ortogonalidade para os polin
omios de Hermite


0
2
2
A equacao de Hermite ex y 0 (x) + ex y(x) = 0 e tipicamente considerada no intervalo J =
2

(, ). Aqui p(x) = ex , q(x) = 0, r(x) = ex e = . Note que p(x) > 0 e r(x) > 0 em todo
J = (, ). Os polinomios de Hermite Hm (x) foram definidos em (8.20) por
Hm (x) :=

bm/2c

X
k=0

(1)k m!
(2x)m2k .
k! (m 2k)!

(9.69)

onde bm/2c e o maior inteiro menor ou igual a m/2, e sao solucoes da equacao de Hermite com = 2m.

Como p(x) decai a zero para x e os Hm (x) sao polinomios, vale para os polinomios de
Hermite a relacao (9.6) e conclumos pelo Teorema 9.1 que
Z
2
Hn (x)Hm (x) ex dx = 0
(9.70)

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Para calcular as integrais acima no caso n = m,


podemos elegantemente usar as relacoes
Hn+1 (x) = 2xHn (x) 2nHn1 (x) ,

(9.71)

JCABarata. Curso de Fsica-Matem


atica

as quais serao provadas mais abaixo (expressao (9.78)). Seja An :=


2nAn1

=
(9.71)

=
(9.71)

Z
Z

(2nHn1 (x)) Hn1 (x) ex dx

(2xHn (x)) Hn1 (x) e

x2

dx

Hn (x) (2xHn1 (x)) ex dx

Hn (x) Hn (x) e

x2

512/1304

(Hn (x))2 ex dx. Tem-se que

Hn+1 (x) Hn1 (x) ex dx


{z
}
|
= 0 por (9.70)

Captulo 9

Vers
ao de 29 de setembro de 2005.

dx + (2n 2)

An .

Hn (x) Hn2 (x) ex dx


{z
}
|
= 0 por (9.70)

2
Logo, An = (2n)An1 , ou seja, An = (2n)!! A0 = 2n n! A0 . Como A0 = ex dx = , conclumos
que
Z

2
(9.72)
Hn (x)Hm (x) ex dx = 2n n! n, m ,

para todo m, n 0. Estas sao as relaco


es de ortogonalidade dos polin
omios de Hermite.
A fun
c
ao geratriz exponencial dos polin
omios de Hermite

Vamos aqui considerar a funcao geratriz exponencial dos polinomios de Hermite e provar que

X
Hn (x)
n=0

n!

tn = e2xtt .

(9.73)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

513/1304

Usando-se diretamente (9.69) e separando-se na soma ns pares de ns mpares, segue que

X
X
H2m (x) 2m X H2m+1 (x) 2m+1
Hn (x) n
t
=
t +
t
n!
(2m)!
(2m
+
1)!
m=0
m=0
n=0
=

X
m
X
(1)k (2x)2m2k t2m

k! (2m 2k)!

m=0 k=0

mm+k

m=0 k=0

k! (2m + 1 2k)!


X
(1)k (2x)2m t2m+2k X X (1)k (2x)2m+1 t2m+1+2k
+
k! (2m)!
k! (2m + 1)!
k=0 m=0
k=0 m=0

X
(1)k t2k

k!

k=0

X
(2xt)n

t2

n=0

X
(1)k (2x)2m2k t2m X X (1)k (2x)2m+12k t2m+1
+
k! (2m 2k)!
k! (2m + 1 2k)!
k=0 m=k
k=0 m=k

X
m
X
(1)k (2x)2m+12k t2m+1

n!

X
(2xt)2m
(2m)!
m=0

X
(1)k t2k
k=0

k!

X
(2xt)2m+1
(2m + 1)!
m=0

e2xtt ,

como queramos provar.


F
ormula de Rodrigues para os polin
omios de Hermite
Pelas nossas consideracoes gerais sobre as formulas de Rodrigues, podemos presumir que os polinomios Hm , por serem ortogonais entre si (vide (9.70)), possam ser expressos na forma (9.17) com
2
r(x) = ex , ou seja,
n
2 d
2
Hn (x) = Kn ex
ex ,
n
dx
onde Km sao constantes que dependem da normalizacao adotada. De fato, essa pressuposicao e correta
2
pois, multiplicando (9.73) por ex , obtem-se
e

(xt)2

X
Hm (x)ex m
t .
=
m!
m=0

(9.74)

Encarando o lado direito como a expansao em serie de Taylor em t, em torno de t = 0, da funcao do


lado esquerdo, conclumos que

n

d
2
2
(xt)
,
e
Hn (x)ex =

dtn
t=0
para todo n 0. Com a mudanca de variavel u = x t,

n

n d
x2
u2
= (1)
Hn (x)e
e

dun

d
dt

u=x

d
= du
, ficamos com

= (1)n

dn x2
.
e
dxn

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

514/1304

Assim,

dn x2
e
,
dxn
para todo n 0. Essa e a f
ormula de Rodrigues dos polin
omios de Hermite.
Hn (x) = (1)n ex

(9.75)

Rela
co
es de recorr
encia para os polin
omios de Hermite
Tomando-se a derivada em x de (9.75), e elementar constatar que
Hn0 (x) = 2xHn (x) Hn+1 (x) .

(9.76)

Ao mesmo tempo,
Hn+1 (x)

dn+1 x2
e
dxn+1


n
d x2
x2 d
e
e
dxn dx

(1)n+1 ex

(1)n+1

Leibniz

dn  x2 
xe
dxn

  np
n    p
X
d
n
d
n x2
x2
2(1) e
x
e
p
dxp
dxnp
p=0
2(1)n ex

x2


dn1  x2 
dn  x2 
+ n n1 e
x n e
dx
dx

2(1) e

2xHn (x) 2nHn1 (x) .

Assim, Hn+1 (x) = 2xHn (x)2nHn1 (x). Note que, como H0 (x) = 1 e H1 (x) = 2x, essa identidade vale
tambem para n = 0, convencionando que H1 (0) 0. Reunindo isso com (9.76), somos conduzidos a
Hn0 (x) = 2nHn1 (x), n 0. Resumindo, obtemos as seguintes relacoes:
Hn0 (x) = 2xHn (x) Hn+1 (x) ,

(9.77)

Hn+1 (x) = 2xHn (x) 2nHn1 (x) ,

(9.78)

Hn0 (x) = 2nHn1 (x) ,

(9.79)

validas para todo n 0 com a convencao H1 (0) 0. Estas expressoes sao bastante u
teis. A relacao
(9.78), por exemplo, permite obter recursivamente todos os Hn s a partir de H0 (x) = 1 e H1 (x) = 2x.
*
Em livros de Mecanica Quantica o estudante podera aprender que algumas das propriedades dos
polinomios de Hermite que obtivemos acima podem ser provadas com o uso dos chamados operadores
de criacao e aniquilacao.

JCABarata. Curso de Fsica-Matem


atica

9.2.4

Captulo 9

Vers
ao de 29 de setembro de 2005.

515/1304

Propriedades dos Polin


omios de Laguerre

Rela
co
es de ortogonalidade para os polin
omios de Laguerre
0

A equacao de Laguerre (xex y 0 (x)) + ex y(x) = 0 e tipicamente considerada no intervalo J =


[0, ). Para ela tem-se p(x) = xex , q(x) = 0, r(x) = ex e = . Note que p(x) > 0 em J 0 = (0, ),
e anula-se em x = 0 e no infinito. Alem disso, r(x) > 0 em todo J = [0, ). Os polinomios de Laguerre
foram definidos em (8.133) por
 
m
X
m
n m!
Lm (x) :=
(1)
xn
(9.80)
n!
n
n=0
bastante claro que para
e representam solucoes da equacao de Laguerre em J = [0, ) para = m. E
os polinomios de Laguerre vale a condicao (9.6) e, portanto, pelo Teorema 9.1, segue que
Z
Ln (x)Lm (x) ex dx = 0
(9.81)
0

para todo n 6= m, com m, n = 0, 1, 2, 3, . . .. Notemos tambem aqui que (9.81) implica


Z
xk Lm (x) ex dx = 0

(9.82)

para todo k < m, pois os monomios xk podem ser escritos como combinacoes lineares dos polinomios
Ln s com n < m. Para calcular as integrais de (9.81) no caso m = n podemos fazer uso da identidade
L0n+1 (x) = (n + 1)L0n (x) (n + 1)Ln (x) ,
que sera demonstrada mais abaixo (expressao (9.87)). Com ela, ve-se que
Z
Z


2 x
(n + 1)
Ln (x) e dx
=
Ln (x) (n + 1)Ln (x) ex dx
0

(9.83)

(9.83)

int. por partes

(n + 1)

Ln (x)L0n (x)

dx
}

Ln (x)L0n+1 (x) ex dx

0
{z
= 0 por (9.82)
Z
x
Ln (x)Ln+1 (x)e +
L0n (x)Ln+1 (x) ex dx
0
{z
}
|0
= 0 por (9.82)
Z

Ln (x)Ln+1 (x) ex dx
{z
}
|0
= 0 por (9.81)

|0

Ln (0)Ln+1 (0)

(9.80)

(n + 1)(n!)2 .

JCABarata. Curso de Fsica-Matem


atica

Conclumos assim que

Captulo 9

Vers
ao de 29 de setembro de 2005.

516/1304

Ln (x)Lm (x) ex dx = (n!)2 n, m

(9.84)

para todos n, m 0. Estas sao as relaco


es de ortogonalidade para os polin
omios de Laguerre.
F
ormula de Rodrigues para os polin
omios de Laguerre
Pela ortogonalidade dos polinomios de Laguerre (9.81), podemos presumir, sob a luz das consideracoes da Secao 9.1.3, pagina 488, que os polinomios de Laguerre satisfazem, por (9.15), uma relacao
como


m 
1 dm 
m
x d
m x
r(x)
x
=
K
e
x
e
,
(9.85)
Lm (x) := Km
m
r(x) dxm
dxm

onde Km e uma constante dependente da normalizacao adotada. De fato, pela regra de Leibniz,
  p

m    mp

m 
X
d
m
d x
x
m x
m
x d
= e
x e
x
e
e
p
dxm
dxmp
dxp
p=0
 
m
X
m! p
p m
x
=
(1)
p!
p
p=0

(9.80)

Lm (x) .

Assim, Km = 1 e conclumos que


Lm (x) = ex

dm  m x 
x e
,
dxm

(9.86)

para todo m 0. Esta e a f


ormula de Rodrigues para os polin
omios de Laguerre.
Rela
co
es de recorr
encia para os polin
omios de Laguerre
Por (9.86), e elementar constatar que
L0m+1 (x)

m+1
d  m+1 x 
dm+1  m+1 x 
x d
x
e
+
e
x
e
dxm+1
dxm+1 dx

ex

Lm+1 (x) + (m + 1)ex

(9.86)

=
=


m+1 
dm+1  m x 
x d
m+1 x
x
e

e
x
e
dxm+1
dxm+1

dm+1  m x 
x e
dxm+1


x d
x
(m + 1)e
e Lm (x)
dx

(m + 1)ex

(m + 1)ex

d dm  m x 
x e
dx dxm

(m + 1)Lm (x) + (m + 1)L0m (x) .

Estabelecemos assim que


L0m+1 (x) = (m + 1)L0m (x) (m + 1)Lm (x) ,

(9.87)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

517/1304

m 0. Essa e uma das formulas de recorrencia para os polinomios de Laguerre, a qual empregamos
acima para provar as relacoes de ortogonalidade (9.84) no caso m = n. Ha uma segunda, da qual
trataremos agora. Pela formula de Rodrigues vale


dm 
dm 
(9.86)
Lm (x) = ex m xm ex
= ex m x xm1 ex
dx
dx
m    p 
X

m
d
dmp
Leibniz
x
m1 x
= e
x
x
e
p
dxp
dxmp
p=0
=

m1


dm
m1 x
x d
m1 x
e x m x
e
+ me
x
e
dx
dxm1
x


d x
e Lm1 (x) + mLm1 (x)
dx

ex x

xLm1 (x) + xL0m1 (x) + mLm1 (x) .

Estabelecemos que
Lm (x) = xLm1 (x) + xL0m1 (x) + mLm1 (x)

(9.88)

Lm+1 (x) = xLm (x) + xL0m (x) + (m + 1)Lm (x) .

(9.89)

o que tambem implica (fazendo m m + 1)

Multiplicando ambos os lados de (9.88) por m e somando o resultado a (9.89), teremos:


Lm+1 (x) mLm (x) = xLm (x) + xL0m (x) + (m + 1)Lm (x) + mxLm1 (x) mxL0m1 (x) m2 Lm1 (x) .
(9.90)
(9.87)

Por (9.87), os termos xL0m (x) mxL0m1 (x) valem x(L0m (x) mL0m1 (x)) = mxLm1 (x). Introduzindo isso de volta a (9.90), inferimos que
Lm+1 (x) = (2m x + 1)Lm (x) m2 Lm1 (x) .
Resumindo nossas conclusoes, estabelecemos as seguintes relacoes:
L0m+1 (x) = (m + 1)L0m (x) (m + 1)Lm (x) ,

(9.91)

Lm+1 (x) = (2m x + 1)Lm (x) m2 Lm1 (x) .

(9.92)

Essas relacoes sao denominadas f


ormulas de recorrencia para os polin
omios de Laguerre. A relacao
(9.92), em particular, permite obter recursivamente todos os Lm (x)s a partir de L0 (x) = 1 e L1 (x) =
1 x.
A fun
c
ao geratriz exponencial dos polin
omios de Laguerre
Partindo de (9.80) obtemos para a funcao geratriz exponencial dos polinomios de Laguerre

X
Lm (x) m
L(x, t) :=
t
m!
m=0

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

518/1304

o seguinte desenvolvimento19 :
X
m
X

1
L(x, t) =
(1)
n!
m=0 n=0
n

X
X

1
=
(1)
n!
n=0 m=n
n

xn
(1)n
=
n!
n=0

 
m
xn t m
n
 
m
xn t m
n

 
X
m

m=n

tm

(9.93)

Agora,
 
X
m

m=n

mm+n

=
Leibniz

tn X (m + n)! m
t
n! m=0
m!

tn X dn m+n
t
n! m=0 dtn

tn d n
n! dtn

tn
1t

tn d n
n! dtn

tn

tm

m=0

  np

n    p
d n
tn X n
d
1
t
(1 t)
n! p=0 p
dtp
dtnp



n   
(n p)!
tn X n
n!
np
t
n! p=0 p
(n p)!
(1 t)np+1
np
n   
tn X n
t
1 t p=0 p
1t

tn
1t

t
1+
1t

n

tn
.
(1 t)n+1

Retornando com isso a (9.93), temos



n

1 X (1)n
xt
L(x, t) =
,
1 t n=0 n!
1t
e assim conclumos que


xt
exp
1t
L(x, t) =
.
1t
Essa e a funca
o geratriz exponencial dos polin
omios de Laguerre.
19

Assumimos |t| e |x| pequenos o suficiente para justificar as diversas manipulaco


es que faremos.

(9.94)

JCABarata. Curso de Fsica-Matem


atica

9.2.5

Vers
ao de 29 de setembro de 2005.

Captulo 9

519/1304

Propriedades dos Polin


omios de Laguerre Associados

A equacao de Laguerre associada


xy 00 + (m + 1 x)y 0 + (n m)y = 0 ,

(9.95)

com m e n inteiros com 0 m n, e tipicamente considerada no intervalo J = [0, ). A mesma


pode ser ser levada a` forma canonica (9.1), transformando-se em
(xm+1 ex y 0 (x))0 + (n m)xm ex y(x) = 0 .
Tem-se, portanto, p(x) = xm+1 ex , q(x) = 0, r(x) = xm ex e = n m. Uma alternativa talvez
melhor e tomar-se p(x) = xm+1 ex , q(x) = mxm ex , r(x) = xm ex e = n. Note-se que p(x) e r(x)
sao os mesmos em ambas as escolhas.
Os polinomios de Laguerre associados foram definidos em (8.156) e expressoes seguintes por 20
Ln(m) (x)

dm
dm
L
(x)
=
=
n
dxm
dxm
(m)

com 0 m n. O polinomio Ln

dn n x
e
(x e )
dxn
x


n
(1)
xk ,
= (1)
k! m + k
k=0
m

nm
X

k n!

(9.96)

e a u
nica solucao de (9.95) que e regular em x = 0.

E. 9.12 Exerccio. Mostre que


Ln(m) (x) =


(1)m n! x m dnm
n x
e x
x
e
.
(n m)!
dxnm

bastante elementar constatar que, com m fixo, as funcoes Ln(m) com n m satisfazem (9.6) para
E
o intervalo J = [0, ). Assim, vale que
Z
(m)
Ln(m) (x) Ln0 (x) xm ex dx = 0
(9.97)
0

sempre que n 6= n0 . Para calcular a integral acima no caso n0 = n fazemos uso da relacao (9.104),
que sera demonstrada logo adiante. Tomando (9.104), substituindo n n 1 e multiplicando-a por
(m)
n1 Ln (x), obtemos
(n m)  (m) 2
(m)
(m)
= (2n m x 1)Ln1 (x)Ln(m) (x) (n 1)2 Ln2 (x)Ln(m) (x) .
Ln (x)
n
(m)

Tomando (9.104) e multiplicando-a por (n + 1)1 Ln1 (x), obtemos


2
(n + 1 m) (m)
(m)
(m)
(m)
Ln+1 (x)Ln1 (x) = (2n m x + 1)Ln(m) (x)Ln1 (x) n2 Ln1 (x) .
n+1

20
Mais uma vez advertimos o leitor do fato de haver v
arias convenco
es distintas quanto a
` definica
o dos polin
omios de
Laguerre associados na literatura. Para comparaca
o, polin
omios de Laguerre associados definidos em [83], que denotamos
(m)
(1)m (m)
m
aqui por L Lm
n (x), diferem dos nossos Ln (x) da seguinte forma: L Ln (x) = (n+m)! Ln+m (x).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

520/1304

Subtraindo uma expressao da outra, obtemos


(n m)  (m) 2 (n + 1 m) (m)
(m)
Ln+1 (x)Ln1 (x)
Ln (x)
n
n+1
=

(m)
2Ln1 (x)Ln(m) (x)

(n 1)

(m)
Ln2 (x)Ln(m) (x)

+n

(m)
Ln1 (x)

2

Multiplicando agora esta expressao por xm ex , integrando entre 0 e e usando (9.97), ficamos com
Z 
Z 
2
2
n3
(m)
m x
(m)
Ln (x) x e dx =
Ln1 (x) xm ex dx .
(n m) 0
0
A inducao pode ser feita diminuindo n ate atingir o valor m, de onde extramos que
Z 
Z 
2
2
(n!)3
(m)
(m)
m x
L
(x)
Ln (x) x e dx =
xm ex dx .
m
3 (n m)!
(m!)
0
0
R
(m)
Pela u
ltima igualdade em (9.96), tem-se Lm (x) = (1)m m!. Ao mesmo tempo, 0 xm ex dx = m!.
Assim,
Z 
2
(n!)3
.
Ln(m) (x) xm ex dx =
(n m)!
0

Essa expressao pressupoe, naturalmente, 0 m n.

Conclumos assim que com nossas definicoes


Z
(m)
Ln(m) (x) Ln0 (x) xm ex dx
0

(n!)3
n, n0 .
(n m)!

(9.98)

Essas sao as relacoes de ortogonalidade dos polinomios de Laguerre associados.


Coment
ario para o leitor mais avancado. Ao contrario da lenda, as relacoes de ortogonalidade (9.98)
n
ao sao as relacoes de ortogonalidade da parte radial das auto-funcoes de energia do atomo de hidrogenio. Os polinomios de Laguerre associados possuem um outro tipo de relacao de ortogonalidade,
a saber,
 
 
Z

2 p2l+4 ((p + l)!)3


2 p+p
(2l+1)
(2l+1)
2l+2
0
pp
0
Lp0 +l
L
e

d
=

.
(9.99)
p,
p
p+l
p0
p
(p l 1)!
0

valida para todo p, p0 inteiros positivos (nao-nulos), as quais discutiremos na Secao 10.5, pagina 568.
Lamentavelmente, poucos livros-texto de Mecanica Quantica discutem esse ponto quando tratam do
atomo de hidrogenio. Uma excecao, um tanto surpreendentemente, e [4].
Uma conseq
u
encia de (9.98) empregada no estudo do
atomo de hidrog
enio
As relacoes (9.98) implicam um resultado que e usado no contexto do atomo de hidrogenio. Trata-se
do seguinte: no caso n = n0 (9.98) diz-nos que
Z
2 m x
(n!)3
(m)
.
Ln (x)
x e dx =
(n m)!
0

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

521/1304

No problema do atomo de hidrogenio surge a necessidade de se determinar a integral


Z
2 m+1 x
x
e dx
Ln(m) (x)

(9.100)

Vers
ao de 29 de setembro de 2005.

que difere da anterior pois o fator xm e substitudo por xm+1 . Essa u


ltima integral pode ser calculada
empregando-se a relacao
xLn(m) (x) =

(n + 1 m) (m)
(m)
Ln+1 (x) + (2n m + 1)Ln(m) (x) n2 Ln1 (x) ,
n+1

que sera provada logo abaixo (expressao (9.104)). Inserindo-a em (9.100) e usando as relacoes de
ortogonalidade (9.98), obtem-se facilmente
Z
2 m+1 x
(n!)3
Ln(m) (x)
x
e dx =
(2n m + 1) .
(9.101)
(n m)!
0
Essa expressao sera usada quando da normalizacao das auto-funcoes de energia do atomo de hidrogenio.
Rela
co
es de recorr
encia para os polin
omios de Laguerre associados
(m)

Se explorarmos a primeira igualdade em (9.96), que define os polinomios Ln , algumas formulas


de recorrencia para os polinomios de Laguerre associados podem ser obtidas diretamente daquelas dos
polinomios de Laguerre listadas em (9.91)-(9.92) simplesmente diferenciando-as m vezes em relacao a
x. Como facilmente se constata, obtem-se
(m+1)

Ln+1 (x) = (n + 1)Ln(m+1) (x) (n + 1)Ln(m) (x) ,


(m)

(9.102)
(m)

Ln+1 (x) = (2n x + 1)Ln(m) (x) mL(m1)


(x) n2 Ln1 (x) ,
n
(m) 0

onde, em (9.102), usamos o fato evidente que Ll

(m+1)

(x) = Ll

(m1)

Tomando (9.102) e trocando m m 1, obtem-se Ln


isso em (9.103), obtem-se

(9.103)

(x).
(m)

(m)

1
Ln+1 (x) + Ln (x). Inserindo
(x) = (n+1)

(m)

(m)

(n + 1 m)Ln+1 (x) = (n + 1)(2n m x + 1)Ln(m) (x) n2 (n + 1)Ln1 (x) .

(9.104)

Essas relacoes sao denominadas f


ormulas de recorrencia para os polin
omios de Laguerre associados.
A fun
c
ao geratriz exponencial dos polin
omios de Laguerre associados
A partir da definicao (9.96) e de (9.94) e elementar constatar que a funcao geratriz exponencial dos
polinomios de Laguerre associados e dada por



(m)
X
Ll (x) l
(1)m tm
xt
t =
Las. (x, t) :=
exp
.
(9.105)
m+1
l!
(1

t)
1

t
l=m
A soma acima comeca com l = m pois

dm
L (x)
dxm l

= 0 caso m > l.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

522/1304

A equa
c
ao de Laguerre generalizada
A assim denominada equaca
o de Laguerre generalizada e a equacao diferencial
zy 00 (z) + ( + 1 z)y 0 (z) + ny(z) .
com n
e > 1, real. Trata-se de uma variante da equacao de Laguerre associada, pois aqui
nao e necessariamente um inteiro.


E. 9.13 Exerccio. Mostre que essa equacao tem uma solucao da forma de um polinomio
Ln (z)

 
n (n + + 1) k
z .
:=
(1)
k (k + + 1)
k=0
n
X

6
E. 9.14 Exerccio. Mostre que
Ln (x) = ex x
x > 0.

dn  n+ x 
,
x e
dxn

E. 9.15 Exerccio. Mostre que


Z

Ln (x)Lm (x) x ex dx = 0

se m 6= n. Calcule a integral no caso m = n.

E. 9.16 Exerccio. Para = m, inteiro, mostre que


Ln (x) = (1)m

(n m)! (m)
Ln (x) .
n!
6

9.2.6

Propriedades das Fun


co
es de Bessel

Na presente secao apresentaremos algumas das propriedades mais importantes e mais empregadas das
funcoes de Bessel, especialmente as de ordem inteira. Devido a` sua importancia em um sem-n
umero de
problemas aplicados, as funcoes de Bessel e de Neumann tem sido intensamente estudadas nos u
ltimos
duzentos anos e foi coletado um enorme conjunto de informacoes sobre as mesmas, gerando uma vasta
literatura. Por isso, nossas pretensoes aqui sao relativamente modestas. Um texto classico sobre o
assunto e [131]. Outros excelentes sao [136], [66] e [83], mas todas as referencias listadas a` pagina 395
tratam do assunto com maior ou menor grau de profundidade.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

523/1304

No estudo das propriedades das funcoes de Bessel J (x) procederemos de um modo ligeiramente
diferente do que fizemos acima. Isso se da por varias razoes. Uma delas e que as funcoes de Bessel nao
sao polinomios, ao contrario dos casos de acima. Outra e a natureza das relacoes de ortogonalidade
dessas funcoes.
Origens
As funcoes de Bessel surgem em varios problemas da Fsica-Matematica, especialmente envolvendo a
resolucao de certas equacoes diferenciais em coordenadas cilndricas. O mais celebre desses problemas e
aquele que estuda as vibracoes de uma membrana circular (um tambor), problema encontrado em varios
livros-texto e que estudamos na Secao 10.3, pagina 564. Esse problema foi tratado pela primeira vez
por Euler21 em 1764, antecedendo a Bessel. Em verdade, certas funcoes de Bessel surgiram antes ainda,
em 1703, na resolucao da chamada equacao de Riccati22 por Jacob Bernoulli23 (vide nota historica a`
pagina 289) e em 1732, em trabalhos de Daniel Bernoulli24 sobre o problema da corda vibrante e suas
variantes (vide problema da corda pendurada na Secao 10.2.2, pagina 556). O trabalho do astronomo
Bessel25 no qual as funcoes que levam seu nome foram (re)encontradas e bem posterior e data de 1817,
tendo sido publicado em 182426 .
O problema que conduziu Bessel nao foi o de resolver uma equacao diferencial, mas o de determinar
coeficientes de Fourier que descrevem a trajetoria de um planeta em movimento periodico em uma orbita
elptica em torno do Sol e obedecendo a segunda lei de Kepler27 , segundo a qual o raio-vetor que conecta
o Sol ao planeta em questao varre areas iguais em tempos iguais28 . Bessel obteve para esses coeficientes
uma expressao integral que e a representacao integral das funcoes de Bessel que apresentamos em
(9.131), mais abaixo. Posteriormente, identificou-se que esses coeficientes representavam as funcoes
previamente tratadas por Daniel Bernoulli e Euler, mas as mesmas acabaram sendo nomeadas em
honra a Bessel (segundo [64], o nome de Bessel foi atribuido a` equacao diferencial por Schlomilch 29 em
1857 e Lipschitz30 em 1859). Em seu trabalho, na verdade, Bessel estendeu resultados anteriores de
Lagrange31 , de 1769, o qual tambem dedicou-se a` questao de determinar os coeficientes de Fourier que
expressam como funcao do tempo a distancia ao Sol de um planeta em orbita elptica, calculando os
tres primeiros32 .
A determinacao desses coeficientes de Fourier nao e um mero exerccio academico, pois e importante
para calculos, via teoria de perturbacoes, da influencia gravitacional que os planetas exercem entre si
e da conseq
uente previsao de desvios das suas orbitas elpticas. O estudo matematico de perturbacoes
21

Leonhard Euler (1707-1783).


Iacopo Francesco Riccati (1676-1754).
23
Jacob Bernoulli (1654-1705).
24
Daniel Bernoulli (1700-1782).
25
Friedrich Wilhelm Bessel (1784-1846).
26
F. W. Bessel, Untersuchungen des Theils der planetarischen St
orungen, welcher aus der Bewegung der Sonne
entsteht. Berliner Abhandlungen, 1-52 (1824).
27
Johannes Kepler (1571-1630).
28
Como todo estudante de Fsica bem sabe, isso e conseq
uencia da conservaca
o do momento angular sob uma forca
central.
29
Oscar Xavier Schl
omilch (1823-1901).
30
Rudolf Otto Sigismund Lipschitz (1832-1903).
31
Joseph-Louis Lagrange (1736-1813).
32
Outras informaco
es hist
oricas sobre o desenvolvimento das funco
es de Bessel podem ser encontradas em [131].
22

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

524/1304

periodicas ou quase-periodicas em sistemas mecanicos (ou em equacoes diferenciais, em geral) e um


vasto assunto de pesquisa que tem desafiado in
umeros pesquisadores ate a atualidade.
Bessel e tambem autor de dois outros importantes feitos cientficos, a proposicao da existencia de
estrelas bin
arias e a medicao da distancia ao Sol de uma outra estrela.
Bessel foi um dos primeiros a propor a existencia de estrelas binarias, prevendo em 1834 a existencia
de uma companheira da estrela Sirius. Tal previsao foi possvel em funcao de medidas de alta precisao,
que Bessel produziu durante anos, da posicao de varias estrelas. Tais medidas indicavam um movimento
elptico periodico de Sirius cuja origem nao poderia ser explicada em termos de movimentos da Terra
ou do sistema solar. Bessel propos que esse movimento era devido a` presenca de uma outra estrela
menos brilhante nas proximidades de Sirius e que ambas orbitavam em torno do centro de massa
comum, explicando assim as observacoes. Em 1840, Bessel anunciou a observacao de tais movimentos
periodicos em outra estrela, a estrela Procyon.
A existencia da companheira de Sirius foi confirmada por observacoes feitas em 1862 por A. G.
Clark33 e a de Procyon em 1896, por J. M. Schaeberle34 , ambas apos a morte de Bessel. As estatsticas
atuais indicam que cerca de metade das estrelas da nossa galaxia e composta por estrelas binarias.
Ha tambem sistemas triplos de estrelas ( Centauri sendo o exemplo mais popularmente conhecido),
quadruplos ( Lyrae) etc.
Um problema matematico, levantado pela primeira vez por Laplace35 em 1785 e ainda hoje em
aberto, ao qual nomes como o de Poincare36 deram importantes contribuicoes, e o de saber se sistemas
m
ultiplos como esses, ou como o nosso proprio sistema solar, sao estaveis. Esse problema deu origem a
uma importante area de pesquisa atual, a teoria dos sistemas dinamicos37 . Metodos como os que Bessel
e outros empregaram para a deteccao de sistemas binarios sao empregados hoje em dia na deteccao de
planetas orbitando estrelas, outro tema atual de pesquisa.
Bessel foi tambem o primeiro, em 1838, a determinar a distancia ao Sol de uma outra estrela, usando
para tal o metodo de paralaxe. A estrela em questao foi 61 Cygni e Bessel calculou sua distancia ao
Sol como sendo cerca de 10 anos-luz. O valor atualmente aceito e de cerca de 10,7 anos-luz, ou 3,3
parsecs38 . Com esse trabalho, Bessel contribuiu para o estudo das escalas de distancia cosmologicas,
tarefa em implementacao ate os nossos dias.
Rela
co
es de recorr
encia para as fun
co
es de Bessel
Seja a funcao de Bessel J (x) definida em (8.102) por
J (x) :=

X
k=0

33

 x 2k+
(1)k
.
k! (k + 1 + ) 2

(9.106)

Alvan Graham Clark (1832-1897).


John Martin Schaeberle (1853-1924).
35
Pierre-Simon Laplace (1749-1827).
36
Jules Henri Poincare (1854-1912).
37
Em verdade, boa parte da topologia moderna foi criada por Poincare no seu tratamento do problema de estabilidade.
38
Um ano-luz e a dist
ancia que a luz percorre em um ano e corresponde a aproximadamente 9, 46 10 12 km, ou 9, 5
trilh
oes de quil
ometros. Um parsec e definido como a dist
ancia de um objeto cuja paralaxe em relaca
o a
` Terra seja
de um segundo de arco, uma medida de dist
ancia usada tradicionalmente na Astronomia. Um parsec corresponde a
aproximadamente 3, 262 anos-luz, ou 3, 09 1013 km.
34

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

525/1304

Consideremos provisoriamente diferente de 0 ou de um inteiro negativo (pois (x) diverge se x e um


inteiro negativo). Multiplicando J por x e diferenciando em relacao a x, obtem-se
 2k+

d
(1)k
1
d X
(x)2k+2
(x J (x)) =
dx
dx k=0 k! (k + 1 + ) 2
 2k+1

X
1
(1)k (k + )
=
(x)2k+21
k! (k + 1 + ) 2
k=0

= x

X
k=0

 x 2k+1
(1)k
k! (k + ) 2

= x J1 (x) .
Multiplicando J por x e diferenciando em relacao a x, obtem-se analogamente
 2k+


(1)k
d X
1
d

(x)2k
x J (x)
=
dx
dx k=0 k! (k + 1 + ) 2
=

X
k=1

(1)k
(k 1)! (k + 1 + )

X
k=1

kk+1

 2k+1
1
(x)2k1
2

 x 2k+1
(1)k
(k 1)! (k + 1 + ) 2

X
k=0

 x 2k++1
(1)k
k! (k + 2 + ) 2

x J+1 (x) .

Provamos assim que, para 6= 0, 1, 2, 3 . . .,



d
d
(x J (x)) = x J1 (x)
e
x J (x) = x J+1 (x) .
(9.107)
dx
dx
Adotando-se a ja mencionada definicao Jm (x) = (1)m Jm (x), para m inteiro positivo ou zero, vemos
que a expressao acima tambem vale para = 0, 1, 2, 3 . . ..
E. 9.17 Exerccio. Mostre isso!

Para = 0, a segunda relacao em (9.107) diz-nos que


J00 (x) = J1 (x) .

(9.108)

Expandindo as derivadas em (9.107), teremos que


x J0 (x) + x1 J (x) = x J1 (x)

x J0 (x) x1 J (x) = x J+1 (x) ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

526/1304

ou seja,
xJ0 (x) = xJ1 (x) J (x)

xJ0 (x) = J (x) xJ+1 (x) .

(9.109)

Somando e subtraindo essas duas expressoes uma da outra obtemos as seguintes relacoes importantes:

1
J0 (x) =
J1 (x) J+1 (x) ,
(9.110)
2

1
J+1 (x) =
2J (x) xJ1 (x) .
(9.111)
x

Essas relacoes, validas para todo , sao denominadas relaco


es de recorrencia das funco
es de Bessel.
A segunda delas permite, por exemplo, obter todas as funcoes Jm com m inteiro positivo a partir de
J0 e J1 . Na verdade, por (9.108), basta conhecer J0 e sua derivada.
Resumindo, obtivemos as seguintes relacoes
d
(x J (x)) = x J1 (x) ,
dx

d
x J (x) = x J+1 (x) ,
dx

(9.113)

xJ0 (x) = xJ1 (x) J (x) ,

(9.114)

xJ0 (x) = J (x) xJ+1 (x) ,

(9.115)


1
J1 (x) J+1 (x) ,
=
2

1
J+1 (x) =
2J (x) xJ1 (x) ,
x
J0 (x)

validas para todo

(9.112)

(9.116)
(9.117)

e todo x , x 6= 0.

Expressoes analogas a`s de acima sao tambem validas para as funcoes N (x).

A rela
c
ao entre Jn e J0 , n


A segunda expressao em (9.107) diz-nos que



1 d
x J (x) = x(+1) J+1 (x) .
x dx

Disso segue imediatamente que



n

1 d
x J (x) = (1)n x(+n) J+n (x) ,
x dx

valida para todo , x

en

. No caso particular em que = 0, obtem-se,



n
1 d
n n
(J0 (x)) ,
Jn (x) = (1) x
x dx

(9.118)

(9.119)

JCABarata. Curso de Fsica-Matem


atica

valida para todo x e n


com as formulas de Rodrigues.


Vers
ao de 29 de setembro de 2005.

Captulo 9

527/1304

. A expressao (9.119) generaliza (9.108) e guarda certa semelhanca

E. 9.18 Exerccio. Obtenha (9.118) e (9.119) diretamente da definicao (9.106).

A fun
c
ao geratriz das fun
co
es de Bessel
A determinacao da funcao geratriz das funcoes de Bessel e importante, entre outras razoes, por nos
permitir obter representacoes integrais para as funcoes de Bessel, representacoes essas que assumem
uma grande relevancia em varias aplicacoes.
Tomemos as funcoes de Bessel de ordem inteira definidas por
Jm (x) :=

X
k=0

 x 2k+m
(1)k
,
k! (k + m)! 2

(9.120)

para m 0, convencionando-se que Jm (x) = (1)m Jm (x) (vide (8.120) e a discussao que lhe acompanha). Vamos aqui considerar a funcao geratriz definida por
J(x, t) :=

tm Jm (x)

m=

para t 6= 0 e vamos provar que

 

x
1
t Jm (x) = exp
t
.
2
t
m=

(9.121)

Dessa importante relacao serao extrados varios fatos u


teis sobre as funcoes de Bessel de ordem inteira.
Antes de provarmos isso, mostremos que J(x, t) esta bem definida. Por (9.120), vale
|Jm (x)|

X
k=0

1
k! (k + m)!

de modo que

|J(x, t)| |J0 (x)| +

m=1

x 2k+m
1 x m X 1



2
m! 2 k=0 k!

m
X
1
|Jm (x)|
|t| |Jm (x)| +
t

x 2k
1 x m |x/2|2

=
,

e
2
m! 2

m=1

|J0 (x)| + e

|x/2|2

sendo que as u
ltimas somas sao convergentes para todo x
J(x, t) e analtica para todo x e todo t com t 6= 0.

X
X
1 x m
1 xt
|x/2|2
+e
,
m! 2
m! 2t
m=1
m=1

e todo t

com t 6= 0, o que prova que

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

528/1304

Podemos com isso demonstrar (9.121) de modo bem simples, tomando a derivada parcial em relacao
a x de J(x, t), derivando termo a termo na soma (o que e permitido, devido a` analiticidade) e usando
(9.110):

J(x, t)
x

0
t m Jm
(x)

(9.122)

m=

(9.110)

k=m1,
l=m+1

1 X m
1 X m
t Jm1 (x)
t Jm+1 (x)
2 m=
2 m=

t X k
t1 X l
t Jk (x)
t Jl (x)
2 k=
2 l=



1
1
t
J(x, t) .
2
t

(9.123)

(9.124)

(9.125)


t) = 21 t 1t J(x, t), cuja solucao geral e

 
1
x
t
,
J(x, t) = f (t) exp
2
t

Assim, J(x, t) satisfaz a equacao diferencial

J(x,
x

para alguma funcao f (t). Agora, como Jm (0) = 0 para m 6= 0 e J0 (0) = 1, segue que J(0, t) = 1, o
que implica f (t) = 1, provando (9.121).
Estudando a demonstracao acima o leitor podera reconhecer a importancia de definir-se J m (x) =
(1)m Jm (x), para m inteiro positivo ou zero.
F
ormula de adi
c
ao das fun
co
es de Bessel
Uma das relacoes mais u
teis que advem de (9.121) e a seguinte:
Jm (x + y) =

Jn (x)Jmn (y) ,

(9.126)

n=

valida para todo m e todos x, y . Essa expressao e denominada por alguns autores f
ormula
de adica
o das funco
es de Bessel (a adicao, aqui, refere-se a` adicao dos argumentos da funcao no
lado esquerdo). As funcoes de Bessel satisfazem varias outras relacoes de adicao do tipo de acima e
remetemos o leitor a` literatura supracitada (por exemplo, a` referencia [66]) para generalizacoes.
A demonstracao de (9.126) e obtida de (9.121) calculando-se o produto J(x, t)J(y, t) de duas

JCABarata. Curso de Fsica-Matem


atica

formas: por um lado,

Captulo 9

Vers
ao de 29 de setembro de 2005.

529/1304

 

 

x
1
y
1
J(x, t)J(y, t) = exp
t
exp
t
2
t
2
t



1
x+y
= exp
t
2
t

tm Jm (x + y) .

(9.127)

m=

Por outro lado,


J(x, t)J(y, t) =

tk Jk (x)

k=

tl Jl (y)

l=

tk+l Jk (x)Jl (y)

k= l=

tm

m=

Jn (x)Jmn (y)

n=

(9.128)

Comparando-se (9.127) a (9.128) obtem-se (9.126).


Se em (9.126) tomarmos y = x e m = 0, e usarmos que Jn (x) = Jn (x) e que J0 (0) = 1,
obteremos


2

2
2
X
X
(9.129)
Jn (x) .
= J0 (x) + 2
1 =
Jn (x)
n=1

n=

Como Jn (x) e real para x

, isso ensina-nos que


|J0 (x)| 1

para todo x


1
|Jn (x)| ,
2

e n 6= 0, n inteiro.

E. 9.19 Exerccio. Justifique!

possvel estabelecer limites superiores mais precisos para |Jn (x)|, mas nao trataremos disso aqui.
E
Representa
co
es integrais das fun
co
es de Bessel
A relacao (9.121) tem varios usos, um deles e o de fornecer uma representacao integral para as
funcoes de Bessel, com a qual outras propriedades podem ser obtidas. A relacao (9.121) foi provada
para todo x e t com t 6= 0. Tomemos t com |t| = 1, ou seja, tomemos t da forma t = ei , com
. Obtemos,

X
eix sen () =
Jm (x)eim .
(9.130)
m=

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

530/1304

O ponto interessante e que podemos interpretar o lado direito como sendo a serie de Fourier na variavel
da funcao periodica de perodo 2 do lado esquerdo, de onde tiramos que
Z
Z
1
1
ix sen () im
Jm (x) =
e
e
d =
eix sen ()im d ,
2
2
. Usando eia = cos(a) + i sen (a), tem-se
Z
Z
i
1
cos (x sen () m) d +
sen (x sen () m) d .
Jm (x) =
2
2

para todo m

A segunda integral do lado direito e nula, pois o integrando e uma funcao mpar em . Como o
integrando da primeira integral do lado direito e uma funcao par em , segue que
Z
Z
1
1
Jm (x) =
cos (x sen () m) d =
cos (x sen () m) d ,
(9.131)
2
0
valida para todo m
Jm (x), m .

. Essa expressao e a importante representaca


o integral da funca
o de Bessel

Tomando-se t = iei em (9.121), obtem-se


e

ix cos()

im Jm (x)eim .

(9.132)

eix cos()im d .

(9.133)

m=

de onde se extrai

(i)m
Jm (x) =
2

facil obter da que


E
(1)m
J2m (x) =
2
(1)m
J2m+1 (x) =
2

Z
Z



cos x cos() 2m d ,


sen x cos() (2m + 1) d .

para todo m = 0, 1, 2, . . .. De (9.133) segue, em particular, a relacao


Z
1
eix cos() d .
J0 (x) =
2

(9.134)

Aplicacoes dessa identidade encontram-se nos Exerccios E. 9.20 e E. 9.21.


E. 9.20 Exerccio. Seja f :

2


integravel e seja
Z
1
F[f ](~
p) :=
f (~x)ei~p~x d2 ~x
2 2


sua transformada de Fourier, onde ~x = (x1 , x2 ), p~ = (p1 , p2 )p


e p~ ~x = p1 x1 + p2 x2 . Suponha que f dependa
apenas da coordenada radial: f (~x) = f (r), com r = k~xk = x21 + x22 . Mostre que
Z
F[f ](~
p) =
f (r)J0 (pr)r dr ,
0

onde p = |~
p|.

JCABarata. Curso de Fsica-Matem


atica

E. 9.21 Exerccio.

Seja f :

2


Captulo 9

Vers
ao de 29 de setembro de 2005.

definida por f (~x) = f (r) =

constantes com R > 0. Mostre que

531/1304

f0 , 0 r R
, sendo f0 e R
0, r > R

f0 R
J1 (pR) .
p

F[f ](~
p) =
Sugestao: De (9.107) segue que xJ0 (x) = (xJ1 (x))0 .

Propriedades adicionais
De (9.130) podemos extrair mais algumas relacoes de interesse. Mostremos algumas aqui. Separando
a parte real e a parte imaginaria de ambos os lados de (9.130), teremos



X
cos x sen () =
Jm (x) cos(m) ,
m=



sen x sen () =

Jm (x) sen (m) .

m=

Usando que Jm (x) = (1) Jm (x), obtemos alguns cancelamentos que conduzem a



X
cos x sen () = J0 (x) + 2
J2k (x) cos(2k) ,

(9.135)

k=1

sen x sen ()

= 2

X
k=1

Em particular, para = /2, isso diz-nos que

J2k1 (x) sen ((2k 1)) .

cos(x) = J0 (x) + 2

(1)k J2k (x) ,

(9.136)

(9.137)

k=1

X
sen (x) = 2
(1)k+1 J2k1 (x) .

(9.138)

k=1

Tomando = 0 em (9.135), segue tambem a identidade


1 = J0 (x) + 2

J2k (x) .

k=1

De (9.135)-(9.136), obtem-se tambem, usando as bem-conhecidas relacoes de ortogonalidade das


funcoes seno e co-seno,

Z

1
Jm (x), m par
cos x sen cos(m)d =
.
0,
m mpar
0

Z

1
0,
m par
.
sen x sen sen (m)d =
J
(x),
m
mpar
0
m

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

532/1304

Outras identidades podem ser obtidas a partir das varias apresentadas de acima, ou com os mesmos
metodos, mas encerramos aqui nossa apresentacao das mesmas, convidando o leitor a um passeio
a` literatura pertinente a`s funcoes de Bessel. Nossa intencao agora e a de discutir as relacoes de
ortogonalidade para as funcoes de Bessel.
Zeros das fun
co
es de Bessel
Antes de entrarmos na discussao sobre as relacoes de ortogonalidade para as funcoes de Bessel em
J = [0, 1] precisamos fazer alguns comentarios sobre os zeros das funcoes de Bessel. Os seguintes
teoremas sao validos:
Teorema 9.2 As funco
es Jn (z), com n , n
ao possuem zeros complexos e possuem uma coleca
o
infinita enumer
avel de zeros reais, todos simples, exceto z = 0, que e um zero de ordem |m| de J m (z)
para m , m 6= 0. Os zeros de Jn (z), com n , n
ao possuem pontos de acumulaca
o em . Como
Jn (x) = (1)n Jn (x), vemos que os zeros de Jn (x) s
ao simetricos em relaca
o ao ponto x = 0. Fora
isso, como Jn (x) = (1)n+1 Jn (x), os zeros de Jn (x) coincidem com os de Jn (x). Por fim, os zeros
positivos das funco
es de Bessel de ordem inteira positiva possuem a seguinte propriedade de altern
ancia:
entre dois zeros positivos sucessivos de Jn existe um zero de Jn1 e um de Jn+1 , para todos n 0. 2


Teorema 9.3 Seja real e suponha que | arg z| < . Ent


ao J (z) possui uma coleca
o infinita enumer
avel de zeros reais e positivos e um n
umero 2N () de zeros conjugados complexos, sendo que
1. N () = 0 se > 1 ou = 1, 2, 3, . . .,
2. N () = m se m 1 < < m, m = 1, 2, 3, . . ..
Os zeros reais positivos de J (z), com real, n
ao possuem pontos de acumulaca
o em


+.

Teorema 9.4 Para 0 a funca


o J0 (z) possui apenas zeros simples, exceto em z = 0 e entre dois
zeros sucessivos de J0 (z) h
a exatamente um zero de J (z).
2
O teorema seguinte e particularmente u
til na resolucao de problemas envolvendo condicoes de
contorno mistas.
Teorema 9.5 Para A e B reais e real com > 1 a equaca
o
AJ (z) + BzJ0 (z)
para | arg z| < possui uma coleca
o enumer
avel de zeros reais positivos e no caso em que + A/B
0, tambem n
ao possui razes complexas. Caso + A/B < 0, AJ (z) + BzJ0 (z) possui duas razes
imagin
arias puras.
2
Os enunciados acima foram extrados de [83], [66] e [62] e suas demonstracoes podem ser encontradas
em [131] ou (parcialmente) em [66]. Nao as apresentaremos aqui, mas o leitor nao deve ser desestimulado
a estuda-las pois as mesmas sao elementares e utilizam-se essencialmente apenas do material que ja
apresentamos aqui.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

533/1304

As rela
co
es de ortogonalidade das fun
co
es de Bessel no intervalo [0, 1]
Em muitos problemas, por exemplo, naquele em que estudamos os modos de vibracao de uma
membrana circular, estamos interessados nas solucoes da equacao de Bessel em um intervalo finito
fechado. Consideraremos, para fixar ideias, o caso em que o intervalo e J = [0, 1]. Em uma tal
situacao encontraremos relacoes de ortogonalidade, as quais sao muito importantes na resolucao de
certos problemas envolvendo equacoes diferenciais parciais submetidas a condicoes iniciais e de contorno.
Devido aos comentarios que fizemos acima sobre os zeros das funcoes de Bessel consideraremos no
que segue apenas o caso em que e real.
facil verificar que f (x) e solucao da equacao
Seja para um dado a funcao f (x) := J (x). E


(xy 0 (x))0

2
y(x) + 2 xy(x) = 0 .
x

E. 9.22 Exerccio importante. Verifique isso.

(9.139)
6

Como aparece elevada ao quadrado na expressao acima podemos sem perda de generalidade
considerar > 0 (o caso = 0 e trivial, pois corresponde a uma funcao constante: f 0 (x) = J (0)).
Nosso principal resultado sera o seguinte teorema, o qual estabelece uma classe bastante geral de
relacoes de ortogonalidade para as funcoes de Bessel. Essas relacoes de ortogonalidade sao de suma
importancia nas aplicacoes dessas funcoes a` solucao de certas equacoes diferenciais submetidas a certas
condicoes iniciais e de contorno.
Teorema 9.6 Seja 0 e sejam fixados certos n
umeros reais A, B com (A, B) 6= (0, 0) satisfazendo
+ A/B 0, caso B 6= 0 (vide Teoremas 9.2-9.5). Seja tambem ZA, B o conjunto de todos os n
umeros
> 0 tais que
AJ () + BJ0 () = 0 ,
(9.140)
ou seja,
ZA, B := { > 0| AJ () + BJ0 () = 0} .

(9.141)

Pelo Teorema 9.5, esse conjunto e n


ao-vazio e enumer
avel. Ent
ao a condica
o (9.6) do Teorema 9.1,
p
agina 487, com J = [0, 1], e satisfeita para todas as funco
es f (x) = J (x) com ZA, B e,

es de ortogonalidade (com r(x) = x)


portanto, para , ZA, B com 6= valem as relaco
Z 1
f (x)f (x) x dx = 0 ,
0

ou seja,

J (x)J (x) x dx = 0 .

(9.142)

para todos , ZA, B com 6= . Para todos , ZA, B , tem-se






Z 1
,
2
2
2
0
J (x)J (x) x dx
=
(J ()) + 1 2 (J ())
2

0


2
(9.115) ,
2
2
=
(J ()) J ()J+1 () + (J+1 ()) .
2

(9.143)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

534/1304

Essa express
ao e denominada relaca
o de ortogonalidade das funco
es de Bessel. Note que h
a uma relaca
o
de ortogonalidade para cada tripla (, A, B) com 0 e (A, B) 6= (0, 0) e + A/B 0, B 6= 0, pois
cada tripla (, A, B) fixa o conjunto WA, B .
A relaca
o (9.140) corresponde a condico
es de contorno freq
uentemente encontradas na resoluca
o de
equaco
es diferenciais parciais da Fsica, como por exemplo no problema de propagaca
o de ondas em
uma membrana circular (um tambor). No caso A = 1, B = 0 o conjunto Z 1, 0 coincide com o dos zeros
o
da funca
o de Bessel J (x). No caso A = 0, B = 1 o conjunto Z0, 1 coincide com o dos zeros da funca
0
J (x).
Em particular, se 0 e k e o k-esimo zero da funca
o J (x) no intervalo (0, ), ent
ao
Z 1


(J0 (k ))2
(J+1 (k ))2

J k x J l x x dx = k, l
= k, l
.
(9.144)
2
2
0

Analogamente, se 0 e k e o k-esimo zero da funca


o J0 (x) no intervalo (0, ), ent
ao
 2 !
Z 1



(J (k ))2
J k x J l x x dx = k, l 1
.
k
2
0

(9.145)

Dessa relaca
o percebemos incidentalmente que k > para todo k, pois o lado esquerdo e certamente
positivo quando k = l.
2
Prova do Teorema 9.6. Podemos encarar a equacao (9.139) como sendo da forma canonica (9.1) para o
2
intervalo J = (0, 1] com p(x) = x, q(x) = x , r(x) = x e = 2 . Perguntemo-nos agora se para duas
funcoes f (x) := J (x) e f (x) := J (x) a condicao (9.6) do Teorema 9.1, pagina 487 e satisfeita nos
extremos do intervalo J = (0, 1], ou seja, se


p(1) f (1)f0 (1) f0 (1)f (1) lim p(x) f (x)f0 (x) f0 (x)f (x) = 0 ,
x0

isto e, se

(J ()J0 () J0 ()J ()) lim x (J (x)J0 (x) J0 (x)J (x)) = 0 .


x0

Dado que o primeiro termo da expansao de J (x) e proporcional a x , e que, conseq


uentemente, o
0
1
primeiro termo da expansao de J (x) e proporcional a x
teremos que
lim x (J (x)J0 (x) J0 (x)J (x)) lim xx x1 = 0

x0

x0

sempre que > 0. Para = 0 a relacao acima tambem e valida, pois o primeiro termo da expansao de
J0 (x) e constante, mas o primeiro termo da expansao de J00 (x) e proporcional a x. Para < 0 o limite
x 0 da expressao acima e singular. Conclumos que para 0 vale


p(1) f (1)f0 (1) f0 (1)f (1) lim p(x) f (x)f0 (x) f0 (x)f (x)
x0

= (J ()J0 () J0 ()J ()) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

535/1304

Procuramos agora identificar condicoes sob as quais o lado direito se anula, o que nos garantira a
aplicabilidade do teorema de ortogonalidade, Teorema 9.1.
Um caso obvio e aquele no qual e sao zeros da funcao de Bessel J . Outro caso obvio e aquele
no qual e sao zeros de J0 , a derivada da funcao de Bessel J . O caso mais geral esta na seguinte
proposicao.
Proposi
c
ao 9.1 Suponhamos que para certos n
umeros A e B com (A, B) 6= (0, 0) existam constantes
reais e tais que
AJ () + BJ0 () = 0

AJ () + BJ0 () = 0 .

(9.146)
(9.147)

Ent
ao,
J ()J0 () J0 ()J () = 0 .
2
Prova. As relacoes (9.146)-(9.147) podem ser expressas em forma matricial como


0
J ()
J0 ()
A

= .
0
J ()
J0 ()
B

Como por hipotese (A, B) 6= (0, 0), a relacao acima so e possvel se a matriz 2 2 do lado esquerdo
for nao-invertvel, ou seja, se tiver determinante nulo. Assim, devemos ter

J ()
J0 ()
= J ()J0 () J0 ()J () ,
0 = det
J ()
J0 ()
que e o que queramos estabelecer.

Com essa proposicao, fica estabelecido que a condicao (9.6) do Teorema 9.1, pagina 487, com
com J = [0, 1], e satisfeita para todas as funcoes f (x) = J (x) com ZA, B e, portanto, para
, ZA, B com 6= valem as relacoes de ortogonalidade (com r(x) = x)
Z

f (x)f (x) x dx = 0
0

para todos , ZA, B com 6= .

ou seja,

J (x)J (x) x dx = 0 ,
0

Passemos a` questao de provar (9.143) para o caso em que = . Isso pode ser feito de diversas
maneiras, a mais direta sendo a seguinte. Escrevamos a equacao (9.139) na forma

x2 y 00 (x) + xy 0 (x) + 2 x2 2 y(x) = 0 .
(9.148)

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

536/1304

Multiplicando-a por 2y 0 (x), obtemos



0 = 2x2 y 0 (x)y 00 (x) + 2x(y 0 (x))2 + 2 2 x2 2 y(x)y 0 (x)
 d
d 0
2
(y (x)) + 2x(y 0 (x))2 + 2 x2 2
(y(x))2
dx
dx

 d
d  2 0
2
=
(y(x))2
x (y (x)) + 2 x2 2
dx
dx
= x2

e, portanto,




d  2 0
d  2 2
2
x (y (x)) +
x 2 (y(x))2 22 x (y(x))2 .
dx
dx
Integrando-se ambos os lados da igualdade entre 0 e 1, obtem-se
Z 1

i 1

 1 h
2
2
2
2 2
2
2
0
x (y(x))2 dx .
0 = x (y (x)) + x (y(x)) 2
0 =

(9.149)

Como f (x) = J (x) e solucao de (9.148), podemos adotar y(x) = J (x), acima. Assim,
 1

 1

2
2
2
x2 (y 0 (x)) = 2 x2 (J0 (x)) = 2 (J0 ()) .
0

h

2 2


i 1




(y(x)) = 2 2 (J ())2 + 2 (J (0))2 = 2 2 (J ())2 ,
2

pois 2 (J (0))2 = 0 para todo 0 (por que?). Portanto, (9.149) fica


Z 1


2
2
2
0
2
2
2
x (J (x)) dx = (J ()) + (J ())2 ,
2
0

o que conduz a` primeira linha de (9.143) no caso = . A identidade




2
2
2
0
(J ()) + 1 2 (J ())2 = (J ())2 J ()J+1 () + (J+1 ())2

segue diretamente de (9.115).


Com isso, o Teorema 9.6 esta demonstrado
Coment
ario sobre a equa
c
ao de Bessel no intervalo J = [0, )
Seja a equacao de Bessel x2 y 00 (x) + xy 0 (x) + (x2 2 )y(x) = 0 e consideremo-la agora no intervalo
semi-infinito J = [0, ). A mesma pode ser escrita como
(xy 0 (x))0

2
y(x) + xy(x) = 0,
x

(9.150)

e aqui temos p(x) = x e poderamos adotar q(x) = x, r(x) = x1 e = 2 . Ha, porem, uma diferenca
marcante em relacao aos casos anteriormente tratados. Para as funcoes J (x), mesmo com inteiro,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

537/1304

nao vale a relacao (9.6), pois limx p(x)J (x)J 0 (x) nao se anula e, portanto, o Teorema 9.1 nao se
aplica nesse caso. De fato, J (x) comporta-se para x como
r


2 cos x
4
2
.
J (x)

x
Infelizmente, nao apresentaremos a demonstracao dessa expressao assintotica nestas Notas. O leitor
podera encontra-la em varios textos, por exemplo, em [131], [136], [66] e mesmo em [79]. Em [66], por
exemplo, encontra-se demonstrada a expressao assintotica mais detalhada

J (x)

2 cos x
2

  2r

X
(1)r + 2r + 21
1

1
2x
(2r)! 2r + 2
r=0

2 sen x
2

X
r=0

  2r+1
(1)r + 2r + 23
1

,
1
2x
(2r + 1)! 2r 2

valida para x . Com isso, percebemos que nao devem valer para as funcoes de Bessel com s
diferentes relacoes de ortogonalidade envolvendo integrais em J = [0, ).

9.2.7

Propriedades das Fun


co
es de Bessel Esf
ericas

As funcoes de Bessel e Neumann esfericas de ordem foram definidas em (8.125) e (8.126) por
r
r

J+ 1 (z) ,
N 1 (z) .
j (z) :=
n (z) :=
(9.151)
2
2z
2z + 2
Por serem fortemente relacionadas a`s funcoes de Bessel, suas propriedades podem ser facilmente deduzidas das propriedades estudadas acima daquelas funcoes.
Por (8.102), tem-se
X

 z 2k+

(1)k
.
j (z) =
2 k=0 k! (k + 1 + + 1/2) 2
Pela formula de duplicacao (8.27), podemos escrever isso como
j (z) = 2

X
(1)k (k + 1 + )
k=0

Em particular, para = l


k! (2(k + 1 + ))

z 2k+ .

, vale

X
(1)k (k + l)! 2k+l
z
.
jl (z) = 2
k! (2k + 2l + 1)!
l

k=0

Rela
co
es de recorr
encia para as fun
co
es de Bessel esf
ericas

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

538/1304

Formulas de recorrencia para as funcoes de Bessel esfericas tambem podem ser obtidas daquelas
para as funcoes de Bessel listadas em (9.112)-(9.117). Analisando-as, e imediato ver que de (9.112) e
(9.113) segue facilmente que

d
x+1 j (x) = x+1 j1 (x)
dx


d
x j (x) = x j+1 (x) .
dx

De (9.114) e (9.115) segue facilmente que


xj0 (x) = xj1 (x) ( + 1)j (x)

(9.152)

xj0 (x) = j (x) xj+1 (x) .

(9.153)

(9.154)

Dessas duas relacoes segue facilmente que


j0 (x)

1
=
2

j+1 (x) =

j (x)
j1 (x)
j+1 (x)
x


1
(2 + 1)j (x) xj1 (x) ,
x

para todo . Usando (9.155), e facil ver que (9.154) pode ser reescrita como


(2 + 1) j0 (x) = ( + 1) j1 (x) j+1 (x)

(9.155)

(9.156)

para todo .

Resumindo nossas conclusoes, obtivemos que



d
x+1 j (x) = x+1 j1 (x) ,
dx


d
x j (x) = x j+1 (x) ,
dx

xj0 (x) = xj1 (x) ( + 1)j (x) ,

xj0 (x) = j (x) xj+1 (x) ,




(2 + 1) j0 (x) = ( + 1) j1 (x) j+1 (x) ,


1
(2 + 1)j (x) xj1 (x) .
j+1 (x) =
x

(9.157)
(9.158)
(9.159)
(9.160)
(9.161)
(9.162)

Expressoes analogas sao validas para as funcoes n (x).


Com o uso das relacoes de recorrencia acima e possvel obter para as funcoes de Bessel esfericas o
analogo da expressao (9.119).
A rela
c
ao entre jn e j0 , n


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

539/1304

A expressao (9.158) diz-nos que



1 d
x j (x) = x(+1) j+1 (x) .
x dx

Disso segue imediatamente que


n


1 d
x j (x) = (1)n x(+n) j+n (x) ,
x dx

valida para todo , x

en

(9.163)

. No caso particular em que = 0, obtem-se,


n
n 


sen x 
1 d
1 d
n n
n n
(j0 (x)) = (1) x
jn (x) = (1) x
,
x dx
x dx
x

valida para todo x


Rodrigues.

en


(9.164)

. A expressao (9.164) guarda certa semelhanca com as formulas de

Para as funcoes de Neumann esfericas tem-se uma expressao analoga:


n 

cos x 
1 d
n+1 n
nn (x) = (1)
x
.
x dx
x

(9.165)

Rela
co
es de ortogonalidade para as fun
co
es de Bessel esf
ericas no intervalo [0, 1]
As relacoes de ortogonalidade para as funcoes de Bessel esfericas podem ser provadas diretamente
daquelas expressas no Teorema 9.6.
+1/2

Observemos em primeiro lugar que o conjunto ZA, B que, pela definicao (9.141), e
+1/2

ZA, B

:=

0
> 0| AJ+1/2 () + BJ+1/2
() = 0

pode ser caracterizado em termos de j como







B
+1/2
0
ZA, B := > 0 A +
j () + Bj () = 0 .
2
Assim, ao lidarmos com problemas que possuem condicoes de contorno do tipo
Aj () + Bj0 () = 0
+1/2

o conjunto de s que satisfazem isso e ZAB/2, B .


Isso mostra que podemos aplicar diretamente
as conclusoes do Teorema 9.6, tomando o cuidado de
q
px
2
substituir: 1. por + 1/2, 2. J () por
j
(),
3.
(na
integral)
J
(x)
por
j (x) e 3. e




J0 () por j2()
+ j0 () . Apos algumas contas elementares, obtem-se o seguinte:

JCABarata. Curso de Fsica-Matem


atica

Captulo 9

Vers
ao de 29 de setembro de 2005.

540/1304

Teorema 9.7 Seja 0, sejam fixados certos n


umeros reais A, B com (A, B) 6= (0, 0) satisfazendo
+ 1/2 + A/B 0, caso B 6= 0 (vide Teoremas 9.2-9.5) e seja definido
+1/2

WA, B := { > 0| Aj () + Bj0 () = 0} = ZAB/2, B .


Pelo Teorema 9.5, esse conjunto e n
ao-vazio e enumer
avel. Para todos , W A, B , tem-se
" 
#
2 
Z 1
1 2

)
(
+
1
j
()

2
+ j0 () + 1
(j ())2
j (x)j (x) x2 dx
=
2
2

0
=
(9.160)



j ()j0 ()
(j ()) +
+ (j0 ())2



,
(2 + 1)
2
2
j ()j+1 () + (j+1 ()) .
(j ())
2

,
2

( + 1)
1
2


(9.166)

Essa express
ao e denominada relaca
o de ortogonalidade das funco
es de Bessel esfericas. Note que h
a
uma relaca
o de ortogonalidade para cada tripla (, A, B) com 0 e (A, B) 6= (0, 0), pois cada
tripla (, A, B) fixa o conjunto ZA, B .
o de Bessel esferica j (x).
No caso A = 1, B = 0 o conjunto W1, 0 coincide com o dos zeros da funca

o j0 (x).
No caso A = 0, B = 1 o conjunto W0, 1 coincide com o dos zeros da funca
Em particular, se 0 e k e o k-esimo zero da funca
o j (x) no intervalo (0, ), ent
ao
Z 1


(j 0 ( ))2
(j+1 (k ))2
j k x j l x x2 dx = k, l k
= k, l
.
(9.167)
2
2
0

o j0 (x) no intervalo (0, ), ent


ao
Analogamente, se 0 e k e o k-esimo zero da funca


Z 1

 2
( + 1) (j (k ))2

j k x j l x x dx = k, l 1
.
(9.168)
(k )2
2
0
p
Dessa relaca
o percebemos incidentalmente que k > ( + 1) para todo k, pois o lado esquerdo e
certamente positivo quando k = l.
2
instrutivo considerar a relacao (9.167) no caso = 0, quando j0 (x) =
E
com k > 0 inteiro. Como j00 (x) = cos(x)
senx2(x) , (9.167) esta dizendo que
x
Z

ou seja,

1
0

k, l
sen (kx) sen (lx)
dx
=
kl 2
2
Z

cos(k)
k

sen (kx) sen (lx) dx =


0

2

sen (x)
x

e, portanto, k0 = k,

1
k, l ,
2(k)2

1
k, l .
2

Essa e uma relacao bem conhecida que, evidentemente, pode tambem ser provada por meios mais
elementares.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 9

541/1304

Ap
endices
9.A

Provando (9.44) `
a For
ca Bruta

A ideia e tomar (9.42), escrever (z 2 1)l = (z 1)l (z + 1)l e aplicar a regra de Leibniz. Tudo esta
resumido nas seguintes linhas auto-explicativas, acompanhadas de uns poucos comentarios ao final:
Plm (z)

:=
=
Leibniz


(1 z 2 )m/2 dl+m  2
l
(z

1)
2l l!
dz l+m


(1 z 2 )m/2 dl+m 
l
l
(z

1)
(z
+
1)
2l l!
dz l+m


l+m 
 l+mp 

(1 z 2 )m/2 X l + m dp 
l d
l
(z

1)
(z
+
1)
2l l!
dz p
dz l+mp
p
p=0


l 
 dl+mp 

(1 z 2 )m/2 X l + m dp 
l
l
(z

1)
(z
+
1)
2l l!
dz p
dz l+mp
p
p=m




l 
(1 z 2 )m/2 X l + m
l!
l!
lp
pm
(z 1)
(z + 1)
2l l!
p
(l

p)!
(p

m)!
p=m


l 
(1 z 2 )m/2 X l + m
(l!)2
(z 1)lp (z + 1)pm
p
2l l!
(l

p)!
(p

m)!
p=m

()

()


l 
1)m (1 z 2 )m/2 X l + m
(l!)2
(1)
(z 1)lp (z + 1)pm
(1 z 2 )m
2l l!
(l

p)!
(p

m)!
p
p=m
m (z

JCABarata. Curso de Fsica-Matem


atica

pp+m

Vers
ao de 29 de setembro de 2005.

Captulo 9

542/1304


l 
(l!)2
(1)m (1 z 2 )m/2 X l + m
(z 1)lp+m (z + 1)p
p
2l l!
(l

p)!
(p

m)!
p=m

lm 
(1)m (1 z 2 )m/2 X l + m
(l!)2
(z 1)lp (z + 1)p+m
2l l!
(l

m)!
p!
p
+
m
p=0
lm
(1)m (1 z 2 )m/2 X
(l + m)! (l!)2
(z 1)lp (z + 1)p+m
2l l!
(l

p)!
(p
+
m)!
(l

m)!
p!
p=0

(1)m

lm
(l + m)! (1 z 2 )m/2 X
(l m)! (l!)2
(z 1)lp (z + 1)p+m
(l m)!
2l l!
(l

p)!
(p
+
m)!
(l

m)!
p!
p=0




lm 
l!
+ m)! (1 z 2 )m/2 X l m
l!
lp
p+m
(z 1)
(z + 1)
(1)
p
(l m)!
2l l!
(l

p)!
(p
+
m)!
p=0

 p
  lmp

lm 
d
d
+ m)! (1 z 2 )m/2 X l m
l
l
(z 1)
(z + 1)
(1)
p
lmp
p
(l m)!
2l l!
dz
dz
p=0

m (l

m (l

Leibniz

(1)m

(1)m


(l + m)! (1 z 2 )m/2 dlm
l
l
(z

1)
(z
+
1)
(l m)!
2l l!
dz lm

(l + m)! (1 z 2 )m/2 dlm 2


(l + m)! m
(z 1)l = (1)m
P (z) ,
l
lm
(l m)!
2 l!
dz
(l m)! l

como queramos provar.


p

l+mp

d
d
l
l
No ponto indicado por () acima, usamos o fato que dz
p (z 1) = 0 se p > l e dz l+mp (z 1) = 0
se l + m p > l. Ambas as condicoes juntas implicam m p l, da a mudanca nos limites da soma.
2 1)m
. Na linha seguinte
No ponto indicado por () multiplicamos toda a expressao por 1 = (1)m (z
(1z 2 )m
2
m
m
m
o fator (z 1) e escrito como (z 1) (z + 1) e distribudo dentro da soma. Fora isso, usamos
tambem que (1z12 )m (1 z 2 )m/2 = (1 z 2 )m/2 .

JCABarata. Curso de Fsica-Matem


atica

9.2

Vers
ao de 29 de setembro de 2005.

Captulo 9

543/1304

Exerccios Adicionais

E. 9.23 Exerccio. A ideia deste exerccio e provar as relacoes de ortogonalidade dos polinomios de
Legendre usando a formula de Rodrigues.
a) Usando a formula de Rodrigues para os polinomios de Legendre, expressao (9.29), pagina 497, mostre
que

xm Pn (x)dx = 0

(9.1)

para todo 0 m < n, m inteiro. Sugest


ao: integracao por partes.
b) Mostre que

para todo n

1
1

c) Mostre que

Sugest
ao: use a expressao do item b.

(x2 1)n dx = (1)n

22n+1 (n!)2
(2n + 1)!

2n+1 (n!)2
x Pn (x)dx =
.
(2n + 1)!
1
n

(9.2)

d) Usando (9.1) e (9.2) mostre a validade das relacoes de ortogonalidade


Z 1
2
n, m .
Pn (x)Pm (x)dx =
2n + 1
1
Sugest
ao: use a expressao (9.21) para os polinomios de Legendre.

Captulo 10
Alguns Problemas Selecionados de Interesse Fsico
Conte
udo
10.1 As Equa
co
es de Helmholtz e de Laplace . . . . . . . . . . . . . . . . . . . . 544
10.1.1 Problemas em Duas Dimensoes em Coordenadas Polares . . . . . . . . . . . . 546
10.1.2 Problemas em Tres Dimensoes em Coordenadas Esfericas . . . . . . . . . . . 549
10.2 O Problema da Corda Vibrante . . . . . . . . . . . . . . . . . . . . . . . . . 553
10.2.1 Corda Vibrante Homogenea . . . . . . . . . . . . . . . . . . . . . . . . . . . . 553
10.2.2 O Problema da Corda Homogenea Pendurada . . . . . . . . . . . . . . . . . . 556
10.2.3 Corda Vibrante Nao-Homogenea . . . . . . . . . . . . . . . . . . . . . . . . . 560
10.3 O Problema da Membrana Circular . . . . . . . . . . . . . . . . . . . . . . 564
10.4 O Oscilador Harm
onico na Mec
anica Qu
antica e a Equa
ca
o de Hermite 567

10.5 O Atomo
de Hidrog
enio e a Equa
ca
o de Laguerre Associada . . . . . . . 568
10.6 Propaga
ca
o de Ondas em Tanques Cilndricos . . . . . . . . . . . . . . . . 571
10.7 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 582

este captulo ilustramos alguns problemas fsicos dos quais emergem algumas das equacoes
diferenciais ordinarias que temos estudado, tais como as equacoes de Euler, de Bessel, de Legendre, de Legendre associada, de Bessel esferica, de Hermite, de Laguerre e de Laguerre associada. O estudante que estiver procurando a motivacao e a origem fsica daquelas equacoes
podera ler parcialmente a presente secao sem precisar dominar totalmente o material anteriormente
apresentado, pelo menos ate o ponto em que apresentarmos as solucoes das equacoes. Tambem evocaremos no que segue o chamado metodo de separacao de variaveis e alguns teoremas de unicidade
de solucao de equacoes diferenciais parciais. Tais assuntos sao discutidos no Captulo 11 ao qual o
estudante podera passar sem perdas, se julgar necessario.

10.1

As Equa
co
es de Helmholtz e de Laplace

Nesta secao apresentaremos alguns problemas envolvendo as equacoes diferenciais parciais de Laplace e
Helmholtz dos quais emergem, pelo metodo de separacao de variaveis, algumas das equacoes diferenciais
ordinarias e suas solucoes de que tratamos em captulos anteriores. O metodo de separacao de
variaveis e discutido na Secao 11.2, pagina 587.
A equa
c
ao de onda
A equacao de onda

2u
(~x, t) c2 u(~x, t) = 0
t2
544

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

545/1304

com c > 0, pode ser tratada pelo procedimento de separacao de variaveis, atraves do qual procuramos
solucoes independentes que sejam da forma de um produto u(~x, t) = T (t)E(~x). Por substituicao na
equacao de onda, somos rapidamente levados a` seguinte equacao:
1 T 00 (t)
E(~x)
=
.
2
c T (t)
E(~x)
Como o lado esquerdo e uma funcao somente de t e o lado direito uma funcao somente das coordenadas
espaciais ~x, a igualdade acima so e possvel se ambos os lados forem iguais a uma constante, a qual
denotaremos por 2 . Assim, conclumos que
T 00 (t) + (c)2 T (t) = 0 ,

(10.1)

E(~x) + 2 E(~x) = 0 .

(10.2)

Obtemos por esse procedimento duas equacoes, uma envolvendo apenas a funcao T , outra a funcao
E e uma incognita extra, a constante , a qual devera ser determinada pela fixacao de certas condicoes
adicionais sobre o problema, por exemplo, atraves de condicoes de contorno. Tais constantes que
aparecem quando do metodo de separacao de variaveis sao denominadas constantes de separaca
o.
A solucao da equacao temporal e bem simples:
T (t) = 1 + 2 t ,

caso = 0 ,

T (t) = 1 cos(ct) + 2 sen (ct) ,

caso 6= 0 ,

(10.3)
onde 1 , 2 , 1 e 2 sao constantes arbitrarias a serem tipicamente fixadas por condicoes iniciais.
A equa
c
ao de difus
ao
A equacao de difusao

u
(~x, t) Ku(~x, t) = 0
t
com K > 0, pode ser tratada pelo procedimento de separacao de variaveis, atraves do qual procuramos
solucoes independentes que sejam da forma de um produto u(~x, t) = T (t)E(~x). Por substituicao na
equacao de onda, somos rapidamente levados a` seguinte equacao:
E(~x)
1 T 0 (t)
=
.
K T (t)
E(~x)
Como o lado esquerdo e uma funcao somente de t e o lado direito uma funcao somente das coordenadas
espaciais ~x, a igualdade acima so e possvel se ambos os lados forem iguais a uma constante, a qual
denotaremos por 2 . Assim, conclumos que
T 0 (t) + 2 K T (t) = 0 ,
E(~x) + 2 E(~x) = 0 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

546/1304

Obtemos por esse procedimento duas equacoes, uma envolvendo apenas a funcao T , outra a funcao
E e uma incognita extra, a constante , a qual devera ser determinada pela fixacao de certas condicoes
adicionais sobre o problema, por exemplo, atraves de condicoes de contorno.
A solucao da equacao temporal e bem simples:
T (t) = 1 ,

caso = 0 ,
(10.4)

T (t) = 1 e

2 Kt

caso 6= 0 ,

onde 1 e 1 sao constantes arbitrarias a serem tipicamente fixadas por condicoes iniciais.
As equa
co
es de Helmholtz e de Laplace
Como se observa, tanto no caso da equacao de onda quanto no caso da equacao de difusao, a funcao
E(~x), que contem a dependencia espacial da funcao u(~x, t), satisfaz a equacao diferencial parcial
E(~x) + 2 E(~x) = 0 ,
com constante. No caso em que 6= 0 essa equacao diferencial parcial e denominada equaca
o de
1
2
Helmholtz . No caso = 0 temos a chamada equaca
o de Laplace
E(~x) = 0 .
Essa u
ltima equacao aparece em varios outros contextos, por exemplo na Eletrostatica.
Trataremos dessas duas equacoes em duas e tres dimensoes em coordenadas polares e esfericas,
respectivamente.

10.1.1

Problemas em Duas Dimens


oes em Coordenadas Polares

A Equa
c
ao de Laplace em duas dimens
oes em coordenadas polares
O operador Laplaciano em duas dimensoes em coordenadas polares assume a forma


1
u
1 2u
u =

+ 2 2

(10.5)

e a equacao de Laplace fica



E
1 2E
1

+ 2
= 0.

2
E agora e tomada como uma funcao de e .
O metodo de separacao de variaveis propoe procurarmos solucoes independentes dessa equacao que
sejam da forma de um produto: E(, ) = ()(). Inserindo isso na equacao de Laplace, somos
levados a
(0 ())0
00 ()
=
.
()
()
1
2

Hermann Ludwig Ferdinand von Helmholtz (1821-1894).


Pierre-Simon Laplace (1749-1827).

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

547/1304

Como o lado esquerdo e uma funcao somente de e o lado direito uma funcao somente de , a igualdade
acima so e possvel se ambos os lados forem iguais a uma constante de separacao, a qual denotaremos
por 2 . Assim, conclumos que
2 00 () + 0 () 2 () = 0 ,
00 () + 2 () = 0 .
Reconhecemos que a equacao para e uma equa
c
ao de Euler, cuja solucao geral e + ,
caso 6= 0, ou 0 ln() + 0 , caso = 0. Aqui, s e s sao constantes arbitrarias.
Conclumos que a equacao de Laplace em duas dimensoes em coordenadas polares possui solucoes
independentes da forma



E(, ) = 0 ln() + 0 0 + 0 ,
caso = 0 ,
E(, ) =



cos() + sen () ,

(10.6)

caso 6= 0 .

Acima s, s, s e s sao constantes arbitrarias a serem fixadas por condicoes adicionais a serem
impostas a` solucao. Por exemplo, se desejarmos que as solucoes sejam funcoes periodicas em de
perodo 2, entao devemos impor que 0 = 0 e que seja um inteiro.
A solucao geral da equacao de Laplace em duas dimensoes que representa funcoes periodicas de
perodo 2 em e, portanto,




X
m
m
u(, ) = 0 ln() +
m + m
m cos(m) + m sen (m) ,
m=

ou, em forma complexa,

u(, ) = 0 ln() +


X

m=


am m + bm m eim ,

onde 0 , am e bm sao constantes a serem determinadas por condicoes adicionais a serem impostas a`
solucao.
A Equa
c
ao de Helmholtz em duas dimens
oes em coordenadas polares
Devido a` forma do operador Laplaciano em duas dimensoes em coordenadas polares dada em (10.5),
a equacao de Helmholtz assume a forma


1
E
1 2E

+ 2
+ 2 E = 0 .
2


E agora e tomada como uma funcao de e .
O metodo de separacao de variaveis propoe procurarmos solucoes independentes dessa equacao que
sejam da forma de um produto: E(, ) = ()(). Inserindo isso na equacao de Helmholtz, somos
levados a
00 ()
(0 ())0
2 2
+ =
.
()
()

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

548/1304

Como o lado esquerdo e uma funcao somente de e o lado direito uma funcao somente de , a igualdade
acima so e possvel se ambos os lados forem iguais a uma constante de separacao, a qual denotaremos
por 2 . Assim, conclumos que
2 00 () + 0 () + (2 2 2 )() = 0 ,
00 () + 2 () = 0 .
Pela mudanca de variavel3 z = e definindo y(z) = y() = (), a primeira equacao acima
transforma-se em
z 2 y 00 (z) + zy 0 (z) + (z 2 2 )y(z) = 0 ,

que podemos reconhecer como sendo a equa


c
ao de Bessel de ordem .

Vemos assim que o metodo de separacao de variaveis para a equacao de Helmholtz em duas dimensoes em coordenadas polares conduz a solucoes independentes da forma E(, ) = y()()
onde as funcoes y e satisfazem as equacoes ordinarias
z 2 y 00 (z) + zy 0 (z) + (z 2 2 )y(z) = 0 ,
00 () + 2 () = 0 .
sendo z = .
Conclumos que a equacao de Helmholtz em duas dimensoes em coordenadas polares possui solucoes
independentes da forma



E(, ) = 0 J0 () + 0 N0 () 0 + 0 ,
caso = 0 ,
(10.7)



E(, ) =

J () + N ()

cos() + sen () ,

caso 6= 0 .

Acima, J sao as funcoes de Bessel de ordem e N sao as funcoes de Neumann de ordem . Fora isso,
s, s, s e s sao constantes arbitrarias a serem fixadas por condicoes adicionais a serem impostas
a` solucao.
Por exemplo, se desejarmos que as solucoes sejam funcoes periodicas em de perodo 2, entao
devemos impor que 0 = 0 e que seja um inteiro.
A solucao geral da equacao de Helmholtz em duas dimensoes que representa funcoes periodicas de
perodo 2 em e, portanto,
u(, ) =


X

m Jm () + m Nm ()

m=




m cos(m) + m sen (m) ,

ou, em forma complexa,


u(, ) =


X

m=
3

Aqui supomos 6= 0.


am Jm () + bm Nm () eim ,

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

549/1304

onde am e bm sao constantes a serem determinadas por condicoes adicionais a serem impostas a` solucao.
Recomendamos ao leitor o exerccio instrutivo de comparar as equacoes radiais obtidas acima no
caso de Laplace e de Helmholtz em duas dimensoes, assim como suas solucoes.

10.1.2

Problemas em Tr
es Dimens
oes em Coordenadas Esf
ericas

A Equa
c
ao de Laplace em tr
es dimens
oes em coordenadas esf
ericas
O operador Laplaciano em tres dimensoes em coordenadas esfericas assume a forma
 




1
u
1
1
2u
2 u
.
u = 2
r
+
( sen )
+
r r
r
sen

( sen )2 2

(10.8)

Assim, a equacao de Laplace em tres dimensoes em coordenadas esfericas fica





 

1
1
E
1
2E
2 E
r
+
( sen )
+
= 0,
r 2 r
r
sen

( sen )2 2
onde E agora e uma funcao de r, e .
O metodo de separacao de variaveis propoe procurarmos solucoes independentes dessa equacao que
sejam da forma de um produto: E(r, , ) = R(r)Y (, ). Inserindo isso na equacao de Laplace,
somos levados a




0
1
1
Y
1
2Y
(r 2 R0 (r))
=
( sen )
(, ) +
(, ) .
R(r)
Y (, ) sen

( sen )2 2
Mais uma vez constatamos que, pelo fato de o lado esquerdo ser funcao apenas de r enquanto que
o lado direito e funcao de e , a igualdade acima implica que ambos os lados devem ser iguais a
uma constante. Por conveniencia futura, escrevemos essa constante na forma ( + 1) (note que todo
n
umero complexo c pode ser escrito dessa forma, pois a equacao 2 + c = 0 sempre tem pelo menos
uma solucao). Conclumos que

1
sen

r 2 R00 (r) + 2rR0 (r) ( + 1)R(r) = 0 .


Y
1
2Y
( sen )
(, ) +
(, ) + ( + 1)Y (, ) = 0 .

( sen )2 2

(10.9)
(10.10)

Reconhecemos que a equacao para R e uma equa


c
ao de Euler, cujas solucoes sao
R(r) = 1 r + 2 r (1+) ,
R(r) = r

21

(1 ln(r) + 2 ),

caso 6= 12
caso =

(10.11)

12

Passemos agora a` equacao para Y (, ), a qual propomos novamente tratar pelo metodo de separacao de variaveis. Tomemos, entao, Y na forma de um produto Y (, ) = ()(). Somos
conduzidos a


d
00 ()
sen d
2
( sen ) () + ( + 1)( sen ) =
.
() d
d
()

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

550/1304

Mais uma vez, a igualdade acima so e possvel se ambos os lados forem iguais a uma constante, que
escrevemos na forma 2 . Ficamos com


2
d
1
d
() = 0 ,
(10.12)
sen () () + ( + 1)()
sen () d
d
( sen ())2
00 () + 2 () = 0 .
A equacao para tem por solucoes

0 + 0 ,
() =

cos() + sen () ,

(10.13)

caso = 0 ,
(10.14)
caso 6= 0 .

Claramente, se desejarmos que () seja contnua e periodica de perodo 2 devemos impor que 0 = 0 e
que seja um inteiro, ou seja, = m em cujo caso a solucao fica () = m cos(m)+m sen (m)
para todo = m (inclusive m = 0). Essa solucao pode tambem ser escrita de forma complexa
como () = am eim + bm eim para outras constantes am e bm .
A experiencia ensina que para melhor tratarmos a equacao (10.12) convem proceder a mudanca de
variavel
d
1
d
= cos ,
com
=
.
d
sen () d
Definindo tambem y() = (), ou seja, () = y(cos ), a equacao diferencial para transforma-se
em


2
d
2 dy
(1 ) () + ( + 1) y()
y() = 0 ,
d
d
1 2

ou, equivalentemente,

(1 2 )y 00 () 2y 0() + ( + 1) y()

2
y() = 0 .
1 2

Reconhecemos que se trata da equa


c
ao de Legendre associada. Por (10.14) vemos que para o
caso em que e contnua e periodica de perodo 2 devemos necessariamente ter = m . Como
discutimos quando tratamos da equacao de Legendre associada, se desejarmos tambem que y() seja
finita nos extremos 1 (ou seja, que () seja finita nos extremos = 0 e = ), devemos ter tambem
que = l , sendo que l e m relacionam-se por l m l. As solucoes para y() nesse caso sao
os polinomios de Legendre associados y() = Plm () ou, em termos de , () = Plm (cos()).


Conclumos, assim, que se desejarmos solucoes que sejam periodicas de perodo 2 em e finitas
nos extremos = 0 e = , temos


Y (, ) = Plm (cos()) m cos(m) + m sen (m)
ou, em forma complexa,



Y (, ) = Plm (cos()) am eim + bm eim .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

551/1304

Constatamos que o lado direito e uma combinacao linear dos harmonicos esfericos Y lm (, ) e Ylm (, ),
definidos em (9.65).
Assim, retornando a` E(r, , ), conclumos que sob as condicoes mencionadas a equacao de Laplace
tem solucoes independentes da forma



l
E(r, , ) = r + l+1 Ylm (, ) ,
r
com l , m
e l m l, e sendo constantes. Acima, adotamos para a parte radial a
primeira solucao de (10.11), pois = l e, portanto, 6= 21 .


A solucao geral da equacao de Laplace em tres dimensoes que representa funcoes periodicas de
perodo 2 em e finitas nos extremos = 0 e = e, portanto,
u(r, , ) =


X
l
X
l=0 m=l

l, m
l, m r + l+1
r
l

Ylm (, ) .

Aqui, l, m e l, m sao constantes a serem determinadas por condicoes adicionais a serem impostas a`
solucao.
Expans
ao de multipolos
Se soubermos a priori que a solucao u(r, , ) converge a 0 para r , podemos supor que as
constantes l, m , acima, se anulam. Nesse caso a solucao reduz-se a
X
l
X
l, m m
u(r, , ) =
Y (, ) .
r l+1 l
l=0 m=l

Essa situacao ocorre, por exemplo, na Eletrostatica quando lidamos com o problema de determinar o
potencial eletrico produzido por uma distribuicao de cargas eletricas estaticas limitadas a uma regiao
finita. Nesse caso a expansao acima e denominada expans
ao de multipolos. O mesmo tipo de situacao
ocorre se desejarmos determinar o potencial gravitacional produzido por uma distribuicao de materia
limitada a uma regiao finita (por exemplo, um planeta).
Se soubermos a priori, por exemplo, por consideracoes de simetria, que a funcao u(r, , ) nao
depende da variavel , entao os termos da soma com m 6= 0 devem ser todos nulos. Como Y l0 (, ) =
q
2l+1
Pl (cos()),
4

onde Pl sao os polinomios de Legendre, obtemos apenas


u(r, ) =


X
l=0

l
l r + l+1
r
l

Pl (cos())

(10.15)

para certas constantes l e l . Novamente, se tambem soubermos que a solucao u(r, ) converge a 0
para r , podemos supor que as constantes l , acima, anulam-se, e obtemos para a expansao de
multipolos

X
l
Pl (cos()) .
(10.16)
u(r, ) =
r l+1
l=0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

552/1304

Historicamente, o problema que conduziu Legendre aos polinomios de Legendre foi o de determinar
o potencial gravitacional de uma distribuicao de materia limitada a uma regiao finita e simetrica em
relacao ao eixo z. Isso conduziu-o a` funcao geratriz dos polinomios de Legendre (expressao (9.35),
pagina 499), da qual ele derivou a expressao para os Pl (cos()) como polinomios em cos() e, da, a`
u
ltima expressao.
A Equa
c
ao de Helmholtz em tr
es dimens
oes em coordenadas esf
ericas
Devido a` forma assumida pelo operador Laplaciano, expressa em (10.8), a equacao de Helmholtz
em tres dimensoes em coordenadas esfericas assume a forma
 




1
E
1
2E
1
2 E
+ 2 E = 0 ,
r
+
( sen )
+
2
2
2
r r
r
sen

( sen )
onde E agora e uma funcao de r, e .
O metodo de separacao de variaveis propoe procurarmos solucoes independentes dessa equacao que
sejam da forma de um produto: E(r, , ) = R(r)Y (, ). Inserindo isso na equacao de Helmholtz,
somos levados a




0
(r 2 R0 (r))
2Y
1
1
1
Y
2 2
+ r =
(, ) +
(, ) .
( sen )
R(r)
Y (, ) sen

( sen )2 2
Mais uma vez constatamos que, pelo fato de o lado esquerdo ser funcao apenas de r enquanto que
o lado direito e funcao de e , a igualdade acima implica que ambos os lados devem ser iguais a
uma constante. Por conveniencia futura, escrevemos essa constante na forma ( + 1) (note que todo
n
umero complexo c pode ser escrito dessa forma, pois a equacao 2 + c = 0 sempre tem pelo menos
uma solucao). Conclumos que


r 2 R00 (r) + 2rR0 (r) + 2 r 2 ( + 1) R(r) = 0 ,
(10.17)
1
sen


2Y
1
Y
(, ) +
(, ) + ( + 1)Y (, ) = 0 .
( sen )

( sen )2 2

(10.18)

Reconhecemos que a equacao para Y (, ) e precisamente a mesma que obtivemos no caso da


equacao de Laplace em tres dimensoes em coordenadas esfericas. Assim, se desejarmos solucoes para
Y (, ) que sejam periodicas de perodo 2 em e finitas nos extremos = 0 e = , teremos que
fixar = l
e Y (, ) sera uma combinacao linear de Ylm (, ) e Ylm (, ), onde m com
l m l.


Concentremo-nos agora na equacao radial. Pela mudanca de variavel 4 z = r e definindo y(z) =


y(r) = R(r), a equacao (10.17) acima transforma-se em
z 2 y 00 (z) + 2zy 0 (z) + (z 2 ( + 1))y(z) = 0 ,
que podemos reconhecer como sendo a equa
c
ao de Bessel esf
erica de ordem . Como mencionamos,
estamos interessados primordialmente no caso em que = l . Obtemos, nesse caso


R(r) = a jl (r) + b nl (r),


4

Aqui supomos 6= 0.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

553/1304

onde a e b sao constantes e jl e nl sao as funcoes de Bessel esfericas de ordem l e de Neumann esfericas
de ordem l, respectivamente.
Retornando a E(r, , ), conclumos que, sob as hipoteses delineadas acima, a equacao de
Helmholtz em tres dimensoes possui solucoes independentes da forma


E(r, , ) = jl (r) + nl (r) Ylm (, ) ,
com l

,m

e l m l, e sendo constantes.

A solucao geral da equacao de Helmholtz em tres dimensoes que representa funcoes periodicas de
perodo 2 em e finitas nos extremos = 0 e = e, portanto,
u(r, , ) =

X
l

X
l=0 m=l


l, m jl (r) + l, m nl (r) Ylm (, ) .

Aqui, l, m e l, m sao constantes a serem determinadas por condicoes adicionais a serem impostas a`
solucao.
Recomendamos ao leitor o exerccio instrutivo de comparar as equacoes radiais obtidas acima no
caso de Laplace e de Helmholtz em tres dimensoes, assim como suas solucoes.

10.2

O Problema da Corda Vibrante

Se considerarmos o problema de determinar o movimento transversal, no regime de pequenas oscilacoes,


de uma corda de comprimento L, de densidade linear de massa (x), com 0 x L, submetida a uma
tensao longitudinal (x), chegaremos a` equacao diferencial


2u
u

(x) 2
(x)
= 0,
(10.19)
t
x
x
onde u(x, t) representa o deslocamento transversal, no instante de tempo t, do ponto x da corda.
A expressao acima e conseq
uencia, essencialmente, da segunda lei de Newton e sua deducao pode
ser acompanhada, por exemplo, em [33]. O estudo das solucoes de (10.19) e um classico problema
de Mecanica dos Meios Deformaveis e da Teoria das Equacoes Diferenciais, tendo suas origens nos
trabalhos pioneiros de Euler5 e Daniel Bernoulli6 na primeira metade do sec. XVIII. O metodo de
separacao de variaveis, o metodo de expansao em modos normais, e outras ideias que tiveram sua
aplicacao estendida a outros campos, originaram-se daqueles estudos.

10.2.1

Corda Vibrante Homog


enea

O caso mais simples da equacao (10.19) e aquele no qual (x) 0 e (x) 0 sao constantes, em cujo
caso (10.19) assume a forma
r
2
2u
0
2 u
.
(10.20)

c
=
0
,
c
=
t2
x2
0
5
6

Leonhard Euler (1707-1783).


Daniel Bernoulli (1700-1782).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

554/1304

Uma corda com (x) 0 constante e dita ser uma corda homogenea.

Na situacao em que a corda encontra-se presa em suas extremidades localizadas em x = 0 e x = L,


as condicoes de contorno a serem impostas sao u(0, t) = 0 para todo t e u(L, t) = 0 para todo t.
Tipicamente considera-se tambem condicoes iniciais que fixam a posicao e velocidade transversais da
corda em t = 0: u(x, 0) = u0 (x) e u
(x, 0) = v0 (x), sendo u0 e v0 duas funcoes dadas, dotadas de
t
propriedades convenientes.

Para encontrar as solucoes de (10.20) satisfazendo as condicoes iniciais e de contorno mencionadas


acima, procede-se pelo metodo de separacao de variaveis, procurando primeiramente solucoes particulares que sejam da forma u(x, t) = T (t)U (x). Inserindo em (10.20), obtem-se
U 00 (x)
1 T 00 (t)
=
.
c2 T (t)
U (x)
Essa igualdade so e possvel se ambos os lados forem iguais a uma constante de separacao, que denotamos por 2 . Chegamos com isso a
T 00 (t) + 2 c2 T (t) = 0 ,

(10.21)

U 00 (x) + 2 U (x) = 0 .

(10.22)

As solucoes da primeira equacao, naturalmente, sao


T (t) = a0 t + b0 ,

caso = 0 ,

T (t) = a1 cos(ct) + b1 sen (ct) ,

(10.23)
caso 6= 0 .

(10.24)

Para = 0 a equacao (10.22) reduz-se a U 00 (x) = 0, cuja solucao e U (x) = c1 x + c2 . Como desejamos
que U (0) = U (L) = 0, de modo que u(x, t) = T (t)U (x) satisfaca as condicoes de contorno, obtem-se
c1 = c2 = 0, ou seja, obtem-se a solucao trivial U (x) 0, o que corresponde a uma corda eternamente
parada. O caso interessante, portanto, esta em 6= 0.
No caso 6= 0, as solucoes de (10.22) sao, como e bem conhecido,
U (x) = 1 cos(x) + 2 sen (x) .
A imposicao que U (0) = 0 implica 1 = 0, levando a U (x) = 2 sen (x). A imposicao que U (L) = 0
implica L = n, com n  (tomar 2 = 0 conduz novamente a` solucao trivial U (x) 0) e, assim,
U (x) = Un (x) = 2 sen nx
, n . Em verdade, podemos nos restringir a ns positivos nao-nulos,
L
i.e., n = 1, 2, 3, . . ., pois para n = 0 tem-se U0 (x) 0 (solucao trivial) e Un (x) = Un (x), mostrando
que as solucoes com Un (x) e Un (x) nao sao independentes.

nx
Resumindo, para cada n = 1, 2, , 3, . . . temos n = n
e
U
(x)
=

sen
. Para tais valores de
n
2
L
L
nct
nct
a solucao (10.24) fica a1 cos L + b1 sen L , e as solucoes particulares para u(x, t) = T (t)U (x)
ficam
 nx 
,
un (x, t) = [an cos (n t) + bn sen (n t)] sen
L
n = 1, 2, 3, . . ., onde
nc
n :=
L

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

555/1304

(aqui, absorvemos a constante 2 dentro das constantes an e bn , as quais ainda estao indeterminadas e
podem depender de n).
Chegamos ate aqui com o metodo de separacao de variaveis. Evocando o princpio de sobreposicao,
obtemos uma solucao mais geral de (10.20) somando as solucoes acima:
u(x, t) =

[an cos (n t) + bn sen (n t)] sen

n=1

 nx 
L

 nx 
X
u
(x, t) =
[an n sen (n t) + bn n cos (n t)] sen
.
t
L
n=1

A imposicao das condicoes iniciais u(x, 0) = u0 (x) e


velocidade da corda em t = 0, conduz a

u0 (x) =

an sen

n=1

v0 (x) =

u
(x,
t

 nx 
L

bn n sen

n=1

(10.25)

(10.26)

0) = v0 (x), que fixam posicao e

(10.27)

 nx 
L

(10.28)

Para invertermos essas relacoes, expressando as constantes an em termos de u0 e as constantes bn


em termos de v0 , fazemos uso das bem-conhecidas relacoes de ortogonalidade da funcao seno:
Z

sen (my) sen (ny) dy =


m, n .
m, n = 1, 2, 3, . . . .
2
0

Assim, multiplicando (10.27) por sen mx
e integrando de 0 a L, obtemos
L
Z

sen
0

 mx 
L

u0 (x) dx =

an

n=1

sen
0

 mx 
L

y=x/L

ou seja,
an

2
=
L

sen
0

sen

 nx 
L

LX
An
n=1

nx0
L

dx

sen (my) sen (ny) dy =


0

u0 (x0 ) dx0

para todo n = 1, 2, 3, . . .. De forma totalmente analoga, obtem-se de (10.28)






Z L
Z L
2
2
nx0
nx0
0
0
bn =
v0 (x ) dx =
v0 (x0 ) dx0
sen
sen
n L 0
L
nc 0
L
para todo n = 1, 2, 3, . . ..

L
Am ,
2

(10.29)

(10.30)

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

556/1304

As fun
co
es de Green para as condi
co
es iniciais
Usando (10.29)-(10.29) podemos reescrever (10.25) como
Z

u(x, t) =

L
0

G(x, t, x )u0 (x ) dx +
0

H(x, t, x0 )v0 (x0 ) dx0 ,

(10.31)

onde, formalmente,

X
2
0
sen
G(x, t, x ) =
L
n=1

X
2
sen
H(x, t, x ) =
nc
n=1
0

nx
L

nx
L

sen

sen

nx0
L

nx0
L

cos

sen

nct
L

nct
L

sao denominadas funcoes de Green7 para as condicoes iniciais do problema em questao. Note-se que,
tambem em um sentido formal,
H
(x, t, x0 ) .
G(x, t, x0 ) =
t
A importancia de (10.31) esta em expressar a solucao diretamente em termos das condicoes iniciais u 0
e v0 . As funcoes G e H contem em si a informacao de como os valores das condicoes iniciais no ponto
x0 influenciam a solucao no ponto x no instante de tempo t.

10.2.2

O Problema da Corda Homog


enea Pendurada

Nosso proposito aqui e o de aplicar a equacao (10.19) para determinar o movimento de uma corda,
ou barbante, homogenea (ou seja, de densidade constante) e de comprimento L que esteja pendurada
por uma das suas extremidades em um campo gravitacional constante (por exemplo, o da superfcie
da Terra), a outra extremidade sendo mantida livre. Cada ponto da corda estara sujeito a uma tensao
igual ao peso do trecho de corda abaixo de si.
Para fixar ideias, vamos denotar por z a coordenada vertical e supor que a corda, quando parada,
localize-se no intervalo 0 z L, estando presa no ponto z = L, apenas. A funcao u(z, t) representara
o deslocamento horizontal da corda, digamos, no plano xz 8 , do ponto z no instante de tempo t. O
ponto da corda situada a` altura z sustenta o peso do trecho de corda situado abaixo de si, ou seja,
entre 0 e z. Como a corda e homogenea, esse peso e gz, onde g e a aceleracao da gravidade. Assim,
para a tensao (z) tem-se (z) = gz e o problema que queremos resolver e o de determinar a solucao
2

da equacao diferencial t2u z


gz u
= 0, ou seja,
z


u
2u

z
= 0,
(10.32)
g
t2
z
z
7

George Green (1793-1841).


Movimentos no plano yz podem ser tratados tambem mas, por simplicidade, consideramos apenas esse caso mais
simples.
8

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

557/1304

para 0 z L, submetida a` condicao de contorno u(L, t) = 0 para todo t e a certas condicoes iniciais
(z, 0) = v0 (z) que fixam posicao e velocidade transversal de cada ponto da corda
u(z, 0) = u0 (z) e u
t
em t = 0.
Comecemos seguindo o metodo de separacao de variaveis e procuremos solucoes particulares na
forma de um produto u(z, t) = T (t)U (z). Inserindo isso em (10.32), obtemos facilmente
1 T 00 (t)
(zU 0 (z))0
=
.
g T (t)
U (z)
Essa igualdade so e possvel se ambos os lados forem iguais a uma constante de separacao, que denotamos por 2 . Chegamos com isso a
T 00 (t) + 2 gT (t) = 0 ,

(10.33)

zU 00 (z) + U 0 (z) + 2 U (z) = 0 .

(10.34)

As solucoes da primeira equacao, naturalmente, sao


T (t) = a0 t + b0 ,

caso = 0 ,

T (t) = a1 cos( gt) + b1 sen ( gt) ,

caso 6= 0 .

Para = 0 a equacao (10.34) reduz-se a zU 00 (z) + U 0 (z) = 0, cuja solucao e U (z) = c1 ln(z) + c2 .
Como desejamos que U (0) seja finita (o deslocamento da corda nao pode divergir em nenhum ponto),
devemos impor c1 = 0 e, portanto, U (z) = c2 . Porem, como u(L, t) = 0 para todo t, devemos impor
U (L) = 0. Assim, c2 = 0 tambem e obtemos apenas a solucao trivial U (z) = 0, o que corresponde a
uma corda eternamente parada. O caso interessante, portanto, esta em 6= 0.
A equacao (10.34) para 6= 0 pode ser transformada em uma equacao conhecida atraves da mudanca
de variaveis

= 42 z ,
U (z) = y() = y ( 42 z) ,

com a qual obtemos


2 y 00 () + y 0() + 2 y() = 0 .
E. 10.1 Exerccio. Mostre isso!

Essa equacao, como se constata, e a equacao de Bessel de ordem zero: = 0. Assim, suas solucoes
sao
y() = 1 J0 () + 2 N0 () ,
J0 sendo a funcao de Bessel de ordem 0 e N0 sendo a funcao de Neumann de ordem 0. Isso significa,
entao, que

U (z) = 1 J0 (2 z) + 2 N0 (2 z) .

A solucao acima tem por particularidade que se 2 6= 0 o termo N0 (2 z) diverge em z = 0. Esse


comportamento nao e aceitavel, obviamente, de modo que devemos impor9 2 = 0.
9

Podemos interpretar a condica


o de finitude da soluca
o em z = 0 como uma outra condica
o de contorno a ser imposta,
juntamente a
` condica
o u(L, t) = 0, para o outro extremo da corda.

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

558/1304

Chegamos dessa forma a` solucao U (z) = J0 (2 z) (adotando aqui 1 = 1), para


a qual devemos
impor a condicao de contorno u(L, t) = 0, ou seja, U (L) = 0. Isso implica que 2 L deve ser um dos
zeros k0 , k , k 1, da funcao de Bessel J0 em + . Assim, conclumos que


=
e dessa forma, para 0 z L,
Uk (z) = J0

k0

k0
,
2 L

r 
z
,
L

k = 1, 2, 3, 4, . . . ,

representam solucoes de (10.34) que satisfazem as condicoes de contorno requeridas. Tem-se, entao,
que
 r 
z
uk (z, t) = [ak cos (k t) + bk sen (k t)] J0 k0
, k = 1, 2, 3, 4, . . . ,
L
com
r
k0 g
k :=
,
2 L

sao solucoes particulares da equacao de onda (10.32) que satisfazem as condicoes de contorno p
requeridas.

0
Acima, ak e bk sao constantes a serem determinadas. Cada funcao cos (k t + 0 ) J0 k Lz , k =
1, 2, 3, 4, . . ., representa um modo de vibraca
o da corda pendurada.
A solucao geral da equacao de onda (10.32) que satisfaz as condicoes de contorno requeridas e dada

por
u(z, t) =

[ak cos (k t) + bk sen (k t)] J0

k=1

k0

r 
z
,
L

X
u
(z, t) =
[ak k sen (k t) + bk k cos (k t)] J0 k0
t
k=1

(10.35)

r 
z
.
L

Assim, a imposicao das condicoes iniciais u(z, 0) = u0 (z) e u


(z, 0) = v0 (z), que fixam posicao e
t
velocidade da corda em t = 0, conduz a
 r 

X
z
u0 (z) =
ak J0 k0
,
(10.36)
L
k=1
v0 (z) =

X
k=1

b k k J0

k0

r 
z
.
L

(10.37)

Para determinarmos as constantes ak em termos de u0 e as constantes bk em termos de v0 faremos


uso das relacoes de ortogonalidade (9.144), pagina 534, para as funcoes de Bessel J 0 :
Z 1
2


(J1 (k0 ))
0
0
.
(10.38)
J0 k x J0 l x x dx = k, l
2
0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

559/1304

p 
Multiplicando ambos os lados de (10.36)-(10.37) por J0 l0 Lz e integrando-se em z entre 0 e L,
obtem-se
Z L  r 
Z L  r   r 

X
z
z
z
0
ak
J0 l
u0 (z) dz =
J0 l0
J0 k0
dz ,
L
L
L
0
0
k=1

J0
0

r 
r
Z L  r   r 
X
1
z
g
z
z
l0
J0 l0
v0 (z) dz =
bk k0
J0 k0
dz .
L
2 L k=1
L
L
0

Agora,
Z

J0
0

l0

r   r 
z
z
J0 k0
dz
L
L

z
Z
L
=
2L

x=



J0 k0 x J0 l0 x x dx

(10.38)

L J1 (k0 )

2

k, l .

Assim, conclumos que


1

al =

L (J1 (k0 ))

J0
0

bl =
para todos l

2
l0 gL (J1 (l0 ))

l0

r 
z
u0 (z) dz ,
L

J0
0

l0

r 
z
v0 (z) dz ,
L

(10.39)

(10.40)

, l 1.

A solucao obtida acima satisfaz as condicoes de contorno e as condicoes iniciais propostas. A


Proposicao 11.7, pagina 602, garante que a solucao assim obtida e a u
nica solucao do problema, o que
a posteriori, justifica todo o nosso proceder. Note o leitor que as condicoes de contorno do problema
tratado acima correspondem a`s condicoes de contorno do tipo IV da Proposicao 11.7, pois a corda esta
fixa em z = L e a tensao anula-se em z = 0. Com isso, o problema de determinar o movimento da corda
pendurada a partir de condicoes iniciais como acima esta completamente resolvido. Esse problema foi
um dos primeiros nos quais surgiram funcoes de Bessel como solucao. Ele foi tratado pela primeira vez
em 1732 por D. Bernoulli1011 .
As fun
co
es de Green para as condi
co
es iniciais
Usando (10.39)-(10.40) podemos reescrever (10.35) como
u(z, t) =
10

L
0

G(z, t, z )u0 (z ) dz +
0

H(z, t, z 0 )v0 (z 0 ) dz 0 ,

(10.41)

Daniel Bernoulli (1700-1782).


Em verdade, de acordo com os coment
arios hist
oricos de [62], D. Bernoulli n
ao incluiu a dependencia temporal na sua
soluca
o nem aplicou o princpio de sobreposica
o para somar os v
arios modos de vibraca
o. Como comentamos a
` p
agina
265, ainda que conhecido anteriormente, o princpio de sobreposica
o para a resoluca
o de equaco
es diferenciais lineares
homogeneas s
o se tornou de uso corrente sob a influencia de Helmholtz, no sec. XIX.
11

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

560/1304

onde

G(z, t, z 0 ) :=

J0

k=1

H(z, t, z ) :=

2J0

k=1

r !
z0
k0
 0r 
L
k g
t ,
cos

0 2
2 L
L J1 (k )

r 
z
0
k
J0
L

r !
r 
z
z0
k0
J0 k0
 0r 
L
L
k g
sen
t ,
p

2
2 L
k0 gL J1 (k0 )

sao as funcoes de Green para as condicoes iniciais do problema em questao. Note-se tambem que,
formalmente,
H
G(z, t, z 0 ) =
(z, t, z 0 ) .
t
A importancia de (10.41) esta em expressar a solucao diretamente em termos das condicoes iniciais u 0
e v0 . As funcoes G e H contem em si a informacao de como os valores das condicoes iniciais no ponto
z 0 influenciam a solucao no ponto z no instante de tempo t.

10.2.3

Corda Vibrante N
ao-Homog
enea

Vamos agora aplicar a equacao (10.19) para determinar o movimento de uma corda nao-homogenea (ou
seja, cuja densidade depende da posicao) e de comprimento L que esteja fixa em suas extremidades,
assumindo tambem que a tensao seja constante ( (x) 0 ). Sob essas hipoteses (10.19) assume a
forma
2u
2u
(10.42)
(x) 2 0 2 = 0 .
t
x
Para encontrar as solucoes de (10.42) satisfazendo as condicoes iniciais e de contorno, procederemos
novamente pelo metodo de separacao de variaveis, procurando primeiramente solucoes particulares que
sejam da forma u(x, t) = T (t)U (x). Inserindo em (10.20), obtem-se
1 T 00 (t)
1 U 00 (x)
=
.
0 T (t)
(x) U (x)
Essa igualdade so e possvel se ambos os lados forem iguais a uma constante de separacao, que denotamos por 2 . Chegamos com isso a
T 00 (t) + 2 0 T (t) = 0 ,

(10.43)

U 00 (x) + 2 (x)U (x) = 0 .

(10.44)

As solucoes da primeira equacao, naturalmente, sao


T (t) = a0 t + b0 ,

caso = 0 ,

T (t) = a1 cos( 0 t) + b1 sen ( 0 t) ,

(10.45)
caso 6= 0 .

(10.46)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

561/1304

Para = 0 a equacao (10.44) reduz-se a U 00 (x) = 0, cuja solucao e U (x) = c1 x + c2 . Como desejamos
que U (0) = U (L) = 0, de modo que u(x, t) = T (t)U (x) satisfaca as condicoes de contorno, obtem-se
c1 = c2 = 0, ou seja, obtem-se a solucao trivial U (x) 0, o que corresponde a uma corda eternamente
parada. Novamente, o caso interessante, portanto, esta em 6= 0.

A resolucao de (10.44) depende, obviamente, da funcao (x). No que segue assumiremos que essa
funcao e da forma (x) = 0 + x, onde 0 e sao constantes. Essa e uma primeira correcao (linear)
ao caso de constante, que tratamos acima.
A eq. (10.44) torna-se, portanto,
U 00 (x) + 2 (0 + x)U (x) = 0 .

(10.47)

Com a mudanca de variaveis = 0 + x, U (x) = V () = V (0 + x), essa equacao assume a forma


V 00 () + 2 V () = 0 ,
onde = /. Trata-se de uma equacao de Airy, cujas solucoes podem ser escritas em termos de
funcoes de Bessel J1/3 (vide pagina 439):


 p
 p
p
p
2
2
V () = A J1/3
2 3 + B J1/3
2 3 ,
3
3
A e B sendo constantes. Assim,





p
p
2
2p 2
(0 + x) AJ1/3
(0 + x)3 + BJ1/3
2 (0 + x)3
U (x) =
.
3
3

(10.48)

O caso mais simples e aquele no qual 0 = 0 com > 0. Ficamos com


 p 
 p 

2
2
3
x + B xJ1/3
x3 .
U (x) = A xJ1/3
3
3

A e B sendo constantes.
Pela expressao (8.118), pagina 437,
as funcoes de Bessel, a funcao

que define

2 3/2
2 3/2
xJ1/3 3 x
anula-se em x = 0, enquanto que a funcao xJ1/3 3 x
assume em x = 0 um valor
nao-nulo. Assim, a imposicao da condicao de contorno U (x) = 0 implica B = 0 e, portanto,
 p 

2
x3 .
U (x) = A xJ1/3
3
p
(1/3)
(1/3)
A imposicao da condicao de contorno U (L) = 0 implica 32 L3 = k , onde k
e o k-esimo zero
de J1/3 em + .


Assim,
(1/3)

e
U (x) = Uk (x) = Ak

3
= k := pk
2 L3

x
J1/3
L

2 p 3
k x
3

= Ak

x
J1/3
L

(1/3)
k

r  !
x 3
L

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

562/1304

ambas validas para todo k = 1, 2, 3, . . ., Ak sendo constantes.


Obtemos para u(x, t) a solucao geral expressa em termos de uma serie de modos normais:
r  !

r x
X

x 3
(1/3)
ak cos(k 0 t) + bk sen (k 0 t)
J1/3 k
u(x, t) =
L
L
k=1
=


X

ak cos (k t) + bk sen (k t)

k=1

sendo

3 (1/3)
k := k
2

Naturalmente, segue disso que

r x

(1/3)

J1/3

u0 (x) =

ak

k=1

v0 (x) =

k b k

k=1

x
J1/3
L

x
J1/3
L

Multiplicando a primeira das expressoes acima por


L, obtemos
Z L
 x 3/2
J1/3
u0 (x)
L
0

(1/3)

r  !
x 3

k=1

y=x/L

ak

ak L

k=1

u=y 3/2

 x 2

J1/3

1
2

y J1/3
0

X
2ak L
k=1

(9.144)

1
0

(1/3)

r  !
x 3
L

(10.49)

u
(x,
t

(1/3)

r  !
x 3
L


x 3/2
L

J1/3

(1/3)
l

.
q


x 3
L

e integrando de 0 a

dx

0) = v0 (x), tem-se
r  !
x 3
(1/3)
,
k
L

Dessa forma, impondo condicoes iniciais u(x, 0) = u0 (x),


r

0
.
L3


r x
X
u
k ak sen (k t) + k bk cos (k t)
(x, t) =
J1/3
t
L
k=1

r  !
x 3

(1/3)

(1/3)
k

r  !
x 3
L

J1/3

(1/3)

r  !
x 3


p 
p 
(1/3)
3
y J1/3 l
y 3 dy





(1/3)
(1/3)
u J1/3 k u J1/3 l u du


2
al L  0  (1/3) 2
al L 
(1/3)
J2/3 l
=
J1/3 l
.
3
3

dx

JCABarata. Curso de Fsica-Matem


atica

Disso, obtemos
3

2
(1/3)
L J2/3 l

al =

e, analogamente,
bl =

3


(1/3)

l L J2/3 l
para todo l = 1, 2, 3, . . ..

2

L
0

Captulo 10

563/1304

s 
 0 3/2
3
x
x0
(1/3)
0

dx0
J1/3 l
u0 (x )
L
L

L
0

Vers
ao de 29 de setembro de 2005.

s 
 0 3/2
3
x
x0
(1/3)
v0 (x0 )
dx0
J1/3 l
L
L

As fun
co
es de Green para as condi
co
es iniciais
Reunindo os resultados acima, podemos escrever
Z L
Z
0
0
0
0
u(x, t) =
G(x, t, x ) u0 (x ) x dx +
0

com

G(x, t, x0 ) = 3

x
J1/3
L

k=1

H(x, t, x ) = 3

X
k=1

x
J1/3
L

(1/3)

H(x, t, x0 ) v0 (x0 ) x0 dx0 ,

(10.50)

s 
3
x0
(1/3)
J1/3 k


r
L
L
L
0
3 (1/3)

t ,
cos


2
2 k
L3
(1/3)
2
L J2/3 k

r  ! r
x 3
x0

s 
3
x0
(1/3)
(1/3)
k
J1/3 k


r
L
L
L
3 (1/3)
0
sen

t ,
2


2 k
L3
(1/3)
2
k L J2/3 k
r  ! r
x0
x 3

sendo as funcoes de Green para as condicoes iniciais do problema em questao. Mais uma vez, vale
formalmente
H
(x, t, x0 ) .
G(x, t, x0 ) =
t
Nota. Ha duas razoes para usarmos a medida de integracao x0 dx0 em (10.50) e nao apenas a medida dx0 .
Primeiro, obtem-se dessa forma funcoes G e H simetricas pela troca x x0 (como se ve explicitamente
nas expressoes acima). Segundo, como temos 0 = 0, (10.44) e da forma U 00 (x) + 2 xU (x) = 0
e estamos, portanto, lidando com um problema de Sturm-Liouville com r(x) = x (para a teoria de
Sturm-Liouville, vide Captulo 12, pagina 606). Ora, em problemas de Sturm-Liouville a medida
natural de integracao e r(x0 )dx0 , para a qual valem as relacoes de ortogonalidade das autofuncoes, da
ser natural a escolha que fizemos.
A importancia de (10.50) esta em expressar a solucao diretamente em termos das condicoes iniciais
u0 e v0 . As funcoes G e H contem em si a informacao de como os valores das condicoes iniciais no
ponto x0 influenciam a solucao no ponto x no instante de tempo t.

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

564/1304

*
E. 10.2 Exerccio. Retornando a (10.48) considere agora o caso 0 6= 0, 6= 0, e, segundo os passos de
acima, obtenha a solucao do problema em termos de condicoes iniciais e as funcoes de Green. (Dispense-se
de escrever explitamente os coeficientes das relacoes de ortogonalidade. Calcula-los e muito trabalhoso!).
6

10.3

O Problema da Membrana Circular

Com o que obtivemos na Secao 10.1, pagina 544, sobre a equacao de Helmholtz em duas dimensoes em
coordenadas polares podemos abordar o problema de determinar o movimento vibratorio, a partir de
uma condicao inicial, de um tambor, ou membrana, circular de raio R, homogeneo, cujas bordas sao
fixas. Matematicamente, isso consiste em determinar as solucoes da equacao de onda dentro de um
disco de raio R > 0 no plano bidimensional, ou seja, da equacao
2u
(~x, t) c2 u(~x, t) = 0 ,
t2

(10.51)

com c > 0, sendo ~x restrito a` regiao k~xk R, com condicoes de contorno u(~x, t) = 0 para todo t e
(~x, 0) = v0 (~x)
para todo ~x satisfazendo k~xk = R e com certas condicoes iniciais u(~x, 0) = u 0 (~x) e u
t
para certas funcoes u0 (~x) e v0 (~x) convenientes.
Pelo que apresentamos acima, solucoes particulares da equacao de Helmholtz correspondente em
coordenadas polares sao (por simplicidade escolhemos a solucao complexa) da forma


am Jm () + bm Nm () eim ,

onde am e bm sao constantes12 . Como esperamos que a solucao nao apresente divergencias em = 0,
devemos ter bm = 0. A condicao de contorno que impoe que a solucao deve anular-se em = R conduz
a Jm (R) = 0, ou seja, = km /R, onde km e o k-esimo zero da funcao de Bessel Jm (x) para x > 0.
Isso fixa os valores da constante de separacao . Para cada k a solucao da equacao temporal (10.1) fica
 m 
 m 
k c
k c
T (t) = 1 cos
t + 2 sen
t .
R
R
Assim, uma solucao particular da equacao de onda satisfazendo as condicoes de contorno e
 m 
 m 

 m 
k ct
k
k ct
+ bk, m sen
Jm
eim ,
ak, m cos
R
R
R
ak, m e bk, m sendo constantes. Cada uma dessas funcoes, para k
vibraca
o da membrana circular de raio R.
12

em

, representa um modo de

Caso = 0, a u
nica soluca
o da equaca
o de Laplace que e n
ao-singular em = 0 e anula-se em = R e a soluca
o
identicamente nula. Vide soluca
o da equaca
o de Laplace em duas dimens
oes dada acima.

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

565/1304

Pelo princpio de sobreposicao (ou seja, pela linearidade e homogeneidade da equacao (10.51) e das
condicoes de contorno consideradas), a solucao geral u da equacao de onda satisfazendo as condicoes
de contorno e sua derivada temporal u
sao dadas por
t
u(, , t) =

X
X

ak, m cos

k=1 m=

km ct
R

+ bk, m sen

km ct
R



Jm

km
R

eim ,

(10.52)


 m 
 m 
 m 

X
X
ak, m km c
bk, m km c
u
k ct
k ct
k
(, , t) =

sen
cos
+
Jm
eim .
t
R
R
R
R
R
k=1 m=
aqui que entram as
As constantes ak, m e bk, m devem ser determinadas pelas condicoes iniciais. E
im
relacoes de ortogonalidade das funcoes de Bessel e das funcoes e .
As condicoes iniciais impoem (tomando t = 0 nas duas equacoes acima) que
 m0 

X
X
k 0
0
eim ,
u0 (, ) =
a k 0 , m 0 Jm 0
R
k 0 =1 m0 =
 m0 
0

X
X
bk0 , m0 km0 c
k 0
0
v0 (, ) =
eim .
Jm 0
R
R
0
0
k =1 m =

Multiplicando ambos os lados de ambas as express


oes por eim e tomando-se a integral em no
R i(mm
0 )
d = 2m, m0 ,
intervalo , obtemos com o uso de e
Z

u0 (, )e

im

d = 2

a k 0 , m Jm

k 0 =1

v0 (, )e

im

km0
R

 m 

X
bk0 , m km0 c
k 0
d = 2
Jm
.
R
R
k 0 =1

Multiplicando ambos os lados de ambas as expressoes por Jm

km
R

e integrando-se as expressoes
R

resultantes para entre 0 e R, obtemos


 m 
 m 
 m 
Z RZ
Z R

X
k 0
k
k
im
Jm
u0 (, )e
Jm
dd = 2
ak 0 , m
Jm
d ,
R
R
R
R
R
0

0
0
k =1
Z

R
0

v0 (, )e

im

Jm

km
R

X bk0 , m m0 c

k
dd = 2
R
R
0
k =1

Temos, porem, com a obvia mudanca de variaveis x =


Z

Jm
0

km
R

Jm

km0
R

d = R
R

Jm
0

km
R

Jm

km0
R

d .
R

,
R

1
0

Jm (km x) Jm

(km0 x)

xdx

(9.144)

k, k 0

(Jm+1 (km ))2


R
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

566/1304

e, portanto,
ak, m

1
=
(Jm+1 (km ))2 R2

bk, m =

R
0

1
km c (Jm+1 (km ))2 R

u0 (, )e

im

Jm

km
R

v0 (, )e

im

Jm

km
R

dd ,

(10.53)

(10.54)

dd .

Essas expressoes determinam completamente os coeficientes ak, m e bk, m para todos k e m em temos
das condicoes iniciais. A solucao assim obtida satisfaz, entao, as condicoes de contorno e iniciais. A
Proposicao 11.7, pagina 602, garante que a solucao assim obtida e a u
nica solucao do problema proposto
(as condicoes de contorno que tratamos sao do tipo de Dirichlet) o que, a posteriori, justifica todo o
nosso proceder.
As fun
co
es de Green para as condi
co
es iniciais
Assim como no problema da corda pendurada, podemos expressar a solucao diretamente em termos
das condicoes iniciais com o uso das chamadas funcoes de Green. Usando (10.53)-(10.54), podemos
reescrever (10.52) como
u(, , t) =

Z RZ
0

G(, , t, , ) u0 ( , ) d d +

Z RZ
0

H(, , t, 0 , 0 ) v0 (0 , 0 ) 0 d0 d0 ,

(10.55)

onde

G(, , t, , ) :=

Jm

X
X


 m 0
km
k
0
 m 
Jm
eim( )
k ct
R
R
cos
,
m 2 2
R
(Jm+1 (k )) R


 m 0
km
k
0
 m 
Jm
eim( )
k ct
R
R
sen
.
m
m 2
R
k c (Jm+1 (k )) R

k=1 m=

H(, , t, , ) :=

Jm

X
X
k=1 m=

Essas sao as funcoes de Green para as condicoes iniciais do problema em questao. Note-se uma vez
mais que
H
(, , t, 0 , 0 ) .
G(, , t, 0 , 0 ) =
t
Tal como no problema da corda pendurada, a importancia de (10.55) esta em expressar a solucao
diretamente em termos das condicoes iniciais u0 e v0 . As funcoes G e H contem em si a informacao
de como os valores das condicoes iniciais no ponto (0 , 0 ) influenciam a solucao no ponto (, ) no
instante de tempo t.

JCABarata. Curso de Fsica-Matem


atica

10.4

Vers
ao de 29 de setembro de 2005.

Captulo 10

567/1304

O Oscilador Harm
onico na Mec
anica Qu
antica e a Equa
c
ao
de Hermite

A equacao de Schrodinger13 independente do tempo para o oscilador harmonico unidimensional e

k
~2 d 2
(x) + x2 (x) = E(x) ,
2
2m dx
2

(10.56)

onde E e um autovalor do operador de Hamilton14 , ~ e a constante de Planck15 , m a massa da partcula


e k a constante de Hooke16 . Definindo
r
 2 1/4
~
2E
x
k
, 0 :=
:=
, :=
1, z := , v(z) := (x) = v(x/) , (10.57)
mk
m
~0

a equacao (10.56) fica


v 00 (z) + ( + 1 z 2 )v(z) = 0 .

A experiencia mostra que para melhor tratarmos dessa equacao devemos definir uma nova funcao
2
2
u(z) := ez /2 v(z), ou seja, escrevemos v(z) = ez /2 u(z), obtendo para u a equacao diferencial
u00 (z) 2zu0 (z) + u(z) = 0 ,

(10.58)

a qual reconhecemos ser a equa


c
ao de Hermite. Como discutimos, essa equacao so possui solucoes
2
que crescem mais lentamente que e+z /2 para |z| se = 2n, sendo n um inteiro nao-negativo. A
2
condicao que u cresce mais lentamente que e+z /2 para |z| e necessaria para que v(z) e, portanto,
(x), seja de quadrado integravel, uma condicao fundamental para a Mecanica Quantica.
No caso em que = 2n, sendo n um inteiro nao-negativo, a solucao para (10.58) e u(z) = H n (z),
sendo Hn o n-esimo polinomio de Hermite. Se = 2n, entao, por (10.57), o valor de E e dado por


1
En := ~0 n +
,
2
para n = 0, 1, 2, 3 . . .. Essa equacao expressa a quantizacao da energia do oscilador harmonico
unidimensional na Mecanica Quantica. Ainda para = 2n, sendo n um inteiro nao-negativo, a solucao
n (x) da equacao de Schrodinger (10.56) sera


x
x2
z 2 /2
n (x) = cn Hn (z)e
= c n Hn
exp 2 ,

2
cRn sendo uma constante de normalizacao a ser fixada. Na Mecanica Quantica adota-se a normalizacao

|n (x)|2 dx = 1. Isso implica,

 2
Z   2
Z


x
x
(9.72)
2
2
Hn
exp 2 dx = |cn |
(Hn (z))2 exp z 2 dz = |cn |2 2n n! ,
1 = |cn |

13

Erwin Rudolf Josef Alexander Schr


odinger (1887-1961).
Sir William Rowan Hamilton (1805-1865).
15
Max Karl Ernst Ludwig Planck (1858-1947).
16
Robert Hooke (1635-1703).

14

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

de onde se extrai, escolhendo-se cn real e positivo, que cn =

n (x) =

1
2n n!

Captulo 10

568/1304

e, portanto,



x
x2
1
Hn
exp 2
2n n!

sao os auto-estados normalizados de energia En para n = 0, 1, 2, 3 . . .. Com o uso de (9.72), e trivial


verificar ainda que
Z
n (x)m (x) dx = n, m ,

a bem-conhecida relacao de ortogonalidade das auto-funcoes n .

E. 10.3 Exerccio. Mostre que




 2
Z
Z   2
1
x
1
x
2
2
2
2

x |n (x)| dx =
x Hn
,
exp 2 dx = n +
2n n!

para todo n , sendo uma constante positiva. Na Mecanica Quantica a expressao do lado esquerdo,
acima, representa o valor medio do quadrado do operador de posicao, ou seja, de x 2 , no auto-estado
normalizado n do operador Hamiltoniano do oscilador harmonico. Sugestao: use as relacoes de recorrencia
(9.78), pagina 514, e as relacoes de ortogonalidade (9.72), pagina 512, das funcoes H n .
6


10.5

O Atomo
de Hidrog
enio e a Equa
c
ao de Laguerre Associada

A equacao de Schrodinger independente do tempo que descreve uma partcula de massa m 0 , em tres
dimensoes, sob um potencial de Coulomb17 atrativo V (r) = r , > 0, e

~2

= E .
2m0
r

Expressando o operador Laplaciano em coordenadas esfericas, como em (10.8), essa equacao fica



 


1

1
1
2m0 
2
2
r
+
( sen )
+
+E = 0.
+ 2
r 2 r
r
sen

( sen )2 2
~
r
Seguindo o procedimento de separacao de variaveis, procuramos solucoes na forma = R(r)Y (, ) e
obtemos, inserindo na equacao,





1
Y
1
(r 2 R0 (r))0 2m0
1
2Y
2
( sen )
+
+ 2 r + Er =
.
R(r)
~
Y (, ) sen

( sen )2 2
17

Charles Augustin de Coulomb (1736-1806).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

569/1304

Novamente, ambos os lados devem ser igualados a uma constante , e obtemos o par de equacoes



2m0
2
2 0
0
r + Er R(r) = 0 ,
(r R (r)) +
~2


1
Y
1
2Y
+ Y = 0 .
( sen )
+
sen

( sen )2 2
Como ja discutimos, a segunda equacao so possui solucoes finitas em = 0 e = se = l(l + 1) com
l , em cujo caso as solucoes para Y sao dadas pelos harmonicos esfericos Y lm (, ) com m e
l m l. A equacao radial fica entao



2m0
2
2 00
0
r + Er l(l + 1) R(r) = 0 .
r R (r) + 2rR (r) +
~2


Para simplificar essa expressao, definamos as constantes


2m0
:=

~2

:=

2m0
E
~2

(tomamos aqui E 0, o que corresponde aos chamados estados ligados), com o que, escrevemos

r 2 R00 (r) + 2rR0 (r) + r 2 r 2 l(l + 1) R(r) = 0 .

Essa equacao ainda nao se encontra em uma forma reconhecvel, mas definindo S(r) :=
seja, escrevendo R na forma R(r) = r l er S(r), obtem-se para S a seguinte equacao:




rS 00 (r) + 2(l + 1) 2r S 0 (r) + 2(l + 1) S(r) = 0 .
E. 10.4 Exerccio. Faca essa conta ao menos uma vez na vida.

er
R(r),
rl

ou

Definindo uma nova variavel z = 2r e y(z) = S(r) = y(2r), obtemos para y(z) a equacao
diferencial





00
0
zy (z) + 2(l + 1) z y (z)
(l + 1) y(z) = 0 ,
2

a qual, para fins de comparacao, escrevemos como


00

zy (z) + (2l + 1) + 1 z y (z)






+ l (2l + 1) y(z) = 0 .
2

Comparando a (8.154), reconhecemos que se trata da equa


c
ao de Laguerre associada com n = 2
+l.
Pela nossa discussao de quando tratamos da equacao de Laguerre, devemos ter n um inteiro positivo
com 0 2l + 1 n, de outra forma a solucao da equacao de Laguerre crescera mais rapido que
exponencial, destruindo a propriedade de ser de quadrado integravel. Assim, n deve ser tomado um

inteiro positivo e, portanto, p := 2


deve ser tambem inteiro. Como 0 2l + 1 n e n = p + l, segue
que p l + 1 e, portanto, p e igualmente um inteiro positivo.

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

570/1304

Na situacao descrita no u
ltimo paragrafo, vimos na Secao 8.3.2, pagina 452, que as solucoes da
(2l+1)
equacao de Laguerre associada acima sao dadas pelos polinomios de Laguerre associados L n
(z).
Retornando a R(r), obtivemos a solucao


r
Rp, l (r) = r exp
2p
l

onde usamos p := 2

expressa-se como
= 2p

, p > 0, e escrevemos =

2m0
m0
E
=
,
~2
p~2

(2l+1)
Lp+l

.
2p

r
p

Voltando a`s constantes originais, a relacao

E Ep =

ou seja,

2 m0 1
,
2~2 p2

com p = 1, 2, 3, 4, . . . .

Essa e a bem-conhecida regra de quantizacao de energia do atomo de hidrogenio, obtida pela primeira
vez, por outros meios, por Bohr18 em 1912-1913 e reobtida posteriormente por Schrodinger em 1926
atraves do estudo das solucoes da equacao de Schrodinger para o potencial de Coulomb, como fizemos
acima. O n
umero inteiro nao-negativo p e denominado n
umero qu
antico principal no contexto da
Mecanica Quantica.
Os auto-estados de energia sao
p, l, m (r, , ) = cp, l, m

r
r exp
2p
l

(2l+1)
Lp+l

r
p

Ylm (, ) ,

cp, l, m sendo uma constante de normalizacao a ser fixada pela imposicao


Z
Z Z
2 3
1 =
|p, l, m | d x =
|p, l, m (r, , )|2 r 2 drd ,


onde d = sen ()dd. Como por (9.68) tem-se


1

=
(9.101)

S2

|cp, l, m |

S2

|Ylm (, )|2 d = 1, segue que

r
exp
p



(2l+1)
Lp+l

r
p

2

 2l+3 Z
2

p
(2l+1)
e Lp+l () 2l+2 d
|cp, l, m |

0
2

 2l+3
p
((p + l)!)3
|cp, l, m |
(2p) .

(p l 1)!
2

Assim, tomando cp, l, m real, obtemos


cp, l, m =
18

r 2l+2 dr

Niels Henrik David Bohr (1885-1962).

2p2

 l+1 s
(p l 1)!

.
p
((p + l)!)3

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

571/1304

Finalmente, as auto-funcoes de energia normalizadas sao


s
 
 l+1 s



(p l 1)! l
r

r
(2l+1)
r exp
p, l, m (r, , ) =
Lp+l
Ylm (, ) ,
2
3
2p
p
((p + l)!)
2p
p
com p l + 1, l


,l0em

com l m l.

Um coment
ario sobre a ortonormalidade das fun
co
es p, l, m
Nota para o leitor com conhecimento de Mec
anica Qu
antica
Por serem auto-funcoes normalizadas do operador Hamiltoniano, as funcoes p, l, m devem satisfazer
as relacoes de ortogonalidade hp0 , l, m , p, l, m i = p, p0 . Integrando a parte angular, isso significa que



  

 
Z 
r
r
r
2 p2l+4 ((p + l)!)3
r
(2l+1)
(2l+1)
2l+2
0
exp 0 Lp0 +l
exp

.
L
r
dr
=

p,
p
p+l
2p
p0
2p
p
2l+3 (p l 1)!
0
O fator pode ser absorvido com a mudanca de variaveis = r e obtem-se
 
 
Z

2 p2l+4 ((p + l)!)3


2 p+p
(2l+1)
(2l+1)
2l+2
0
pp
0
.
e
Lp+l

d = p, p
Lp0 +l
p0
p
(p l 1)!
0

(10.59)

Essa e uma nova relacao de ortogonalidade para os polinomio de Laguerre associados, a qual vale para
todo p, p0 inteiros positivos (nao-nulos).
Perceba-se que nao podemos eliminar simultaneamente p e p0 por uma mudanca de variaveis na
de se notar que essa relacao de ortogonalidade nao tem muito a ver com a relacao
integral em (10.59). E
de ortogonalidade dos polinomios de Laguerre associados que obtivemos em (9.98). Infelizmente, poucos
livros de Mecanica Quantica ou de Fsica-Matematica comentam esse ponto 19 , uma excecao um tanto
surpreendente sendo [4] e estas Notas.
Comentamos que toda a teoria do atomo de hidrogenio, incluindo as varias expressoes complexas
que derivamos acima envolvendo polinomios de Laguerre, e muito mais, ja se encontrava nos primeiros
trabalhos de Schrodinger sobre a Mecanica Quantica, de 1926.

10.6

Propaga
c
ao de Ondas em Tanques Cilndricos
A vers
ao original desta seca
o e de autoria de
Andre M. Timpanaro, Fleury J. Oliveira e Paulo H. Reimberg20

A Mecanica de Fluidos, quando consideramos fluidos ideais, e baseada fundamentalmente na equacao


de Euler (vide, e.g., [80] ou [18])
~v
1
+ (~v ) ~v + p ~g = 0 ,
t

19

(10.60)

[79] e [113] ignoram o assunto e mesmo o excelente [42] atribui erroneamente a normalizaca
o de p, l, m a
`s relaco
es
de ortogonalidade (9.98).
20
No ano de 2005, alunos de graduaca
o do Instituto de Fisica da Universidade de S
ao Paulo. Ttulo original da
monografia: Propagaca
o de ondas na superfcie de um lquido contido em tanques circulares - uma breve an
alise,
apresentada no curso de Mec
anica dos Fluidos ministrado pelo Prof. M. Cattani.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

572/1304

onde ~v e o campo de velocidades, a densidade do fluido, p a pressao e ~g a aceleracao da gravidade.


Esta equacao, apesar de nao-linear, pode, para certos limites, ser aproximada por equacoes lineares.
Quando isto se da, a dificuldade em encontrar solucoes explcitas diminui consideravelmente. Sera este
o caso tratado neste trabalho: o estudo de solucoes explcitas do problema de propagacao de ondas na
superfcie de um lquido contido num tanque cilndrico.
Consideraremos tres casos limites com a caracterstica comum de que o comprimento de onda e
muito maior que sua amplitude. O primeiro caso tratado e o da propagacao de tais ondas em um
tanque cuja profundidade e muito grande, nao havendo, desta forma, influencia do fundo na solucao
das equacoes. O segundo caso tratado e um limite do anterior, fazendo com que o raio do tanque seja
infinito. O terceiro, e u
ltimo caso estudado e aquele no qual a profundidade do tanque e muito menor
que o comprimento de onda, para o qual obtem-se uma solucao bastante parecida com a do problema
da membrana circular da Secao 10.3, pagina 564 (mas com condicoes de contorno do tipo de Neumann).
Ondas de gravita
c
ao e a propaga
c
ao de ondas em tanques profundos
A superfcie de um fluido em equilbrio sob a influencia de um campo gravitacional uniforme e plana.
Se, por meio de uma acao exterior qualquer, a superfcie do fluido sair de seu estado de equilbrio em
um ponto, um movimento inicia-se no fluido. Este movimento se propaga por todo o fluido sob a forma
de ondas.
Admitamos, primeiramente, que as ondas tem comprimentos muito maiores que suas amplitudes.
Assim, como sera demonstrado, o termo nao linear da equacao de Euler, (~v )~v , pode ser desprezado
v
em comparacao com ~
.
t
Seja o perodo de oscilacoes das partculas da onda, estas partculas percorrem uma distancia da
ordem da amplitude, a, da onda. A velocidade de seu movimento e , portanto, v a .

A velocidade v varia de maneira notavel para perodos de tempo da ordem de e para comprimentos
de onda, , dependendo da direcao de propagacao da onda. Desta forma, a derivada da velociade em
relacao ao tempo e aproximadamente v , e v e a diferenca de velocidades entre dois pontos distintos
do espaco percorridos pela partcula em um certo intervalo de tempo. Assim, se  a, que e nossa
aproximacao inicial, tem-se
1a
a2 1

,

1
v
v  v,

~v
 (~v ) v .
t

v
Vemos que (~v ) ~v e desprezvel em relacao a ~
. Assim, obtemos para a equacao de Euler a
t
simplificacao
1
~v
= p ,
(10.61)
t

onde e o potencial gravitacional ( = ~g ).

Para o caso isentropico, ou seja, para entropia constante, temos:


1
p = (h + ) ,

(10.62)

onde h e a entalpia do sistema. Aplicando o rotacional em ambos os lados da equacao (10.61) obtemos:

~v = 0
t

ou seja,

~v = constante .

(10.63)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

573/1304

No entanto, para o movimento oscilatorio, a media temporal de ~v e nula de forma que ~v = 0,


sendo o fluido potencial em primeira aproximacao (ou seja, ~v e o gradiente de um potencial, por ter
rotacional nulo). Pode-se entao definir uma funcao potencial, , como sendo:
~v =

(10.64)

Aplicando a definicao (10.64) a` equacao de Euler (10.61) obtemos:

p
= gz .
t

(10.65)

Assim, temos

.
(10.66)
t
Suporemos o eixo z orientado verticalmente para cima e um sistema de coordenadas polares planas
r, tendo como origem o centro do tanque cilndrico.
p = gz

Designaremos a coordenada z dos pontos da superfcie do fluido por ; e a funcao das coordenadas
r, , e do tempo. Se na superfcie a pressao for uma constante p0 , por exemplo, a pressao atmosferica,
obteremos para a equacao (10.66)

.
(10.67)
p0 = g
t
Como, para um fluido incompressvel,


p0
+ t = ,
(10.68)

podemos definir um novo potencial 0 por:

0 := +
Assim,

p0
t.


0
= 0.
g +
t z=

(10.69)

(10.70)

Como e pequeno, visto que as ondas tambem o sao, podemos considerar que
0

(10.64) (10.69)
= vz =
,
=
t
z
z
de forma que a derivada temporal da equacao (10.70) torna-se
 0


1 2 0
= 0.
+
z
g t2 z=

(10.71)

(10.72)

Novamente, como as oscilacoes sao pequenas, pode-se substituir na equacao (10.72) z = 0 no lugar de
z = e 0 por . De tal maneira, obtemos o sistema de equacoes diferencias que determinam as ondas
na superfcie do fluido.
2 = 0 ,


1 2
= 0.
+
z
g t2 z=0

(10.73)
(10.74)

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

574/1304

Seja (por separacao de variaveis) (r, , z, t) = (r) A () V (z) T (t). Obtem-se de (10.73) as
seguintes equacoes para os fatores , A e V :

r 2 00 + r0 + 2 r 2 2 = 0 ,
(10.75)
A00 + 2 A = 0 ,

(10.76)

V 00 2 V

(10.77)

= 0.

Para que a solucao seja periodica em , de perodo 2, devemos ter que = m, onde m . Para
V , obtemos de (10.77) V (z) = Aez + Bez caso 6= 0 e V (z) = Az + B caso = 0, A e B sendo
constantes. Como desejamos uma solucao finita para z (onde localiza-se o fundo do tanque),
devemos ter Re () 0 e V (z) = Aez . Disso obtem-se V 0 (0)/V (0) = e, por (10.74), obtemos para
o fator T a equacao
T 00 + gT = 0 .
(10.78)
Para que essa equacao tenha um carater oscilatorio e nao divirja para t devemos ter Im () = 0
e > 0.
Aplicando as condicoes de contorno (velocidade radial igual a zero em r = R) e admitindo que o
tanque seja profundo o bastante para que o fundo nao interfira, obtem-se:
!
!#
"
r
r
 m 

X
X
k r im+ km z
gkm
gkm
R
t + bk, m sen
t
,
Jm
e
ak, m cos
(r, , z, t) =
R
R
R
k=1 m=
(10.79)
m
0
onde Jm (x) sao as funcoes de Bessel e k e o k-esimo zero da funcao Jm (x) em + \ {0}. Para a
parte radial, nao consideramos as funcoes de Neumann como possveis solucoes da equacao de Bessel
(10.75), pois estas solucoes nao sao compatveis com a finitude da energia, devido a` presenca de uma
singularidade na origem.


Seja v0 a velocidade aplicada na superfcie do fluido no instante t = 0 na direcao de z, ou seja,


v0 v0 (r, , z = 0, t = 0) z. Entao,
v0 (r, ) =

X
X

k=1 m=

ak,m Jm

km r
R

eim .

A partir da equacao (10.70) no caso em que 0 e t = 0, temos


s
 m 

X
X
km
k r im
0 (r, ) =
bk,m
e
,
Jm
gR
R
k=1 m=

(10.80)

(10.81)

onde 0 e a forma da superfcie no instante inicial.


Usando em (10.80) e (10.81) as rela
R coes de ortogonalidade (9.145), pagina 534, das funcoes de
Bessel e as relacoes de ortogonalidade ei(mn) d = 2mn das funcoes eim , determina-se o valor

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

575/1304

das constantes ak, m e bk, m , que seguem:


ak, m

km
=
2

R (km )2 m2 Jm (km )
(km )3/2

bk, m =
R3/2

(km )2

g


m2

Jm (km )

Z RZ
0

2

v0 (r, ) e

im

Jm

Z RZ
0

km r
R

0 (r, ) e

im

Jm

r d dr ,

(10.82)

(10.83)

km r
R

r d dr .

Assim, determina-se completamente a solucao para o potencial da velocidade do fluido.


Aplicando o gradiente pode-se obter as velocidades com que as ondas se propagam nas direcoes
radial e vertical em termos das condicoes iniciais. Desta forma,
!
!#
"
r
r



X
X
gkm
gkm
km 0 km r im+ km z
R
Jm
t + bk, m sen
t
,
ak, m cos
e
vr =
R
R
R
R
m=
k=1

vz

!
"
r
 m 

mz
m
m
X
X

k
k r im+ k
gk
R
=
Jm
t + bk, m sen
e
ak, m cos
R
R
R
m=
k=1

gkm
R

!#

Vemos dessas expressoes que as velocidades decrescem exponencialmente com a profundidade. A forma
final da superfcie e dada pela equacao (10.70) (no caso em que 0) e fica
s
!
!#
"
r
r
 m 

X
X
km
k r im
gkm
gkm
=
Jm
t bk, m cos
t
.
(10.84)
e
ak, m sen
gR
R
R
R
k=1 m=
As ondas cuja propagacao e descrita pelas expressoes acima sao denominadas ondas de gravitaca
o na
literatura da Mecanica dos Fluidos. Vide e.g. [80].
Propaga
c
ao de ondas em um tanque profundo de raio infinito
Abordaremos agora o limite em que o raio e a profundidade do tanque sao muito grandes (infinitos).
Tal e o caso se considerarmos ondas de pequeno comprimento de onda se propagando no meio de um
oceano. Nesse caso teremos novamente as equacoes (10.73)-(10.74)
2

2
2
+ 2 +r
= 0 r
+r
= 0
r 2
r

z 2
 2



= 0.
+g
t2
z z=0
2

(10.85)

(10.86)

Para fazermos a separacao de variaveis suporemos que pode ser escrita como
= (r, , z, t) = A(r)B()C(z)D(t) .

(10.87)

Dessa forma, as equacoes (10.85) e (10.86) ficam respectivamente


r 2 A00 BCD + rA0 BCD + AB 00 CD + r 2 ABC 00 D = 0

(10.88)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

576/1304

e
ABC(0)D 00 + gABC 0 (0)D = 0 .

(10.89)

Para resolver a equacao (10.88) iremos dividi-la por ABCD = . Sempre poderemos fazer isso desde
que a solucao para nao seja a solucao trivial. Tambem iremos supor que as seguintes condicoes sao
obedecidas:
B 00
= cte. = 2 .
(10.90)
B
e
C 00
= cte. = k 2 .
(10.91)
C
Discutiremos se e k sao ou nao reais mais tarde. Levando em conta (10.90) e (10.91), (10.88) fica:
r2

A00
A0
+r
= 2 k2 r2
A
A

r 2 A00 + rA0 + (r 2 k 2 2 )A = 0 .

(10.92)

Se fizermos uma mudanca de variavel chegaremos na equaca


o de Bessel para a funcao J (x), de
forma que a solucao e
A(r) = KJ (kr) .
(10.93)
Se resolvermos (10.90) e (10.91) obteremos:
B() = ei + ei ,

(10.94)

C(z) = z ekz + z ekz .

(10.95)

Note que para que seja contnua e diferenciavel (precisaremos dessas condicoes se quisermos
descrever a superfcie de forma satisfatoria), entao devemos ter que e inteiro. Alem disso, como
vamos somar as solucoes com variando de ate +, podemos sem perda de generalidade considerar
= 0.
Na equacao (10.95), devemos manter em mente que como o tanque e sem fundo devemos ter a
relacao z 0 satisfeita, de forma que k deve ser real (e sem perda de generalidade
positivo) e z = 0. Entao a equacao (10.89) fica

p

p
D 00
gk t + tk sen
gk t .
(10.96)
= gk = D(t) = tk cos
D

Entao o resultado para o potencial e

h
p

p
i
k (r, z, , t) = J (rk)ei+kz Ek cos
gk t + Fk sen
gk t
,

(10.97)

onde as constantes Ek e Fk sao definidas como

Ek = tk ,
Fk = tk .
Para determinarmos essas constantes em termos de k e , precisamos escolher condicoes iniciais.
Lembrando entao as equacoes que foram deduzidas para as ondas pequenas (e que tambem valem nesse

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

577/1304

caso) para a coordenada z dos pontos do fluido na superfcie, . Entao podemos escrever as condicoes
|
e de Z(r, , t) =
|
no instante t = 0
em termos de T (r, , t) =
t z=0
z z=0

Para tanto usaremos a transformada de Hankel21 (tambem conhecida como transformada de FourierBessel) e a relacao de ortogonalidade da funcao einx :
Z

F(q) = H (f )(q) =
f (x) qxJ (qx) dx ,
(10.98)
0

f (x) =

H1 (F)(x)
Z

F(q) qxJ (qx) dq ,

(10.99)

ei(mn)x dx = 2mn .

(10.100)

Entao, se Sk (r, ) = Z(r, , 0), tem-se

Sk (r, ) = kJ (rk)e

Ek

H1

Ek =

2kJ (rk)Ek dk =

o que nos leva a

Se R(r, ) = T (r, , 0), entao


p
Rk (r, ) =
gkJ (rk)Fk
=

e, portanto,

Se

d =

k
Ek
r

2kJ (rk)Ek dk

kEk = H

Z

rS(r, )ei
d ,
2

rZ(r, , 0) i
e
J (rk) d dr .
2

Re

d =

 r

p
g
1
Fk
2 gkJ (rk)Fk dk = H 2
r
Fk

(10.101)

p
gkJ (rk)Fk dk =

Fk = H

s Z Z
k rT (r, , 0) i
e
J (rk) d dr .
=
g 0
2

r

r 1
g 2

Re

(10.102)

As funcoes Z e T podem ser obtidas a partir de e


, as condicoes iniciais, a partir das equacoes
t
(10.69), (10.70) e (10.71) que tambem podem ser utilizadas para obter . Por fim podemos obter o
21

Hermann Haenkel (1839-1873).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

578/1304

campo de velocidades tomando ~v = . E e F determinam completamente :


(r, z, , t) =

Z
X

J (rk)e

i+kz

Ek cos

p

p
i
gk t + Fk sen
gk t dk , (10.103)

~v (r, z, , t) = (r, z, , t) ,
(r, , t) =

(10.104)

p0
1

(r, , 0, t) .
g g t

(10.105)

Grandes ondas de gravita


c
ao e a propaga
c
ao de ondas em tanques rasos
Trataremos agora da propagacao de ondas com um comprimento de onda grande relativamente a`
profundidade do meio onde se da a propagacao, mas amplitude pequena em relacao ao comprimento
de onda.
Suporemos tratar de tanque cilndrico de raio R. Na situacao de equilbrio, sem movimento, o fluido
atinge uma altura h0 do tanque. Suporemos um sistema de coordenadas cilndricas r, , z, com o eixo
z coincidente com o eixo de simetria do tanque, sendo a coordenada z medida a partir do fundo do
tanque no sentido crescente para cima. Em havendo movimento do fluido, cada ponto da sua superfcie
tera altura h(r, ), medida a partir do fundo do tanque. Definindo (r, ) = h(r, ) h0 , podemos
escrever h = h0 + . A grandeza descreve o afastamento da superfcie do fluido em relacao a` superfcie
de equilbrio.
Como justificado anteriormente, podemos novamente desconsiderar o termo nao-linear da equacao
de Euler (10.60), que reduz-se a
~v
p
=
+ ~g
(10.106)
t

Escrevendo esta equacao para as componentes radial e tangencial, respectivamente, teremos


vr
t

1 p
,
r

(10.107)

v
t

1 p
,
r

(10.108)

vz
t

p
.
z

(10.109)

Lembrando que a pressao num ponto interior a um fluido aproximadamente estatico e dada por
p
= p0 + g (h z)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

579/1304

onde h e altura da superfcie do fluido medida a partir do fundo, obteremos, substituindo esta em
(10.107) e em (10.108), a aproximacao
vr
t

,
= g
r

(10.110)

v
t

g h

,
=
r

(10.111)

vz
t

= 0.

(10.112)

A equacao de continuidade
+ (~v ) = 0 reduz-se, para fluidos incompressveis (ou seja, com
t
= const.) a ~v = 0. Em coordenadas cilndricas isso significa
vz 1 (rvr ) 1 v
+
+
= 0.
z
r r
r
Integrando-se essa equacao em z entre z = 0 (fundo do tanque) e z = h(r, , t) := h 0 + (r, , t)
(superfcie superior do fluido), obtemos
Z h
Z h
1 v
1 (rvr )
dz +
dz = 0 ,
vz (r, , h(r, , t), t) +
r
0 r
0 r
onde usamos a hipotese que vz (z = 0) = 0 (ou seja, o fluido nao se move verticalmente no fundo do
tanque). Supondo agora que o tanque seja razo, e que vr e v nao dependam da altura z, a u
ltima
expressao pode ser aproximada por
vz (r, , h(r, , t), t) + h(r, , t)
Lembrando que vz (r, , h, t) =

h
,
t

1 v
1 (rvr )
+ h(r, , t)
= 0,
r r
r

obtemos
h h (rvr ) h v
+
+
= 0,
t
r r
r

Derivando esta equacao em relacao ao tempo, teremos


 



vz v
vr
h v
vz
2h h
(rv
)
+
= 0.
+
r
+
+
r
t2
r r
t
r t
r r
r
Usando as expressoes (10.110) e (10.111) a equacao acima fica


  
2h
h
vz
vz v
h
h 2h

g
+
(rv
)
+
= 0.
r

g
r
t2
r r
r
r 2 2
r r
r
Utilizando h = h0 + , desprezando termos quadraticos em e nas velocidades, obtem-se
 2

2
1
1 2
gh0
+
+
= 0.
(10.113)
t2
r 2 r r r 2 2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

580/1304

Podemos notar que a expressao entre parenteses e o Laplaciano bidimensional escrito em coordenadas polares. Com isso podemos escrever (10.113) mais sucintamente como:
2
gh0 2 = 0 .
t2

(10.114)

Vemos que esta


e uma equacao de onda em duas dimensoes, que corresponde a ondas com velocidade
de propagacao gh0 (Comentario en pasant: o fato de a velocidade de propagacao diminuir com a
profundidade do tanque explica o por que de uma onda quebrar ao se aproximar de uma praia).
As ondas cuja propagacao e descrita por (10.114) sao denominadas grandes ondas de gravitaca
o na
literatura da Mecanica dos Fluidos. Vide e.g. [80]. Como desejamos conhecer a forma de ondas na
superfcie de um tanque cilndrico devemos aplicar o metodo de separacao de variaveis a` equacao
(10.114).
Supondo da forma (r) A () T (t) na equacao (10.114), teremos:
2
T = 0,
gh0

r 2 00 + r0 + 2 r 2 2 = 0 ,
T 00 +

A00 + 2 A = 0 .

(10.115)
(10.116)
(10.117)

Devido a` expresao (10.110), e ao fato de a velocidade radial


nula
vr ser h
na borda do tanque (quando


=
= 0. Essa relacao deve ser
r = R) para todo tempo t, constatamos que devemos ter
r r=R
r r=R
entendida como condicao de contorno (do tipo de Neumann) a ser satisfeita pela funcao (r, ).

Resolvendo sistema de equacoes diferenciais (10.115)-(10.117) sujeito a` condicao de contorno de


que a derivada de em relacao ao raio deve anular-se em r = R a solucao para o perfil das ondas na
superfcie do lquido sera:

 m

 m 

 m

X
X
k gh0 t
k r im
k gh0 t
+ bk,m sen
Jm
e
, (10.118)
(r, , t) =
ak,m cos
R
R
R
k=1 m=
onde = m para que a solucao seja periodica de perodo 2 em e onde, como anterioremente,
0
em + \ {0}. Para a parte radial, nao consideramos as funcoes de
km designa o k-esimo zero de Jm
Neumann como possveis solucoes da equacao de Bessel, pois estas nao sao compatveis com a finitude
da energia, devido a` presenca de uma singularidade na origem.


Supondo, como condicoes iniciais, que a superfcie do lquido tenha uma forma descrita por uma
funcao 0 (r, ) e uma distribuicao de velocidades verticais dada por v0 (r, ) em t = 0, teremos:
0 (r, ) =

X
X

k=1 m=

ak, m Jm

km r
R

eim ,

 m 
k r im
km gh0
Jm
v0 (r, ) =
bk, m
e
.
R
R
k=1 m=

X
X

(10.119)

(10.120)

JCABarata. Curso de Fsica-Matem


atica

Captulo 10

Vers
ao de 29 de setembro de 2005.

581/1304

Utilizando em (10.119) e (10.120) asR relacoes de ortogonalidade (9.145), pagina 534, das funcoes de

Bessel e as relacoes de ortogonalidade ei(mn) d = 2mn das funcoes eim , teremos:


ak, m =
R2

bk, m =
R

gh0 km

m
km

1
2 

(Jm (km ))2

1


m
km

2 

Z RZ
0

0 (r, ) e

(Jm (km ))2

Z RZ
0

im

Jm

km r
R

v0 (r, ) e

im

Jm

r drd ,

km r
R

(10.121)

r drd (. 10.122)

Essas expressoes determinam completamente os coeficientes ak, m e bk, m para todos k e m em termos
das condicoes iniciais.

JCABarata. Curso de Fsica-Matem


atica

10.7

Captulo 10

Vers
ao de 29 de setembro de 2005.

582/1304

Exerccios Adicionais

E. 10.5 Exerccio. Determine a solucao da equacao de ondas com amortecimento


u
1 2u
+
u = 0,
2
2
c t
t
> 0, em duas dimensoes, no interior de um disco de raio R, com |u(, , t)| < , com condicoes de
contorno de Dirichlet u(R, , t) = 0 e com as condicoes iniciais
u(, , 0) = 0
onde
v0 () =

u
(, , 0) = v0 (),
t

V, 0 R0 < R

0, R0 < R

Acima, as coordenadas e referem-se ao sistema de cordenadas polares cuja origem coincide com o
centro do disco de raio R. Sugest
ao. Ao resolver a equacao para a parte temporal (metodo de separacao
de variaveis), lembre-se que alguns modos de vibracao podem ter amortecimento sub-crtico e outros supercrtico. Para simplificar, ignore o caso de amortecimento crtico.
6
E. 10.6 Exerccio. Determine (tao detalhada e explicitamente quanto possvel) a solucao da equacao
de ondas com amortecimento
1 2u
u
4u = 0,
+
2
2
c t
t
> 0, em tres dimensoes, no interior da esfera de raio R, com |u(r, , , t)| < , com condicoes de
contorno de Dirichlet u(R, , , t) = 0 e com as condicoes iniciais
u(r, , , 0) = 0
onde
v0 (r) =

u
(r, , , 0) = v0 (r),
t

V, 0 r R0 < R

0, R0 < r R

E. 10.7 Exerccio. Determine a solucao da equacao da corda pendurada com amortecimento




2u

u
u
g
+
z
= 0,
t2
t
z
z
onde > 0 e g > 0, que descreve o movimento de uma corda de comprimento L localizada, quando em
repouso, no intervalo 0 z L do eixo vertical, pendurada pelo seu extremo superior (o que corresponde `a

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

583/1304

(z, 0) = v0 (z),
condicao de contorno u(L, t) = 0 para todo t) e com condicoes iniciais u(z, 0) = u 0 (z) e u
t
para certas funcoes u0 e v0 dadas. Sugest
ao. Ao resolver a equacao para a parte temporal (metodo de
separacao de variaveis), lembre-se que alguns modos de vibracao podem ter amortecimento sub-crtico e
outros super-crtico. Para simplificar, ignore o caso de amortecimento crtico.
6
E. 10.8 Exerccio. Determine o potencial eletrico (r, ) produzido no vacuo por um anel unidimensional
de raio R, uniformemente carregado com carga eletrica total Q e densidade linear de carga = Q/(2R),
nas seguintes regioes:
a) r > R.
b) r < R.
c) r = R, mas 6= /2.

As variaveis r e referem-se ao sistema de coordenadas esfericas cuja origem e o centro do anel e cujo
eixo z, a partir de onde o angulo e medido, coincide com o eixo de simetria do anel.
Sugest
ao 1. Calcule primeiramente o potencial ao longo do eixo de simetria. Para os demais pontos use
a solucao da equacao de Laplace:


X
Bn
n
(r, ) =
An r + n+1 Pn (cos()) .
r
n=0
Os coeficientes An e Bn sao fixados pela solucao ao longo do eixo de simetria (que correspondem a = 0
e = ).
Sugest
ao 2. Para |x| < 1 vale
(1 + x)

X
k=0

( + 1)
xk .
( k + 1)(k + 1)

Em particular, para |t| < 1, tem-se


(1 + t)

1/2

= 1+

X
k=1

k tk ,

com

k = (1)k

(2k 1)!!
.
(2k)!!
6

E. 10.9 Exerccio. Determine o potencial eletrico (r, ) produzido no vacuo por um disco de raio R,
uniformemente carregado com carga eletrica total Q e densidade superficial de carga = Q/(R 2 ), nas
seguintes regioes:
a) r > R.
b) r < R, mas 0 < /2.

c) r < R, mas /2 < .

As variaveis r e referem-se ao sistema de coordenadas esfericas cuja origem e o centro do disco e cujo
eixo z, a partir de onde o angulo e medido, coincide com o eixo de simetria do disco.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

584/1304

Sugest
oes. Calcule primeiramente o potencial ao longo do eixo de simetria. Para os demais pontos use
a solucao (10.15) da equacao de Laplace :
(r, ) =


X
n=0

Bn
An r + n+1
r
n

Pn (cos()) .

Use tambem a expansao binomial citada no Exerccio E. 10.8, pagina 583.


Lembre-se tambem que sobre o semi-eixo z > 0, onde = 0, tem-se z 2n = r 2n P2n (cos(0)) para todo
n 0 e |z| = +rP1 (cos(0)). Porem, sobre o semi-eixo z < 0, onde = , tem-se z 2n = r 2n P2n (cos())
para todo n 0 mas |z| = rP1 (cos()). Esse u
ltimo sinal - e importante para distinguir as solucoes
dos itens b e c.
6
E. 10.10 Exerccio. Considere uma barra unidimensional de comprimento L, uniformemente carregada
e com carga eletrica total Q. Determine, em termos de uma expansao em serie envolvendo polinomios de
Legendre, o potencial eletrico (r, ) produzido por essa barra no vacuo na regiao r > L/2. As variaveis
r e referem-se ao sistema de coordenadas esfericas cuja origem e ponto medio da barra e cujo eixo z, a
partir do qual o angulo e medido, coincide com o eixo da barra.
Para averiguar se o resultado obtido esta correto, verifique a validade aproximada da lei de Coulomb para
r grande.
Sugest
ao. Como no exerccio anterior, determine primeiro o potencial ao longo do eixo z.

E. 10.11 Exerccio.
Uma esfera homogenea de raio R, boa condutora de calor, com constante de
difusao K, encontra-se em contacto termico com um banho termico `a temperatura T = 0. No instante de
tempo t = 0 a temperatura inicial da esfera e descrita (em um sistema de coordenadas esfericas, cuja origem
coincide com o centro da esfera) por uma funcao u0 (r, , ), com 0 r R, 0 e 0 2.

a. Determine a temperatura u(r, , , t) de um ponto do interior da esfera com coordenadas (r, , )


no instante t 0.

b. Determine explicitamente u(r, , , t) para o caso em que u0 (r, , ) = T0 ( sen )/, onde
= r/R.
Sugest
ao. Funcoes de Bessel esfericas.
6

E. 10.12 Exerccio. Um cano cilndrico infinito, cujo raio interno e R 1 e cujo raio externo e R2 , e
formado por um material Mc cuja constante de difusao termica e K. O cano esta em contacto por dentro
com um material M1 `a temperatura T1 e por fora com um material M2 `a temperatura T2 . As temperaturas
dos materiais M1 e M2 sao mantidas constantes e nao mudam nem com o tempo nem com a posicao.
Adotemos coordenadas cilndricas (r, , z), cujo eixo z coincide com o eixo do cilindro. Deseja-se
determinar a temperatura u(r, , z, t) no interior do cano, ou seja, para R 1 r R2 . Como o cano e
infinito e as temperaturas dos meios M1 e M2 nao variam, a temperatura u deve ser apenas uma funcao de
r, e t.
Seguindo a Lei de Fourier, as condicoes de contorno a serem satisfeitas em r = R 1 e em r = R2 devem

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 10

585/1304

impor que o fluxo de calor na superfcie de contacto entre o cano um meio externo deve ser proporcional
`a diferenca de temperatura entre ambos os meios na superfcie de contacto, sendo que a constante de
proporcionalidade depende de ambos os materiais em contacto termico. Ou seja, devemos impor
u
(R1 , , t) = +1 [u(R1 , , t) T1 ]
r
e

u
(R2 , , t) = 2 [u(R2 , , t) T2 ] ,
r

para todo t e todo .


Sabendo que a temperatura no interior do cano (ou seja, para R 1 r R2 ) era u0 (r, ) no instante
t = 0, determine a temperatura u(r, , z, t) para todo t > 0. A temperatura u deve satisfazer a equacao
de difusao do calor
u
= K4u .
t
Sugest
ao. As condicoes de contorno acima sao nao-homogeneas. Para passar para condicoes homegeneas, proceda da seguinte forma. Escreva
u(r, , t) = f (r, , t) + g(r)
e escolha g, que e uma funcao apenas de r, de modo que 4g = 0 e de modo que
g 0 (R1 ) 1 g(R1 ) = 1 T1

e
g 0 (R2 ) + 2 g(R2 ) = +2 T2 .
Com isso, como 4g = 0, a funcao f deve satisfazer tambem a equacao de difusao
f
= K4f
t

mas com condicoes de contorno homogeneas


f
(R1 , , t) 1 f (R1 , , t) = 0
r
e

f
(R2 , , t) + 2 f (R2 , , t) = 0 ,
r

para todo t e todo .


P.S. 1. A determinacao dos auto-valores nao precisa ser feita completamente, caso envolva a solucao
suficiente deixar indicado como proceder.
de uma equacao transcendente. E
P.S. 2. A solucao para f requer o uso de funcoes de Bessel e de Neumann (funcoes de Bessel de
importante determinar as relacoes de ortogonalidade a serem usadas.
segundo tipo). E
P.S. 3. Nao esqueca que a condicao inicial para f e
f (r, , 0) = u0 (r, ) g(r) .
6

Captulo 11
Rudimentos da Teoria das Equaco
es Diferenciais
Parciais
Conte
udo
11.1 Defini
ca
o e Alguns Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . 586
11.2 O M
etodo de Separa
ca
o de Vari
aveis

. . . . . . . . . . . . . . . . . . . . . 587

11.3 Unicidade de Solu


co
es de Equa
co
es Diferenciais Parciais . . . . . . . . . . 590
11.3.1 Casos Simples. Discussao Preliminar . . . . . . . . . . . . . . . . . . . . . . . 590
11.3.2 Unicidade de Solucoes. Generalizacoes . . . . . . . . . . . . . . . . . . . . . . 597

este captulo apresentaremos uma breve introducao a` teoria das equacoes diferenciais parciais.
Serao apresentados alguns metodos de resolucao mais comummente empregados e alguns
teoremas de unicidade de solucao de importancia na justificativa daqueles metodos. Assim
como as equacoes diferenciais ordinarias, introduzidas no Captulo 5, pagina 260, equacoes
diferenciais parciais sao de guande importancia nas Ciencias Naturais por expressarem leis fsicas.
Ainda que tenham se desenvolvido em paralelo, a teoria das equacoes diferenciais ordinarias dintinguese um tanto da teoria das equacoes diferenciais parciais, pois na segunda menos resultados gerais sao
conhecidos e os metodos de resolucao e de analise qualitativa sao mais intrincados e limitados em escopo.
Por exemplo, nao existem na teoria das equacoes diferenciais parciais, resultados sobre existencia de
solucao que sejam tao gerais quanto os Teoremas de Peano e de Picard-Lindelof, validos para equacoes
diferenciais ordinarias (vide Teorema 5.1, pagina 280 e Teorema 5.2, pagina 281). Varios metodos de
resolucao de equacoes diferenciais parciais, como o metodo de separacao de variaveis e o metodo das
caractersticas, envolvem a resolucao de equacoes diferenciais ordinarias e vamos nos dedicar a eles
aqui. Exemplos de aplicacoes poderao ser encontrados no Captulo 10, pagina 544.

11.1

Defini
c
ao e Alguns Exemplos

Exemplos de equa
co
es diferenciais parciais de interesse
Tipos de equa
co
es lineares parciais
Lineares, homogeneas, nao-homogeneas, semi-lineares etc...
Classifica
c
ao de equa
co
es lineares de segunda ordem

586

JCABarata. Curso de Fsica-Matem


atica

11.2

Vers
ao de 29 de setembro de 2005.

Captulo 11

587/1304

O M
etodo de Separa
c
ao de Vari
aveis

O chamado metodo de separaca


o de vari
aveis e freq
uentemente empregado na solucao de certas equacoes
diferenciais parciais lineares e homogeneas. Quer a sorte que muitas equacoes de interesse em Fsica
pertencem a` classe de equacoes para as quais esse metodo e eficaz, uma das razoes da sua popularidade.
Uma segunda vantagem desse metodo reside no fato de o mesmo transformar um problema de equacoes
diferenciais parciais em uma serie de problemas de equacoes diferenciais ordinarias, sobre as quais
muito mais e conhecido no que concerne a metodos de solucao. Uma terceira razao para o interesse no
metodo de separacao de variaveis reside no fato de o mesmo permitir explorar simetrias de determinados
problemas (por exemplo, a simetria por rotacoes), o que e de particular utilidade em certas situacoes.
O metodo de separacao de variaveis foi descoberto originalmente por Daniel Bernoulli 1 no estudo de
diversas equacoes diferenciais, como a equacao da corda vibrante.
Vamos apresentar o metodo de separacao de variaveis no tratamento de uma equacao de segunda
ordem em duas variaveis reais, digamos x e y, definidas em um certo domnio de 2 . Seja a equacao a
derivadas parciais da forma


A(x)

2u
2u
u
u
+
B(y)
+ C(x)
+ D(y)
+ (E(x) + F (y))u = 0 ,
2
2
x
y
x
y

(11.1)

sendo que ou A ou B nao e identicamente nula (de modo que a equacao seja de segunda ordem em
pelo menos uma das variaveis, mas nao-necessariamente em ambas) a ser satisfeita por uma funcao
incognita de duas variaveis u(x, y). Como claramente indicado acima, as funcoes A, C e E sao funcoes
de uma u
nica variavel, a saber x, enquanto que B, D e F sao funcoes de uma u
nica variavel, a saber
preciso supor muito pouco sobre essas funcoes, por exemplo, que as mesmas sao contnuas, mas
y. E
mesmo essa hipotese pode ser enfraquecida, o que ocorre em muitos exemplos de interesse (vide as
proximas secoes). Por enquanto, deixemos de lado consideracoes sobre o domnio de validade D 2
da equacao acima e sobre condicoes de contorno e concentremo-nos em procurar solucoes particulares
de (11.1).


O metodo de separacao de variaveis consiste em procurar solucoes particulares para a equacao (11.1)
que sejam da forma u(x, y) = X(x)Y (y). Antes de fazermos perguntas sobre a aplicabilidade dessa
ideia, vejamos a que a mesma conduz. Inserindo o Ansatz u(x, y) = X(x)Y (y) na equacao (11.1),
obtem-se
A(x)X 00 (x)Y (y) + B(y)X(x)Y 00 (y) + C(x)X 0 (x)Y (y) + D(y)X(x)Y 0 (y) + (E(x) + F (y))X(x)Y (y) = 0 .
Dividindo-se essa expressao por X(x)Y (y), obtem-se
A(x)

X 00 (x)
Y 00 (y)
X 0 (x)
Y 0 (y)
+ B(y)
+ C(x)
+ D(y)
+ E(x) + F (y) = 0 .
X(x)
Y (y)
X(x)
Y (y)

Aqui, e de se observar que cada termo da expressao acima e funcao de uma u


nica variavel. Separando
os termos que dependem de cada variavel em cada lado da igualdade, obtem-se da u
ltima expressao




X 00 (x)
X 0 (x)
Y 00 (y)
Y 0 (y)
A(x)
+ C(x)
+ E(x) = B(y)
+ D(y)
+ F (y) .
X(x)
X(x)
Y (y)
Y (y)
1

Daniel Bernoulli (1700-1782).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

588/1304

Chegamos agora ao ponto crucial que justifica o que foi feito ate aqui. Do lado esquerdo da igualdade
acima encontra-se uma funcao que depende apenas de x e do lado direito uma funcao apenas de y. Ora,
como ambas as variaveis sao independentes, uma tal igualdade so e possivel se ambos os lados forem
iguais a uma mesma constante, que denotaremos por , a qual e denominada constante de separaca
o.
Assim,




X 00 (x)
X 0 (x)
Y 00 (y)
Y 0 (y)
A(x)
+ C(x)
+ E(x) = B(y)
+ D(y)
+ F (y) = ,
X(x)
X(x)
Y (y)
Y (y)
o que implica o par de equacoes
A(x)X 00 (x) + C(x)X 0 (x) + (E(x) )X(x) = 0 ,

(11.2)

B(y)Y 00 (y) + D(y)Y 0 (y) + (F (y) + )Y (y) = 0 ,

(11.3)

cada qual sendo uma equacao diferencial ordinaria. Ambas as equacoes podem agora, em princpio, ser
tratadas separadamente com os metodos de solucao disponveis para equacoes diferenciais ordinarias
de se lembrar, porem,
como por exemplo, o metodo de expansao em serie ou o metodo de Frobenius. E
que ambas as equacoes nao sao totalmente desacopladas, pois tem em comum a presenca da mesma
constante de separacao ainda indeterminada .
Uma pergunta que se coloca nesse momento e se a equacao (11.1) e a forma mais geral de uma
equacao linear de segunda ordem em duas variaveis para a qual o Ansatz u(x, y) = X(x)Y (y) conduz a
equacoes separadas para X e para Y . Nao e do conhecimento do autor que sejam conhecidas condicoes
necessarias e suficientes para a separabilidade de equacoes diferenciais parciais lineares, de modo que a
forma da (11.1) e apenas uma condicao suficiente para separabilidade. Um pouco de experimentacao
(faca!) permite concluir que a separacao dificilmente se da caso haja na equacao um termo com uma
2u
derivada mista xy
, ou se as funcoes A, B etc. nao forem funcoes de uma u
nica variavel especificamente
como explicitado em (11.1), mas ha excessoes, como mostra o exemplo do Exerccio E. 11.3, abaixo.
Outrossim, o metodo de separacao de variaveis dificilmente pode ser feliz no caso de equacoes diferenciais nao-lineares mas, novamente, nao e do conhecimento do autor que isso tenha sido completamente
demonstrado em uma classe grande de exemplos interessantes.
de se notar, porem, que o metodo de separacao de variaveis nao se restringe a equacoes envolvendo
E
apenas duas variaveis, nem a equacoes de segunda ordem. Nosso interesse pelas equacoes de segunda
ordem provem do fato de que a grande maioria das equacoes diferenciais parciais encontrada na Fsica
e de segunda ordem.
E. 11.1 Exerccio. Encontre uma classe de equacoes diferencias parciais de primeira ordem lineares e
homogeneas em duas variaveis x e y para as quais o Ansatz u(x, y) = X(x)Y (y) conduz a equacoes
separadas para X e para Y . Obtenha essas equacoes.
6
E. 11.2 Exerccio. Encontre uma classe de equacoes diferencias parciais de terceira ordem lineares e
homogeneas em duas variaveis x e y para as quais o Ansatz u(x, y) = X(x)Y (y) conduz a equacoes
separadas para X e para Y . Obtenha essas equacoes.
6

JCABarata. Curso de Fsica-Matem


atica

Captulo 11

Vers
ao de 29 de setembro de 2005.

589/1304

E. 11.3 Exerccio. Mostre que uma equacao diferencial da forma


A(x)

2u
u
2u
+
B(y)
+ (C(x) + D(y))
= 0
2
x
xy
x

(11.4)

permite separacao de variaveis na forma u(x, y) = X(x)Y (y). Sugestao: substitua esse Ansatz na equacao
e divida-a por X 0 (x)Y (y), obtendo, com uma constante de separacao ,
A(x)X 00 (x) + (E(x) )X 0 (x) = 0 ,
B(y)Y 0 (y) + (D(y) + )Y (y) = 0 .
Outra sugestao e observar que a equacao (11.4) pode ser reduzida a uma equacao linear de primeira ordem
para u
, a qual e separavel.
6
x
O que determina a constante de separacao ? Em situacoes tpicas ela e determinada pela imposicao
de condicoes de contorno, ou de outras condicoes subsidiarias a` solucao, tais como que ela seja contnua,
ou que ela seja periodica, ou que ela seja limitada, ou que ela seja de quadrado integravel (o que
tipicamente ocorre na Mecanica Quantica) etc. Os exemplos que se seguirao ilustrarao essas diversas
situacoes.
Um certo cuidado aqui e necessario. Para a imposicao de condicoes de contorno ou subsidiarias a`s
solucoes particulares da forma de um produto X(x)Y (y) e necessario que essas condicoes de contorno
possam ser expressas separadamente como condicoes sobre a dependencia em x e sobre a dependencia
em y. Geralmente, isso so e possvel se o domnio D de validade da equacao (entenda-se, a regiao
onde o problema esta definido) seja um retangulo tal como {(x, y) 2 , 0 x L, 0 y M },
um disco {(x, y) 2 , 0 x L, 0 y 2} com uma dependencia periodica de perodo 2
na variavel y (que representaria um angulo, em algum sistema de coordenadas) ou talvez um toro
{(x, y) 2 , 0 x 2, 0 y 2} com uma dependencia periodica de perodo 2 em ambas as
variaveis. Os exemplos sao os melhores mestres nessa discussao.


Assim, mesmo que uma equacao diferencial tenha a forma (11.1) o metodo de separacao de variaveis
sera ineficaz se as condicoes de contorno e subsidiarias nao forem compatveis com solucoes particulares
na forma de um produto.
Um fato importante observado na pratica (vide os exemplos tratados no Captulo 10, pagina 544)
e que ja a imposicao de algumas das condicoes de contorno ou subsidiarias fixa todos os valores
possveis para a constante de separacao e, em muitos casos, esse conjunto de valores possveis e
um conjunto contavel: {n , n }. Para cada uma dessas constantes n havera possivelmente
duas solucoes independentes para a equacao (11.2) e duas solucoes independentes para a equacao
(11.3) (pois sao equacoes de segunda ordem2 ). Assim, para cada n teremos associada uma cons(1)
(2)
tante de separacao n , duas solucoes linearmente independentes, Xn e Xn , para a equacao (11.2)
(a solucao geral sendo uma combinacao linear de ambas) e duas solucoes linearmente independen(1)
(2)
tes, Yn e Yn , para a equacao (11.3) (a solucao geral sendo uma combinacao linear de ambas). A
solu
  pelo Ansatz u(x, y) = X(x)Y (y) assume assim, para cada n, a forma
 cao particular fornecida
(2)
(1)
(2)
(1)
n Xn (x) + n Xn (x) n Yn (y) + n Yn (y) , onde n , n , n e n sao constantes.


Nada impede, porem, que se tenha A 0 ou B 0, em cujo caso uma das equaco
es (11.2) ou (11.3) ser
a de primeira
ordem. Tal ocorre, por exemplo, na equaca
o de difus
ao. Vide p
agina 545.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

590/1304

Como a equacao (11.1) e linear e homogenea, e as condicoes de contorno sao homogeneas, o princpio
de sobreposicao se aplica e uma solucao mais geral seria obtida somando-se as solucoes obtidas para
cada n, ou seja,


X
n Xn(1) (x) + n Xn(2) (x) n Yn(1) (y) + n Yn(2) (y) .
(11.5)
n

As constantes n , n , n e n devem ainda ser fixadas atraves das demais condicoes de contorno e
subsidiarias (que nao aquelas que ja foram usadas para fixar os n s) e, apos isso, e preciso tambem
demonstrar que a serie (11.5) assim obtida converge.

Sera, afinal, a expressao (11.5) a solucao completa do problema, que resolve a equacao diferencial
e satisfaz todas as condicoes de contorno e subsidiarias? Em muitos casos, a resposta e sim, o que
pode ser provado por teoremas que garantem a unicidade de solucoes de certas equacoes diferenciais
que satisfacam certas condicoes de contorno. Vide Secao 11.3, pagina, 590.
Como comentamos, e como ilustram os exemplos que se seguirao, o metodo de separacao de variaveis
delineado acima e feliz em resolver varios problemas envolvendo equacoes diferenciais parciais de interesse em Fsica. Mas, o estudante nao deve adquirir a falsa impressao de que o metodo de separacao
de variaveis e o u
nico metodo de solucao disponvel para equacoes diferenciais parciais. Muitos outros metodos sao oferecidos na gigantesca literatura sobre o assunto (vide para tal [27, 28] ou mesmo
[141]), cada qual empregavel em uma classe especfica de equacoes. Para nos limitarmos a um u
nico
exemplo, citamos o chamado metodo das caratersticas, que tambem permite a resolucao de certas
equacoes diferenciais parciais em termos de equacoes diferenciais ordinarias. Boa parte do estudo de
equacoes diferenciais parciais nao e voltado a` procura de solucoes para as equacoes, mas sim a analises
qualitativas de propriedades das solucoes. Muitas vezes, advem dessas analises informacoes u
teis sobre
o comportamento do sistema de interesse que nao sao facilmente obtenveis diretamente das solucoes,
mesmo caso estas sejam conhecidas (vide para tal [45], [36], [100] [27, 28]).

11.3

Unicidade de Solu
co
es de Equa
co
es Diferenciais Parciais

Como ja comentamos, teoremas de unicidade de solucoes de equacoes diferenciais parciais submetidas a


condicoes iniciais e de contorno sao de importancia crucial para justificar certos metodos de resolucao,
como por exemplo o metodo de separacao de variaveis e de expansao em modos (como os modos
de vibracao de cordas ou membranas vibrantes, por exemplo), tal como discutido em diversos dos
problemas tratados no Captulo 10, pagina 544. No que segue, apresentaremos alguns desses teoremas,
concentrando-nos em casos de de maior interesse em problemas fsicos. Alguns desses teoremas sao
evocaremos na discussao do Captulo 10.

11.3.1

Casos Simples. Discuss


ao Preliminar

Primeiramente, exporemos o leitor aos teoremas de unicidade de solucao mais simples e seus metodos de
demonstracao. A intencao e pedagogica e por isso escolhemos dois tipos de equacoes de interesse fsico,
as equacoes de difusao e de onda com coeficientes constantes em uma dimensao espacial. Generalizacoes
serao apresentadas adiante na Secao 11.3.2, pagina 597.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

591/1304

Unicidade de solu
co
es para a equa
c
ao de difus
ao em um intervalo finito
A proposicao que segue apresenta condicoes que garantem unicidade para as solucoes da equacao
de difusao a coeficientes constantes definida em um intervalo finito da reta sob certas condicoes iniciais
e de contorno.
Proposi
c
ao 11.1 Considere a equaca
o diferencial
2u
u
K 2 = F (x, t) ,
t
x

(11.6)

com K > 0 constante, e F e uma funca


o dada (em princpio arbitr
aria). Acima, x [0, L] para algum
L > 0 e t 0. As condico
es iniciais s
ao
u(x, 0) = u0 (x),
onde u0 : [0, L]


(11.7)

e uma funca
o arbitr
aria. Considere os seguintes tipos de condico
es de contorno.

I. Condicoes de Dirichlet3 :
u(0, t) = f1 (t), u(L, t) = f2 (t) .
II. Condicoes de Neumann4 :
u
u
(0, t) = f3 (t),
(L, t) = f4 (t) .
x
x
Acima fi s
ao funco
es arbitr
arias.
Ent
ao, caso exista, a soluca
o de (11.6) sob as condico
es iniciais (11.7) e u
nica tanto sob condico
es
de contorno do tipo de Dirichlet quanto sob condico
es de contorno do tipo de Neumann.
2
A proposicao acima garante unicidade da solucao para qualquer funcao F (x, t) e quaisquer funcoes
fi , mas nao garante a existencia de solucoes. Para garantir existencia e exibir uma solucao (por exemplo
em termos de series de Fourier) e preciso ser mais restritivo quanto a` funcao F e a`s funcoes f i . A demonstracao da Proposicao 11.1 e apresentada na forma do exerccio dirigido que segue. Generalizacoes
encontram-se na Proposicao 11.5, pagina 598, e a Proposicao 11.6, pagina 601.
E. 11.4 Exerccio. Prova da Proposica
o 11.1.
Para demonstrar a unicidade de solucao da equacao
diferencial (11.6) sob as condicoes acima procede-se da seguinte forma. Suponha que haja duas solucoes u
e v da equacao acima, ambas satisfazendo as mesmas condicoes de contorno e as mesmas condicoes iniciais.
Defina w(x, t) := u(x, t) v(x, t). Desejamos mostrar que w = 0, implicando que as duas solucoes u e
v sao em verdade iguais.
a. Mostre que w satisfaz a equacao diferencial homogenea
w
2w
K
= 0.
t
x2
3
4

Johann Peter Gustav Lejeune Dirichlet (1805-1859).


Carl Neumann (1832-1925).

(11.8)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

592/1304

b. Mostre que w satisfaz a condicao inicial w(x, 0) = 0.


c. Mostre que w satisfaz as condicoes de contorno
w(0, t) = 0, w(L, t) = 0 ,

(11.9)

no caso de condicoes de Dirichlet ou


w
w
(0, t) = 0,
(L, t) = 0 ,
x
x

(11.10)

no caso de condicoes de Neumann.


d. Defina
E(t) =
Mostre que E(t) 0 para todo t. (Trivial).

(w(x, t))2 dx .

e. Mostre que E(0) = 0. (Use as condicoes iniciais de w).


f. Mostre, diferenciando dentro da integral, usando integracao por partes e usando a equacao diferencial
(11.8), que
0

E (t) = 2K

L
0

w
x

2

w
w
(0, t)
dx + 2K w(L, t) (L, t) w(0, t)
x
x

g. Conclua que
0

E (t) = 2K

L
0

w
x

2

dx

supondo as condicoes de contorno (11.9) ou (11.10) para w. Conclua que, sob essas condicoes,
E 0 (t) 0 para todo t.
h. Conclua de g, d e e que E(t) = 0 para todo t.
i. Conclua da que w(x, t) e identicamente nula.

6
Uma das razoes de expormos os passos acima de forma tao detalhada e pedagogica: esses passos sao
seguidos, nem sempre com a mesma trivialidade, em outras demonstracoes de teoremas de unicidade
de solucoes de equacoes diferenciais parciais. Para teoremas de unicidade validos em generalizacoes da
equacao de difusao vide, por exemplo, a Proposicao 11.5, pagina 598, e a Proposicao 11.6, pagina 601.
Podemos generalizar um pouco a proposicao acima, mas apenas para condicoes de Dirichlet. Isso e
o conte
udo da proposicao que segue.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

593/1304

Proposi
c
ao 11.2 Considere a equaca
o diferencial
2u
u
u
K 2
= F (x, t) ,
t
x
x

(11.11)

o dada (em princpio arbitr


aria). Acima, x [0, L]
com K > 0, , constantes, e F e uma funca
para algum L > 0 e t 0. As condico
es iniciais s
ao


u(x, 0) = u0 (x),
onde u0 : [0, L]


(11.12)

e uma funca
o arbitr
aria. Ent
ao, para condico
es de Dirichlet:
u(0, t) = f1 (t), u(L, t) = f2 (t) ,

onde fi s
ao funco
es arbitr
arias, a soluca
o de (11.11) e u
nica, caso exista.

Prova. A prova segue os mesmos passos descritos no Exerccio E. 11.4, mas agora

2

Z L 

w
w
w
0
E (t) = 2K
dx + 2K w(L, t) (L, t) w(0, t) (0, t) + w(L, t)2 w(0, t)2 .
x
x
x
0

Porem, os dois u
ltimos termos sao nulos, em funcao das condicoes de Dirichlet, e obtemos a mesma
expressao para E 0 (t) que no caso do Exerccio E. 11.4.

Unicidade de solu
co
es para a equa
c
ao de ondas em um intervalo finito
Vamos agora considerar outra equacao importante em Fsica, a equacao de ondas. A proposicao que
segue apresenta condicoes que garantem unicidade para as solucoes da equacao de ondas a coeficientes
constantes definida em um intervalo finito da reta sob certas condicoes iniciais e de contorno.
Proposi
c
ao 11.3 Considere a equaca
o diferencial
2
2u
u
2 u

c
+
= F (x, t)
2
2
t
x
t

(11.13)

com c > 0, 0, constantes, sendo F uma funca


o dada (em princpio arbitr
aria). Acima, x [0, L]
para algum L > 0 e t 0. As condico
es iniciais s
ao
u(x, 0) = u0 (x),
onde u0 , v0 : [0, L]
ramos


u
(x, 0) = v0 (x) ,
t

(11.14)

s
ao igualmente funco
es arbitr
arias. Para as condico
es de contorno, conside-

I. Condicoes de Dirichlet:
u(0, t) = f1 (t), u(L, t) = f2 (t) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

594/1304

II. Condicoes de Neumann:


u
u
(0, t) = f3 (t),
(L, t) = f4 (t) .
x
x
Acima fi s
ao funco
es arbitr
arias.
Ent
ao, caso exista, a soluca
o de (11.13) com as condico
es iniciais (11.14) e u
nica tanto no caso de
condico
es de contorno do tipo de Dirichlet quando do tipo de Neumann.
2
A proposicao acima garante unicidade da solucao para qualquer funcao F (x, t) e quaisquer funcoes
fi , mas nao garante a existencia de solucoes. Para garantir existencia e exibir uma solucao (por
exemplo em termos de series de Fourier) e preciso ser mais restritivo quanto a` funcao F e a`s funcoes
fi . A proposicao acima pode ser bastante generalizada. Isso e apresentado na Proposicao 11.7, pagina
602.
Para demonstrar a unicidade de solucao da equacao
E. 11.5 Exerccio. Prova da Proposica
o 11.3.
diferencial sob as condicoes acima proceda da seguinte forma: suponha que haja duas solucoes u e v da
equacao acima, ambas satisfazendo as mesmas condicoes de contorno e as mesmas condicoes iniciais. Defina
w(x, t) = u(x, t) v(x, t). Desejamos mostrar que w = 0, implicando que as duas solucoes u e v sao,
em verdade, iguais.
a. Mostre que w satisfaz a equacao diferencial homogenea
2
w
2w
2 w
= 0.

c
+
2
2
t
x
t

b. Mostre que w satisfaz as condicoes iniciais


w
(x, 0) = 0
t

w(x, 0) = 0,
c. Mostre que w satisfaz as condicoes de contorno

w(0, t) = 0, w(L, t) = 0 ,

(11.15)

no caso de condicoes de Dirichlet ou


w
w
(0, t) = 0,
(L, t) = 0
x
x

(11.16)

no caso de condicoes de Neumann.


d. Defina
E(t) =

L
0

"

Mostre que E(t) 0 para todo t. (Trivial).

w
t

2

+ c2

w
x

2 #

dx .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

595/1304

e. Mostre que E(0) = 0. (Use as condicoes iniciais de w).


f. Mostre, diferenciando dentro da integral e usando integracao por partes, que


Z L
2
w 2 w
2 w
0
c
dx .
E (t) = 2
t t2
x2
0
Para a integracao por partes e preciso usar as condicoes de contorno (11.15) ou (11.16) para w.
g. Usando a equacao diferencial de w conclua que
0

E (t) = 2

L
0

w
t

2

dx .

e, portanto, E 0 (t) 0 para todo t.


h. Conclua de g, d e e que E(t) = 0 para todo t.
i. Conclua da que w(x, t) e uma constante, ou seja, nao depende de x e t. Disso, conclua pela condicao
inicial w(x, 0) = 0 que w e identicamente nula.

6
Unicidade de solu
c
ao para as equa
co
es de Laplace e Poisson em regi
oes finitas
De grande importancia em problemas de Eletrostatica, Magnetostatica, Mecanica dos Fluidos ou em
problemas de transporte de calor e a questao da unicidade de solucao da equacao de Laplace (~x) = 0
ou da de Poisson5 (~x) = (~x) sob certas condicoes de contorno. Para o caso de regioes limitadas
essa questao e respondida na seguinte proposicao.
Proposi
c
ao 11.4 Considere-se o problema de determinar a soluca
o da equaca
o de Poisson (~x) =
(~x) (a equaca
o de Laplace e o caso particular em que (~x) 0) em tres dimens
oes em uma regi
ao
R, compacta, conexa, limitada por uma superfcie fechada, retific
avel e orient
avel R, de forma que
seja contnua e diferenci
avel em R satisfazendo em R uma das seguintes condico
es de contorno:
1. Condicao de Dirichlet. Para todo ~x R vale (~x) = f (~x), para uma funca
o f dada.
2. Condicao de Neumann.
Para todo ~x R vale
(~x) = g(~x), para uma funca
o g dada, onde
n


~ x) ~n(~x) e a chamada derivada normal de em ~x R, ~n(~x) sendo um versor


(~x) := (~
n
normal a R em ~x R, apontando para fora de R.
3. Condicao mista. Para todo ~x R vale (~x) + a(~x)
(~x) = h(~x), onde h e uma funca
o dada
n
e a e contnua por partes, n
ao-identicamente nula e n
ao-negativa, ou seja, a(~x) 0 para todo
~x R.

Simeon Denis Poisson (1781-1840).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

596/1304

Ent
ao, no caso de uma condica
o de Dirichlet ou mista a soluca
o e u
nica, se existir, e no caso de
uma condica
o de Neumann a soluca
o e u
nica a menos de uma constante aditiva, se existir.
Mutatis mutantis, as afirmaco
es acima s
ao tambem v
alidas em duas dimens
oes, ou mesmo em
quatro ou mais dimens
oes.
2
Prova. Vamos supor que haja duas solucoes u e v da equacao (~x) = (~x) em R, ambas satisfazendo
a mesma condicao de contorno, de Dirichlet, de Neumann ou mista, em R. Entao, a funcao w := u v
obviamente satisfaz w = 0 em R e uma das seguintes condicoes de contorno homogeneas:
1) w(~x) = 0 para todo ~x R (no caso de uma condicao de Dirichlet),
2)

w
(~x)
n

= 0 para todo ~x R (no caso de uma condicao de Neumann) ou

3) w(~x) + a(~x) w
(~x) = 0 para todo ~x R (no caso de uma condicao mista).
n
Considere-se a quantidade
U :=

Z 
R

~ x)
w(~

2

d3 ~x .


 
2

2
evidente pela definicao que U 0. Como w w
~
~
~
E
= w
+ ww = w
(pois w = 0),
temos, pelo Teorema de Gauss,
Z


{
w
Gauss
3
~
(~x) d(~x) ,
(11.17)
w(~x)
U =
w w (~x) d ~x =
n
R
R

d(~x) sendo a medida de integracao de superfcie em R.


No caso de uma condicao de Neumann ou de Dirichlet o lado direito de (11.17) anula-se, pois ou
w(~x) = 0 para todo ~x R (Dirichlet) ou w
(~x) = 0 para todo ~x R (Neumann).
n
2

{
w
(~x) d(~x) 0, pois
No caso de uma condicao mista o lado direito de (11.17) fica
a(~x)
n
R
a foi suposta nao-negativa. Como, de acordo com a definicao, U 0, conclumos novamente que U e
nulo.
~ = 0 em
Assim, para cada uma das tres condicoes conclumos que U = 0, o que implica que w
todo R. Logo, u(~x) = v(~x) + c, onde c e uma constante. No caso de uma condicao de Dirichlet essa
constante deve anular-se, pois u e v satisfazem as mesmas condicoes em R. O mesmo se da para uma
condicao mista. No caso de uma condicao de Neumann essa constante pode ser arbitraria.
Mutatis mutantis, a demonstracao das afirmacoes de acima nao se altera em duas ou mais dimensoes.

Unicidade de solu
c
ao de EDPs. Um contra-exemplo
Sob a luz das Proposicoes 11.1, 11.2, 11.3, 11.4, 11.5 e 11.6 (paginas 591, 593, 593, 595, 598, e
601, respectivamente), o estudante nao deve ser levado a pensar que a unicidade seja uma propriedade

JCABarata. Curso de Fsica-Matem


atica

Captulo 11

Vers
ao de 29 de setembro de 2005.

597/1304

comum a todas as equacoes diferenciais parciais lineares com as condicoes iniciais e de contorno como
as que tratamos. Vejamos um contra-exemplo.
E. 11.6 Exerccio. Seja a equacao diferencial linear e homogenea
(1 2x)t

u
u
x(1 x)
= 0,
t
x

para x [0, 1], t 0, com a condicao inicial u(x, 0) = 0 e as condicoes de contorno u(0, t) = u(1, t) = 0.
a. Esse problema tem infinitas solucoes. Mostre que todas as funcoes da forma v (x, t) = [x(1 x)t]
com > 0 satisfazem a equacao diferencial, a condicao inicial e as condicoes de contorno acima.
Observe que a funcao u(x, t) 0 tambem satisfaz a equacao diferencial acima, assim como a condicao
inicial e as condicoes de contorno.
b. Seja 0 < a < b < e h uma funcao contnua de [a, b] em
wh (x, t) =

. Mostre que

b
a

h() [x(1 x)t] d

tambem satisfaz a equacao diferencial, a condicao inicial e as condicoes de contorno acima.


6

11.3.2

Unicidade de Solu
co
es. Generaliza
co
es

Nesta secao continuaremos a discussao sobre teoremas de unicidade de solucoes de equacoes diferenciais
parciais de interesse, particularmente para versoes mais gerais das equacoes de onda e de difusao, em
uma ou mais dimensoes espaciais.
O problema de determinar solucoes de equacoes diferenciais submetidas a condicoes iniciais e
freq
uentemente demoninado problema de Cauchy.
Unicidade de solu
c
ao para a equa
c
ao de difus
ao em regi
oes finitas
A proposicao que segue estabelece unicidade de solucao para uma forma bastante geral da equacao
de difusao definida em um conjunto pre-compacto6 e conexo D de n , para todo n 1, sob certas
condicoes iniciais e certas condicoes de contorno, que podem ser do tipo de Dirichlet 7 , de Neumann8
ou mistas (vide abaixo), generalizando assim a Proposicao 11.1, da pagina 591.


Um conjunto e dito ser pre-compacto se seu fecho for compacto. No caso de


somente se for fechado e limitado.
7
Johann Peter Gustav Lejeune Dirichlet (1805-1859).
8
Carl Neumann (1832-1925).

, um conjunto e compacto se e

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

598/1304

Proposi
c
ao 11.5 Consideremos para uma funca
o real u a equaca
o diferencial linear, denominada
equaca
o de difus
ao, dada por
(~x)



u
~ (~x, t)u(~
~ x, t) + (~x)u(~x, t) = (~x, t) ,
(~x, t)
t

definida para ~x em um conjunto n


ao-vazio, aberto, conexo e limitado D
pre-compacto e conexo.

(11.18)

, n 1. D e, assim,

Suporemos que e s
ao contnuas por partes com (~x) 0 e (~x) 0, ambas podendo se anular
apenas em um conjunto de medida nula. Suporemos tambem que e contnua e diferenci
avel e que
(~x, t) 0.

Denotaremos por D o fecho de D (que e compacto, pois D e limitado) e denotaremos por D = D\D
a fronteira de D. Acima, (~x, t) e uma funca
o real dada de ~x e t que, se n
ao nula, faz de (11.18) uma
equaca
o n
ao-homogenea. Sobre a regi
ao D, suporemos ainda que D seja diferenci
avel e orient
avel, de
modo que em qualquer ponto ~x de D possamos definir o versor (vetor de comprimento 1) ~n(~x) normal
a
` D no ponto ~x e apontando para fora de D.
Iremos supor que a funca
o u esteja submetida a condico
es iniciais que fixam seu valor em t = 0:
u(~x, 0) = u0 (~x) ,

(11.19)

~x D, onde a funca
o real u0 e um dado do problema (denominado dado de Cauchy). Alem disso,
iremos supor que u(~x, t) esteja submetida a condico
es na fronteira D, as chamadas condico
es de
contorno. Trataremos dos seguintes tipos de condico
es de contorno:
I. Condicoes de Dirichlet:
u(~x, t) = (~x, t)
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada.
II. Condicoes de Neumann:

u
(~x, t) = (~x, t)
n
u
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada. Acima, n
representa a
u
~
derivada normal de u a
` superfcie D, ou seja, n (~x, t) = ~n(~x) u(~x, t), ~x D.

III. Condicoes mistas: para uma funca


o contnua (~x, t) 0, definida em D para todo t 0,
tem-se
u
u(~x, t) + (~x, t) (~x, t) = (~x, t)
n
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada.
Ent
ao, para cada uma das condico
es de contorno descritas acima, a soluca
o do problema de Cauchy
de determinar a soluca
o (11.18) para as condico
es iniciais (11.19) e u
nica, caso exista.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

599/1304

Vide tambem a Proposicao 11.6 para uma generalizacao. Antes de passarmos a` demonstracao da
Proposicao 11.5, facamos alguns comentarios.
O leitor deve ter notado que no enunciado da Proposicao 11.5 nao sao feitas restricoes a`s funcoes
, , e , acima, pois, de fato, restricoes nao sao necessarias para garantir-se unicidade. Para uma
prova de existencia de solucao, porem, certamente sao necessarias restricoes a essas funcoes, tais como
continuidade por partes etc. Nao trataremos de condicoes gerais de existencia aqui.
Na Proposicao 11.5, acima, a regiao D e limitada (tecnicamente, e pre-compacta e conexa). O
estudante pode perguntar-se o que ocorre com a questao da unicidade se considerarmos a equacao de
difusao, equacao (11.18), em regioes abertas, conexas, mas nao-limitadas, como n , por exemplo. Nesse
caso, tem-se que considerar outras condicoes de contorno no infinito e os metodos de demonstracao
abaixo nao funcionam. Sob condicoes convenientes, e possvel demonstrar unicidade de solucao, mas algumas surpresas interessantssimas ocorrem. Vide para tal a fascinante discussao de [75], especialmente
seus captulos 67 e 68.


A equacao (11.18) pode ser interpretada como a equacao de difusao de calor sem conveccao em um
meio homogeneo de constante de difusao (~x, t), a funcao u(~x, t) representando a temperatura do
meio no ponto ~x no instante t. Nessa interpretacao, para o caso em que para e sao identicamente
nulas, a equacao (11.18) e uma representacao matematica de uma lei fsica denominada Lei de Fourier 9
do transporte de calor. Vide [33]. A Lei de Fourier foi originalmente obtida experimentalmente e e ate
hoje um problema de pesquisa demonstra-la teoricamente a partir de primeiros princpios usando os
metodos da Mecanica Estatstica, especialmente no caso quantico. O termo (~x, t) tem a interpretacao
de uma fonte de calor externa e o termo (~x, t)u(~x, t) com 0 representa uma dissipacao de calor,
por exemplo, por emissao de radiacao.
As tres condicoes de contorno listadas acima manifestam condicoes fsicas a`s quais o sistema definido
em D se submete em seu contorno D. Consideremos a interpretacao de (11.18) como a equacao de
difusao de calor sem conveccao em um meio homogeneo. Fisicamente mais precisas sao as condicoes
u
(~x, t), vale
mistas, que afirmam que para o fluxo de calor (para fora de D) por unidade de area, n
u
1
n (~x, t) = (~x, t) (u(~x, t) (~x, t)). De acordo com a Lei de Fourier do transporte de calor (vide
[33]), isso diz-nos que em cada ponto ~x D o calor flui do sistema a` temperatura u(~x, t) para um
banho termico externo a` temperatura (~x, t), atraves da superfcie de contacto cuja constante de
difusao e (~x, t), a qual dependente do contacto entre o sistema e o meio, do material que os compoe
etc., e por isso pode depender de ~x e t. As condicoes de Dirichlet significam que cada ponto de ~x de
D esta em contacto com um banho termico a` temperatura (~x, t) que difunde calor perfeitamente ao
sistema nos pontos de contacto, ou seja, vale a aproximar por zero a constante de difusao de contacto
(o que e uma boa aproximacao no caso de contactos metalicos). As condicoes de Neumann significam
u
que, cada ponto de ~x de D, o fluxo de calor (para fora de D) por unidade de area, n
, e fixado em
(~x, t). Tal se da, por exemplo, se u for desprezvel face a` temperatura do meio externo, em cujo caso
teramos, comparando com o caso das condicoes mistas, = /. Um caso comum e aquele em que
e nula, o que corresponde a colocar o sistema em contacto com um isolante termico perfeito, ou seja,
para o qual e proximo ao infinito.
Prova da Proposicao 11.5. Afirmamos que sob as condicoes descritas na proposicao, a solucao de
9

Jean Baptiste Joseph Fourier (1768-1830). Os trabalhos de Fourier na resoluca


o da equaca
o de difus
ao de calor em
uma dimens
ao o conduziram a
`s chamadas series de Fourier.

JCABarata. Curso de Fsica-Matem


atica

Captulo 11

Vers
ao de 29 de setembro de 2005.

600/1304

(11.18) e u
nica, caso exista. Para tal, vamos supor que u e v sejam duas solucoes reais de (11.18), ambas
satisfazendo as mesmas condicoes iniciais e as mesmas condicoes de contorno, quer sejam de Dirichlet, de
Neumann ou mistas, descritas acima. Consideremos a funcao w definida por w(~x, t) := u(~x, t)v(~x, t).
Como (11.18) e linear, e facil constatar que w satisfaz a equacao homogenea


w
~
~
(~x)
(~x, t) (~x, t)w(~x, t) + (~x)w(~x, t) = 0 ,
t

(11.20)

para todo ~x D e todo t 0, assim como a condicao inicial w(~x, 0) = 0, ~x D. Quanto a`s condicoes
de contorno teremos, para o caso de condicoes de Dirichlet, w(~x, t) = 0 para todo ~x D e todo t 0.
Para o caso de condicoes de Neumann, w
(~x, t) = 0 para todo ~x D e todo t 0. Para o caso de
n
(~
x
,
t)
= 0 para todo ~x D e todo t 0.
condicoes mistas, w(~x, t) + (~x, t) w
n

Desejamos mostrar que w e identicamente nula, o que prova que u e v sao identicas, estabelecendo
unicidade de solucao sob as condicoes mencionadas. Para tal, consideremos a expressao

Z
Z t Z

2 n
0 2 n
(~x) w(~x, t ) d ~x dt0 .
(11.21)
A(t) =
(~x) w(~x, t) d ~x + 2
0

evidente que A(t) 0 para todo t 0. Tem-se, porem, A(0) = 0, pois em t = 0 a funcao w anula-se
E
(pela condicao inicial para w). Como w e diferenciavel em relacao a t, podemos calcular a derivada
d
A(t) por
dt
Z
Z
2 n
2
dA

(t)
=
(~x)
w(~x, t) d ~x + 2
(~x) w(~x, t) dn~x
dt
t
D
D
Z
Z
2
w
n
=
2
w(~x, t)(~x)
(~x, t) d ~x + 2
(~x) w(~x, t) dn~x
t
D
D
Z
Z
h


i
2
(11.20)
n
~
~
=
2
w(~x, t) (~x, t)w(~x, t) (~x)w(~x, t) d ~x + 2
(~x) w(~x, t) dn~x
D

=
Gauss

Z
Z



~ (~x, t)w(~
~ x, t) dn~x
w(~x, t)


Z



2
n
n
~
~
~
(~x, t) w w d ~x
(~x, t) w d ~x

w
(~x, t)w
ds(~x)
n
D

~
(~x, t) w

2

d ~x ,

onde ds(~x)Ze a medida de integracao n1 dimensional em D. Agora, no caso de condicoes de Dirichlet,


w
a integral
(~x, t) w
ds(~x) anula-se pois w anula-se em D, o mesmo se sucedendo no caso de
n
D
condicoes de Neumann, quando w
anula-se em D. Conclumos que em ambos os casos
n
Z

2
dA
~
(t) = 2
(~x, t) w dn~x .
(11.22)
dt
D

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

No caso de condicoes mistas, tem-se


"Z
#
 2
Z

2
w
dA
~
(t) = 2
(~x, t) (~x, t)
ds(~x) +
(~x, t) w
dn~x .
dt
n
D
D

601/1304

(11.23)

Ora, como (~x, t) 0 e (~x, t) 0 , o lado direito de (11.22) e de (11.23) sao ambos claramente
(t) fosse negativa para algum t 0,
menores ou iguais a zero. Porem, como A(0) = 0, se a derivada dA
dt
a funcao A assumiria valores negativos, o que e impossvel pois, como observamos, A(t) 0 para todo
(t) = 0 para todo t, ou seja, A e constante. Mas como A(0) = 0, vale
t 0. Logo, devemos ter dA
dt
A(t) = 0 para todo t 0. Sendo A(t) dada em (11.21) como a somaZ de duas integrais maiores ou
2
iguais a zero, isso implica que ambas se anulam, ou seja, em particular,
(~x) w(~x, t) dn~x = 0 para
D

todo t 0. Como w e contnua e (~x) se anula apenas em um conjunto de medida nula, isso implica
que w e identicamente nula em todo D, para todo t 0, para a condicao inicial e para cada uma das
condicoes de contorno consideradas, que e o que queramos mostrar.

Uma ideia semelhante a` da demonstracao acima sera seguida quando tratarmos da equacao que
descreve vibracoes em meios elasticos na Proposicao 11.7, pagina 602. A Proposicao 11.5 pode ser
extendida, sob certas condicoes, como mostra a seguinte proposicao, que generaliza a Proposicao 11.2
da pagina 593.
Proposi
c
ao 11.6 Consideremos para uma funca
o real u a equaca
o diferencial linear dada por


u
~ x, t) u(~
~ (~x, t)u(~
~ x, t) (~
~ x, t) + (~x)u(~x, t) = (~x, t) ,
(~x) (~x, t)
(11.24)
t

definida sob as mesmas hip


oteses da Proposica
o 11.5, mas assumindo ainda que ~ e continuamente
~
~
diferenci
avel e (~x, t) 0 para todo ~x D e t 0. Seja u submetida a condico
es iniciais que
fixam seu valor em t = 0:
u(~x, 0) = u0 (~x) ,
(11.25)
~x D, onde a funca
o real u0 e um dado do problema (denominado dado de Cauchy) e a condico
es de
contorno do tipo de Dirichlet na fronteira D:
u(~x, t) = (~x, t)
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada.

Ent
ao, a soluca
o do problema de Cauchy de determinar a soluca
o (11.24) para as condico
es iniciais
(11.25) e u
nica, caso exista.
2
O leitor deve notar que a equacao diferencial (11.24) difere de (11.18) pela introducao do termo
contendo o campo ~, sendo que supomos que o divergente desse campo seja maior ou igual a zero em D.
de se notar tambem o fato de a proposicao limitar-se a condicoes de contorno do tipo de Dirichlet.
E
Prova. A prova segue os mesmos passos do caso da Proposicao 11.5, mas obtem-se agora
Z 
Z
Z




2
dA
n
2 n
2 ~
~
~
~
w d ~x +
w ~n(~x) ds(~x) ,
(t) = 2
(~x, t) w d ~x
dt
D
D
D

(11.26)

JCABarata. Curso de Fsica-Matem


atica

Captulo 11

Vers
ao de 29 de setembro de 2005.

602/1304

em lugar de (11.22). A integral sobre D e nula sob condicoes de Dirichlet, pois para elas w anula-se na
~ ~ 0, obtem-se novamente dA (t) 0 sob condicoes de Dirichlet10 , conduzindo
fronteira. Assim, se
dt
a`s mesmas conclusoes que no caso da Proposicao 11.5.
Unicidade de solu
c
ao para a equa
c
ao de vibra
co
es el
asticas em regi
oes finitas
A proposicao que segue estende os resultados de unicidade que obtivemos para a equacao de difusao
na Proposicao 11.5, acima, para uma forma bastante geral da equacao que descreve vibracoes em meios
elasticos, definida em um conjunto pre-compacto e conexo D de n , para todo n 1, sob certas
condicoes iniciais e certas condicoes de contorno, que podem ser do tipo de Dirichlet, de Neumann ou
mistas. Um caso particular importante e a equacao de ondas, de grande relevancia em Fsica, tratado
na Proposicao 11.3 da pagina 593 no caso unidimensional.


Proposi
c
ao 11.7 Consideremos para uma funca
o real u a equaca
o diferencial linear, dada por


u
2u
~ (~x)u(~
~ x, t) + (~x)u(~x, t) = (~x, t) ,
(11.27)
(~x) 2 (~x, t) + (~x, t) (~x, t)
t
t
definida para ~x em um conjunto n
ao-vazio, aberto, conexo e limitado D n , n 1. D e, assim,
pre-compacto e conexo. Assumiremos que e contnua e diferenci
avel e que , e sejam contnuas
por partes. Suporemos tambem que (~x) > 0 e (~x) > 0, exceto em conjuntos de medida nula, onde
podem anular-se. Assumiremos tambem que (~x) 0 e que (~x, t) 0 para todo ~x D e todo t 0.


Denotaremos por D o fecho de D (que e compacto, pois D e limitado) e denotaremos por D = D\D
a fronteira de D. Sobre a regi
ao D, suporemos ainda que D seja diferenci
avel e orient
avel, de modo
que em qualquer ponto ~x de D possamos definir o versor (vetor de comprimento 1) ~n(~x) normal a
` D
no ponto ~x e apontando para fora de D.
Iremos supor que a funca
o u esteja submetida a condico
es iniciais que fixam seu valor em t = 0
assim como o de sua derivada temporal:

u
(~x, 0) = v0 (~x) .
(11.28)
t
~x D, onde as funco
es reais u0 e v0 s
ao dados do problema (denominados dados de Cauchy). Alem
disso, iremos supor que u(~x, t) esteja submetida a condico
es na fronteira D, as chamadas condico
es
de contorno. Trataremos dos seguintes tipos de condico
es de contorno:
u(~x, 0) = u0 (~x) ,

I. Condicoes de Dirichlet:
u(~x, t) = (~x, t)
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada.
II. Condicoes de Neumann:

u
(~x, t) = (~x, t)
n
u
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada. Acima, n
representa a
u
~
derivada normal de u a
` superfcie D, ou seja, n (~x, t) = ~n(~x) u(~x, t), ~x D.

O leitor poderia pensar que poderamos incluir condico


es mistas de contorno e ainda obter dA
dt (t) 0 em (11.26) se
~
~
~
adionamente supusessemos que ~n(~x) 0 em todo D, mas isso e incompatvel com 0, pelo Teorema de Gauss.
10

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

603/1304

III. Condicoes mistas: para uma funca


o contnua (~x, t) 0, definida em D para todo t 0, tem-se
u
u
(~x, t) + (~x, t) (~x, t) = (~x, t)
t
n
para todo ~x D e todo t 0, (~x, t) sendo uma funca
o real dada.
u
anula-se identicamente na fronteira D.
IV. A express
ao (~x) u
t n

Ent
ao, para cada uma das condico
es de contorno descritas acima, a soluca
o do problema de Cauchy
de determinar a soluca
o (11.27) para as condico
es iniciais (11.28) e u
nica, caso exista.
2
A equacao (11.27) descreve vibracoes elasticas em um meio material de densidade (~x) localizado
em D. O termo (~x, t) u
(~x, t) descreve uma dissipacao (por exemplo, por atrito viscoso com um meio
t
externo) e (~x) deve ser interpretado como a tensao do meio no ponto ~x. O termo (~x)u(~x, t) provem
de uma forca harmonica restauradora (caso positivo) agindo sobre cada ponto do meio. Por fim,
(~x, t) representa uma forca externa (por unidade de volume) agindo sobre o sistema no ponto ~x no
instante t. Para uma deducao parcial dessa expressao no caso unidimensional vide, por exemplo, [33].
Um caso particular importante e aquele em que , e sao nulas e e sao constantes positivas,
caso esse em que (11.27) assume a forma da equaca
o de ondas livres
r
2u

2
(~x, t) c u(~x, t) = 0 ,
c =
.
2
t

A constante c tem a interpretacao de velocidade de propagacao das ondas.


Prova da Proposicao 11.7. Afirmamos que sob as condicoes descritas na proposicao, a solucao de
(11.27) e u
nica, caso exista. Para tal, vamos supor que u e v sejam duas solucoes reais de (11.27), ambas
satisfazendo as mesmas condicoes iniciais e as mesmas condicoes de contorno, quer sejam de Dirichlet, de
Neumann ou mistas, descritas acima. Consideremos a funcao w definida por w(~x, t) := u(~x, t)v(~x, t).
Como (11.27) e linear, e facil constatar que w satisfaz a equacao homogenea
(~x)



w
2w
~ (~x)w(~
~ x, t) + (~x)w(~x, t) = 0 ,
(~
x
,
t)
+
(~
x
,
t)
(~
x
,
t)

t2
t

(11.29)

para todo ~x D e todo t 0, assim como as condicoes iniciais w(~x, 0) = 0, e w


(~x, 0) = 0, ~x D.
t
Quanto a`s condicoes de contorno teremos, para o caso de condicoes de Dirichlet, w(~x, t) = 0 para todo
~x D e todo t 0. Para o caso de condicoes de Neumann, w
(~x, t) = 0 para todo ~x D e todo
n
w
w
t 0. Para o caso de condicoes mistas, t (~x, t) + (~x, t) n (~x, t) = 0 para todo ~x D e todo t 0.

Desejamos mostrar que w e identicamente nula, o que prova que u e v sao identicas, estabelecendo
unicidade de solucao sob as condicoes mencionadas. Para tal, consideramos a expressao
#

2
Z "




2
2
(~x) ~
(~x)
(~x) w
E(t) =
(~x, t) +
w(~x, t) +
w(~x, t)
dn~x .
(11.30)
2
t
2
2
D

JCABarata. Curso de Fsica-Matem


atica

Captulo 11

Vers
ao de 29 de setembro de 2005.

604/1304

evidente pelas hipoteses de positividade sobre , e que E(t) 0 para todo t 0. Tem-se, porem,
E
E(0) = 0, pois em t = 0 a funcao w anula-se, assim como sua derivada temporal (pela condicao inicial
para w). Como w e diferenciavel em relacao a t, podemos calcular a derivada dtd E(t) por



Z 
w
2w
w
dE
w
~
~
(t)
=
(~x) 2 + (~x) w
+ (~x)w
dn ~x
dt
t
t
t
t
D




Z 

w
w ~ 
w
(11.29)
~
~
~
=
+ (~x)w (~x) w + (~x) w
(~x, t)
dn~x
t
t
t
D
Z
w n
d ~x
+
(~x) w
t
D
=

=
Gauss

onde

w
n

w
t

2

(~x, t)

w
t

2

(~x, t)

w
t

2

(~x, t)
D

d ~x +

Z 
D

d ~x +

d ~x +

Z
Z




w
w ~ 
~
~
~
(~x)w
+ (~x) w
dn ~x
t
t


~
~ (~x) w w

t
D
(~x)
D

w w
ds(~x) ,
t n

dn~x

(11.31)

e a derivada normal introduzida a` pagina 602.

No caso de condicoes de Dirichlet, w anula-se na fronteira D para todo t e, portanto, tambem sua
derivada temporal se anula. Com isso, a segunda integral em (11.31) vale zero, o que tambem ocorre
para condicoes de Neumann pois, a, w
e nula, assim como para as condicoes de contorno do tipo IV,
n
descritas na pagina 603. Nesses casos tem-se, assim,
 2
Z
w
dE
dn~x ,
(t) =
(~x, t)
dt
t
D
que e menor ou igual a zero, pois supomos (~x, t) 0. Para condicoes de contorno mistas, tem-se

2
2

Z
Z
w
dE
w
n
d ~x
(~x)(~x, t)
ds(~x) ,
(t) =
(~x, t)
dt
t
n
D
D
que e igualmente menor ou igual a zero, pois supusemos que (~x) > 0, (~x, t) 0 e (~x, t) 0.

Para os varios tipos de condicoes de contorno tratados, chegamos ao mesmo tipo de situacao encontrada na prova da Proposicao 11.5: temos que E(t) 0 e que dE
(t) 0 para todo t 0, mas
dt
E(0) = 0. Isso so e possvel se E(t) = 0 para todo t 0. Lembrando a definicao de E(t) em (11.30)
e da hipotese que e sao positivos (exceto, talvez, em conjuntos de medida nula), conclumos que
~ x, t) = 0, o que implica que w(~x, t) e uma
para todo ~x D e todo t 0 tem-se w
(~x, t) = 0 e w(~
t
constante para todo ~x D e todo t 0. Lembrando que w(~x, 0) = 0 pela condicao inicial, conclumos
que w(~x, t) e nula para todo ~x D e todo t 0. Isso implica que as solucoes u e v sao identicas, que
e o que queramos provar.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 11

605/1304

E. 11.7 Exerccio. Se u e uma solucao da equacao (11.27), que descreve vibracoes elasticas em um
meio material, entao a expressao que define E(t) em (11.30), ou seja,
#

2
Z "
2 (~x) 
2
(~x) u
(~x)  ~
E(t) =
u(~x, t) +
u(~x, t)
dn~x ,
(~x, t) +
2
t
2
2
D
representa a energia mecanica dessas vibracoes. Justifique essa afirmacao. Determine, como fizemos acima,
(t). Discuta sob
mas para nao-nula e para condicoes de contorno nao-homogeneas, a expressao de dE
dt
quais circunstancias a energia e conservada.
6

Captulo 12
Introduc
ao ao Problema de Sturm-Liouville
Conte
udo
12.1 Introdu
ca
o

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 607

12.2 O Problema de Sturm . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 611


12.2.1 Resolvendo o Problema de Sturm. A Funcao de Green . . . . . . . . . . . . . 612
12.2.2 O Teorema de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 615
12.3 O Problema de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . 617
12.4 Propriedades B
asicas dos Autovalores e das Autofun
co
es de Problemas
de Sturm-Liouville . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 619
12.4.1 Realidade dos Autovalores. Ortogonalidade de Autofuncoes . . . . . . . . . . 619
12.4.2 A Simplicidade dos Autovalores . . . . . . . . . . . . . . . . . . . . . . . . . . 622
12.4.3 Condicoes Suficientes para a Positividade dos Autovalores . . . . . . . . . . . 623
12.5 A Equa
ca
o Integral de Fredholm . . . . . . . . . . . . . . . . . . . . . . . . 627
12.6 Uma Aplica
ca
o do Problema de Sturm-Liouville . . . . . . . . . . . . . . . 630
12.7 O M
etodo dos Determinantes de Fredholm . . . . . . . . . . . . . . . . . . 634
12.7.1 A Equacao Integral de Fredholm Linear Nao-Homogenea . . . . . . . . . . . . 634
12.7.2 A Equacao Integral de Fredholm Linear Homogenea . . . . . . . . . . . . . . 638
12.8 Coment
arios Finais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 640
12.8.1 O Problema de Sturm-Liouville Singular . . . . . . . . . . . . . . . . . . . . . 640
12.A Prova do Teorema 12.1. Exist
encia e Unicidade . . . . . . . . . . . . . . . 643
12.B Prova da Proposi
ca
o 12.1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 644
12.C Coment
ario Sobre o Determinante Wronskiano . . . . . . . . . . . . . . . 646
12.D Aus
encia de Autovalores em um Problema Singular

. . . . . . . . . . . . 647

12.E Demonstra
ca
o do Teorema 12.3 . . . . . . . . . . . . . . . . . . . . . . . . . 648
12.F Prova da Desigualdade (12.E.22) . . . . . . . . . . . . . . . . . . . . . . . . 652
12.G Obtendo os Determinantes de Fredholm . . . . . . . . . . . . . . . . . . . . 654
12.8 Exerccios Adicionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 661

presente captulo e dedicado ao problema de Sturm-Liouville, um classico problema da


teoria das equacoes diferenciais com varias aplicacoes em Fsica. Historicamente o problema
de Sturm-Liouville engendrou uma serie de desenvolvimentos que conduziram, no comeco
do seculo XX, ao nascimento de uma nova e importante area da Matematica, a Analise
Funcional, area essa que e de importancia fundamental para a Fsica Quantica.

606

JCABarata. Curso de Fsica-Matem


atica

12.1

Vers
ao de 29 de setembro de 2005.

Captulo 12

607/1304

Introdu
c
ao

In
umeros problemas em Fsica envolvem a resolucao de equacoes diferenciais ordinarias lineares de
segunda ordem e o estudo de propriedades gerais de suas solucoes. De modo geral, uma equacao
diferencial desse tipo e da forma
u00 + a1 (x)u0 + a0 (x)u = g(x) ,

(12.1)

onde g, a0 e a1 sao certas funcoes conhecidas de n


umeros reais em n
umeros reais das quais eventualmente
exige-se certas condicoes (como continuidade, diferenciabilidade etc.). A funcao u representa alguma
grandeza fsica e a equacao (12.1) e a expressao matematica de uma lei fsica que essa grandeza deve
obedecer.
Em muitos casos a funcao u e definida em um intervalo fechado finito [a, b] da reta real, b > a, e
e obrigada a satisfazer certas condicoes nos extremos desse intervalo. Tais condicoes sao chamadas de
condico
es de contorno.
Condicoes de contorno sao ditadas ou por leis fsicas ou por restricoes fsicas ou geometricas que
devem ser impostas nos pontos a e b a` grandeza representada por u. O caso mais tpico e aquele no
qual impoe-se que a funcao u ou sua primeira derivada (ou combinacoes lineares de ambas) assumem
certos valores fixos nos pontos a e b.
Ha tambem muitas situacoes nas quais a funcao u e definida em intervalos semi-infinitos, como
[0, ) ou infinitos, como (, ), e as condicoes impostas podem exigir, por exemplo, que u se
anule no infinito, que seja limitada ou que seja de quadrado integravel.
Condi
co
es de contorno lineares e homog
eneas
Ha muitos tipos distintos de condicoes de contorno. De particular importancia sao as condicoes de
contorno lineares que, no caso de equacoes de segunda ordem, tem a seguinte estrutura. A funcao u
esta definida em um intervalo finito [a, b] e para certas constantes reais 1 , 2 , 1 , 2 , 1 e 2 tais que
(1 , 2 ) 6= (0, 0), (1 , 2 ) 6= (0, 0) a funcao u satisfaz o par de condicoes
1 u(a) + 2 u0 (a) = 1 ,

(12.2)

1 u(b) + 2 u0 (b) = 2 .

(12.3)

Condicoes de contorno desse tipo sao ditas lineares devido a` dependencia linear em u do lado direito
de (12.2) e (12.3).
Nestas notas, estaremos interessados particularmente em condicoes do seguinte tipo: suporemos
que u esta definida em um intervalo finito [a, b] e que para certas constantes reais 1 , 2 , 1 e 2 tais
que (1 , 2 ) 6= (0, 0), (1 , 2 ) 6= (0, 0) a funcao u satisfaca o par de condicoes
1 u(a) + 2 u0 (a) = 0 ,

(12.4)

1 u(b) + 2 u0 (b) = 0 .

(12.5)

Condicoes de contorno lineares desse tipo sao ditas homogeneas devido ao lado direito de (12.4) e
(12.5) ser zero.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

608/1304

Condicoes de contorno sao restricoes de crucial importancia na resolucao de equacoes diferenciais.


Para verificar essa importancia, faca os seguintes exerccios simples:
E. 12.1 Exerccio.
Verifique que o problema de determinar uma funcao u tal que u 00 = 0 tal que
u0 (0) = 0 e u0 (1) = 1 nao tem solucoes.
6
E. 12.2 Exerccio.
Verifique que o problema de determinar uma funcao u tal que u 00 = 0 tal que
0
0
u (0) = 0 e u (1) = 0 tem infinitas solucoes.
6
E. 12.3 Exerccio. Verifique que o problema de determinar uma funcao u tal que u 00 + u = 0 com
u(0) = 1 e u() = 1 nao tem solucoes.
6
E. 12.4 Exerccio. Verifique que o problema de determinar uma funcao u tal que u 00 + u = 0 com
u(0) = 1 e u() = 1 tem infinitas solucoes.
6
E. 12.5 Exerccio. Verifique que o problema de determinar uma funcao u tal que u 00 + u = 0 com
u(0) = 1 e u() = 2 tem infinitas solucoes se 1 = 2 e nao tem solucao se 1 6= 2 .
6
Um teorema sobre exist
encia e unicidade de solu
co
es
Os exemplos dos exerccios acima mostram que a questao da existencia e unicidade de solucoes
importante nesse
em problemas que envolvem condicoes de contorno nao e uma questao trivial. E
contexto mencionar o seguinte teorema, o qual expressa condicoes necessarias e suficientes para garantir
a existencia e a unicidade de solucoes:
Teorema 12.1 Seja a equaca
o diferencial linear de segunda ordem
u00 + a1 (x)u0 + a0 (x)u = g(x),

(12.6)

onde g, a0 e a1 s
ao definidas num intervalo finito e fechado [a, b] e s
ao contnuas nesse intervalo. O
problema de encontrar soluco
es dessa equaca
o que satisfacam condico
es de contorno do tipo
1 u(a) + 2 u0 (a) = 1

(12.7)

1 u(b) + 2 u0 (b) = 2

(12.8)

para certas constantes reais 1 , 2 , 1 , 2 , 1 e 2 tais que (1 , 2 ) 6= (0, 0), (1 , 2 ) 6= (0, 0) tem
soluca
o u
nica se e somente se o determinante da matriz

1 u1 (a) + 2 u01 (a)


1 u2 (a) + 2 u02 (a)

(12.9)
0
0
1 u2 (b) + 2 u2 (b)
1 u1 (b) + 2 u1 (b)
for n
ao nulo, onde u1 e u2 s
ao duas soluco
es independentes quaisquer da equaca
o homogenea
u00 + a1 (x)u0 + a0 (x)u = 0 .

(12.10)
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

609/1304

A demonstracao e apresentada no Apendice 12.A, pagina 643, cujo estudo pode ser dispensado em
uma primeira leitura.
Exemplo. No Exerccio E. 12.5, pagina 608, acima, verificamos que o problema de determinar uma
funcao u tal que u00 + u = 0 com u(0) = 1 e u() = 2 ou tem infinitas solucoes (caso 1 = 2 )
ou nao tem nenhuma solucao (caso 1 6= 2 ). Vamos analisar isso sob a luz do Teorema 12.1. Aqui
temos [a, b] = [0, ]. Com as condicoes u(0) = 1 e u() = 2 tem-se 1 = 1 = 1 e 2 = 2 = 0.
Duas solucoes independentes da equacao homogenea u00 + u = 0 sao u1 (x) = cos(x) e u2 (x) = sen (x).
Assim,

1 u1 (a) + 2 u01 (a)


1 u2 (a) + 2 u02 (a)
cos(0)
sen (0)
1
0

=
=
,
0
0
1 u1 (b) + 2 u1 (b)
1 u2 (b) + 2 u2 (b)
cos()
sen ()
1
0
que tem determinante nulo. Logo, a condicao do Teorema 12.1 e violada e isso justifica por que nao se
pode garantir nem existencia nem unicidade a` solucao do problema em questao.
Relacionando problemas com condi
co
es de contorno n
ao-homog
eneas e homog
eneas
Adiante, consideraremos apenas problemas com condicoes de contorno lineares e homogeneas. Por
que nao consideraremos tambem as condicoes de contorno nao-homogeneas? A razao e que, como
veremos, podemos sempre obter solucoes de problemas com condicoes de contorno nao-homogeneas a
partir das solucoes de problemas com condicoes de contorno homogeneas.
A argumentacao e bem simples. Seja w uma funcao em princpio arbitraria (duas vezes diferenciavel)
mas que satisfaca
1 w(a) + 2 w 0 (a) = 1 ,

(12.11)

1 w(b) + 2 w 0 (b) = 2 .

(12.12)

Para uma tal funcao w, vamos definir uma funcao h(x) da seguinte forma:
h(x) := w 00 + a1 (x)w 0 + a0 (x)w .
Seja v solucao da equacao
v 00 + a1 (x)v 0 + a0 (x)v = g(x) h(x) ,

(12.13)

com as condicoes de contorno homogeneas


1 v(a) + 2 v 0 (a) = 0,

(12.14)

1 v(b) + 2 v 0 (b) = 0.

(12.15)

Entao, e facil verificar que a funcao u(x) = v(x) + w(x) satisfaz


u00 + a1 (x)u0 + a0 (x)u = g(x)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

610/1304

e
1 u(a) + 2 u0 (a) = 1 ,

(12.16)

1 u(b) + 2 u0 (b) = 2 .

(12.17)

Isso diz-nos, em resumo, que para resolver problemas com condicoes de contorno nao-homogeneas
e suficiente saber determinar uma funcao como w acima e saber determinar a solucao de uma equacao
diferencial linear com condicoes de contorno homogeneas. Por essa razao, daqui por diante so consideraremos problemas com condicoes de contorno homogeneas.
Determinar uma funcao w pode ser feito, por exemplo, procurando uma w na forma de um polinomio
e procurando ajustar os coeficientes desse polinomio de modo que (12.11)-(12.12) sejam satisfeitas.
Reescrevendo a equa
c
ao diferencial na forma de Liouville
Uma observacao importante que devemos fazer sobre equacoes como (12.1) e que, para muitos
casos, as mesmas sempre podem ser reescritas da seguinte forma equivalente, conhecida como forma
de Liouville:
(p(x)u0 )0 + q(x)u = f (x) ,
(12.18)

Rx
onde p(x) = exp a a1 (x0 ) dx0 , q(x) = p(x)a0 (x) e f (x) = p(x)g(x). Estaremos usando esta forma da
equacao mais freq
uentemente que a forma anterior.
E. 12.6 Exerccio. Verifique a equivalencia das duas formas da equacao multiplicando (12.1) por p(x)
e usando o fato que, pela definicao, p0 (x) = a1 (x)p(x).
6
Condi
co
es de contorno homog
eneas caracterizam um espa
co vetorial
Um fato importante sobre problemas com condicoes de contorno homogeneas e que sera implicitamente utilizado no que seguira e o seguinte:
Sejam fixadas as constantes 1 , 2 , 1 e 2 . Se r1 e r2 sao duas funcoes duas vezes diferenciaveis
definidas no intervalo [a, b] tais que ambas satisfazem as condicoes de contorno homogeneas (12.4)(12.5) entao qualquer combinacao linear de ambas 1 r1 (x) + 2 r2 (x) e tambem uma funcao duas vezes
diferenciavel no intervalo [a, b] que satisfaz as mesmas condicoes de contorno homogeneas (12.4)-(12.5).
E. 12.7 Exerccio. Verifique essa afirmacao.

Em outras palavras, o conjunto de todas as funcoes duas vezes diferenciaveis definidas no intervalo
[a, b] que satisfazem as condicoes de contorno homogeneas (12.4)-(12.5) e um espaco vetorial. Esse
espaco sera denotado aqui por V(1 , 2 , 1 , 2 ), ou simplesmente por V, quando nao houver confusao.

Condi
co
es de contorno n
ao-homog
eneas caracterizam um espa
co convexo
Sejam fixadas as constantes 1 , 2 , 1 , 2 , 1 e 2 . Se r1 e r2 sao duas funcoes duas vezes
diferenciaveis definidas no intervalo [a, b] tais que ambas satisfazem as condicoes de contorno nao-

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

611/1304

homogeneas (12.2)-(12.3) entao qualquer combinacao linear convexa de ambas r 1 (x) + (1 )r2 (x),
0 1, e tambem uma funcao duas vezes diferenciavel no intervalo [a, b] que satisfaz as mesmas
condicoes de contorno nao-homogeneas (12.2)-(12.3).
E. 12.8 Exerccio. Verifique essa afirmacao.

Em outras palavras, o conjunto de todas as funcoes duas vezes diferenciaveis definidas no intervalo
[a, b] que satisfazem as condicoes de contorno nao-homogeneas (12.2)-(12.3) e um espaco convexo.
Uma nota
c
ao
Como iremos daqui por diante tratar de equacoes diferenciais da forma (p(x)u0 )0 + q(x)u = f (x),
convem introduzir uma notacao simplificadora:
Lu := (p(x)u0 )0 + q(x)u .
L pode ser entendido como o operador diferencial linear
L :=

d
d
p(x) + q(x) .
dx
dx

L e linear pois claramente tem-se


L(u + v) = Lu + Lv
para quaisquer constantes e e quaisquer funcoes (duas vezes diferenciaveis) u e v.
*
Apos estas observacoes podemos passar a tratar nosso problema de forma mais sistematica.

12.2

O Problema de Sturm

Defini
c
ao do problema
Entende-se como o Problema de Sturm1 o problema de determinar as solucoes da equacao diferencial
(p(x)u0 )0 + q(x)u = f (x) ,
para u definida no intervalo fechado finito [a, b]
homogeneas

, b > a, com as condicoes de contorno lineares e

1 u(a) + 2 u0 (a) = 0 ,

(12.20)

1 u(b) + 2 u0 (b) = 0 ,

(12.21)

onde o seguinte estara sendo suposto:


1

(12.19)

Jacques Charles Francois Sturm (1803-1855).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

612/1304

As funcoes p, q e f sao reais e contnuas em [a, b].


A funcao p e diferenciavel em [a, b] e estritamente positiva: p(x) > 0, x [a, b].
As constantes 1 , 2 , 1 e 2 sao reais e tais que (1 , 2 ) 6= (0, 0) e (1 , 2 ) 6= (0, 0).
As condicoes acima sao essenciais mas nao delimitam ainda totalmente o Problema de Sturm,
pois e preciso impor restricoes que garantam a existencia e unicidade de solucoes do mesmo. Como
aprendemos do Teorema 12.1, devemos impor ainda que

1 u1 (a) + 2 u01 (a)


1 u2 (a) + 2 u02 (a)
6= 0 ,
(12.22)
det
0
0
1 u2 (b) + 2 u2 (b)
1 u1 (b) + 2 u1 (b)

onde u1 e u2 sao duas solucoes independentes quaisquer da equacao homogenea Lu = 0.


Uma observa
c
ao importante

Essa u
ltima restricao tem uma conseq
uencia que usaremos abaixo quando tratarmos de desenvolver
um metodo de resolver problemas de Sturm baseado no conceito de funcao de Green. A conseq
uencia
da qual falamos e a seguinte:
Proposi
c
ao 12.1 Com as definico
es acima, existem funco
es v1 e v2 , independentes, definidas no intervalo [a, b], tais que
Lv1 = 0,
Lv2 = 0
e tais que
1 v1 (a) + 2 v10 (a) = 0

(12.23)

1 v2 (b) + 2 v20 (b) = 0 .

(12.24)

e
2
A demonstracao dessa proposicao, da qual faremos uso adiante, encontra-se no Apendice 12.B,
pagina 644.
*
Uma vez delineado o quadro onde iremos trabalhar, passemos ao importante conceito da funcao de
Green que nos leva diretamente a` solucao do problema de Sturm.

12.2.1

Resolvendo o Problema de Sturm. A Fun


c
ao de Green

Alem da equacao
(p(x)u0 )0 + q(x)u = f (x) ,

(12.25)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

613/1304

consideremos tambem a equacao diferencial homogenea


(p(x)u0 )0 + q(x)u = 0 .

(12.26)

Pela Proposicao 12.1, existem solucoes independentes v1 e v2 da equacao homogenea, tais que v1 e
v2 satisfazem as seguintes condicoes de contorno:
1 v1 (a) + 2 v10 (a) = 0 ,

(12.27)

1 v2 (b) + 2 v20 (b) = 0 .

(12.28)

Note-se que a (12.27) e uma restricao a` funcao v1 no ponto a enquanto que a (12.28) e uma restricao a`
funcao v2 no ponto b. Com o uso dessas funcoes vamos construir uma solucao do problema de Sturm.
Para tal, vamos introduzir a importante definicao da funca
o de Green2 . A funcao de Green e uma
funcao de duas variaveis G(x, y), onde x [a, b] e y [a, b], definida da seguinte forma:

v1 (x)v2 (y)

, para a x y b

p(a)W (a)
G(x, y) :=
,
(12.29)

v
(y)v
(x)
1
2

, para a y x b

p(a)W (a)

onde W (x) e o chamado determinante Wronskiano3 , ou funca


o Wronskiana, definido4 , neste caso, por

v1 (x)
v10 (x)
= v1 (x)v20 (x) v2 (x)v10 (x) .
(12.30)
W (x) := det
0
v2 (x)
v2 (x)

Note-se que, por (12.B.9), W (x) 6= 0 para todo x [a, b].

Antes de prosseguirmos, vamos demonstrar um fato simples sobre a funcao Wronskiana, a saber vamos mostrar que a funcao p(x)W (x) e constante no intervalo [a, b]. Isso significa provar que
(p(x)W (x))0 = 0. De fato,
(pW )0 = p0 W + pW 0 = p0 (v1 v20 v10 v2 ) + p (v1 v20 v10 v2 )0
= p0 (v1 v20 v10 v2 ) + p (v10 v20 + v1 v200 v100 v2 v10 v20 )
= p0 (v1 v20 v10 v2 ) + p (v1 v200 v100 v2 )
= v1 (p0 v20 + pv200 ) v2 (p0 v10 + pv100 )
= v1 (pv20 )0 v2 (pv10 )0
= v1 qv2 + v2 qv1
= 0,
2

(12.31)

George Green (1793-1841).


Conde Josef Hoene de Wronski (1778-1853).
4
No Apendice 12.C, p
agina 646, mostramos a relaca
o entre essa definica
o de determinante Wronskiano e aquela
introduzida no Captulo 7, p
agina 306 (vide p
agina 318).
3

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

614/1304

onde, na pen
ultima igualdade, usamos o fato que v1 e v2 satisfazem a equacao homogenea. Assim,
provamos que, para todo x [a, b], tem-se p(x)W (x) = p(a)W (a) = p(b)W (b).

Dado que as funcoes v1 e v2 sao contnuas, e facil ver que G e igualmente contnua no quadrado
Q := [a, b] [a, b] onde esta definida. Entretanto, as derivadas parciais Gx e Gy de G nao sao
contnuas em Q, apresentando uma descontinuidade ao longo da diagonal de Q, que consiste nos
pontos (x, y) Q com x = y. Como esse fato tera conseq
uencias adiante, vamos nos dedicar a estudar
essa descontinuidade com mais detalhe.
Dado que v1 e v2 sao diferenciaveis, e claro que
0
v1 (x)v2 (y)

p(a)W (a)
Gx (x, y) :=

v1 (y)v20 (x)

p(a)W (a)

para a x < y b
.

(12.32)

para a y < x b

Note que, nesta u


ltima expressao, exclumos os pontos para os quais x = y, onde G x nao esta definida.
Entretanto, apesar de Gx nao estar definida nesses pontos, os limites lim Gx (x + , x) e lim Gx (x , x)
0

0

0

0

existem mas sao, porem, distintos, o mesmo se dando com os limites lim Gx (x, x + ) e lim Gx (x, x )

(aqui  > 0). Dado que, para qualquer  > 0, tem-se x +  > x e x  < x, segue que
lim Gx (x + , x) =

v1 (x)v20 (x)
p(a)W (a)

(12.33)

lim Gx (x , x) =

v10 (x)v2 (x)


.
p(a)W (a)

(12.34)

lim Gx (x, x ) =

v1 (x)v20 (x)
p(a)W (a)

(12.35)

lim Gx (x, x + ) =

v10 (x)v2 (x)


.
p(a)W (a)

(12.36)

0

e que
0

Analogamente segue que


0

e que
0

Portanto, segue que


lim Gx (x + , x) lim Gx (x , x) =
0

0

v1 (x)v20 (x) v10 (x)v2 (x)


W (x)
1
=
=
,
p(a)W (a)
p(a)W (a)
p(x)

(12.37)

pois, como vimos, para qualquer x [a, b] tem-se p(a)W (a) = p(x)W (x). De maneira identica, segue
que
1
lim Gx (x, x ) lim Gx (x, x + ) =
.
(12.38)
0
0
p(x)
As relacoes (12.37) e (12.38) mostram-nos que, de fato, Gx e descontnua na diagonal de Q e nos
dizem tambem quao grande e o salto dado pela funcao Gx quando se cruza a diagonal de Q no ponto
(x, x).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

615/1304

O fato fundamental a respeito da funcao de Green e que a funcao u(x) definida por
u(x) =

G(x, y) f (y) dy

(12.39)

e tal que u satisfaz a equacao nao-homogenea (12.19) e satisfaz as condicoes de contorno (12.20)(12.21), ou seja, e a solucao do problema de Sturm. Esse fato e conhecido como Teorema de Green e
sera provado na proxima sub-secao.

12.2.2

O Teorema de Green

Vamos aqui demonstrar o Teorema de Green mencionado acima. Precisamos para tal calcular
(pu0 )0 + qu = pu00 + p0 u0 + qu
para u(x) dada por (12.39) e demonstrar que isso e igual a f (x). Dado que G tem derivadas parciais
descontnuas, e conveniente escrever
Z b
Z x
G(x, y) f (y) dy .
(12.40)
G(x, y) f (y) dy +
u(x) =
x

Em cada um dos pedacos em que quebramos a integral acima tem-se que Gx e contnua. Da, segue
que
Z b
Z x
0
Gx (x, y) f (y) dy
Gx (x, y) f (y) dy G(x, x)f (x) +
u (x) = G(x, x)f (x) +
x

Gx (x, y) f (y) dy +
a

Gx (x, y) f (y) dy .

(12.41)

E. 12.9 Exerccio. Justifique as expressoes acima.

De forma inteiramente analoga tem-se que


00

u (x) = lim Gx (x, x )f (x) +


0

Gxx (x, y) f (y) dy


a

lim Gx (x, x + )f (x) +


0

f (x)
+
=
p(x)

Gxx (x, y) f (y) dy


x

Gxx (x, y) f (y) dy +


a

Gxx (x, y) f (y) dy ,

(12.42)

onde, na u
ltima igualdade, usamos (12.38).
E. 12.10 Exerccio. Justifique as expressoes acima.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

616/1304

Desta forma, temos que


p(x)u00 + p0 (x)u0 + q(x)u =

p(x)
f (x)
p(x)
Z x
[p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y)] f (y) dy
+
a

[p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y)] f (y) dy(12.43)


.
x

Entretanto, temos que


p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y) = 0 ,

(12.44)

e isto vale tanto para y = [a, x) quanto para y = (x, b]. Para ver isso basta notar, por exemplo, que
para y = [a, x) tem-se que
p(x)Gxx (x, y) + p0 (x)Gx (x, y) + q(x)G(x, y)

v1 (y)
[p(x)v200 (x) + p0 (x)v20 (x) + q(x)v2 (x)] = 0 ,
p(a)W (a)

(12.45)

pois, por hipotese, v2 e solucao da equacao homogenea p(x)v200 (x) + p0 (x)v20 (x) + q(x)v2 (x) = 0. O caso
y = (x, b] e analogo.
E. 12.11 Exerccio. Verifique!

Assim, retomando a equacao (12.43), vemos que


p(x)u00 + p0 (x)u0 + q(x)u = f (x) .

(12.46)

Esta, portanto, demonstrado que a funcao u dada por (12.39) e solucao da equacao diferencial naohomogenea. Resta provar que essa funcao u satisfaz as condicoes de contorno (12.4)-(12.5). Deixamos
a importante verificacao desse u
ltimo fato como exerccio.
E. 12.12 Exerccio. Mostre que (12.39) satisfaz as condicoes de contorno (12.4)-(12.5).

O problema de Sturm com condi


co
es de contorno n
ao-homog
eneas
Com as observacoes da pagina 609 podemos encontrar tambem solucoes de problemas de Sturm
(Lu)(x) = f (x) com u satisfazendo condicoes de contorno nao-homogeneas como (12.2)-(12.3).
Seja w uma funcao duas vezes diferenciavel satisfazendo tambem (12.11)-(12.12). Defina-se
h(x) := (Lw)(x) .
e seja v a solucao da equacao
(Lv)(x) = f (x) h(x) ,

(12.47)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

617/1304

com as condicoes de contorno homogeneas


1 v(a) + 2 v 0 (a) = 0 ,

(12.48)

1 v(b) + 2 v 0 (b) = 0 .

(12.49)

Entao, u = v + w satisfaz Lu = f e as condicoes nao-homogeneas (12.2)-(12.3). Agora, pela solucao do


problema de Sturm homogeneo, sabemos que
Z b
v(x) =
G(x, y)(f (y) h(y)) dy,
a

onde G e montada como antes (vide (12.29)) a partir de solucoes v1 e v2 da equacao homogenea
Lv1, 2 = 0, com v1 e v2 satisfazendo (12.27) e (12.28), respectivamente.
Logo, a solucao procurada e
Z b
u(x) =
G(x, y)(f (y) h(y)) dy + w(x)
a

12.3

G(x, y)f (y) dy + w(x)

a
b
a

G(x, y)f (y) dy + w(x)

G(x, y)h(y) dy .
a
b

G(x, y)(Lw)(y) dy
a

(12.50)

O Problema de Sturm-Liouville

Seja o intervalo J := [a, b]




e sejam p, q e r funcoes reais definidas em J, tais que

p e contnua, diferenciavel e estritamente positiva em J, ou seja, p(x) > 0 para todo x [a, b].
q e contnua em J.
r e contnua e estritamente positiva em J, ou seja, r(x) > 0 para todo x [a, b].
Para uma funcao u definida em J que seja pelo menos duas vezes diferenciavel, vamos como anteriormente definir o operador diferencial L por (Lu)(x) = (p(x)u0 )0 + q(x)u.
Entende-se por Problema de Sturm-Liouville5 regular6 , ou simplesmente Problema de Sturm-Liouville,
umeros tais que a seguinte equacao
o problema de se determinar a funcao u definida em J e os n
diferencial seja satisfeita:
Lu + r(x)u = 0 ,
(12.51)
5

Jacques Charles Francois Sturm (1803-1855). Joseph Liouville (1809-1882). Os trabalhos de ambos sobre o problema
que e hoje conhecido como Problema de Sturm-Liouville foram desenvolvidos entre 1829 e 1837.
6
O problema de Sturm-Liouville singular ser
a tratado brevemente a
` p
agina 640.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

618/1304

com o seguinte tipo de condicao de contorno: vamos supor que existam constantes reais 1 , 2 , 1 e
2 tais que (1 , 2 ) 6= (0, 0), (1 , 2 ) 6= (0, 0) e tais que o seguinte par de relacoes deve ser valido
1 u(a) + 2 u0 (a) = 0 ,

(12.52)

1 u(b) + 2 u0 (b) = 0 .

(12.53)

Se for um n
umero tal que a equacao (12.51) seja satisfeita para alguma funcao u (que em geral
dependera de ) entao diz-se que e um autovalor do Problema de Sturm-Liouville e u e dito ser a
autofunca
o associada ao autovalor do Problema de Sturm-Liouville. Essa nomenclatura surge por
analogia com os conceitos de autovalor e autovetor de matrizes na algebra linear.
Muitos problemas de Fsica envolvem a solucao de problemas de Sturm-Liouville. Fora isso, a
solucao de problemas de Sturm-Liouville e u
til para a resolucao de equacoes nao-homogeneas como
Lu = f (x)

(12.54)

para uma funcao f dada, com condicoes de contorno como (12.52)-(12.53). A razao para isso reside
no fato que, como veremos, a funcao de Green associada ao problema de Sturm Lu = f com condicoes
de contorno como (12.52)-(12.53) pode ser escrita em termos das autofuncoes e dos autovalores de um
problema de Sturm-Liouville.
Exemplo 12.1 No bem-conhecido problema da corda vibrante, descrevendo o movimento transversal
de uma corda homogenea de densidade > 0 e de comprimento L, estendida entre os pontos a e
b = a + L e submetida a uma tensao T > 0, temos que resolver a equacao de ondas
s
2
T

u
2u
2
,

c
=
0
,
c
:=
t2
x2

com x [a, b], t . Pelo metodo de separacao de variaveis (vide Secao 11.2, pagina 587), procuramos
+ c2 (t) = 0 e para y a equacao
solucoes da forma u(x, t) = y(x)(t) e obtemos para a equacao (t)


y 00 (x) + y(x) = 0 ,

(12.55)

sendo uma constante de separacao. Se a corda estiver fixa em a e em b, devemos impor as condicoes
de contorno y(a) = 0 e y(b) = 0. Esse problema de determinar a funcao y satisfazendo a equacao
(12.55) e as condicoes de contorno acima e um problema de Sturm-Liouville com p(x) = 1, q(x) = 1,
r(x) = 1, (1 , 2 ) = (1, 0) e (1 , 2 ) = (1, 0).
No caso a = 0 e b = 0, obtem-se como solucoes desse problema de Sturm-Liouville as funcoes
yn (x) = sen (nx/L) com n = (n/L)2 para todo n = 1, 2, 3, . . ..

Exemplo 12.2 Na Mecanica Quantica, considere o problema de determinar a funcao de onda de uma
partcula de massa m movendo-se em uma dimensao e constrita a um intervalo finito [a, b] por
barreiras infinitas de potencial em x a e x b e sujeita, no intervalo [a, b], a um potencial V (x). A
equacao de Schrodinger independente do tempo e


~2 d 2
(x) V (x)(x) + E(x) = 0 ,
2m dx2
com x [a, b], sendo que, devido a`s barreiras infinitas de potencial, devemos impor as condicoes
~2
de contorno (a) = 0 e (b) = 0. Trata-se de um problema de Sturm-Liouville com p(x) = 2m
,
q(x) = V (x), r(x) = 1, = E, (1 , 2 ) = (1, 0) e (1 , 2 ) = (1, 0).

JCABarata. Curso de Fsica-Matem


atica

12.4

Vers
ao de 29 de setembro de 2005.

Captulo 12

619/1304

Propriedades B
asicas dos Autovalores e das Autofun
co
es
de Problemas de Sturm-Liouville

bem sabido
Seja C([a, b]) o conjunto das funcoes complexas contnuas definidas no intervalo [a, b]. E
que C([a, b]) e um espaco vetorial. Para cada 1 , 2 , 1 e 2 o espaco V(1 , 2 , 1 , 2 ), definido a`
pagina 610, e um sub-espaco de C([a, b]).
Um produto escalar complexo em um espaco vetorial complexo V e uma funcao V V , ou
seja, uma funcao que associa pares de vetores a um n
umero complexo, denotada por h, i e de tal
forma que os seguintes requerimentos sejam observados:
1. hx, xi 0 para todo x V .
2. hx, yi = hy, xi, para todos x, y V .
3. Se hx, xi = 0 entao x = 0, onde 0 e o vetor nulo.
4. Se a e b sao n
umeros complexos quaisquer entao
hx, ay + bzi = ahx, yi + bhx, zi .

(12.56)

5. Se a e b sao n
umeros complexos quaisquer entao
hax + by, zi = ahx, zi + bhy, zi .

(12.57)

Podemos dotar o espaco vetorial C([a, b]) de varios produtos escalares. Dois deles nos interessarao
aqui. Para f , g C([a, b]) definimos o produto escalar
Z b
hf, gi =
f (x) g(x) dx ,
(12.58)
a

e tambem o produto escalar


hf, gir =

f (x) g(x) r(x) dx ,

(12.59)

onde a funcao r e a funcao estritamente positiva caracterizada acima no problema de Sturm-Liouville.

12.4.1

Realidade dos Autovalores. Ortogonalidade de Autofun


co
es

Vamos aqui demonstrar duas propriedades basicas comuns a todos os problemas de Sturm-Liouville.
A saber, vamos provar o seguinte teorema.
Teorema 12.2 Os autovalores de um problema de Sturm-Liouville, como descrito acima s
ao sempre
n
umeros reais. Fora isso, se u1 e u2 s
ao duas autofunco
es associadas a dois autovalores distintos 1
e 2 (1 6= 2 ) ent
ao vale que
Z b
hu1 , u2 ir =
u1 (x) u2 (x) r(x) dx = 0 .
(12.60)
a

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

620/1304

Esta u
ltima relaca
o e chamada de relaca
o de ortogonalidade (em relaca
o ao produto escalar h, i r ). 2
Para provar este teorema vamos antes demonstrar o seguinte lema:
Lema 12.1 (Lema de Green) Sejam u e v duas funco
es definidas em J = [a, b], que sejam pelo
menos duas vezes diferenci
aveis e tais que ambas satisfacam condico
es de contorno como (12.52)(12.53), ou seja, ambas s
ao elementos do espaco vetorial de funco
es V( 1 , 2 , 1 , 2 ) (p
agina 610).
Ent
ao, tem-se
hv, Lui = hLv, ui,
ou seja,

v(x) (Lu)(x) dx =
a

(Lv)(x) u(x) dx .

(12.61)

Prova do Lema 12.1. Usando-se integracao por partes, tem-se


Z b
Z b
Z b
0 0
v(x) (Lu)(x) dx =
v(x)(p(x)u ) dx +
v(x)q(x)u(x) dx
a

=
=

v 0 (x)(p(x)u0 )
a

u(pv 0 )0
a
b
a

dx +

dx +

b
vpu0 |a

b
vpu0 |a

b
v 0 pu a

v(x)q(x)u(x) dx
a

v(x)q(x)u(x) dx
a

b
b
u(x) (Lv)(x) dx + vpu0 |a v 0 pu a .

Agora, escrevendo-se explicitamente tem-se que


b
b
vpu0 |a v 0 pu a = p(b)v(b)u0 (b) p(a)v(a)u0 (a) p(b)v 0 (b)u(b) + p(a)v 0 (a)u(a)





= p(b) v(b)u0 (b) v 0 (b)u(b) p(a) v(a)u0 (a) v 0 (a)u(a) .

(12.62)

(12.63)

Vamos agora provar que os fatores entre parenteses em (12.63) sao nulos. Como u e v satisfazem
(12.52)-(12.53), tem-se



1
0
1
0
v(a)
v 0 (a)
v(b)
v 0 (b)

.
e
=
2
0
2
0
u(a)
u0 (a)
u(b)
u0 (b)
       
1
0
1
0
Como
6=
e
6=
devemos ter
2
0
2
0

v(a)
v 0 (a)
v(b)
v 0 (b)
= 0
= 0,
det
e
det
0
0
u(a)
u (a)
u(b)
u (b)

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

621/1304

ou seja,
v(a)u0 (a) v 0 (a)u(a) = 0

v(b)u0 (b) v 0 (b)u(b) = 0 .

O lado esquerdo de ambas as expressoes sao os termos entre parenteses de (12.63). Logo,
b
b
vpu0 |a v 0 pu a = 0.

Voltando a` (12.62), isso completa a demonstracao do Lema de Green.


Vamos entao passar a`

Prova do Teorema 12.2. Para provar que os autovalores de um problema de Sturm-Liouville sao reais,
seja um autovalor e u a sua correspondente autofuncao. Vamos mostrar que
Z b
( )
u(x) u(x) r(x) dx = 0 .
(12.64)
a

Rb
Como u 6= 0 e r > 0 (por hipotese), temos que a u u r(x) dx 6= 0. Portanto, (12.64) diz-nos que
umero real. Para provar (12.64), notemos que
= 0, ou seja, que e um n
Z b
Z b
Z b
( )
u u r(x) dx =
u (u r(x)) dx
ur(x) u dx
a

u (Lu) dx +
a

Lu u dx
a

= 0,

(12.65)

pelo Lema de Green. Assim, completamos a demonstracao de que os autovalores de um problema de


Sturm-Liouville sao n
umeros reais.
Vamos agora provar a relacao de ortogonalidade (12.60). Para tal, vamos provar que
Z b
(1 2 )
u1 (x) u2 (x) r(x) dx = 0 .

(12.66)

Como estamos supondo que 1 6= 2 , essa relacao diz entao que (12.60) deve ser verdadeira. Como 1
e 2 sao reais, o lado esquerdo de (12.66) pode ser escrito como
Z

b
a

(1 r(x)u1 (x)) u2 (x) dx

u1 (x) (2 r(x)u2 (x)) dx


a

(Lu1 (x)) u2 (x) dx +


a

u1 (x) (Lu2 (x)) dx = 0 , (12.67)


a

pelo Lema de Green. A prova do Teorema 12.2 esta entao completa.


O que vimos no Teorema 12.2 e que autofuncoes associadas a autovalores distintos de um problema
de Sturm-Liouville sao ortogonais entre si em relacao ao produto escalar definido em (12.59).
O Lema de Green afirma que L e um operador simetrico em relacao ao produto escalar definido em
(12.58) quando age em vetores do sub-espaco V(1 , 2 , 1 , 2 ).

JCABarata. Curso de Fsica-Matem


atica

12.4.2

Vers
ao de 29 de setembro de 2005.

Captulo 12

622/1304

A Simplicidade dos Autovalores

Se u1 , u2 V(1 , 2 , 1 , 2 ) sao duas autofuncoes de um problema de Sturm-Liouville regular com


o mesmo autovalor , ou seja, Lu1 + ru1 = 0 e Lu2 + ru2 = 0, entao e facil verificar que qualquer
combinacao linear a1 u1 +a2 u2 e tambem um elemento de V(1 , 2 , 1 , 2 ) e e tambem uma autofuncao
com autovalor : L(a1 u1 +a2 u2 )+r(a1 u1 +a2 u2 ) = 0. Em outras palavras, o conjunto das autofuncoes
de um um problema de Sturm-Liouville com um mesmo autovalor e um espaco vetorial.
Uma questao importante sobre problemas de autovalores, como o de Sturm-Liouville, e a questao
da multiplicidade dos autovalores, ou seja, a questao de saber, dado um autovalor , qual a dimensao
do espaco vetorial de todas as suas autofuncoes.
No problema de Sturm-Liouville regular a resposta e simples. A dimensao e sempre igual a 1, ou
seja, os autovalores sao simples. A demonstracao e a seguinte. Sejam u1 , u2 V(1 , 2 , 1 , 2 ) tais
que Lu1 + ru1 = 0 e Lu2 + ru2 = 0 para um dado . Considere-se a funcao

u1 (x)
u01 (x)
= u1 (x)u02 (x) u01 (x)u2 (x) .
W12 (x) = det
u2 (x)
u02 (x)

Vamos em primeiro lugar mostrar que p(x)W12 (x) e constante no intervalo [a, b], ou seja, que (pW12 )0 =
0. De fato,
(pW12 )0 = p0 W12 + pW012 = p0 (u1 u02 u01 u2 ) + p (u1 u02 u01 u2 )0
= p0 (u1 u02 u01 u2 ) + p (u01 u02 + u1 u002 u001 u2 u01 u02 )
= p0 (u1 u02 u01 u2 ) + p (u1 u002 u001 u2 )
= u1 (p0 u02 + pu002 ) u2 (p0 u01 + pu001 )
= u1 (pu02 )0 u2 (pu01 )0
= u1 (qu2 + ru2 ) + u2 (qu1 + ru1 )
= 0.

(12.68)

Vamos agora mostrar que W12 (b) = 0. Como acabamos de ver que p(x)W12 (x) e constante, isso
implica p(x)W12 (x) = 0 para todo x [a, b].

Como as funcoes u1 e u2 sao elementos de V(1 , 2 , 1 , 2 ), temos em x = b7



0
1
u1 (b)
u01 (b)
= .

0
u2 (b)
u02 (b)
2
Um argumento an
alogo funciona tambem em x = a.

JCABarata. Curso de Fsica-Matem


atica
   
1
0
Agora, como
6=
, segue que
2
0

det

ou seja, W12 (b) = 0.

Vers
ao de 29 de setembro de 2005.

u1 (b)

u01 (b)

u2 (b)

u02 (b)

Captulo 12

623/1304

= 0,

Pelo que acabamos de provar, p(x)W12 (x) = 0 para todo x [a, b]. Como p e estritamente positiva,
segue que W12 (x) = 0 para todo x [a, b], ou seja,

u1 (x)
u01 (x)
= 0,
det
0
u2 (x)
u2 (x)

para todo x [a, b]. Isso diz que as duas linhas que formam a matriz acima sao, para cada x [a, b],
proporcionais uma a outra, ou seja, existe (x) tal que, por exemplo,
u1 (x) = (x)u2 (x)

u01 (x) = (x)u02 (x)

para cada x [a, b]. Derivando a primeira e comparando a` segunda, conclui-se que (x) e constante,
ou seja, nao depende de x.
Assim, verificamos que as funcoes u1 e u2 sao m
ultiplas entre si. Com isso, mostramos que se
tivermos duas autofuncoes com o mesmo autovalor as autofuncoes sao m
ultiplas uma da outra e o subespaco que ambas geram tem dimensao 1. Em resumo, autovalores de problemas de Sturm-Liouville
regular sao sempre simples, ou nao-degenerados.

12.4.3

Condi
co
es Suficientes para a Positividade dos Autovalores

Em muitas aplicacoes de interesse fsico ocorre que os autovalores sao (ou precisam ser) n
umeros
positivos. Vamos apresentar agora um conjunto de condicoes que sao suficientes para garantir isso.
Proposi
c
ao 12.2 Se forem simultaneamente v
alidas as condico
es
1. q(x) 0 para todo x [a, b],
2. 1 2 0,
3. 1 2 0,
ent
ao todos os autovalores do problema de Sturm-Liouville correspondente s
ao estritamente positivos:
> 0.
2
Prova. A demonstracao e um tanto indireta. Seja u uma autofuncao com autovalor , ou seja,
(pu0 )0 + qu + ru = 0 .

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

Multiplicando-se essa igualdade por u e integrando-se entre a e b, tem-se


Z b
Z b
Z b
0 0
2
u(x)(pu ) (x) dx

|u(x)|2 q(x) dx .
|u(x)| r(x) dx =
a

624/1304

(12.69)

Vamos agora integrar por partes a primeira integral do lado direito. Temos,
Z b
b Z b

0 0
0
|u0 (x)|2 p(x) dx .
u(x)(pu ) (x) dx = u(x)(pu )(x)
a

Substituindo em (12.69), tem-se


Z b
Z b
h
i

0
2
2
2
0
0
|u (x)| p(x) |u(x)| q(x) dx + p(a)u(a)u (a) p(b)u(b)u (b) . (12.70)
|u(x)| r(x) dx =

As tres integrais acima sao n


umeros reais. Portanto, vale, tomando-se a parte real da expressao,
Z b
Z b
h



i

2
|u0 (x)|2 p(x) |u(x)|2 q(x) dx+ p(a) Re u(a)u0 (a) p(b) Re u(b)u0 (b)
|u(x)| r(x) dx =

.
a

(12.71)

No ponto a u satisfaz 1 u(a) + 2 u0 (a) = 0. Multiplicando-se essa expressao pelo seu complexo
conjugado, tem-se


12 |u(a)|2 + 22 |u0 (a)|2 + 21 2 Re u(a)u0 (a) = 0 ,
ou seja,

21 2 Re u(a)u (a)
Analogamente, para o ponto b,


= 12 |u(a)|2 + 22 |u0 (a)|2 .




21 2 Re u(b)u0 (b) = 12 |u(b)|2 + 22 |u0 (b)|2 .

(12.72)

(12.73)

Consideremos agora que 1 2 < 0 e 1 2 > 0.



A expressao (12.72) nos ensina que 1 2 e Re u(a)u0 (a) tem sinais opostos e (12.73) que 1 2


e Re u(b)u0 (b) tem sinais opostos. Assim, se tivermos q(x) 0 para todo x [a, b], 1 2 < 0 e
Rb
1 2 > 0 a soma do lado direito de (12.71) sera estritamente positiva. Como a |u(x)|2 r(x) dx > 0, ja
que r e tambem por hipotese estritamente positiva, segue de (12.71) que > 0.
Se 1 2 = 0, entao u(a)u0 (a) = 0 (por que?). Assim, se adicionalmente tivermos q(x) 0 para
todo x [a, b] e 1 2 > 0, entao a soma do lado direito de (12.71) sera estritamente positiva, o que
implica > 0.

Analogamente, se 1 2 = 0, entao u(b)u0 (b) = 0 (por que?). Assim, se adicionalmente tivermos


q(x) 0 para todo x [a, b] e 1 2 < 0, entao teremos novamente > 0. Por fim, se 1 2 = 0 e
1 2 = 0, entao u(a)u0 (a) = 0 e u(b)u0 (b) = 0. Assim, com q(x) 0 para todo x [a, b] teremos
novamente > 0.
Coment
ario sobre autovalores negativos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

625/1304

importante dizer aqui que existem problemas de Sturm-Liouville regulares onde ocorrem autoE
valores negativos (vide exerccio-exemplo abaixo). No Teorema 12.3, pagina 626, mostraremos que
apesar de ser possvel a existencia de autovalores negativos, os mesmos nao podem ser arbitrariamente
negativos, ou seja, negativos mas com modulo || arbitrariamente grande. Provaremos que existe uma
constante M tal que M . A constante M pode ser positiva, negativa ou nula. Em verdade, em
um problema de Sturm-Liouville regular pode ocorrer no maximo um n
umero finito de autovalores
negativos.
Um Exemplo
E. 12.13 Exerccio-exemplo. Seja o problema de Sturm-Liouville u 00 + u = 0, no intervalo [0, 1], com
as condicoes de contorno u(0) = 0 e 1 u(1) + 2 u0 (1) = 0.
Aqui p(x) = 1, q(x) = 0, r(x) = 1, 1 = 1 e 2 = 0. A identidade (12.71) fica
Z 1
Z 1


2
|u0 (x)|2 dx Re u(1)u0 (1) .
|u(x)| dx =

(12.74)

Caso 1 = 0, teremos u0 (1) = 0. Caso 2 = 0, teremos u(1) = 0. Nesses dois casos, (12.74) fica

1
2

|u(x)| dx =

1
0

|u0 (x)|2 dx ,

que garante que > 0.


No caso em que 1 e 2 sao nao-nulos, (12.73) diz-nos que
Z 1
Z 1

1
2
12 |u(1)|2 + 22 |u0 (1)|2 .

|u(x)| dx =
|u0 (x)|2 dx +
21 2
0
0

(12.75)

Como se ve, se 1 2 > 0 tem-se > 0, mas se 1 2 < 0 poderemos ter autovalores negativos. Abaixo
(item f), veremos que isso de fato ocorre caso 12 < 2 1 < 0.
a. No caso 1 = 0 mostre que os autovalores sao n = (n + 12 )2 2 , n = 0, 1, 2, . . ..
b. No caso 2 = 0 mostre que os autovalores sao n = n2 2 , n = 1, 2, 3, . . ..
c. Determine as autofuncoes normalizadas nessas duas situacoes.
d. No caso em que 1 e 2 sao nao-nulos mostre que os autovalores positivos sao as (infinitas!) solucoes
positivas de

1
= tan( ) .
2
Mostre graficamente que essa equacao tem infinitas solucoes positivas quer

1
2

> 0 ou quer

1
2

< 0.

e. Para o caso 1 = 2 mostre que tambem ocorre o autovalor = 0, cuja autofuncao e u(x) = x,
sendo uma constante arbitraria nao nula.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

626/1304

f. Mostre que se 0 < 21 < 1, ou seja, se 12 < 2 1 < 0, ocorre tambem um (unico!) autovalor
negativo, o qual e solucao de

1
= tanh( ) .
2
Mostre graficamente que essa equacao nao tem solucao nao-nula caso 0 > 21 ou caso 21 > 1.
g. Reunindo os resultados obtidos, indique no plano Cartesiano ( 1 , 2 ) a regiao onde os autovalores
sao estritamente positivos, a regiao onde ocorre o autovalor zero e a regiao onde ocorrem tambem
autovalores negativos alem dos autovalores positivos.
6
Um Limite Inferior para os Autovalores
Ainda sobre os autovalores de problemas de Sturm-Liouville regulares, o seguinte teorema pode ser
demonstrado.
Teorema 12.3 Seja o problema de Sturm-Liouville (regular) definido pela equaca
o
Lu + r(x)u = 0,
onde p, q e r s
ao funco
es reais definidas em [a, b], tais que p e contnua, diferenci
avel e estritamente
positiva em [a, b], ou seja, p(x) > 0 para todo x [a, b]; q e contnua em [a, b]; r e contnua e
estritamente positiva em [a, b], ou seja, r(x) > 0 para todo x [a, b]; com as condico
es de contorno
1 u(a) + 2 u0 (a) = 0 ,

1 u(b) + 2 u0 (b) = 0

para (1 , 2 ) 6= (0, 0), (1 , 2 ) 6= (0, 0).

Ent
ao existe uma constante M , que depende (em geral de forma muito complicada) das funco
es p,
q e r e das constante 1, 2 e 1, 2 , tal que todos os autovalores satisfazem
M.
2
A constante M pode ser positiva, negativa ou nula. O que esse teorema diz e que existe um
limitante inferior para os autovalores de um problema de Sturm-Liouville, ou seja, os mesmos podem
ate ser eventualmente negativos, mas nao arbitrariamente negativos. A demonstracao 8 desse teorema
e apresentada no Apendice 12.E, pagina 648.
8

Essa demonstraca
o pode ser omitida numa primeira leitura.

JCABarata. Curso de Fsica-Matem


atica

12.5

Vers
ao de 29 de setembro de 2005.

Captulo 12

627/1304

A Equa
c
ao Integral de Fredholm

Um dos passos mais u


teis para se estudar um problema de Sturm-Liouville consiste em transforma-lo
em uma equacao integral. Como veremos, isso pode ser feito caso 0 nao seja um possvel autovalor.
Considere o problema de Sturm-Liouville de determinar as solucoes de
Lu = r(x) u,

(12.76)

que satisfacam as condicoes de contorno (12.52)-(12.53). Se = 0 nao for um autovalor desse problema,
ou seja, se Lu = 0 com as condicoes de contorno (12.52)-(12.53) possuir apenas a solucao trivial u = 0,
entao o problema de Sturm Lu = f com as condicoes de contorno (12.52)-(12.53) possui solucao u
nica.
Isso e elementar de se ver, pois se u1 e u2 sao duas solucoes, entao L(u1 u2 ) = 0, sendo que u1 u2
obviamente satisfaz (12.52)-(12.53). Pelo pressuposto, u1 u2 = 0.
Z b
Agora, pelo Teorema de Green, u(x) =
G(x, y) f (y)dy e solucao de Lu = f com as condicoes
a

de contorno (12.52)-(12.53) e, portanto, essa e a u


nica solucao. Assim sob a hipotese que = 0 nao e
um autovalor do problema de Sturm-Liouville, todaZ funcao u que satisfaz Lu = f com as condicoes de
b

contorno (12.52)-(12.53) satisfaz tambem u(x) =

G(x, y) f (y)dy para qualquer que seja a funca


o

contnua f .

Disso conclumos que a funcao u que satisfaz a equacao diferencial (12.76) satisfaz tambem
Z b
u(x) =
G(x, y) r(y) u(y) dy ,
(12.77)
a

isto e, definindo-se

para x, y [a, b], vale

k(x, y) := G(x, y) r(y)


u(x) =

(12.78)

k(x, y) u(y) dy .

(12.79)

Uma equacao como esta onde a funcao k(x, y) e contnua em um intervalo fechado e conhecida como
Equaca
o Integral de Fredholm linear homogenea, ou simplesmente Equaca
o Integral de Fredholm 9 . O
estudo da equacao integral de Fredholm e um dos captulos importantes da Analise Funcional e da
Teoria das Equacoes Integrais. Iremos agora tratar apenas de aspectos basicos da mesma que mais
diretamente nos interessam. O metodo dos determinantes de Fredholm para a solucao de equacoes
integrais de Fredholm homogeneas e nao-homogeneas sera apresentado com certo detalhe na Secao
12.7, pagina 634. O leitor podera encontrar mais material sobre a equacao integral de Fredholm naolinear na Secao 17.2, pagina 889, assim como na Secao 26.6, pagina 1202, para o caso linear. Alguns
poucos comentarios historicos podem ser encontrados a` pagina 640.
Seja o espaco vetorial C(J) introduzido acima, de todas as funcoes contnuas definidas no intervalo
J = [a, b]. Podemos entao, com o auxlio da funcao k(x, y) dada em (12.78), definir em C(J) um
operador linear K dado por
Z
b

k(x, y) f (y) dy .

(Kf )(x) :=

Erik Ivar Fredholm (1866-1927).

(12.80)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

628/1304

x J. O operador K e denominado operador de Fredholm. A equacao (12.79) diz-nos entao que


1
u.

Ku =

(12.81)

A respeito desse operador K podemos provar o seguinte resultado. Tomando-se em C(J) o produto
escalar h, ir definido acima, temos
hf, Kgir = hKf, gir

(12.82)

para todo f , g C(J).


E. 12.14 Exerccio. Mostre esse fato. Para isso use que a funcao de Green satisfaz G(x, y) = G(y, x).
6
Um operador linear que satisfaz uma relacao como (12.82) e dito ser um operador simetrico ou
Hermiteano, um conceito de grande importancia em Fsica e Matematica. O operador K e entao um
operador simetrico em relacao ao produto escalar h, ir .
Se A e um operador linear agindo em um espaco vetorial complexo V , dizemos que um vetor
umero (real ou complexo) tal que
nao-nulo x e um autovetor de A se houver um n
Ax = x.

(12.83)

O n
umero e dito ser um autovalor de A e x o autovetor associado a . O conjunto de todos os
autovalores de um operador linear A e chamado de espectro pontual10 de A.
Um fato importante sobre operadores simetricos e o seguinte: se e um autovalor de um operador
simetrico A que age em um espaco vetorial complexo V , entao e um n
umero real. Para ver isso note
que se x e o autovetor associado a entao temos que, como A e simetrico
0 = hx, Axi hAx, xi = hx, xi hx, xi = ( )hx, xi .
Como x 6= 0, isso implica = , ou seja, e real.

O fato de o operador de Fredholm K ser simetrico significa que seus autovalores sao n
umeros reais.
Note-se que a equacao de Fredholm (12.81) e precisamente uma equacao de autovalores, o autovalor
sendo, nesse caso, o n
umero 1/. O que provamos acima diz-nos entao que dever ser um n
umero
real, uma outra demonstracao de um fato que ja sabamos.
O seguinte teorema pode ser demonstrado sobre o operador de Fredholm associado a um problema
de Sturm-Liouville:
Teorema 12.4 Seja K o operador de Fredholm associado a um problema de Sturm-Liouville, que
supomos n
ao admitir autovalor nulo. Ent
ao K e um operador contnuo. Seus autovalores formam um
conjunto discreto (ou seja, cont
avel) {n , n }. Os valores da seq
uencia dos n s
ao limitados
(n
ao divergem para ), apenas um n
umero finito deles pode ser negativo e eles se acumulam apenas


10

O conceito geral de espectro de operadores definidos em espacos de Banach e detalhadamente discutido na Seca
o
26.5, p
agina 1193.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

629/1304

1
= +. Alem disso, os autovalores n s
ao simples: existe para
n n
cada autovalor n apenas uma autofunca
o un tal que
no ponto 0. Assim, tem-se que lim

K u n = n un .

(12.84)

Denotemos por Hr o espaco de Hilbert de todas as funco


es em J = [a, b] tais que
Z

b
a

|f (x)|2 r(x) dx < .

(12.85)

Nesse espaco de Hilbert o produto escalar considerado e o produto escalar h, i r definido acima. Vamos
supor que as autofunco
es un s
ao normalizadas, ou seja, satisfazem hun , un ir = 1. Ent
ao o conjunto
das autofunco
es normalizadas un de K forma uma base ortonormal completa em Hr , ou seja, todo
vetor f Hr pode ser escrito como
f = lim

N
X

onde
cn := hun , f ir =
Mais precisamente, vale

lim

N
X
n=1

c n un

N
X
n=1

cn un =:

n=1

c n un

c n un ,

(12.86)

n=1

!+

un (x) f (x) r(x) dx .

(12.87)

2
Z b
N

X


= lim
cn un (x) r(x) dx = 0 . (12.88)
f (x)
N a

n=1
2

A demonstracao deste teorema e elaborada e sera apresentada ao longo da Secao 26.6, pagina 1202,
do Captulo 26. O que faremos e mostrar que o operador de Fredholm K e um operador compacto e
auto-adjunto e para tais operadores valem as propriedades espectrais mencionadas acima. A afirmacao
(12.86)-(12.88), por exemplo, e parte do chamado Teorema Espectral, o qual vale para operadores
compactos e auto-adjuntos, como mostrado no Teorema 26.29 da pagina 1219.
Notemos algumas conseq
uencias do teorema acima. Como os autovalores de um problema de SturmLiouville regular n sao da forma n = 1/n , onde n e um autovalor de K, o teorema acima diz-nos
que podemos ordenar os n s em ordem crescente:
< 1 < 2 < 3 <

(12.89)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

630/1304

com lim n = +. Uma segunda conseq


uencia de importancia relaciona o problema de Sturmn
Liouville com a funcao de Green. Seja u um vetor arbitrario de Hr . Como dissemos, podemos escrever
N

u = lim uN , onde uN = cn un , onde os cn s sao dados por (12.87). Como K e contnuo, temos que
N

n=1

(Ku)(x) =

lim (KuN )(x) =

lim

lim

N
X

cn (Kun )(x)

n=1

N
X
n=1

cn

1
un (x)
n

Z b

N
X
1
= lim
un (y)u(y)r(y) dy un (x)
N
n
a
n=1
=

r(y)
a

lim

N
X
un (x)un (y)
n=1

Por outro lado sabemos que, pela definicao, (Ku)(x) =


valem para qualquer u Hr , conclumos que
G(x, y) =

Rb
a

u(y) dy .

(12.90)

G(x, y)r(y) u(y). Como ambas relacoes

X
un (x)un (y)
n=1

(12.91)

possvel demonstrar, o que nao faremos aqui, que a soma do lado direito da u
E
ltima expressao e absoluta
e uniformemente convergente. A relacao (12.91), que e por vezes chamada formula de Mercer 11 , mostra
que a funcao de Green de um problema de Sturm pode ser escrita como uma expansao envolvendo
autovalores e autofuncoes de um problema de Sturm-Liouville. Esse fato e relevante tanto na pratica
da resolucao de equacoes diferenciais quanto na obtencao de resultados qualitativos sobre a natureza
das solucoes. Estudaremos adiante algumas dessas aplicacoes.

12.6

Uma Aplica
c
ao do Problema de Sturm-Liouville

Vamos aqui tratar do problema de encontrar as solucoes da equacao diferencial nao-homogenea


Lu + r(x)u = f (x) ,

(12.92)

onde a solucao u esta ainda sujeita a`s condicoes de contorno homogeneas (12.52)-(12.53). Acima, o
operador L e definido como anteriormente e assumimos para as funcoes p, q e r as mesmas condicoes
11

T. Mercer. Functions of positive type and their connection with the theory of integral equations. Transactions
London Phil. Soc. (A) 209, 415-446 (1909).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

631/1304

mencionadas no incio do presente captulo. A funcao f sera assumida uma funcao real e contnua e
um n
umero real dado.
Como veremos, a solucao pode ser obtida com uso das autofuncoes e autovalores do problema de
Sturm-Liouville
Lu + r(x)u = 0
com condicoes de contorno homogeneas do tipo (12.4)-(12.5). Chamaremos esse problema de problema
de Sturm-Liouville associado (ao problema (12.92)). Novamente suporemos que o problema de SturmLiouville associado nao tem solucao com autovalor = 0.
Com o uso da representacao da funcao de Green em termos dos autovalores e autofuncoes do
problema de Sturm-Liouville associado (formula de Mercer, (12.91)), vamos mostrar como podemos
encontrar uma expressao para a solucao desse problema.
A equacao diferencial (12.92) pode ser escrita como
Lu = r(x)u + f .

(12.93)

Usando, como fizemos anteriormente, o Teorema de Green, podemos dizer que a funcao u(x) que satisfaz
esta equacao diferencial satisfaz tambem a equacao integral
Z b
Z b
u(x) =
G(x, y)r(y)u(y) dy +
G(x, y)f (y) dy .
(12.94)
a

Definamos

g(x) :=

G(x, y)f (y) dy .

(12.95)

Usando a formula de Mercer para a funcao de Green, podemos escrever (12.94) como
u(x) =

X
hun , uir
un (x) + g(x) .

n
n=1

E. 12.15 Exerccio. Mostre isso.

(12.96)

Tomando-se o produto escalar de ambos os lados da igualdade com o vetor um , tiramos que



hum , uir = hum , gir .


(12.97)
1
m
Aplicando agora a formula de Mercer a` definicao de g em (12.95), tiramos que
Z b


X
1
g(x) =
un (y) f (y) dy un (x) ,

a
n=1 n

e, portanto, que

1
hum , gir =
m
ou seja,

(12.98)

um (y) f (y) dy ,

(12.99)

hum , gir =

1
hum , f i .
m

(12.100)

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

E. 12.16 Exerccio. Mostre esses dois u


ltimos resultados.

632/1304

Ate agora nao fizemos quaisquer restricoes a respeito da constante que aparece na equacao diferencial nao-homogenea (12.92). Ha dois casos a supor. Aquele em que nao e igual a nenhum autovalor
m do problema de Sturm-Liouville associado e aquele caso em que = s , para algum autovalor s
do problema de Sturm-Liouville associado.
Caso I. nao e um autovalor.
Nesse caso as relacoes (12.97) e (12.99) dizem-nos que
1
hum , uir =
m

um (y) f (y) dy

(12.101)

e, portanto, temos que


u(x) =


X

m=1

1
m

um (y) f (y) dy
a

um (x) .

(12.102)

Esta formula da-nos a solucao do problema em termos das autofuncoes e autovalores do problema
do Sturm-Liouville associado e mostra-nos uma das razoes que tornam importante a solucao do mesmo
problema de Sturm-Liouville. A serie do lado direito converge absoluta e uniformemente em J.
Caso II. = s para algum s.
Neste caso o problema tratado nem sempre tem solucoes. Para ver isso, note que, supondo-se a
existencia de uma solucao, a relacao (12.97) diz-nos neste caso que hu s , gir = 0, ou seja, por (12.100)
hum , f i =

us (y) f (y) dy = 0 .

(12.103)

Caso a funcao f seja tal que (12.103) nao e satisfeita, entao nenhuma solucao e possvel para o
problema tratado. Se f , porem, for tal que (12.103) seja valida, teremos que a funcao u
dada por
u
(x) =


X
m=1
m6=s

1
m

um (y) f (y) dy
a

um (x)

(12.104)

e uma solucao do problema tratado.


E. 12.17 Exerccio. Prove esta u
ltima afirmativa seguindo passos semelhantes aos do caso I.

A solucao mais geral, porem, e dada por


u(x) = cus (x) + u(x) ,

(12.105)

onde c e uma constante arbitraria, a ser determinada por alguma imposicao adicional qualquer a ser
feita ao problema.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

633/1304

E. 12.18 Exerccio. Mostre que esta funcao u e de fato uma solucao (substitua na equacao (12.92)
e verifique tambem se as condicoes de contorno sao satisfeitas). Mostre que nao pode haver solucao mais
geral que esta. Para isso use o fato que o autovalor s e simples.
6
O caso de condi
co
es de contorno n
ao-homog
eneas
Vamos aqui discutir brevemente uma generalizacao do problema anterior. Procuramos uma solucao
da equacao diferencial nao-homogenea
Lu + r(x)u = f (x) ,

(12.106)

onde a solucao u esta ainda sujeita a`s condicoes de contorno nao-homogeneas (12.2)-(12.3). Acima, o
operador L e definido como anteriormente e assumimos para as funcoes p, q e r as mesmas condicoes
mencionadas no incio destas notas. A funcao f sera assumida ser uma funcao real e contnua e sera
assumido ser um n
umero real dado.
Esse problema pode ser resolvido combinando metodos que ja discutimos. Em primeiro lugar
constroi-se uma funcao w que seja duas vezes diferenciavel e satisfaca as condicoes nao-homogeneas
(12.2)-(12.3).
Procura-se entao uma supostamente existente solucao v da equacao
Lv + r(x)v = h(x) ,

(12.107)

com
h(x) = f (x) (L + r(x))w(x) ,

que satisfaca as condicoes de contorno homogeneas (12.4)-(12.5). Uma tal solucao pode ser obtida
pelos metodos da Secao 12.6, pagina 630.
claro, entao, que u = v + w satisfara
E
Lu + r(x)u = f (x)

(12.108)

e as condicoes de contorno nao-homogeneas (12.2)-(12.3).


Como vimos, para a solucao v exista e necessario que nao seja um autovalor do problema de
Sturm-Liouville associado. Caso seja um autovalor, so teremos solucao se hu , hi = 0, ou seja,
hu , f i = hu , (L + r)wi .

(12.109)

Vale observar que


hu , (L + r)wi = hu , Lwi + hru , wi = hu , Lwi hLu , wi .
Note que o lado direito nao e forcosamente zero, pois aqui o Lema de Green nao se aplica, ja que w nao
e elemento do espaco vetorial V(1 , 2 , 1 , 2 ) das funcoes que satisfazem as condicoes de contorno
homogeneas (12.4)-(12.5). A condicao (12.109) fica, entao,
hu , f i = hu , Lwi hLu , wi .
Nesse caso de ser um autovalor podemos, como ja observamos, acrescentar a` solucao u
um m
ultiplo
da autofuncao u , obtendo a solucao mais geral na forma cu (x) + u
(x).

JCABarata. Curso de Fsica-Matem


atica

12.7

Vers
ao de 29 de setembro de 2005.

Captulo 12

634/1304

O M
etodo dos Determinantes de Fredholm

Vamos nesta secao apresentar a teoria de Fredholm para o tratamento das equacoes integrais de
Fredholm. Historicamante, o trabalho de Fredholm precedeu o estudo de Hilbert daquelas equacoes
integrais, trabalho esse que levou ao desenvolvimento da teorias dos espacos de Hilbert e dos operadores
compactos. Apesar de superado pelo de Hilbert, o tratamento de Fredholm e de interesse, pois envolve
um metodo de solucao explcita das equacoes integrais de Fredholm em termos de uma serie envolvendo
determinantes de certas matrizes construdas com o n
ucleo k(x, y). Esses determinantes passaram a
ser conhecidos como determinantes de Fredholm.
Iniciaremos nossa exposicao considerando a equacao de integral de Fredholm linear nao-homogenea.

12.7.1

A Equa
c
ao Integral de Fredholm Linear N
ao-Homog
enea

Consideremos a equacao integral de Fredholm linear e nao-homogenea definida em um intervalo compacto [a, b]
Z b
u(x) = f (x) +
k(x, y) u(y) dy ,
(12.110)


f : [a, b] e k : [a, b] [a, b]


equaca
o integral.

sendo ambas contnuas. A funcao k e denominada n


ucleo da

Vamos supor que k seja da forma k(x, y) =

n
X

al (x)bl (y), as funcoes al e bl sendo igualmente

l=1

contnuas em [a, b]. A equacao (12.110) assume a forma


u(x) = f (x) +

n
X

al (x)hbl , ui ,

(12.111)

l=1

onde, para funcoes contnuas g e h, definimos hg, hi :=

Rb
a

g(y)h(y) dy.

Multiplicando a u
ltima expressao por bm (x) e integrando em [a, b], ficamos com
hbm , ui = hbm , f i +
ou seja,
hbm , ui

n
X
l=1

n
X
l=1

hbm , al ihbl , ui ,

hbm , al ihbl , ui = hbm , f i ,

que deve ser encarada como um sistema linear de equacoes para as quantidades hb j , ui. Isso talvez
fique mais transparente definindo-se xj hbj , ui, yj hbj , f i e kij hbi , aj i, i, j = 1, . . . , n, com o
que a equacao acima fica
xm

n
X
l=1

kml xl = ym ,

ou seja,

( k)x = y ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

635/1304

 y1 
 x1 
.
sendo x = .. , y = ... e k sendo a matriz formada pelos elementos kij . A solucao dessa equacao
yn

xn

em forma matricial e x = ( k)1 y, caso a inversa de


restricao para ).

k exista (o que sera encarado como uma

Vamos agora cuidar de encontrar uma forma conveniente de expressar essa relacao com uso da
regra de Laplace, expressao (3.8), pagina 145, para o calculo de inversa de matrizes: para uma matriz
invertvel A vale

Men(A)ji
,
(12.112)
A1 ij = (1)i+j
det(A)
onde Men(A)ij e o determinante da matriz (n 1) (n 1) obtida eliminando-se a i-esima linha e a
j-esima coluna da matriz A. (A matriz Men(A) e por vezes denominada matriz dos menores de A).
Temos que assim que
xi =

n 
X
j=1

( k)

X
1
(1)i+j yj Men( k)ji .
yj =
ij
det( k) j=1

Por (12.111), a solucao u(x) e dada por u(x) = f (x) +


n

Pn

l=1

al (x)xl e, assim,

XX

u(x) = f (x) +
(1)l+j yj Men( k)jl al (x) .
det( k) l=1 j=1
Portanto,
u(x) = f (x) +
onde

Kn (x, y; ) :=

Kn (x, y; )f (y) dy ,

(12.113)

XX
1
(1)l+j bj (y)Men( k)jl al (x) .
det( k) l=1 j=1

(12.114)

bastante claro pelas expressoes acima que Kn (x, y; ) e a razao de dois polinomios em . Mais
E
especificamente, vale para Kn (x, y; ) a seguinte expressao
Kn (x, y; ) =

k(x, y) k(x, y1 ) k(x, ym )


Z b
Z
n1
k(y1 , y) k(y1 , y1 ) k(y1 , ym )
X
1
()m b

det

dy1 dym , (12.115)


..
..
..
det( k) m=0 m!

.
.
.
a
a
k(ym , y) k(ym , y1 ) k(ym , ym )

onde

det( k) =

n
X

()m
m!
m=0

b
a

k(y1 , ym )

..
dy1 dym .
.
k(ym , y1 ) k(ym , ym )

k(y1 , y1 )
b

..
det
.

(12.116)

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

636/1304

Os determinantes que aparecem nas duas expressoes acima sao denominados determinantes de
Fredholm e as expressoes acima sao denominadas f
ormulas dos determinantes de Fredholm, em honra a
seu descobridor. Suas demonstracoes que, infelizmente, sao bastante complexas, podem ser encontradas
em toda sua gloria no Apendice 12.G, pagina 654.
Resumindo nossas conclusoes ate aqui, vimos que a solucao da equacao de Fredholm linear naon
X
homogenea (12.110) para n
ucleos k na forma de uma soma finita k(x, y) =
al (x)bl (y), as funcoes
l=1

al e bl sendo contnuas em [a, b], e dada por

u(x) = f (x) +

Kn (x, y; )f (y) dy ,

(12.117)

com Kn definida em (12.115) e (12.116).


A questao importante que se coloca agora e saber se podemos tomar o limite n nas expressoes

X
al (x)bl (y), supondo que essa
acima, obtendo solucoes de (12.110) para n
ucleos da forma k(x, y) =
l=1

serie seja uniformemente convergente e que, como acima, as funcoes al e bl sejam todas contnuas.

A resposta a essa questao e obtida primeiramente mostrando que, sob as hipoteses acima, os limites
n de (12.115) e de (12.116) existem e, em seguida, provando que a expressao obtida tomando-se
o limite n no lado direito de (12.117) e, de fato, uma solucao da equacao (12.110). Para a prova
de convergencia necessitamos de uma boa estimativa para o crescimento com n de determinantes de
matrizes n n e a estimativa que se faz u
til e a estimativa de Hadamard12 , equacao (3.93), enunciada
no Teorema 3.27, pagina 216: para toda matriz A Mat ( , n) vale

n
n/2
.
| det(A)| n
max |Aij |
ij

Como k(x, y) e contnua em [a, b] [a, b], por hipotese, entao seu modulo possui um maximo k 0 0.
Com uso da estimativa de Hadamard, conclumos de (12.116) que
| det( k)|

n
X
|(b a)k0 |m m/2
m
.
m!
m=0

Pelo criterio da razao, o limite n convergira se |am+1 /am | < 1 para todo m grande o suficiente,
m
0 |
mm/2 . Agora,
sendo am = |(ba)k
m!



1 m/2
am+1
1
+
m


am |(b a)k0 | (m + 1)1/2 .

m

1
= e, o lado direito aproxima-se de |(b a)k0 | (m+1)e 1/2 para m grande. Segue,
Como lim 1 +
m
m
portanto, que lim |am+1 /am | = 0 para todo .


12

Jacques Salomon Hadamard (1865-1963).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

637/1304

Conclumos que, para todo , o limite lim det( k) existe e define uma funcao inteira (ou
n

seja, analtica em toda parte) de . Essa funcao e tradicionalmente denotada por D():

k(y
,
y
)

k(y
,
y
)
Z
Z
1
1
1
m

b
X ()m b

..
..
D() :=

(12.118)
det
dy1 dym .
.
.
m!
a
a
m=0
k(ym , y1 ) k(ym , ym )

De forma totalmente analoga prova-se a convergencia absoluta para todo da soma do lado
direito de (12.115). Assim,

k(x, y) k(x, y1 ) k(x, ym )


Z b
Z

k(y1 , y) k(y1 , y1 ) k(y1 , ym )


X
()m b

det

D(x, y; ) :=
dy1 dym ,
..
..
..

m!
.
.
.
a
a
m=0
k(ym , y) k(ym , y1 ) k(ym , ym )
(12.119)
existe e e uma funcao inteira de , Portanto, para K(x, y; ) = lim Kn (x, y; ), tem-se
n

K(x, y; ) =
que e uma funcao meromorfica de
para todo com D() 6= 0.

D(x, y; )
,
D()

(ou seja, e a razao de duas funcoes inteiras de ), definida

Com essa expressao, somos estimulados a crer que a solucao da equacao de Fredholm nao-homogenea

X
(12.110) para k(x, y) =
al (x)bl (y), supondo que essa serie seja uniformemente convergente e que
l=1

as funcoes al e bl sejam todas contnuas, seja dada por (vide (12.117))


Z b

D(x, y; )f (y) dy .
u(x) = f (x) +
D() a

(12.120)

Note que a expressao acima nao esta definida nos pontos em que D() = 0. Como D e uma
funcao inteira, esses pontos formam um conjunto discreto. Que de fato essa e a solucao procurada
sera conseq
uencia do proximo lema, o qual tambem sera empregado de forma importante mais adiante
quando tratarmos da equacao de Fredholm linear e homogenea (Secao 12.7.2, pagina 638).

Lema 12.2 Com as definico


es acima, valem
D(x, y; ) = D()k(x, y) +
e
D(x, y; ) = D()k(x, y) +

k(x, z)D(z, y; ) dz

(12.121)

D(x, z; )k(z, y) dz .

(12.122)

a
b

Essas relaco
es s
ao denominadas relacoes de reciprocidade entre os n
ucleos k e D. Alem disso, vale
Z b
dD
() =
D(z, z; ) dz .
(12.123)
d
a
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

638/1304

Prova. A prova de (12.121) e imediada se expandirmos os determinantes que ocorrem em (12.119) em


relacao a` primeira linha (expressao (3.9), pagina 145). Os coeficientes podem ser identificados sem
dificuldades, usando novamente (12.119) e (12.118), apos trocas convenientes das linhas das matrizes
menores que ocorrem na expansao. A prova de (12.122) segue a mesma ideia, mas fazendo-se a expansao
dos determinantes que ocorrem em (12.119) em relacao a` primeira coluna (expressao (3.10), pagina 145).
A relacao (12.123) pode ser provada sem dificuldades calculando-se o lado esquerdo com uso de (12.118)
e o lado direito com uso de (12.119) e comparando-se as expressoes assim obtidas.
Podemos agora provar que o lado direito de (12.120) e solucao de (12.110). Escrevendo (12.120)
Rb

D(z, y; )f (y) dy, multiplicando ambos os lados por k(x, z), integrando
como u(z) = f (z) + D()
a
em z e somando f (x), temos
f (x) +

k(x, z)u(z)dz = f (x) +


a
(12.121)

= f (x) +

b
a

2
k(x, z)f (z)dz +
D()

Z bZ
a

k(x, z)D(z, y; )f (y)dydz


a

k(x, z)f (z) dz


a

+
D()

= f (x) +
D()

Z b
a


D(x, y; ) D()k(x, y) f (y) dy

D(x, y; )f (y) dy
a

= u(x) ,
provando que u satizfaz (12.110).
Devemos notar ainda que a forma k(x, y) =

al (x)bl (y) e bastante geral. Toda funcao de duas

l=1

variaveis reais, contnua em [a, b] [a, b], pode ser escrita assim para uma escolha conveniente de
al s e bl s contnuas e de modo que a serie convirja uniformemente. Por exemplo, al s e bl s podem ser
tomados como polinomios ortonormais em algum espaco de funcoes de quadrado integravel em [a, b].

12.7.2

A Equa
c
ao Integral de Fredholm Linear Homog
enea

Para o problema de Sturm-Liouville nosso interesse concentra-se na equacao integral de Fredholm linear
homogenea
Z
b

u(x) =

k(x, y) u(y) dy ,

(12.124)

k : [a, b] [a, b] contnua. Claramente, trata-se da equacao (12.110) para o caso em que f e
identicamente nula. Ora, a solucao de (12.110) foi obtida em (12.120) e nela vemos que, caso seja tal
que D() 6= 0, entao a u
nica solucao para f 0 e a solucao identicamente nula. Conclumos que se
for tal que a equacao integral de Fredholm homogenea possui solucao nao-nula, entao D() = 0. Isso

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

639/1304

limita o conjunto de valores possveis de ao conjunto de zeros da funcao inteira D(), conjunto esse
que passa a ter importancia significativa na teoria de Fredholm.
Como vimos, (12.120) nao fornece a solucao nesse caso (apenas a solucao trivial), mas a chave da
solucao encontra-se nas equacoes (12.121) e (12.123).
Seja n um zero de ordem qn 1 de D() em . Como D() e D(x, y; ) sao analticas em toda
parte como funcoes de , valem as expansoes de Taylor (absolutamente convergentes para | n |
suficientemente pequeno),
D() =

m=qn

am ( n ) ,

D(x, y; ) =

m=pn

com pn 0 e aqn 6= 0. Agora, por (12.123), tem-se

m=qn 1

(m + 1)am+1 ( n )

Z
X

m=pn

dm (x, y)( n )m ,

dm (z, z) dz
a

de onde se conclui que pn = qn 1 e, em particular, que


Z b
dqn 1 (z, z) dz .
qn a qn =

( n )m ,

(12.125)

O fato de pn = qn 1 diz-nos que K(x, y; ) = D(x, y; )/D() tem um polo de ordem 1 em


= n . Agora, escrevendo (12.121) na forma
Z b
Z b
K(x, y; ) = k(x, y) +
k(x, z)( n )K(z, y; ) dz + n
k(x, z)K(z, y; ) dz ,
a

constatamos que os dois primeiros termos do lado direito sao analticos em = n , enquanto que o
lado esquerdo e o u
ltimo termo do lado direito tem um polo de ordem 1 nesse ponto. Calculando os
resduos de ambos os lados, conclumos que a funcao


1

=
wn (x, y) := Res K(x, y; )
dq 1 (x, y)
a qn n
=n
satisfaz

wn (x, y) = n

k(x, z)wn (z, y) dz .


a

Portanto, para um y fixo, a funcao wn (x, y) e uma solucao da equacao de Fredholm linear homogenea
com autovalor n . Note que dqn 1 (x, y) nao pode ser identicamente nula, devido a (12.125) e ao fato
que aqn 6= 0, por hipotese.

Em resumo, as solucoes da equacao de Fredholm linear homogenea com = n , para cada n que
satisfaca D(n ) = 0, sao obtidas do primeiro coeficiente nao-nulo da expansao de Taylor de D(z, y; )
em tormo de n .
Nota hist
orica sobre o problema de Fredholm

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

640/1304

O tratamento que apresentamos acima, no qual se obtem a solu


Pcao (12.120) da equacao naohomogenea (12.110), primeiramente para n
ucleos da forma k(x, y) = nl=1 al (x)bl (y) e depois tomando
o limite n , e originalmente devido a Goursat13 . Em seu trabalho original, Fredholm seguira uma
estrategia ligeiramente distinta14 , primeiro discretizando a equacao (12.110), transformando a integral
em uma soma de Riemann, em seguida resolvendo o sistema linear correspondente (quando entao surgem os determinantes) e, por fim, recuperando o limite do contnuo. Os passos de Fredholm podem ser
acompanhados na exposicao de [136]. Esses desenvolvimentos culminaram com os trabalhos de Hilbert
e Schmidt15 , entre 1904 e 1910, sobre a equacao de Fredholm linear homogenea, levando ao nascimento
das nocoes de espacos de Hilbert e de operadores compactos.
Em teoria, metodo de Fredholm descrito acima fornece as solucoes desejadas, tanto no caso linear
nao-homogeneo quanto no linear homogeneo, mas na pratica ha grandes dificuldades, tanto numericas
quanto analticas, em lidar com a serie de determinantes e suas expansoes em serie de Taylor, o que dificulta tanto a solucao numerica de equacoes por esse metodo quanto o estudo abstrato de propriedades
de suas solucoes e dos autovalores. Por isso, o metodo de Fredholm acabou substituido pelos metodos
analtico-funcionais provenientes dos trabalhos de Hilbert, Schmidt e outros. Mais sobre isso sera estudado no Captulo 26, pagina 1114, quando desenvolvermos a teoria dos operadores compactos (Secao
26.6, pagina 1202). Independente disso, os trabalhos de Hilbert e colaboradores engendraram uma
serie de desenvolvimentos que alcancaram de modo marcante a Fsica quando do advento da Mecanica

Quantica, levando tambem ao nascimento da Analise Funcional e das Algebras


de Operadores, areas
de grande importancia na Matematica. Para uma historia da Analise Funcional, vide [32].

12.8

Coment
arios Finais

12.8.1

O Problema de Sturm-Liouville Singular

Vamos aqui discutir brevemente uma variante do problema de Sturm-Liouville regular que consiste no
problema de determinar as solucoes da equacao diferencial
(p(x)u0 )0 + q(x)u + r(x)u(x) = 0
para u definida no intervalo fechado finito [a, b]


(12.126)

, b > a, com as seguintes condicoes de contorno

u(a) e u0 (a) sao finitas,

(12.127)

1 u(b) + 2 u0 (b) = 0 ,

(12.128)

onde o seguinte estara sendo suposto:


As funcoes p, q e r sao reais e contnuas em [a, b].
13

Edouard Jean-Baptiste Goursat (1858-1936). O mencionado trabalho de Goursat e Sur um cas elementaire de
lequation de Fredholm. Bull. Soc. math. France, vol. 35, 163-173 (1907).
14
Erik Ivar Fredholm (1866-1927). O mencionado trabalho de Fredholm e Sur une class dequations fonctionelles,
Acta Math. 27, 365-390 (1903).
15
Erhard Schmidt (1876-1959).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

641/1304

A funcao p e diferenciavel em [a, b] e positiva: p(x) > 0 para x (a, b] mas se anula em x = a:
p(a) = 0
r e contnua e estritamente positiva em J, ou seja, r(x) > 0 para todo x [a, b].
As constantes 1 , 2 , 1 e 2 sao reais e tais que (1 , 2 ) 6= (0, 0) e (1 , 2 ) 6= (0, 0).
Como se percebe, a distincao basica entre este problema e o anteriormente tratado reside no fato
de que agora p(x) se anula no ponto a. O fato de p anular-se em a implica que a solucao pode ser
singular nesse ponto. Da, nenhuma condicao de contorno pode ser fixada para o ponto x = a, exceto
que a solucao e sua derivada nao sejam divergentes naquele ponto (se isso for desejado).
Um exemplo fsico que conduz a esse tipo de situacao e o problema das oscilacoes de uma corda de
densidade constante e comprimento L, suspensa verticalmente em um campo gravitacional constante
(a aceleracao da gravidade sendo g) e presa em uma das suas extremidades, a outra ficando livre. Esse
problema e resolvido na Secao 10.2.2, pagina 556. Se x representa a altura e o ponto onde uma as
extremidades fica presa e x = L, entao a equacao que descreve o problema e


u
2u

gx
=
x
x
t2
com as condicoes de contorno u(0, t) e u0 (0, t) finitas e u(L, t) = 0. Usando o metodo de separacao
de variaveis e adotando-se u(x, t) = v(x)w(t), obtem-se para w a equacao
w(t)
+ w(t) = 0
e para v
(gxv 0 )0 + v = 0 ,
com v(L) = 0 e com v(0) e v 0 (0) finitos. Aqui euma constante arbitraria a ser determinada pelas
condicoes de contorno. A solucao e vn (x) = cn J0 (2 n x), onde J0 e a funcao de Bessel de ordem zero,
0 )2
n
, onde n0 e o n-esimo zero de J0
cn e uma constante e n e o n-esimo autovalor, dado por n = (4L
no semi-eixo real positivo. Para um tratamento detalhado desse problema, vide Secao 10.2.2, pagina
556. O problema para v e claramente um problema de Sturm-Liouville do tipo mencionado acima, ja
que p(x) = gx se anula em x = 0.
Esse tipo de problema de Sturm-Liouville e, por vezes, denominado Problema de Sturm-Liouville
singular, e para ele nem sempre valem os mesmos resultados que no caso anteriormente tratado, o dos
problemas de Sturm-Liouville regulares. Por exemplo, nem sempre pode ser garantida a existencia de
autovalores e autovetores (ou seja, de solucoes para o problema). Isso pode ser visto explicitamente no
exemplo tratado no Apendice 12.D, pagina 647.
Mesmo assim, os problemas de Sturm-Liouville singulares, quando sol
uveis, compartilham algumas
propriedades com os problemas regulares, tais como a realidade dos autovalores e a ortogonalidade das
autofuncoes.
De fato, e facil ver que o Lema de Green tambem vale nesse caso. Seja V(1 , 2 ) o espaco vetorial
de todas as funcoes f duas vezes diferenciaveis definidas no intervalo [a, b] tais que 1 f (b) + 2 f 0 (b) = 0
e que sejam finitas em x = a. Entao, se u e v sao elementos de V(1 , 2 ) tem-se
hv, Lui = hLv, ui ,

JCABarata. Curso de Fsica-Matem


atica

ou seja,

Vers
ao de 29 de setembro de 2005.

v(x) (Lu)(x) dx =
a

Captulo 12

642/1304

(Lv)(x) u(x) dx .

(12.129)

De fato, como em (12.62) e (12.63), pagina 620, tem-se


Z

v(x) (Lu)(x) dx =
a

u(x) (Lv)(x) dx
a





0
0
0
0
+ p(b) v(b)u (b) v (b)u(b) p(a) v(a)u (a) v (a)u(a) . (12.130)

Ou
ltimo termo e zero, pois p(a) = 0 e v(a)u0 (a) v 0 (a)u(a) e finito. O termo v(b)u0 (b) v 0 (b)u(b) e
nulo pelo mesmo argumento apresentado quando da primeira demonstracao do Lema de Green, para o
caso regular (vide pagina 620 e seguintes).
Uma vez demonstrado o Lema de Green para o problema singular, segue de maneira totalmente
analoga ao que demonstramos no caso regular que os autovalores sao reais e que autofuncoes de autovalores distintos sao ortogonais entre si em relacao ao produto escalar h, ir :
hu , u0 ir =

b
a

u (x) u0 (x) r(x) dx = 0

se 6= 0 . Nao repetiremos a demonstracao aqui e remetemos o leitor a` pagina 621 onde isso foi feito
no caso regular.
E. 12.19 Exerccio. Mostre que, assim como no caso regular, os autovalores, se existirem, sao simples.
Para isso estude a demonstracao para o caso regular da Secao 12.4.2, pagina 622, e verifique que a mesma
tambem se aplica ao caso singular.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

643/1304

Ap
endices
12.A

Prova do Teorema 12.1. Exist


encia e Unicidade

Abaixo faremos uso da notacao e de resultados do Captulo 7, pagina 306.


A equacao u00 + a1 (x)u0 + a0 (x)u = g(x) e equivalente a` equacao de primeira ordem
Y 0 (x) = A(x)Y (x) + G(x)
onde

Y (x) =

y1 (x)
y2 (x)

A(x) =
0

a0 (x)

a1 (x)

com as identificacoes u(x) = y1 (x), u (x) = y2 (x).

G(x) =

,
g(x)

A solucao e da forma
Y (x) = D(x, x0 )Yx0 +

D(x, y)G(y) dy ,
x0

onde Yx0 = Y (x0 ), x0 arbitrario.


facil ver da que a solucao geral da equacao u00 + a1 (x)u0 + a0 (x)u = g(x) e da forma
E
u(x) = A1 u1 (x) + A2 u2 (x) + up (x) ,
onde A1 e A2 sao constantes, u1 e u2 sao solucoes independentes da equacao homogenea u00 + a1 (x)u0 +
a0 (x)u = 0 e up e uma solucao particular da equacao nao-homogenea u00 + a1 (x)u0 + a0 (x)u = g(x).
Desejamos impor as condicoes de contorno
1 u(a) + 2 u0 (a) = 1 ,

(12.A.1)

1 u(b) + 2 u0 (b) = 2 ,

(12.A.2)

1 (A1 u1 (a) + A2 u2 (a) + up (a)) + 2 (A1 u01 (a) + A2 u02 (a) + u0p (a)) = 1 ,

(12.A.3)

1 (A1 u1 (b) + A2 u2 (b) + up (b)) + 2 (A1 u01 (b) + A2 u02 (b) + u0p (b)) = 2 .

(12.A.4)

a` solucao. Isso implica

Esse par de equacoes pode ser escrito em forma matricial como

1 1 up (a) 2 u0p (a)


A1
1 u2 (a) + 2 u02 (a)
1 u1 (a) + 2 u01 (a)
.
=

0
0
0
2 1 up (b) 2 up (b)
A2
1 u2 (b) + 2 u2 (b)
1 u1 (b) + 2 u1 (b)

(12.A.5)

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

E. 12.20 Exerccio. Verifique.

644/1304

Essa u
ltima equacao (cujas incognitas sao A1 e A2 ) tem solucao u
nica se e somente se

1 u1 (a) + 2 u01 (a)


1 u2 (a) + 2 u02 (a)

1 u2 (b) + 2 u02 (b)


1 u1 (b) + 2 u01 (b)

for uma matriz invertvel, ou seja, se

1 u1 (a) + 2 u01 (a)


det
1 u1 (b) + 2 u01 (b)

1 u2 (a) + 2 u02 (a)


1 u2 (b) +

2 u02 (b)

Isso e o que queramos provar.

12.B

6= 0 .

Prova da Proposi
c
ao 12.1

Pelas hipoteses mencionadas, existem funcoes u1 e u2 independentes entre si que sao solucoes de Lu = 0
e satisfazem (12.22). Sejam c11 , c12 , c21 , c22 definidas por

c11
c12
1 u1 (a) + 2 u01 (a)
1 u2 (a) + 2 u02 (a)
0
1

:=

0
0
c21
c22
1 u1 (b) + 2 u1 (b)
1 u2 (b) + 2 u2 (b)
1
0

1 u2 (a) + 2 u02 (a)

(1 u1 (a) + 2 u01 (a))

2 u02 (b)

2 u01 (b))

1 u2 (b) +

Note-se que

c11
c12
1 u1 (a) + 2 u01 (a)
= det
det
1 u1 (b) + 2 u01 (b)
c21
c22

(1 u1 (b) +

1 u2 (a) + 2 u02 (a)


1 u2 (b) +

2 u02 (b)

por (12.22).

Sejam as funcoes v1 (x) e v2 (x) definidas por

v1 (x)
c11

=
v2 (x)
c21
Pela definicao,

Lv1
Lv2

c11
c21

c12
c22

u1 (x)
u2 (x)

det

= ,
c22
Lu2
0
c12

Lu1

(12.B.6)

6= 0 (12.B.7)

JCABarata. Curso de Fsica-Matem


atica

pois Lu1 = Lu2 = 0. Alem disso,

c11
v1 (x)
v10 (x)

=
c21
v2 (x)
v20 (x)

e como

det

Captulo 12

Vers
ao de 29 de setembro de 2005.

c12
c22

u1 (x)

u01 (x)

u2 (x)

u02 (x)

u1 (x)

u01 (x)

u2 (x)

u02 (x)

645/1304

(12.B.8)

6= 0 ,

pois u1 e u2 sao independentes, segue de (12.B.7) que

v1 (x)
v10 (x)
6= 0 ,
det
0
v2 (x)
v2 (x)

(12.B.9)

para todo x [a, b], provando que v1 e v2 sao tambem independentes.


Tem-se de (12.B.8)

1 v1 (x) + 2 v10 (x)


v1 (x)

=
1 v2 (x) + 2 v20 (x)
v2 (x)

Logo,

1 v1 (a) + 2 v10 (a)


1 v2 (a) +

2 v20 (a)

c11

v20 (x)
c12

c21

c22

c11

c12

c21

que afirma, em particular, que

v10 (x)

c11

c22

c12

c21

c22

c11

c12

c21

c22

1
2

u1 (x)

u01 (x)

u2 (x)

u02 (x)

1 u1 (x) + 2 u01 (x)


1 u2 (x) +

0
c11 c22 c12 c21

2 u02 (x)

1
2

c12
c11

1 v1 (a) + 2 v10 (a) = 0 .

1 u1 (a) + 2 u01 (a)


1 u2 (a) +

2 u02 (a)

(12.B.10)

(12.B.11)

JCABarata. Curso de Fsica-Matem


atica

Analogamente,

1 v1 (x) + 2 v10 (x)


1 v2 (x) +

2 v20 (x)

Logo,

1 v1 (b) + 2 v10 (b)


1 v2 (b) +

2 v20 (b)

v1 (x)
v2 (x)


1

v20 (x)
2
c12

c21

c22

c11

c12

c21

c11

646/1304

v10 (x)

c11

que afirma, em particular, que

Captulo 12

Vers
ao de 29 de setembro de 2005.

c22

c12

c21

c22

c11

c12

c21

c22

u1 (x)
u2 (x)


1

u02 (x)
2

u01 (x)

1 u1 (x) + 2 u01 (x)


1 u2 (x) +

2 u02 (x)

1 u1 (b) + 2 u01 (b)


1 u2 (b) +
c22
c21

c11 c22 + c12 c21


0

2 u02 (b)

(12.B.12)

1 v2 (b) + 2 v20 (b) = 0 .

(12.B.13)

As relacoes (12.B.11) e (12.B.13) sao precisamente o que afirmamos em (12.23) e (12.24). Isso
demonstra o que queramos provar sobre a existencia e propriedades das funcoes v 1 e v2 .

12.C

Coment
ario Sobre o Determinante Wronskiano

Faremos aqui um comentario sobre a nocao de determinante Wronskiano introduzida no Captulo 7,


pagina 7 (vide pagina 318) e aquele apresentado na definicao. (12.30).
Abaixo faremos uso de notacao e de resultados daquelas notas.
A equacao Lu = 0 pode ser escrita na forma u00 +a1 (x)u0 +a0 (x)u = 0 que, por sua vez, e equivalente
a` equacao de primeira ordem
Y 0 (x) = A(x)Y (x) ,
onde

Y (x) =

y1 (x)
y2 (x)

A(x) =

a0 (x)

a1 (x)

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

647/1304

com as identificacoes u(x) = y1 (x), u0 (x) = y2 (x).


A solucao e da forma
Y (x) = D(x, x0 )Yx0 ,
onde Yx0 = Y (x0 ), x0 arbitrario.
Se Y1 e Y2 sao duas solucoes independentes da equacao homogenea Y 0 (x) = A(x)Y (x), o determinante Wronskiano (segundo a definicao usada no Captulo 7, pagina 7 (vide pagina 318)) e
hh
ii
det Y1 (x), Y2 (x) .
Como comentamos acima, Y1 e Y2 sao da forma

u1 (x)
,
Y1 (x) =
0
u1 (x)

Y2 (x) =

u2 (x)
u02 (x)

onde u1 e u2 sao duas solucoes independentes de Lu = 0.


claro entao que
E
hh

det Y1 (x), Y2 (x)

ii

= det

u1 (x)

u2 (x)

u01 (x)

u02 (x)

= det

u1 (x)

u01 (x)

u2 (x)

u02 (x)

Au
ltima igualdade e apenas o fato de que o determinante de uma matriz nao muda quando a transpomos.
Por outro lado, a relacao (12.B.8) nos diz que

v1 (x)
v10 (x)
c11
c12
u1 (x)
u01 (x)
= det
det
.
det
(12.C.14)
0
0
v2 (x)
v2 (x)
c21
c22
u2 (x)
u2 (x)






c11 c12
v1 (x) v10 (x)
u1 (x) u01 (x)
diferem apenas
Como det
e nao nulo, isso diz que det
e det
u2 (x) u02 (x)
c21 c22
v2 (x) v20 (x)


v (x) v10 (x)
e o determinante Wronskiano, introduzido em
por um fator constante. Agora det 1
v2 (x) v20 (x)
(12.30).
Com isso mostramos que o determinante Wronskiano do Captulo 7, pagina 7, difere apenas por
um fator nao nulo constante daquele introduzido em (12.30).

12.D

Aus
encia de Autovalores em um Problema Singular

Considere o seguinte problema de Sturm-Liouville singular definido no intervalo [0, 1]:


(x2 u0 )0 + u = 0 ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

648/1304

com u(1) = 0 e u finita em x = 0. A equacao diferencial e


x2 u00 + 2xu0 + u = 0 ,
que e uma equacao do tipo de Euler, de segunda ordem. A solucao pode ser procurada na forma
u(x) = x e obtem-se

1 1 4
.
=
2
Assim, para 6= 1/4, tem-se

1+ 14
1 14
2
2
u(x) = Ax
+ Bx
.
Como deseja-se u(1) = 0 tem-se A = B e, assim,

 1+14

1 14
2
2
x
.
u(x) = A x
Essa solucao so sera finita em x = 0 se16

1 + Re 1 4 0

1 Re

1 4 0 .

Ambas as condicoes nao podem ser satisfeitas simultaneamente para nenhum (pois somando-se ambas
as desigualdades, teramos 2 0, o que e obviamente falso). Para = 1/4 a solucao e u(x) =
1 (A ln x + B) e a condi
cao u(1) = 0 implica B = 0 e, portanto, u(x) = A 1x ln x, que nao e finita em
x
x = 0. Logo, o problema tratado nao tem solucao para nenhum autovalor.

12.E

Demonstra
c
ao do Teorema 12.3

De acordo com (12.71),

b
2

|u(x)| r(x) dx =

b
a


|u0 (x)|2 p(x) |u(x)|2 q(x) dx
h


i
0
+ p(a) Re u(a)u (a) p(b) Re u(b)u (b)
. (12.E.15)
0

Afirmamos que existem constantes 1 e 2 , independentes de u, tais que




p(a) Re u(a)u0 (a) = 1 |u(a)|2



p(b) Re u(b)u0 (b) = 2 |u(b)|2 .

(12.E.16)
(12.E.17)

A demonstracao e a seguinte. A funcao u satisfaz no ponto a

1 u(a) + 2 u0 (a) = 0 .
16

Outra possibilidade seria escolher A = 0, ou seja, u(x) = 0, soluca


o trivial que n
ao interessa como autofunca
o.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

649/1304

Vamos primeiro supor que 2 6= 0. Tomando-se o complexo conjugado e multiplicando-se a expressao


por u(a) obtem-se
1
u0 (a)u(a) = |u(a)|2 ,
2
ou seja,


1
Re u0 (a)u(a) = |u(a)|2 .
2
Nesse caso, entao, tomamos 1 = p(a) 12 .

Caso 2 = 0, a relacao 1 u(a) + 2 u0 (a) = 0 diz-nos que u(a) = 0. Da, e evidente que


p(a) Re u(a)u0 (a) = 1 |u(a)|2 ,

para qualquer constante 1 , pois ambos os lados sao nulos. Isso provou (12.E.16). A demonstracao de
(12.E.17) e analoga, escolhendo-se 2 = +p(b) 21 , caso 2 6= 0.
Inserindo (12.E.16) e (12.E.17) em (12.E.15) tem-se

b
2

|u(x)| r(x) dx =


|u0 (x)|2 p(x) |u(x)|2 q(x) dx + 1 |u(a)|2 + 2 |u(b)|2 .

(12.E.18)

Essa u
ltima expressao sera nosso ponto de partida para mostrar que os autovalores sao limitados
inferiormente, ou seja, que existe uma constante M tal que M .


Note-se que 1 e 2 sao n


umeros reais que tanto podem ser positivos quanto negativos. Vamos
considerar os quatro casos possveis: 1. 1 0 e 2 0; 2. 1 < 0 e 2 0; 3. 1 0 e 2 < 0; 4.
1 < 0 e 2 < 0.
Caso 1. 1 0 e 2 0.

Nesse caso tem-se de (12.E.18) que

|u(x)| r(x) dx

Rb

b
a

|u(x)|2 q(x) dx ,

|u0 (x)|2 p(x)dx 0, pois p(x) > 0. Logo,




Rb
Rb
q(x)
2
2
r(x) dx
|u(x)|

|u(x)| q(x) dx
r(x)
a
=
.
Rab
Rb
2 r(x) dx
2 r(x) dx
|u(x)|
|u(x)|
a
a

pois 1 |u(a)|2 + 2 |u(b)|2 0 e

Sejam agora

Q = max q(x),
x[a, b]

R1 = max r(x),
x[a, b]

Lembrando que r(x) > 0 para todo x [a, b], teremos

Q
q(x)

.
r(x)
r(x)

R2 = min r(x) .
x[a, b]

(12.E.19)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

650/1304

Se Q = 0 conclumos que

q(x)
0.
r(x)

Se Q < 0, conclumos que

Q
q(x)

.
r(x)
R1

q(x)
Q
.

r(x)
R2

Se Q > 0, teremos

E. 12.21 Exerccio. Justifique cuidadosamente as desigualdades acima.


Em resumo,

Retornando a (12.E.19)

0,

se Q = 0

q(x)
RQ1 , se Q < 0 .
B :=

r(x)

Q
R2 , se Q > 0
Rb
a

|u(x)|2 Br(x) dx

Rb
a

(12.E.20)

= B,

|u(x)|2 r(x) dx

onde B esta definida em (12.E.20). Adotando M = B para esse caso, obtemos o que se queria provar.
Caso 2. 1 < 0 e 2 0.

Nesse caso tem-se de (12.E.18) que

b
2

|u(x)| r(x) dx

b
a

pois 2 |u(b)|2 0.


|u0 (x)|2 p(x) |u(x)|2 q(x) dx + 1 |u(a)|2 ,

(12.E.21)

No Apendice 12.F, pagina 652, demonstramos a seguinte desigualdade, valida para todo x [a, b]
e todo  > 0:
Z b
Z b
2
0
2
|u(x)| 
|u (y)| dy + ()
|u(y)|2 r(y) dy ,
(12.E.22)
a

onde

1
() =
R2

R2 sendo definido como acima: R2 = min r(x).

1
1
+
ba 

x[a, b]

Tomando x = a, temos
2

1 |u(a)| 1 

b
0

|u (y)| dy + 1 ()

b
a

|u(y)|2 r(y) dy ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

651/1304

sendo que a desigualdade se inverteu pois 1 < 0, por hipotese. Inserindo isso em (12.E.21), tem-se
Z b
Z b
Z b
2
0
2

|u(x)| r(x) dx
(p(x) + 1 ) |u (x)| dx +
(1 ()r(x) q(x)) |u(x)|2 dx .
a

Ate agora nao fixamos o valor de . Vamos agora escolhe-lo pequeno o suficiente de modo que
p(x) + 1  0 ,
para todo x [a, b]. Isso e sempre possvel, pois, por hipotese p(x) > 0 para todo x [a, b]. Com
Rb
essa escolha a integral a (p(x) + 1 ) |u0 (x)|2 dx e positiva e podemos escrever

b
2

|u(x)| r(x) dx

Z b

b
2

(1 ()r(x) q(x)) |u(x)| dx =

q(x)
1 ()
r(x)

|u(x)|2 r(x) dx .

Com o uso de (12.E.20) isso fica


Z b
Z b
2

|u(x)| r(x) dx (1 () + B)


|u(x)|2 r(x) dx ,
a

o que implica
(1 () + B) .
Adotando-se M = (1 () + B) para esse caso, obtemos que queramos provar.
Caso 3. 1 0 e 2 < 0.

Esse caso e totalmente analogo ao caso 2, e nao precisa ser considerado em detalhe.

Caso 4. 1 < 0 e 2 < 0.


Esse caso e tambem analogo ao caso 2, mas trataremos dos detalhes. De (12.E.18) temos
Z b
Z b

2

|u(x)| r(x) dx
|u0 (x)|2 p(x) |u(x)|2 q(x) dx + 1 |u(a)|2 + 2 |u(b)|2 .
(12.E.23)
a

Usando novamente a desigualdade (12.E.22) para x = a e x = b, temos


Z b
Z b
2
2
0
2
1 |u(a)| + 2 |u(b)| (1 + 2 )
|u (y)| dy + (1 + 2 )()
|u(y)|2r(y) dy,
a

sendo que a desigualdade se inverteu pois 1 < 0 e 2 < 0, por hipotese. Inserindo isso em (12.E.21),
tem-se
Z b
Z b
Z b
2
0
2

|u(x)| r(x) dx
(p(x) + (1 + 2 )) |u (x)| dx +
((1 + 2 )()r(x) q(x)) |u(x)|2 dx.
a

Ate agora nao fixamos o valor de . Vamos agora escolhe-lo pequeno o suficiente de modo que
p(x) + (1 + 2 ) 0 ,

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

652/1304

para todo x [a, b]. Isso e sempre possvel, pois, por hipotese p(x) > 0 para todo x [a, b]. Com
Rb
essa escolha a integral a (p(x) + (1 + 2 )) |u0 (x)|2 dx e positiva e podemos escrever

|u(x)| r(x) dx

b
a

((1 + 2 )()r(x) q(x)) |u(x)|2 dx


Z b

q(x)
(1 + 2 )()
r(x)

|u(x)|2 r(x) dx.

Com o uso de (12.E.20) isso fica

b
2

|u(x)| r(x) dx ((1 + 2 )() + B)

|u(x)|2 r(x) dx ,

o que implica
((1 + 2 )() + B) .
Adotando-se M = ((1 + 2 )() + B) para esse caso, isto e o que queramos provar.
Com isso a demonstracao do Teorema 12.3 esta completa.

12.F

Prova da Desigualdade (12.E.22)

Seja u uma funcao qualquer duas vezes diferenciavel definida em [a, b]. Sejam x [a, b] e x0 [a, b].
Tem-se
Z x
0
2
2
|u(y)|2 dy .
|u(x)| = |u(x0 )| +
x0

Portanto, tem-se, para quaisquer x, x0 [a, b],

Z

|u(x)| |u(x0 )| +
2

Agora,
Z
Z x

2 0
|u(y)| dy =
x0

Assim,

x
x0

Z

0
u(y)u(y) dy =

x
x0

|u(y)|

x0

u0 (y)u(y)

Z

|u(x)| |u(x0 )| + 2 Re
2



dy .


2 0

+ u(y)u (y) dy = 2

x0



u0 (y)u(y) dy .

Para qualquer n
umero complexo z, vale |Re(z)| |z|. Logo,
Z x

Z x





0
0
Re


.
u
(y)u(y)
dy

u
(y)u(y)
dy




x0

x0

x
x0



Re u0 (y)u(y) dy .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Pela desigualdade de Cauchy-Schwarz,


Z
Z x




0


u (y)u(y) dy

1/2 Z

|u (y)| dy

x0

x0

x0

653/1304

1/2

.
|u(y)| dy

Conseq
uentemente, juntando as duas u
ltimas desigualdades,
1/2
Z x


2
2
2

|u(y)| dy
|u(x)| |u(x0 )| + 2

Captulo 12

x0

1/2

|u (y)| dy
.
0

x0

Como x e x0 sao elementos de [a, b] e tambem obvio que


Z x

Z b


2


|u(y)| dy
|u(y)|2 dy

x0

e que


Z b


|u (y)| dy
|u0 (y)|2 dy ,
0

x0

ja que ao passarmos de uma integral em [x0 , x] a uma integral em [a, b] estamos em geral aumentando
o intervalo de integracao e, em ambos os casos, o integrando e positivo.
Assim,
2

|u(x)| |u(x0 )| + 2

Z

b
2

|u(y)| dy

1/2 Z

b
0

|u (y)| dy

1/2

Para qualquer  > 0 isso pode ser reescrito como


 Z b
1/2
1/2  Z b
1
2
2
0
2
2
|u(x)| |u(x0 )| + 2
|u (y)| dy
.
|u(y)| dy

 a
a
Se A e B sao dois n
umeros positivos, e facil provar a partir de

2 A B A+B .

2
A B 0, que

E. 12.22 Exerccio. Faca!


Rb 0
2
|u(y)|
dy
e
B
=

|u (y)|2 dy, tem-se
a
a
Z
Z b
1 b
2
2
2
|u(x)| |u(x0 )| +
|u(y)| dy + 
|u0 (y)|2 dy .
 a
a

Usando isso em (12.F.24) com A =

1


(12.F.24)

Rb

(12.F.25)

Ate aqui x0 era um ponto arbitrario do intervalo [a, b]. Vamos escolhe-lo agora de modo que x 0 seja
o ponto onde |u(x)| assume seu menor valor nesse intervalo: |u(x0 )| = min |u(x)|. Um tal ponto x0
x[a, b]

sempre existe, pois |u(x)| e contnua e [a, b] e um intervalo compacto. Com isso teremos, obviamente,
Z b
|u(y)|2 dy (b a)|u(x0 )|2 ,
a

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

ou seja,
1
|u(x0 )|
ba
2

Captulo 12

654/1304

b
a

|u(y)|2 dy .

Inserindo isso em (12.F.25), ficamos com


Z b

Z b
1
1
2
0
2
+
|u(y)|2 dy .
|u(x)| 
|u (y)| dy +
b

a

a
a

(12.F.26)

Seja agora r uma funcao contnua qualquer definida em [a, b] com r(y) > 0 para todo y [a, b].
r(y)
Definindo-se como antes R2 = min r(y) teremos
1 , para todo y [a, b]. Inserindo isso na
y[a, b]
R2
segunda integral de (12.F.26), aquela expressao fica

Z b
Z b
1
1
1
2
0
2
|u(y)|2r(y) dy .
(12.F.27)
|u(x)| 
+
|u (y)| dy +
R
b

a

2
a
a
Isso e a desigualdade (12.E.22), que queramos provar.

12.G

Obtendo os Determinantes de Fredholm

As regras de calculo de determinantes (relacoes (3.9)-(3.10), pagina 145) ensina-nos que a soma
n
X
bj (y)(1)l+j Men( k)jl al (x), que ocorre no lado direito de (12.114), e igual ao determinante
j=1

da matriz !obtida substituindo-se a l-esima coluna da matriz k pelo vetor-coluna b(y)a l (x) =
b1 (y)al (x)
..
. Assim, denotando por ki a i-esima coluna da matriz k e empregando os vetores da base
.
bn (y)al (x)
1
0
0

canonica de e1 = 0. , . . . , en = ... para denotar as colunas da matriz , podemos escrever,


..
0
0
1
usando a multilinearidade do determinante (linearidade em relacao a cada coluna), que
hh
ii
X
1
Kn (x, y; ) =
det e1 k1 , . . . , b(y)al (x), . . . , en kn
det( k) l=1
n

n X
n1
hh
ii
X
X
1
det e1 , . . . , kj1 . . . , b(y)al (x), . . . , kjm . . . , en ,
()m
=
det( k) l=1 m=0
1j <<jm n
1
ja 6=l, a=1, ..., m

onde a matriz

hh

e1 , . . . , kj1 . . . , b(y)al (x), . . . , kjm , . . . , en

(12.G.28)
ii

possui os vetores kjq nas jq -esimas

colunas, o vetor bl (y)a(x) na l-esima, e os vetores ei em cada i-esima coluna restante. Recordando

JCABarata. Curso de Fsica-Matem


atica

agora a definicao kpq = hbp , aq i =

Rb
a

Vers
ao de 29 de setembro de 2005.

bp (y)ap (y)dy, podemos escrever kq =

ii
hh
det e1 , . . . , kj1 , . . . , b(y)al (x), . . . , kjm , . . . , en
=

Captulo 12
Rb
a

655/1304

b(yq )aq (yq )dyq . Assim,

ii
hh
det e1 , . . . , b(yj1 )aj1 (yj1 ), . . . , b(y)al (x), . . . , b(yjm )ajm (yjm ), . . . , en dyj1 dyjm .

(12.G.29)

Para o determinante dentro da integral vale, devido a` multilinearidade,


hh
ii
det e1 , . . . , b(yj1 )aj1 (yj1 ), . . . , b(y)al (x), . . . , b(yjm )ajm (yjm ), . . . , en

onde

hh

ii
hh
= aj1 (yj1 ) al (x) ajm (yjm ) det b(yj1 ), . . . , b(y), . . . , b(yjm )

b(yj1 ), . . . , b(y), . . . , b(yjm )

ii

j1 , ..., l, ..., jm

j1 , ..., l, ..., jm

e a matriz (m + 1) (m + 1) obtida preservando

apenas as ja -esimas, a = 1, . . . , m, e l-esimas linhas e colunas da matriz n n


ii
hh
e1 , . . . , b(yj1 ), . . . , b(y), . . . , b(yjm ), . . . , en

ii
hh
e eliminando as demais. Nessa nova matriz reduzida b(yj1 ), . . . , b(y), . . . , b(yjm )

j1 , ..., l, ..., jm

, b(y)

aparece na c-esima posicao, onde c pode ser determinado em funcao de l e dos j k s, nao nos importando,
porem, como.
Os fatores aj1 (yj1 ) al (x) ajm (yjm ) foram tirados de dentro do determinante pois cada um multiplica uma coluna da matriz.
Podemos agora reinserir os fatores aj1 (yj1 ) al (x) ajm (yjm ) no determinante, mas fazendo que
cada um agora multiplique uma linha da matriz. O resultado sera

bj1 (yj1 )aj1 (yj1 ) bj1 (y)aj1 (yj1 ) bj1 (yjm )aj1 (yj1 )

..
..
..

.
.
.

.
det
b
(y
)a
(x)

b
(y)a
(x)

b
(y
)a
(x)
l
j
l
l
l
l
j
l
m
1

..
..
..

.
.
.
bjm (yj1 )ajm (yjm ) bjm (y)ajm (yjm ) bjm (yjm )ajm (yjm )
E. 12.23 Exerccio. Confira!

Nosso proximo passo e mover a c-esima coluna da matriz acima (trata-se da coluna que contem
os fatores bj1 (y), . . . , bl (y), . . . , bjm (y)) para a posicao da primeira coluna e a c-esima linha (a que
contem os fatores al (x)) para a posicao da primeira linha. Como esses movimentos sao feitos com

JCABarata. Curso de Fsica-Matem


atica

(1)c (1)c transposicoes, o valor do determinante nao

bl (y)al (x)
bl (yj1 )al (x)
b (y)a (y )
bj1 (yj1 )aj1 (yj1 )
j1 j1
j1
det
.
..
.

.
.
bjm (y)ajm (yjm ) bjm (yj1 )ajm (yjm )

Reinserindo isso na integral em (12.G.29), teremos

b
a

b
a

det

b
a

b
a

bl (y)al (x)
bj1 (y)aj1 (yj1 )
..
.

Captulo 12

Vers
ao de 29 de setembro de 2005.

bl (yj1 )al (x)


bj1 (yj1 )aj1 (yj1 )
..
.

se altera. Ficamos assim com

bl (yjm )al (x)


bj1 (yjm )aj1 (yj1 )

.
..

.
bjm (yjm )ajm (yjm )

bl (yjm )al (x)


bj1 (yjm )aj1 (yj1 )
..
.

bjm (y)ajm (yjm ) bjm (yj1 )ajm (yjm ) bjm (yjm )ajm (yjm )

det

bl (y)al (x)
bj1 (y)aj1 (y1 )
..
.

bl (y1 )al (x)


bj1 (y1 )aj1 (y1 )
..
.

656/1304

dyj1 dyjm

bl (ym )al (x)


bj1 (ym )aj1 (y1 )
..
.

bjm (y)ajm (ym ) bjm (y1 )ajm (ym ) bjm (ym )ajm (ym )

dy1 dym , (12.G.30)

onde fizemos as renomeacoes de variaveis yja ya para todo a = 1, . . . , m. Note o leitor que na matriz
acima, os ndices das funcoes a e b que ocorrem em cada elemento de matriz sao iguais, um fato de
importancia crucial, como se vera, e que e a razao de ser das nossas varias manipulacoes de acima.
n
X
X
do determinante acima.
Retornando a (12.G.28), desejamos agora realizar as somas
l=1

1j1 <<jm n
ja 6=l, a=1, ..., m

Para facilitar esse computo, devemos fazer algumas observacoes sobre o lado direito de (12.G.30).

Em primeiro lugar, notemos que caso j1 seja igual a l, as duas primeiras linhas da matriz do
lado direito de (12.G.30) sao proporcionais uma a` outra (a primeira linha e igual a` segunda vezes
al (x)/al (y1 )) e, portanto, o determinante se anula. Naturalmente, o mesmo vale caso ja seja igual a
l para
Xalgum a. O mesmo racioccio se aplica caso dois dos ndices ja sejam iguais. Assim, na soma
podemos eliminar a restricao ja 6= l, a = 1, . . . , m e podemos aceitar que os ja s sejam
1j1 <<jm n
ja 6=l, a=1, ..., m

iguais entre si. Assim, essa soma pode ser escrita como

1j1 jm n

A segunda observacao importante diz respeito ao ordenamento 1 j1 jm n dos ndices


ja na soma. Contemplando (12.G.30) e facil nos convercermos que se trocarmos dois ndices, digamos,
ja e jb e simultaneamente renomearmos as variaveis ya yb entao teremos trocado duas linhas e duas
colunas da matriz, o que nao altera o determinante. Com isso aprendemos que permutacoes arbitrarias
dos ndices j aconpanhadas de renomeacoes das variaveis de integracao nao alteram a integral do lado

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

657/1304

direito de (12.G.30). Como ha m! possiveis permutacoes distintas, conclumos que

m
X

l=1 1j1 jm n

b
a

b
a

det

bl (y)al (x)
bj1 (y)aj1 (y1 )
..
.

bl (ym )al (x)


bj1 (ym )aj1 (y1 )
..
.

bjm (y)ajm (ym ) bjm (y1 )ajm (ym ) bjm (ym )ajm (ym )

Z b
Z b
m
n

1 X X

det
m!

a
j , ..., j = 1 a
l=1

bl (y1 )al (x)


bj1 (y1 )aj1 (y1 )
..
.

bl (y)al (x)
bj1 (y)aj1 (y1 )
..
.

bl (y1 )al (x)


bj1 (y1 )aj1 (y1 )
..
.

dy1 dym

bl (ym )al (x)


bj1 (ym )aj1 (y1 )
..
.

bjm (y)ajm (ym ) bjm (y1 )ajm (ym ) bjm (ym )ajm (ym )

dy1 dym ,

fazendo com que as somas sobre os ja s sejam independentes. Podemos agora inserir as somas em l e
sobre os ja s dentro do determinante (devido a` multilinearidade), e o lado direito fica

m
X

bl (y)al (x)

l=1
X
n
Z b
Z b

bj1 (y)aj1 (y1 )


1

det j1 =1

m! a
a
..

n
X

bjm (y)ajm (ym )


jm =1

m
X

bl (y1 )al (x)

l=1
n
X

bj1 (y1 )aj1 (y1 )

j1 =1
n
X

jm =1

..
.

bjm (y1 )ajm (ym )

k(x, y)
Z b
Z b

1
k(y1 , y)
det

=
..
m! a

.
a

m
X

bl (ym )al (x)

bj1 (ym )aj1 (y1 )

dy1 dym
j1 =1

..

bjm (ym )ajm (ym )


l=1
n
X

jm =1

k(x, y1 )
k(y1 , y1 )
..
.

k(x, ym )
k(y1 , ym )

dy1 dym .
..

k(ym , y) k(ym , y1 ) k(ym , ym )

Retornando agora a (12.G.28), temos


Kn (x, y; ) =

k(x, y) k(x, y1 ) k(x, ym )


Z b
Z
n1
k(y1 , y) k(y1 , y1 ) k(y1 , ym )
X
1
()m b

det

dy1 dym .
..
..
..
det( k) m=0 m!

.
.
.
a
a
k(ym , y) k(ym , y1 ) k(ym , ym )

Calculando det( k)

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

658/1304

O calculo de det( k) e muito semelhante ao feito acima.


hh

det( k) = det e1 k1 , . . . , en kn
=

n
X

()m

m=0

hh

ii

hh
ii
det e1 , . . . , kj1 , . . . , kjm . . . , en , (12.G.31)

1j1 <<jm n

ii

onde a matriz e1 , . . . , kj1 , . . . , kjm , . . . , en possui os vetores kjq nas jq -esimas colunas e os vetores
Rb
ei em cada i-esima coluna restante. Recordando agora a definicao kpq = hbp , aq i = a bp (y)ap (y)dy,
Rb
podemos escrever kq = a b(yq )aq (yq )dyq . Assim,
hh
ii
det e1 , . . . , kj1 , . . . , kjm , . . . , en
=

hh
ii
det e1 , . . . , b(yj1 )aj1 (yj1 ), . . . , b(yjm )ajm (yjm ), . . . , en dyj1 dyjm . (12.G.32)

Para o determinante dentro da integral vale, devido a` multilinearidade,


hh

det e1 , . . . , b(yj1 )aj1 (yj1 ), . . . , b(yjm )ajm (yjm ), . . . , en

ii

hh

= aj1 (yj1 ) ajm (yjm ) det b(yj1 ), . . . , b(yjm )


hh

ii

ii

j1 , ..., jm

e a matriz m m obtida preservando apenas as ja -esimas, a =


hh
ii
1, . . . , m, linhas e colunas da matriz n n, e1 , . . . , b(yj1 ), . . . , b(yjm ), . . . , en e eliminando as
demais.
onde

b(yj1 ), . . . , b(yjm )

j1 , ..., jm

Os fatores aj1 (yj1 ) ajm (yjm ) foram tirados de dentro do determinante pois cada um multiplica
uma coluna da matriz.
Podemos agora reinserir os fatores aj1 (yj1 ) ajm (yjm ) no determinante, mas fazendo que cada um
agora multiplique uma linha da matriz. O resultado sera

bj1 (yj1 )aj1 (yj1 ) bj1 (yjm )aj1 (yj1 )

..
..
det
.
.
.
bjm (yj1 )ajm (yjm ) bjm (yjm )ajm (yjm )

E. 12.24 Exerccio. Confira!

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

659/1304

Reinserindo isso na integral em (12.G.32), teremos


Z

b
(y
)a
(y
)

b
(y
)a
(y
)
j
j
j
j
j
j
j
j
m
1
1
1
1
1
1
1
b
b

..
..

det
dyj1 dyjm
.
.
a
a
bjm (yj1 )ajm (yjm ) bjm (yjm )ajm (yjm )

b
(y
)a
(y
)

b
(y
)a
(y
)
j1 1 j1 1
j1 m j1 1
b
b

..
..

det
dy1 dym , (12.G.33)
.
.
a
a
bjm (y1 )ajm (ym ) bjm (ym )ajm (ym )

onde fizemos as renomeacoes de variaveis yja ya para todo a = 1, . . . , m. Note o leitor que na matriz
acima, os ndices das funcoes a e b que ocorrem em cada elemento de matriz sao iguais, um fato de
importancia crucial, como se vera, e que e a razao de ser das nossas varias manipulacoes de acima.
X
Retornando a (12.G.31), desejamos agora realizar as somas
do determinante acima.
1j1 <<jm n

Para facilitar esse computo, devemos fazer algumas observacoes sobre o lado direito de (12.G.33).

Em primeiro lugar, notemos que caso dois dos ndices ja sejam iguais as linhas correspondentes
em (12.G.33)
sao proporcionais uma a` X
outra e, portanto, o determinante se anula. Assim, na soma
X
pode ser escrita como
.

1j1 <<jm n

1j1 jm n

A segunda observacao importante diz respeito ao ordenamento 1 j1 jm n dos ndices


ja na soma. Contemplando (12.G.33) e facil nos convercermos que se trocarmos dois ndices, digamos,
ja e jb e simultaneamente renomearmos as variaveis ya yb entao teremos trocado duas linhas e duas
colunas da matriz, o que nao altera o determinante. Com isso aprendemos que permutacoes arbitrarias
dos ndices j aconpanhadas de renomeacoes das variaveis de integracao nao alteram a integral do lado
direito de (12.G.33). Como ha m! possiveis permutacoes distintas, conclumos que

1j1 jm n

b
(y
)a
(y
)

b
(y
)a
(y
)
j
1
j
1
j
m
j
1
1
1
1
1
b
b

..
..

det
dy1 dym
.
.
a
a
bjm (y1 )ajm (ym ) bjm (ym )ajm (ym )

1
m! j

n
X

1 , ..., jm

=1

b
a

b
a

bj1 (y1 )aj1 (y1 ) bj1 (ym )aj1 (y1 )

..
..
det
dy1 dym ,
.
.
bjm (y1 )ajm (ym ) bjm (ym )ajm (ym )

fazendo com que as somas sobre os ja s sejam independentes. Podemos agora inserir as somas sobre os

JCABarata. Curso de Fsica-Matem


atica

Captulo 12

Vers
ao de 29 de setembro de 2005.

660/1304

ja s dentro do determinante (devido a` multilinearidade), e o lado direito fica

n
X

bj (y1 )aj1 (y1 )

j =1 1
1
b
b
1

..
det

m! a
a
n
X

bjm (y1 )ajm (ym )


Z

bj1 (ym )aj1 (y1 )

j1 =1

..
dy1 dym
.

X
bjm (ym )ajm (ym )

jm =1

1
m!

n
X

jm =1

b
a

k(y1 , ym )

..
dy1 dym .
.
k(ym , y1 ) k(ym , ym )

k(y1 , y1 )
b

..
det
.

Retornando agora a (12.G.31), temos

det( k) =

n
X

()m
m!
m=0

como queramos mostrar.

b
a

k(y1 , ym )

..
dy1 dym ,
.
k(ym , y1 ) k(ym , ym )

k(y1 , y1 )
b

..
det
.

(12.G.34)

JCABarata. Curso de Fsica-Matem


atica

12.8

Vers
ao de 29 de setembro de 2005.

Captulo 12

661/1304

Exerccios Adicionais

E. 12.25 Exerccio. Determine a funcao de Green para o seguinte problema de Sturm: u 00 = f (x), com
1 u(a) + 2 u0 (a) = 0, 1 u(b) + 2 u0 (b) = 0, com x [a, b], a < b.
Mostre que esse problema so tem solucao se (b a)1 1 + 1 2 1 2 6= 0.

E. 12.26 Exerccio. Determine explicitamente a funcao de Green para os seguintes problemas de Sturm:
a) u00 = f (x), com u(0) = 0, u(1) = 0.
b) u00 = f (x), com u(0) = 0, u0 (1) = 0.
c) u00 = f (x), com u(0) = 0, u(1) + u0 (1) = 0.
d) u00 + u = f (x), com u(0) = 0, u0 (1) = 0.
e) (xu0 )0 = f (x), com u(1) = 0, u(e) = 0.
6
E. 12.27 Exerccio. Determine explicitamente a solucao dos cinco problemas de Sturm acima para o
caso em que f (x) = x.
6
E. 12.28 Exerccio. Determine explicitamente a funcao de Green para o seguinte problema de Sturm:
(xu0 )0

2
u = f (x) ,
x

onde > 0, com as condicoes de contorno com u(a) = 0 e u(b) = 0, onde 0 < a < b < .
Verifique que funcoes do tipo

v(x) = c1 x + c2 x ,
sao solucoes da equacao homogenea e, com as mesmas, monte a funcao de Green.
A solucao obtida vale tambem caso a = 0? Note que nesse caso p(x) = x nao e estritamente positiva
no intervalo [a, b].
6
Uma partcula de massa m > 0 se move em uma dimensao sob um potencial
E. 12.29 Exerccio.
kx2
U (x) =
com k > 0 (potencial do oscilador harmonico). Alem disso, a partcula esta submetida a uma
2
forca externa f (t) que, como a notacao indica, pode variar com o tempo.
Suponha que se saiba que no instante dertempo t0 = 0 a partcula encontra-se na posicao x(t0 ) = 0 e que
k

, onde =
, a partcula encontra-se novamente na posicao x(t1 ) = 0.
no instante de tempo t1 =
2
m
Determine a funcao de Green para o problema de Sturm associado ao problema mecanico acima e
determine a trajetoria x(t) da partcula para t [t0 , t1 ] para os seguintes tipos de forca:
a) f (t) = At, para A > 0, constante e

b) f (t) = B sin(t), para B > 0, constante.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

662/1304

E. 12.30 Exerccio. Resolva os seguintes problemas de Sturm-Liouville, determinando os autovalores e


as autofuncoes normalizadas:
a) u00 + u = 0, com u(0) = 0, u(1) = 0.
b) u00 + u = 0, com u(0) = 0, u0 (1) = 0.
c) u00 + u = 0, com u(0) = 0, u(1) + u0 (1) = 0.
d) u00 + u0 + u = 0, com u(0) = 0, u0 (1) = 0. Neste caso, mostre graficamente que ha infinitos
autovalores e que, `a medida em que eles crescem, a distancia entre eles tende a uma constante. Ocorrem
autovalores negativos? Zero e um possvel autovalor?
6
E. 12.31 Exerccio.
Seja o problema de Sturm-Liouville u00 + u = 0, no intervalo [0, 1], com as
condicoes de contorno u(0) = 0 e 1 u(1) + 2 u0 (1) = 0.
a. Determine os autovalores positivos no caso 1 = 0, no caso 2 = 0 e indique como determina-los no
caso em que ambos 1 e 2 sao nao-nulos. Determine as autofuncoes em cada situacao.
b. Que relacao devem satisfazer as constantes 1 e 2 para que = 0 seja um autovalor? Determine a
autofuncao correspondente.
c. Que relacao devem satisfazer as constantes 1 e 2 para que haja tambem autovalores negativos?
Quantos sao os autovalores negativos, se os houver? Determine suas autofuncoes, se as houver.
d. Reunindo os resultados obtidos, indique no plano Cartesiano ( 1 , 2 ) a regiao onde os autovalores sao
estritamente positivos, a regiao onde ocorre o autovalor zero e a regiao onde ocorrem autovalores negativos
alem dos autovalores positivos.
Nota. Em a, b e c n
ao e necess
ario normalizar as autofunco
es.

E. 12.32 Exerccio. Em cada caso acima expresse a funcao de Green do problema de Sturm correspondente usando a formula de Mercer, ou seja, em termos de uma serie envolvendo as autofuncoes normalizadas
e os autovalores:

X
un (x)un (y)
G(x, y) =
.
n
n=1
6
E. 12.33 Exerccio. Resolva o seguinte problema de Sturm-Liouville, determinando os autovalores e as
autofuncoes normalizadas:

(xu0 )0 + u = 0 ,
x
com u(1) = 0 e u(e) = 0.
Determine as relacoes de ortogonalidade entre as autofuncoes. Verifique-as explicitamente.
Expresse a funcao de Green do problema de Sturm correspondente usando a formula de Mercer.
Sugest
ao: Verifique que funcoes do tipo
c1 ei

ln x

+ c2 ei

ln x

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 12

663/1304

sao as solucoes gerais de (xu0 )0 + x u = 0. Mostre, da, que as autofuncoes sao da forma
un (x) = cn sen (n ln x) ,
n = 1, 2, . . .. Determine cn impondo que cada un seja normalizada.

E. 12.34 Exerccio. Resolva explicitamente o problema de Sturm-Liouville semi-homogeneo

(xu0 )0 + u = f (x) ,
x

x [1, e] ,

com u(1) = 0 e u(e) = 0, fixo, 6= n2 2 , n = 1, 2, . . ., primeiramente para f generica e depois,


explicitamente, para f (x) = x1 .
6
E. 12.35 Exerccio. a. Determine explicitamente a funcao de Green do seguinte problema de Sturm,
definido no intervalo [0, 1]:
(ex u0 )0 = f (x) ,
com u(0) = u(1) = 0.
b. Determine os autovalores e as autofuncoes normalizadas do problema de Sturm-Liouville
(ex u0 )0 + ex u = 0 ,
com x [0, 1] e com u(0) = u(1) = 0.

c. Usando a formula de Mercer, expresse funcao de Green em termos de uma serie envolvendo os
autovalores e as autofuncoes normalizadas.
d. Determine explicitamente a solucao da equacao diferencial
(ex u0 )0 + 5ex u = f (x),

x [0, 1] ,

com u(0) = u(1) = 0, para f (x) = ex/2 .

E. 12.36 Exerccio. Seja o problema de Sturm


(p(x)u0 )0 + q(x)u = f (x) ,
para uma funcao u definida no intervalo [a, b]


, a < b, satisfazendo as condicoes de contorno

1 u(a) + 2 u0 (a) = 0 ,
1 u(b) + 2 u0 (b) = 0 ,
onde p, q e f sao funcoes reais; p e contnua, diferenciavel e estritamente positiva em [a, b]; q e f sao
contnuas em [a, b].
a. Mostre que o produto p(x)W (x) e constante, onde W (x) e o determinante Wronskiano das solucoes
da equacao homogenea (p(x)v 0 )0 + q(x)v = 0 satisfazendo 1 v1 (a) + 2 v10 (a) = 0, 1 v2 (b) + 2 v20 (b) = 0.

JCABarata. Curso de Fsica-Matem


atica

b. Mostre que a funcao de Green desse problema satisfaz




lim Gx (x + , x) Gx (x , x) =
0

Captulo 12

Vers
ao de 29 de setembro de 2005.



lim Gx (x, x ) Gx (x, x + ) =
0

664/1304

1
,
p(x)
1
.
p(x)

c. Mostre que a funcao de Green satisfaz

sendo Lx [G](x, y) =

Lx [G](x, y) = (x y) ,


p(x) x
G(x, y) + q(x)G(x, y).

E. 12.37 Exerccio. a. Obtenha a funcao de Green associada ao problema de Sturm


y 00 (x) = f (x)
com x [0, 1] e y(0) = y(1) = 0.

b. Mostre que as autofuncoes do problema de Sturm-Liouville

y 00 (x) + xy(x) = 0

com x
[0, 1] e y(0) = y(1) = 0 sao dadas por yn (x) = xJ1/3 ( 32 n x3 ), com n positivos e satisfazendo
J1/3 ( 32 n ) = 0.
c. Determine as relacoes de ortogonalidade entre essas autofuncoes. Obtenha as autofuncoes normalizadas. Sugestao: use as relacoes de ortogonalidade das funcoes de Bessel.
d. Expresse a funcao de Green do problema de Sturm correspondente usando a formula de Mercer.
e. Determine aproximadamente os dois primeiros autovalores Sugestao: procure aproximantes da forma
y(2) (x) = c1 x(1 x) + c2 x2 (1 x).

f. Obtenha os zeros exatos de J1/3 em alguma tabela e compare os resultados, indicando os erros
percentuais.
g. Resolva explicitamente a equacao diferencial
y 00 + xy = f (x) ,

x [0, 1] ,

com y(0) = 0 e y(1) = 0, fixo, 6= n , para todo n, primeiramente para f generica e depois, explicita1
mente, para f (x) =
. Sugestao: use a identidade
1 x3
Z 1
1
h  a  i2
J (au)
du =
J
,
2 2 2
1 u2
0
valida para a > 0, > 1.

Parte IV
Grupos

665

Captulo 13
Grupos. Alguns Exemplos
Conte
udo
13.1 O Grupo de Permuta
co
es

. . . . . . . . . . . . . . . . . . . . . . . . . . . . 667

13.1.1 Ciclos, Transposicoes e Transposicoes Elementares . . . . . . . . . . . . . . . 668


13.2 Alguns Grupos Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673
13.2.1 Os Grupos GL(n) e SL(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 673
13.2.2 O Grupo de Borel e o Grupo de Heisenberg . . . . . . . . . . . . . . . . . . . 676
13.2.3 Grupos Associados a Formas Bilineares e Sesquilineares . . . . . . . . . . . . 682
13.2.4 Os Grupos Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 684
13.2.5 Os Grupos Unitarios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 685
13.3 Os Grupos SO(2), SO(3), SU(2) e SL( , 2)

. . . . . . . . . . . . . . . . . 686

13.3.1 Os Grupos SO(2), O(2), SO(1, 1) e O(1, 1) . . . . . . . . . . . . . . . . . . . 686


13.3.2 O Grupo SO(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 690
13.3.3 O Grupo SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698
13.3.4 A Relacao entre SO(3) e SU(2) . . . . . . . . . . . . . . . . . . . . . . . . . . 701
13.3.5 O Grupo SL( , 2) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 704
13.4 Generalidades sobre os grupos SU(n) e SO(n) . . . . . . . . . . . . . . . . 705
13.4.1 Os Grupos SU(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 706
13.4.2 O Grupo SU(3) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 709
13.4.3 Os Grupos SO(n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 710
13.5 O Grupo Afim e o Grupo Euclidiano . . . . . . . . . . . . . . . . . . . . . . 715
13.6 O Grupo de Lorentz

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 719

13.6.1 O Espaco-Tempo, a Nocao de Intervalo e a Estrutura Causal . . . . . . . . . 720


13.6.2 A Invariancia do Intervalo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 726
13.6.3 O Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 729
13.6.4 Alguns Sub-Grupos do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . 730
13.6.5 A Estrutura do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 734
13.6.6 Os Geradores do Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . 738
13.7 O Grupo de Poincar
e . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 742
13.8 SL( , 2) e o Grupo de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . 745
13.A Prova do Teorema 13.8 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 754
13.B Um Isomorfismo entre SL( , 2)/{ , } e L + . . . . . . . . . . . . . . . . . 764

666

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

667/1304

rupos sao objetos de suma importancia na Fsica devido a` sua relacao com transformacoes de
simetria. A nocao abstrata de grupo foi introduzida na Secao 1.2.1, pagina 46. No presente
captulo introduziremos alguns grupos de particular interesse na Fsica e na Matematica
e estudaremos algumas de suas propriedades mais simples e importantes. Com particular
detalhe trataremos do grupo de Lorentz na Secao 13.6, grupo este de fundamental importancia na
teoria da relatividade.

13.1

O Grupo de Permuta
co
es

Seja C um conjunto nao-vazio qualquer e seja P erm(C) o conjunto de todas as funcoes bijetoras de C
em C. P erm(C) e naturalmente um grupo, onde o produto e a composicao de funcoes e o elemento
neutro e a funcao identidade (que denotaremos doravante por id). O elemento inverso de uma funcao
f P erm(C) e a sua funcao inversa f 1 (que existe, pois P erm(C) contem funcoes bijetoras, por
definicao). P erm(C) e denominado grupo de permutaco
es do conjunto C.
E. 13.1 Exerccio.
elementos.

Mostre que P erm(C) somente e um grupo Abeliano se C possuir um ou dois


6

Grupos de permutacoes desempenham um papel de destaque na teoria de grupos, em parte devido


ao seguinte teorema estrutural, que nao demonstraremos nestas notas:
Teorema 13.1 Todo grupo e sub-grupo de um grupo de permutaco
es P erm(C), para algum conjunto
C.
2
De particular importancia e o caso em que C e um conjunto finito. Tais grupos de permutacao e suas
representacoes tambem desempenham um papel de destaque na Fsica, particularmente na Mecanica
Quantica, e por isso vamos nos deter um pouco nos mesmos.
Grupos de Permuta
co
es de n Elementos
Seja n 1, inteiro, e considere-se o conjunto {1, . . . , n}. O grupo Sn = P erm({1, . . . , n}) e
denominado grupo de permutaco
es de n elementos.
E. 13.2 Exerccio. Seja C um conjunto com n elementos. Mostre que P erm(C) e isomorfo a S n .

Um elemento Sn e dito ser uma permutaca


o. Como toda a permutacao, e uma funcao bijetora
{1, . . . , n} {1, . . . , n} e e costume representa-la na forma de um arranjo matricial:


1
2
...
n
=
,
(1) (2) . . . (n)
onde na primeira linha ordenamos os elementos de {1, . . . , n} e na segunda suas imagens por .

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

Exemplos. Os elementos de S2 sao




1 2
1 =
1 2

2 =

668/1304


1 2
.
2 1

1 e a identidade do grupo.
Os elementos de S3 sao

1
1 =
1

1
4 =
3

1 e a identidade do grupo.


2 3
,
2 3

2 3
,
2 1


1 2 3
2 =
,
2 1 3


1 2 3
5 =
,
3 1 2


1 2 3
3 =
,
1 3 2


1 2 3
6 =
.
2 3 1

E. 13.3 Exerccio. Mostre que Sn tem exatamente n! elementos.

13.1.1

Ciclos, Transposi
co
es e Transposi
co
es Elementares

Vamos aqui estudar alguns fatos estruturais importantes sobre os grupos Sn .


Ciclos
Precisamos da seguinte definicao.
Defini
c
ao. Uma permutacao e dita ser um
i1 , . . . , ir tais que

j,

ia+1 ,
(j) =

i1 ,

ciclo, ou um r-ciclo se existirem r inteiros distintos


se j 6 {i1 , . . . , ir }
se j = ia , mas a 6= r .
se j = ir

E. 13.4 Exerccio. Mostre que se e um r-ciclo, entao r = id.

A importancia do conceito de ciclo manifesta-se no seguinte teorema:


Teorema 13.2 Toda permutaca
o diferente da identidade e um produto de ciclos disjuntos dois a dois.
2
Prova. Seja Sn , 6= id. Seja i1 o menor elemento de {1, . . . , n} para o qual (i) 6= i. Vamos
considerar a seq
uencia (em princpio infinita)
i1 ,

(i1 ),

2 (i1 ),

3 (i1 ), . . .

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

669/1304

Os elementos dessa seq


uencia sao obviamente elementos de {1, . . . , n} que e um conjunto finito.
Conseq
uentemente essa seq
uencia tem, na verdade, elementos repetidos. Vamos supor que p (i1 ) e
q (i1 ), p < q, sejam os primeiros elementos que se repetem: p (i1 ) = q (i1 ). Essa igualdade implicaria
i1 = r1 (i1 ), onde r1 = q p. Assim, o primeiro par que se repete na seq
uencia acima e, em verdade,
o par i1 e r1 (i1 ).
Isso nos diz que a seq
uencia acima e uma repeticao infinita da seq
uencia finita
i1 ,

(i1 ),

2 (i1 ),

...,

r1 (i1 ),

seq
uencia esta formada por r1 elementos que, por construcao, sao distintos.
Vamos denominar
i1 ,
e definir 1 Sn por

i2 := (i1 ),

i3 = 2 (i1 ),

...,

ir1 = r1 (i1 )

j,
se j 6 {i1 , . . . , ir1 }

ia+1 = a (i1 ), se j = ia , mas a 6= r1 .


1 (j) =

i1 ,
se j = ir1

evidente que 1 e um ciclo e que 1 e coincidem no conjunto {i1 , . . . , ir1 }. Podemos entao escrever
E
= 1 0 = 0 1 ,

onde 0 Sn e a identidade em {i1 , . . . , ir1 } e coincide com no complemento:

se j {i1 , . . . , ir1 }
j,
0
(j) =
.

(j), de outra forma.

O que fazemos em seguida e repetir o procedimento, mas agora para a permutacao 0 . Obteremos
= 2 00 = 00 2 , onde 2 e novamente um ciclo (disjunto de 1 , por construcao). Como {1, . . . , n}
e um conjunto finito, a repeticao desse procedimento deve ter um fim, e obtemos
0

= 1 2 k
para k ciclos 1 , . . . , k disjuntos dois a dois. Isso completa a prova.
Transposi
co
es
2-ciclos sao denominados transposico
es. Sejam p e q dois elementos distintos de {1, . . . , n}. A
transposicao de p e q, denotada por tp, q e a permutacao definida por

j, se j 6= p e j 6= q

q, se j = p
tp, q (j) =
.

p, se j = q
Transposicoes sao importantes pela seguinte razao:

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

670/1304

Teorema 13.3 Todo ciclo pode ser escrito como um produto de transposico
es.

Prova. Seja o ciclo associado ao conjunto {i1 ,

j,

ia+1 ,
(j) =

i1 ,

. . . , ir } {1, . . . , n}:
se j 6 {i1 , . . . , ir }
se j = ia , mas a 6= r .
se j = ir

A prova resume-se em constatar que

= ti1 , ir ti1 , ir1 ti1 , ir2 ti1 , i3 ti1 , i2 .

E. 13.5 Exerccio. Complete os detalhes e/ou faca alguns casos particulares para convencer-se.

O seguinte teorema e um corolario imediato dos Teoremas 13.2 e 13.3:


Teorema 13.4 Toda permutaca
o diferente da identidade e um produto transposico
es.

Transposi
co
es Elementares
De particular importancia sao as transposicoes de vizinhos ti = ti, i+1 com i = 1, . . . , n 1:

j,
se j 6= i e j 6= i + 1

i + 1, se j = i
ti (j) =

i,
se j = i + 1

e que sao chamadas transposico


es elementares.

A importancia das mesmas reside nos dois teoremas abaixo.


Teorema 13.5 Toda transposica
o e um produto transposico
es elementares.

Prova. Seja tp, q uma transposicao com p < q. A prova resume-se em constatar que
tp, q = tq1, q tp+1, p+2 tp, p+1 tp+1, p+2 tq1, q = tq1 tp+1 tp tp+1 tq1 .

E. 13.6 Exerccio. Complete os detalhes e/ou faca alguns casos particulares para convencer-se.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

671/1304

O seguinte teorema e um corolario imediato dos Teoremas 13.2, 13.3, 13.4 e 13.5:
Teorema 13.6 Toda permutaca
o diferente da identidade e um produto de transposico
es elementares.
2
O Teorema 13.6 afirma que Sn e um grupo gerado por transposicoes elementares, ou seja, todo
Sn (distinto da identidade) e da forma
= t i1 t ik ,

(13.1)

para certas transposicoes ti1 , . . . , tik .


E. 13.7 Exerccio. Determine quais dos elementos 1 , . . . , 6 do grupo S3 (pagina 668) sao transposicoes elementares e escreva os demais como produtos de tais transposicoes elementares.
6
Podemos nos perguntar, essa forma de escrever e u
nica? A resposta e nao, pelas razoes que agora
expomos.
Transposi
co
es Elementares e suas Rela
co
es
Proposi
c
ao 13.1 Em Sn as transposico
es elementares ti , i = 1, . . . , n 1 satisfazem as seguintes
relaco
es:
(ti )2 = id,
ti tj = t j ti ,

(13.2)
se |i j| 2,

ti ti+1 ti = ti+1 ti ti+1 ,

se i = 1, . . . , n 2.

(13.3)
(13.4)
2

Prova. Exerccio.

Essa proposicao explica por que a representacao (13.1) nao e geralmente u


nica: o lado direito
de (13.1) pode eventualmente ser reescrito se aplicarmos quaisquer das relacoes (13.2)-(13.4). Estas,
porem, sao as u
nicas relacoes que as transposicoes elementares t i satisfazem. Desses fatos extramos a
seguinte conclusao:
Proposi
c
ao 13.2 Todo grupo gerado por n 1 elementos t1 , . . . , tn1 e que satisfazem as relaco
es
(13.2)-(13.4) (e somente elas) e isomorfo a Sn .
2
Prova. Exerccio.
O Sinal, ou Paridade, de uma Permuta
c
ao

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

672/1304

Seja Sn . O sinal, ou paridade de e (1)k , onde k e o menor n


umero de transposicoes
elementares que geram . Assim, se = ti1 tik define-se sinal(id) = +1 e
sinal() := (1)k ,

6= id.

O estudante e convidado a constatar que sinal() nao depende da particular representacao de em


termos de produtos de transposicoes elementares, pois sinal() nao muda por aplicacao das relacoes
(13.2)-(13.4).
E. 13.8 Exerccio.
668).

Determine o sinal das permutacoes 1 , . . . , 6 do grupo S3 dadas acima (pagina


6

E. 13.9 Exerccio importante. Mostre que


sinal( 0 ) = sinal()sinal( 0 )
para todos , 0 Sn . Mostre da que Sn+ = { Sn | sinal() = +1} e um subgrupo de Sn , o subgrupo
das permutacoes pares. Mostre tambem que Sn+ e normal.
6
Sn+ e tambem denominado subgrupo alternante de grau n.

E. 13.10 Exerccio. Ja mencionamos que Sn tem n! elementos. Quantos elementos tem Sn+ ?

O Grupo de Tran
cas
Ha um grupo importante aparentado ao grupo Sn que e o chamado grupo de n trancas, denotado por
Bn (do ingles braid = tranca). Este e, por definicao, o grupo gerado por n 1 elementos b 1 , . . . , bn1
que satisfazem as relacoes
bi bj = b j bi ,

se |i j| 2,

bi bi+1 bi = bi+1 bi bi+1 ,

se i = 1, . . . , n 2,

(13.5)
(13.6)

de tal forma que para todo Bn existem {bi1 , . . . , bik } {b1 , . . . , bn1 } e n
umeros inteiros
n1 , . . . , nk tais que
= (bi1 )n1 (bik )nk .
Note-se que a relacao (13.2) nao tem analogo em Bn , ou seja, ao contrario do que ocorre em Sn ,
os elementos bi nao tem a si mesmos como inversa. Por essa razao elementos como (bi )n para ns
diferentes sao todos distintos entre si. Assim, ao contrario de Sn , Bn e um grupo infinito, apesar de ter
um n
umero finito de geradores.
E. 13.11 Exerccio. Seja p : {0, 1} definida por p(n) = 0 se n for par e p(n) = 1 se n for mpar.
p(n )
p(n )
Mostre que : Bn Sn definido por ((bi1 )n1 (bik )nk ) = ti1 1 tik k e um homomorfismo.
6

O grupo de trancas foi inventado pelo matematico E. Artin1 em 1925 e desempenha um papel
importante na chamada teoria dos n
os, um rico captulo do estudo das propriedades topologicas do
1

Emil Artin (1889-1962).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

673/1304

espaco tridimensional. Nesse contexto os elementos bi tem uma interpretacao interessante em termos
de transposicoes de trancas (barbantes) no espaco tridimensional. Por falta de espaco e habilidade em
apresentar as figuras correspondentes, nao entraremos em mais detalhes aqui e remetemos o estudante
a` leitura de [72], por exemplo. No final dos anos 80 e nos anos 90 do seculo XX encontrou-se aplicacoes
dos grupos de trancas na Fsica, no contexto das teorias quanticas de campos em dimensoes 2 e 3,
assim como na fsica dos materiais (problema da supercondutividade a altas temperaturas).

13.2

Alguns Grupos Matriciais

13.2.1

Os Grupos GL(n) e SL(n)

Vamos denotar por Mat(n, ) ou Mat( , n) o conjunto de todas as matrizes reais n n e por
Mat(n, ) ou Mat( , n) o conjunto de todas as matrizes complexas n n.


Mat(n, ) e Mat(n, ) sao naturalmente dois grupos (Abelianos) em relacao a` operacao de soma
de matrizes. Nao, porem, em relacao a` operacao de produto, pois e bem sabido que nem toda matriz
possui uma inversa.


O conjunto de todas as matrizes de Mat(n, ) que sao invertveis forma naturalmente um grupo
nao-Abeliano2 em relacao ao produto usual de matrizes. Esse grupo, denominado grupo linear real,
e denotado por GL(n, ). Analogamente, o conjunto de todas as matrizes de Mat(n, ) invertveis
forma um grupo nao-Abeliano3 que e denominado grupo linear complexo e denotado por GL(n, ). Em
smbolos


GL(n,

) := {A Mat(n,


), det(A) 6= 0}


GL(n,

) := {A Mat(n,

), det(A) 6= 0} .

Devido a` propriedade bem conhecida det(AB) = det(A) det(B), o produto de duas matrizes com
determinante igual a 1 e novamente uma matriz com determinante igual a 1. Assim,
SL(n,


) := {A Mat(n,

sao subgrupos de GL(n,




), det(A) = 1}


) e GL(n,

SL(n,

) := {A Mat(n,

), det(A) = 1}

), respectivamente.

1
=
E. 13.12 Exerccio. Para qualquer matriz n n real ou complexa e invertvel A vale que AT
1 T
1
1
(A ) . Alem disso, para qualquer matriz n n complexa A vale que (A ) = (A ) . Usando esses
fatos, mostre que se A GL(n, ) entao AT GL(n, ). Analogamente, mostre que se A GL(n, )
entao A e AT GL(n, ).
6



E. 13.13 Exerccio. Para qualquer matriz n n real ou complexa A vale que det(A) = det AT . Fora
isso, para qualquer matriz n n complexa A vale que det(A) = det (A ). Usando esses fatos, mostre que
se A SL(n, ) entao AT SL(n, ). Analogamente, mostre que se A SL(n, ) entao A e AT
SL(n, ).
6


2
3

Exceto no caso n = 1, onde o grupo e Abeliano, trivialmente.


Idem.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

674/1304

*
Os grupos GL(n, ), GL(n, ), SL(n, ) e SL(n, ) possuem varios outros sub-grupos de interesse.
Discutiremos alguns adiante, como os grupos de Borel, os grupos ortogonais, unitarios e simpleticos.


Os grupos GL(n,

), SL(n,

) e SL(n,

Vamos denotar por Mat(n, ) ou Mat( , n) o conjunto de todas as matrizes n n cujos elementos
de matriz sao n
umeros inteiros e por Mat(n, ) ou Mat( , n) o conjunto de todas as matrizes n n
cujos elementos de matriz sao n
umeros racionais. Analogamente, defina-se
GL(n,

) := {A Mat(n,

), det(A) 6= 0}

GL(n,

SL(n,

) := {A Mat(n,

), det(A) = 1}

SL(n,

) := {A Mat(n,

), det(A) 6= 0}

e
) := {A Mat(n,

), det(A) = 1} .

Entao valem as seguintes afirmacoes:


1. GL(n,

) e um grupo em relacao a` operacao de produto usual de matrizes.

2. SL(n,

) e um grupo em relacao a` operacao de produto usual de matrizes.

3. GL(n, ) n
ao e um grupo em relacao a` operacao de produto usual de matrizes, mas sim um
monoide.
4. SL(n,

) e um grupo em relacao a` operacao de produto usual de matrizes.

Para provar 1, notemos que o produto de matrizes n n com entradas racionais e tambem uma
matriz n n com entradas racionais (por que?). Assim, a operacao de produto e uma operacao binaria
em GL(n, ). O elemento neutro e a matriz identidade, que e elemento de GL(n, ) (pois os n
umeros 0
e 1 sao racionais). Por fim, resta mostrar que a inversa de uma matriz invertvel com entradas racionais
tambem tem entradas racionais.
Para mostrar isso, notemos primeiramente que o determinante de uma matriz com entradas racionais
e tambem um n
umero racional, pois o calculo do determinante de uma matriz M envolve apenas
operacoes de soma e produto dos elementos de matriz de M . Alem disso, lembremos a chamada regra
de Laplace4 ), expressao (3.8), pagina 145, que para qualquer matriz A o elemento ij da sua matriz
inversa (se houver) e dado por
(1)i+j
(A1 )ij =
Men(A)ji ,
(13.7)
det(A)
onde Men(A)ij e o determinante da matriz (n 1) (n 1) obtida eliminando-se a i-esima linha e a
j-esima coluna da matriz A. (A matriz Men(A) e por vezes denominada matriz dos menores de A).
Ve-se claramente da que se A e uma matriz com entradas racionais entao os n
umeros Men(A) ji sao
1
tambem racionais, assim como det(A). Logo (A )ij e um n
umero racional e, portanto, se A GL(n,
) entao A1 GL(n, ).
4

Pierre-Simon Laplace (1749-1827).

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

675/1304

O item 2 se prova da mesma maneira.


No caso do item 3, notemos que o produto de matrizes n n com entradas inteiras e tambem uma
matriz n n com entradas inteiras (por que?). Assim, a operacao de produto e uma operacao binaria
em GL(n, ). O elemento neutro e a matriz identidade, que e elemento de GL(n, ) (pois os n
umeros
0 e 1 sao inteiros). Com isso, GL(n, ) e um monoide. O problema que faz com que GL(n, ) nao
seja um grupo reside no fato de que a inversa de uma matriz com entradas inteiras nem sempre e uma

0
matriz com entradas inteiras. Isso se ve claramente no exemplo da matriz ( 10 02 ) cuja inversa e 10 1/2
.
No entanto, se uma matriz A, invertvel com entradas inteiras, tiver determinante igual a 1, segue
imediatamente de (13.7) que A1 tem tambem entradas inteiras. Da, prova-se facilmente a afirmativa
4.
E. 13.14 Exerccio. Complete os detalhes das afirmacoes feitas acima.


2 1
SL(n, ) e que A =
SL(n, ).
E. 13.15 Exerccio. Verifique que A =
1 1


a b
SL(n,
Mais genericamente, se a, b, c e d sao numeros inteiros tais que ad bc = 1, entao A =
c d


d b
1
SL(n, ).
)eA =
6
c a


1 1
1 2

E. 13.16 Exerccio.
SL(n,

1 b
0 1

Verifique que todas as matrizes da forma




1
1
). Verifique que todas as matrizes da forma
com c
c c+1

com b

sao elementos de

sao elementos de SL(n,

). 6

Outros Subgrupos de GL( , n) e de GL( , n)




Ha varios outros subgrupos de GL( , n) e GL( , n) aos quais eventualmente faremos referencia.
Deixamos ao estudante provar em cada caso que se trata realmente de grupos. Dois deles sao os grupos
de matrizes com determinante positivo:


GL( , n)+ := {A Mat ( , n), det(A) > 0} ,




GL( , n)+ := {A Mat ( , n), det(A) > 0} .

Outro grupo relevante e o chamado grupo de Weyl5 de GL( , n):


(
)
n
n
X
X
Wn := A GL( , n), Aij {0, 1} i, j, com
Aij = 1 =
Aij .
i=1

j=1

Em palavras, as matrizes de Wn sao matrizes n n cujas entradas valem 0 ou 1, sendo que exatamente
um elemento 1 ocorre em cada linha e em cada coluna.
5

Hermann Klaus Hugo Weyl (1885-1955).

JCABarata. Curso de Fsica-Matem


atica

E. 13.17 Exerccio.


0 1
.
1 0

Vers
ao de 29 de setembro de 2005.

Captulo 13

Mostre que W2 contem apenas dois elementos, a saber as matrizes

676/1304


1 0
0 1

e
6

E. 13.18 Exerccio. Determine os (seis) elementos de W3 .

E. 13.19 Exerccio. Prove que Wn e isomorfo ao grupo de permutacoes de n elementos Sn definido `a


pagina 667.
6

13.2.2

O Grupo de Borel e o Grupo de Heisenberg

Uma matriz A, complexa, n n, e dita ser uma matriz triangular superior se seus elementos de matriz
Aij satisfizerem Aij = 0 se i > j. Tais matrizes tem a forma

A11 A12
A1(n1)
A1n
0 A22
A2(n1)
A2n

..
..
.. ,
..
A = ...
.
.
.
.

0
0 A(n1)(n1) A(n1)n
0
0
0
Ann
onde os elementos abaixo da diagonal principal sao nulos. Aqueles que ficam acima da diagonal principal
podem ser nulos ou nao.

De acordo com a Proposicao 3.21, pagina 190, o conjunto das matrizes complexas n n triangulares
superiores invertveis forma um grupo, denominado por alguns autores Grupo de Borel 6 de ordem n e
denotado por GBn ( ).
E. 13.20 Exerccio-exemplo. Para duas matrizes triangulares superiores invertveis 2 2
!
!
a b
d e
A =
e
B =
0 c
0 f
verifique que
AB =

ad ae + bf
0

cf

que e novamente uma matriz triangular superior, e verifique que


!
1
b

a
ac
A1 =
.
1
0
c
6

Armand Borel (1923-2003). A noca


o de grupo de Borel e mais geral. As matrizes n n triangulares superiores
invertveis compoem o grupo de Borel associado ao grupo GL( , n).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

677/1304

Um caso particular do grupo de Borel e o grupo de Heisenberg, que agora discutiremos.


O grupo de Heisenberg GH3 ( )
O chamado grupo de Heisenberg7 , denotado por GH3 ( ) (os grupos GHn ( ) com n 3 sao definidos
adiante), e definido como o grupo formado por todas as matrizes 3 3 da forma

1 a c
H(a, b, c) = 0 1 b ,
0 0 1

onde a, b, c , com o produto usual de matrizes (se a, b, c temos o grupo GH3 ( )). A matriz
identidade e um elemento de GH3 ( ) pois H(0, 0, 0) = e tem-se


H(a, b, c)H(a0 , b0 , c0 ) = H(a + a0 , b + b0 , c + c0 + ab0 ).

(13.8)

Essa relacao, em particular, diz que o produto de duas matrizes de GH3 ( ) e novamente uma matriz
de GH3 ( ). Tem-se tambem que

1 a ab c
b ,
H(a, b, c)1 = H(a, b, ab c) = 0 1
(13.9)
0 0
1
que mostra que toda matriz de GH3 ( ) tem inversa e que essa inversa e tambem uma matriz de
GH3 ( ). Assim, GH3 ( ) e um grupo matricial.
E. 13.21 Exerccio. Verifique essas afirmacoes.

De (13.8) constata-se facilmente que GH3 ( ) nao e um grupo Abeliano.


E. 13.22 Exerccio. Mostre que o centro do grupo de Heisenberg e formado pelas matrizes do tipo
H(0, b, 0) com b . O conceito de centro de um grupo foi introduzido `a pagina 71.
6
Como e facil de ver, o grupo de Heisenberg e um grupo de Lie (grupos de Lie serao tratados no
Captulo 14) que, como variedade analtica, e difeomorfo a 3 . O exerccio seguinte discute tres de seus
subgrupos uniparametricos.
E. 13.23 Exerccio. Verifique que as matrizes H1 (t) := H(t, 0, 0), H2 (t) := H(0, t, 0), H3 (t) :=
H(0, 0, t) satisfazem Hj (t)Hj (t0 ) = Hj (t + t0 ) e Hj (0) = , j = 1, 2, 3. Assim, para cada j, as
matrizes Hj (t) representam sub-grupos uniparametricos de GH3 ( ). Os geradores desses subgrupos sao
hj := dtd Hj (t) t=0 . Verifique que

0 1 0
0 0 0
0 0 1
h1 = 0 0 0 , h2 = 0 0 1 , h3 = 0 0 0 .
0 0 0
0 0 0
0 0 0
7

Werner Karl Heisenberg (1901-1976).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

678/1304

Mostraremos agora que esses geradores formam uma algebra de Lie, a chamada algebra de Heisenberg gh3 ( ). Adiante explicaremos por que o nome de Heisenberg e associado ao grupo GH 3 ( ) e a`
algebra gh3 ( ).
A
algebra de Heisenberg gh3 ( )
Considere matrizes da forma

0 a c
h(a, b, c) = 0 0 b ,
0 0 0

(13.10)

[h(a, b, c), h(a0 , b0 , c0 )] = h(0, 0, ab0 a0 b),

(13.11)

onde a, b, c . Calculando-se o comutador de duas de tais matrizes tem-se

(verifique!) que e novamente da forma (13.10). Assim, o conjunto de matrizes da forma (13.10) forma
uma algebra de Lie com o produto definido pelo comutador de matrizes. Essa algebra de Lie, denotada
lgebra de Heisenberg.
por gh3 ( ), e denominada a
A razao dessa denominacao e a seguinte. Podemos encontrar em gh3 ( ) uma base especial formada
por tres matrizes que, por razoes psicologicas, denotaremos por p, q e ~:

0 1 0
0 0 0
0 0 i
p = 0 0 0 ,
q = 0 0 1 ,
~ = 0 0 0 .
0 0 0
0 0 0
0 0 0
um exerccio facil (e fortemente recomendado) verificar que essas matrizes satisfazem as seguintes
E
regras de comutacao:
[p, ~] = 0 ,
[q, ~] = 0 ,
[p, q] = i~ .
Para aqueles familiarizados com a Mecanica Quantica as relacoes acima justificam a denominacao
dessa algebra em honra a Heisenberg: as relacoes de comutacao acima sao precisamente iguais a`s
relacoes canonicas de comutacao satisfeitas pelos operadores associados ao momento (p) e posicao (q)

,
de uma partcula se movendo em uma dimensao. No caso da Mecanica Quantica, p e o operador i~ x
8
q = x e ~ representa um n
umero (a constante de Planck ), que obviamente comuta com os operadores
p e q.
Nota. O estudante deve, porem, observar que as matrizes p, q e ~, acima, nao sao auto-adjuntas, ao
contrario dos operadores correspondentes da Mecanica Quantica. Essa observacao e relevante, pois e
possivel provar que as relacoes canonicas de comutacao nao podem ser satisfeitas por operadores autoadjuntos agindo em espacos de Hilbert de dimensao finita ou por operadores auto-adjuntos limitados
agindo em espacos de Hilbert de dimensao infinita. De fato, no espaco de Hilbert L2 ( , dx) os

operadores p = i~ x
e q = x sao auto-adjuntos (em um domino conveniente), mas nao sao limitados.


O que faz gh3 ( ) especial como algebra de Lie e a propriedade expressa no seguinte exerccio:

Max Karl Ernst Ludwig Planck (1858-1947).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

679/1304

E. 13.24 Exerccio importante. Verifique que para quaisquer tres elementos h 1 , h2 e h3 da algebra de
Heisenberg tem-se
[h1 , [h2 , h3 ]] = 0 .
(13.12)
Sugestao: use as relacoes de comutacao de p, q e ~, dadas acima ou use diretamente (13.11). A relacao
(13.12) mostra que gh3 ( ) e o que se chama uma algebra de Lie nilpotente (de grau 2).
6
Para entender a relacao da algebra de Heisenberg gh3 ( ) com o grupo de Heisenberg GH3 ( ),
facamos o seguinte. Notemos em primeiro lugar que as matrizes h(a, b, c) sao matrizes nilpotentes de
grau 3, ou seja,
h(a, b, c)3 = 0.
facil com isso verificar que se calcularmos a exponencial de h(a, b, c) teremos
(Mostre isso!). E



1 a c + ab
2
1
ab
2

b
, (13.13)
= H a, b, c +
exp (h(a, b, c)) = + h(a, b, c) + h(a, b, c) = 0 1
2
2
0 0
1

ou seja,

 

ab
.
H(a, b, c) = exp h a, b, c
2

E. 13.25 Exerccio. Escreva h a, b, c

ab
2

como combinacao linear de p, q e ~.

(13.14)
6

Pelo que vimos, todos os elementos do grupo de Heisenberg GH3 ( ) sao obtidos pela exponenciacao
de elementos da algebra de Lie gh3 ( ), ou seja, a exponenciacao e uma aplicacao sobrejetora de gh3 ( )
em seu grupo de Lie GH3 ( ). Em verdade, e facil constatar que essa aplicacao e tambem injetora (faca
isso!). A aplicacao exponencial e, portanto, uma bijecao de gh3 ( ) em GH3 ( ).
E. 13.26 Exerccio importante. Usando a formula de Baker-Campbell-Hausdorff (equacoes (4.4), pagina
222, ou (4.46), pagina 249) e as relacoes (13.11) e (13.12), mostre que
 





ab0 a0 b
0
0
0
0
0
0
exp h(a, b, c) exp h(a , b , c ) = exp h a + a , b + b , c + c +
.
(13.15)
2
Usando (13.13) e (13.14), re-obtenha de (13.15) a regra de produto (13.8).

Coment
ario. Esse exerccio ilustra uma aplicacao da formula de Baker-Campbell-Hausdorff. Note-se
que, devido ao fato de gh3 ( ) ser uma algebra de Lie nilpotente (vide (13.12)), a serie de BakerCampbell-Hausdorff e composta apenas por um n
umero finito de termos e, portanto, converge sempre.
O grupo de Heisenberg GHn ( ), n 3
Vamos agora generalizar o grupo GH3 ( ). Para n 3, os chamados grupos de Heisenberg GHn ( )
sao definidos como sendo os grupos formado por todas as matrizes n n da forma

1 aT c
H(a, b, c) = m m b
T
0
m 1

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

680/1304

com o produto usual de matrizes, sendo m = n 2, onde a, b n2 e c . Acima, a e b representam


matrizes-coluna com m = n 2 linhas equanto que aT e bT , as transpostas de a e b, respectivamente,
representam matrizes-linha com m = n 2 colunas:

a1
b1



a = ... ,
aT = a1 an2 ,
b = ... ,
bT = b1 bn2 ,
an2
bn2
0
sendo m = ... a matriz coluna identicamente nula com m = n 2 linhas e sendo m a matriz
0
 
 
a1
b
identidade m m. Por exemplo, no caso n = 4, para a =
, b = 1 2 , a matriz H(a, b, c) e
a2
b2
 1 a 1 a2 c 
H(a, b, c) = 00 01 10 bb21 . Para simplificar a notacao, iremos doravante escrever H(a, b, c) na forma
0 0 0 1

1 aT c
b .
H(a, b, c) = 0
0 0 1

A matriz identidade e um elemento de GHn ( ) pois H(0, 0, 0) =

e tem-se

H(a, b, c)H(a0 , b0 , c0 ) = H(a + a0 , b + b0 , c + c0 + aT b0 ) ,

(13.16)

sendo que definimos a forma bilinear aT b0 := ha, b0 i = a1 b01 + + an2 b0n2 .




Essa relacao, em particular, diz que o produto de duas matrizes de GHn ( ) e novamente uma
matriz de GHn ( ). Vale tambem que

1 a aT b c

,
b
0
H(a, b, c)1 = H(a, b, aT b c) =
(13.17)

0 0
1
que mostra que toda matriz de GHn ( ) tem inversa e que essa inversa e tambem um elemento de
GHn ( ). Assim, GHn ( ) e um grupo matricial.

A
algebra de Heisenberg ghn ( ), n 3
Para n 3, considere matrizes de Mat ( , n) da forma

0
1
aT c
h(a, b, c) = m mm b 0
T
1
0
0
m

aT
mm

c
b ,
0

(13.18)

n2
e a matriz m m identicamente
nula
e c ,
 
 e onde a, b
a1
b1
como acima. Por exemplo, no caso n = 4, para a =
, b =
2 , a matriz h(a, b, c) e
a2
b2
 0 a 1 a2 c 
h(a, b, c) = 00 00 00 bb21 .

com m = n 2, onde

0 0 0 0

mm

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

681/1304

Calculando-se o comutador de duas de tais matrizes tem-se


T

[h(a, b, c), h(a0 , b0 , c0 )] = h(0, 0, aT b0 a0 b),

(13.19)

(verifique!) que e novamente da forma (13.18). Assim, o conjunto de matrizes da forma (13.18) forma
uma algebra de Lie com o produto definido pelo comutador de matrizes. Essa algebra de Lie, denotada
por ghn ( ), e igualmente denominada a
lgebra de Heisenberg.
E. 13.27 Exerccio importante. Verifique que para quaisquer tres elementos h 1 , h2 e h3 da algebra de
Heisenberg ghn ( ) tem-se
[h1 , [h2 , h3 ]] = 0 .
(13.20)
A relacao (13.20) mostra que ghn ( ) e o que se chama uma algebra de Lie nilpotente (de grau 2).
Podemos encontrar em ghn (
definidas por

0 eTk
p k = 0
0 0

) uma base especial formada pelas matrizes ~ e pk , qk , k = 1, . . . , n2

0
0 ,
0

0 0 0
ek ,
q k = 0
0 0 0

sendo ek , k = 1, . . . , n 2 as matrizes-coluna definidas por


1
0
0
0

e1 := .. ,
.
0
0

1
0

e2 := .. ,
.
0
0

0 0 i
~ = 0 0 0 ,
0 0 0
0
0

en2

0
:= .. ,
.
0
1

ou seja, todos as linhas de ej sao nulas, exceto a j-esima, que vale 1. No caso n = 4, por exemplo,
tem-se

0 0 1 0
0 1 0 0
0 0 0 0
0 0 0 0

p1 =
0 0 0 0 , p2 = 0 0 0 0 ,
0 0 0 0
0 0 0 0
q1

0
0
=
0
0

0
0
0
0

0
0
0
0

0
1
,
0
0

0
0
q2 =
0
0

0
0
0
0

0
0
0
0

0
0
,
1
0

0
0
~ =
0
0

0
0
0
0

0
0
0
0

i
0
.
0
0

Em analogia com o caso do grupo GH3 ( ), e facil constatar que as matrizes pk , qk e i~ sao
geradores de sub-grupos uniparametricos de GHn ( ).
E. 13.28 Exerccio. Verifique a afirmacao do u
ltimo paragrafo. Determine os sub-grupos uniparametricos
de GHn ( ) mencionados.
6

Como eTk el = k, l para todos k e l, e um exerccio facil (e fortemente recomendado!) verificar que
essas matrizes satisfazem as seguintes regras de comutacao:
[pk , ql ] = i~ k, l ,
[pk , ~] = [qk , ~] = [pk , pl ] = [qk , ql ] = 0 ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

682/1304

para todos k, l = 1, . . . , n 2. Como o estudante familiarizado com a Mecanica Quantica percebe,


essas sao as relacoes canonicas de comutacao de um sistema com n 2 graus de liberdade.

Para entender a relacao da algebra de Heisenberg ghn ( ) com o grupo de Heisenberg GHn ( ),
notemos em primeiro lugar que, assim como no caso n = 3, as matrizes h(a, b, c) sao matrizes
nilpotentes de grau 3, ou seja,
h(a, b, c)3 = 0.
facil com isso verificar que
(Mostre isso!). E
exp (h(a, b, c)) =

ou seja,

aT b


1
a
c
+
T
2
a
b
1
2
+ h(a, b, c) + h(a, b, c) = 0 1
,
b = H a, b, c +
2
2
0 0
1
(13.21)

 
aT b
H(a, b, c) = exp h a, b, c
.
2

(13.22)

Pelo que vimos, todos os elementos do grupo de Heisenberg GHn ( ) sao obtidos pela exponenciacao
de elementos da algebra de Lie ghn ( ), ou seja, a exponenciacao e uma aplicacao sobrejetora de ghn ( )
em seu grupo de Lie GHn ( ). Em verdade, e facil constatar que essa aplicacao e tambem injetora (faca
isso!). A aplicacao exponencial e, portanto, uma bijecao de ghn ( ) em GHn ( ).
E. 13.29 Exerccio importante. Usando a formula de Baker-Campbell-Hausdorff (equacoes (4.4), pagina
222, ou (4.46), pagina 249) e as relacoes (13.19) e (13.20), mostre que
!!




T 0
0T
a
b

a
b
. (13.23)
exp h(a, b, c) exp h(a0 , b0 , c0 ) = exp h a + a0 , b + b0 , c + c0 +
2
Usando (13.21) e (13.22), re-obtenha de (13.23) a regra de produto (13.16).

13.2.3

Grupos Associados a Formas Bilineares e Sesquilineares

Seja E um espaco vetorial. Vamos denotar por GL(E) o conjunto de todos os operadores lineares
bem claro que GL(E) forma um grupo, tendo como
bijetores (e portanto invertveis) de E em E. E
produto o produto de operadores.
Seja uma forma bilinear ou sesquilinear (caso E seja complexo) em E. Denotaremos por (E, )
o subconjunto de GL(E) formado por todos os operadores lineares O invertveis tais que
(Ox, Oy) = (x, y)
para todos x, y E. Vamos mostrar que (E, ) e um sub-grupo de GL(E). Primeiramente e claro
que (E, ). Em segundo lugar, sejam O1 e O2 dois operadores de (E, ). Teremos pelas
hipoteses que
(O1 O2 x, O1 O2 y) = (O2 x, O2 y) = (x, y)

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

683/1304

para todos x, y E e, portanto, O1 O2 (E, ). Resta mostrar que se O (E, ) entao


O 1 (E, ). De fato,
(O 1 x, O 1 y) = (OO 1x, OO 1 y) = (x, y)
para todos x, y E, que e o que queramos provar.

Vamos considerar casos particulares em que E e o espaco


n

ou

e seja A uma forma bilinear em


, que pelas consideracoes da Secao 2.4 e da forma
Seja E =
A (x, y) = hx, Ayi para alguma matriz real A. Neste caso ( n , A ) e o conjunto de todas as
matrizes M invertveis reais n n tais que


hM x, AM yi
n

para todos x, y


= hx, Ayi


. Essa relacao nos diz que


hx, M T AM yi

para todos x, y

= hx, Ayi


, o que implica
M T AM = A.

(Por que?). Assim,


(

n


, A ) =


M Mat( , n), det(M ) 6= 0 e M T AM = A .


Se a matriz A for invertvel (ou seja, se A for nao-degenerada), entao podemos escrever tambem


( n , A ) = M Mat( , n), det(M ) 6= 0 e M 1 = A1 M T A .


Seja E = n e seja A uma forma sesquilinear em n , que pelas consideracoes da Secao 2.4 e da
forma A (x, y) = hx, Ayi para alguma matriz complexa A. Neste caso ( n , A ) e o conjunto de
todas as matrizes M invertveis complexas n n tais que


hM x, AM yi
n

para todos x, y

n


. Essa relacao nos diz que


hx, M AM yi

para todos x, y

= hx, Ayi


= hx, Ayi


, o que implica
M AM = A.

Acima M = M T . Assim,
(

, A ) = {M Mat( , n), det(M ) 6= 0 e M AM = A} .

Se a matriz A for invertvel (ou seja, se A for nao-degenerada), entao podemos escrever tambem


( n , A ) = M Mat( , n), det(M ) 6= 0 e M 1 = A1 M A .

JCABarata. Curso de Fsica-Matem


atica

13.2.4

Captulo 13

Vers
ao de 29 de setembro de 2005.

684/1304

Os Grupos Ortogonais

Os Grupos O(n) e SO(n)


Um caso de particular interesse e aquele onde E = n e A = , ou seja, A (x, y) = hx, yi . Neste
caso o grupo ( n , A ) e denotado por O(n) e tem-se


O(n) := M Mat( , n), M 1 = M T .


O(n) e o grupo das matrizes ditas ortogonais n n.

Se M e uma matriz ortogonal, tem-se que M M T = . Da, 1 = det( ) = det(M M T ) =


det(M ) det(M T ) = (det(M ))2 . Conclumos que se uma matriz M e ortogonal, vale det(M ) = 1.

O(n) possui um sub-grupo, denominado SO(n), que e composto pelas matrizes ortogonais com
determinante igual a 1:


SO(n) := M Mat( , n), M 1 = M T e det(M ) = 1 .


Os grupos SO(n) representam generalizacoes do grupo de rotacoes do espaco tridimensional para o


espaco n-dimensional.
Os Grupos O(p, m) e SO(p, m)
Um outro caso de particular interesse e aquele onde E =
(p, m) e a matriz diagonal

1
...

(p, m) :=
1

..

.


com p elementos +1 e m elementos 1, sendo p + m = n.

e (x, y) = hx, (p, m)yi




onde

(13.24)

, ) e denotado por O(p, m) e tem-se




O(p, m) := M Mat( , n), M 1 = (p, m)M T (p, m) .

Neste caso o grupo (

Se M O(p, m), tem-se que M (p, m)M T (p, m) = . Da,



1 = det( ) = det M (p, m)M T (p, m) = det(M ) det(M T ) (det((p, m)))2 = (det(M ))2 .

Conclumos que se M O(p, m), vale det(M ) = 1.

O(p, m) possui um sub-grupo, denominado SO(p, m), que e composto pelas matrizes de O(p, m)
com determinante igual a 1:


SO(p, m) := M Mat( , n), M 1 = (p, m)M T (p, m) e det(M ) = 1 .


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

685/1304

*
Certos grupos O(p, m) e SO(p, m) desempenham um papel muito importante em Fsica, estando
ligados ao chamado Grupo de Lorentz, o qual tem importancia na Teoria da Relatividade Especial. O
grupo de Lorentz e detalhadamente discutido na Secao 13.6.

13.2.5

Os Grupos Unit
arios

Os Grupos U (n) e SU (n)


Mais um caso importante e aquele onde E = n e A e a forma sesquilinear associada a A = , ou
seja, A (x, y) = hx, yi . Neste caso o grupo ( n , A ) e denotado por U (n) e tem-se


U (n) := M Mat( , n), M 1 = M .


U (n) e o grupo das matrizes ditas unit


arias n n.

Se M e uma matriz unitaria, tem-se que M M = . Da,



T
=
1 = det( ) = det (M M ) = det(M ) det(M ) = det(M ) det M

det(M )det(M T ) = det(M )det(M ) = |det(M )|2 .

Conclumos que se M U (n), vale |det(M )| = 1.

U (n) possui um sub-grupo, denominado SU (n), que e composto pelas matrizes unitarias com determinante igual a 1:


SU (n) := M Mat( , n), M 1 = M e det(M ) = 1 .
*

Os grupos U (2) e SU (3) desempenham um papel muito importante na Mecanica Quantica e na


Fsica das Partculas Elementares.
Os Grupos U (p, m) e SU (p, m)
Mais um caso e aquele onde E = n e (x, y) = hx, (p, m)yi onde (p, m) foi definida em
(13.24). Neste caso o grupo ( n , ) e denotado por U (p, m) e tem-se


U (p, m) := M Mat( , n), M 1 = (p, m)M (p, m) .


Se M U (p, m), tem-se que M (p, m)M (p, m) = . Da,

1 = det( ) = det (M (p, m)M (p, m)) = det(M ) det(M ) (det((p, m)))2 =


det(M ) det M T = det(M )det(M T ) = det(M )det(M ) = |det(M )|2 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

686/1304

Conclumos que se M U (p, m), vale |det(M )| = 1.

U (p, m) possui um sub-grupo, denominado SU (p, m), que e composto pelas matrizes de U (p, m)
com determinante igual a 1:


SU (p, m) := M Mat( , n), M 1 = (p, m)M (p, m) e det(M ) = 1 .

E. 13.30 Exerccio.
Mostre que os elementos do grupo SO(n) sao caracterizados por n(n 1)/2
parametros reais. Mostre que os elementos do grupo SU(n) sao caracterizados por n 2 1 parametros reais.
6
Desse exerccio conclui-se, por exemplo, que os grupos SO(3) e SU(2) sao caracterizados pelo mesmo
n
umero de parametros reais, a saber 3. Conseq
uencias desse fato serao investigadas abaixo, quando
olharemos com mais detalhe para esses dois grupos.
Os Grupos Ortogonais Complexos
Seja o espaco vetorial complexo n e seja a seguinte forma bilinear em n : (x, y) = hx, yi =
x1 y1 + +xn yn para vetores x = (x1 , , xn ) e y = (y1 , , yn ) n . O grupo ortogonal complexo,
denotado por O(n, ), e o grupo das matrizes complexas que mantem essa forma bilinear invariante:


O(n,

) := {M Mat (n,

=
M Mat (n,

)| (M x, M y) = (x, y), x, y

)| M T = M 1 .

facil ver tambem que se M O(n,


O(n, ) nao pode ser confundido com o grupo U (n). E
det(M ) = 1. Da, define-se


SO(n, ) := M Mat (n, )| M T = M 1 e det(M ) = 1 .

Como e facil de se ver, SO(n,

13.3

) e um subgrupo de O(n,

), entao

).

Os Grupos SO(2), SO(3), SU(2) e SL( , 2)

Em funcao de sua particular importancia na Fsica, em especial na Fsica Quantica, vamos discutir
aqui com algum detalhe os grupos SO(3) e SU(2), os quais, ademais, como veremos, sao intimamente
relacionados. Por razoes pedagogicas, ilustraremos o estudo dos grupos SO(3) e SU(2) tratando antes
do grupo SO(2).

13.3.1

Os Grupos SO(2), O(2), SO(1, 1) e O(1, 1)

Os Grupos SO(2) e O(2)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

687/1304

Conforme ja definimos, o grupo SO(2) e o grupo das matrizes ortogonais 22 reais com determinante
igual a 1: SO(2) = {R Mat ( , 2)| RT = R1 e det(R) = 1}. Vamos comecar estudando a forma
geral de tais matrizes.


Como toda matriz 22 real, uma matriz generica R SO(2) e da forma R = ( ac db ), onde a, b, c, d
. Vamos estudar a condicao R1 = RT . Podemos calcular R1 usando a regra de Laplace, expressao
(3.8), pagina 145: R1 e dada pela transposta da matriz dos cofatores de R dividida pelo determinante
d b
1
de R, que e 1, neste caso. Ou seja, R1 = c
= RT significa nesse caso
a . Assim, R




a c
d b
,
=
b d
c a

a b
ou seja, c = b e d = a. Logo, R = b
cao det(R) = 1 implica, portanto, a2 + b2 = 1.
a . A condi
Podemos entao escrever a e b na forma a = cos , b = sen (), com (, ]. Resumindo:



cos sen
SO(2) =
, onde (, ] .
sen cos


Seja
R() :=

cos sen
sen cos

Como R() = R( + 2) vemos que SO(2) e homeomorfo ao crculo unitario S 1 , que e uma variedade
diferenciavel. Como o produto e a inversa sao contnuos em SO(2), isso diz que SO(2) e um grupo de
facil constatar que R(0) = e que vale a regra de produto R()R( 0 ) = R(+ 0 ) (faca!). SO(2) e,
Lie. E
portanto, um grupo uniparametrico homomorfo ao grupo ( , +) e isomorfo ao grupo ( , + mod 2).


O gerador J de SO(2) e definido por









d
d
0
1
cos

sen


.
=
=
J :=
R()

1 0
sen

cos

d
d
=0
=0
igualmente elementar constatar que J 2 = . Da
E

X
m m
exp(J) =
J
m!
m=0

X
2k 2k X 2k+1
=
J +
J 2k+1
(2k)!
(2k
+
1)!
k=0
k=0

X
(1)k 2k
k=0

(2k)!

= cos() + sen ()J


= R().

X
(1)k 2k+1
k=0

(2k + 1)!

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

688/1304

Assim,
SO(2) = {exp(J), onde (, ]} .

(13.25)

Com isso, (13.25) esta nos dizendo que todo elemento de SO(2) pode ser escrito como exponencial do
seu gerador. Veremos que algo semelhante tambem se da nos grupos SO(3) e SU(2).
O grupo O(2) e o grupo das matrizes ortogonais 2 2 reais: O(2) = {R Mat ( , 2)| R T = R1 }.
Se R O(2) entao det(R) = 1. O caso det(R) = 1 corresponde a SO(2), que tratamos acima. Vamos
considerar o caso det(R) = 1.


Como toda matriz 22 real, uma matriz generica R O(2) com det(R) = 1 e da forma R = ( ac db ),
b
cao
onde a, b, c, d . Neste caso, como det(R) = 1, teremos R 1 = d
c a . Assim, a condi
1
T
R = R significa nesse caso




d b
a c
=
,
c a
b d

b
ou seja, c = b e d = a. Logo, R = ab a
. A condicao det(R) = 1 implica novamente a2 + b2 = 1.
Podemos entao escrever a e b na forma a = cos , b = sen , com (, ]. Assim, R e da forma





cos sen
1 0
cos sen
R =
=
.
sen cos
0 1
sen cos


Resumindo:
O(2) =

(

1 0
0 1

P 

)

cos sen
, onde P {0, 1} e (, ] .
sen cos

O grupo U(1)
E. 13.31 Exerccio. Mostre que o grupo U(1) := {z , |z| = 1} e isomorfo ao grupo SO(2).

O grupo O(1, 1) (O Grupo de Lorentz em 1+1 dimens


oes)
Aqui estudaremos em detalhe o grupo O(1, 1), tambem denominado Grupo de Lorentz em 1+1
dimensoes. A leitura deste topico pode servir de introducao a` leitura da Secao 13.6 que tratara do
Grupo de Lorentz em 3+1 dimensoes.
Seja M matriz invertvel real 2 2 na forma M = ( ac db ), onde a, b, c, d  . Tem-se que,
a c
1
d b
1 0
M = adbc
ao M T = b
d , como facilmente
c a , onde det(M ) = ad bc. Se := ( 0 1 ) ent
se ve.


a c
d b
Se M SO(1, 1) entao M 1 = M T e det(M ) = 1. Isso significa que c
=
b d . Assim,
a
devemos ter a = d e b = c. A condicao det(M ) = 1 significa a2 b2 = 1. Logo,


SO(1, 1) = M Mat ( , 2)| M = ( ab ab ) com a2 b2 = 1, a, b
.


Como se ve, SO(1, 1) e homeomorfo ao conjunto H+ H formado por duas hiperboles


p
H := {(x, y) 2 | x = 1 + y 2 }.


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

689/1304

SO(1, 1) tem, portanto, duas componentes conexas, que denotaremos por L+ e L+ :


n

o

1+b2 b
L+ :=
M Mat ( , 2)| M =
,
,
b

1+b2
b


L+ :=

M Mat ( , 2)| M =


1+b2 b
b
1+b2

, b

Note-se que apenas L+ e conexa a` identidade e, portanto, apenas a componente L+ e um subgrupo de


SO(1, 1).
Parametrizando b
L+

na forma b = senh (z), com z , constatamos que




n
o
senh (z)
,
z

= M Mat ( , 2)| M = cosh(z)


,
senh (z) cosh(z)


L+ =

M Mat ( , 2)| M =


cosh(z) senh (z)


senh (z) cosh(z)

, z

Os elementos de
1. Assim, sao matrizes que
 nao sao de SO(1, 1) tem determinante

 O(1,a 1)cque
a b
b
sendo,
portanto,
da
forma
com
a2 b2 = 1. O conjunto de
=
satisfazem d
b a
b d
c a
tais matrizes e igualmente homeomorfo ao conjunto H+ H e consta tambem de duas componentes
conexas, a saber, os conjuntos
n


o

1+b2 b
L :=
M Mat ( , 2)| M =
, b
,
1+b2
b


L :=

M Mat ( , 2)| M =


1+b2 b
b 1+b2

, b

claro que nem L nem L sao subgrupos de O(1, 1). Parametrizando b


E
b = senh (z), com z , constatamos que
n


cosh(z) senh (z)
M Mat ( , 2)| M = senh
, z
L =
(z) cosh(z)

.
novamente na forma

L =

M Mat ( , 2)| M =


cosh(z) senh (z)


senh (z) cosh(z)

, z

O grupo O(1, 1) e, portanto, a uniao de quatro componentes conexas:

O(1, 1) = L+ L+ L L ,

sendo cada componente disjunta das demais. Dentre elas apenas L+ e um grupo.

1 0
0
Definindo as matrizes P := ( 1
0 1 ) L e T := ( 0 1 ) L , podemos escrever
n


o
senh (z)
L+ = M Mat ( , 2)| M = T cosh(z)
P,
z

,
senh (z) cosh(z)


L
L

=
=

M Mat ( , 2)| M =


M Mat ( , 2)| M = T


cosh(z) senh (z)


senh (z) cosh(z)

cosh(z) senh (z)


senh (z) cosh(z)

P, z


, z

o que exibe a relacao entre as matrizes dessas tres componentes conexas e as matrizes de L + .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

690/1304

E. 13.32 Exerccio. Mostre que


L+ = {M Mat ( , 2)| M = exp(zM1 ), z


onde M1 :=

0 1
1 0

},

6
*

O grupo O(1, 1) e por vezes denominado Grupo de Lorentz em 1+1 dimensoes. L+ e denominado
Grupo de Lorentz proprio ortocrono em 1+1 dimensoes. O Grupo de Lorentz em 3+1 dimensoes sera
estudado em detalhe na Secao 13.6, pagina 719.
Para fazermos contacto com a teoria da relatividade restrita, facamos uma outra parametrizacao
de L+ , definindo v = c tanh(z). Com isso c < v < c, cosh(z) = (v) e senh (z) = vc (v), onde
(v) = (1 (v/c)2 )1/2 . Assim,
n


o
(v) vc (v)

L+ = M Mat ( , 2)| M = v (v) (v) , c < v < c .




Logo, M L+ age em um vetor

x
ct

como M

x
ct

x vc t
x = q
,
2
1 vc2

 0
x
ct0

, onde

t cv2 x
t = q
,
2
1 vc2

que sao as bem conhecidas transformacoes de Lorentz da teoria da relatividade restrita.


E. 13.33 Exerccio. Qual a interpretacao fsica das matrizes P e T introduzidas acima?

13.3.2

O Grupo SO(3)

Conforme ja definimos, SO(3) e o grupo formado por todas as matrizes 3 3 reais R tais que R T = R1
e tais que det(R) = 1. Vamos comecar seu estudo mostrando que toda a matriz R 6= de SO(3)
representa uma rotacao por algum angulo em torno de algum eixo. A essa interpretacao seremos
conduzidos pelas duas proposicoes que seguem.
Proposi
c
ao 13.3 Para cada matriz R SO(3), R 6= , existe um sub-espaco unidimensional V de
3
formado por vetores que s
ao deixados invariantes por R: R~v = ~v para todo ~v V .
2


Note que o sub-espaco V pode nao ser o mesmo para matrizes R distintas. Note tambem que
exclumos R = por razoes obvias: todo vetor de 3 e invariante por e nao apenas um sub-espaco
unidimensional.


Prova. Seja R 6= uma matriz qualquer de SO(3), fixa daqui por diante. Para x , seja p(x) :=
det(x R), o polinomio caracterstico de R. Se escrevermos explicitamente o determinante da matriz


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

691/1304

x R (faca!), veremos que p(x) = +x3 +1 x2 +2 x+3 , onde as constantes i dependem dos elementos
de matriz de R. Como o termo de maior grau em x de p(x) e +x3 , conclumos que limx p(x) = +.
Fora isso, e claro que p(0) = det(R) = det(R) = 1 (por que?). Esses dois fatos dizem que o
polinomio p(x) deve ter um zero para algum x0 > 0.
Vamos provar que x0 = 1. Como det(x0 R) = 0, conclumos que a matriz R x0 nao possui
uma inversa. Portanto, deve existir pelo menos um vetor nao-nulo ~v0 3 tal que (R x0 )~v0 = 0,
ou seja, R~v0 = x0~v0 . Como R SO(3), segue que


|~v0 |2 = h~v0 , ~v0 i




= hR~v0 , R~v0 i


= hx0~v0 , x0~v0 i


= x20 h~v0 , ~v0 i .




Logo x20 = 1 e, como x0 > 0, segue x0 = 1. Assim, R~v0 = ~v0 , ou seja, ~v0 e um autovetor de R com
autovalor 1.
Seja V o sub-espaco de 3 formado por todos os vetores ~v que sao autovetores de R com autovalor
1: V = {~v 3 | R~v = ~v }. Como acabamos de mostrar, V e nao-trivial, ou seja, V 6= {0} e sua
dimensao pode ser 1, 2 ou 3.


Notemos de passagem que se v V entao vale tambem que R T v = v. De fato, se aplicarmos RT a`


direita na igualdade v = Rv e lembrarmos que RT R = , segue que RT v = v. Notemos tambem que
V , o sub-espaco formado por todos os vetores ortogonais a todos os vetores de V , e tambem deixado
invariante por R, ou seja, se u V entao Ru V . De fato, se v V e u V
hRu, vi


= hu, RT vi


= hu, vi


= 0.

Como isso vale para todo v V , conclumos que Ru V , como queramos.

Como dissemos, a dimensao de V pode ser igual a 1, 2 ou 3. Vamos mostrar que os dois u
ltimos
casos nao sao possveis.

Se a dimensao de V fosse 3, V seria identico ao espaco


vetor ~v 3 , ou seja, R = , situacao que exclumos.

3


. Nesse caso entao R~v = ~v para todo

Vamos supor entao que a dimensao de V e 2. Nesse caso a dimensao de seu complemento ortogonal
V e 1. Agora, como V e unidimensional e e invariante pela acao de R, teremos para u V que
Ru = u, para algum . Mas isso diz que

hu, ui


= hRu, Rui


= hu, ui


= 2 hu, ui


e, portanto, = 1. O caso = +1 ja esta excludo (pois a u V ). Logo = 1 e Ru = u.

Conseq
uentemente, se escolhermos em 3 uma base ortonormal formada por tres vetores v1 , v2 e u
com v1 , v2 V e u V , a matriz R teria a forma

1 0 0
R = 0 1 0 .
0 0 1


Mas com isso teramos det(R) = 1, uma contradicao! Logo a dimensao de V dever ser igual a 1, e
isso completa a prova.

Seja R 6= um elemento de SO(3) e seja VR o sub-espaco unidimensional formado pelos vetores


deixados invariantes por R e cuja existencia foi estabelecida na proposicao que acabamos de provar.

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

692/1304

Como tambem vimos, R tambem deixa invariante o sub-espaco bidimensional VR , que e ortogonal a
VR .
uma base ortonormal v, u1 , u2 com v VR e ui VR , a

0
0
1

(13.26)
R :=
r

Isso significa que se escolhermos em


matriz R tera a forma

onde r e uma matriz real 2 2. Que propriedades tem r? Como veremos, r SO(2). De fato, pela
definicao de R, teremos para qualquer vetor u, que hu, ui = hRu, Rui , mas se escolhermos u VR ,
teremos Ru = ru em VR e a relacao acima significa hu, ui = hru, rui . Logo r O(2). Fora isso,
(13.26) mostra que 1 = det(R) = det(r), provando que r SO(2). Como sabemos a forma geral de
uma matriz de SO(2) e


cos sen
r =
,
sen cos


com (, ]. Isso esta tambem dizendo que R representa uma rotacao de em torno do eixo
representado por VR .
Conclumos entao o seguinte:
Proposi
c
ao 13.4 Para cada R SO(3) existe uma base ortonormal de

1
0
0
R = 0 cos sen
0 sen cos

3


onde R e da forma
(13.27)

com (, ].

Pela discussao precedente, se considerarmos os elementos de SO(3) que correspondem a rotacoes


por um angulo no sentido horario em torno dos eixos canonicos 1, 2 e 3 do espaco tridimensional 3 ,
eixos esses que suporemos orientados positivamente, como usual, teremos que as respectivas matrizes
de rotacao sao dadas por

1
0
0
cos 0 sen
0
1
0 ,
R2 () =
R1 () = 0 cos sen ,
0 sen cos
sen 0 cos


cos sen 0
R3 () = sen cos 0 ,
0
0
1

(13.28)

com (, ].
um exerccio elementar (faca) verificar que cada matriz Ri () representa um sub-grupo unipaE
rametrico de SO(3): Ri (0) = e Ri ()Ri ( 0 ) = Ri ( + 0 ). Os geradores desses sub-grupos sao dados

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

693/1304

por
J1 :=

J2 :=

J3 :=



d
R1 ()
d


d
R2 ()
d


d
R3 ()
d

=0

=0

=0



0 0 0
1
0
0

d
0 cos sen
= 0 0 1 ,
=
d

0 1 0
0 sen cos
=0


0 0 1
cos 0 sen
d
0
1
0
=
= 0 0 0 ,
d
1 0 0
sen 0 cos =0


0 1 0
cos sen 0
d
=
= 1 0 0 .
sen cos 0
d

0 0 0
0
0
1
=0

E. 13.34 Exerccio importantssimo.


comutacao

(13.29)

(13.30)

(13.31)

Verifique que as matrizes J1 , J2 e J3 satisfazem as relacoes de

[Ja , Jb ] =

3
X

abc Jc ,

(13.32)

c=1

onde abc , com a, b, c = 1, 2, 3, e o chamado smbolo (ou tensor) de Levi-Civita 9 , definido da seguinte
forma:

1, se abc for uma permutacao par de 123


1, se abc for uma permutacao mpar de 123 .
abc :=
(13.33)

0, se quaisquer dois ndices forem iguais


6
Esse exerccio nos diz que as matrizes J1 , J2 e J3 formam uma algebra de Lie, denominada algebra
de Lie so(3) (com letras min
usculas), para lembrar sua associacao com o grupo SO(3).
E. 13.35 Exerccio. Sejam
~ = (1 , 2 , 3 ) 3 e ~ = (1 , 2 , 3 )
que
h
i
~ J,
~ ~ J~ = (~
~

~ J,
)


sendo que denota o produto vetorial em


6
9

Tullio Levi-Civita (1873-1941).

3


. Usando (13.32), mostre


(13.34)

e
~ J~ e uma abreviacao sugestiva para 1 J1 + 2 J2 + 3 J3 .

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

E. 13.36 Exerccio. Verifique que as matrizes J1 , J2 e J3 satisfazem

0 0 0
J12 = 0 1 0 =: E1 ,
0 0 1
J22

J32

694/1304

(13.35)

1 0 0
= 0 0 0 =: E2 ,
0 0 1

(13.36)

1 0 0
= 0 1 0 =: E3 .
0 0 0

(13.37)
6

E. 13.37 Exerccio. Verifique que com as matrizes E1 , E2 e E3 acima podemos escrever


+ (1 cos())Ea + sen ()Ja

Ra () =

(13.38)

para a = 1, 2 e 3.

Com o uso de (13.35)-(13.37) podemos facilmente provar o seguinte fato: para a = 1, 2 ou 3 tem-se
Ra () = exp(Ja ).
Vamos mostrar isso. Por (13.35)-(13.37) e evidente que Ja3 = Ea Ja = Ja (verifique!). Logo, para todo
k ,
Ja2k = (1)k+1 Ea , k > 0
e
Ja2k+1 = (1)k Ja , k 0.
(13.39)


Assim, temos para a = 1, 2 ou 3,


exp(Ja )

(13.39)

X
m m
+
J
m! a
m=1

X
2k 2k X 2k+1 2k+1
+
J +
J
(2k)! a
(2k + 1)! a
k=1
k=0

X
(1)k+1 2k
k=1

=
(13.38)

(2k)!

Ea +

X
(1)k 2k+1
k=0

(2k + 1)!

Ja

+ (1 cos())Ea + sen ()Ja


Ra (),

que e o que queramos mostrar.


Vamos agora mostrar que todo elemento de SO(3) pode ser escrito como exponencial de uma
combinacao linear das matrizes Ja .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Proposi
c
ao 13.5 Seja R SO(3). Ent
ao existe um vetor ~
a
ngulo (, ] tais que


R = exp ~ J~ ,

3


Captulo 13

695/1304

, ~ = (1 , 2 , 3 ), com |~ | = 1 e um

onde ~ J~ := 1 J1 + 2 J2 + 3 J3 . Em particular, toda matriz de rotaca


o R SO(3) pode ser expressa
na forma



2
R = + (1 cos()) ~ J~ + sen () ~ J~ ,
(13.40)

ou seja, escrevendo-se explicitamente,

(1 cos())12 + cos()
(1 cos())1 2 sen ()3 (1 cos())1 3 + sen ()2

2
.
(1

cos())

+
sen
()
(1

cos())
+
cos()
(1

cos())

sen
()
R =
1
2
3
3
2
1
2

(1 cos())1 3 sen ()2 (1 cos())3 2 + sen ()1


(1 cos())32 + cos()
A express
ao (13.40) e denominada f
ormula de Rodrigues 10 .

Prova. Se R = podemos escolher = 0. Vamos supor R 6= . Pela Proposicao 13.3, existe um


sub-espaco unidimensional VR que e deixado invariante por R. Vamos escolher ~ como sendo um vetor
obvio que R~ = ~. Pela Proposicao 13.4, R representa uma
de VR com comprimento igual a 1. E
rotacao de um angulo (no sentido horario se > 0) em torno de ~ .


O que faremos para demonstrar nossa proposicao e mostrar que exp ~ J~ mantem ~ invariante
e roda os vetores perpendiculares a ~ de um angulo  (no sentido horario) em torno do eixo definido
por ~. Com isso, podemos identificar R = exp ~ J~ , como queremos.


~
Vamos abaixo calcular de modo mais explcito o que e a matriz exp ~ J mas, antes disso, vamos


demonstrar que exp ~ J~ SO(3).
Para isso comecamos com a observacao que

0 3 2
0 1
~ J~ := 1 J1 + 2 J2 + 3 J3 := 3
2 1
0

(13.41)

~ T = ~ J~.
e uma matriz anti-simetrica, ou seja, (~ J)
10

Benjamin Olinde Rodrigues (1794-1851). Rodrigues foi banqueiro e matem


atico amador, nascido na Franca, mas de
origem judaico-portuguesa. Seu nome e mais conhecido por uma identidade sobre polin
omios de Legendre.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

696/1304

Assim,
h

h

iT
iT m
m
X

=
exp ~ J~
~ J~
m!
m=0


X
()m
~m
=
(~ J)
m!
m=0



= exp ~ J~
=

i1
~
exp ~ J
.

~ e ortogonal, ou seja, sua transposta e igual a sua inversa. Resta-nos


Isso provou que exp(~
 J) 


mostrar que det exp ~ J~
= 1. Como exp ~ J~ e ortogonal, seu determinante e 1. Assim,



como det exp ~ J~ depende continuamente de (para isso, vide, por exemplo a expressao (13.44)



abaixo), temos que det exp ~ J~
e constante para todo (, ]. Calculando em = 0,
teremos






det exp ~ J~
= det exp 0~ J~
= det( ) = 1.


Logo, exp ~ J~ SO(3) para todo e todo ~.


Vamos agora expressar de modo mais explcito a matriz exp ~ J~ . Para isso sera importante
mostrar que



3
= ~ J~
.
(13.42)
~ J~
A maneira pedestre de mostrar isso e por verificacao
2
1 1

2
~ J~
= 1 2
1 3

explcita. De fato, por (13.41),

1 2
1 3
22 1 3 2 .
3 2 32 1

(13.43)

~ obtem-se (13.42). Temos, entao, o seguinte: para todo k


Multiplicando-se novamente por ~ J,
k > 0, vale

2

2k
k+1
~
~
= (1)
~ J
~ J



2k+1
k
~
~
= (1) ~ J .
~ J

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

697/1304

Logo,



~
exp ~ J
=
=

X
m  ~m
+
~ J
m!
m=1

X
2k  ~2k X 2k+1  ~2k+1
+
+
~ J
~ J
(2k)!
(2k + 1)!
k=0
k=1

X
(1)k+1 2k

(2k)!

k=1

=
Resumindo,


2
~ J~ +

X
(1)k 2k+1
k=0

(2k + 1)!

~ J~


2


+ (1 cos()) ~ J~ + sen () ~ J~ .



exp ~ J~ =

um exerccio facil verificar que


E




2
+ (1 cos()) ~ J~ + sen () ~ J~ .

(13.44)


0
0 3 2
1


0 1 2 = 0 .
~ J~ ~ = 3
0
2 1
0
3


~
Assim, conclui-se, tanto pela expansao em serie de Taylor de exp ~ J quando por (13.44) que


exp ~ J~ ~ = ~,



ou seja, tal como R, a matriz exp ~ J~ mantem ~ invariante para qualquer .
 
1
Para finalizar, vamos entao escolher uma base em 3 na qual ~ = 0 . Nessa base teremos ~ J~ = J1
0

2


~
e ~ J = E1 . Logo, por (13.44), teremos nessa base que exp ~ J~ se expressa como


1
0
0
+ (1 cos())E1 + sen ()J1 = 0 cos sen
0 sen cos


~
que e a forma (13.27) da matriz R. Isso permite-nos identificar R = exp ~ J , completando a prova.



exp ~ J~ =

Resumindo nossas conclusoes,


n


SO(3) = exp ~ J~ ,

[, ], ~

3


o
com |~ | = 1 .

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

698/1304

A Proposicao 13.5 esta nos dizendo que todo elemento de SO(3) pode ser escrito como a exponencial
de um elemento de sua algebra de Lie. Isso constata um teorema geral (vide, por exemplo, [119]) que
diz que se um grupo de Lie e compacto e sua algebra de Lie e semi-simples, a aplicacao exponencial da
sua algebra de Lie e sobrejetora no grupo. De fato, SO(3) e compacto e so(3) e semi-simples.
Para finalizar esta exposicao sobre o grupo SO(3), vamos descrever sua estrutura enquanto variedade
diferenciavel. Como vimos, os elementos de SO(3) sao parametrizados por pontos ~ de 3 , sendo que
[, ] e |~ | = 1. O conjunto de todos os pontos desse tipo compreende a esfera de raio
centrada na origem. Para cada ~ fixo, os dois pontos antpodas da superfcie dessa esfera que estao na
claro, porem, que tais pontos correspondem a` mesma rotacao: uma
direcao definida por ~ sao ~ . E
rotacao de em torno de um eixo e o mesmo
 que uma rota
 cao de em torno do mesmo eixo. De
~
fato, e trivial verificar por (13.44) que exp ~ J = exp ~ J~ . Assim, SO(3) corresponde nessa
imagem ao espaco obtido tomando-se uma esfera e identificando-se todos os pares de pontos antpodas.
Na linguagem da geometria diferencial, o conjunto que assim se obtem e denominado espaco projetivo
real (em quatro dimensoes) e denotado por P 3 . O conjunto P n e a variedade diferenciavel ndimensional formada pelo conjunto de todas as linhas retas de n+1 que passam pela origem. SO(3)
e homeomorfo, enquanto variedade, ao espaco projetivo P 3 . Como veremos na proxima secao, o
grupo SU(2), que e fortemente aparentado a SO(3), tem outra estrutura: SU(2) e homeomorfo a S 3 , a
superfcie da esfera de raio 1 em 4 . Para uma introducao a` geometria diferencial, vide [98].


E. 13.38 Exerccio. Leia [98] e resolva todos os seus exerccios.

13.3.3

O Grupo SU(2)

As Matrizes de Pauli
De grande importancia no estudo do grupo SU(2) sao as chamadas matrizes de Pauli 11 , definidas
como






0 1
0 i
1
0
1 :=
, 2 :=
e 3 :=
.
(13.45)
1 0
i 0
0 1

As matrizes de Pauli satisfazem as seguintes relacoes algebricas: para todos a, b = 1, 2, 3 valem


[a , b ] := a b b a = 2i

3
X

abc c ,

(13.46)

c=1

{a , b } := a b + b a = 2ab ,
a b = ab + i

(13.47)
3
X

abc c .

(13.48)

c=1

E. 13.39 Exerccio importantssimo (todo estudante deve faze-lo pelo menos uma vez na vida). Verifique as relacoes algebricas acima. Note que (13.48) segue diretamente de (13.47) e (13.46).
6
11

Wolfgang Pauli (1900-1958).

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

699/1304

Note tambem que as matrizes de Pauli sao auto-adjuntas: i = i . Note ainda que as quatro
matrizes , 1 , 2 , 3 formam uma base em Mat ( , 2): toda matriz complexa 2 2 pode ser escrita
como uma combinacao linear das mesmas.
E. 13.40 Exerccio. Mostre que as matrizes , 1 , 2 , 3 sao ortonormais em relacao ao seguinte
6
produto escalar definido em Mat ( , 2): hA, Bi := 21 Tr (A B).
As matrizes de Pauli desempenham um papel importante na Mecanica Quantica, estando associadas
ao operador de spin para partculas de spin 1/2, tais como o eletron, o proton, o neutron, os quarks e
outras.
A Forma Geral das Matrizes de SU(2)
Conforme ja definimos, o grupo SU(2) e o grupo das matrizes unitarias complexas 2 2 com
determinante igual a 1: SU(2) = {U Mat ( , 2)| U = U 1 e det(U ) = 1}. Vamos comecar
estudando a forma geral de tais matrizes, procurando uma parametrizacao conveniente para as mesmas
que permitira estudar as propriedades de SU(2) como um grupo de Lie.
Como toda matriz 2 2 complexa, uma matriz generica U SU(2) e da forma U = ( ac db ), onde
a, b, c, d . Vamos estudar a condicao U 1 = U . Podemos calcular U 1 usando a regra de Laplace,
expressao (3.8), pagina 145: U 1 e dada pela transposta da matriz
dos cofatores de U dividida pelo

1
d b
determinante de U , que e 1, neste caso. Ou seja, U = c a . Assim, U 1 = U significa nesse caso




a c
d b
,
=
c a
b d

a b
ou seja, c = b e d = a. Logo, U = b
cao det(U ) = 1 implica, portanto, |a|2 + |b|2 = 1.
a . A condi
Resumindo:

SU(2) =




a b
, onde a, b
b a

com |a| + |b| = 1 .

Escrevendo os n
umeros complexos a e b como soma de suas partes real e imaginaria: a = a 1 + ia2
e b = b1 + ib2 , com a1 , a2 , b1 , b2 , poderemos escrever U como uma combinacao linear de matrizes
de Pauli (e da unidade):


a1 + ia2 b1 + ib2
U =
= a1 + i(b2 1 + b1 2 + a2 3 ).
(13.49)
b1 + ib2 a1 ia2


Essa expressao sera usada adiante.


Vamos agora nos voltar para a condicao |a|2 + |b|2 = 1. A mesma significa a21 + a22 + b21 + b22 = 1.
Temos entao,



a1 + ia2 b1 + ib2
4
2
2
2
2
SU(2) =
, onde (a1 , a2 , b1 , b2 )
com a1 + a2 + b1 + b2 = 1 . (13.50)
b1 + ib2 a1 ia2


Lembremos que para todo inteiro n 1, o conjunto de pontos


S n := {(x1 , . . . , xn+1 )

n+1


com x21 + + x2n+1 = 1}

n+1


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

700/1304

designa a superfcie da esfera unitaria de n+1 . Assim, vemos que SU(2) e homeomorfo a S 3 , a
superfcie da esfera unitaria do espaco quadridimensional 4 . Isso ilustra o fato que SU(2) e uma
variedade diferenciavel. Como o produto e a inversa sao contnuos em SU(2), o mesmo e um grupo de
Lie.


Vamos tentar agora parametrizar de outra forma o vetor (a1 , a2 , b1 , b2 ) S 3 que aparece do lado
direito de (13.50). Claramente, a condicao a21 + a22 + b21 + b22 = 1 diz que a1 , a2 , b1 e b2 sao n
umeros
reais contidos no intervalo [1, 1]. Podemos assim definir um angulo [, ] de forma que
a1 = cos .
Fora isso, para cos() 6= 1, podemos definir

b2
b1
a2
,
2 :=
,
3 :=
.
sen
sen
sen
A condicao a21 + a22 + b21 + b22 = 1 implica entao (verifique!) que 12 + 22 + 32 = 1. Assim, o vetor
~ := (1 , 2 , 3 ) de 3 e um vetor de comprimento 1. Com esses novos parametros e ~ podemos
reescrever (13.49) como
U = cos() + i sen ()~ ~ ,
1 :=

onde

~ ~ := 1 1 + 2 2 + 3 3 =
Assim,
SU(2) =


3
1 i2
.
1 + i2
3

cos() + i sen ()~ ~ , onde [, ] e ~

3



com |~ | = 1 .

A importancia de se expressar U SU(2) dessa forma, em termos de e ~, provem da seguinte


identidade:
cos() + i sen ()~ ~ = exp (i~ ~ ) .

Vamos provar isso expandindo o lado direito e verificando que e igual ao lado esquerdo. De fato, pela
definicao da exponencial de matrizes,

X
(i)m
exp (i~ ~ ) =
(~ ~ )m
m!
m=0
=

X
(i)2k
k=0

(2k)!

(~ ~ )

2k

X
(i)2k+1
+
(~ ~ )2k+1 ,
(2k + 1)!
k=0

onde, na u
ltima linha, apenas fizemos separar a soma em m da primeira linha nos casos m par e m

mpar. E um exerccio muito facil (faca!) verificar que



2
3
1 i2
2
(~ ~ ) =
= .
1 + i2
3
Portanto, (~ ~ )2k =

e (~ ~ )2k+1 = ~ ~ . Logo,

exp (i~ ~ ) =

X
(i)2k
k=0

(2k)!

X
(i)2k+1
(2k + 1)!
k=0

= cos() + i sen ()~ ~ ,

~ ~

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

701/1304

que e o que queramos mostrar.


Resumindo nossas conclusoes,

SU(2) = exp (i~ ~ ) onde [, ] e ~

3



com |~ | = 1 .

(13.51)

Se tomarmos ~1 = (1, 0, 0), ~2 = (0, 1, 0) ou ~3 = (0, 0, 1), obtemos tres sub-grupos uniparametricos distintos de SU(2):


cos i sen
U1 () := exp(i1 ) =
,
i sen cos
U2 () := exp(i2 ) =

U3 () := exp(i3 ) =


cos
sen
,
sen cos

ei 0
,
0 ei

respectivamente. Isso nos permite identificar as matrizes de Pauli 1 , 2 e 3 como os geradores desses
subgrupos uniparametricos. As relacoes (13.46) sao as relacoes satisfeitas por essas matrizes, como
elementos de uma algebra de Lie, que e denominada algebra de Lie su(2).
Com isso, (13.51) esta nos dizendo que todo elemento de SU(2) pode ser escrito como exponencial
de um elemento de sua algebra de Lie. Isso constata um teorema geral (vide, por exemplo, [119]) que
diz que se um grupo de Lie e compacto e sua algebra de Lie e semi-simples, a aplicacao exponencial
da sua algebra de Lie e sobrejetora no grupo. De fato, tal como SO(3), SU(2) e compacto e su(2) e
semi-simples.
E. 13.41 Exerccio. Mostre que

U(2) = exp (i + i~ ~ ) onde , [, ] e ~

13.3.4


com |~| = 1 .

3


A Rela
c
ao entre SO(3) e SU(2)

O leitor que acompanhou com atencao as exposicoes precedentes sobre os grupos SO(3) e SU(2) certamente apercebeu-se da existencia de uma serie de semelhancas entre ambos. Vamos agora precisa-las.
Em primeiro lugar, note-se que os geradores de SO(3) sao matrizes 3 3 satisfazendo as relacoes
algebricas [Ja , Jb ] = abc Jc , enquanto que geradores de SU(2) sao matrizes 22 satisfazendo as relacoes
algebricas [a , b ] = 2iabc c . Se porem definirmos ja := ia /2, obtemos [ja , jb ] = abc jc .
Seja

so(3) := {L Mat ( , 3) : L = 1 J1 + 2 J2 + 3 J3 , k


, k = 1, 2, 3}

a algebra de Lie (real) associada aos geradores de SO(3) e seja


su(2) := {l Mat ( , 2) : l = 1 j1 + 2 j2 + 3 j3 , k


, k = 1, 2, 3}

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

702/1304

a algebra de Lie (real) associada aos geradores de SU(2).


muito facil constatar que a aplicacao linear : su(2) so(3) dada por
E
(1 j1 + 2 j2 + 3 j3 ) = 1 J1 + 2 J2 + 3 J3
e um isomorfismo de a
lgebras de Lie, ou seja, e bijetora e satisfaz ([la , lb ]) = [(la ), (lb )] para todos
la , lb su(2).
E. 13.42 Exerccio importante. Prove as afirmativas acima.

E. 13.43 Exerccio. Mostre que so(3) coincide com a algebra de Lie de todas as matrizes reais 3 3
anti-simetricas. (Vide exerccio `a pagina 58).
6
E. 13.44 Exerccio. Mostre que su(2) coincide com a algebra de Lie de todas as matrizes complexas
2 2 anti-autoadjuntas. (Vide exerccio `a pagina 58).
6
Assim, as algebras de Lie so(3) e su(2) sao isomorfas. Discutiremos agora que implicacoes isso traz
sobre as relacao entre os grupos SO(3) e SU(2).
por

O isomorfismo definido acima sugere considerar-se a seguinte aplicacao : SU (2) SO(3) dada
(exp(l)) := exp ((l)) ,

ou seja,
para todos (2, 2], e ~

l su(2),






exp ~ ~j
:= exp ~ J~ ,
3

com |~ | = 1.

Que propriedades essa possui? Em primeiro


 lugar, e facil ver que e sobrejetora (por que?),
mas nao e injetora, pois para U1 := exp i 20 ~ ~ = e U2 := exp i 2
~ ~ = tem-se (U1 ) =
2
(U2 ) = . Verifique! A questao e: como se comporta em relacao ao produto dos elementos do
grupo? A resposta encontra-se na afirmativa da proposicao seguinte.

Proposi
c
ao 13.6 A aplicaca
o : SU (2) SO(3) definida acima e um homomorfismo do grupo
SU(2) no grupo SO(3), ou seja, ( ) = e para todos Ua , Ub SU(2) vale (Ua )(Ub ) = (Ua Ub ). 2
Em verdade, como e sobrejetora, a proposicao estabelece que e um epimorfismo de SU(2) em
SO(3). Vide definicao a` pagina 66.
Prova. Que ( ) =
Ua e Ub da forma

e trivial. Provemos que (Ua )(Ub ) = (Ua Ub ) para todos Ua , Ub SU(2). Sejam
Ua = exp

3
X
k=1

k j k

Ub = exp

3
X
k=1

k j k

com k , k , k = 1, 2, 3, e limitemos provisoriamente os valores


a uma vizinhanca
P3dos k s e k sP
O suficientemente pequena de zero
que as matrizes a = k=1 k jk e b = 3k=1 k jk tenham
 de modo



ambas normas menores que 12 ln 2

2
2

. Essa restricao provisoria a`s normas de a e b (vide comentario

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

703/1304

a` pagina 251) e u
til pois coloca-nos no domnio de validade da formula de Baker-Campbell-Hausdorff
(eq. (4.46) a` pagina 249. Vide tambem (4.47)). Isso justifica entao escrevermos
Ua Ub = ea eb = exp (a b) ,
onde a b esta definida em (4.46). Como a serie que define a b e convergente e envolve comutadores
m
ultiplos de elementos da algebra de Lie su(2), e evidente que a b e tambem um elemento de su(2) e,
mais que isso, tem-se
ab =

3
X

k jk =

k=1

3
X

k (1 , 2 , 3 , 1 , 2 , 3 )jk ,

(13.52)

k=1

onde cada k e uma funcao analtica das variaveis 1 , 2 , 3 , 1 , 2 , 3 em um aberto suficientemente


pequeno proximo zero. A analiticidade se deve ao fato de que a serie que define a b e absolutamente
convergente e envolve, em cada termo, polinomios nas variaveis e .
E. 13.45 Exerccio. Lance um olhar meditativo sobre a formula de Baker-Campbell-Hausdorff (4.46)
e convenca-se da veracidade das afirmacoes feitas no u
ltimo paragrafo sobre a analiticidade das funcoes
k . De modo mais iluminante, mostre usando (4.47) e as relacoes de comutacao (13.34), que os primeiros
termos de ~ = (1 , 2 , 3 ) sao





1
1 
~ =
~ + ~ +

~ ~ +

~
~ ~ + ~ ~
~
+ ,
2
12
onde
~ = (1 , 2 , 3 ) e ~ = (1 , 2 , 3 ).

Retomando, sejam agora


(Ua ) = exp

3
X

k Jk

k=1

e A = (a), B = (b), ou seja, A =

P3

k=1

(Ub ) = exp

3
X
k=1

k Jk e B =

P3

k=1

k Jk

k Jk . Novamente, tem-se que

(Ua )(Ub ) = eA eB = exp (A B) ,


mas, como as relacoes de comutacao entre os jk s sao identicas a`s dos Jk s, segue que
AB =

3
X
k=1

k Jk , =

3
X

k (1 , 2 , 3 , 1 , 2 , 3 )Jk ,

k=1

com as mesmas funcoes k que em (13.52) (Justifique isso!). Ou seja, vale que
A B = (a b).
Isso concluiu que, pelo menos quando 1 , 2 , 3 , 1 , 2 , 3 sao suficientemente proximos de zero,
vale
(Ua )(Ub ) = exp((a b)) = (exp(a b)) = (Ua Ub ).

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

704/1304

Tudo que nos falta agora e um argumento que justifique que essa igualdade vale nao apenas para
1 , 2 , 3 , 1 , 2 , 3 suficientemente proximos de zero, mas para quaisquer valores desses parametros.
Esse argumento e a analiticidade.

P3
e uma funcao analtica (inteira) de 1 , 2 e 3 (pois a
Cada elemento de matriz de exp
k=1 k Jk
serie que define a exponencial
para os elementos
 converge absolutamente em toda parte). O mesmoPvale

P3
P3
3
de matriz de exp

J
.
Assim,
cada
elemento
de
matriz
do
produto
exp
k=1 k k
k=1 k Jk exp
k=1 k Jk
e uma
cao anal
 tica (inteira) de 1 , 2 , 3 , 1 , 2 , 3 . Igualmente, cada elemento de matriz de
Pfun
3
exp

J
e uma funcao analtica de 1 , 2 , 3 , 1 , 2 , 3 quando esses estao proximos a zero
k=1 k k
(pois a composicao de funcoesPanalticase tamb
uma fun
provamos acima
 cao anal

Pem
P3tica). Portanto,
3
3
que as funcoes analticas exp
k=1 k Jk exp
k=1 k Jk e exp
k=1 k Jk coincidem em um aberto
suficientemente pequeno. Por um teorema geral da teoria de funcoes de variaveis complexas, isso implica que essas funcoes sao iguais em toda parte. Assim, vale para todos 1 , 2 , 3 , 1 , 2 , 3 reais ou
complexos que (Ua )(Ub ) = (Ua Ub ), completando a prova.
Note que a aplicacao nao pode ser um isomorfismo de grupos pois, como vimos, nao e bijetora.
E. 13.46 Exerccio. Mostre, porem, que SO(3) e SU(2)/{ , } sao isomorfos.

*
Todas as consideracoes de acima sobre a relacao entre os grupos SO(3) e SU(2) sao de grande
importancia em fsica, particularmente no que concerne a` representacao do grupo de rotacoes SO(3)
para partculas de spin 1/2. Ainda mais profunda e a relacao entre o grupo SL( , 2) e o grupo de
Lorentz, relacao esta que discutiremos na Secao 13.8, pagina 745.

13.3.5

O Grupo SL( , 2)

Vamos aqui tratar de um grupo fortemente aparentado ao grupo SU(2) e ao grupo de Lorentz, cujo
estudo e importante na teoria dos spinores, particularmente no estudo de representacoes do grupo de
Lorentz para partculas de spin 1/2. Trata-se do grupo SL( , 2). Mais sobre o grupo SL( , 2), em
especial, sua relacao com o grupo de Lorentz, sera visto na Secao 13.8, pagina 745.
O grupo SL( , 2) e definido como o grupo formado pelas matrizes complexas 2 2 de determinante
igual a 1. Como as matrizes , 1 , 2 , 3 formam uma base em Mat ( , 2), podemos escrever toda
matriz A SL( , 2) na forma


b4 + b3 b1 ib2
A = b 4 + b 1 1 + b 2 2 + b 3 3 , =
,
b1 + ib2 b4 b3
com b4 , b1 , b2 , b3 . A condicao det(A) = 1 implica b24 b21 b22 b23 = 1.
Assim,

SL( , 2) =



b4 + b3 b1 ib2
b1 + ib2 b4 b3

com b4 , b1 , b2 , b3

b24

b21

b22

b23

=1 .

(13.53)

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

705/1304

Como b4 e um n
umero complexo arbitrario, podemos escrever
b4 = cosh z,
para algum z . Fora isso, para z 6= 0, podemos definir tres n
umeros complexos 1 , 2 , 3 por
1 :=

b1
,
senh z

2 :=

b2
,
senh z

3 :=

b3
.
senh z

A condicao b24 b21 b22 b23 = 1 implica (verifique!) que os n


umeros complexos 1 , 2 , 3 satisfazem
12 + 22 + 32 = 1.
Com isso vemos que

SL( , 2) = cosh(z) + senh (z) (~ ~ ), onde z

e ~


com 12 + 22 + 32 = 1 .

(13.54)

Mesmo para vetores ~ complexos tem-se, como vimos anteriormente quando tratamos de SU(2),
que (~ ~ )2 = . Portanto,

X
zm
(~ ~ )m
exp (z ~ ~ ) =
m!
m=0

X
X
z 2k+1
z 2k
2k
(~ ~ ) +
(~ ~ )2k+1
=
(2k)!
(2k + 1)!
k=0
k=0

X
z 2k
(2k)!
k=0

X
k=0

z 2k+1
(2k + 1)!

(~ ~ )

= cosh(z) + senh (z) (~ ~ ).


Assim, todo elemento A SL( , 2) e da forma exp (z ~ ~ ). Em resumo,


SL( , 2) = exp (z ~ ~ ) , onde z e ~ 3 com 12 + 22 + 32 = 1 .

(13.55)

Como ja vimos, o sub-grupo SU(2) de SL( , 2) corresponde a z = i, , e ~ 3 . Como


vemos, SU(2) e SL( , 2) tem ambas algebras de Lie geradas pelas matrizes de Pauli, mas em SU(2)
essa algebra e real enquanto que em SL( , 2) e complexa.


Mais sobre o grupo SL( , 2), em especial, sua relacao com o grupo de Lorentz, sera visto na Secao
13.8, pagina 745.

13.4

Generalidades sobre os grupos SU(n) e SO(n)

Nesta secao discutiremos algumas qualidades gerais dos grupos SU(n) e SO(n). Para esta secao
recomenda-de a leitura previa de partes do Captulo 14. Comecaremos com os grupos SU(n) pois
seu tratamento e ligeiramente mais simples que o dos grupos SO(n). O caso fisicamente importante do
grupo SU(3) sera discutido com um pouco de detalhe.

JCABarata. Curso de Fsica-Matem


atica

13.4.1

Captulo 13

Vers
ao de 29 de setembro de 2005.

706/1304

Os Grupos SU(n)

Apos termos adquirido algum conhecimento sobre o grupo SU(2), vamos estudar alguns aspectos gerais
dos grupos SU(n), n 2. Vimos acima de modo explcito que os elementos de SU(2) podem ser escritos
como exponenciais de elementos de sua algebra de Lie. Veremos que esse fato e tambem valido para
SU(n).
Lembremos a definicao: para n 2,
SU (n) := {U Mat ( , n)| U = U 1 e det(U ) = 1}.
Comecemos com a seguinte observacao.
Proposi
c
ao 13.7 SU(n) e um subgrupo compacto de GL( , n).

Prova. Provemos primeiramente que SU (n) e um subconjunto (topologicamente) fechado de GL( , n).
Seja Un , n , uma seq
uencia de matrizes de SU(n) que converge em norma a uma matriz
U Mat ( , n), ou seja, limn kUn U k = 0, onde k k e a norma operatorial de matrizes.
Desejamos provar que U SU(n).


Em primeiro lugar, notemos que podemos escrever

U U = (U Un + Un ) (U Un + Un ) = (U Un ) (U Un ) + Un (U Un ) + (U Un ) Un + Un Un .
Como os Un sao unitarios, Un Un =
(U Un ) Un . Assim
kU U k

e conclui-se que U U

= (U Un ) (U Un ) + Un (U Un ) +

= k(U Un ) (U Un ) + Un (U Un ) + (U Un ) Un k


k(U Un ) (U Un )k + kUn (U Un )k + k(U Un ) Un k




k(U Un ) k kU Un k + kUn k kU Un k + k(U Un ) k kUn k




kU Un k2 + 2kU Un k


(13.56)

(Ao estudante deve ser claro que acima usamos os fatos que, para quaisquer matrizes A, B, complexas
n n, valem kA + Bk kAk + kBk , kABk kAk kBk , kAk = kA k e que kAk = 1 se A e
unitaria. Se nao for claro, justifique esses fatos como exerccio ou leia o Captulo 26).


Agora, como o extremo direito da seq


uencia de desigualdades (13.56) pode ser feito arbitrariamente
pequeno para n , conclumos que o extremo esquerdo e nulo, ou seja, U U = . Analogamente,
prova-se que U U = . Isso estabelece que U e unitario.
Para provar que o determinante de U vale 1, notemos que o fato de Un convergir a U na norma
operatorial implica que os elementos de matriz da seq
uencia de matrizes Un convergem aos elementos de
matriz de U (por que?). Como o determinante de uma matriz depende continuamente de seus elementos
de matriz (por que?), segue que det(U ) = limn det(Un ) = 1. Isso estabelece que U SU(n) e isso
prova que SU(n) e um subconjunto topologicamente fechado de GL( , n), como queramos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

707/1304

Para provarmos que SU(n) e compacto, resta apenas provar que SU(n) e um conjunto limitado
(em um espaco metrico um conjunto e compacto se e somente se for fechado e limitado). A condicao
U U = implica Tr(U U ) = n. Assim, vale
n
X

a, b=1

|Uab |2 = n,

para todo U SU(n). Isso mostra que SU(n) e limitado e, portanto, compacto.
Seja agora {U (t) SU (n), t }, um subgrupo uniparametrico de SU(n) (ou seja, U (0) = e
U (t)U (t0 ) = U (t + t0 ), sendo t 7 U (t) contnua). Pela Proposicao 14.5, pagina 782, U (t) = exp(tA)
para alguma matriz A. Agora, sejam u, v dois vetores arbitrarios de n . Temos que, para todo t vale
hu, vi = hU (t)u, U (t)vi . Diferenciando essa igualdade em relacao a t, escrevendo-se U (t) = exp(tA)
e calculando a derivada em t = 0, tem-se 0 = hAu, vi + hu, Avi , ou seja, hu, (A + A )vi = 0. Como
isso vale para todo u, v em n , segue que A = A. Fora isso12 , como 1 = det(exp(tA)) = exp(tTr(A)),
segue que A tem traco nulo.


Assim, vimos que os geradores dos subgrupos uniparametricos de SU(n) sao anti-autoadjuntos e
tem traco nulo. Podemos nos perguntar se a recproca e valida, ou seja, se todas as matrizes antiautoadjuntas e de traco nulo sao geradoras de subgrupos uniparametricos de SU(n). Para responder
isso, precisamos da seguinte proposicao:
Proposi
c
ao 13.8 Se A Mat ( , n) e anti-autoadjunta (ou seja, A = A) satisfazendo tambem
Tr(A) = 0, ent
ao a matriz exp(A) e um elemento de SU(n).
2
Prova. Precisamos provar que exp(A) e unitaria e que seu determinante e igual a 1. Pela definicao da
exponencial de matrizes em termos de uma serie de potencias (a serie de Taylor da funcao exponencial),
sabe-se que exp(M ) = exp(M ) para qualquer matriz nn complexa M . Assim, exp(A) = exp(A ) =
exp(A) = exp(A)1 , provando que exp(A) e unitaria.
Assim, para nossa matriz A, tem-se det(exp(A)) = exp(Tr(A)) = exp(0) = 1, o que prova que
exp(A) SU(n), como queramos.
Essa proposicao diz-nos que, se A Mat ( , n) e anti-autoadjunta e tem traco nulo, entao U (t) =
exp(tA), t e um subgrupo uniparametrico de SU(n). Em resumo, conclumos que o conjunto de
todas as matrizes n n complexas anti-autoadjuntas e de traco nulo e identico ao conjunto de todos
os geradores de subgrupos uniparametricos de SU(n).


Como SU(n) e um subgrupo fechado de GL( , n), segue do Teorema 14.1 que o conjunto de seus
geradores e uma algebra de Lie. Essa algebra de Lie e dita ser a algebra de Lie de SU(n), e e denotada
por su(n) (assim, com letras min
usculas). Como vimos, su(n) coincide com o conjunto de todas as
matrizes n n complexas anti-autoadjuntas de traco nulo.
De passagem, notemos que o fato de que o conjunto de todas as matrizes n n complexas antiautoadjuntas de traco nulo forma uma algebra de Lie real ja fora visto independentemente nos exerccios
da pagina 58.
12

Aqui usamos a Proposica


o 4.7, p
agina 234.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

708/1304

Provemos agora uma outra proposicao, a qual essencialmente diz-nos que todo elemento de SU(n)
pode ser obtido como exponencial de um elemento de su(n). No caso de SU(2) isso foi provado explicitamente, quando mostramos que todo elemento de SU(2) e da forma exp(i~ ~ ).

Proposi
c
ao 13.9 Todo elemento U de SU(n) pode ser escrito na forma U = e A , onde A Mat ( , n)
e anti-autoadjunta (ou seja, A = A) e de traco nulo (ou seja, Tr(A) = 0).
2
Prova. Seja U SU(n). Como toda matriz unitaria, U e normal, pois vale U U = U U (= ).
Uma das conseq
uencias do Teorema Espectral para matrizes diz-nos que toda matriz normal pode ser
diagonalizada por uma matriz unitaria (vide Teorema 3.14 e as paginas que o antecedem).
Assim, existe V , matriz unitaria, tal que U = V DV , onde D = diag (u1 , . . . , un ), e onde os uk sao
n
umeros complexos (os autovalores de U ). Da condicao U U = segue imediatamente que DD = ,
o que implica que cada uk e um n
umero complexo de modulo 1: |uk |2 = 1. Assim, podemos escrever
uk = eik , onde k , sendo que cada k e determinado a menos de um termo 2m, com m inteiro.


Note-se
como UPtem determinante 1, segue que 1 = det(U ) = det(V DV ) = det(D) =

Pn que,
exp i k=1 k . Assim, nk=1 k = 2m0 , com m0 inteiro. Podemos redefinir, digamos, n , subtraindolhe 2m0 . Com essa nova escolha teremos
n
X

k = 0.

(13.57)

k=1

Definamos agora a matriz L = diag (i1 , . . . , in ). Note-se que, como os k sao reais, vale L = L.
claro que D = eL e tambem que U = exp(A), onde A = V LV . E
agora elementar constatar que
E
P
A = A. Fora isso, por (13.57) segue que Tr(A) = Tr(V LV ) = Tr(L) = i nk=1 k = 0. Isso completa
a prova.
A Proposicao 13.9 diz-nos que a exponenciacao e uma aplicacao sobrejetora de su(n) em SU(n).
Isso e um caso particular de um teorema mais geral que diz que isso e valido para qualquer grupo de
Lie compacto, conexo e cuja algebra de Lie seja de dimensao finita.
Pelo que vimos su(2) coincide com a algebra de Lie real de todas as matrizes
E. 13.47 Exerccio.
complexas 2 2, anti-autoadjuntas e de traco zero. Mostre que as matrizes i 1 , i2 e i3 formam uma base
nesse espaco de matrizes. Conclua que todo elemento de SU(2) e da forma exp(i 1 1 + i2 2 + i3 3 )
com k .
6


A Proposicao 13.9 tem o seguinte corolario simples:


Corol
ario 13.1 O grupo SU(n) e conexo por caminhos e, portanto, e um espaco conexo.

Prova. Pelo que vimos, se U SU(n), U e da forma U = eA , para alguma A su(n). Logo U
pertence ao subgrupo uniparametrico de SU(n) gerado por A: {exp(tA), t }. Esse subgrupo
conecta continuamente U a` identidade (que corresponde a t = 0).


JCABarata. Curso de Fsica-Matem


atica

13.4.2

Vers
ao de 29 de setembro de 2005.

Captulo 13

709/1304

O Grupo SU(3)

O grupo SU(3) e de grande importancia na Fsica das Partculas Elementares, estando associado a`
uma simetria aproximada, dita de sabor, e a uma simetria exata, dita de cor. Nao nos deteremos
nesses aspectos aqui, e remetemos o estudante aos bons livros sobre Fsica das Partculas Elementares
e Teoria Quantica de Campos (por exemplo, [134]-[135]).
O grupo SU(3) e um grupo a 32 1 = 8 parametros. Pelo que vimos, su(3) coincide com o espaco das
matrizes complexas 3 3, anti-autoadjuntas e de traco zero. Para o estudo do grupo SU(3) no contexto
da fsica das partculas elementares e conveniente introduzir-se uma base explcita nesse espaco. Como
toda matriz anti-autoadjunta pode ser escrita como i, onde e autoadjunta, basta-nos procurar uma
base no espaco das matrizes autoadjuntas de traco zero.
Comummente adota-se as chamadas Matrizes de Gell-Mann13 i , i = 1, . . . , 8, que sao as seguintes
matrizes:

1 0 0
0 i 0
0 1 0
3 = 0 1 0 ,
2 = i 0 0 ,
1 = 1 0 0 ,
0 0 0
0 0 0
0 0 0

0 0 1
4 = 0 0 0 ,
1 0 0

0 0 i
5 = 0 0 0 ,
i 0 0

0 0 0
7 = 0 0 i , 8 =
0 i 0

1 0 0
1 0 1
0 .
3
0 0 2

0 0 0
6 = 0 0 1 ,
0 1 0

Note que todas as matrizes i sao autoadjuntas e de traco zero, formando uma base no espaco das
matrizes complexas autoadjuntas e de traco nulo (mostre isso!). As mesmas sao normalizadas de modo
que Tr(a b ) = 2ab .
ltimo paragrafo.
E. 13.48 Exerccio. Prove as afirmativas do u
A algebra de Lie de su(3) pode ser expressa para as matrizes de Gell-Mann da seguinte forma:
[a , b ] = 2i

8
X

fabc c ,

c=1

onde fabc , as camadas constantes de estrutura de su(3), sao totalmente anti-simetricas, ou seja
fabc = fbca = fcab = fbac = facb = fcba ,
13

Murray Gell-Mann (1929-).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

710/1304

sendo
f123 = 1,
f147 = f156 = f246 = f257 = f345 = f367 =

1
,
2

3
,
2

f458 = f678 =

e as demais constantes independentes sao nulas.


ao: tire uma tarde livre.
E. 13.49 Exerccio. Verifique isso. Sugest

Pelo que aprendemos da nossa discussao geral sobre grupos SU(n), todo elemento U de SU(3) pode
ser escrito na forma
!
8
X
U = exp i
k k ,
k=1

onde os k s sao n
umeros reais.

13.4.3

Os Grupos SO(n)

Primeiramente lembremos a definicao: para n 2,


SO(n) := {R Mat ( , n)| RT = R1 e det(R) = 1}.


Sob varios aspectos os grupos SO(n) podem ser tratados de modo semelhante aos grupos SU(n),
exceto por um ponto importante: por agirem em um espaco vetorial real ( n ), nao podemos aplicar o
teorema espectral a`s matrizes ortogonais, tal como fizemos na prova da Proposicao 13.9. Por isso, um
desvio mais longo devera ser seguido, ainda que as conclusoes sejam as mesmas, em essencia.


Analogamente ao que fizemos no caso SU(n), comecemos com a seguinte observacao.


Proposi
c
ao 13.10 SO(n) e um subgrupo compacto de GL( , n).

Prova. A prova e uma mera imitacao da demonstracao correspondente no caso SU(n) e poupamo-nos
de reproduz-la.
Seja agora {R(t) SO(n), t }, um subgrupo uniparametrico de SO(n) (ou seja, R(0) = e
R(t)R(t0 ) = R(t+t0 )). Pela Proposicao 14.5, pagina 782, R(t) = exp(tA) para alguma matriz A. Agora,
sejam u, v dois vetores arbitrarios de n . Temos que, para todo t vale hu, vi = hR(t)u, R(t)vi .
Diferenciando essa igualdade em relacao a t, escrevendo-se R(t) = exp(tA) e calculando a derivada em
t = 0, tem-se 0 = hAu, vi + hu, Avi , ou seja, hu, (A + AT )vi = 0. Como isso vale para todo u, v
em n , segue que AT = A. Assim, A e uma matriz anti-simetrica, o que implica que seus elementos
diagonais sao nulos. Assim, e automatico que Tr(A) = 0.


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

711/1304

Assim, vimos que os geradores dos subgrupos uniparametricos de SO(n) sao anti-simetricos. Podemos nos perguntar se a recproca e valida, ou seja, se todas as matrizes anti-simetricas sao geradores
de subgrupos uniparametricos de SU(n). Para responder isso, precisamos da seguinte proposicao:
Proposi
c
ao 13.11 Se A Mat ( , n) e anti-simetrica (ou seja, AT = A), ent
ao a matriz exp(A)
e um elemento de SO(n).
2


Prova. Precisamos provar que exp(A) e ortogonal e que seu determinante e igual a 1. Pela definicao da
exponencial de matrizes em termos de uma serie de potencias (a serie de Taylor da funcao exponencial),
sabe-se que exp(M )T = exp(M T ) para qualquer matriz n n real ou complexa M . Assim, exp(A)T =
exp(AT ) = exp(A) = exp(A)1 , provando que exp(A) e ortogonal.
Como observamos, Tr(A) = 0. Logo, para nossa matriz A, tem-se det(exp(A)) = exp(Tr(A)) =
exp(0) = 1, o que prova que exp(A) SO(n), como queramos.
Essa proposicao diz-nos que, se A Mat ( , n) e anti-simetrica, entao R(t) = exp(tA), t
e
um subgrupo uniparametrico de SO(n). Em resumo, conclumos que o conjunto de todas as matrizes
n n reais anti-simetricas e identico ao conjunto de todos os geradores de subgrupos uniparametricos
de SO(n).


Como SO(n) e um subgrupo fechado de GL( , n), segue do Teorema 14.1 que o conjunto de seus
geradores e uma algebra de Lie. Essa algebra de Lie e dita ser a a algebra de Lie de SO(n), e e denotada
por so(n). Como vimos, so(n) coincide com o conjunto de todas as matrizes n n reais anti-simetricas.


De passagem, notemos que o fato de que o conjunto de todas as matrizes n n reais anti-simetricas
forma uma algebra de Lie real ja fora visto independentemente nos exerccios da pagina 58.

Provemos agora uma outra proposicao, a qual essencialmente diz-nos que todo elemento de SO(n)
pode ser obtido como exponencial de um elemento de so(n). Nos casos de SO(2) e SO(3) isso foi
provado explicitamente nas paginas acima.
Proposi
c
ao 13.12 Todo elemento R de SO(n) pode ser escrito na forma R = e A , onde A Mat ( , n)
e anti-simetrica (ou seja, AT = A).
2


Prova. Como dissemos nao podemos aqui seguir exatamente os passos da prova da Proposicao 13.9,
pois o teorema espectral nao se aplica de modo direto a matrizes reais.
Seja R SO(n), com elementos de matriz reais Rij . Normalmente R age no espaco real n , mas
podemosP
faze-la agir em n da maneira usual: para um vetor u n com componentes ui , tem-se
(Ru)i = nj=1 Rij uj . Como tal, R e uma matriz unitaria de determinante 1, ou seja, um elemento de
SU(n), pois (R )ij = (R)ji = (R)ji = (RT )ij = (R1 )ij . Aqui usamos que os Rij sao reais e o fato obvio
(por que?) que a inversa de R em n e a mesma que em n .


Dado que R e unitaria, seus autovalores sao n


umeros eventualmente complexos mas de modulo 1.
Notemos, porem, que os autovalores sao razes do polinomio caracterstico p(x) = det(x R), x .
um fato elementar e bem conhecido que
Como os Rij sao reais, esse polinomio tem coeficientes reais. E
se x e raiz de um polinomio com coeficientes reais, entao seu complexo conjugado x tambem o e.

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

712/1304

Se n e par, os autovalores sao, portanto, pares de n


umeros complexos de modulo 1 complexoconjugados: ei e ei . Como o determinante de R e o produto de seus autovalores, isso automaticamente garante que det(R) = 1 desde que 1, se for autovalor, o seja com multiplicidade algebrica
par.
Se n e mpar, os autovalores sao pares de n
umeros complexos de modulo 1 complexo-conjugados:
ei , mas um deles pode ser real, podendo, portanto, ser 1. Como o determinante de R e o produto
de seus autovalores, a condicao det(R) = 1 implica que um dos autovalores deve ser +1 e que 1, se
for autovalor, o e com multiplicidade algebrica par.
Em resumo:
1. Se n e par, o conjunto de autovalores de R e do tipo {eik , k = 1, . . . , n/2, sendo k


}.

2. Se n e mpar, o conjunto de autovalores de R e do tipo {1}{eik , k = 1, . . . , (n1)/2, sendo k


}.


Em ambos os casos 1 pode ser autovalor e, se o for, o e com multiplicidade algebrica par.
Seja o autovalor eik . Ha dois casos a considerar.

Caso I. eik 6= 1, de modo que eik e nao-real e, portanto, distinto de eik .

Seja vk n um autovetor de R com autovalor eik : Rvk = eik vk , normalizado de modo que
kvk k2 = hvk , vk i = 1. Segue que Rvk = eik vk , ou seja, vk e um autovetor de R com autovalor
eik . Como R e unitaria, segue que autovetores que correspondem a autovalores distintos sao ortogonais
(em n ). Logo,


hvk , vk i


= 0

e, portanto,

hvk , vk i


= hvk , vk i


= 0.

(13.58)

Escrevamos vk separando componente a componente suas partes real e imaginaria: v k = ak + ibk ,


com ak , bk n . As relacoes Rvk = eik vk e Rvk = eik vk tornam-se


Rak = (cos k )ak ( sen k )bk ,

Rbk = ( sen k )ak + (cos k )bk .


Note-se que, como sen k 6= 0, essas duas relacoes implicam que nao se pode ter ak = 0, pois isso
implicaria bk = 0 e vice-versa. Porem, ak e bk sao vetores ortogonais em n . De fato,


hak , bk i


=
=
=

1 k
h(v + vk ), (vk vk )i
4

1 k k
hv , v i hvk , vk i + hvk , vk i hvk , vk i
4

1 k k
hv , v i hvk , vk i + hvk , vk i hvk , vk i
4


1
(0 1 + 1 0)
4

0.

por (13.58)

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

713/1304

k
k
Assim, conclumos que no
 sub-espaco realgerado pelos vetores ortogonais nao-nulos a e b , a
cos k
sen k
matriz R age como a matriz
, elemento de SO(2).
sen k cos k

importante notar tambem que os vetores ak e bk sao tambem ortogonais entre si para ks difeE
rentes. Isso e mostrado na proposicao seguinte.

Proposi
c
ao 13.13 Se vj = aj + ibj e vk = ak + ibk s
ao vetores de
j
k
k
j
valerem hv , v i = 0 e hv , v i = 0, ent
ao tem-se


com aj , ak , bj , bk

n


e se

haj , ak i


= haj , bk i


= hbj , ak i


= hbj , bk i

= 0.


2
Prova. De hvj , vk i = 0 segue facilmente que


haj , ak i + hbj , bk i


= 0


hbj , ak i haj , bk i

hbj , ak i + haj , bk i

= 0.

Como vj = aj ibj , tem-se de hvj , vk i = 0 que




haj , ak i hbj , bk i


= 0

= 0.

Disso, o resultado desejado segue imediatamente.


j
j
O fato demonstrado nessa proposicao mostra que os sub-espacos gerados por pares
 a , b sao ortogo
cos j
sen j
n
nais em
.
. Na base formada por esses vetores, R tem a forma de blocos diagonais
sen j cos j
Resta-nos ainda discutir o que se passa com os autovalores reais.


Caso II. eik = 1.

Como comentamos, o autovalor 1 tem multiplicidade algebrica par em n . Como R e unitaria


em n , R e simples (vide definicao a` pagina 152), conclumos que a multiplicidade geometrica desse
autovalor em n e igualmente par. Os autovalores reais de R correspondem a autovetores reais (por
que?). Assim, ha um sub-espaco real de dimensao par onde R age como . Como a dimensao e par,

cos j
sen j
podemos escrever R nesse sub-espaco como uma serie de blocos diagonais como
,
sen j cos j
mas para j = .
Para o autovalor +1 a conclusao e a mesma, exceto que se n for mpar a multiplicidade
geometrica


cos j
sen j
e mpar. Assim, R age nesse sub-espaco como uma serie de blocos diagonais como
,
sen j cos j
mas para j = 0 e um bloco 1 1 com elemento de matriz 1.

A conclusaosao e a seguinte: para R SO(n) existe uma matriz ortogonal 14 V tal que R = V BV 1 ,
onde B e a seguinte matriz: quando n e par, ou seja, n = 2m, para algum m > 0 inteiro, B e a matriz
14
A matriz e ortogonal pois faz a mudanca de base para a base dos vetores a j , bj e dos autovetores de autovalor 1,
os quais s
ao todos ortogonais entre si, como provamos acima. Um fato crucial, como se ve.

JCABarata. Curso de Fsica-Matem


atica

bloco-diagonal dada por

cos 1
sen 1
sen 1 cos 1

B =

..

cos 2
sen 2
sen 2 cos 2
..

Captulo 13

Vers
ao de 29 de setembro de 2005.

714/1304

cos m
sen m
sen m cos m

(13.59)

que e formada por m = n/2 blocos 2 2, como indicado acima, sendo os demais elementos de matriz
nulos. Quando n e mpar, ou seja, n = 2m + 1, para algum m > 0 inteiro, B e a matriz bloco-diagonal
dada por

cos 1
sen 1

0
0

sen 1 cos 1

cos 2
sen 2

0
0
0

sen 2 cos 2

B =
(13.60)
..
.. ,
.
.

.
.
.

cos

sen

m
m

0
0
0

sen m cos m

0
0

0
1
que e formada por m = (n 1)/2 blocos 2 2, como indicado acima, sendo o elemento B nn igual a 1,
e os demais elementos de sao matriz nulos.
Definamos agora (tanto para o caso em que n e par ou mpar)

R
.
Jk :=
k
1 ==m =0

claro que cada Jk e a matriz anti-simetrica composta pelo bloco 0 1 colocado na k-esima posicao,
E
1 0
os demais elementos de matriz sendo iguais a zero. Deve ser tambem claro que Jk Jl = Jl Jk para todos
k, l = 1, . . . , m e que
B = exp (1 J1 + + m Jm ) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

715/1304

E. 13.50 Exerccio. Complete os detalhes.

Do comentado acima, temos entao que R = V BV 1 = exp (A) , onde


A := V (1 J1 + + m Jm ) V 1 .

Agora, como V e ortogonal e as Jk sao anti-simetricas, e elementar verificar que AT = A. Isso


completa a prova da Proposicao 13.12.
A Proposicao 13.12 diz-nos que a exponenciacao e uma aplicacao sobrejetora de so(n) em SO(n).
Isso e um caso particular de um teorema mais geral que diz que isso e valido para qualquer grupo de
Lie compacto, conexo e cuja algebra de Lie seja de dimensao finita.
A Proposicao 13.12 tem os dois seguintes corolarios simples:
Corol
ario 13.2 Para n mpar existe para cada R SO(n) um vetor ~

n


tal que R~ = ~ .

O vetor ~ e o autovetor com autovalor 1. Se n e par pode nao haver um tal vetor invariante. Esse
corolario, junto com a Proposicao 13.12, generaliza a Proposicao 13.5, que era restrita ao caso SO(3).
Corol
ario 13.3 O grupo SO(n) e conexo por caminhos e, portanto, e conexo.

Prova. Pelo que vimos, se R SO(n), R e da forma R = eA , para alguma A so(n). Logo R
pertence ao subgrupo uniparametrico de SO(n) gerado por A: {exp(tA), t }. Esse subgrupo
conecta continuamente U a` identidade (que corresponde a t = 0).


13.5

O Grupo Afim e o Grupo Euclidiano

Seja V um espaco vetorial (que, lembremos, e um grupo Abeliano em relacao a` operacao de adicao
de vetores). Vamos denotar por GL(V ) o conjunto dos operadores lineares bijetores (e, portanto,
invertveis) de V em V . Tambem sabemos que GL(V ) e um grupo.
Existe uma acao a` esquerda natural de GL(V ) em V , a saber : GL(V ) V V dada por
(M, v) := M v onde M GL(V ) e v V . (Mostre que isso define uma acao a` esquerda).

Dessa forma podemos definir o produto semi-direto de GL(V ) e V , denotado por GL(V )s V ou
simplesmente por GL(V )sV , definindo em GL(V ) V o produto
(M, u) (M 0 , u0 ) := (M M 0 , M u0 + u) ,

onde M, M 0 GL(V ) e u, u0 V . (A nocao de produto semi-direto de dois grupos foi definida a`


pagina 73).
GL(V )sV e denominado o grupo afim do espaco vetorial V .
Se G for um subgrupo de GL(V ), o produto semi-direto GsV e definido analogamente (M, u)
evidente que GsV e um subgrupo
(M , u0 ) := (M M 0 , M u0 + u) , onde M, M 0 G e u, u0 V . E
de GL(V )sV .
0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

716/1304

E. 13.51 Exerccio. Mostre que o conjunto de translacoes puras formado pelos pares ( , v), v V e
um subgrupo normal de GL(V )sV . Sugestao: basta mostrar que trata-se de um subgrupo Abeliano. 6
E. 13.52 Exerccio. Se G e um subgrupo normal de GL(V ), mostre que GsV e um subgrupo normal
de GL(V )sV .
6
E. 13.53 Exerccio. Se G e um subgrupo de GL(V ), mostre que V 3 u 7 Ru+v, para (R, v) GsV ,
define uma acao `a esquerda de GsV em V .
6

Consideraremos dois exemplos importantes, o grupo Euclidiano15 e o grupo de Poincare16 o qual


sera tratado na Secao 13.7.
O Grupo Euclidiano
O chamado grupo Euclidiano em dimens
ao n e o grupo En := O(n)s

n


O grupo En tem uma acao natural em n dada por n 3 y 7 Ry + x, para cada elemento (R, x)
En . Assim, En implementa em n translacoes, rotacoes e reflexoes, as chamadas transformaco
es
n
Euclidianas de
. Essa e, em verdade, a propria motivacao da definicao de En .


E. 13.54 Exerccio. Mostre que


En em n .

n


Ha um subgrupo de GL(n + 1,

Entao, tem-se

E(R, x) :=

3 y 7 Ry + x, para (R, x) En , define uma acao `a esquerda de


6

) que e isomorfo a En . Sejam as matrizes reais (n + 1) (n + 1)

com R O(n) e x

E(R, x) E(R0 , x0 ) := E(RR0 , Rx0 + x) .


E. 13.55 Exerccio importante. Mostre isso.

Assim, o conjunto de matrizes {E(R, x) GL(n + 1, ), com R O(n) e x n } forma um subgrupo de GL(n + 1, ) que e isomorfo a En . Tambem denotaremos esse grupo por En .


ltima afirmativa.
E. 13.56 Exerccio. Prove essa u
Os Geradores do Grupo Euclidiano E3
15
16

Euclides de Alexandria ( 325 A.C, 265 A.C.).


Jules Henri Poincare (1854-1912).

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

717/1304

possvel identificar os seguintes sub-grupos uniparametricos


De particular interesse e o caso n = 3. E
de E3 , aqueles gerados pelas matrizes E(Rj , 0), j = 1, 2, 3, onde Rj sao as matrizes introduzidas em
(13.28) e que geram sub-grupos uniparametricos de SO(3) e aqueles gerados pelas matrizes E( , x k ),
k = 1, 2, 3, onde x1 = (x, 0, 0), x2 = (0, x, 0) e x3 = (0, 0, x) com x . Esses subgrupos geram
translacoes nas direcoes k = 1, 2, 3.


E. 13.57 Exerccio importante. Mostre que esses seis subgrupos sao subgrupos uniparametricos.

Como facilmente se verifica, os geradores desses subgrupos sao as seguintes matrizes:

0
0

0
0
J1
J2
J3

,
j
:=
,
j
:=
j1 :=
2
3
0
0

0 0 0
0 0 0
0 0 0
0
0

p1 :=

1
0
0

0 0 0

p2 :=

0
1
0

0 0 0

p3 :=

0
0
0
0

0
0
1

0 0 0

sendo que J1 , J2 e J3 sao os geradores de SO(3), definidos em (13.29)-(13.31), pagina 693. Usando a
forma das matrizes Jk dada em (13.29)-(13.31), e facil constatar as seguintes relacoes de comutacao
entre os geradores acima:
[ja , jb ] =

3
X

abc jc ,

[pa , pb ] = 0 ,

c=1

[ja , pb ] =

3
X

abc pc .

(13.61)

c=1

E. 13.58 Exerccio. Verifique!

As relacoes (13.61) representam as relacoes de comutacao da algebra de Lie e 3 do grupo E3 . Note


que p1 , p2 e p3 formam uma sub-algebra Abeliana de e3 e que essa sub-algebra e um ideal de e3 . Esse
fato reflete a propriedade que o subgrupo de translacoes e um subgrupo normal de E3 .
Os Geradores do Grupo Euclidiano E2
De maneira analoga podemos tratar o caso (mais simples) do grupo E2 . Os elementos de SO(2)s
podem ser parametrizados na forma

cos sen x1
sen cos x2 ,
(, ], x1 , x2 .
0
0
1


Seus geradores serao

0 1 0
j1 := 1 0 0 ,
0 0 0

0 0 1
p1 := 0 0 0 ,
0 0 0

0 0 0
p2 := 0 0 1 .
0 0 0

2


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

718/1304

Como e facil de verificar, as relacoes de comutacao entre esses geradores sao


[j1 , p2 ] = p1 ,

[j1 , p1 ] = p2 ,

[p1 , p2 ] = 0.

Um elemento generico dessa algebra de Lie e da forma

I(J, t) :=

onde
J = j1 =

0
0

 
t1
t = t 1 p1 + t 2 p2 =
t2

com < e t1 , t2 .
um exerccio facil (faca-o) constatar que para todo k
E



I(J, t)k = I Jk , Jk1 t .

Conseq
uentemente, vale que

exp (I(J, t)) =

, k 1, tem-se


1
I Jk , Jk1 t =
+

k!

k=1

X
1
I(J, t)k =
+
k!
k=1

onde
J

R := e =

cos sen
sen cos

t0

R
0

t0 = f (J)t ,

sendo f a funcao analtica inteira definida pela serie de Taylor

X
1 k1
w ,
f (w) := 1 +
k!
k=2

facil constatar que


E

w
e 1

, w 6= 0
w
f (w) =

1,
w=0

(13.62)

A matriz f (J) pode ser calculada facilmente usando-se o fato que




0 1
1 0

2k

= (1)

0 1
1 0

2k+1

= (1)


0 1
,
1 0

k


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

719/1304

de onde se extrai
f (J) :=

X
1 k1
J
+
k!
k=2

X
1
1
2m1
+
J
+
J2m
(2m)!
(2m
+
1)!
m=1
m=1


 X

X
(1)m 2m1 0 1
(1)m 2m
=
+
1 0
(2m)!
(2m + 1)!
m=1
m=0

Notemos que



sen
cos 1 0 1
+
=
1 0

sen
cos 1

=
.
cos 1
sen

det f (J) = 2

1 cos
2

6= 0

 
x1
para < . Assim, f (J) e invertvel e se escolhermos t = f (J) x, para qualquer x =

x2
teremos

cos

sen

x
1
R
x


= sen cos x2 .
exp I(J, f (J)1 x) =

0
0
1
0
0
1
1

2


Isso prova que todo elemento do grupo SO(2)s 2 pode ser escrito como exponencial de um elemento
da sua propria algebra de Lie. Essa afirmacao e igualmente valida para todo os grupos SO(n)s n . A
demonstracao segue passos analogos aos de acima pois, como observamos na Secao 13.4.3, pagina 710,
os elementos de SO(n) podem ser escritos em uma base conveniente na forma de blocos de matrizes de
SO(2). Isso implicara que tambem no caso geral a matriz f (J) e invertvel. Deixamos os detalhes da
demonstracao como exerccio ao leitor.


13.6

O Grupo de Lorentz

Para a leitura desta secao uma certa familiaridade com os rudimentos da teoria da relatividade restrita
e recomendavel, mas nao totalmente indispensavel.

JCABarata. Curso de Fsica-Matem


atica

13.6.1

Captulo 13

Vers
ao de 29 de setembro de 2005.

720/1304

O Espa
co-Tempo, a No
c
ao de Intervalo e a Estrutura Causal

um fato elementar da natureza ser possvel descrever qualquer evento idealmente pontual e de duracao
E
instantanea por uma colecao de quatro n
umeros que especificam sua posicao espacial e seu instante de
tempo, medidos em algum sistema de referencia. A colecao de todos os eventos pontuais de duracao
instantanea, e denominada espaco-tempo, nocao introduzida por Minkowski 17 . Assim, e natural (pelo
menos na ausencia de campos gravitacionais, que podem alterar a topologia global do espaco-tempo)
identificar o mesmo com o espaco matematico 4 . Assim descrito, cada evento pode ser especificado
em um sistema de referencia que adote coordenadas espaciais cartesianas, por uma quadrupla ordenada
(x1 , x2 , x3 , x4 ), onde convencionamos que os tres primeiros n
umeros sao coordenadas espaciais do
evento e o u
ltimo sua coordenada temporal. O leitor deve ser advertido que muitos autores convencionam escrever as coordenadas espaco-temporais de um evento na forma (x0 , x1 , x2 , x3 ), onde x0 e
a coordenada temporal. Isso alteraria a forma das matrizes que serao manuseadas abaixo, mas nao a
essencia dos resultados que apresentaremos.


Na mecanica classica, a primeira lei de Newton18 afirma existirem certos sistemas de referencia
dotados da seguinte propriedade: se um corpo encontra-se isolado do restante do universo, ou seja,
se sobre ele nao atuam forcas externas, entao em relacao a esse sistema de referencia esse corpo se
move com velocidade constante. Tais sistemas de referencia sao denominados sistemas de referencia
muito facil concluir que se um sistema de referencia
inerciais, pois neles vale o princpio de inercia. E
se move com velocidade constante em relacao a um sistema de referencia inercial, entao ele e tambem
um sistema de referencia inercial.
Sistemas de referencia inerciais desempenham um papel central pois neles as Leis da Fsica assumem
um postulado fundamental da Fsica que suas leis basicas sao as mesmas em
um caracter universal. E
todos os sistemas de referencia inerciais. Na mesma linha, e um postulado fundamental da Fsica que
tambem suas constantes fundamentais, tais como a velocidade da luz c, a constante de Planck 19 ~, a
constante de gravitacao universal G e outras tenham tambem o mesmo valor em todos os sistemas de
referencia inerciais. Mais que isso, os sistemas de referencia inerciais concordam quanto a`s relacoes
de causa e efeito entre todos os eventos ocorridos no espaco-tempo. Essa serie de princpios aqui
mal-delineados e por vezes denominada princpio da relatividade. O princpio da relatividade tem sua
origem nos trabalhos de Galilei20 sobre a dinamica, mas foi com a Teoria da Relatividade de Einstein21
que suas reais conseq
uencias foram exploradas em sua maxima extensao.
Ao realizarmos transformacoes entre sistemas de coordenadas inerciais, as coordenadas dos eventos transformam-se linearmente. Esse postulado e familiar se nos lembramos da acao do grupo de
translacoes, da acao do grupo de rotacoes no espaco tridimensional ou das transformacoes de Galilei da
mecanica classica (nao-relativista). Assim, cada transformacao entre sistemas de coordenadas inerciais
deve ser representada na forma Lx + t, onde L e uma matriz real 
4 4 e x e t sao vetores de 4 . Aqui,


x e t sao representados na forma de um vetor coluna, como x =

x1
x2
x3
x4

O vetor t representa uma translacao (tanto no espaco quanto no tempo) entre os sistemas de

17

Hermann Minkowski (1864-1909). A express


ao espaco-tempo provem do alem
ao Raumzeit.
Isaac Newton (1643-1727).
19
Max Karl Ernst Ludwig Planck (1858-1947).
20
Galileu Galilei (1564-1642).
21
Albert Einstein (1879-1955).
18

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

721/1304

coordenadas. Cada matriz L Mat ( , 4) deve depender das velocidades relativas entre os sistemas
inerciais cuja transformacao descreve, da direcao dessas velocidades e dos angulos relativos entre os
eixos cartesianos espaciais dos dois sistemas. L deve tambem conter informacao sobre se os eixos
cartesianos espaciais dos dois sistemas tem a mesma orientacao (positiva ou negativa) e sobre se os
relogios dos dois sistemas correm na mesma direcao.


Dados dois eventos quaisquer x, y no espaco-tempo (que doravante identificaremos com 4 ) e cujas
coordenadas sejam x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) em um determinado sistema de referencia
inercial, define-se o intervalo entre ambos como sendo a quantidade22


I(x, y) = I(x y) := (x1 y1 )2 + (x2 y2 )2 + (x3 y3 )2 c2 (x4 y4 )2 ,


onde c e a velocidade da luz no sistema de referencia inercial em questao.
A nocao de intervalo entre eventos e de grande importancia. Para comecar a explicar isso consideremos a situacao na qual dois eventos distintos x e y representam a producao e a absorcao de um mesmo
raio luminoso, respectivamente. Se em um determinado sistema de referencia inercial as coordenadas
desses eventos sao x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ), entao a velocidade de propagacao da luz
entre x e y satisfaz
(y1 x1 )2 + (y2 x2 )2 + (y3 x3 )2
c2 =
(y4 x4 )2

e, portanto, I(y, x) = I(y x) = 0. Um dos postulados fundamentais da teoria da relatividade restrita


e a afirmacao que a velocidade de propagacao da luz no vacuo e a mesma para qualquer sistema de
referencia inercial. Portanto, se em um outro sistema de referencia inercial as coordenadas de x e y
fossem x0 = (x01 , x02 , x03 , x04 ) e y 0 = (y10 , y20 , y30 , y40 ) teramos igualmente
c2 =

(y10 x01 )2 + (y20 x02 )2 + (y30 x03 )2


(y40 x04 )2

e, portanto, tem-se igualmente I(y 0 , x0 ) = I(y 0 x0 ) = 0 com o mesmo valor c para a velocidade de
propagacao da luz.
Compreendemos entao que o postulado da constancia da velocidade da luz pode ser traduzido matematicamente da seguinte forma: se o intervalo entre dois eventos e nulo em um sistema de referencia
inercial ent
ao e tambem nulo em todos os demais sistemas de referencia inerciais. Mais adiante provaremos que, sob certas hipoteses fsicas adicionais, esse fato implica uma condicao ainda mais geral
de invariancia: o intervalo entre dois eventos quaisquer e o mesmo em qualquer sistema de referencia
inercial, mesmo quando nao e nulo.
Nota.
Independente de ser um postulado te
orico, a const
ancia da velocidade da luz e um fato experimental que tem sofrido sucessivas
confirmaco
es ao longo de v
arias decadas. Para uma lista possivelmente parcial de referencias recentes (das u
ltimas quatro decadas) contendo
testes experimentais da const
ancia da velocidade da luz e testes da velocidade da luz como velocidade limite, vide:
1. T. S. Jaseja, A. Javan, J. Murray and C. H. Townes. Test of Special Relativity or of the Isotropy of Space by Use of Infrared Masers.
Phys. Rev. A133, A1221-A1125 (1964).
2. T. Alv
ager, F. J. M. Farley, J. Kjellman and I. Wallin. Test of the Second Postulate of Special Relativity in the GeV Region. Phys.
Lett. 12, 260-263 (1964).
22

Novamente supomos a ausencia de campos gravitacionais, em cuja presenca a definica


o de intervalo tem que ser
modificada.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

722/1304

3. D. I. Blotkhintsev. Basis for Special Relativity Theory Provided by Experiments in High Energy Physics. Sov. Phys. Uspekhi, 9,
405 (1966).
4. Z. G. T. Guiragossi
an, G. B. Rothbart, M. R. Yearian, R. A. Gearhart and J. J. Murray. Relative Velocity Measurements of Electrons
and Gamma Rays at 15 GeV. Phys. Rev. Lett. 34, 335-338 (1975).
5. K. Brecher. Is the Speed of Light Independent of the Velocity of the Source?. Phys. Rev. Lett. 39, 1051-1054, 1236(E) (1977).
6. D. Newman, G. W. Ford, A. Rich and E. Sweetman. Precision Experimental Verification of Special Relativity. Phys. Rev. Lett.
40, 1355-1358 (1978).
7. K. M. Baird, D. S. Smith and B. G. Whitford. Confirmation of the Currently Accepted Value 299 792 458 Metres per Second for
the Speed of Light. Opt. Comm. 31, 367-368 (1979).
8. G. L. Greene, M. Scott Dewey, E. G. Kessler, Jr. and E. Fischbach. Test of Special Relativity by a Determination of the Lorentz
Limiting Velocity: Does E = mc2 ?. Phys. Rev. D 44, R2216-R2219 (1991).
9. Bradley E. Schaefer. Severe Limits on Variations of the Speed of Light with Frequency. Phys. Rev. Lett. 82, 4964 (1999).
Para um texto recente, vide [140]23 .

Notemos que o intervalo depende da diferenca x y. Assim, translacoes entre sistemas de referencia automaticamente mantem invariantes os intervalos entre eventos. Por essa razao vamos por
ora interessar-nos apenas por transformacoes entre sistemas de referencia que sejam do tipo Lx, com
L Mat ( , 4).


Para prosseguirmos precisamos introduzir uma importante classificacao de intervalos.

Intervalos de Tipo Luz, de Tipo Tempo e de Tipo Espa


co
Em um sistema de referencia, dois eventos distintos x e y sao ditos ser24
1. do tipo luz se I(x, y) = 0,
2. do tipo tempo se I(x, y) < 0,
3. do tipo espaco se I(x, y) > 0.
Se dois eventos distintos x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) sao do tipo luz, entao
(y1 x1 )2 + (y2 x2 )2 + (y3 x3 )2
= c2 .
2
(y4 x4 )

Se dois eventos distintos x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) sao do tipo tempo, entao


(y1 x1 )2 + (y2 x2 )2 + (y3 x3 )2
< c2 .
(y4 x4 )2
Se dois eventos distintos x = (x1 , x2 , x3 , x4 ) e y = (y1 , y2 , y3 , y4 ) sao do tipo espaco, entao
(y1 x1 )2 + (y2 x2 )2 + (y3 x3 )2
> c2 .
2
(y4 x4 )
Com isso entendemos que
23

Agradecemos a
` Profa. Renata Zukanovich Funchal pelas referencias acima.
As express
oes em ingles s
ao light-like, time-like e space-like, respectivamente. Essa nomenclatura provem do
alem
ao: lichtartig, zeitartig e raumartig.
24

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

723/1304

1. Se dois eventos sao separados por um intervalo do tipo luz pode haver um sinal conectando ambos
e que se propagaria com a velocidade da luz.
2. Se dois eventos sao separados por um intervalo do tipo tempo pode haver um sinal conectando
ambos e que se propagaria com velocidade menor que a da luz.
3. Se dois eventos sao separados por um intervalo do tipo espaco nao pode haver um sinal conectando
ambos, pois o mesmo se propagaria com velocidade maior que a da luz.
uma crenca da fsica atual que as partculas
A importancia dessas consideracoes e a seguinte. E
elementares (que compoem toda a materia do universo) nao podem mover-se com velocidade maior
que a da luz. Conseq
uentemente, se dois eventos sao separados por um intervalo do tipo espaco nao
pode haver nenhum processo fsico que, iniciando-se em um evento, influencie o outro. Diz-se entao que
esses eventos sao causalmente desconectados, ou seja, nao pode haver nenhuma relacao causal (isto e,
de causa e efeito) entre ambos. Por outro lado, se dois eventos sao separados por um intervalo do tipo
tempo entao pode haver alguma influencia causal entre ambos, por exemplo, atraves de uma partcula
ou corpo material que, movendo-se no espaco-tempo com velocidades inferiores a` da luz, parta de um
evento e influencie o outro. No caso de intervalos do tipo luz a situacao e a mesma mas, entao, a
eventual influencia de um no outro deve propagar-se com a velocidade da luz.
E. 13.59 Exerccio. Passe varios dias meditando sobre os paragrafos acima.

A Estrutura Causal. Transforma


co
es que Preservam a Estrutura Causal
Como se percebe, se aceitarmos a ideia que processos fsicos nao podem propagar-se com velocidades
superiores a` da luz, a nocao de intervalo estabelece as possveis relacoes de causalidade entre todos os
eventos do espaco-tempo, ao dizer quais eventos podem eventualmente influenciar-se (aqueles que sao
do tipo tempo ou do tipo luz um em relacao ao outro) e quais nao podem de forma alguma influenciar-se
(aqueles que sao do tipo espaco um em relacao ao outro).
uma crenca da Fsica atual que essas relacoes de causalidade devem ser as mesmas para todos os
E
sistemas de referencia inerciais, pois os mesmos descrevem as mesmas leis fsicas e devem perceber as
mesmas relacoes de causa e efeito entre os eventos que compoem o universo.
E. 13.60 Exerccio. Mais alguns dias de meditacao.

Com isso, podemos introduzir a seguinte definicao: dizemos que uma transformacao linear L, que
representa uma transformacao entre dois sistemas de referencia, preserva a estrutura causal do espacotempo se a mesma satisfizer todas as tres condicoes seguintes:
1. I(Lx, Ly) = 0 sempre que I(x, y) = 0,
2. I(Lx, Ly) < 0 sempre que I(x, y) < 0,
3. I(Lx, Ly) > 0 sempre que I(x, y) > 0.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

724/1304

Em palavras, L preserva o tipo de intervalo que separa todos os eventos do espaco-tempo, levando
todos os intervalos do tipo luz em intervalos do tipo luz, levando todos os intervalos do tipo tempo em
intervalos do tipo tempo e levando todos os intervalos do tipo espaco em intervalos do tipo espaco.
Notemos que a condicao que impoe que I(Lx, Ly) = 0 sempre que I(x, y) = 0 e a condicao da
invariancia da velocidade da luz (ja mencionada acima), mas as demais representam algo diferente: a
invariancia das relacoes de causalidade por mudanca de sistemas de referencia inerciais.
Um pouco mais abaixo exploraremos as conseq
uencias matematicas que essas imposicoes tem sobre
as transformacoes L e concluiremos que, sob as hipoteses acima (e sob uma hipotese adicional de
ausencia de dilatacoes), vale uma conseq
uencia mais forte, a saber, que I(Lx, Ly) = I(x, y) para
todos os eventos x e y. Assim, transformacoes que preservam a estrutura causal e nao envolvem
dilatacoes preservam o valor do intervalo entre dois eventos quaisquer do espaco-tempo.
Por fim, apenas a ttulo de ilustracao, exemplifiquemos como seria uma transformacao que preserva
os intervalos de tipo luz mas nao os demais, preservando, portanto, a velocidade da luz mas violando
a estrutura causal. Consideremos um espaco-tempo bidimensional, onde
 0 cada
 evento e descrito por
c
uma coordenada espacial x1 e uma temporal t. Seja a matriz L =
. O intervalo entre os
c1 0
 
x 
0
1
seria I(x, 0) = x21 c2 t2 . Porem, pela transformacao L teramos
e 0 =
eventos x =
t
0
 x   ct 
 0
x1
1
. Assim,
=
L
= 1
0
t
c

x1

I(Lx, L0) = (x01 )2 c2 (t0 )2 = c2 t2 x21 = I(x, 0).

Logo, como os intervalos I(Lx, L0) e I(x, 0) diferem por um sinal, teramos para quaisquer eventos x
ey
1. I(Lx, Ly) = 0 sempre que I(x, y) = 0,
2. I(Lx, Ly) < 0 sempre que I(x, y) > 0,
3. I(Lx, Ly) > 0 sempre que I(x, y) < 0.
Portanto, intervalos tipo luz seriam levados em intervalos tipo luz, mas intervalos tipo espaco seriam
levados em intervalos tipo tempo e vice-versa. Como se ve por esse exemplo, em transformacoes
que violam a estrutura causal deve haver algo como uma permutacao entre coordenadas espaciais e
temporais.
E. 13.61 Exerccio. Sao tais transformacoes fisicamente aceitaveis?

Dilata
co
es
Vamos agora discutir uma classe de transformacoes que preservam a estrutura causal: as dilatacoes.
Para , 6= 0, a matriz D() := simplesmente transforma cada x 4 em x, ou seja,

D() representa uma dilataca


o ou mudanca de escala das coordenadas espaco-temporais de eventos. E
2
evidente que I(D()x, D()y) = I(x, y), de modo que dilatacoes sao transformacoes lineares que
preservam a estrutura causal.


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

725/1304

Sao as dilatacoes aceitaveis enquanto mudancas de sistemas de referencia inerciais? Essa e uma
questao muito interessante e sutil e demanda uma certa discussao.
Claramente, mudancas de escala podem ocorrer naturalmente no caso de tratarmos de dois sistemas
de referencia que adotam sistemas metricos diferentes, como no caso em que um sistema mede distancias
em metros e um outro em jardas (mas de modo que as medidas de tempo em um e outro sejam
tais que ambos atribuem o mesmo valor numerico para c). Essas situacoes sao triviais e poderiam
ser contornadas se ambos os sistemas de referencia concordassem no uso de uma mesma escala de
distancias. Mas para que isso seja possvel e preciso que haja objetos fsicos, em repouso em ambos
os sistemas de referencia, que possuam as mesmas dimensoes. Poderamos, por exemplo, adotar como
unidade de distancia o tamanho medio do atomo de hidrogenio25 , ou o comprimento de onda de uma
linha de emissao de um certo atomo ou molecula, fixos em cada sistema de referencia.
Mas o que garante que o tamanho medio de um atomo de hidrogenio parado na Terra e o mesmo
que o de um atomo de hidrogenio parado em uma galaxia distante que se move em relacao a nos com
uma certa velocidade? A princpio, nada garante, mas a crenca que sistemas de referencia inerciais
descrevem a mesma fsica envolve tambem a crenca que certas escalas basicas de distancia e de tempo,
como o tamanho medio de um atomo em repouso, sao as mesmas em todos os sistemas de referencia
inerciais. Por exemplo, o tamanho medio do atomo de hidrogenio em repouso depende de propriedades
fsicas que regem a interacao entre o proton e o eletron que o constituem (a lei de Coulomb 26 ), das leis
da mecanica que regem seus movimentos (as leis da mecanica quantica), assim como dos valores das
cargas eletricas e das massas de repouso dessas partculas. Essas grandezas e leis devem ser as mesmas
em quaisquer sistemas de referencia inerciais.
Intimamente associada a isso esta a questao dos valores das massas de repouso das partculas
elementares. Isso se deve ao fato seguinte. A fsica quantica nos ensina que se m 0 e a massa de
repouso de uma partcula elementar, digamos um eletron, entao a quantidade ~/(m0 c) tem dimensao
de comprimento (verifique!). Esse e o chamado comprimento de onda Compton27 da partcula de massa
de repouso m0 . Assim, para qualquer partcula de massa de repouso m0 ha uma escala de distancia a
ela associada.
parte da crenca associada ao princpio da relatividade que as massas em repouso das partculas
E
elementares, como eletrons, quarks etc., sao as mesmas quer na Terra quer em uma galaxia distante que
se move em relacao a nos com velocidade constante. Ate onde se sabe, essa hipotese tem corroboracao
experimental, pois sua violacao levaria a conseq
uencias observacionais em relacao ao comportamento
da materia que nunca foram verificadas quer em observacoes astronomicas quer em experimentos com
aceleradores de partculas feitos na Terra. Como ~ e c sao constantes fsicas, devem tambem ser as
mesmas em quaisquer sistemas de referencia inerciais e, portanto, o comprimento de onda Compton
de, digamos, um eletron em repouso deve ser o mesmo em qualquer sistema de referencia inercial e com
ele poderamos estabelecer uma escala de distancias universal.
Em um universo em que nao houvessem escalas de distancia ou de massa naturais, como por exemplo
no caso de universos em que todas as partculas elementares tem massa nula e nao formam estados
25

A noca
o de tamanho medio de um a
tomo pode ser definida na mec
anica qu
antica, mas n
ao entraremos em detalhes
aqui.
26
Charles Augustin de Coulomb (1736-1806).
27
Arthur Holly Compton (1892-1962). Compton recebeu o premio Nobel de Fsica de 1927 for his discovery of the
effect named after him.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

726/1304

ligados (como atomos) que possuam alguma escala de distancia tpica, nao haveria maneira de sistemas
de referencia inerciais concordarem com escalas espaciais e temporais e, a, a inclusao de dilatacoes
seria inevitavel nas transformacoes entre sistemas de referencia. Esse nao e o caso do universo em que
vivemos, pois nele sabidamente habitam partculas massivas.
Assim, apesar de as dilatacoes satisfazerem a condicao de nao violarem a estrutura causal do
espaco-tempo, as mesmas nao devem ser consideradas como transformacoes legtimas de coordenadas
espaco-temporais entre sistemas de referencia inerciais no nosso universo, pois partimos da crenca que
esses sistemas podem sempre concordar quanto a certas escalas basicas de certos objetos fsicos em
repouso, tais como as massas de repouso de certas partculas elementares e seus comprimentos de onda
Compton.
E. 13.62 Exerccio. Mais meditacao.

A Conven
c
ao que c = 1
Daqui por diante adotaremos a convencao simplificadora que c = 1. Isso pode ser obtido pela
escolha de um sistema de unidades metricas conveniente. Essa convencao, muito empregada atualmente em textos de fsica teorica28 , tem a vantagem de limpar as expressoes matematicas de fatores
que dependam de c. Admitidamente, ha uma certa preguica na adocao dessa convencao, mas a
mesma traz vantagens. De qualquer forma, os fatores c omitidos podem ser facilmente recuperados por
consideracoes de analise dimensional.
Nota
c
ao Matricial. A M
etrica de Minkowski
muito conveniente escrever o intervalo entre dois eventos x e y com uso da seguinte notacao
E
matricial:
I(x y) = (x1 y1 )2 + (x2 y2 )2 + (x3 y3 )2 (x4 y4 )2 = h(x y), (x y)i ,


onde

1 0
0 1
:= (3, 1) =
0 0
0 0

0 0

0 0
=

1 0

0 1

0
0
0
0 0 0

E. 13.63 Exerccio. Verifique.

(13.63)

A matriz e freq
uentemente denominada metrica de Minkowski.

13.6.2

A Invari
ancia do Intervalo

No que vimos acima, aprendemos que o postulado da invariancia da velocidade de propagacao da luz
quando de uma transformacao entre sistemas de referencia inerciais implica que se x e y sao dois eventos
28

Em textos te
oricos de mec
anica qu
antica e teoria qu
antica de campos, adota-se tambem ~ = 1.

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

727/1304

tais que
I(x, y) = h(x y), (x y)i


= 0

(13.64)

entao tem-se tambem


I(Lx, Ly) = hL(x y), L(x y)i


= 0

(13.65)

para qualquer transformacao linear L Mat ( , 4) que represente uma mudanca entre sistemas de
referencia inerciais.


Nesta secao iremos provar uma afirmacao, o Teorema 13.7, adiante, que generaliza ainda mais o
descrito no u
ltimo paragrafo, a saber, provaremos que se L Mat ( , 4) representa uma mudanca
entre sistemas de referencia inerciais que preserva a estrutura causal e n
ao envolve dilataco
es (definicoes
adiante) entao I(x, y) = I(Lx, Ly) para quaisquer eventos x e y, mesmo aqueles para os quais
I(x, y) 6= 0. Esse fato releva a importancia da nocao de intervalo na teoria da relatividade: o mesmo
representa uma grandeza invariante por transformacoes de sistemas de referencia do tipo descrito acima.
Dessa propriedade de invariancia extrairemos todas as informacoes importantes sobre as transformacoes
de Lorentz.


Transforma
co
es Lineares e a Estrutura Causal
Vamos aqui provar um teorema de importancia central no entendimento da relacao entre transformacoes L Mat ( , 4) e sua relacao com a estrutura causal do espaco-tempo.


Teorema 13.7 Seja L um elemento de Mat ( , 4) que representa uma mudanca entre sistemas de
referencia inerciais que preserva os intervalos de tipo luz. Ent
ao,

LT L = LT L 44 = | det(L)|1/2 .
(13.66)


Se alem disso L preserva a estrutura causal, ent


ao,

LT L = LT L 44

= | det(L)|1/2 .

(13.67)

Por fim, se L preserva a estrutura causal e n


ao envolve dilataco
es, ent
ao
LT L =

(13.68)

Uma conseq
uencia imediata dessa relaca
o e que I(Lx, Ly) = I(x, y) para todos x, y
Prova. Para x

4


4


, sejam as formas quadraticas

I(x) := hx, xi


J(x) := hLx, Lxi




= hx, LT Lxi .


bastante claro que


E
I(x) = (x4 )2 + k~xk2 = [x4 k~xk] [x4 + k~xk] ,
p
onde ~x = (x1 , x2 , x3 ) e k~xk = x21 + x22 + x23 . Por outro lado,


J(x) = LT L 44 (x4 )2 + a(~x)x4 + b(~x) = LT L 44 [x4 y1 (~x)] [x4 y2 (~x)] ,

(13.69)

(13.70)

JCABarata. Curso de Fsica-Matem


atica

onde29
a(~x) := 2

3
X

LT L

a=1

sendo que
LT L

44

4a

Captulo 13

Vers
ao de 29 de setembro de 2005.

xa ,

3
X

b(~x) :=

LT L

a, b=1

(y1 (~x) + y2 (~x)) = a(~x)

LT L

44

728/1304

xa xb ,

ab

y1 (~x)y2 (~x) = b(~x).

Sabemos por (13.64)-(13.65) (tomando y = 0) que se L preserva intervalos tipo luz, entao se tivermos
I(x) = 0 para algum x 4 , valera tambem J(x) = 0. Para ~x fixo qualquer, vemos por (13.69) e
(13.70) que tanto I(x) quanto J(x) sao polinomios de segundo grau em x4 e, pelo que acabamos de
comentar, tem os mesmos zeros. Dessa forma, tambem por (13.69) e (13.70), podemos sem perda de
generalidade escolher y1 (~x) = k~xk e y2 (~x) = k~xk.


Com isso teremos que

J(x) =
4

para todo x


LT L

44

(x4 k~xk)(x4 + k~xk) = LT L

. Pela definicao de I(x) e J(x) temos entao



hLx, Lxi = LT L 44 hx, xi .


para todo x

44

I(x)

(13.71)

, ou seja


 
hx, LT L + LT L 44 xi = 0

para todo x 4 . Como LT L + LT L 44 e uma matriz simetrica (verifique!), a Proposicao 2.5,

pagina 126, implica LT L + LT L 44 = 0. Como 2 = , segue que


LT L = LT L

44

(13.72)

Como det() = 1 e det(L) = det(LT ), obtemos ao tomar o determinante de ambos os lados da


igualdade acima que

 4
det(L)2 = LT L 44
de onde extramos que

LT L

Com (13.72), isso prova (13.66).

44

= | det(L)|1/2 .

(13.73)

Inserindo (13.73) em (13.71) teramos hLx, Lxi = | det(L)|1/2 hx, xi para todo x 4 .
Portanto, se L preserva a estrutura causal, apenas o sinal positivo e aceitavel. Assim, por (13.72),
temos nesse caso LT L = | det(L)|1/2 e isso completa a prova de (13.67).


Seja agora L o conjunto de todas as matrizes L0 Mat ( , 4) que satisfazem LT0 L0 = .


Afirmamos que se L satisfaz (13.67) entao L e da forma L = L0 com
e L0 L. De fato,
1
T
1
se L 6= 0 satisfaz (13.67) teremos para qualquer 6= 0 que ( L) ( L) = 2 | det(L)|1/2 e
escolhendo = | det(L)|1/4 conclumos que 1 L L.


29

Aqui usou-se que LT L

4a

= LT L

a4

pois LT L e simetrica, ou seja LT L

T

= LT L.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

729/1304

Assim, se L satisfaz (13.67), L e produto de uma transformacao de L com uma transformacao


D() = , , 6= 0. Se L nao envolve dilatacoes entao L L. Isso prova (13.68).


Como vemos, um papel especial e desempenhado pelas matrizes de L. Por toda nossa discussao
tais matrizes representam as transformacoes entre sistemas de referencia que respeitam a imposicao
fsica de preservar a estrutura causal e ignoram dilatacoes. Daqui por diante vamos nos concentrar
exclusivamente em tais transformacoes. Como veremos, o conjunto L introduzido acima tem a estrutura
de um grupo, um fato de grande importancia. Trata-se do chamado grupo de Lorentz, um objeto de
importancia central na teoria da relatividade.

13.6.3

O Grupo de Lorentz

O Teorema 13.7 acima diz-nos que se L Mat ( , 4) representa uma transformacao entre sistemas de
referencia inerciais que preserva a estrutura causal e nao envolve dilatacoes, entao L T L = , o que
equivale a dizer que L1 = LT . Isso tambem equivale a dizer que


hLx, Lyi


= hx, yi


para todos x, y 4 . Esse fato e a particular forma da matriz mostram que o conjunto de tais
matrizes L coincide com o grupo O(3, 1), que previamente definimos (vide pagina 684).


Devido a` sua grande importancia na fsica relativstica, o grupo O(3, 1) recebe denominacao especial,
a saber, e denominado grupo de Lorentz30 , em honra ao grande fsico holandes, pioneiro nos estudos da
teoria da relatividade. O(3, 1) e tambem denotado pelo smbolo L. Os elementos de L sao denominados
transformaco
es de Lorentz.
Equivalentemente, o grupo de Lorentz L = O(3, 1) e o grupo de todas as matrizes 4 4 que
satisfazem
L1 = LT .
Como todo elemento L do grupo de Lorentz satisfaz LLT = , tem-se det(LLT ) = 1, ou
seja, det(L)2 = 1 pois det(LLT ) = det(L) det()2 det(LT ), det() = 1 e det(L) = det(LT ). Assim,
det(L) = 1. O subconjunto SO(3, 1) de O(3, 1), formado pelas matrizes L que satisfazem det(L) = +1
e um sub-grupo, denotado tambem por L+ .
A seguinte proposicao sobre o grupo de Lorentz sera usada adiante:
Proposi
c
ao 13.14 Se L L ent
ao LT L.

Prova. Sabemos que para qualquer matriz M vale (M T )T = M e que para qualquer matriz invertvel
M vale (M T )1 = (M 1 )T (por que?). Se L L, tem-se por definicao que L1 = LT . Assim, como
T = , segue que
T
L1
= L,
ou seja,

LT

30

Hendrik Antoon Lorentz (1853-1928).

1

= LT

T

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

730/1304

que e o que se queria provar.

O Grupo de Poincar
e
Retornemos brevemente a`s transformacoes afins gerais que preservam intervalos e que, como vimos,
sao da forma Lx + t, com t 4 sendo uma translacao e L L. A composicao de duas de tais
transformacoes L0 x + t0 e Lx + t, e a transformacao L0 (Lx + t) + t0 = L0 Lx + L0 t + t0 .


Essa u
ltima expressao naturalmente conduz ao seguinte. Seja P := L 4 o conjunto de todos os
pares ordenados (L, t) com L L e t 4 . Entao P e um grupo com o produto definido por


(L0 , t0 ) (L, t) := (L0 L, L0 t + t0 ).


Como se ve, esse produto faz de P o produto semi-direto Ls
definido a` pagina 74.

4


. O produto semi-direto de grupos foi

E. 13.64 Exerccio. Verifique que o produto acima e de fato associativo. Identifique o elemento neutro
e determine a inversa de cada par (L, t) P.
6
Esse grupo, que combina transformacoes de Lorentz e translacoes, e denominado grupo de Poincare31 em homenagem ao eminente matematico frances que tambem foi um dos pioneiros da teoria da
relatividade32 . O grupo de Poincare e o grupo mais geral de transformacoes afins do espaco-tempo que
mantem os intervalos invariantes.
Mais adiante (pagina 742) vamos retornar ao grupo de Poincare para analisar sua estrutura enquanto
grupo de Lie. Antes, porem, precisamos nos concentrar plenamente no grupo de Lorentz.

13.6.4

Alguns Sub-Grupos do Grupo de Lorentz

Antes de e com o proposito de estudarmos a estrutura do grupo de Lorentz, vamos identificar alguns
de seus sub-grupos mais importantes.
Troca de Paridade e Revers
ao Temporal
As seguintes

1
0
P1 :=
0
0

31

matrizes sao elementos do grupo de Lorentz

0 0 0
1 0 0 0
0 1 0 0
1 0 0
,

P2 :=

0 0 1 0 ,
0 1 0
0 0 1
0 0 0 1

1
0
P3 :=
0
0

0 0 0
1 0 0
,
0 1 0
0 0 1

(13.74)

Jules Henri Poincare (1854-1912).


V
arios historiadores da ciencia apontaram para o fato que Poincare, assim como Lorentz, antecedeu Einstein em
alguns aspectos. Poincare foi o primeiro (em 1905, o ano da publicaca
o do trabalho seminal de Einstein, mas independente
deste) a estudar o car
ater de grupo das transformaco
es de Lorentz, tendo provado que toda transformaca
o de Lorentz e
combinaca
o de rotaco
es com um boost, fato que estabeleceremos no Teorema 13.8, mais adiante.
32

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

1 0
0 0
0 1 0 0
,
P :=
0
0 1 0
0
0
0 1

1
0
T :=
0
0

0
1
0
0

0 0
0 0
.
1 0
0 1

731/1304

(13.75)

E. 13.65 Exerccio importante. Verifique que as cinco matrizes acima sao membros do grupo de Lorentz,
ou seja, satisfazem LLT = .
6
As matrizes P , P1 , P2 e P3 implementam trocas de paridade, ou seja, reversao da orientacao dos
ao temporal, ou
eixos de coordenadas espaciais de pontos de 4 . A matriz T implementa uma revers
seja, inversao da coordenada temporal de pontos de 4 .
bastante evidente que (T )2 = (P )2 = (P1 )2 = (P2 )2 = (P3 )2 = e que P = P1 P2 P3 . As matrizes
E
T, P1 , P2 , P3 geram um sub-grupo do grupo de Lorentz que implementa reversoes temporais e de
paridade.


Os Sub-grupos Rot e SRot


Se R e uma matriz 4 4 da forma

R :=

r0

0
0
0

0 0 0

onde r0 e uma matriz 3 3 pertencente a O(3), entao e facil verificar que R e um elemento do grupo
de Lorentz, ou seja, satisfaz RRT = .
E. 13.66 Exerccio. Verifique isso, usando os fatos que r0 r0T = e que

(r0 )T
0

T
= R1 .
R :=
0

0 0 0
1

facil constatar que o conjunto das matrizes da forma de R acima forma um sub-grupo do grupo
E
de Lorentz. Esse sub-grupo sera designado aqui33 por Rot.
E. 13.67 Exerccio. Mostre que Rot e isomorfo ao grupo O(3): Rot ' O(3).
33

Essa notaca
o n
ao e uniforme na literatura.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

732/1304

Se R e da forma acima, e evidente tambem que det(R) = det(r0 ). Logo, Rot tem um sub-grupo
SRot de matrizes R com det(R) = 1 da forma

r0
0

R :=
0

0 0 0
1
onde r0 e uma matriz 3 3 pertencente a SO(3).

E. 13.68 Exerccio. Mostre que SRot e isomorfo ao grupo SO(3): SRot ' SO(3).

E. 13.69 Exerccio.
R = P R0 .

Mostre que se R Rot mas R 6 SRot entao existe matriz R 0 SRot com
6

E. 13.70 Exerccio.
R = P1 R00 .

Mostre que se R Rot mas R 6 SRot entao existe matriz R 00 SRot com
6

de


As matrizes de SRot implementam rotacoes puras (sem troca de paridade) nas coordenadas espaciais
4
.

Os Boosts de Lorentz
Um conjunto muito importante de matrizes de Lorentz e formado pelos chamados boosts 34 de
Lorentz na direcao 1. Tais matrizes sao da forma

(v) 0 0 v(v)

0
1 0
0
,
B1 (v) :=
(13.76)

0
0 1
0
v(v) 0 0 (v)
onde

(v) :=
e v (1, 1).

1
1 v2

E. 13.71 Exerccio muito importante. Verifique que as matrizes B1 (v) acima sao membros do grupo
de Lorentz, ou seja, satisfazem B1 (v)B1 (v)T = para todo v (1, 1).
6
Outro fato de grande importancia e o seguinte: o conjunto de todas as matrizes B 1 (v) com v
(1, 1) forma um sub-grupo do grupo de Lorentz, denominado sub-grupo dos boosts de Lorentz (na
direcao 1) e que designaremos aqui por B1 . Isso decorre do seguinte:
1. Para v = 0
B1 (0) =
34

Do ingles to boost: impulsionar, propelir, impelir, empurrar.

JCABarata. Curso de Fsica-Matem


atica

2. Para todo v (1, 1)

Captulo 13

Vers
ao de 29 de setembro de 2005.

733/1304

B1 (v)1 = B1 (v).

3. Para todos v, v 0 (1, 1)

B1 (v )B1 (v) = B1

v0 + v
1 + v0v

E. 13.72 Exerccio muito importante. Verifique essas tres afirmacoes.

(13.77)
6

Observe-se que o item 3, acima, esta intimamente associado a` regra relativista de composicao de
velocidades.
Segue tambem de (13.77) que B1 e um sub-grupo Abeliano: B1 (v 0 )B1 (v) = B1 (v)B1 (v 0 ) para todos
v 0 , v (1, 1).
E. 13.73 Exerccio.
6

Mostre que det(B1 (v)) = 1 para todo v (1, 1) e, portanto, B1 SO(3, 1).

Analogamente aos boosts de Lorentz na direcao 1, ha os boosts de Lorentz nas direcoes 2 e 3,


representados por matrizes como

1 0
0
0
1
0
0
0

0 1
0 (v) 0 v(v)
0
0

e
B
(v)
:=
B2 (v) :=
3
0 0 (v) v(v) . (13.78)

0
0
1
0
0 0 v(v) (v)
0 v(v) 0 (v)

Todas as afirmacoes feitas sobre as matrizes B1 tem seu correspondente analogo para as matrizes B2 e
B3 . Os respectivos sub-grupos sao aqui denotados por B2 e B3 .
Geometricamente as matrizes B2 (v) e B1 (v) estao relacionadas por uma matriz de rotacao de SRot
que implementa uma rotacao de /2 em torno do eixo 3:
B2 (v) = RB1 (v)RT ,
onde

E. 13.74 Exerccio. Verifique.

0 1 0 0
1 0 0 0

R =
0 0 1 0 SRot.
0 0 0 1
6

Analogamente, e possvel obter a matriz B3 (v) a partir de B1 (v) ou de B2 (v) atraves de rotacoes.
E. 13.75 Exerccio. Boosts de Lorentz em direcoes distintas nao comutam. Mostre, por exemplo, que
B1 (v)B2 (v 0 ) 6= B2 (v 0 )B1 (v), exceto se v = 0 ou v 0 = 0.
6
Adiante, em nosso estudo da estrutura geral do grupo de Lorentz, mostraremos o quao importantes
os boosts de Lorentz sao. A saber, mostraremos que toda matriz de Lorentz e obtida por uma sucessao

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

734/1304

de uma rotacao, um boost (na direcao 1, por exemplo) e eventualmente uma outra rotacao. Eventualmente trocas de paridade e inversoes temporais podem ocorrer tambem. A afirmacao precisa esta no
Teorema 13.8.

13.6.5

A Estrutura do Grupo de Lorentz

Antes de iniciar a leitura desta secao o leitor podera apreciar o estudo do grupo O(1, 1) iniciado a`
pagina 688.
Vamos aqui tentar caracterizar a forma geral de um elemento do grupo de Lorentz O(3, 1). Como
ja observamos, O(3, 1) possui um sub-grupo SRot ' SO(3) formado por matrizes da forma

r0
0

R :=
0

0 0 0
1

onde r0 e uma matriz 3 3 pertencente a SO(3).

Vamos no que segue demonstrar o seguinte teorema, que nos fornece a forma geral de toda matriz
L L e que e de importancia em todo estudo detalhado do grupo de Lorentz.
Teorema 13.8 Seja L um elemento do grupo de Lorentz O(3, 1). Como matriz 4 4, L e da forma

L11 L12 L13 L14


L21 L22 L23 L24

L =
(13.79)
L31 L32 L33 L34 .
L41 L42 L43 L44
Ent
ao vale uma das quatro afirmaco
es seguintes:

Ia. det(L) = +1, L44 +1 e L e da forma


L = Ra B1 (v) Rb ,
para algum v (1, 1) e para Ra , Rb SRot.
Ib. det(L) = +1, L44 1 e L e da forma

L = T P Ra B1 (v) Rb ,
para algum v (1, 1) e para Ra , Rb SRot.
IIa. det(L) = 1, L44 1 e L e da forma

L = T Ra B1 (v) Rb ,
para algum v (1, 1) e para Ra , Rb SRot.
IIb. det(L) = 1, L44 +1 e L e da forma

L = P Ra B1 (v) Rb ,
para algum v (1, 1) e para Ra , Rb SRot.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

735/1304

A demonstracao detalhada deste teorema encontra-se na Secao 13.A, pagina 754.


Dois Resultados sobre o Grupo de Lorentz
Proposi
c
ao 13.15 Se L e um elemento do grupo de Lorentz O(3, 1) e L1 e sua inversa, ent
ao tem-se
1
que (L )44 = L44 .
2
Prova. A prova e simples, pois sabemos que L1 = LT . Entao, usando-se a representacao (13.A.1) e
calculando-se explicitamente, tem-se

0
0

l
b

0
0

L
=

0
0

T
0 0 0 1
0 0 0 1
a
L44

lT

aT

L44

o que leva a` constatacao que (L1 )44 = L44 .

Proposi
c
ao 13.16 Se L e L0 s
ao dois elementos quaisquer do grupo de Lorentz O(3, 1) ent
ao tem-se
que
sinal((LL0 )44 ) = sinal(L44 )sinal(L044 ).
2
Prova. Sejam L e L0 duas transformacoes de Lorentz que, como em (13.A.1), representamos na forma
de blocos

L =

bT

L44

0
L =

l0

b0 T

a0

L044

(13.80)

Vamos formar o produto L00 = LL0 e estudar o sinal do elemento L0044 da matriz resultante. Pela regra
de produto de matrizes teremos
L0044 = L44 L044 + bT a0 .
E. 13.76 Exerccio. Verifique.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

736/1304

O produto de matrizes bT a0 representa tambem o produto escalar b a0 dos vetores b e a0 de


que?). Assim,
L0044 = L44 L044 + b a0 .

3


(por

(13.81)

Ha dois casos a considerar: o caso em que sinal(L44 ) = sinal(L044 ) e o caso em que sinal(L44 ) 6=
sinal(L044 ).
1. Caso em que sinal(L44 ) = sinal(L044 ).
Por (13.81) tem-se
L0044 L44 L044 |b a0 |.

Sabemos que b a0 = kbk ka0 k cos , onde kbk e o comprimento de b, ka0 k e o comprimento de a0 e e o
obvio, portanto, que |b a0 | kbk ka0 k (desigualdade
angulo que esses dois vetores formam entre si. E
de Cauchy). Assim,
L0044 L44 L044 kbk ka0 k.
(13.82)

Pela Proposicao 13.21, kbk = || e ka0 k = |0 |. Alem disso, L44 = 1 + 2 e L044 = 1 + 0 2 .


Assim, por (13.82),
p

L0044 1 + 2 1 + 0 2 || |0| > 0.


Portanto,

sinal(L0044 ) = +1 = sinal(L44 ) sinal(L044 ),

como queramos provar.


2. Caso em que sinal(L44 ) 6= sinal(L044 ).

Por (13.81) tem-se

L0044 L44 L044 + |b a0 |.

Sabemos que b a0 = kbk ka0 k cos , onde kbk e o comprimento de b, ka0 k e o comprimento de a0 e e o
obvio, portanto, que |b a0 | kbk ka0 k (desigualdade
angulo que esses dois vetores formam entre si. E
de Cauchy). Assim,
L0044 L44 L044 + kbk ka0 k.
(13.83)

Pela Proposicao 13.21, kbk = || e ka0 k = |0 |. Alem disso, L44 = 1 + 2 e L044 = 1 + 0 2 (pois
sinal(L44 ) 6= sinal(L044 )). Assim, por (13.83),
p

L0044 1 + 2 1 + 0 2 + || |0| < 0.


Portanto,

como queramos provar.

sinal(L0044 ) = 1 = sinal(L44 ) sinal(L044 ),

Os Sub-grupos Pr
oprio, Ort
ocrono e Restrito do Grupo de Lorentz
Os conjuntos de transformacoes de Lorentz que satisfazem as condicoes Ia, Ib, IIa ou IIb acima
sao obviamente conjuntos disjuntos. Nao e difcil mostrar (mas nao o faremos aqui) que cada um e
um conjunto conexo. Portanto, o grupo de Lorentz L = O(3, 1) possui quatro componentes conexas.
Seguindo a convencao, detonaremos essas quatro componentes da seguinte forma:

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

737/1304

1. L+ := {L L| det(L) = +1 e sinal(L44 ) = +1},


2. L := {L L| det(L) = 1 e sinal(L44 ) = +1},
3. L+ := {L L| det(L) = +1 e sinal(L44 ) = 1},
4. L := {L L| det(L) = 1 e sinal(L44 ) = 1}.
Note-se tambem que apenas L+ contem a identidade . L contem a operacao de troca de paridade
P . L+ contem a operacao de troca de paridade e inversao temporal P T . L contem a operacao de
inversao temporal T .
Os conjuntos L , L+ e L nao sao subgrupos de L. Porem, pelas Proposicoes 13.15 e 13.16, e
muito facil constatar as seguintes afirmacoes:
1. L+ e um sub-grupo de L, denominado grupo de Lorentz pr
oprio ort
ocrono ou grupo de Lorentz
restrito.
2. L := L+ L e um sub-grupo de L, denominado grupo de Lorentz ort
ocrono.
3. L+ := L+ L+ e um sub-grupo de L, denominado grupo de Lorentz pr
oprio.
4. L0 := L+ L e um sub-grupo de L, denominado grupo de Lorentz ort
ocoro.
Note-se que os elementos de ambos os conjuntos L+ e L+ satisfazem det(L) = 1. Portanto, o grupo
de Lorentz proprio L+ := L+ L+ coincide com SO(3, 1). Em L nao ocorrem reversoes temporais35 .
Note tambem que SRot e um sub-grupo de L+ .
A Relev
ancia de L+ , L e L+ na Fsica
uma crenca da Fsica atual que L+ representa uma simetria da natureza (na ausencia de campos
E
gravitacionais). Essa crenca nao se estende aos grupos L+ e L . O problema com esses u
ltimos grupos
e que os mesmos envolvem operacoes de troca de paridade (representada pela matriz P ) ou de reversao
temporal (representada pela matriz T ).
um fato bem estabelecido experimentalmente que nas chamadas interacoes fracas da fsica das
E
partculas elementares a troca de paridade (representada por matrizes como P ou P 1 ) nao e uma
transformacao de simetria da natureza.
No contexto da teoria quantica de campos e um fato teorico bem estabelecido que a chamada transformacao CPT36 e uma transformacao de simetria. Violacoes dessa simetria nao foram empiricamente
observadas na fsica as partculas elementares. Por isso, a constatacao que a simetria CP e violada,
fenomeno observado em certos processos da fsica das partculas elementares, indica fortemente que
35

Essa a raz
ao da uso da flecha apontando para cima no smbolo L , indicando que o tempo corre na mesma direca
o
nos sistemas de referencia inerciais transformados por L .
36
A chamada transformaca
o CPT envolve as operaco
es sucessivas de troca de carga, ou partcula-antipartcula, (denotada por C), de paridade (denotada por P) e de revers
ao temporal (denotada por T).

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

738/1304

a reversao temporal tambem nao seria uma simetria da natureza. Entretanto, evidencias experimentais diretas de que a simetria de reversao temporal e violada nao foram ainda encontradas, por serem
de difcil constatacao. Para mais informacoes a respeito de simetrias e suas violacoes na fsica das
partculas elementares, vide por exemplo [84] ou outros livros introdutorios sobre a fsica das partculas
elementares.
L+
e um Sub-grupo Normal de L
Vamos aqui provar a seguinte proposicao sobre L+ :
Proposi
c
ao 13.17 L+ e um sub-grupo normal do grupo de Lorentz.

Prova. Tudo o que temos que fazer e provar que se L L+ e G L, entao G1 LG L+ . Isso equivale
a provar que det(G1 LG) = 1 e que sinal((G1 LG)44 ) = 1.
Como det(L) = 1, tem-se obviamente que
det(G1 LG) = det(G1 ) det(L) det(G) = det(G1 ) det(G) = det(G1 G) = det( ) = 1.
Analogamente, pela Proposicao 13.16 vale
sinal((G1 LG)44 ) = sinal((G1 L)44 ) sinal(G44 ) = sinal((G1 )44 ) sinal(L44 ) sinal(G44 )
= sinal((G1 )44 ) sinal(G44 ) = sinal(G44 )2 = 1,
onde usamos a Proposicao 13.15 na pen
ultima igualdade. Isso completa a prova.
E. 13.77 Exerccio. Mostre que o grupo quociente L/L+ e isomorfo ao grupo gerado por P1 e T .

13.6.6

Os Geradores do Grupo de Lorentz

Os Geradores dos Boosts de Lorentz


Vamos reparametrizar os boosts de Lorentz B1 , B2 e B3 , introduzindo um novo parametro z =
arctanh v, ou seja v = tanh z, com < z < . Na literatura fsica, z e por vezes denominado
rapidez. Definindo Ba (z) = Ba (tanh z), a = 1, 2, 3, temos, explicitamente

cosh z 0 0 senh z
1
0
0
0

0
1 0
0
, B2 (z) := 0 cosh z 0 senh z ,
B1 (z) =

0
0 1
0
0
1
0
senh z 0 0 cosh z
0 senh z 0 cosh z

1
0
B3 (z) :=
0
0

0
0
0

1
0
0
.
0 cosh z senh z
0 senh z cosh z

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

739/1304

As relacoes de composicao (13.77) ficam


Ba (z)Ba (z 0 ) = Ba (z + z 0 ),

a = 1, 2, 3.

E. 13.78 Exerccio. Mostre isso usando (13.77) e a identidade bem conhecida tanh(x+y) =
Alternativamente, use a forma explcita das matrizes B a (z) dada acima.

tanh(x)+tanh(y)
.
1+tanh(x) tanh(y)

Como Ba (0) = , constatamos que {Ba (z), < z < }, a = 1, 2, 3, sao tres subgrupos
uniparametricos do grupo de Lorentz. Seus geradores sao


d
a = 1, 2, 3,
Ma :=
Ba (z) ,
dz
z=0
explicitamente dados

0 0
0 0
M1 =
0 0
1 0

por

0 1
0 0
,
0 0
0 0

0 0
0 0
M2 =
0 0
0 1

0 0
0 1
,
0 0
0 0

0
0
M3 =
0
0

0 0
0
0 0
0
.
0 0 1
0 1 0

(13.84)

tambem importante notar que


E
Ba (z) = exp(zMa )
para a = 1, 2, 3.
E. 13.79 Exerccio. Verifique isso usando as formas explcitas dos geradores M a dadas acima.

Os geradores de SRot
Alem dos boosts de Lorentz, consideremos tambem os tres sub-grupos
dados por

1
0
0
0
cos 2
0 cos 1 sen 1 0

R1 (1 ) =
R2 (2 ) =
0 sen 1 cos 1 0 ,
sen 2
0
0
0
1
0

uniparametricos de SRot
0 sen 2
1
0
0 cos 2
0
0

cos 3 sen 3
sen 3 cos 3
R3 (3 ) =

0
0
0
0

0
0
1
0

0
0
,
0
1

0
0
,
0
1

que representam rotacoes por angulos 1 , 2 e 3 (, ] no sentido horario em torno dos eixos
espaciais 1, 2 e 3, respectivamente. Em completa analogia com o grupo SO(3), seus geradores sao


d
,
a = 1, 2, 3.
Ra ()
Ja :=
d
=0

JCABarata. Curso de Fsica-Matem


atica

obvio que
E

onde Ja sao os geradores de

0 0 0
0 0 1
J1 =
0 1 0
0 0 0

Vers
ao de 29 de setembro de 2005.

Ja =

Ja

0
0
0

0 0 0

Captulo 13

740/1304

SO(3) dados em (13.29)-(13.31), pagina 693. Explicitamente, tem-se

0 1 0 0
0 0 1 0
0

0
J2 = 0 0 0 0 , J3 = 1 0 0 0 .
(13.85)

0 0 0 0
1 0 0 0
0
0 0 0 0
0 0 0 0
0

E. 13.80 Exerccio muito importante. Todo estudante tem que faze-lo ao menos uma vez na vida. Mostre que os geradores, Ma e Jb , com a, b = 1, 2, 3, satisfazem as seguintes relacoes de comutacao:
[Ja , Jb ] =

3
X

abc Jc ,

(13.86)

abc Jc ,

(13.87)

abc Mc .

(13.88)

k=1

[Ma , Mb ] =

[Ja , Mb ] =

3
X
k=1

3
X
k=1

claro de (13.86)-(13.88) que os seis geradores Ma e Jb formam uma algebra de Lie, a algebra de
E
Lie do grupo de Lorentz L+ . Sabemos que nao ha mais geradores independentes pois, como provamos,
todo elemento do grupo de Lorentz L+ e produto de boosts e rotacoes.
De (13.87) percebemos o fato notavel que os tres geradores dos sub-grupos de boost por si so nao formam uma algebra de Lie! Para tal, e preciso incluir os geradores dos sub-grupos de rotacao! Isso releva
uma relacao insuspeita, mas profunda, entre os boosts (que fisicamente representam transformacoes
entre sistemas de referencia inerciais com velocidades relativas nao-nulas) e as rotacoes espaciais, pois
indica que as rotacoes espaciais podem ser geradas a partir de boosts. Isso e uma caracterstica especial
da fsica relativista (vide a comparacao com o grupo de Galilei, abaixo) e esta relacionada a alguns
fenomenos fsicos, como a chamada precess
ao de Thomas, importante na discussao do chamado fator
giromagnetico do eletron. Vide qualquer bom livro sobre Mecanica Quantica Relativista (por ex. [114]).
Revisitando o Teorema 13.8

Como vimos no Teorema 13.8, pagina 734, toda L L+ e da forma L = Ra B1 (v)Rb , com
Ra , Rb SRot. Escrevendo v = tanh , ficamos com L = Ra B1 ()Rb ou, usando o gerador M1 , L =

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

741/1304

Ra exp(M1 )Rb . Isso, por sua vez pode ser reescrito como L = Ra exp(M1 )RaT R = exp(Ra M1 RaT )R,
onde R := Ra Rb SRot.
P
Vamos agora escrever Ra na forma Ra = exp(J), onde J = 3k=1 k Jk para certos k s reais. Pela
expressao (4.39), pagina 243 (vide tambem a serie completa em (4.38)), teremos
Ra M1 RaT = exp(J)A exp(J) = M1 + [J, M1 ] +

1
1
[J, [J, M1 ]] + [J, [J, [J, M1 ]]] + ,
2!
3!

sendo a serie do lado direito convergente. O fato importante a notar e que, por (13.88), os comutadores
m
ultiplos [J, [J, M1 ]] sao combinacoes lineares de M1 , M2 e M3 . A conclusao disso esta expressa
no seguinte teorema.
P
P
Teorema 13.9 Toda L L+ e da forma L = exp(M) exp(J), onde J = 3k=1 k Jk e M = 3k=1 k Mk ,
sendo que os k s e k s s
ao n
umeros reais.
2
A interpretacao desse teorema e que toda transformacao de Lorentz (de L + ) pode ser obtida como
uma rotacao (definida por exp(J) SRot) seguida de um boost em uma certa direcao (que e definida
pelas componentes de M).
Invertendo ordens na prova acima, o leitor se convence
facilmente que P
todo L L+ tambem pode
P
ser escrito como L = exp(J0 ) exp(M0 ), para outros J0 = 3k=1 k0 Jk e M0 = 3k=1 k0 Mk .
Por
o estudante do fato que, por (13.87), o conjunto das matrizes da forma

P3fim, 0 advertimos
, nao formam um subgrupo de L+ .
exp
k=1 ak Mk , ak


O Grupo de Galilei

E. 13.81 Exerccio. Mostre que as transformacoes de Galilei37 da mecanica classica podem ser representadas como um grupo de matrizes 4 4, da forma

v1

r0
v2

G(r0 , ~v ) :=
v3
,

0 0 0
1

onde r0 e uma matriz 3 3 pertencente a O(3) e vj (, ). Mostre que tais matrizes formam um
grupo de Lie, determinando tambem G(r0 , ~v )1 e a regra de produto G(r0 , ~v )G(r00 , ~v 0 ).
6
Determine seus tres sub-grupos de boost, seus tres sub-grupos de rotacao e os seis geradores desses
sub-grupos. Em seguida calcule as relacoes de comutacao desses seis geradores. Compare com o que
ocorre com o grupo de Lorentz.
E. 13.82 Exerccio. Constate que o grupo de Galilei e isomorfo ao grupo O(3)s
37

Galileu Galilei (1564-1642).

3


JCABarata. Curso de Fsica-Matem


atica

13.7

Vers
ao de 29 de setembro de 2005.

Captulo 13

742/1304

O Grupo de Poincar
e

O chamado grupo de Poincare (em 3+1 dimensoes) e definido como sendo o grupo P := O(3, 1)s 4 .
Seus elementos sao, portanto, pares ordenados (L, x) com L O(3, 1) e x 4 , sendo o produto
dado por (L, x) (L0 , x0 ) = (LL0 , Lx0 + x). Sua acao no espaco-tempo 4 e interpretada como uma
transformacao de Lorentz seguida de uma translacao.


Ha um subgrupo de GL( , 5) que e isomorfo a P. Sejam as matrizes reais 5 5

P (L, x) :=

Entao, tem-se

com L O(3, 1) e x

P (L, x) P (L0 , x0 ) := P (LL0 , Lx0 + x) .


E. 13.83 Exerccio importante. Mostre isso.
Assim, o conjunto de matrizes {P (L, x) GL( , 5), com L O(3, 1) e x
grupo de GL( , 5) que e isomorfo a P. Tambem denotaremos esse grupo por P.


4


6
} forma um sub-

ltima afirmativa.
E. 13.84 Exerccio. Prove essa u
O chamado grupo de Poincare pr
oprio ort
ocrono, denotado por P + e o grupo P+ := L+ s

4


6
.

Os Geradores do Grupo de Poincar


e
De maneira totalmente analoga ao que fizemos no grupo Euclidiano, podemos determinar os geradores do grupo P+ . Este possui 10 geradores. Seis da forma

mk :=

Mk

ou

jk :=

Jk

com k = 1, 2, 3,

onde Mk e Jk sao as matrizes 4 4 definidas em (13.84) e (13.85), respectivamente, e quatro da forma

pk :=

xk

com k = 1, . . . , 4,

JCABarata. Curso de Fsica-Matem


atica

onde


1
0

x1 :=
0 ,
0

Captulo 13

Vers
ao de 29 de setembro de 2005.


0
0

x4 :=
0 .
1


0
0

x3 :=
1 ,
0


0
1

x2 :=
0 ,
0

As relacoes de comutacao associadas ao grupo de Poincare sao:


3
X

[ja , jb ] =

743/1304

abc jc ,

(13.89)

abc jc ,

(13.90)

abc mc ,

(13.91)

k=1

[ma , mb ] =

[ja , mb ] =

3
X
k=1

3
X
k=1

[pa , pb ] =
[ja , pb ] =

0,
(1 b4 )

(13.92)
3
X

abc pc ,

(13.93)

k=1

[ma , pb ] = (ab p4 + b4 pa ) .

(13.94)

Aqui, os ndices dos ms e js variam de 1 a 3 e os ndices dos ps variam de 1 a 4.


E. 13.85 Exerccio importante. Todo estudante deve faze-lo uma vez na vida. Verifique isso.

As tres primeiras relacoes acima seguem de (13.86)-(13.88), pagina 740. A relacao (13.93) diz que
os js comutam com p4 e, nos demais casos, tem-se a u
ltima relacao de (13.61).
Novamente constatamos que a sub-algebra gerada pelos ps e um ideal de algebra de Lie do grupo
de Poincare.
oes
O grupo P+ em 1+1-dimens
Com base no nosso estudo do grupo O(1, 1) (vide Secao 13.3.1, em especial, pagina 688), sabemos
que o grupo P+ em 1+1-dimensoes e isomorfo ao grupo de matrizes da forma

cosh z senh z x1
senh z cosh z x2
0
0
1
com z, x1 , x2

. Seus geradores serao

0 1 0
m1 := 1 0 0 ,
0
0 0


0 0 1
p1 := 0 0 0 ,
0 0 0

0 0 0
p2 := 0 0 1 .
0 0 0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

744/1304

Como e facil de verificar, as relacoes de comutacao entre esses geradores sao


[m1 , p1 ] = p2 ,

[m1 , p2 ] = p1 ,

[p1 , p2 ] = 0.

Um elemento generico dessa algebra de Lie e da forma

I(M, t) :=

onde
M = zm1 =
com z, t1 , t2


0 z
z 0

 
t1
t = t 1 p1 + t 2 p2 =
t2

um exerccio facil (faca-o) constatar que para todo k


. E

I(M, t)k = I Mk , Mk1 t .

, k 1, tem-se

Conseq
uentemente, vale que

exp (I(M, t)) =


1
k
k1
+
I M , M t =

k!

k=1

X
1
+
I(M, t)k =
k!
k=1

onde
L := e

cosh z senh z
senh z cosh z

t0

L
0

t0 = f (M)t ,

sendo f a funcao analtica inteira definida em (13.62). A matriz f (M) pode ser calculada facilmente
usando-se o fato que


0 1
1 0

2k

0 1
1 0

2k+1


0 1
,
1 0

k


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

745/1304

de onde se extrai
f (M) :=

X
1 k1
+
M
k!
k=2

X
1
1
2m1
M
+
M2m
+
(2m)!
(2m + 1)!
m=1
m=1

 X


X
z 2m
z 2m1 0 1
+
=
(2m)! 1 0
(2m + 1)!
m=0
m=1

Notemos que



senh z
cosh z 1 0 1
+
=
1 0
z
z

senh z
cosh z 1

z
z

cosh z 1
senh z

z
z


cosh z 1
det f (M) = 2
z2

para z
teremos

6= 0

 
x1

. Assim, f (M) e invertvel e se escolhermos t = f (M) x, para qualquer x =


x2
1


1
exp I(M, f (M) x) =

L
0

2


cosh
z

senh
z
x
1
x

= senh z cosh z x2 .

0
0
1
1

Isso prova que todo elemento do grupo P+ em 1+1 dimensoes pode ser escrito como exponencial de
um elemento da sua propria algebra de Lie.

13.8

SL( , 2) e o Grupo de Lorentz

Nesta secao discutiremos com algum detalhe a relacao entre SL( , 2) (introduzido na Secao 13.3.5,
pagina 704) e o Grupo de Lorentz em 3+1 dimensoes, relacao esta de grande importancia em Fsica,
especialmente no estudo da equacao de Dirac38 para o eletron e na Teoria Quantica de Campos.
Automorfismos de SL( , 2)
38

Paul Adrien Maurice Dirac (1902-1984).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

746/1304

Com o proposito de preparar a discussao sobre a relacao entre SL( , 2) e o Grupo de Lorentz,
vamos em primeiro lugar discutir alguns automorfismos do grupo SL( , 2).


0 1
Seja := i2 =
SL( , 2). Definimos : SL( , 2) SL( , 2) por
1 0
(A) := A 1 .
Entao, e um automorfismo de SL( , 2). De fato, ve-se trivialmente que e bijetora e que
(AB) = (A) (B) para todos A, B SL( , 2) (prove isso!).
por M a matriz obtida tomando-se o complexo
Para uma matriz M Mat ( , 2) denotamos

conjugado dos elementos de matriz de M : M ij = Mij . Sabe-se que det(M ) = det(M ), portanto, se
A SL( , 2) entao A SL( , 2).
Assim, seja 1 : SL( , 2) SL( , 2) definida por

1 (A) := A.
Entao, 1 e tambem um automorfismo de SL( , 2). De fato, ve-se trivialmente que 1 e bijetora e que
1 (AB) = 1 (A)1 (B) para todos A, B SL( , 2) (prove isso!).
Note que 1 (1 (A)) = A, ou seja, 1 1 e a identidade.

O grupo SL( , 2) possui um outro automorfismo de interesse. Se det(A) = 1 e facil ver que
igualmente tem-se det ((A )1 ) = 1. Definimos entao 2 : SL( , 2) SL( , 2) por
2 (A) := (A )1 = (A1 ) .
Novamente, e facil ver que 2 e bijetora e que e que 2 (AB) = 2 (A)2 (B) para todos A, B SL( ,
2) (prove isso!).


a b
,
Ha uma relacao entre os automorfismos , 1 e 2 . Se A SL( , 2) e da forma A =
c d


d c
uma conta simples (faca!) mostra que (A )1 =
. Da, e facil constatar que (A )1 = A 1
b a
(faca essa constatacao!). Conclumos assim que 2 = 1 . Portanto, vale tambem que
2 1 = .

(13.95)

Todos esses fatos serao usados na Secao 13.8, onde discutiremos em detalhe a importante e surpreendente relacao entre SL( , 2) e o Grupo de Lorentz.
SL( , 2) e o Espa
co de Minkowski
Por Herm ( , 2) designamos o sub-espaco (real) de Mat ( , 2), formado por todas as matrizes
facil ver que
complexas 2 2 e Hermitianas: Herm ( , 2) := {M Mat ( , 2)| M = M }. E
existe uma correspondencia biunvoca entre Herm ( , 2) e 4 (e, portanto, entre Herm ( , 2) e o
espaco-tempo de Minkowski39 quadridimesional). De fato, como , 1 , 2 , 3 formam uma base em


39

Hermann Minkowski (1864-1909).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

747/1304

Mat ( , 2), podemos escrever toda matriz M Herm ( , 2) na forma




m4 + m3 m1 im2
,
M = m 4 + m 1 1 + m 2 2 + m 3 3 , =
m1 + im2 m4 m3
com m4 , m1 , m2 , m3 . Porem, como as matrizes de Pauli e
ser Hermitiana, ou seja, M = M , significa

sao auto-adjuntas, a condicao de M

m 4 + m 1 1 + m 2 2 + m 3 3 = m 4 + m 1 1 + m 2 2 + m 3 3 ,
ou seja, mk

, k = 1, . . . , 4. Logo,
(


3
X
m4 + m3 m1 im2
Herm ( , 2) = m4 +
m k k , =
com m1 , m2 , m3 , m4
m1 + im2 m4 m3


k=1

(13.96)

Antes de prosseguirmos, facamos algumas observacoes sobre a relacao entre Herm ( , 2) e SL( , 2).
Se A e uma matriz qualquer de Mat ( , 2) e M Herm ( , 2), e facil constatar que AM A tambem

e um elemento de Herm ( , 2). De fato (AM A ) = AM A , provando que AM A e Hermitiana. E


claro que isso tambem vale para A SL( , 2). Nesse caso, porem, tem-se a seguinte proposicao.
Proposi
c
ao 13.18 Se A SL( , 2) e tal que AM A = M para toda M Herm ( , 2), ent
ao
A= .
2

Prova. Como AM A = M para toda M Herm ( , 2) e Herm ( , 2), segue que A = A1 . Logo,
AM A1 = M para toda M Herm ( , 2), ou seja, AM = M A para toda M Herm ( , 2). Ocorre,
porem, que toda matriz Q Mat ( , 2) pode ser escrita como Q = Q1 + iQ2 com
Q1 :=

1
(Q + Q ),
2

Q2 :=

1
(Q Q )
2i

onde Q1 e Q2 sao ambas Hermitianas (verifique!). Logo, como A comuta com todas as matrizes
Hermitianas, A comuta com todas as matrizes de Mat ( , 2). Isso so e possvel se A for um m
ultiplo
da matriz identidade: A = (vide Proposicao 1.9, pagina 73). Como det(A) = 1, segue que 2 = 1,
ou seja, A = , que e o que queramos mostrar.
Essa proposicao tem a seguinte conseq
uencia:
Proposi
c
ao 13.19 Se A, B SL( , 2) s
ao tais que AM A = BM B para todas as matrizes M
Herm ( , 2), ent
ao A = B.
2
Prova. A relacao AM A = BM B implica CM C = M , onde C = B 1 A SL( , 2). Pela proposicao
anterior, C = , terminando a prova.
Seja x


x 
1

,x=

x2
x3
x4

, e seja
M (x) := x4 + x1 1 + x2 2 + x3 3

(13.97)

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

748/1304

facil ver que M : 4 Herm ( , 2) e bijetora e linear:


o elemento correspondente de Herm ( , 2). E
M (x + y) = M (x) + M (y) para todos , e todos x, y 4 .


E. 13.86 Exerccio. Mostre que as quatro componentes do vetor x


M (x) pelas seguintes expressoes:
x4 =

1
1
Tr ( M (x)) = Tr (M (x))
2
2

4


podem ser recuperadas de

1
Tr (i M (x)),
2

xi =

i = 1, 2, 3.
6

Em resumo, denotando 4 = , tem-se


x =

1
Tr ( M (x)),
2

= 1, . . . , 4.

(13.98)

um exerccio facil e importante para o que segue verificar que


E


x4 + x3 x1 ix2
det(M (x)) = det
= x21 + x22 + x23 x24 = hx, xi ,
x1 + ix2 x4 x3


onde e a matriz 4 4 definida em (13.63). Como se ve, surge (milagrosamente!) a metrica do


espaco-tempo de Minkowski do lado direito, o que indica a existencia de uma conexao insuspeita entre
a relatividade restrita e a teoria das matrizes Hermitianas 2 2. Vamos explorar as conseq
uencias
desse fato.
Em primeiro lugar, notemos que para dois vetores x, y 4 quaisquer tem-se a seguinte identidade40 :
1
hx, yi = [h(x + y), (x + y)i h(x y), (x y)i ] .
4


E. 13.87 Exerccio. Verifique isso expandindo o lado direito.

Assim, podemos escrever


hx, yi


1
= [det(M (x + y)) det(M (x y))] .
4

(13.99)

Seja agora A um elemento de SL( , 2). Se M Herm ( , 2), como ja observamos, AM A tambem
e um elemento de Herm ( , 2). Como A(BM B )A = (AB)M (AB) e facil ver (faca!) que
: SL( , 2) Herm ( , 2) Herm ( , 2)
definida por
(A, M ) := AM A
e uma aca
o a
` esquerda de SL( , 2) sobre Herm ( , 2).
40

Chamada de identidade de polarizaca


o.

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

749/1304

Para quaisquer x 4 e A SL( , 2) teremos que (A, M (x)) = AM (x)A e Hermitiana. Como
o lado direito depende linearmente de x, existe uma matriz real 4 4 que denotaremos por L[A] tal
que
(A, M (x)) = AM (x)A = M (L[A]x).
(13.100)


Formalmente podemos definir L[A] da seguinte forma. Como M : 4 Herm ( , 2) e bijetora,


definimos
L[A]x := M 1 ( (A, M (x)) ) = M 1 ( AM (x)A ),
(13.101)


para todo x

4


. Em componentes tem-se, usando (13.98),


4
X
1
1
Tr ( AM (x)A ) =
Tr ( A A )x ,
2
2
=1

(L[A]x) =

(verifique!) e, portanto, L[A] e uma matriz 4 4 com elementos de matriz


1
Tr ( A A ),
2

L[A] =

(13.102)

, = 1, . . . , 4.
E. 13.88 Exerccio importante. Usando a Proposicao 13.19, mostre que L[A] = L[B] se e somente se
A = B.
6
E. 13.89 Exerccio importante. Mostre que L[A]L[B] = L[AB] para todos A, B SL( , 2). Sugest
ao: use a definicao (13.101), nao (13.102).
6
E. 13.90 Exerccio. Mostre que l : SL( , 2)
SL( , 2) sobre 4 .


4


4


definida por l(A, x) = L[A]x e uma aca


o de
6

O ponto importante de tudo isso, e que iremos mostrar agora, e que L[A] e uma matriz de Lorentz,
ou seja, e um elemento de O(3, 1)! Para isso, faremos uso de (13.99). De fato, temos por (13.99) que
hL[A]x, L[A]yi


1
= [det(M (L[A](x + y))) det(M (L[A](x y)))]
4
=


1
det(M (M 1 ( AM (x + y)A ))) det(M (M 1 ( AM (x y)A )))
4

1
= [det( AM (x + y)A ) det( AM (x y)A )]
4
=

det(A) det(A )
[det(M (x + y)) det(M (x y))]
4

1
= [det(M (x + y)) det(M (x y))]
4
= hx, yi .


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

750/1304

Na pen
ultima igualdade usamos que det(A ) = det(A) = 1, pois A SL( , 2).

Ficou estabelecido, entao, que hL[A]x, L[A]yi = hx, yi e, portanto, L[A] O(3, 1), ou seja,
L[A] e uma transformacao de Lorentz. Isso provou tambem que ha um homomorfismo de SL( , 2) no
bom notar que nao se trata de um isomorfismo, pois
grupo de Lorentz O(3, 1), a saber, A L[A]. E
L[A] = L[A], como ja observamos.


Nao e difcil mostrar, mas nao faremos aqui41 , que L[A] definida acima nao e apenas um elemento

do grupo de Lorentz completo O(3, 1), mas de seu sub-grupo de Lorentz proprio ortocrono L + . E
trivial, por exemplo, constatar usando (13.102) que L[A]44 > 0 para qualquer A SL( , 2). Como o
conjunto de matrizes {L[A], A SL( , 2)} evidentemente contem a identidade , basta apenas provar
que o mesmo e conexo.
Os Grupos SL( , 2)/{ , } e L+ s
ao Isomorfos
Um fato muito importante e que a aplicacao 1 : SL( , 2)/{ , } L+ definida por
1 (A) := L[A]

(13.103)

e um isomorfismo entre os grupos SL( , 2)/{ , } e L+ . A prova dessa afirmacao, muito importante
na teoria dos spinores, e apresentada na Secao 13.B, pagina 764. Notemos que pelos exerccios da
pagina 749, acima, resta apenas provar que 1 e sobrejetora, o que e feito na Secao 13.B.
1 nao e o u
nico isomorfismo relevante entre esses dois grupos e apresentaremos mais tres logo
abaixo para em seguida discutir o significado de todos eles.
O fato de haver isomorfismos de SL( , 2)/{ , } no grupo de Lorentz proprio ortocrono L + e de
grande importancia na fsica relativista, em particular na Teoria Quantica de Campos, por mostrar que
as transformacoes de Lorentz (proprias e ortocronas) podem ser implementadas para partculas de spin
1/2 (cujas funcoes de onda vivem em 2 ) atraves de elementos de SL( , 2). As rotacoes SRot L+ ,
por exemplo, sao implementadas pela imagem por 1
dos elementos do sub-grupo SU(2)/{ , }
1
de SL( , 2)/{ , } (lembre-se que SU(2)/{ , } e isomorfo a SO(3), que e isomorfo a SRot).
O boost de velocidade v na direcao ~ 3 e implementado pela imagem por 1
dos elementos
1
exp((tanh v) ~ ~ ) SL( , 2).


E. 13.91 Exerccio. Prove os fatos mencionados no paragrafo precedente. Sugestao: vide [98] ou [46].
6
Outros Isomorfismos entre L+ e SL( , 2)/{ , }
Usando os automorfismos 1 e 2 de SL( , 2) definidos a` pagina 746 podemos construir mais tres
acoes de SL( , 2) sobre Herm ( , 2) com o uso da acao definida em (13.100). Essas acoes sao
41

Vide, por exemplo, [98] ou [46].

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

751/1304

denotadas aqui por ,


c e c e sao definidas da seguinte forma:

(A,

M ) := (1 (A), M ) = AM A ,

(13.104)

c (A, M ) := (2 (A), M ) = (A )1 M A1 ,

(13.105)

c (A, M ) := (2 1 (A), M ) = ( (A), M ) = A 1 M A 1 .

(13.106)

Na u
ltima linha usamos (13.95). Do fato de , 1 e 2 serem automorfismos, segue trivialmente que
essas sao de fato acoes de SL( , 2) sobre Herm ( , 2).
Analogamente a` definicao de L[A] em (13.101), definimos

imediato constatar que


E

L[A]
x := M 1 ( (A,

M (x)) ),

(13.107)

Lc [A] x := M 1 ( c (A, M (x)) ),

(13.108)

L c [A] x := M 1 ( c (A, M (x)) ).

(13.109)

 

L[A]
= L [1 (A)] = L A ,


Lc [A] = L [2 (A)] = L (A )1 ,



L c [A] = L [ (A)] = L A 1 .

(13.110)
(13.111)
(13.112)

Do fato de , 1 e 2 serem automorfismos, segue igualmente que


1 (A) := L[A],

(13.113)

2 (A) := L[A],

(13.114)

3 (A) := Lc [A],

(13.115)

4 (A) := L c [A]

(13.116)

: L+
sao isomorfismos de SL( , 2)/{ , } em L+ . Isso claramente significa que as inversas 1
i
SL( , 2)/{ , }, i = 1, . . . , 4, sao representaco
es de L+ em 2 .
A representacao 1
e por vezes denominada complexo conjugada e a representacao 41 e por vezes
2
denominada contra-gradiente.

Spinores
Em termos fsicos, se tivermos uma transformacao de Lorentz L L+ podemos implementa-la em 2
de quatro formas, de acordo com cada uma das quatro representacoes 1
dadas acima. Quantidades
i
2
fsicas vivendo em
e que se transformem por transformacoes de Lorentz de acordo com alguma
dessas quatro representacoes sao denominadas spinores. Ha, portanto, quatro tipos de spinores. De
acordo com uma convencao (que, segundo Haag [51], foi introduzida por Van der Waerden em [133])
costuma-se denotar suas componentes da seguinte forma:

JCABarata. Curso de Fsica-Matem


atica

1. As componentes de spinores
ndices inferiores: r , r = 1, 2.

Vers
ao de 29 de setembro de 2005.

Captulo 13

752/1304

que se transformam de acordo com 1


ao denotados por
1 s

2. As componentes de spinores 2 que se transformam de acordo com 1


ao denotados por
2 s
ndices inferiores com um ponto: r , r = 1, 2.
ao denotados por
3. As componentes de spinores 2 que se transformam de acordo com 1
3 s
r
ndices superiores com um ponto: , r = 1, 2.
4. As componentes de spinores
ndices superiores: r , r = 1, 2.

que se transformam de acordo com 1


ao denotados por
4 s

Spinores com ponto e sem (em ingles: dotted spinors e undotted spinors, respectivamente)
podem ser relacionados por conjugacao complexa.
E. 13.92 Exerccio. Justifique essa afirmativa.

Para U SU(2), vale U = U 1 (verifique), de modo que, no que concerne ao grupo de rotacoes,
a diferenca entre undotted spinors e dotted spinors e uma rotacao de em torno do eixo 2. Para
um boost B(v, ~ ) = exp((tanh v) ~ ~ ) SL( , 2) com ~ = (1 , 2 , 3 ) teremos B(v, ~) = B(v, ~ r ),
onde ~ r = (1 , 2 , 3 ). Isso pois 1 = 1 , 3 = 3 mas 2 = 2 . Logo,
B(v, ~ ) = B(v, ~ ) 1 .
Assim, no que concerne aos boosts de Lorentz, a diferenca entre undotted spinors e dotted spinors
e uma reversao temporal (representada aqui pela troca v v) seguida de rotacao de em torno do
eixo 2.
Todas as consideracoes acima sobre undotted spinors e dotted spinors sao de relevancia na
mecanica quantica relativista, particularmente para a celebre equacao de Dirac para o eletron 42 .
Formas invariantes de spinores
A seguinte proposicao e freq
uentemente empregada na teoria dos spinores.


0 1
Proposi
c
ao 13.20 Seja := i2 =
SL( , 2). Ent
ao, para todo A SL( , 2) tem-se
1 0
AT A = .
2
Prova. Seja A = exp(1 1 +2 2 +3 3 ) SL( , 2), com k , k = 1, 2, 3. Entao, AT = exp(1 1
2 2 + 3 3 ), pois 1T = 1 , 3T = 3 mas 2T = 2 . Assim, AT = iAT 2 = i2 2 AT 2 =
exp (2 [1 1 2 2 + 3 3 ] 2 ) = exp(1 1 2 2 3 3 ) = A1 onde, na pen
ultima igualdade,
usamos as propriedades de anti-comutacao das matrizes de Pauli. Isso completa a prova.
42

Para um artigo cl
assico sobre o assunto, vide: O. Laporte and G. E. Uhlenbeck. Application of spinor analysis
for the Maxwell and Dirac equations. Phys. Rev. 37, 1380 (1931). Outra referencia cl
assica e [133]. Vide tambem
qualquer bom livro moderno sobre Teoria Qu
antica de Campos.

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

753/1304

Uma conseq
uencia dessa proposicao e que se definirmos, para , 2 , a forma bilinear (simpletica)
(, ) := h, i , teremos (A, A) = (, ) para todo A SL( , 2).


Apesar de invariante por SL( , 2), a forma bilinear acima nao e interessante para a fsica
quantica, pois nao e um produto escalar (tem-se, por exemplo, (, ) = 0 2 ) e, portanto,
nao existe uma interpretacao probabilstica associada a` mesma. Para que a simetria L + implementada
por SL( , 2) represente uma simetria de um sistema quantico cujo espaco de Hilbert e 2 , devemos
procurar um produto escalar em 2 que seja invariante por SL( , 2). Veremos, porem, que um tal
produto escalar nao existe.

Vamos estudar a forma mais geral de um produto escalar em 2 . Como ja observamos a` pagina
131 e anteriores, a forma mais geral de um produto escalar em 2 e h, M i , onde M e autoadjunta
e positiva. Toda matriz 2 2 autoadjunta e da forma M (p) para algum p 4 (M (p) foi definida
em (13.97), pagina 747)). Vamos descobrir para quais p 4 tem-se M (p) > 0. Para que essa
condicao seja satisfeita os dois autovalores 1 e 2 de M (p) devem ser positivos. Calculando por
(13.97) o traco e o determinante de M (p) , tem-se det(M (p)) = 1 2 = (p4 )2 (p1 )2 (p2 )2 (p3 )2 e
facil ver da que 1 = p4 + k~
Tr(M (p)) = 1 + 2 = 2p4 . E
pk e 2 = p4 k~
pk onde p~ = (p1 , p2 , p3 ).
Logo, M (p) > 0 se e somente se p4 > k~
pk.
4
facil verificar (faca-o) que V+ e mantido invariante por L+ .
pk}. E
Seja V+ := {p | p4 > k~


Para ,

e p V+ , definamos o produto escalar

h, ip := h, M (p)i


Teremos, para todo A SL( , 2),


hA, Aip := h, A M (p)Ai


= h, M (L[A ]p) i


= h, iL[A ]p ,

onde, acima, usamos (13.101).


No caso do subgrupo SU(2), o produto escalar invariante corresponde a p V+ com Lp = p para
L SRot. Tais ps sao da forma p = (0, 0, 0, p4 ), p4 > 0. Assim, h, i e, a menos de um m
ultiplo
2
positivo, o u
nico produto escalar invariante em
para SU(2). Mas vemos acima que que nao ha
produto escalar invariante para todo o grupo SL( , 2) em 2 , ja que nao ha vetor em V+ que seja
invariante para todo L L+ . Fisicamante falando, a simetria de Lorentz L+ nao pode, portanto, ser
implementada em espacos de Hilbert bidimensionais, apenas a simetria de rotacao.


Adiante discutiremos como implementar a simetria de Lorentz (e a de Poincare) em campos de


spinores, aumentando a dimensao do espaco de Hilbert dos estados.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

754/1304

Ap
endices
13.A

Prova do Teorema 13.8

Aqui a demonstracao do Teorema 13.8 sera apresentada.


Seja L um elemento do grupo de Lorentz O(3, 1), representada como matriz da forma (13.79).
Vamos definir vetores coluna (ou seja, matrizes 3 1) a e b por

L41
L14
b := L42 .
a := L24 ,
L43
L34
evidente que podemos escrever L na forma de blocos
E

L =

bT

L44

(13.A.1)

onde bT , a transposta de b, e o vetor linha (matriz 1 3) dado por bT =


matriz 3 3 dada por

L11 L12 L13


l := L21 L22 L23 .
L31 L32 L33

Vamos agora considerar duas matrizes Ra e Rb pertencentes a SRot, ou

0
ra
rb

Ra :=
,
R
:=
b
0

0 0 0
0 0 0
1

L41 , L42 , L43

e l e a

seja,

0
0

0
,

com ra e rb matrizes 3 3 pertencentes a SO(3). Precisamos estudar a forma da matriz Ra LRbT . A


regra de produto de matrizes nos diz que

Ra L =

ra l

bT

ra a

L44

(13.A.2)

JCABarata. Curso de Fsica-Matem


atica

e que, conseq
uentemente,

Ra LRbT

Captulo 13

Vers
ao de 29 de setembro de 2005.

ra lrbT

ra a

(rb b)T

L44

755/1304

(13.A.3)

E. 13.93 Exerccio importante. Verifique essas afirmacoes. Se voce nao conseguir procure ajuda, pois
nao sera possvel entender o que segue. A maneira pedestre de provar (13.A.2) e escrever explicitamente R a
e L como matrizes 4 4, fazer o produto de ambas e entao constatar a validade de (13.A.2). Para (13.A.3)
proceda de modo analogo.
6
As expressoes acima sao validas de modo bastante geral, para quaisquer que sejam as matrizes de
rotacao ra e rb . Vamos agora, porem, considerar matrizes de rotacao ra e rb particulares. Escolhemos
ra da forma ra = sa ta , onde ta SO(3) e a matriz de rotacao que roda o vetor a de modo que apenas
a primeira componente do vetor resultante seja nao nula:

0 .
t a =
(13.A.4)
0
A matriz sa SO(3), por sua vez, e uma matriz de rotacao em torno do eixo 1, e que, portanto, deixa
o vetor 10 invariante. sa e da forma
0

1
1 0
0

a
a
a

0 s22 s23
=: 0
s =
0 sa32 sa33
0

com

s
Assim, temos tambem

a0

:=

sa22 sa23
sa32 sa33

0 0
s

a0

(13.A.5)

SO(2).

s a ta a = 0 .
0

Analogamente, escolhemos rb da forma rb = sb tb , onde tb SO(3) e a matriz de rotacao que roda o


vetor b de modo que apenas a primeira componente do vetor resultante seja nao nula:

0 .
tb =
(13.A.6)
0
A matriz sb SO(3), por sua vez, e uma matriz de rotacao em torno do eixo 1, e que, portanto, deixa

JCABarata. Curso de Fsica-Matem


atica

o vetor

 
1
0
0

Captulo 13

Vers
ao de 29 de setembro de 2005.

756/1304

invariante. sb e da forma

com

1
1 0
0

b
b
b
s = 0 s22 s23 =: 0
0 sb32 sb33
0

b0

:=

Pela definicao de sb acima, tambem temos

sb22 sb23
sb32 sb33

0 0
s

b0

(13.A.7)

SO(2).

s b tb b = 0 .
0

Daqui por diante as matrizes ta e tb estarao fixas. As matrizes sa e sb sao ainda arbitrarias, mas serao
fixadas mais adiante.
Com essas escolhas temos agora

Ra LRbT

onde lt := ta l(tb )T .

sa lt (sb )T

0
0

0 0

L44

(13.A.8)

A matriz L0 = Ra LRbT e certamente um elemento do grupo de Lorentz O(3, 1), pois Ra , L e RbT o

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

757/1304

sao. Assim, L0 satisfaz L0 (L0 )T = . Calculemos o lado esquerdo dessa igualdade:

sb lT (sa )T

sa l (sb )T
0
0
0

t
t

L0 (L0 )T =
0
0
0

0 0
0 0 0 1
0 0
0 0 0
L44
L44

onde

sa lt (sb )T

0
0

0 0

L44

sa lt (sb )T

0
0

0 0

L44

g T

L244 2

0
0
0
1

0 0 0

sb ltT (sa )T

0
0

0 0

L44

sb ltT (sa )T

0
0

0 0

L44

0
0
0
1

2 0 0
f = sa lt (lt )T (sa )T + 0 0 0
0 0 0


1
1
a
b T

0
g = s lt (s )
+ L44 0 .
0
0

E. 13.94 Exerccio importante. Verifique as expressoes acima. Sugestao: exerca a virtude da Paciencia.
6
Como mencionamos, L0 (L0 )T = . Portanto, devemos ter
f =
g = 0
L244 2 = 1

(13.A.9)
e

(13.A.10)
(13.A.11)

JCABarata. Curso de Fsica-Matem


atica

(por que?). Logo,

Vers
ao de 29 de setembro de 2005.

Captulo 13

1 + 2 0 0
sa lt (lt )T (sa )T =
0
1 0 ,
0
0 1


1
1
a
b T

0
s lt (s )
= L44 0 .
0
0

Devido a` forma de sa e sb em (13.A.5) e (13.A.7) essas relacoes implicam

1 + 2 0 0
lt (lt )T =
0
1 0 ,
0
0 1


1
1

lt
0
= L44 0 .
0
0
E. 13.95 Exerccio. Certo?

758/1304

(13.A.12)

(13.A.13)

(13.A.14)

(13.A.15)

Das relacoes acima extrairemos varias conclusoes sobre a estrutura do grupo de Lorentz. A primeira
e a seguinte proposicao:
Proposi
c
ao 13.21 Para qualquer transformaca
o de Lorentz L vale
L244 2 = 1,

(13.A.16)

L244 2 = 1

(13.A.17)

2 = 2 .

(13.A.18)

e, conseq
uentemente,
Fora isso,
a2 = 2 = 2 = b 2 ,
onde a2 e b2 s
ao os m
odulos ao quadrado dos vetores a e b, respectivamente, ou seja,
a2 = (L14 )2 + (L24 )2 + (L34 )2

b2 = (L41 )2 + (L42 )2 + (L43 )2 .

Portanto,
L244 = 1 + (L14 )2 + (L24 )2 + (L34 )2 = 1 + (L41 )2 + (L42 )2 + (L43 )2 .
2
Prova. (13.A.16) e o mesmo que (13.A.11). Para provar (13.A.17), notemos que, pela Proposicao 13.14,
LT e tambem uma transformacao de Lorentz. Logo, para LT a relacao (13.A.16) significa L244 2 = 1,
pois ao passarmos de L para LT o elemento L44 nao muda, mas ocorre a troca . (13.A.18) segue

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

759/1304

 
de (13.A.16) e (13.A.17). Para provar que a2 = 2 , notemos que, por (13.A.4), o vetor 0 e obtido
0
de a por uma rotacao ta SO(3), que nao altera o comprimento de vetores. De modo analogo prova-se
que b2 = 2 .
Segue dessa proposicao que, para prosseguirmos, teremos que considerar dois casos: o caso = =
0 e o caso em que 6= 0 e 6= 0.
Caso = = 0

Como comentamos, nesse caso temos a = b = 0. Podemos adotar sa = sb = ta = tb =


L e simplesmente da forma

l
0

L =
0
.

0 0 0 L44

e, portanto,

Com = 0 e sa = sb = ta = tb = , a relacao (13.A.14) reduz-se a ll T = , ou seja, l O(3). Como


det(L) = 1 e det(l) = 1 ha quatro situacoes a considerar:
Ia. det(L) = 1 e det(l) = 1.

Nessa situacao tem-se l SO(3) e L44 = 1. Portanto, L SRot.

Ib. det(L) = 1 e det(l) = 1.

Nessa situacao l O(3) mas l 6 SO(3) e L44 = 1. Assim L e da forma L = P1 T R com R SRot.
(Justifique).
IIa. det(L) = 1 e det(l) = 1.

Nessa situacao l SO(3) e L44 = 1. Assim L e da forma L = T R com R SRot. (Justifique).

IIb. det(L) = 1 e det(l) = 1.

Nessa situacao l O(3) mas l 6 SO(3) e L44 = 1. Assim L e da forma L = P1 R com R SRot.
(Justifique).
Resumindo, vimos para o caso a = b = 0 que nas quatro situacoes possveis L consiste apenas
de uma simples rotacao, seguida eventualmente de uma inversao de paridade (Ib e IIb) e/ou de uma
reversao temporal (Ib e IIa.). Como veremos, o caso 6= 0 e 6= 0 envolve tambem um boost de
Lorentz, ou seja, uma mudanca de entre dois sistemas de referencia inerciais com uma velocidade
relativa eventualmente nao-nula.
Caso 6= 0 e 6= 0

Como 6= 0, (13.A.15) pode ser escrita como




1
1
L44

0
0 ,
lt
=
(13.A.19)

0
0
 

ou seja, 10 e um autovetor de lt com autovalor := L44


. De (13.A.19) podemos extrair uma
0
 
informacao importante sobre a forma da matriz lt . Como 10 e um vetor da base canonica de 3 , a


JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

760/1304

matriz lt deve ser da forma

(lt )12 (lt )13

lt = 0 (lt )22 (lt )23 =


0
0 (lt )32 (lt )33
0
onde e o vetor coluna =

(lt )12
(lt )13

lt0

lt0

e a matriz 2 2 dada por

lt0

:=

(lt )22 (lt )23


(lt )32 (lt )33

E. 13.96 Exerccio. Por que?

Ocorre que tambem vale que = 0. Para ver isso, notemos que (13.A.14) diz-nos que

T
0
0

1
+

0
0

0
1 0 ,
lt (lt )T =
=
0

0T
0
lt
0
0 1
lt

ou seja,

Logo,

2 + T

(lt0 )T

lt0

lt0 (lt0 )T

1 + 2 0 0

0
1 0 .
=
0
0 1

lt0 (lt0 )T =

(13.A.20)

lt0 = 0

(13.A.21)

2 + T = 1 + 2 .

(13.A.22)

e
Agora, (13.A.20) afirma que lt0 e uma matriz ortogonal e (lt0 )1 = (lt0 )T . Aplicando, portanto, (lt0 )1 a`
esquerda em (13.A.21) segue que = 0. Chegamos assim a` conclusao que

0
0

0 (lt )22 (lt )23


lt =
=
0
0 (lt )32 (lt )33
0

com 2 = 1 + 2 (por (13.A.22)). Segue da que

sa lt (sb )T = 0
0

0
sa0 lt0 (sb )T

0 0
lt0

(sa0 e sb estao definidos em (13.A.5) e (13.A.7)). Neste momento vamos fixar sa e sb , adotando
0

sa0 = sb (lt0 )1 = sb (lt0 )T .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Com isso, obviamente

sa0 lt0 (sb )T =


Logo,
sa lt (sb )T
Retornando a (13.A.8)
Ra LRbT
onde, recordando,
=

Captulo 13

761/1304

0 0
= 0 1 0 .
0 0 1

0
=
0

L44

0
1
0
0

0
0 0

1 0
0 L44
2 = 1 + 2 .

(13.A.23)

(13.A.24)

Resta-nos mostrar que a matriz do lado direito de (13.A.23) tem a forma de um boost de Lorentz,
o que
acompanhado eventualmente de uma operacao de troca de paridade e/ou reversao temporal. E
faremos agora.
Como Ra LRbT e um elemento do grupo de Lorentz O(3, 1), tem-se que det(Ra LRbT ) = 1. Calculando o determinante da matriz do lado direito (13.A.23) tem-se entao
L44 = 1.
Multiplicando-se por / teremos

ou seja,

L44

2 = ,

2 2 = .

Pela segunda equacao em (13.A.24) isso implica


=

L44 = ,

os dois sinais acima sendo iguais ao sinal de det(Ra LRbT ). , porem, e dado por 1 + 2 ( por
(13.A.24)), mas a escolha do sinal dessa raiz quadrada e independente do sinal de det(R a LRbT ). Ha,
portanto, quatro situacoes possveis que deveremos considerar separadamente:

Ia. Escolhendo det(Ra LRbT ) = +1 e = + 1 + 2 , (13.A.23) fica


1 + 2 0 0

0
1 0
0
Rb .
L = (Ra )T
(13.A.25)

0
0 1 0
1 + 2

0 0
Ra e Rb sao elementos de SRot ' SO(3), temos det(Ra ) = det(Rb ) = 1. Logo, neste caso temos
det(L) = 1. Fora isso L44 1.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

762/1304

conveniente escrever (13.A.25) de outra forma. Como e um n


E
umero real arbitrario, vamos
definir v (1, 1) por
v :=
Teremos

onde

1 + 2
0
0

0
1
0
0

,
1 + 2

de modo que

(v)

0
0
0
=

1 0
0
2
v(v)
0
1+
(v) :=

0
1
0
0

v
.
1 v2

(13.A.26)

0 v(v)

0
0
=: B1 (v),

1
0
0 (v)

1
.
1 v2

Como se ve, chegamos dessa forma aos boosts de Lorentz B1 (v) utilizando apenas as propriedades
definidoras do grupo de Lorentz. Compare com o estudo do grupo O(1, 1), pagina 688.
Com essa parametrizacao, (13.A.25) fica
L = (Ra )T B1 (v)Rb ,
para Ra , Rb SRot.

Ib. Escolhendo det(Ra LRbT ) = +1 e = 1 + 2 ,



1 + 2

0
Ra LRbT =

(13.A.23) fica
0
1
0
0

0
0
.

1
0

2
0 1+

Logo, usando-se as matrizes P1 e T definidas em (13.74) e



1 + 2 0

0
1
P1 Ra LRbT T =

0
0

como facilmente se verifica. Da, lembrando que T e


temos

1 + 2

0
L = (P1 Ra )T

Assim, com a parametrizacao (13.A.26),

(13.75), segue

0
0
,

1 0
1 + 2
0

(13.A.28)

(13.A.29)

Rb comutam (por que?), conclui-se que nesse caso

0 0

1 0
0
Rb T.
(13.A.30)

0 1 0
0 0
1 + 2

L = (P1 Ra )T B1 (v)Rb T,
para Ra , Rb SRot.

(13.A.27)

(13.A.31)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

Por fim, note-se que neste caso temos det(L) = 1 com L44 1 (por que?).

IIa. Escolhendo det(Ra LRbT ) = 1 e = + 1 + 2 , (13.A.23) fica


1 + 2 0 0

0
1 0
0
.
Ra LRbT =

0
0 1
0

0 0 1 + 2
Assim,

T Ra LRbT


1 + 2

0
=

como facilmente se verifica. Nesse caso, entao,



1 + 2

0
L = T (Ra )T

0
1
0
0

0
1
0
0

Assim, com a parametrizacao (13.A.26),

763/1304

(13.A.32)

0
0
,

1 0
0
1 + 2

(13.A.33)

0
0
Rb .

1 0
2
0
1+

(13.A.34)

L = T (Ra )T B1 (v)Rb ,

(13.A.35)

para Ra , Rb SRot.

Por fim, note-se que neste caso temos det(L) = 1 com L44 1 (por que?).

IIb. Escolhendo det(Ra LRbT ) = 1 e = 1 + 2 , (13.A.23) fica


1 + 2 0 0

0
1 0
0
.
Ra LRbT =

0
0 1 0
2
1+

0 0
Assim,


1 + 2

0
Ra LRbT P1 =

como facilmente se verifica. Nesse caso, entao,



1 + 2

0
L = (Ra )T

0
1
0
0

0
1
0
0

0
0
,

1 0
2
1+
0

0
0
P1 R b .

1 0
1 + 2
0

(13.A.36)

(13.A.37)

(13.A.38)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

764/1304

Assim, com a parametrizacao (13.A.26),


L = (Ra )T B1 (v)P1 Rb ,

(13.A.39)

para Ra , Rb SRot.

Por fim, note-se que neste caso temos det(L) = 1 e L44 1 (por que?).

A demonstracao do Teorema 13.8 esta assim completa.

13.B

Um Isomorfismo entre SL( , 2)/{ , } e L+


Esta seca
o e de autoria de Daniel A. Cortez

Vamos provar que a aplicacao 1 : SL( , 2)/{ , } L+ definida por


1 (A) := L[A]

(13.B.40)

e um isomorfismo entre os grupos SL( , 2)/{ , } e L+ . Para isso, comecaremos resolvendo dois
dos exerccios propostos a` pagina 749. O primeiro deles afirma que L[A] = L[B] se e somente se
A = B. Isso pode ser visto facilmente a partir da Proposicao 13.19. De fato, se L[A] = L[B],
entao para qualquer x 4 , vale que L[A]x = L[B]x. Usando (13.101), resulta M 1 (AM (x)A ) =
M 1 (BM (x)B ). Portanto, AM (x)A = BM (x)B e, como M (x) Herm( , 2) para qualquer x 4 ,
segue da Proposicao 13.19 que A = B. Por outro lado, e claro que se A = B, entao L[A] = L[B],
como se pode constatar, por exemplo, a partir de (13.102). Note que o resultado desse exerccio implica
o fato da aplicacao 1 definida em (13.B.40) ser injetora. Realmente, se 1 (A) = 1 (B), segue que
L[A] = L[B] e, portanto, A = B, que correspondem ao mesmo elemento em SL( , 2)/{ , }. Dessa
forma, acabamos de estabelecer o seguinte resultado:


Proposi
c
ao 13.22 A aplicaca
o 1 : SL( , 2)/{ , } L+ definida em (13.B.40) e injetora.

Passemos agora a mostrar que vale a seguinte regra de composicao: L[A]L[B] = L[AB] para
quaisquer matrizes A, B, SL( , 2). De fato, para qualquer x 4 , usando (13.101), temos


L[A]L[B]x = L[A]M 1 (BM (x)B )

 
= M 1 AM M 1 (BM (x)B )) A
= M 1 ( ABM (x)B A )

= M 1 ( ABM (x)(AB) )
= L[AB]x .

(13.B.41)

Como x e arbitrario, conclumos que L[A]L[B] = L[AB]. Desse resultado, segue que 1 (A)1 (B) =
1 (AB), ou seja, que 1 e um homomorfismo de SL( , 2)/{ , } em L+ . Como 1 e uma aplicacao
injetora, vale, em verdade, o seguinte:

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

765/1304

Proposi
c
ao 13.23 A aplicaca
o 1 : SL( , 2)/{ , } L+ definida em (13.B.40) e um monomorfismo, ou seja, um homomorfismo injetor.
2
Note agora que para provarmos que 1 e um isomorfismo entre SL( , 2)/{ , } e L+ , so precisamos
verificar que 1 e sobrejetor, isto e, que qualquer transformacao de Lorentz do grupo L + e imagem por
1 de alguma matriz em SL( , 2)/{ , }. Como qualquer L+ pode ser escrita em termos de uma
composicao de rotacoes e de um boost ao longo da direcao 1, so precisamos encontrar as matrizes em
SL( , 2)/{ , } que correspondem a essas operacoes em L+ . De fato, seja L+ , entao, de acordo
com o Teorema 13.8, e da forma RaT B1 Rb , onde Ra , Rb SRot e B1 e um boost apropriado ao longo
da direcao 1. Se b1 SL( , 2)/{ , } for tal que 1 [b1 ] = B1 e r SL( , 2)/{ , } for tal
que 1 [r] = R, para qualquer R SRot, entao teramos
1 [raT b1 rb ] = 1 [raT ]1 [b1 ]1 [rb ] = RaT B1 R = ,

(13.B.42)

uma vez que 1 e um homomorfismo. A relacao (13.B.42) mostra que 1 e uma aplicacao sobrejetora, ja
que toda transformacao de Lorentz L+ pode ser obtida como imagem de alguma matriz apropriada
de SL( , 2)/{ , }. Para que o nosso raciocnio seja valido, precisamos apenas encontrar as matrizes
b1 e r em SL( , 2)/{ , } com as propriedades mencionadas acima, ou seja, tais que 1 [b1 ] =
L[b1 ] = B1 e que 1 [r] = L[r] = R, para qualquer R SRot. Vamos fazer isso nos paragrafos
seguintes.
Em primeiro lugar, escrevemos v = tanh z em B1 (v), de

cosh z

0
B1 (z) = B1 (tanh z) =

0
senh z

maneira que
0
1
0
0

0 senh z

0
0
.

1
0
0 cosh z

As matrizes de SRot, por sua vez, podem ser escritas como

~
0
e~J

R~ () =
0
SRot ,

0 0 0

(13.B.43)

(13.B.44)

com [, ] e ~ 3 tal que k~k = 1. Acima, J~ = (J1 , J2 , J3 ) sao os geradores do grupo de


rotacoes SO(3). Com as observacoes acima, provaremos o seguinte resultado:


Proposi
c
ao 13.24 Sejam z
de Pauli. Ent
ao,
 z 
(a) L e 2 1 = B1 (z);
h i
(b) L ei 2 ~~ = R~ ().

, [, ], ~

3


tal que |~ | = 1 e ~ = (1 , 2 , 3 ) as tres matrizes

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

766/1304

2
z

Prova. Demonstraremos primeiramente (a). Observe que e 2 1 pertence a` SL( , 2) uma vez que
(13.B.45)
SL( , 2) = { exp (z~ ~ ) , onde z e ~ 3 com 12 + 22 + 32 = 1 } .
 z 
Dessa forma L e 2 1 esta bem definido e podemos usar (13.102) para computar explicitamente seus
elementos de matriz. Esse calculo sera facilitado com o auxlio do seguinte
Lema 13.1 Sejam 1 , 2 , 3 as tres matrizes de Pauli. Ent
ao,
(a) Tr(k ` ) = 2k` , onde k` e o delta de Kr
onecker43 ;
(b) Tr(j k ` ) = 2ijk` , onde jk` e o smbolo totalmente anti-simetrico de Levi-Civita;
(c) Tr(i k j ` ) = 2i` kj 2ij k` + 2ik j` .

2
2

Prova do lema. A demonstracao consiste em usar repetidamente os fatos de que o traco de qualquer
matriz de Pauli e nulo (isto e, Trj = 0, j = 1, 2, 3) e que
k ` = k` + ik`j j ,
onde a convencao de soma implcita em ndices repetidos foi usada. Assim, para provar (a), temos
Tr(k ` ) = Tr(k` + ik`j j )
= k` Tr
= 2k` .
Para provar (b), usamos o resultado acima e os fatos ja mencionados. Conseq
uentemente,
Tr(j k ` ) = Tr[ j (k` + ik`m m ) ]
= ik`m Tr(j m )
= 2ik`m jm
= 2ik`j = 2ijk` .
43

Leopold Kr
onecker (1823-1891).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

767/1304

Finalmente, para provar (c), usamos novamente (a). Com efeito,


Tr(i k j ` ) = Tr[ (ik + iikm m )(j` + ij`n n ) ]
= ik j` Tr ikm j`n Tr(m n )
= 2ik j` 2ikm j`n mn
= 2ik j` 2ikm j`m .
Aplicando a bem conhecida identidade
ikm j`m = ij k` i` kj ,
obtemos
Tr(i k j ` ) = 2ik j` 2ij k` + 2i` kj ,
completando a prova do lema.
Retornemos agora a` prova do item (a) da Proposicao 13.24. Como e bem sabido, podemos escrever
z

e 2 1 = cosh

z
z
1 senh .
2
2

(13.B.46)

 z 
Para calcular os elementos de matriz L e 2 1 , com , = 1, 2, 3, 4, usamos a relacao (13.102),
lembrando que 4 . Assim, com o auxlio de (13.B.46), temos
 z 1 
z
z
1 h
z
z  i
2
Tr cosh
L e
=
1 senh
cosh
1 senh
44
2
2
2
2
2
z 
1 
z
z
z
=
2 cosh senh 1 + senh 2 12
Tr cosh2
2
2
2
2
2

1
2 z
2z
=
cosh + senh
Tr
2
2
2
= cosh2

z
z
+ senh 2 = cosh z ,
2
2

(13.B.47)

 z 
onde usamos que 12 = , Tr1 = 0 e cosh2 x + senh 2 x = cosh 2x. Calculemos agora L e 2 1 4j com
j = 1, 2, 3. Usando (13.102) e (13.B.46), obtemos
 z 
1 h
z 
z
z  i
z
L e 2 1 4j =
1 senh
j cosh
1 senh
Tr cosh
2
2
2
2
2

z
1 
z
z
z
z
=
Tr cosh senh j 1 senh cosh 1 j + senh 2 1 j 1 .
2
2
2
2
2
2
Aplicando o Lema 13.1, resulta imediatamente que
 z 
z
z
L e 2 1 4j = 2j1 cosh senh = j1 senh z ,
2
2

(13.B.48)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

768/1304

 z 
onde a identidade 2 senh (x) cosh(x) = senh (2x) foi usada. O calculo de L e 2 1 j4 , j = 1, 2, 3 e feito
de forma semelhante. Explicitamente,
 z 
z
z
z
z  i
1 h 
L e 2 1 j4 =
Tr j cosh
1 senh
cosh
1 senh
2
2
2
2
2
i

1 h 
z
z
2 z
2z
=
Tr j cosh + senh
2 cosh senh j 1
2
2
2
2
2

z
z
senh = j1 senh z .
(13.B.49)
2
2
Observe
 que
 novamente utilizamos o Lema 13.1 para o calculo do traco. Resta, finalmente, o computo
z

1
de L e 2 ij , com i, j = 1, 2, 3. Esse tambem pode ser feito de forma simples com o auxlio do
Lema 13.1. De fato,
 z 
z 
z  i
1 h 
z
z
1 senh
1 senh
j cosh
L e 2 1 ij =
Tr i cosh
2
2
2
2
2

= 2j1 cosh

z
z
1
z
z

Tr i cosh2 j cosh senh (j 1 + 1 j ) + senh 2 1 j 1


{z
}
2
2
2
2|
2
2j1

z
1
z
1
cosh2 Tr(i j ) + senh 2 Tr(i 1 j 1 )
{z
}
2
2
2
2|
41i 1j 2ij

= ij cosh2

z
z
+ senh 2 (21i 1j ij )
2
2

z
= ij + 21i 1j senh 2 ,
(13.B.50)
2
onde a identidade fundamental cosh2 x senh 2 x = 1 foi utilizada na u
ltima igualdade. Observe da
relacao acima que quando i = j = 1, obtem-se
 z 
z
L e 2 1 11 = 1 + 2 senh 2
2

z
z
z
= cosh2 senh 2
+ 2 senh 2
2
2
2
= cosh2
 z 
caso contrario, L e 2 1 ij = ij .

z
z
+ senh 2 = cosh z ,
2
2

(13.B.51)

Usando
oes (13.B.47)-(13.B.51), podemos escrever explicitamente a forma completa da

 asz express
1
2
para , = 1, 2, 3, 4. Nao e difcil constar (faca!) que
matriz L e

cosh z 0 0 senh z

 z 
0
1 0
0
.
L e 2 1 =

0
0 1
0
senh z 0 0 cosh z

JCABarata. Curso de Fsica-Matem


atica

Captulo 13

Vers
ao de 29 de setembro de 2005.

769/1304

 z 
Comparando com (13.B.43), vemos que L e 2 1 = B1 (z), provando o item (a) da proposicao.

A prova da segunda parte da proposicao segue, essencialmente, a mesma ideia da primeira, embora
i 2
~~

seja um pouco mais htrabalhosa.


Em
primeiro
lugar,
observamos
que
e
SL( , 2) em virtude de
i

(13.B.45). Assim, L ei 2 ~~ esta bem definida e podemos calcular seus elementos de matriz usando a

formula (13.102). Antes disso, porem, e conveniente expressarmos ei 2 ~~ usando a identidade

ei 2 ~~ = cos

i~ ~ sen .
2
2

Assim, de acordo com (13.102), lembrando sempre que 4 , temos




 
h i

i 2
~ ~

Tr cos
L e
=
i~ ~ sen
i~ ~ sen
cos
2
2
2
2
2
44


1
2
2
2
Tr cos
+ (~ ~ ) sen
.
=
2
2
2
Escrevendo ~ ~ = j j e usando o Lema 13.1, resulta
h i

1
1
cos2 Tr + sen 2 k j Trk j
L ei 2 ~~
=
2
2
2
2
44
= cos2

+ sen 2 k j kj
2
2

= cos2

+ sen 2 k k = 1 ,
2
2

(13.B.52)

h i
uma vez que k k = ~ 2 = 1. Prosseguindo, devemos agora calcular os elementos de matriz L ei 2 ~~ ,
4j

com j = 1, 2, 3. Como sempre, o calculo e feito com base na expressao (13.102) e com o auxlio do
Lema 13.1. Assim,

 
 
h i

i 2
~~

Tr cos
L e
ik k sen
j cos
i` ` sen
=
2
2
2
2
2
4j
=

1
1

i cos sen ` Tr(j ` ) i cos sen k Tr(k j )


2
2
2 | {z } 2
2
2 | {z }
2j`

sen 2 k ` Tr(k j ` )
| {z }
2
2

2kj

2ikj`

= i cos

sen j i cos sen j + i sen 2 k ` kj` = 0 ,


2
2
2
2
2

(13.B.53)

h i
uma vez que k ` e simetrico pela troca de k com ` e kj` e anti-simetrico. O calculo de L ei 2 ~~

j4

e bastante analogo ao realizado acima e e deixado como exerccio para o leitor. O resultado obtido

JCABarata. Curso de Fsica-Matem


atica

devera ser

Vers
ao de 29 de setembro de 2005.

h i
L ei 2 ~~

Captulo 13

770/1304

(13.B.54)
h i
assim como em (13.B.53). Resta, finalmente, calcularmos os elementos de matriz L ei 2 ~~
para
j4

= 0,

ij

i, j = 1, 2, 3. Isso e feito de forma usual, a partir da expressao (13.102) e dos resultados do Lema 13.1.
Temos,
 
 
 
h i

1
i 2
~~

L e
ik k sen
j cos
i` ` sen
Tr i cos
=
2
2
2
2
2
ij
=

1
i

cos2 Tr(i j ) + cos sen ` Tr(i j ` ) cos sen k Tr(i k j )


2
2 | {z } 2
2
2 | {z } 2
2
2 | {z }
2iij`

2ij

sen 2 k `
2
2

2iikj

Tr(i k j ` )
{z
}
|

2(i` kj ij k` +ik j` )

= cos2

ij 2 cos sen ` ij` + sen 2 k ` (i` kj ij k` + ik j` ) .


2
2
2
2

Usando no u
ltimo termo que k ` k` = k k = ~ 2 = 1 e que 2 sen x cos x = sen 2x; cos2 x sen 2 x =
cos 2x, resulta
h i

= ij cos ` ij` sen + 2i j sen 2 .


L ei 2 ~~
2
ij
Observando ainda que 2 sen 2 x = 1 cos 2x, ficamos com
h i
= ij cos ` ij` sen + i j (1 cos ) .
L ei 2 ~~

(13.B.55)

ij

As expressoes (13.B.52)-(13.B.55) devem ser diretamente comparadas com (13.B.44). Notamos que
todos os elementos da quarta linha e da quarta coluna sao coincidentes. Resta saber se a expressao
(13.B.55) obtida acima e equivalente a` (13.B.44) para as demais linhas e colunas. Isso pode ser verificado
calculando os elementos ij da matriz R~ (). Para tanto, usamos a identidade dada na Proposicao 13.5
a` pagina 695. Assim,





2

~
J~
R~ ()ij = e
+ (1 cos ) ~ J~ + sen ~ J~
=
ij

= ij + (1 cos )

ij



2 


~
~
~ J
+ sen ~ J
.
ij

Agora, conforme visto em (13.41), pagina 695, tem-se




~ J~ = ijk k .
ij

ij

(13.B.56)

(13.B.57)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 13

771/1304

Portanto,


2 
~
~ J

ij


 

~ J~
~ J~
ik

kj

= ik` ` kjm m = (im `j ij `m )` m


= i j ij ` ` = i j ij ,

(13.B.58)

ja que |~ | = 1. Inserindo (13.B.57) e (13.B.58) em (13.B.56), resulta


R~ ()ij = ij + (1 cos )(i j ij ) sen (ijk k )
= ij cos ijk k sen + i j (1 cos ) ,
que e justamente (13.B.55). Isso completa a demonstracao do item (b) da proposicao.
Conforme discutido nos paragrafos que precedem a Proposicao 13.24, a existencia de matrizes
b1 e r em SL( , 2)/{ , } tais que 1 [b1 ] = B1 e 1 [r] = R, para qualquer R SRot, e
suficiente para garantir que a aplicacao 1 seja sobrejetora em L+ . Ocorre que a Proposicao 13.24 nos

z
diz justamente que as matrizes procuradas em SL( , 2)/{ , } sao b1 = e 2 1 e r = ei 2 ~ , com
[, ] e ~ 3 tal que k~ k = 1. Dessa forma, para qualquer transformacao de Lorentz L + , a
relacao (13.B.42) pode ser sempre satisfeita, evidenciando o fato de que 1 e sobrejetora. Juntando a`
essa conclusao o resultado da Proposicao 13.23, temos demonstrado o seguinte teorema fundamental:


Teorema 13.10 A aplicaca


o 1 : SL( , 2)/{ , } L+ definida em (13.B.40) e um isomorfismo,

2
ou seja, SL( , 2)/{ , }
= 1 L+ .

Captulo 14

Grupos de Lie e Algebras


de Lie. Uma Breve
Introduc
ao
Conte
udo
14.1 Variedades e Grupos de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . 773
14.2 Breves Considera
co
es sobre Grupos Topol
ogicos . . . . . . . . . . . . . . . 775
14.3 Grupos de Lie Matriciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 778
14.3.1 Uma Topologia Metrica em GL( , n) . . . . . . . . . . . . . . . . . . . . . . 778
14.3.2 O Grupo de Lie GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 779
14.3.3 Sub-Grupos Uniparametricos e seus Geradores . . . . . . . . . . . . . . . . . 782

14.3.4 Sub-Grupos Uniparametricos e Algebras


de Lie . . . . . . . . . . . . . . . . . 785
14.3.5 Subgrupos Fechados de GL( , n) . . . . . . . . . . . . . . . . . . . . . . . . . 790

14.4 A Rela
ca
o entre Grupos de Lie Matriciais e suas Algebras
de Lie . . . . 794

14.4.1 Algebras
de Lie Nilpotentes, Sol
uveis, Simples e Semi-Simples . . . . . . . . . 795

14.4.2 Questoes sobre a Exponenciacao de Algebras


de Lie . . . . . . . . . . . . . . 799
14.4.3 Alguns Exemplos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 802

ste captulo tenciona ser uma modesta introducao ao estudo de grupos de Lie. Com particular
destaque discutiremos grupos de Lie matriciais. Algumas observacoes previas sao necessarias.
Para a discussao do conceito geral de grupo de Lie sao indispensaveis algumas nocoes basicas
sobre espacos topologicos mas, de importancia especial e a nocao de variedade diferenciavel.
Esse importante conceito, proveniente da geometria, desempenha um papel importante em varias areas
de Fsica, tais como a Teoria da Relatividade Geral e as Teorias de Calibre. O conceito de variedade
diferenciavel nasceu inspirado na nocao mais familiar de superfcie em espacos n e nao se desvincula
totalmente daquela. Nao pressuporemos da parte do leitor conhecimento previo do conceito de variedade diferenciavel e, por isso, vamos introduz-lo adiante. Nao iremos, no entanto, desenvolver esse
assunto em detalhe e, para tal, remetemos o estudante aos (in
umeros) bons livros sobre Geometria
Diferencial, por exemplo [98].


Iremos nos concentrar em exemplificar o conceito de grupo de Lie tratando primordialmente de


grupos de Lie matriciais. Isso simplifica um pouco o tratamento e reduz um tanto o escopo destas notas
introdutorias. No entanto, a grande maioria dos grupos de Lie de interesse (especialmente em Fsica)
e formada por grupos de Lie matriciais. Para o tratamento de grupos de Lie matriciais discutiremos
com certo detalhe aspectos algebricos e topologicos de grupos de matrizes.
Mais de 100 anos de pesquisa intensa nos separam dos primordios do estudo dos grupos e algebras
de Lie e nossas pretensoes aqui sao a de uma modesta introducao a esse vastssimo assunto. Para
tratamentos gerais e abrangentes de grupos de Lie recomendamos as referencias [101], [97], [20], [73],
[130], [63] ou [119], . Para algebras de Lie, recomendamos [69] e [115].
772

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

773/1304

Varios grupos de Lie sao importantes na Fsica e seu tratamento e particularmente importante na
Mecanica Quantica e nas Teorias Quanticas de Campos. Exemplos de grupos de Lie importantes para
a Fsica sao discutidos com certo detalhe no Captulo 13, tais como os grupos SO(3), SU(2) e o grupo
de Lorentz.

14.1

Variedades e Grupos de Lie

Variedades Diferenci
aveis
Uma variedade diferenci
avel real de dimensao n e um espaco topologico Hausdorff V dotado de uma
famlia de abertos F = {U , } com as seguintes propriedades:
1. V =

U .

2. Para cada U F existe um conjunto aberto C de


contnua : U C .

n


e uma bijecao contnua com inversa

3. Para todo par U , U F com U U 6= a funcao


1
: (U U ) (U U )
e infinitamente diferenciavel como funcao de (um sub-conjunto de)

n


em

n


Uma variedade analtica complexa de dimensao n e definida analogamente, substituindo-se n por


e substituindo-se a condicao de diferenciabilidade infinita do item 3, acima, por analiticidade.


Observaca
o 1. Acima, e apenas um conjunto de ndices usados para rotular os elementos de F
e nao tem nenhum papel especial. pode ser finito ou nao, contavel ou nao.
ao denominadas funco
es de transica
o. Em uma
Observaca
o 2. As funcoes 1
de acima s
variedade k-diferenci
avel exige-se apenas que as funcoes de transicao sejam k-vezes diferenciaveis.
Esses objetos tem, porem, interesse relativamente limitado.
Observaca
o 3. Os pares ( , U ) sao freq
uentemente denominados cartas locais da variedade ou
simplesmente cartas. A colecao das cartas e freq
uentemente denominada atlas.
Vamos a` interpretacao das condicoes acima. A condicao 1 diz apenas que a famlia {U , }
e um recobrimento de V , ou seja, todo elemento de V pertence a pelo menos um aberto U , podendo
naturalmente ocorrer que alguns pontos de V pertencam a varios elementos da famlia F, ou seja, os
elementos de F podem ter interseccoes nao-vazias. A condicao 2 e importante e diz que os elementos
de cada U podem ser rotulados (univocamente) por uma n-upla de n
umeros reais (ou complexos).
Ou seja, podemos dotar cada U de um sistema de coordenadas. Note que esses sistemas podem ser
diferentes para U s diferentes. Como dissemos, pontos de V podem pertencer a varios U s e, portanto,
podem ter a si atribudas coordenadas diferentes, uma para cada U ao qual pertence. Assim, os pontos
de U U tem a si atribudos pelo menos dois sistemas de coordenadas: as coordenadas C de U e as

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

774/1304

coordenadas C de U . A condicao 3 diz-nos como esses sistemas de coordenadas devem relacionar-se,


a saber, o que se deseja e que a passagem das coordenadas C para as coordenadas C , a qual e definida
pela funcao 1
avel (ou analtica).
, seja infinitamente diferenci

Como mencionamos, a conceito de variedade foi inspirado na nocao de superfcie em conjuntos como
e n . Sem entrarmos em detalhes tecnicos, toda superfcie em n convenientemente definida (tais
como a superfcie da esfera e o toro, em 3 ) e uma variedade, ou seja, tem um sistema de coordenadas
local. Isso pode ser garantido, por exemplo, pelo conhecido teorema da funcao implcita da analise
real. Note-se porem que variedades nao sao apenas conjuntos de pontos, como as superfcies de n o
sao, podendo ser tambem conjuntos de outros tipos de objetos, como funcoes, curvas, vetores, matrizes
etc. A ideia intuitiva basica em torno da nocao de variedade e que a mesma representa uma colecao
contnua de objetos que podem ser rotulados por sistemas de coordenadas e de tal forma que possamos,
ao menos localmente, manipular essas coordenadas de modo (infinitamente) diferenciavel, como se faz
em n .



a b
com det(R) = 1 e
E. 14.1 Exerccio. Mostre que o conjunto de matrizes R = b
a , a, b
uma variedade diferenciavel de dimensao 1.
6
n

Grupos Topol
ogicos
Vamos agora apresentar a definicao de grupo topol
ogico, da qual precisaremos para discutir grupos
de Lie.
Seja G um grupo. Para cada g G podemos definir uma funcao g : G G por g (h) = gh. Fora
isso tem-se tambem em G a funcao inv : G G definida por inv(h) = h1 .
ogico em relacao a uma topologia definida em G
Defini
c
ao. Um grupo G e dito ser um grupo topol
se nessa topologia a funcao inv e todas as funcoes g forem contnuas.
Coment
ario. Podemos definir tambem para cada g G a funcao g : G G por g (h) = hg, que
facil de se ver, porem, que g = inv g1 inv. Assim,
representa a multiplicacao a` direita por g. E
em um grupo topologico as funcoes g sao tambem contnuas.
Coment
ario. Um grupo pode ser topologico em relacao a uma topologia mas nao em relacao a outra.
Veremos exemplos.
Informalmente, um grupo G e topologico se as operacoes de produto por elementos do grupo e
inversao forem contnuas.
Em termos mais precisos um grupo topologico e formado por um grupo G e uma colecao G de
subconjuntos de G, G (G), satisfazendo as condicoes definidoras de um Espaco Topologico (vide
Captulo 18):
1. G e G G,
2. Se A G e B G entao A B G,
3. Se I e um conjunto arbitrario de ndices e A G para todo I entao

A tambem e um

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

775/1304

elemento de G,
e tais que para todo O G as imagens inversas inv 1 (O) e 1
ao igualmente
g (O), para todo g G, s
elementos de G.
Os elementos de G sao ditos ser os conjuntos abertos de G. Como em geral se faz em espacos
topologicos, um conjunto F G e dito ser fechado se seu complementar G \ F for aberto.
Grupos de Lie
Um grupo topologico que, enquanto espaco topologico, seja uma variedade real diferenciavel (complexa analtica) e dito ser um Grupo de Lie1 real (complexo) se as operacoes de multiplicacao a` direita
e inversao forem infinitamente diferenciaveis (analticas).
E. 14.2 Exerccio. Verifique que ( , +) (o grupo aditivo dos reais) e (
cativo dos reais nao-negativos) sao grupos de Lie reais.


E. 14.3 Exerccio.
6


Verifique que R =

a b
b a

, a, b


\ {0}, ) (o grupo multipli6


com det(R) = 1 e um grupo de Lie real.

Na Secao 14.3.2, pagina 779, mostraremos com detalhe que GL( , n) e um grupo de Lie. Para
mais exemplos, vide a discussao sobre os grupos SO(3), SU(2) etc. do Captulo 13.

14.2

Breves Considera
co
es sobre Grupos Topol
ogicos

Nesta secao nos limitaremos a apresentar alguns poucos resultados sobre grupos topologicos, dos quais
faremos uso adiante ao tratarmos de grupos de Lie. O estudo de grupos topologicos gerais e bastante
vasto e para um texto classico recomendamos fortemente [101].
Introduzimos aqui a seguinte notacao. Seja G um grupo topologico. Se U e algum subconjunto de
G e g G definimos
gU = {x G| x = gu para algum u U }.
Analogamente,
U g = {x G| x = ug para algum u U }.
E. 14.4 Exerccio. Se U e um conjunto aberto de G mostre que para todo g G os conjuntos gU e
U g sao tambem conjuntos abertos de G.
6
Grupos Topol
ogicos Conexos e Desconexos
1

Marius Sophus Lie (1842-1899). Lie introduziu esse conceito em cerca de 1870 em seus estudos de propriedades de
invari
ancia de equaco
es diferenciais parciais.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

776/1304

Um grupo topologico H e dito ser desconexo se for a uniao disjunta de dois conjuntos A e B, ambos
nao-vazios e ambos simultaneamente abertos e fechados. Ou seja, H = A B, A B = com A 6= ,
B 6= , onde A e B sao abertos e fechados.
Um grupo topologico H e dito ser conexo se nao for desconexo.

Alguns Fatos sobre Grupos Topol


ogicos
Vamos aqui provar alguns fatos basicos sobre grupos topologicos gerais. Faremos uso da Proposicao
14.3 abaixo quando falarmos da relacao entre algebras de Lie matriciais e algebras de Lie.
Seja H um grupo topologico e G H um subgrupo de H. Dizemos que G e um subgrupo aberto
de H se G for um subconjunto aberto de H. Analogamente, dizemos que G e um subgrupo fechado de
H se G for um subconjunto fechado de H. A seguinte proposicao e relevante nesse contexto.
Proposi
c
ao 14.1 Seja H um grupo topol
ogico e G um subgrupo aberto de H. Ent
ao G e igualmente
um subgrupo fechado de H.
2
Prova. Seja g 0 G, onde G e o fecho de G. Entao, se Ug0 e qualquer aberto de H que contem g 0 ,
tem-se Ug0 G 6= (Proposicao 18.5, pagina 936). Vamos escolher cuidadosamente um tal aberto U g0 .
Seja Ue um aberto de H que contem a identidade. Como G e aberto, V = Ue G e igualmente aberto.
Escolhemos Ug0 = g 0 V := {x H, x = g 0 v para algum v V }. Entao, como Ug0 G 6= existe algum
elemento g G que e tambem elemento de Ug0 , ou seja, g = g 0 v para algum elemento v V . Mas isso
implica que g 0 = gv 1 . Agora, v V = Ue G G e, portanto, g 0 G por ser o produto de dois
elementos de G, que e um grupo.
Proposi
c
ao 14.2 Seja H um grupo topol
ogico conexo e G um subgrupo aberto de H. Ent
ao G = H.
2
Prova. Vamos supor que G 6= H, ou seja, H \ G 6= . Como G e um conjunto aberto e fechado (pela
proposicao anterior) H \ G = H Gc e um conjunto aberto e fechado. Assim, H e a uniao disjunta
de dois conjuntos abertos e fechados, a saber G e H \ G. Isso e uma contradicao com o fato de H ser
conexo. Logo G = H.
Proposi
c
ao 14.3 Seja H um grupo topol
ogico conexo e U um aberto de H que contem a identidade e
que seja tal que para todo u U tem-se u1 U . Ent
ao,
H =

U n,

n=1

onde U 1 := U e
U n := {x H| x = un u1 para ui U, i = 1, . . . , n},

n > 1.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

777/1304

Prova. Todos os conjuntos U n sao conjuntos abertos. Isso e facil de se ver. De fato,
[
U2 =
u2 U
u2 U

e, assim, U 2 e aberto, pois e uma uniao de abertos (vide exerccio a` pagina 775). Analogamente,
[
Un =
un U n1 ,
n > 2.
(14.1)
un U

Por inducao, segue facilmente que todo U n e aberto.


S
n
Assim U :=
e igualmente um conjunto aberto (por ser uma uniao de abertos). Se provarmos
n=1 U
que U e um grupo, a proposicao anterior garante a prova desejada.
evidente que U contem a identidade e (que esta contida em U ). Fora isso, se g1 U n1 e g2 U n2 ,
E
entao g1 = un1 u1 e g2 = u0n2 u01 para certos ui e u0i U. Logo, g1 g2 = un1 u1 u0n2 u01 ,
1
mostrando que g1 g2 U n1 +n2 U. Finalmente, se g U n e g = un u1 , entao g 1 = u1
1 un
n
U U. Isso completa a prova que U e um grupo.
Informalmente, essa proposicao diz que se H e um grupo topologico conexo, entao qualquer aberto
U que contem a identidade gera o grupo H, ou seja, todo elemento de H pode ser escrito como o
produto finito de elementos de U.
Observaca
o. Como a identidade e e um elemento de U , segue facilmente de (14.1) que U n1 U n
para todo n 1.

Seja H um grupo topologico. Dizemos que uma colecao de conjuntos abertos A H, , e um


recobrimento de H se
[
H =
A .

Um grupo topologico e dito ser compacto se possuir a seguinte propriedade: para todo recobrimento
A H, , de H existir um subconjunto finito A1 , . . . , An de conjuntos abertos que tambem e
um recobrimento de H:
H = A 1 A n .
A seguinte proposicao e imediata:
Proposi
c
ao 14.4 Seja H um grupo topol
ogico conexo e compacto e seja U um aberto de H que contem
a identidade e que seja tal que para todo u U tem-se u1 U . Ent
ao, existe um n tal que
H = U n.
2
S
n
Prova. Como H e conexo, pela Proposicao 14.3 tem-se H =
e, portanto,
n=1 U . O lado direito
um recobrimento de H por abertos. Assim, como H e compacto, H tem um recobrimento finito pelos
abertos U n : existem n1 < n2 < < nk tais que H = U n1 U nk . Como U n1 U nk , tem-se
H = U nk , como queramos provar.

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

778/1304

Coment
ario. Na proposicao acima, a igualdade H = U n afirma que todo elemento de H e obtido por
um produto de no maximo n elementos de U . O n
umero n e dependente de U e e intuitivo dizer que
quanto menor for o aberto U que contem a identidade, maior sera n.

14.3

Grupos de Lie Matriciais

Nosso objetivo nesta secao e nas que se seguem e introduzir os grupos de Lie matriciais e discut-los.
Trataremos de alguns exemplos ilustrativos com algum detalhe, comecando com o grupo GL( , n).
Comentemos que essencialmente todas as nossas afirmacoes adiante sobre GL( , n) sao tambem validas
para o grupo real GL( , n).


14.3.1

Uma Topologia M
etrica em GL( , n)

Como preparacao, facamos alguns comentarios topologicos sobre GL( , n). A topologia metrica de
Mat ( , n) discutida na Secao 4.1, pagina 223, pode ser introduzida naturalmente em GL( , n), que
afinal e um subconjunto de Mat ( , n), ao definirmos para A, B GL( , n) a metrica d(A, B) =
kA Bk, sendo k k a norma operatorial de Mat ( , n). Mostremos que GL( , n) e um conjunto
aberto e denso de Mat ( , n).
e um Conjunto Aberto de Mat( , n)
GL( , n)
relevante notarmos que GL( , n) nao e um subconjunto fechado de Mat ( , n). Isso se ve tomando
E


1/m
0
o exemplo da seq
uencia de matrizes diagonais 2 2 da forma Am =
, m , seq
uencia
0
1/m
essa formada por elementos de GL( , 2) mas que converge para a matriz nula, que obviamente nao e
elemento de GL( , 2).


Em verdade, GL( , n) e um conjunto aberto de Mat ( , n). Para mostrar isso temos que provar 2
que se A GL( , n) e B e uma matriz tal que kBAk e suficientemente pequena, entao B e invertvel
e, portanto, tambem pertence a GL( , n). Observemos que B = A ( + A1 (B A)). Se provarmos
1
que +A1 (B A) e invertvel entao teremos que B 1 existe, sendo dada por ( + A1 (B A)) A1 .


Escolhendo B proximo o suficiente de A de modo que kB Ak < 1/kA1 k entao A1 (B A)


tera norma menor que 1 e, portanto, + A1 (B A) tem uma inversa dada pela serie de Neumann3
convergente4

X
1
m
1
+ A (B A)
= +
(1)m A1 (B A)
.


m=1

Isso prova que B tem inversa e completa a prova que GL( , n) e um conjunto aberto.
2

Vide a definica
o de conjunto aberto em espacos metricos dada a
` p
agina 845.
Karl Neumann (1832-1925).
4
A justificativa dessa express
ao foi apresentada na Seca
o 4.2. Note que a expans
ao de Taylor da funca
o analtica
P
para |z| < 1 em torno de z = 0 e precisamente 1 + m=1 (1)m z m .
3

1
1+z

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

779/1304

E. 14.5 Exerccio. Ha uma maneira alternativa rapida de provar que GL( , n) e um conjunto aberto.
Mostre que det(A) e contnua como funcao dos elementos de matriz de A. Mostre que isso implica que
det(A) e contnua na topologia induzida em Mat ( , n) pela norma operatorial (em, verdade, por qualquer
norma, pois sao todas equivalentes). Conclua que GL( , n) e um conjunto aberto, observando para tal que
trata-se do conjunto de todas as matrizes complexas com determinante nao-nulo e notando que \ {0} e
um conjunto aberto em .
6
GL( , n)
e denso em Mat( , n)
Provemos que todo elemento de Mat ( , n) pode ser aproximado em norma por uma matriz invertvel. Isso equivale a dizer que GL( , n) e denso em Mat ( , n). Seja A Mat ( , n) e seja
claro que se 6 (A) entao
(A) = {1 , . . . , r } o conjunto de seus autovalores distintos (r n). E
det( A) 6= 0 e A tem inversa (recorde que os autovalores de A sao os zeros do polinomio
caracterstico de A). Seja agora, n , n , uma seq
uencia de n
umeros complexos tais que n 6 (A)
para todo n, e tais que n 0 para n . Teremos que as matrizes An := A n sao todas
invertveis e d(A, An ) = kA An k = |n | k k = |n | 0 para n . Isso prova nossa afirmacao.


14.3.2

O Grupo de Lie GL( , n)

Nesta secao mostraremos que GL( , n) e um grupo de Lie. Para isso mostraremos primeiro que
GL( , n) e um grupo topologico e depois que e uma variedade analtica, para entao mostrar que o
produto e a inversao sao analticos. Esses resultados, alem de importantes em si, servem ao proposito
pedagogico de ilustrar os conceitos de grupo topologico e de variedade.
GL( , n)
e um Grupo Topol
ogico
Para provarmos que GL( , n) e um grupo topologico precisamos mostrar que o produto em
GL( , n) e a inversao de matrizes em GL( , n) sao operacoes contnuas.
Sejam G, G0 , H GL( , n). Temos que
kG0 H GHk


= k(G0 G)Hk


kG0 Gk kHk ,


mostrando que kG0 H GHk 0 se kG0 Gk 0. Assim, o produto a` esquerda e contnuo.




Sejam agora G, H GL( , n). Fixemos H e tomemos kG Hk <  com  > 0 escolhido pequeno
claro que G = H + (G H) = H( + H 1 (G H)), de
o suficiente de modo que kH 1 k < 1. E
1
maneira que G1 = [ + H 1 (G H)] H 1 . Logo,
n
o
1

G1 H 1 =
+ H 1 (G H)
H 1 .


Assim, como pela escolha de  temos kH 1 (G H)k kH 1 k < 1, podemos escrever
"
#
X


m
G1 H 1 =
(1)m H 1 (G H)
H 1 .


m=1

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

780/1304

A justificativa dessa expressao5 foi apresentada na Secao 4.2. Tem-se, entao,


"
#
X
kH 1 k2
kG1 H 1 k
.
kH 1 km kG Hkm kH 1 k
1 k
1

kH
m=1


Portanto kG1 H 1 k 0 quando kG Hk 0, provando a continuidade da operacao de inversao


de matrizes. Isso completa a prova que GL( , n) e um grupo topologico.


E. 14.6 Exerccio. Ha uma maneira alternativa rapida de provar que a operacao de inversao e contnua:
use a regra de Laplace, expressao (3.8), pagina 145, para calcular a inversa de uma matriz e evoque o fato
que o determinante e contnuo.
6
GL( , n)
e uma Variedade Analtica
Vamos agora mostrar que GL( , n) e uma variedade analtica.
Seja, para cada  > 0, o sub-conjunto C de

n2

definido por

C := {(x11 , . . . , x1n , x21 , . . . , x2n , . . . , xn1 , . . . , xnn )

n2

com |xij | <  para todos i, j = 1, . . . , n}.


Para x = (x11 , . . . , x1n , x21 , . . . , x2n , . . . , xn1 , . . . , xnn ) C , denotemos por X a matriz cujo
elemento ij e Xij = xij e denotemos + X por A(x). Obviamente A(x)ij = ij + xij , i, j = 1, . . . , n.
bem claro que cada C e um sub-conjunto aberto de n2 . Seja tambem U := {A(x) Mat ( , n)| x
E
C }.
E. 14.7 Exerccio. Mostre que cada U e um sub-conjunto aberto de Mat ( , n).

bem claro que para toda matriz A(x) como acima tem-se det(A(x)) = 1 + p(x), onde p(x) e
E
um polinomio nas variaveis xij que se anula quanto todas as xij sao nulas. Assim, se x C ve-se
que det(A(x)) 6= 0 caso  seja pequeno o suficiente, pois isso garante que |p(x)| < 1. Portanto, se
escolhermos  pequeno o suficiente, teremos que U e um sub-conjunto aberto de GL( , n), o que
suporemos daqui por diante.
Seja agora g uma matriz arbitraria de GL( , n) e seja
Ug = {gA(x), com A(x) U }.
Pela notacao que apresentamos quando discutimos grupos topologicos, Ug = gU , e Ug e um aberto de
GL( , n). Fora isso, g Ug , pois = A(0) U . Conclumos que
[
GL( , n) =
Ug ,
gGL( , n)
5
Note que a expans
ao de Taylor da funca
o analtica
P
m m
(1)
z
.
m=1

1
1+z

1 para |z| < 1 em torno de z = 0 e precisamente

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

781/1304

ou seja, GL( , n) possui um recobrimento por abertos.


n2

Vamos agora mostrar que cada Ug e bijetivamente mapeado em um aberto de


simples pois, se para cada g GL( , n) definirmos funcoes gij : Ug por
gij (gA(x)) = gij (g + gX)) := (gX)ij ,
ou seja,
gij (gA(x))

:=

n
X

gik xkj ,

. Isso e bem

i, j = 1, . . . , n,

i, j = 1, . . . , n,

k=1

vemos facilmente que todo h P


Ug e da forma hij = gij + gij (gA(x)). Assim, o conjunto Cg
formado pelas variaveis xij = nk=1 gik xkj com xij C e um sistema de coordenadas para Ug .

n2

Por fim, para todo h Ug Ug0 , teremos h = gA(x) = g 0 A(x0 ), ou seja, A(x0 ) = (g 0 )1 gA(x) e
x0ij

n
X
 0 1 
= ij +
(g ) g ik (kj + xkj ) =
k=1

0 1

(g ) g

ij

n
X


(g 0 )1 g

k=1

ik

xkj ,

o que mostra que as coordenadas x0 sao expressas em termos de polinomios nas variaveis x. Portanto, a
mudanca nas coordenadas de Ug para as de Ug0 e expressa em termos de funcoes analticas (em verdade,
polinomios). Isso provou que GL( , n) e uma variedade analtica.
e Grupo de Lie
GL( , n)
Para finalmente provarmos que GL( , n) e um grupo de Lie, resta-nos provar que a multiplicacao
a` direita e a inversao sao analticas. A primeira parte e elementar. Tomemos g, h GL( , n). Os
elementos de Uh sao da forma hA(x) e os de gUh sao da forma ghA(x) Ugh . Agora, as funcoes de C
em dadas por
C 3 x 7

gh
ij (ghA(x))

n
X

(gh)ik xkj

i, j = 1, . . . , n,

k=1

sao polinomios nas variaveis xij e, portanto, analticas. Assim, o produto e analtico.
Para provar que a inversao e analtica tomemos g GL( , n). Um elemento generico de U g e da
forma gA(x) = g( + X). Agora,
(gA(x))

1 1

= ( + X) g

= g ( + gY (x)g ),

com Y (x) :=

(1)m X m .

m=1

Cada elemento de matriz de Y (x) e uma funcao analtica dos xij , pois a serie de Neumann6 acima
converge absolutamente (claramente, temos que escolher  pequeno o suficiente). Agora, as funcoes



1
1
C 3 x 7 gij (gA(x))1 = gij g 1 ( + gY (x)g 1 ) = gY (x)g 1 ij
sao funcoes analticas dos xij , provando que a aplicacao de inversao e analtica. Isso estabelece finalmente que GL( , n) e um grupo de Lie de dimensao n2 .
6

Karl Neumann (1832-1925).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

782/1304

E. 14.8 Exerccio. Ha uma maneira alternativa rapida de provar que a operacao de inversao e analtica:
use a regra de Laplace, expressao (3.8), pagina 145, para calcular a inversa de uma matriz e evoque o fato
que o determinante e analtico.
6

14.3.3

Sub-Grupos Uniparam
etricos e seus Geradores

Sub-grupos uniparametricos sao muito importantes na teoria dos grupos de Lie. Vamos apresenta-los
no caso de matrizes.
Defini
c
ao. Um sub-grupo uniparametrico de GL( , n) e um homomorfismo contnuo 7 do grupo ( , +)
em GL( , n). Em outras palavras, e uma funcao que a cada t real associa continuamente uma matriz
invertvel (t) de modo que
(t)(t0 ) = (t + t0 )
(14.2)


para todos t, t0

. Note que de (14.2) segue automaticamente que (0) =

(por que?).

A importancia dos sub-grupos uniparametricos reside na seguinte proposicao, a qual tambem comeca
a revelar a relevancia das exponenciais de matrizes na teoria dos grupos de Lie.

Proposi
c
ao 14.5 Seja :
GL( , n) um sub-grupo uniparametrico. Ent
ao existe uma matriz
M Mat ( , n), univocamente definida, tal que (t) = exp(tM ) para todo t . Esse fato, em
particular, mostra que e real-analtica (e, portanto, diferenci
avel) e que M = 0 (0). A matriz M e
dita ser o gerador do sub-grupo uniparametrico .
2


Prova.8 Se supusessemos que e uma matriz diferenciavel proximo a t = 0, teramos que para qualquer
t


1
1
0
(t) = lim ((t + s) (t)) = (t) lim ((s) (0)) = (t) 0 (0).
s0 s
s0 s

Definindo M := 0 (0), concluiramos que satisfaz a equacao diferencial 0 (t) = (t)M , cuja solucao e
u
nica (vide Captulo 7) e dada por (t) = exp(tM ), como queramos provar.
A demonstracao estaria completa, nao fosse o fato de que no enunciado supomos apenas que e
no entanto, possvel
contnua, o que em geral nao implica que seja tambem diferenciavel em t = 0. E,
provar que se e contnua, entao pelo fato de ser um homomorfismo de ( , +) segue que e tambem
diferenciavel proximo a t = 0! A ideia e construir a partir de uma funcao infinitamente diferenciavel
e posteriormente mostrar que pode ser recuperada de por operacoes diferenciaveis.


Para tal seja uma funcao real, positiva infinitamente diferenciavel, com suporte compacto contendo
t = 0 e tal que
Z

(s)ds = 1.

Vide nota a
` p
agina 785.
Extrada de [63]. A observaca
o de que no enunciado da Proposica
o 14.5 e suficiente supor-se que o sub-grupo
uniparametrico e apenas contnuo (dispensando uma condica
o de diferenciabilidade) e devida a von Neumann.
8

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

Um exemplo de uma tal funcao seria (para a < 0 < b)



(

K exp (sa)21(sb)2 ,
(s) =
0,

783/1304

para s (a, b)
de outra forma,

que tem suporte [a, b] 3 0. Uma escolha conveniente da constante K garante que

(s)ds = 1.

Assim, seja uma tal funcao desse tipo e com suporte em, digamos, [a, a] para algum a > 0, e
seja
Z
(t s)(s)ds.
(t) :=

facil (Exerccio!) ver que assim definida e infinitamente diferenciavel. Fora isso,
E
Z

(t) =

(t s)(s)ds =

(u)(t u)du =

(u)(t)(u)du

= (t)
R

com Y :=

pois

(u)(u)du = (t)Y,

(u)(u)du. Temos que


Y

(u)((u) )du,

(u)du = 1, por hipotese. Logo

kY k


(u) k(u) k du =


(u) k(u) k du


(u) du = c
a

(u) du = c ,

onde c := supu[a, a] k(u) k . Como e contnua e (0) = , podemos fazer c arbitrariamente


pequena, escolhendo
Mas isso diz que Y = ( Y ) e invertvel, com Y 1 dado pela
Pa pequeno.
m
serie convergente m=0 ( Y ) . Assim, com a pequeno teremos (t) = (t)Y 1 , o que prova que (t)
e infinitamente diferenciavel.


Defini
c
ao. O que essa proposicao provou e que todo sub-grupo uniparametrico de GL( , n) e da
forma exp(tM ) para alguma matriz M Mat ( , n). Essa matriz M e dita ser o gerador do sub-grupo
uniparametrico em questao.
Comentemos brevemente que a Proposicao 14.5, que acabamos de provar, tem generalizacoes importantes na teoria dos espacos de Hilbert e de Banach, onde e conhecida como Teorema de Stone 9 .
Vide, por exemplo, [103].
9

Marshall Harvey Stone (1903-1989).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

784/1304

A Cole
c
ao de todos os Geradores de Sub-grupos Uniparam
etricos
Seja G um sub-grupo de GL( , n). Seja definido o seguinte conjunto:
L(G) := {M Mat ( , n)| exp(tM ) G,

} .


Analogamente, seja G um sub-grupo de GL( , n). Seja definido o seguinte conjunto:




L(G) := {M Mat ( , n)| exp(tM ) G, t




} .

Em palavras, L(G) e a colecao de todos os geradores de todos os sub-grupos uniparametricos de


claro, pela definicao, que L(G) contem sempre pelo menos a matriz nula (pois exp(t0) = G,
G. E
t ), mas nao e nem um pouco evidente que esse nao seja o u
nico elemento de L(G). Por exemplo,
se G for um grupo discreto entao L(G) = {0}. Mesmo no caso de G ser um grupo contnuo nao e nada
obvio que G possua sub-grupos uniparametricos nao-triviais. Logo abaixo estudaremos essa questao
no caso do grupo GL( , n) e, um pouco mais adiante, no caso de sub-grupos fechados (nao-discretos)
de GL( , n). Em tais casos veremos que L(G) nao consiste apenas da matriz nula.


Chamamos a atencao do estudante para o fato que, para um grupo G generico, nao e necessariamente
verdade que todo elemento de G pode ser escrito na forma exp(tM ) para algum M L(G) e algum
t . Ou seja, existem grupos G nos quais encontram-se elementos que nao pertencem a nenhum
sub-grupo uniparametrico de G. Na Proposicao 4.10, pagina 236, vimos que isso ocorre no grupo real
GL( , n), pois esse grupo nao e conexo, mas esse fenomeno pode ocorrer mesmo em grupos conexos.
Um exemplo sera discutido na pagina 803, adiante.


*
A colecao de todos os geradores de todos os sub-grupos uniparametricos de um dado grupo G e um
objeto muito importante, especialmente na teoria dos grupos de Lie. Discutiremos esse fato adiante.
No caso do grupo GL( , n) podemos facilmente identificar o que e L(GL( , n)). Faremos isso agora.

Sub-grupos Uniparam
etricos de GL( , n) e a Algebra
de Lie Associada a GL( , n)
A colecao de todos os geradores de todos os subgrupos uniparametricos do grupo GL( , n) sera
denotada aqui por L(GL( , n)) ou por gl( , n). Vamos identificar esse conjunto.
Na Proposicao 4.11, pagina 236, demonstramos que todo elemento A GL( , n) pode ser escrito
na forma A = exp(B) para algum B Mat ( , n). Conseq
uentemente, A pertence ao subgrupo
uniparametrico composto pelas matrizes da forma exp(tB), t . Assim, GL( , n) possui subgrupos
uniparametricos nao-triviais. Reciprocamente, para todo B Mat ( , n) o conjunto de matrizes
da forma exp(tB), t , forma um subgrupo uniparametrico de GL( , n). Conclumos disso que
L(GL( , n)) = Mat ( , n).


Ja discutimos por diversas vezes (vide pagina 57 e seguintes) que o conjunto Mat ( , n) e uma
algebra de Lie com relacao ao produto definido pelo comutador de matrizes. Um pouco mais adiante,
veremos que esse fato e geral: o conjunto de todos os geradores de um subgrupo fechado (nao-discreto)
de um grupo de Lie e tambem uma algebra de Lie. Esse fato e de importancia central na teoria dos
grupos de Lie.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

785/1304

E. 14.9 Exerccio. Para a, b = 1, . . . , n e , sejam ab (t), matrizes definidas da seguinte forma:

para a 6= b
+ tE ab ,
ab
,
com t .
(t) :=

+ (et 1)E aa , para a = b



Aqui E ab e a matriz cujos elementos ij sao dados por E ab ij = i a j b , ou seja, E ab e a matriz cujos
elementos de matriz sao todos nulos, exceto o elemento ab, que vale 1. Mostre que as matrizes ab sao
subgrupos uniparametricos de GL( , n), ou seja, que ab (t) sao contnuas e que ab (t)ab (t0 ) = ab (t + t0 )
2
para todo a, b e todo . (Sugest
ao: mostre que E ab = ab E ab e use esse fato). Mostre
que seus

6
geradores sao as matrizes E ab . Constate tambem explicitamente que ab (t) = exp tE ab .


Note que a colecao formada por todas combinacoes lineares reais dos geradores dos subgrupos
uniparametricos ab de GL( , n) coincide com Mat ( , n) (por que?).
E. 14.10 Exerccio. Como sao as relacoes de comutacao das matrizes E ab ?

Homomorfismos N
ao-Contnuos de ( , +)


Contemplando a definicao de sub-grupo uniparametrico que apresentamos acima, como sendo um


homomorfismo contnuo de ( , +) em um grupo G, o estudante pode legitimamente questionar se
existem, afinal, homomorfismos nao-contnuos desse grupo que justifiquem a necessidade de evocar
a condicao de continuidade na Proposicao 14.5. Talvez um tanto surpreendentemente, a resposta e
positiva. Ha ate mesmo automorfismos nao-contnuos de ( , +) em si mesmo, os quais foram apresentados a` pagina 98, onde discutimos a existencia de funcoes descontnuas de em que satisfazem
f (t) + f (t0 ) = f (t + t0 ) para todos t, t0 . Assim, com o uso de uma tal funcao f , e relativamente
facil construir um homomorfismo nao-contnuo de ( , +) em um grupo G dado, caso conhecamos um
homomorfismo contnuo de ( , +) em G. De fato, se (t), t , e um homomorfismo contnuo de
( , +) em G entao (f (t)), t , e um homomorfismo de ( , +) em G, mas que nao e contnuo.
Dada a artificialidade daquelas funcoes f , tais exemplos sao um tanto patologicos, mas explicam
a necessidade de incluir a condicao de continuidade na definicao de sub-grupo uniparametrico e na
Proposicao 14.5.


14.3.4

Sub-Grupos Uniparam
etricos e Algebras
de Lie

Sub-Grupos Uniparam
etricos em Sub-Grupos Fechados
Defini
c
ao. Seja H um subgrupo fechado mas nao discreto de GL( , n). Definimos


L(H) := X Mat ( , n) tais que etX H para todo t
.


claro,
Como se ve, trata-se do conjunto dos geradores de todos os subgrupos uniparametricos de H. E
pela definicao acima, que L(H) possui pelo menos um elemento, a saber a matriz nula, pois, obviamente
et0 = H para todo t . Nao e nem um pouco obvio, porem, que haja outros elementos em L(H)


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

786/1304

que nao o elemento nulo. Nao e sequer obvio que existam subgrupos uniparametricos nao-triviais 10 em
H. Na Proposicao 14.6 adiante, provaremos que L(H), de fato, e nao-trivial e que ha, de fato, subgrupos
uniparametricos nao-triviais em H. Para demonstrarmos a Proposicao 14.6 precisamos de algumas
definicoes e de alguns resultados preparatorios. Seguiremos muito proximamente a exposicao de [97]
(vide todo o 2 do Captulo XI daquela referencia), mas com ligeiras correcoes e aperfeicoamentos.
Para simplificar a notacao denotaremos aqui o grupo GL( , n) por G e sua algebra de Lie
Mat ( , n) por g.
Fixemos doravante um n
umero r > 0, arbitrario mas conveniente, e seja wr a bola fechada de raio
r centrada na origem em g:
wr := {X g| kXk r} .
(14.3)
Notemos que wr e simetrica, ou seja, se X wr entao X wr . Denotaremos por wO
r a bola aberta
de raio r centrada na origem em g:
wO
r := {X g|

kXk < r} .

(14.4)

Vamos denotar por Wr a imagem de wr pela exponenciacao:


Wr := {exp(X), X wr } .

(14.5)

claro que Wr G e e claro que Wr e simetrico, ou seja, se Y Wr entao Y 1 Wr .


E

Como H e um subconjunto fechado de G, o conjunto H Wr e fechado. Seja fr o subconjunto de


wr formado pelos elementos cuja exponencial esta em H Wr :
fr := {X wr | exp(X) H Wr }.

(14.6)

Comentemos que, pela Proposicao 4.11, pagina 236, todo elemento de H e uma exponencial de algum
elemento de g = Mat ( , n). Portanto, todo h H Wr e da forma h = exp(f ) para algum f fr .
Simbolicamente, podemos escrever
exp(fr ) = H Wr .
(14.7)
bastante claro que fr e tambem simetrico. Como exp e contnua, fr e tambem fechado (vide Secao
E
22.2, pagina 993). Fora isso, fr wr , por definicao. Logo, fr e limitado. Por ser fechado e limitado, fr
e compacto.
Definamos M(H, Wr ) Mr por
Mr := {X g tais que, para algum  > 0, tem-se exp(tX) H Wr sempre que |t| < } . (14.8)
Alternativamente, e claro que
Mr = {X g tais que, para algum  > 0, tem-se tX fr sempre que |t| < } .
Note-se que Mr contem sempre ao menos um elemento, a saber, 0. Nao e nada obvio, porem, se
esse e o u
nico elemento de Mr . No Corolario 14.1, adiante, provaremos que tal nao e o caso, ou seja,
Mr nao e trivial. Antes disso precisamos de dois lemas preparatorios.
10

Um subgrupo uniparametrico (t) e trivial se (t) for igual ao elemento neutro para todo t

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

787/1304

Lema 14.1 Com as definico


es acima, valem as seguintes afirmaco
es. I. Se X M r ent
ao X Mr
para todo . II. wr Mr fr .
2


Prova do Lema 14.1. Se X Mr entao, para algum  > 0 tem-se tX fr sempre que |t| < . Mas,
entao, se 6= 0, vale t(X) fr sempre que |t| < /||. Isso prova a afirmativa I.

Seja agora X wr Mr . Queremos provar que X fr . Como X Mr entao, para algum  > 0
tem-se exp(tX) H Wr sempre que |t| < . Assim, para n grande o suficiente (n > 1 ) teremos
exp(n1 X) H Wr o que, em particular, diz que exp(n1 X) H. Como H e um grupo, tem-se que
(exp(n1 X))n H. Mas o lado esquerdo e exp(X) e, portanto, conclumos que exp(X) H. Agora,
por hipotese, X wr , o que implica, pela definicao de Wr , que exp(X) Wr . Logo, mostramos que
exp(X) H Wr , o que significa que X fr . Provamos, assim, que wr Mr fr . Isso completa a
prova do Lema 14.1.


Podemos agora demonstrar o seguinte lema, de importancia central no presente contexto e, talvez,
o resultado preparatorio tecnicamente mais difcil.
uencia de elementos de fr tais que Xn 6= 0. Suponhamos que
Lema 14.2 Seja Xn , n , uma seq
Xn 0 para n e que Xn /kXn k Y para algum Y Mat ( , n). Ent
ao11 Y Mr .
2


Prova do Lema 14.2. Notemos antes de mais nada que se Yn := Xn /kXn k Y Mat ( , n) entao
Y 6= 0. Em verdade, kY k = 1 pois, fazendo uso da desigualdade (2.19), pagina 123, temos | kY n k
kY k | kYn Y k. Como o lado direito vai a zero quando n , segue que kY k = 1, pois kYn k = 1.
Fixemos tambem um n
umero m

nao nulo. Podemos escrever wr como a uniao


wr =

m
[

sk

k=1

onde




k1
k
sk
:= X wr
r kXk r ,
m
m
ou seja, podemos escrever wr como uma uniao de fatias, ou cascas esfericas, de vetores com normas
k
re m
r. Note-se que s1 e a bola fechada de raio r/m centrada em 0:
entre k1
m

n
r o

s1 = X wr kXk
.
m
srk

Como Xn converge a 0, existe um n


umero Nm (que pode depender de m) tal que Xn s1 para todo
n > Nm . Seja agora um k0
fixo, escolhido de modo que 1 < k0 m. Vamos mostrar que para
cada n > Nm podemos encontrar um n
umero inteiro jn (eventualmente dependente de n) de modo que
jn Xn sk0 , ou seja, tal que
(k0 1)r
k0 r
kjn Xn k
.
m
m


11

Ap
os a demonstraca
o do Lema 14.2, discutiremos a
` p
agina 789 que de fato existem seq
uencias satisfazendo essas
hip
oteses.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

788/1304

Para isso, e suficiente escolhermos um jn inteiro satisfazendo


(k0 1)r
k0 r
|jn |
.
mkXn k
mkXn k
Havera inteiros no intervalo entre
intervalo e

(k0 1)r
mkXn k

k0 r
?
mkXn k

Para ver isso, notemos que o comprimento desse

k0 r
(k0 1)r
r

=
1,
mkXn k
mkXn k
mkXn k

pois kXn k mr , dado que Xn s1 . Entao, uma tal escolha de jn e sempre possvel para cada n (pois
todo intervalo fechado de comprimento igual ou maior que 1 contem ao menos um inteiro).
(k )
evidente que Yn(k0 ) sk0 wr . Isso implica
Vamos
jn Xn por Yn 0 (com k0 fixo). E
 denominar

(k )
(k )
que exp Yn 0 Wr . Fora isso, exp Yn 0 = exp(jn Xn ) = (exp(Xn ))jn . Como exp(Xn ) pertence ao


(k )
grupo H (pois Xn fr ), segue pela propriedade de grupo que tambem tem-se exp Yn 0 H (e por


(k0 )
essa razao que escolhemos jn inteiro). Com isso, provamos que exp Yn
H Wr , o que significa
(k0 )

que12 Yn

fr .

O conjunto fr e fechado e limitado e, portanto, compacto. Isso significa que existe uma sub(k )
seq
uencia Ynl 0 , l , que e convergente em fr . Agora, como Yn = Xn /kXn k converge a Y , isso
(k )
(k )
significa que Ynl 0 converge a um m
ultiplo de Y , digamos (k0 ) Y , pois Ynl 0 e um m
ultiplo de Ynl , a
(k0 )
(k0 )
(k0 )
saber, Ynl = jnl kXnl kYnl . Portanto, para um tal
temos Y fr . Note que tambem tem-se
(k0 )
Y fr , bastando para tal trocar Xn por Xn na argumentacao acima, o que e permitido pois fr
e simetrico.


Assim, (k0 ) = lim jnl kXnl k e, conseq


uentemente,
l



(k0 1)r
k0 r
(k0 )
.
m
m

O que provamos acima vale para cada k0


com 1 < k0 m.h Resumindoi nossas conclusoes,
provamos que para todo m
nao-nulo, cada intervalo Ik0 , m := (k0m1) r, km0 r com 1 < k0 m


contem pelo menos um (k0 ) tal que (k0 ) Y fr .


m
[


A uniao
Ik0 , m e o conjunto m1 r, r . Esses intervalos Ik0 , m podem ser feitos mais finos e em
k0 =2

[ 1
maior n
umero, fazendo m , sendo que
r, r = (0, r].
m
m


Conclumos disso que existe um conjunto contavel denso de n


umeros no intervalo (0, r] tais que
Y fr . Como fr e fechado, isso implica que Y fr para todo [r, r]. Agora, isso significa
precisamente que Y Mr , que e o que queramos provar.
A prova do Lema 14.2 esta completa.

12

(k0 )

Em [97] o argumento que prova que Yn

fr n
ao est
a correto, lamentavelmente.

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

789/1304

Podemos nos perguntar agora, sera que existem seq


uencias Xn satisfazendo as hipoteses do Lema
facil ver que sim. Notemos para isso que
14.2, ou seja, tais que Xn /kXn k convirja para algum Y ? E
para qualquer seq
uencia Xn fr com Xn 0 a seq
uencia Yn = Xn /kXn k esta contida no conjunto
compacto formado pelos vetores de norma 1. Assim, Yn sempre tem uma sub-seq
uencia convergente
a algum Y , que tambem tem norma 1. A essa sub-seq
uencia aplica-se entao o Lema 14.2 e tem-se
Y Mr . Isso, em particular, mostra-nos que Mr e nao-trivial, ou seja, contem elementos nao-nulos.
Provamos entao:
Corol
ario 14.1 O conjunto Mr definido acima contem elementos diferentes de 0.

Esse simples corolario e crucial para o que segue13 , pois tem a seguinte conseq
uencia.
Proposi
c
ao 14.6 Seja H um subgrupo fechado e n
ao-discreto de GL( , n)). Ent
ao valem as seguintes
afirmativas. I. Mr = L(H) para qualquer r > 0. II. L(H) e n
ao-trivial, ou seja, n
ao consiste apenas
da matriz nula. H
a, portanto, subgrupos uniparametricos n
ao-triviais em H.
2
Prova. Seja o conjunto Mr M(H, Wr ) definido em (14.8), com Wr definido em (14.3)-(14.5) para
algum r > 0. Provaremos que M(H, Wr ) = L(H).
Em primeiro lugar, e claro (por definicao!) que se X L(H) teremos exp(tX) H, t . Se
X = 0 entao X M(H, Wr ) trivialmente. Se X 6= 0 entao, se escolhermos |t| < r/kXk, teremos que
tX wr . Logo, X M(H, Wr ). Isso mostra que L(H) M(H, Wr ).


Seja X M(H, Wr ) com X 6= 0. Pelo Corolario 14.1, um tal X existe. Assim, existe um  > 0
tal que exp(t0 X) H para todo t0 (, ). Seja agora t
qualquer. Se escolhermos n
com |n| grande o suficiente, teremos |t/n| < . Da, exp((t/n)X) H e, como H e um grupo,
exp(tX) = (exp((t/n)X))n H. Como isso vale para qualquer t provamos que X L(H).


Com isso provamos que M(H, Wr ) L(H) e, portanto, M(H, Wr ) = L(H). Assim, pelo Corolario
14.1, L(H) e nao-trivial. Conseq
uentemente existem em H subgrupos uniparametricos nao-triviais, a
saber aqueles que tem como geradores os elementos nao-nulos de M(H, Wr ).

*
Chegamos agora ao ponto em que boa parte do que fizemos sera unificado e revelaremos a importancia de sub-grupos uniparametricos para os grupos de Lie matriciais.

Sub-Grupos Uniparam
etricos e Algebras
de Lie
Seja H um sub-grupo fechado e nao-discreto de GL( , n). O seguinte teorema, o qual e uma conseq
uencia das formulas de Lie-Trotter e do comutador (vide Captulo 4), e de importancia fundamental:
13

Infelizmente, alguns textos como [119], [130] e mesmo (surpreendentemente) [101], n


ao provam que M r e n
ao-trivial,
o que torna suas demonstraco
es do Teorema 14.2 incompletas. Mesmo [97], que prova os Lemas 14.1 e 14.2, n
ao menciona
o Corol
ario 14.1, embora o mesmo fique implcito pela sua an
alise. A referencia [63], que segue outra e muito interessante
linha de raciocnio, e explcita quanto ao Corol
ario 14.1.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

790/1304

Teorema 14.1 Se H e um sub-grupo fechado e n


ao-discreto de GL( , n) ent
ao L(H), definida acima,
e uma a
lgebra de Lie real14 .
2
Prova. Vamos primeiramente mostrar que L(H) e um espaco vetorial real. Para tal, precisamos mostrar
que se X e Y sao geradores de dois sub-grupos uniparametricos de H, entao X + Y tambem o e,
para quaisquer , . Comecemos observando que (t) := exp(t(X + Y )) e um sub-grupo
uniparametrico contnuo de GL( , n) cujo gerador e obviamente X + Y . Tudo o que precisamos
fazer e mostrar que (t) H para todo t . Pela formula de Lie-Trotter (vide Captulo 4),


m


t
t
X exp
Y
exp(t(X + Y )) = lim exp
.
(14.9)
m
m
m


X e exp t
Y pertencem ao grupo
Observemos entao o seguinte. Pela hipotese, as matrizes exp t
m
m
H, pois supomos
que

 X e Y sao geradores de subgrupos uniparametricos de H. Portanto os produtos
t
X
exp
Y
sao tambem elementos de H, pois H e um grupo. Ora, o lado direito de (14.9) e,
exp t
m
m
portanto, o limite de uma seq
uencia de elementos de H. Como supomos que H e fechado, segue que o
limite e igualmente um elemento de H, como queramos mostrar. Isso provou entao que X + Y
L(H) para quaisquer , e, portanto, L(H) e um espaco vetorial real.


Vamos mostrar agora que L(H) e uma algebra de Lie. Se X, Y L(H) temos, pela formula do
comutador (vide Captulo 4), e usando [tX, Y ] = t[X, Y ], que
exp(t[X, Y ]) = lim

exp







m2
t
1
1
t
X exp
Y exp X exp Y
.
m
m
m
m

(14.10)

Raciocnio identico ao que empregamos acima conclui que exp(t[X, Y ]) H para todo t , mostrando que [X, Y ] e o gerador de um sub-grupo uniparametrico contnuo de H, ou seja, [X, Y ] L(H).
Isso provou que L(H) e uma algebra de Lie.


Coment
ario. Se para todo X L(H) tivermos tambem X L(H) para todo
demonstracao acima que L(H) e uma algebra de Lie complexa.

14.3.5

, conclui-se pela

Subgrupos Fechados de GL( , n)

Nesta Secao provaremos o seguinte teorema:


Teorema 14.2 Se H e um subgrupo topologicamente fechado de GL( , n) (na topologia metrica induzida de GL( , n)) e H n
ao e discreto, ent
ao H e tambem um grupo de Lie (na topologia metrica
induzida de GL( , n)).
2
O Teorema 14.2 e particularmente importante pois muitos grupos encontrados em aplicacoes sao
sub-grupos fechados (nao discretos) de GL( , n) ou de GL( , n). Tal e o caso, por exemplo, dos


14

Algebras de Lie foram definidas a


` p
agina 57.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

791/1304

grupos U(n), U(p, q), SU(n), SU(p, q), O(n), SO(n) e outros. Assim, o Teorema 14.2 nos informa que
tais grupos sao grupos de Lie.
A prova desse teorema sera oferecida a` pagina 793. Antes de chegarmos la precisaremos apresentar
varios teoremas preparatorios. Chamamos a atencao do leitor para o fato que as demonstracoes de
alguns desses resultados preparatorios sao bastante tecnicas e talvez devam ser omitidas em uma
primeira leitura.
Seja H um subgrupo fechado nao-discreto de G = GL( , n). Sabemos pelo Teorema 14.1 que L(H)
e um sub-espaco de L(G) = Mat ( , n). Seja L(H) seu complemento ortogonal (em relacao a algum
produto escalar em Mat ( , n), por exemplo hA, Bi = Tr(A B)). Todo elemento A Mat ( , n)
pode ser escrito de modo u
nico na forma A = Ak + A , com Ak L(H) e A L(H) .
Seja assim a funcao H : L(G) G definida por



H (A) := exp Ak exp A .

Lema 14.3 Para H, subgrupo fechado e conexo de GL( , n), existe r0 > 0 tal que a aplicaca
o H
O
0
0
definida acima e um homeomorfismo do aberto wO
em
um
aberto

(w
)

W
para
um
certo
r
H
r0
r0
r0
0 > 0.
2
Acima, wO
e a bola aberta de raio r0 em torno da matriz nula. Vide (14.4).
r0
Prova. Escolhamos r0 pequeno o suficiente para que valha a formula de Baker-Campbell-Hausdorff15 .
Considere-se a aplicacao H : L(G) L(G) definida por H (A) = ln (H (A)), ou seja,


H (A) := ln exp Ak exp A
= Ak A = A + H (A) ,
(lembre-se que Ak + A = A) onde
H (A) :=

1  k 
1  k  k    k 
A, A +
A, A , A
+ A , A , A
+ .
2
12

H (A)k
0 para kAk 0. Assim, H e contnua e diferenciavel em uma
Como facilmente se constata, kkAk
vizinhanca de 0 e e sua derivada em 0 e a identidade. Assim, pelo bem conhecido Teorema da Aplicacao
Inversa (vide, Secao 17.4, pagina 907, ou por exemplo, [88]), H e um homeomorfismo entre wO
r0 e sua
imagem. Como H = exp H e a exponencial e tambem um homeomorfismo local (Proposicao 4.4,
pagina 231), a prova do Lema 14.3 esta completa.

Seja H um subgrupo fechado de GL( , n). Vimos acima que L(H) Mat ( , n) e uma algebra
evidente que se A L(H) entao exp(A)
de Lie real e, como tal, um sub-espaco de Mat ( , n). E
e o subgrupo de H cujos elementos sao produtos finitos de exponenciais de
H. Vamos denotar por H
elementos de L(H):
e := {h H, h = exp(A1 ) exp(Am ) para algum m
H

e e de fato um grupo, pois


H
15

}.

Vide Captulo 4, p
agina 222. A f
ormula de Baker-Campbell-Hausdorff e dada em (4.46) a
` p
agina 249.

JCABarata. Curso de Fsica-Matem


atica

1.

Captulo 14

Vers
ao de 29 de setembro de 2005.

792/1304

e
H,

e entao h1 = exp(Am ) exp(A1 ) H


e e
2. se h = exp(A1 ) exp(Am ) H

e entao tem-se, evidentemente, hh0 =


3. se h = exp(A1 ) exp(Am ) e h0 = exp(A01 ) exp(A0m0 ) H
0
0
e
exp(A1 ) exp(Am ) exp(A1 ) exp(Am0 ) H.

e e denominado subgrupo gerado por L(H). Vamos provar o seguinte teorema:


O grupo H

e = H.
Teorema 14.3 Se H e fechado e conexo ent
ao H

e H, de modo que queremos apenas provar que H H.


e
Prova. Ja e evidente, pela definicao, que H
Seja r > 0, fixo. O que faremos e provar que fr L(H) wr0 para algum r 0 > 0. Se isso for
verdadeiro, entao, pela definicao de fr em (14.6) e por (14.7), os elementos de H Wr sao da forma
exp(A) com A L(H) wr0 . Agora, pelo fato de H ser conexo, sabemos pela Proposicao 14.3, que
todo elemento de H pode ser escrito como um produto finito de elementos do interior de H Wr . Logo,
todo elemento de H pode ser escrito como um produto finito exp(A1 ) exp(Am ), para algum m ,
e que e o que queramos provar.
com Ak L(H) wr0 . Ora, isso esta precisamente dizendo que H H,


Vamos entao mostrar que fr L(H) wr0 para algum r 0 > 0. A demonstracao sera feita por
absurdo, ou seja, supondo que nao existam r e r 0 > 0 tais que fr L(H) wr0 e chegando-se da a
uma contradicao.
muito facil ver pela definicao dos conjuntos fr em (14.6) que fr1 fr2 sempre que r1 r2 . Alem
E
\
disso,
fr = {0}.
r>0

Para um r 0 arbitrario, fixo, vamos entao supor que nao haja nenhum fr com fr L(H) wr0 . Isso
implica que fr \ (L(H) wr0 ) 6= para todo r. Fixando r, poderamos escolher uma seq
uencia rn < r,
rn 0 com frn \ (L(H) wr0 ) 6= . Escolhendo para cada n um elemento Xn frn \ (L(H) wr0 ),
teremos que Xn fr \ (L(H) wr0 ) para todo n e Xn 0 quando n .

Como Xn 0, teremos exp(Xn ) Wr00 para para todo n grande o suficiente, onde r00 e referido
no enunciado do Lema 14.3. Assim, pelo mesmo lema, existir
de tais ns um elemento
 cada um
a para

k
k

Zn wr0 , Zn = Zn + Zn , tal que exp (Xn ) = H (Zn ) = exp Zn exp Zn .


k

Antes de prosseguirmos, facamos algumas observacoes sobre Zn e Zn . Como Xn 0, deve valer


tambem Zn 0 ja que, pelo Lema 14.3, H e sua inversa sao contnuas. Assim, tem-se igualmente
k
Zn 0 e Zn 0. Pela parte II do Lema 14.1 e pela parte I da Proposicao 14.6, segue que w r L(H)
k
fr . Da, para n grande o suficiente, ter-se-a Zn fr . Note-se tambem que, como
n 6 L(H) para
 X
k

n grande, teremos Zn 6= 0, pois, se assim nao fosse, valeria exp (Xn ) = exp Zn e, tomando-se
k

o logaritmo (o que e permitido para n grande, ja que kXn k e kZn k estao ambos proximos a zero),
k
obteramos Xn = Zn L(H), o que e impossvel.



k

Como conseq
uencia das observacoes acima, teremos que exp Zn = exp Zn exp (Xn ). Sucede


 
k
k
que exp (Xn ) H Wr e exp Zn H Wr . Assim exp Zn H e, kZn k kZn k < r0 . Logo,

exp Zn H Wr0 . Portanto, Zn fr0 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

793/1304

Como conseq
uencia do Lema 14.2, da parte I da Proposicao 14.6 e da compacidade de f r0 , a seq
uencia
de vetores de norma 1 dada por Zn /kZn k tem uma sub-seq
uencia que converge a um elemento de
Mr0 = L(H). Porem, como Zn L(H) , isso e impossvel e tem-se a uma contradicao. Logo, deve
valer fr L(H) wr0 para certos r, r 0 > 0. Isso completa a prova do Teorema 14.3.
Podemos agora reunir os resultados que provamos acima e passar a`
Prova do Teorema 14.2.
Seja H um subgrupo fechado de GL( , n). Como veremos, e suficiente provarmos o teorema
considerando apenas a componente de H que e conexa ao elemento neutro, componente essa que
denominaremos H0 . Isso pois se provarmos que H0 e uma variedade, a demonstracao facilmente se
estendera para todo H. Esse ponto sera discutido com mais detalhe ao final da demonstracao, de modo
que, por ora, nos limitamos a considerar o caso em que H e conexo (o que, no caso geral, equivale a
nos restringirmos a H0 ).
e e um grupo de Lie. Pelo Teorema 4.4, podemos encontrar
Pelo Teorema 14.3, basta provarmos que H
uma vizinhanca aberta de V de 0 em Mat ( , n) e uma vizinhanca aberta W de em GL( , n) tais que
exp : V W e um difeomorfismo. Seja VH a vizinhanca de 0 em L(H) definida por VH = V L(H) e
e pela exponencial. A aplicacao exp : VH WH e tambem um difeomorfismo,
seja WH sua imagem em H
pois e a restricao de um difeomorfismo (a saber exp : V W ) por uma funcao suave (a projecao
V VH ). Existe naturalmente um sistema de coordenadas em VH , pois L(H) e um espaco vetorial
e, portanto, isomorfo a k , k sendo a dimensao de L(H). Dessa forma como exp : VH WH e
uma bijecao, exp1 : WH VH estabelece um sistema de coordenadas em WH . Para estabelecer um
e por exemplo, em torno de um elemento h H,
e podemos transladar
sistema de coordenadas em todo H,
o sistema de coordenadas de WH para uma vizinhanca de h, a saber, hWH . As cartas locais assim
obtidas serao compatveis (infinitamente diferenciaveis ou analticas) devido ao fato de exp : V H WH
ser um difeomorfismo e pelo fato de a multiplicacao por um h constante nao alterar esse carater. O
argumento de translacao pode ser aplicado mesmo a elementos de H que nao estao na componente
conexa a` identidade, de modo que todo H se torna uma variedade de dimensao k. O produto e a
inversa sao contnuas e infinitamente diferenciaveis por o serem em GL( , n) e tambem devido ao fato
de exp : VH WH ser um difeomorfismo. A demonstracao do Teorema 14.2 esta entao completa
Coment
ario. Segundo [97], o Teorema 14.2 e devido a Cartan16 . Demonstracoes desse importante
teorema podem ser encontradas em varios livros-texto, como por exemplo [97] ou [101]. Devemos,
porem, notar ao leitor e advertir o estudante que alguns textos (inclusive alguns classicos) apresentam
certas falhas tanto no enunciado do teorema quanto na sua demonstracao, falhas essas que procuramos
corrigir e evitar nas demonstracoes acima. Por exemplo, muitos autores esquecem-se de excluir do
enunciado o caso (trivial) em que H e fechado mas discreto (grupos discretos obviamente nao podem ser
grupos de Lie), por vezes ressalvando isso apenas no correr da demonstracao. Varios textos apresentam
demonstracoes incompletas (por exemplo, [119], [130] e mesmo parcialmente [101]), pois deixam por
exemplo, de provar que o conjunto Mr , definido acima, nao e apenas formado pelo elemento nulo, um
ponto crucial. A demonstracao que apresentamos e essencialmente (mas nao exatamente) a de [97]
(vide todo 2 do Captulo XI daquela referencia). Um outro tratamento excelente (mas talvez nao
acessvel a todo estudante) e o de [63].
16

Elie Joseph Cartan (1869-1951). E. J. Cartan foi um dos mais importantes contribuidores a
` teoria de grupos de Lie.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

794/1304

Um ponto importante do Teorema 14.2 e que o subgrupo fechado H e um grupo de Lie com a
topologia induzida em H por G. Em verdade, vale para grupos de Lie um teorema mais ainda forte
que o Teorema 14.2:
Teorema 14.4 Todo subgrupo n
ao-discreto H de um grupo de Lie G e tambem um grupo de Lie, mas
n
ao necessariamente em relaca
o a
` topologia induzida por G em H.
2
Como se ve, esse teorema generaliza o Teorema 14.2 pois nao e necessario requerer que H seja um
subgrupo fechado de G. Porem, a topologia na qual H e um grupo de Lie pode nao ser a topologia
induzida em H por G. Um exemplo ilustrativo sera discutido na Secao 14.4.3. A demonstracao do
Teorema 14.4 teorema esta alem dos limites dessas notas e pode ser encontrada em textos como [101]
ou [63].
*
O Teorema 14.1, pagina 790, revela um sentido da relacao fundamental entre grupos de Lie e
algebras de Lie. Ele mostra que e possvel construir uma algebra de Lie a partir de um grupo de Lie
fechado. A teoria geral dos grupos de Lie revela que muitas propriedades importantes de grupos de Lie
podem ser estudadas a partir das algebras de Lie associadas a seus sub-grupos uniparametricos. Essa
possvel
relacao se mostra particularmente relevante no estudo de representacoes de grupos de Lie. E
provar (e faremos isso no exemplo do grupo SO(3) no Captulo 15) que existe uma correspondencia
um-a-um entre as representacoes de um grupo de Lie e as representacoes de sua algebra de Lie. Sucede
que (devido a` estrutura linear) e muito mais simples estudar as representacoes de uma algebra de Lie
do que de um grupo de Lie. Infelizmente ainda esta fora do modesto alcance destas notas explorar
completamente esse vasto terreno e remetemos o estudante aos bons livros supra-citados sobre grupos
e algebras de Lie.
Iremos no que segue deste captulo limitar-nos a discutir algumas questoes as quais sao importantes
para um estudo mais abrangente. Particularmente nos deteremos na questao de identificar algumas
situacoes nas quais podemos prosseguir no caminho inverso ao que apontamos acima, ou seja, na
questao de quando um grupo de Lie pode ser recuperado a partir da algebra de Lie dos seus geradores
por aplicacao da exponenciacao.

14.4

A Rela
c
ao entre Grupos de Lie Matriciais e suas Algebras
de Lie

Vimos nas secoes anteriores que se H e um subgrupo nao-discreto fechado de GL( , n) existe associada
ao mesmo uma algebra de Lie a qual e (obviamente) uma sub-algebra de da algebra de Lie de GL( , n)
que e Mat ( , n). Sera a recproca verdadeira, ou seja, se A e uma sub-algebra de Lie de Mat ( , n)
havera um grupo de Lie fechado associado a A? A reposta, em geral, e nao. Um contra-exemplo (para
n = 2) e o seguinte:
a um n
umero real irracional e seja a algebra de Lie formada pelas matrizes
 Seja 
it 0
2 2 dadas por
com t R. Exponenciando os elementos dessa algebra de Lie obtemos
0 iat

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

795/1304


eit 0
as matrizes
com t R. Esse conjunto de matrizes forma certamente um grupo. Sucede,
0 eiat
porem, que nao se trata de um sub-grupo topologicamente fechado de GL( , 2), como veremos com
um pouco mais de detalhe na Secao 14.4.3 (a qual o leitor podera passar sem perdas). Felizmente e
possvel dizer um pouco mais se enfraquecermos a condicao de H ser um subgrupo fechado. Tem-se,
por exemplo, o seguinte:
Proposi
c
ao 14.7 Seja G um subgrupo fechado n
ao-discreto de GL( , n) cuja a
lgebra de Lie e L(G)
e seja H um subgrupo (n
ao discreto) de G. Seja L(H) := {M Mat ( , n)| exp(tM ) H, t }
e suponha que se saiba que L(H) e um sub-espaco de L(G). Ent
ao L(H) e tambem uma sub-
algebra
de L(G).
2


Prova. Sejam A, B L(H). Entao e claro que para todos t e s


teremos esAetB esA H pois
sA
tA
sA tB sA
H e um grupo e e , e H. Podemos escrever e e e
= exp tesA BesA e isso prova que
esA BesA L(H) para todo s . Como por hipotese L(H) e um sub-espaco de L(G), L(H) e
fechado (pois estamos em dimensao finita). Logo


d sA sA 
1 sA sA
= [A, B],
L(H) 3 lim
e Be
B =
e Be

s0 s
ds
s=0


completando a prova.

Comparando a demonstracao acima com a do Teorema 14.1, vemos que a diferenca e que nao
supomos que H seja fechado. Podemos ir mais um pouco alem e estabelecer o seguinte:
Teorema 14.5 Seja G um subgrupo fechado de GL( , n) cuja a
lgebra de Lie e L(G) e seja h uma
sub-
algebra de Lie real de L(G). Ent
ao existe um u
nico sub-grupo conexo H de G cuja a
lgebra de Lie
e h. H e um grupo de Lie (em uma certa topologia).
2
Nao apresentaremos a demonstracao dessa afirmacao aqui no caso geral, a qual e uma conseq
uencia
da formula de Baker-Campbell-Hausdorff. Mais adiante (pagina 799) discutiremos como H pode ser
construda a partir de h no caso dessa u
ltima ser uma algebra de Lie nilpotente, o caso mais facil de
tratar.

14.4.1

Algebras
de Lie Nilpotentes, Sol
uveis, Simples e Semi-Simples

Ja comentamos anteriormente que se A e B sao matrizes n n reais ou complexas tais que AB = BA,
entao exp(A) exp(B) = exp(A + B). O que ocorre caso A e B nao comutem entre si? A resposta a
esta questao e dada por uma expressao conhecida como f
ormula de Baker-Campbell-Hausdorff, a qual
foi discutida e demonstrada no Captulo 4, pagina 222. Essa formula permite expressar o produto
exp(A) exp(B) para duas matrizes A e B Mat ( , n) (ou Mat ( , n)) novamente como uma
exponencial de matrizes:
exp(A) exp(B) = exp(A B),


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

796/1304

onde A B e uma expressao um tanto complexa envolvendo somas de comutadores m


ultiplos das
matrizes A e B, e cujos primeiros termos sao os seguintes:
1
1
1
A B = A + B + [A, B] + [A, [A, B]] + [B, [B, A]] + .
2
12
12
A expressao completa encontra-se em (4.46) a` pagina 249.
Vamos agora fazer uma pausa e, antes de entrarmos na discussao das conseq
uencias da formula
de Baker-Campbell-Hausdorff e da exponenciacao de algebras de Lie e sua relacao com grupos de
Lie, vamos nos dedicar a discutir alguns aspectos algebricos das algebras de Lie (com o perdao do
pleonasmo).
A formula de Baker-Campbell-Hausdorff nos chama a atencao para a importancia de comutadores
m
ultiplos de elementos de uma algebra de Lie. Vamos aproveitar a oportunidade para introduzir
algumas nocoes algebricas muito empregadas no estudo de algebras de Lie. Falaremos da sua relevancia
adiante.
No que segue trataremos apenas de algebras de Lie sobre o corpo dos n
umeros reais ou complexos.
Seja L uma algebra de Lie e A, B dois subconjuntos de L. Por [A, B] denotamos o conjunto de
todos os elementos de L que sao iguais ao comutador de algum elemento de A por algum elemento de
B. Em smbolos:
[A, B] = {[a, b], a A, b B} .
(14.11)

Algebras
de Lie Nilpotentes
Seja uma algebra de Lie L. Com a notacao acima, denotaremos por L[n] , n = 0, 1, 2, . . ., a seq
uencia
[0]
[n]
[n1]
de conjuntos obtida da seguinte forma: L := L e L = [L, L
], n = 1, 2, . . .. Ou seja,
L[0] := L,
L[1] := [L, L[0] ] = [L, L],
L[2] := [L, L[1] ] = [L, [L, L]],
L[3] := [L, L[2] ] = [L, [L, [L, L]]],
..
.
etc.
Defini
c
ao. Uma algebra de Lie e dita ser nilpotente se L[m] = {0} para algum m.

O menor m para o qual L[m] = {0} e dito ser o grau ou ndice da algebra de Lie nilpotente. Note-se
0
que se L[m] = {0} entao L[m ] = {0} para todo m0 > m.

Um exemplo de algebra de Lie nilpotente e a algebra de Heisenberg tri-dimensional gh3 , com


geradores p, q e ~, satisfazendo [p, ~] = 0, [q, ~] = 0 e [p, q] = i~. Para ela vale (gh3 )[2] = {0}. Essa
algebra foi apresentada e discutida na Secao 13.2.2 a` pagina 676.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

797/1304

Ha varias razoes por que as algebras de Lie nilpotentes sao relevantes. Uma delas esta no fato
de as algebras de Lie nilpotentes serem igualmente algebras de Lie sol
uveis (vide o que segue) e a
importancia destas sera discutida. O leitor pode reconhecer uma outra razao da importancia das
algebras de Lie nilpotentes na seguinte observacao: para uma algebra de Lie nilpotente a serie de
Baker-Campbell-Hausdorff em (4.46) e (4.47) e uma serie finita! Voltaremos a isso quando retomarmos
adiante a discussao da formula Baker-Campbell-Hausdorff.

Algebras
de Lie Sol
uveis
Em paralelo a` nocao de algebra de Lie nilpotente que apresentamos acima, existe a nocao de a
lgebra
de Lie sol
uvel.
Para uma algebra de Lie L, denotaremos por L(n) , n = 0, 1, . . ., a seq
uencia de conjuntos obtida
da seguinte forma: L(0) := L e L(n) := [L(n1) , L(n1) ], n = 1, 2, . . .. Ou seja,
L(0) := L,
L(1) := [L(0) , L(0) ] = [L, L],
L(2) := [L(1) , L(1) ] = [[L, L], [L, L]],
..
.
etc.
uvel se L(m) = {0} para algum m.
Defini
c
ao. Uma algebra de Lie e dita ser sol

Para qualquer algebra de Lie L e bastante evidente, pelas definicoes, acima que L (n) L[n] . De
fato, L(0) = L[0] e L(1) = L[1] e, se L(n) L[n] para algum n, segue que L(n+1) = [L(n) , L(n) ]
[L, L(n) ] [L, L[n] ] = L[n+1] , provando a afirmativa por inducao.
Segue dessa observacao que toda algebra de Lie nilpotente e tambem sol
uvel.

A recproca dessa u
ltima afirmacao e falsa: nem toda algebra de Lie sol
uvel e nilpotente. Considerese com exemplo a algebra de Lie bidimensional com geradores 1 e 2 satisfazendo [1 , 2 ] = 2 . Essa
algebra nao e nilpotente, pois [1 , [1 , [ , [1 , 2 ]]]] = 2 . Porem, essa algebra e sol
uvel, pois
[[1 , 2 ], [1 , 2 ]] = [2 , 2 ] = 0. Essa algebra aparecera concretamente no exemplo discutido a`
pagina 803.
Ha varias razoes por que as algebras de Lie sol
uveis sao relevantes. Uma delas sera discutida apos
apresentarmos o Teorema de Levi, abaixo.

Algebras
de Lie Simples e Semi-Simples
Se L e uma algebra de Lie, dizemos que e um sub-espaco vetorial J de L e uma sub-
algebra (de Lie)
se
[J, J] J.
Se L e uma algebra de Lie, dizemos que um sub-espaco vetorial I de L e um ideal se
[L, I] I.

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

798/1304

Pela definicao, todo ideal de L e uma sub-algebra de Lie de L.


As algebras de Lie nilpotentes e as sol
uveis possuem muitos ideais. Contrapostas a`s mesmas estao
as chamadas algebras de Lie simples e semi-simples, que possuem poucos ideais.
Defini
c
ao. Uma algebra de Lie L e dita ser simples se seus u
nicos ideais forem {0} e a propria L.
Defini
c
ao. Uma algebra de Lie L e dita ser semi-simples se nao possuir ideais sol
uveis (que nao {0}).
bem claro que toda algebra de Lie simples e semi-simples.
E

Ha varias razoes por que as algebras de Lie semi-simples sao relevantes. Uma delas sera discutida
apos apresentarmos o Teorema de Levi, abaixo.

Soma Direta e Soma Semi-Direta de Algebras


de Lie
Defini
c
ao. Uma algebra de Lie L e dita ser a soma direta de duas de suas sub-algebras L 1 e L2 se
[L1 , L2 ] = 0
e se todo elemento x L puder ser escrito de modo u
nico da forma x = x1 + x2 com x1 L1 e x2 L2 .
Se L for a soma direta de L1 e L2 denotamos isso por L = L1 L2 .

Defini
c
ao. Uma algebra de Lie L e dita ser a soma semi-direta de duas de suas sub-algebras L 1 e L2
se
[L1 , L2 ] L2
e se todo elemento x L puder ser escrito de modo u
nico da forma x = x1 + x2 com x1 L1 e x2 L2 .
Se L for a soma semi-direta de L1 e L2 denotamos isso por L = L1  L2 .
Note que L2 deve ser um ideal de L.
Nesse contexto e importante o seguinte teorema, cuja demonstracao esta alem das pretensoes destas
notas (vide e.g. [97, 69]):
Teorema 14.6 (Teorema de Levi) Toda a
lgebra de Lie L de dimens
ao finita e uma soma semidireta
L = SR
onde S e semi-simples e R sol
uvel.

A sub-algebra R acima e denominada radical de L.


Exemplos. O chamado grupo Euclidiano17 em tres dimensoes E3 possui seis geradores J1 , J2 , J3
(geradores de rotacoes) e P1 , P2 , P3 (geradores de translacoes), satisfazendo as relacoes
[Ji , Jj ] =

3
X

ijk Jk

[Ji , Pj ] =

k=1

17

Euclides, de Alexandria (ci. 325 A.C., ci. 265 A.C.).

3
X
k=1

ijk Pk

[Pi , Pj ] = 0,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

799/1304

onde ijk e o smbolo anti-simetrico de Levi-Civita definido em (13.33), pagina 693. Se denominarmos
por P a sub-algebra gerada por P1 , P2 , P3 e por J a sub-algebra gerada por J1 , J2 , J3 , veremos que
tambem imediato que
P e sol
uvel (pois e Abeliana) e que J e simples (e, portanto, semi-simples). E
L = P  J.
*
O teorema de Levi nos diz que o estudo geral de algebras de Lie, e conseq
uentemente, de grupos de
Lie, reduz-se ao estudo das algebras de Lie sol
uveis (dentre as quais estao as nilpotentes) e das algebras
de Lie semi-simples. Um dos resultados mais importantes da teoria das algebras de Lie e uma celebre
classificacao completa de todas as algebras de Lie semi-simples, feito devido a Killing 18 e a Cartan19 .
Para o caso das algebras sol
uveis uma classificacao completa esta ainda longe de ser alcancada.

14.4.2

Quest
oes sobre a Exponencia
c
ao de Algebras
de Lie

Apesar de sua importancia, a formula de Baker-Campbell-Hausdorff apresenta uma restricao quanto a`


norma das matrizes A e B, necessaria para garantir a convergencia da serie que ocorre em (4.46). Ha,
porem, uma classe de algebras de Lie para a qual essa questao nao e importante, as chamadas algebras
de Lie nilpotentes, das quais trataremos agora.
Grupos de Lie Nilpotentes
A importancia das algebras de Lie nilpotentes no contexto da formula de Baker-Campbell-Hausdorff
(4.46), pagina 249, e a seguinte. Se L Mat ( , n) e uma algebra de Lie nilpotente de grau m de
matrizes, entao para quaisquer A, B L teremos que A B definida em (4.46) e uma soma finita,
contendo no maximo comutadores m
ultiplos de ordem m.
Com isso, vemos que para uma algebra de Lie nilpotente de matrizes L Mat ( , n) nao existe
o problema da convergencia da serie de (4.46), e a mesma vale para todo A, B L, independente da
norma desses elementos. Fora isso A B L, ja que e dado por uma soma finita de elementos de L.
Uma conseq
uencia e a seguinte proposicao.
Proposi
c
ao 14.8 Seja G um subgrupo de Lie de GL( , n) e LG Mat ( , n) sua a
lgebra de Lie.
Vamos supor que LG seja nilpotente. Ent
ao o produto definido pela f
ormula de Baker-CampbellHausdorff e associativo. Fora isso, a a
lgebra de Lie LG e, ela mesma, um grupo com o produto .
2
Prova. Sejam P
A1 , A2 e A3 tres elementos de LG . Se L1 , . . . , Lm formam uma base em LG podemos
i
i
i
ao n
umeros complexos. Como a soma de comutadores que ocorre
escrever A = m
k=1 k Lk , onde k s
na formula de Baker-Campbell-Hausdorff e finita, conclumos que
1

(A A ) A =
18
19

m
X
k=1

Wilhelm Karl Joseph Killing (1847-1923).


Elie Joseph Cartan (1869-1951).

pk ()Lk

A (A A ) =

m
X
k=1

qk ()Lk ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

800/1304

onde pk () e qk () sao polinomios nas variaveis ji , i = 1, 2, 3, j = 1, . . . , m. Desejamos provar


que para cada k tem-se pk = qk . Como ambos sao polinomios, e suficiente provar isso para quando as
variaveis ji estao restritas a algum aberto de .
Sejam Gi = exp(Ai ), i = 1, 2, 3, elementos de G. Como o produto do grupo e associativo, temos
(G1 G2 )G3 = G1 (G2 G3 ) e, portanto, exp((A1 A2 ) A3 ) = exp(A1 (A2 A3 )). Se escolhermos as
variaveis ji suficientemente proximas de zero, teremos pk () e qk () igualmente proximas de zero
(convenca-se disso checando a formula de Baker-Campbell-Hausdorff) e, portanto, k(A 1 A2 ) A3 k e
kA1 (A2 A3 )k podem ser ambas feitas menores que ln 2. Pela Proposicao 4.5, pagina 231, podemos
tomar o logaritmo das exponenciais acima e concluir que (A1 A2 ) A3 = A1 (A2 A3 ). Assim,


m
X
k=1

pk ()Lk =

m
X

qk ()Lk

k=1

pelo menos para ji pequenos o suficiente. Como os elementos Lk da base sao linearmente independentes,
conclumos que pk () = qk () para todo k = 1, . . . , m, pelo menos quando os ji sao pequenos o
suficiente. Como pk e qk sao polinomios, isso vale para todos ji . Isso provou a associatividade.

Para provar que LG e um grupo, devemos mostrar que ha um elemento neutro em LG para o produto
e que para cada elemento de LG existe uma inversa. Pela formula de Baker-Campbell-Hausdorff e
facil constatar que
A0 = 0A = A

para todo A LG . Assim o zero e o elemento neutro procurado. Fora isso, tambem pela formula de
Baker-Campbell-Hausdorff e facil constatar que
A (A) = A + (A) + comutadores de A com A = 0.
Logo, (LG , ) e um grupo.
Esses fatos tem ainda uma conseq
uencia importante. Seja L Mat ( , n) uma algebra de Lie
nilpotente de matrizes. Definamos por exp(L) o conjunto de todas as matrizes que sao exponenciais
de elementos de L:
exp(L) = {G Mat ( , n)| G = exp(A) para algum A L} .
Afirmamos que exp(L) e um grupo (em relacao ao produto usual de matrizes), em verdade um subgrupo
de GL( n). De fato, exp(L), pois, 0 L. Se G = exp(A) com A L, entao sua inversa
e G1 = exp(A), que tambem pertence a exp(L) pois A L. Por fim, se G1 = exp(A1 ) e
G2 = exp(A2 ) com A1 e A2 dois elementos quaisquer de L, entao, pela formula de Baker-CampbellHausdorff, G1 G2 = exp(A1 A2 ) exp(L), pois A1 A2 L.
A conclusao e que a partir de uma algebra de Lie nilpotente L podemos construir um grupo,
importante
denominado grupo de Lie associado a
`a
lgebra L pelo procedimento de exponenciacao. E
notar que L e um conjunto conexo. Portanto, como a exponencial e contnua, o grupo exp(L) e
igualmente conexo.
Interessantemente vale tambem a recproca. Seja G um grupo de Lie conexo fechado (de matrizes) e LG sua algebra de Lie e vamos supor que LG seja nilpotente. Considere, para algum  > 0

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

801/1304

suficientemente pequeno, o subconjunto V de LG definido por


( m
)
X
V :=
k Lk , com |i | <  para todo i = 1, . . . , m ,
k=1

e o subconjunto U de G definido por


(
!
)
m
X
U := exp
k Lk , com |i | <  para todo i = 1, . . . , m ,
k=1

onde L1 , . . . , Lm formam uma base em LG .


U e que se g =
Note-se
aberto
Pm que V e um subconjunto
Pmde LG . Note-se tambem que
1
exp ( k=1 k Lk ) U entao g = exp ( k=1 k Lk ) U . Assim, se provarmos que U e aberto
poderemos usar a Proposicao 14.3, pagina 776.
P
Se  for pequeno o suficiente poderemos garantir que k m
i | <  para
k=1 k Lk k < ln
P2msempre que |P
todo i = 1, . . . , m e, pela Proposicao 4.5, pagina 231, teremos ln (exp ( k=1 k Lk )) = m
k=1 k Lk .
Logo U e a imagem inversa pela funcao ln do conjunto aberto V . Como ln e uma funcao contnua
(Proposicao 4.3, pagina 229) conclumos que U e igualmente aberto.


Logo, pela Proposicao 14.3, cada elemento g de G pode ser escrito como um produto de n elementos de U : g = g1 gn , onde gi = exp(li ) com li V . Agora, como a algebra e nilpotente, vale
exp(l1 ) exp(ln ) = exp(l1 ln ). Com isso, fica demonstrada a seguinte afirmacao: se G e um
subgrupo conexo fechado de GL( , n) e se sua algebra de Lie LG e nilpotente, entao todo elemento
de G pode ser escrito como exponencial de um elemento de LG . Um exemplo dessa situacao e o grupo
de Heisenberg GH3 , tratado a` pagina 677.
Observaca
o 1. O n
umero n mencionado no u
ltimo paragrafo pode nao ser o mesmo para todo g G
(vide o enunciado da Proposicao 14.3), podendo eventualmente crescer arbitrariamente quando g varia
no grupo. Porem, como a algebra LG e nilpotente, o produto l1 ln esta sempre definido para
qualquer n.
Observaca
o 2. Nas circunstancias descritas acima, e facil constatar que a funcao exponencial exp :
LG G e um isomorfismo do grupo (LG , ) em G.

Grupos de Lie com algebras de Lie nilpotentes nao sao os u


nicos grupos de Lie para os quais vale que
possvel
todo seu elemento pode ser escrito como exponencial de um elemento da sua algebra de Lie. E
mostrar que grupos de Lie compactos com algebras de Lie semi-simples tambem tem essa propriedade.
Para uma demonstracao vide, por exemplo, [119]. Vimos isso de modo explcito quando tratarmos dos
grupos SO(3), SU(2), SL( , 2), SU(n) e SO(n) no Captulo 13.
Para grupos de Lie nao-conexos tipicamente ocorre que nao se pode escrever todos os seus elementos
como exponenciais de elementos de sua algebra de Lie. Tal e, por exemplo, o caso do grupo de Lie
GL( , 2), cuja algebra de Lie e Mat ( , 2). A exponencial de matrizes reais 2 2 e sempre formada
por matrizes com determinante positivo (pela Proposicao 4.7, pagina 234), enquanto que GL( , 2)
possui tambem matrizes com determinante negativo. Vide Proposicao 4.10, pagina 236.


Porem, como veremos no exemplo discutido em detalhe a` pagina 803, nao basta que um grupo de
Lie seja conexo para que todos os seus elementos possam ser escritos como exponenciais de elementos

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

802/1304

de sua algebra de Lie. Em varios casos, todavia, os elementos do grupo podem ser escritos como um
produto finito de exponenciais. Tal tambem ocorre no exemplo da pagina 803.
Para um grupo de Lie conexo G e possvel, sob hipoteses adequadas que nao discutiremos aqui,
construir um grupo de Lie simplesmente conexo a partir de sua algebra de Lie, usando um procedimento semelhante ao que empregamos quando discutimos acima o caso de algebras de Lie nilpotentes.
Constroi-se primeiramente uma vizinhanca U da identidade que seja simetrica (ou seja, se g U entao
g 1 U ) por exemplo a vizinhanca na qual a formula de Baker-Campbell-Hausdorff converge, no caso
de matrizes e em seguida considera-se o conjunto formado por produtos finitos de elementos de U , o
chamado grupo gerado por U . Esse conjunto e em geral um grupo de Lie simplesmente conexo que e
um recobrimento do grupo original G.

14.4.3

Alguns Exemplos Especiais

Um subgrupo conexo n
ao-fechado de GL( , 2)
Exibiremos aqui um exemplo de um sub-grupo conexo nao-fechado de GL( , 2) o qual e um grupo
de Lie mas nao e um subgrupo de Lie de GL( , 2). Isso significa que a topologia que faz desse subgrupo
Ha um grupo de Lie nao e a topologia induzida por GL( , 2) em Ha .
Esse exemplo e bastante instrutivo e ilustra o porque de haver certas dificuldades sutis de natureza
topologica na teoria dos grupos de Lie (e na geometria diferencial, em geral).
O grupo em questao e o seguinte grupo de matrizes a um parametro real:

 it

e
0
,
Ha :=
, t
0 eiat


onde a e um n
umero real irracional fixo arbitrario. Para mostrar que esse grupo nao e fechado, vamos
exibir uma seq
uencia convergente de matrizes de Ha que nao converge a um elementode Ha . Considere

1
0
tn = (2n+1) com n . As matrizes de Ha correspondentes a esses valores de t sao
.
0 ei2a(2n+1)
Sucede que, como a e irracional, os n
umeros complexos da forma ei2a(2n+1) , com n , formam um
conjunto denso em todo o crculo unitario do plano complexo20 . Assim, existe uma sub-seq
uencia nk
tal que ei2a(2nk +1) converge a 1 quando k . Isso mostra que a matriz esta no fecho de
Ha . Sucede, porem, que 6 Ha pois, para a irracional, nao existe nenhum t real tal que valham
simultaneamente eit = 1 e eiat = 1 (prove isso). Isso mostra que Ha nao e fechado.
 it

e
0
Por outro lado, e claro que ha uma aplicacao bijetora de em Ha dada por 3 t 7
,a
0 eiat
qual induz a topologia usual de em Ha , topologia essa na qual Ha e um grupo de Lie, como facilmente
se ve. Essa topologia nao coincide com a topologia induzida em Ha pela norma de matrizes em Ha .


Ha uma maneira geometrica de entender o que esta acontecendo nesse grupo. Considere o seguinte
20

O leitor para o qual esse fato n


ao e familiar poder
a encontrar demonstraco
es em bons livros sobre teoria de n
umeros,
por exemplo [55].

JCABarata. Curso de Fsica-Matem


atica

grupo de Lie de matrizes 2 2:


T :=



Captulo 14

Vers
ao de 29 de setembro de 2005.


eit 0
, t, s
0 eis

803/1304

Esse grupo de Lie (a dois parametros reais) pode ser visualizado como um toro bidimensional (pois e
o produto cartesiano de dois crculos: o crculo eit com t e o crculo eis com s ). Cada grupo
Ha e um subgrupo de T e, nessa imagem, corresponde a uma curva (pois cada Ha e unidimensional)
que preenche densamente o toro sem auto-cruzamentos. Dessa forma entende-se que o fecho de H a na
topologia da norma das matrizes e o grupo T .


Se imaginarmos um aberto no toro, veremos que este intercepta a curva que corresponde a H a em
infinitos segmentos. Assim, Ha nao e uma sub-variedade de T e, portanto, apesar de ser um subgrupo
de T , Ha nao pode ser um subgrupo de Lie de T na topologia de T .
Exponencia
c
ao e
algebras de Lie matriciais. Um contra-exemplo
Vamos agora apresentar um exemplo de um grupo de Lie conexo no qual nao podemos escrever
todos os seus elementos como exponenciais de elementos de sua algebra de Lie, ou seja, a exponencial
de sua algebra de Lie nao e sobrejetora no grupo.
Seja um n
umero real irracional21 fixo. Vamos considerar o seguinte conjunto de matrizes complexas 2 2:
H := {h(t, z), t , z } ,


onde


eit z
h(t, z) :=
.
0 eit
Afirmamos que H e um sub-grupo de GL( , 2). De fato,

(14.12)

= h(0, 0) H ,
0

h(t, z)h(t0 , z 0 ) = h(t + t0 , zeit + z 0 eit ) H

h(t, z)1 = h(t, zei(1+)t ) H .


E. 14.11 Exerccio. Verifique!

H e um grupo de Lie conexo parametrizado por t e z . De fato, o grupo H e homeomorfo


a` variedade conexa . O homeomorfismo de em H e dado pela funcao h definida em
(14.12), isto e, h : H ,
 it

e
z
(t, z) 7 h(t, z) :=
.
0 eit


Claramente, h e contnua (certo?). Vamos mostrar que h e bijetora. Suponha que existam (t, z) e
(t0 , z 0 ) tais que h(t, z) = h(t0 , z 0 ), ou seja,


 it0
 it
z0
e
e
z
.
=
0
0 eit
0 eit


21

Como veremos abaixo, e crucial para a construca


o desejada que n
ao seja racional.

JCABarata. Curso de Fsica-Matem


atica

Captulo 14

Vers
ao de 29 de setembro de 2005.

804/1304

Isso implica as tres seguintes condicoes simultaneas:


eit = eit

eit = eit

(14.13)
0

(14.14)

z = z0 .

(14.15)

As relacoes (14.13) e (14.14) implicam


t = t0 + 2k
respectivamente, para k, l
da segunda, teramos

t = t0 + 2l,

. Assim, multiplicando-se a primeira igualdade por e subtraindo-se


k = l

para k, l . Mas isso e impossvel se for um n


umero irracional, a menos que k = l = 0. Com isso,
0
conclumos que t = t , fato esse que, juntamente com (14.15), prova que h e uma bijecao. Mais ainda,
e bem claro que h e infinitamente diferenciavel e, portanto, e um difeomorfismo.
Vamos determinar os geradores de H , que denotaremos por 1 , 2 :




i 0

1 =
,
h(t, z)
=
0 i
t
t=z=0
2 =

E. 14.12 Exerccio. Verifique!





0 1

h(t, z)
=
.
0 0
z
t=z=0

Um elemento generico da algebra de Lie L(H ) associada a H e, portanto, da forma




i w
h(, w) := 1 + w2 =
,
0 i
com


ew .

E. 14.13 Exerccio. Constate que [1 , 2 ] = i(1 )2 . Conclua da que a algebra de Lie L(H )
associada a H nao e nilpotente, nao e simples e nao e semi-simples, mas e soluvel.
6
muito facil provar que
Vamos nos dedicar agora a calcular exp(h(, w)). E

(i )2
w(i )(1 + )

h(, w)2 =
2
0
(i )

e que

h(, w)3 =

(i )3
0

w(i )2 (1 + + 2 )
(i )

JCABarata. Curso de Fsica-Matem


atica

Por inducao, ve-se tambem que

h(, w)

(i )

w(i )

n1

n1
X

Captulo 14

Vers
ao de 29 de setembro de 2005.

p=0

(i )

(i )n

805/1304


1 n
w(i )
1
,

n
(i )
n1

para todo n 1. Na u
ltima igualdade usamos a bem conhecida formula da progressao geometrica.
E. 14.14 Exerccio importante. Mostre isso!

Dessa forma, obtemos


exp(h(, w)) =

X
1
h(, w)n
+
n!
n=1

X
1
(i )n
1 +
n!

n=1

onde

ei
0

wf ( )
,
i
e




X
1 n
1
n1
w
(i )
n!
1

n=1

X 1

n
(i )
1+
n!
n=1




X
1 n
1
n1
(i )
.
f ( ) :=
n!
1
n=1

Vamos agora expressar melhor a funcao f ( ). Note-se que f (0) = 1 e que, para =
6 0,
!



n
X
X
X
1
1
1

1
1
(i )n1
=
(i )n1
(i )n1
n!
1

n!
n!
n=1
n=1
n=1
1
=
1
1
=
1
ei
=
1





ei 1
i

ei ei
i

ei(1) 1
i

ei 1
i



JCABarata. Curso de Fsica-Matem


atica

Assim,

1,

f ( ) =

Captulo 14

806/1304

para = 0,

ei

e, finalmente,

Vers
ao de 29 de setembro de 2005.

ei(1) 1
i

exp(h(, w)) =

, para 6= 0

ei

wf ( )

(14.16)

A questao que agora se poe e: sera o conjunto de matrizes exp(L(H )) := {exp(h(, w)), , w }
2
, z com z 6= 0
igual a H ? A resposta e n
ao! Para provar isso mostraremos que as matrizes h 1
n
ao sao elementos do conjunto exp(L(H )). Se tal nao fosse o caso, existiriam e w tais que


2
, z = exp(h(, w)),
h
1


ou seja,

ei 1

ei 1

ei
0

wf ( )
.
i
e

Isso so e possvel se as seguintes tres condicoes forem satisfeitas simultaneamente:


2

ei 1 = ei ,

(14.17)

ei 1 = ei ,

(14.18)

z = wf ( ).

(14.19)

As condicoes (14.17) e (14.18) implicam


=
e

2
+ 2k
1

2
+ 2l,
1
. Das duas conclu-se (multiplicando a primeira por ) que
=

respectivamente, com k, l

2k = 2l,

ou seja,

k = l.

Porem, como foi suposto ser um n


umero irracional, isso so e possvel se k = l = 0. Portanto
=

2
.
1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 14

807/1304

Ocorre agora, porem, que inserindo-se esse valor de no lado direito de (14.19) obtemos
!
 2i



2
2
2
e 1
ei(1) 1 1
ei 1
2
i 1
wf
= we
= w
= 0
2
1
1
2i
i 1
e, conseq
uentemente, (14.19) nao pode ser satisfeita para z 6= 0.

Esse exemplo ilustra bem o fato mencionado de haver situacoes nas quais a imagem pela exponenciacao da algebra de Lie L(G) associada a um grupo de Lie G nao coincide com o grupo G.
E. 14.15 Exerccio.
Seja um grupo de Lie simplesmente conexo G, cuja algebra de Lie e L. Um
teorema devido a Dixmier [63] afirma, entre outras coisas, que exp(L) = G se exp for injetora. Mostre que
(, w) 7 exp(h(, w)) definida em (14.16) nao e injetora.
6
No exemplo acima vale, porem, a seguinte afirmacao: todo elemento de H pode ser escrito como
produto de duas exponenciais de elementos da algebra de Lie L(H ), a saber, da forma
exp(h(, 0)) exp(h(0, w)) .
De fato, e bem facil ver que
 it

 it


e
z
e
0
1 eit z
h(t, z) =
=
= exp(h(t, 0)) exp(h(0, eit z)).
0 eit
0 eit
0
1

Captulo 15
Uma Breve Introduc
ao `
a Teoria das
Representaco
es de Grupos
Conte
udo
15.1 Representa
co
es de Grupos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 808
15.2 Representa
co
es Irredutveis de SO(3) . . . . . . . . . . . . . . . . . . . . . 815
15.3 A Medida de Haar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 819
15.4 Representa
co
es de Grupos Compactos . . . . . . . . . . . . . . . . . . . . . 821
15.5 O Teorema de Peter-Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 822

rupos desempenham um papel importante na Fsica em geral devido a sua relacao com transformacoes de simetria. Na Fsica Quantica (na Mecanica Quantica ou na Teoria Quantica de
Campos), onde o conjunto de estados puros de um sistema fsico e descrito por um espaco
linear, torna-se particulamente relevante estudar a acao de grupos de simetria em espacos
vetoriais. Essa e a motivacao basica do estudo de representacoes de grupos.

15.1

Representa
co
es de Grupos

Uma representaca
o de um grupo G em um espaco vetorial V e uma aplicacao que a cada g G associa
um operador linear invertvel (g) : V V de modo que as seguintes condicoes sejam satisfeitas:
1. (e) = .
2. (g)(h) = (gh), g, h G.
3. (g 1 ) = (g)1 , g G.
Acima e e a unidade de G e

o operador identidade em V .

Ha outras formas equivalentes de caracterizar ou definir o conceito de representacao de um grupo.


Podemos dizer que uma representacao de um grupo em um espaco vetorial V e um homomorfismo de
G no grupo dos operadores lineares invertveis de V em V , ou ainda, que e uma acao a` esquerda de G
em V atraves de operadores lineares invertveis.
A Representa
c
ao Trivial
A representacao que associa todo g G ao operador identidade em V , ou seja, tal que (g) = ,
g G, e denominada representaca
o trivial.
808

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

809/1304

Intertwiners
Seja G um grupo e V1 , V2 dois espacos vetoriais (sobre o mesmo corpo) onde atuem duas representacoes de G: 1 e 2 , respectivamente em V1 e V2 . Um operador U : V1 V2 tal que
U 1 (g) = 2 (g)U,
para todo g G, e dito ser um operador de entrelacamento de 1 e 2 . Operadores de entrelacamento
sao mais freq
uentemente designados intertwiners.
Voltaremos a falar sobre intertwiners quando tratarmos do importante Lema de Schur adiante.
Representa
co
es Equivalentes
As duas representacoes sao ditas equivalentes se existir um operador invertvel U : V 1 V2 tal que
U 1 (g) = 2 (g)U
para todo g G, ou seja, se 1 e 2 possurem um intertwiner invertvel.

muito facil mostrar que a equivalencia de duas representacoes e uma relacao de equivalencia (no
E
sentido usual) e que, portanto, a classe de todas as representacoes de um grupo pode ser quebrada em
classes de representacoes equivalentes.
Um grupo pode ter varias representacoes distintas (e inequivalentes) em um mesmo espaco vetorial.
E. 15.1 Exerccio. Seja G = ( , +) e V = 2 . Mostre que






1 x
1 0
cos x sen x
T1 (x) :=
, T2 (x) :=
e R(x) :=
,
0 1
x 1
sen x cos x


ao: tome U = ( 01 10 )).


x , sao tres representacoes de G. Mostre que T1 e T2 sao equivalentes (sugest
Mostre que R e T1 (ou T2 ) nao sao equivalentes (sugest
ao: se o fossem, veja o que ocorreria para x = 2).
6


Sub-Espa
cos Invariantes
Seja G um grupo, V um espaco vetorial e uma representacao de G em V . Seja V 0 um sub-espaco
de V . V 0 e dito ser um sub-espaco invariante por se (g)v 0 V 0 para todo v 0 V 0 e todo g G, ou
seja, se (G)V 0 V 0 .
Qualquer representacao possui sempre pelo menos dois sub-espacos invariantes: aquele formado
apenas pelo vetor nulo V 0 = {0} e aquele formado pelo espaco todo V 0 = V . Esses sub-espacos
invariantes sao ditos triviais.

E. 15.2 Exerccio. 1. Mostre que a representacao T1 , definida acima, tem um sub-espaco invariante de
dimensao 1, a saber, o sub-espaco formado pelos vetores da forma ( a0 ), a . Mostre que nenhum outro
sub-espaco de dimensao 1 de 2 e invariante por T1 . 2. Mostre que a representacao T2 , definida acima,
tem um sub-espaco invariante de dimensao 1, a saber, o sub-espaco formado pelos vetores da forma ( 0b ),
b . Mostre que nenhum outro sub-espaco de dimensao 1 de 2 e invariante por T2 . 3. Mostre que a
representacao R, definida acima, nao tem nenhum sub-espaco invariante nao-trivial.
6


JCABarata. Curso de Fsica-Matem


atica

Captulo 15

Vers
ao de 29 de setembro de 2005.

810/1304

E. 15.3 Exerccio. Verifique que as expressoes abaixo definem representacoes de G = ( , +) em V =


e identifique seus sub-espacos invariantes.


1
0
1 (x) =
0
0

x
1
0
0

0
0
1
0

0
0
,
x
1

1
0
2 (x) =
0
0

x
1
0
0

0
0
0
0
,
cos x sen x
sen x cos x

cos x sen x
sen x cos x
3 (x) =
0
0
0
0

4


0
0
0
0
.
cos x sen x
sen x cos x

Representa
co
es Irredutveis
De grande importancia e o conceito de representaca
o irredutvel de um grupo G em um espaco
vetorial V . Uma representacao de um grupo G em um espaco vetorial V e dita ser irredutvel se os
seus u
nicos sub-espacos invariantes forem os triviais.
Uma representacao que nao e irredutvel e dita ser redutvel.
E. 15.4 Exerccio. Mostre que as representacoes T1 e T2 , definidas `a pagina 809, sao redutveis. Mostre
que a representacao R e irredutvel.
6
Vamos supor que V seja um espaco de dimensao finita, digamos n, e que seja uma representacao
de um grupo G em V que possua um sub-espaco invariante nao-trivial V 0 (ou seja, e redutvel).
Seja m n a dimensao de V 0 . Entao e possvel encontrar uma base em V tal que (g) possui a
representacao matricial em blocos


1 (g) (g)
(g) =
0
2 (g)
para todo g G, onde 1 (g) e uma matriz m m, 2 (g) e uma matriz (n m) (n m), e (g) e
uma matriz m (n m).
Mostrar isso e bem simples, basta representar cada v V em uma base e1 , . . . , en , onde e1 . . . , em
formam uma base de V 0 .
O seguinte exerccio revela uma propriedade importante dos blocos 1 e 2 :
E. 15.5 Exerccio. Mostre que 1 e 2 definidos acima sao tambem representaco
es de G.

Uma representacao de um grupo G em um espaco vetorial V e dita ser totalmente redutvel


se for redutvel e se V puder ser escrita como uma soma direta de sub-espacos invariantes por :
V = V1 Vk . Em tal caso (g) pode ser escrita em uma base conveniente na forma de blocos

1 (g)

..
(g) =

.
k (g)

para todo g G, onde cada i (g) e uma representacao de G agindo no espaco invariante Vi de . Em
um tal caso denotamos da forma = 1 k .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

811/1304

Particularmente importante e a situacao em que e totalmente redutvel e cada i e irredutvel.


Em tal caso dizemos que e maximalmente redutvel ou completamente redutvel.
E. 15.6 Exerccio. Sejam as representacoes T1 e T2 definidas `a pagina 809. Mostre que T1 e T2 nao sao
totalmente redutveis.
6
E. 15.7 Exerccio. Sejam as representacoes 1 , 2 e 3 definidas `a pagina 810. Mostre que 1 e 2
sao totalmente mas nao maximalmente redutveis. Mostre que 3 e maximalmente redutvel.
6
Nesse contexto a seguinte proposicao e importante:
Proposi
c
ao 15.1 Seja V um espaco vetorial complexo de dimens
ao finita, dotado de um produto
interno h, i, e seja uma representaca
o de um grupo G por operadores unit
arios (em relaca
o ao
produto interno). Ent
ao ou e irredutvel ou e maximalmente redutvel.
2
Para provar essa proposicao, vamos antes demonstrar o seguinte lema, o qual tem importancia por
si so, como veremos mais adiante.
Lema 15.1 Seja V um espaco vetorial complexo, dotado de um produto interno h, i, e seja uma
o ao produto interno). Se W e um
representaca
o de um grupo G por operadores unit
arios (em relaca
sub-espaco invariante por ent
ao seu complemento ortogonal W (em relaca
o ao produto interno)
tambem o e.
2
Prova. Como e unitario, vale (g) = (g)1 = (g 1 ) para todo g G. Seja w 0 W e w W .
Entao, para qualquer g G
h(g)w 0 , wi = hw 0 , (g) wi = hw 0 , (g 1 )wi = 0
pois (g 1 )w W , ja que W e invariante, e w 0 e ortogonal e todo elemento de W . Como w e um
elemento arbitrario de W , isso mostrou que (g)w 0 W para todo g G, provando assim que W e
invariante.
Vamos agora provar a proposicao. Se e unitaria e e redutvel, entao V possui um sub-espaco
invariante nao trivial V1 e, pelo lema acima, V2 = V1 e tambem invariante. Logo, e totalmente
redutvel, V = V1 V2 e = 1 2 . Agora, e facil ver que cada 1 e tambem uma representacao
unitaria (por que?). Assim, podemos aplicar a mesma conclusao a cada i e, se i for redutvel,
podemos tornar a quebrar o sub-espaco Vi em sub-espacos invariantes ainda menores e i em uma
soma de representacoes unitarias menores. Como a dimensao de V e finita, esse procedimento tera
forcosamente um fim e cada representacao menor a que se chegar sera forcosamente irredutvel.
E. 15.8 Exerccio. Mostre que as mesmas conclusoes valem para representacoes ortogonais em espacos
vetoriais reais.
6
Representa
co
es Irredutveis para Operadores

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

812/1304

Um outro conceito importante e o seguinte. Uma representacao de um grupo G em um espaco


vetorial V e dita ser irredutvel para operadores se valer a seguinte propriedade: os u
nicos operadores
A : V V tais que
A(g) = (g)A
para todo g G sao da forma A = , ou seja, sao m
ultiplos da identidade.

Podemos nos perguntar qual a relacao entre essa nocao e a de representacao irredutvel. Vamos
demonstrar adiante os seguintes fatos: 1) toda representacao irredutvel complexa de dimensao finita
e irredutvel para operadores. 2) toda representacao unitaria que seja irredutvel para operadores e
tambem irredutvel.
Varias das conseq
uencias mais importantes da teoria das representacoes de grupos sao extradas
dessas observacoes. Como vemos elas nos dizem que para representacoes unitarias complexas e de
dimensao finita (de particular interesse na fsica quantica) os conceitos de representacao irredutvel e
representacao irredutvel para operadores sao coincidentes.
Vamos comecar demonstrando a afirmacao 2).
Proposi
c
ao 15.2 Se e uma representaca
o unit
aria que e irredutvel para operadores, ent
ao e
tambem irredutvel.
2
Prova. Vamos supor W seja um sub-espaco invariante por . Seja P o projetor sobre W . Entao, P
evidente que
e o projetor sobre W , que e tambem invariante, pois e unitaria. E
(g)P x = P (g)P x,
pois (g)P x W . Por outro lado, como x = P x + ( P )x, entao
P (g)x = P (g)P x + P (g)( P )x = P (g)P x,
pois P (g)( P )x = 0, ja que W e invariante. Comparando-se, conclumos que (g)P x = P (g)x
para todo x e todo g G, ou seja,
(g)P = P (g)
para todo g G. Porem, como e irredutvel para operadores, isso so e possvel se P = . Como
P 2 = P , tem-se = 0 ou = 1. No primeiro caso P = 0, no segundo, P = , ou seja, no primeiro
caso W = {0} e no segundo W e o espaco todo. Ora, isso diz precisamente que e irredutvel.
Vamos agora passar a demonstracao da afirmacao 1), acima. A mesma e corolario de um lema
algebrico de grande importancia. O chamado lema de Schur1 .
Lema de Schur
Lema 15.2 (Schur) Se 1 e 2 s
ao duas representaco
es irredutveis de um grupo G em espacos
vetoriais V1 e V2 , respectivamente, e A : V1 V2 e um intertwiner de 1 e 2 , ou seja, A1 (g) =
2 (g)A para todo g G, ent
ao ou A e invertvel ou A = 0. Caso A seja invertvel e V 1 e V2 sejam
1

Issai Schur (1875-1941).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

813/1304

espacos vetoriais complexos de dimens


ao finita, ent
ao A e u
nico, a menos de multiplicaca
o por escalar.
2
Prova. Sejam
M1 := Ker(A) V1
M2 := Ran(A) V2

facil ver que M1 e M2 sao sub-espacos invariantes de 1


o n
ucleo e a imagem de A, respectivamente2 . E
e 2 , respectivamente. De fato, se x M1 tem-se Ax = 0. Logo, A1 (g)x = 2 (g)Ax = 0, provando
que 1 (g)x M1 para todo g G, ou seja, M1 e invariante por 1 . Analogamente, se y M2 temos
que y = Ax para algum x V1 . Assim, 2 (g)y = 2 (g)Ax = A1 (g)x Ran(A), mostrando, assim,
que M2 e invariante por 2 .
Pelas hipoteses do lema, 1 e 2 sao irredutveis e so possuem sub-espacos invariantes triviais.
Valem, portanto, os seguintes quatro casos apenas:
1. M1 = V1 e M2 = V2 .
2. M1 = {0} e M2 = V2 .
3. M1 = V1 e M2 = {0}.
4. M1 = {0} e M2 = {0}.
Os casos 1 e 4 sao impossveis: se Ker(A) = V1 nao se pode ter Ran(A) = V2 ; se Ker(A) = {0} nao se
pode ter Ran(A) = {0}. Assim, valem apenas os casos 2 e 3. No caso 2 tem-se que A e invertvel. No
caso 3, tem-se que A = 0.
Resta-nos provar que, caso A seja invertvel e V1 e V2 sejam espacos vetoriais complexos de dimensao
finita, entao A e u
nico, a menos de multiplicacao por escalar. Se A e invertvel, entao a dimensao de
V1 e igual a` de V2 e A pode ser visto como uma matriz quadrada. Seja B um outro intertwiner de 1 e
2 . Entao, para qualquer tem-se (A B)1 (g) = 2 (g)(A B). Portanto, ou (A B) = 0
ou e invertvel. Podemos, porem, escolher de modo que det(A B) = 0. Isso e sempre possvel, pois
det(A B) e um polinomio em e polinomios sempre tem razes complexas. Para uma tal escolha
de , a matriz A B nao e invertvel e, portanto, e nula e A = B.
O Lema de Schur tem varias conseq
uencias importantes. A primeira e o seguinte:
Corol
ario 15.1 Se e uma representaca
o irredutvel complexa de dimens
ao finita de um grupo G
ent
ao e irredutvel para operadores.
2
Prova. Seja A tal que A(g) = (g)A para todo g G. Sabemos tambem que (g) = (g) ,
trivialmente. Pela unicidade afirmada no Lema de Schur, A = .
Outro corolario importante e o seguinte:
2

Para os esquecidos, Ker(A) := {x V1 | Ax = 0}. Ran(A) := {y V2 | y = Ax para algum x V1 }.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

814/1304

Corol
ario 15.2 As representaco
es irredutveis complexas de dimens
ao finita de um grupo Abeliano
s
ao unidimensionais.
2
Prova. Se G e Abeliano e uma representacao de G, vale (h)(g) = (g)(h) para quaisquer
g, h G. Assim, se e irredutvel complexa e de dimensao finita, segue do corolario anterior que
(h) = (h) , ou seja, (h) e uma matriz diagonal com (h) na diagonal. Como e irredutvel, a
dimensao do espaco so pode ser igual a 1.

Exemplos
E. 15.9 Exerccio.
ao
N , N 2, s
a

N,

Mostre que as representacoes irredutveis complexas de dimensao finita do grupo




2ik
k (a) = exp
a ,
N

k = 0, , . . . N 1.

E. 15.10 Exerccio.
SO(2) sao

Mostre que as representacoes irredutveis complexas de dimensao finita do grupo


p () = exp (ip) ,

[0, 2), p

Note que o grupo SO(2) tem representacoes irredutveis reais que nao sao unidimensionais. Por
cos() sen ()
exemplo, aquela que define o proprio grupo SO(2): R() =
, [0, 2).
sen () cos()
E. 15.11 Exerccio.
( , +) sao

Mostre que as representacoes irredutveis complexas de dimensao finita do grupo

z (x) = exp (zx) ,


x

,z .


E. 15.12 Exerccio.
( , +) sao

6
Mostre que as representacoes irredutveis unitarias de dimensao finita do grupo

k (x) = exp (ikx) ,


x
(

,k


E. 15.13 Exerccio.
ao
+ , ) s

6
Mostre que as representacoes irredutveis complexas de dimensao finita do grupo

x


+,

z .

z (x) = exp (z ln(x)) =: xz ,


6

JCABarata. Curso de Fsica-Matem


atica

E. 15.14 Exerccio.
ao
+ , ) s

Vers
ao de 29 de setembro de 2005.

Captulo 15

815/1304

Mostre que as representacoes irredutveis unitarias de dimensao finita do grupo

x


+,

15.2

k


k (x) = exp (ik ln(x)) = xik ,

Representa
co
es Irredutveis de SO(3)

Um captulo importante das aplicacoes da teoria de grupos a` Fsica envolve a classificacao das representacoes irredutveis de dimensao finita (unitarias ou ortogonais) do grupo de rotacoes SO(3).
~ onde
Como ja vimos, o grupo SO(3) e formado por matrizes da forma R(, ~) = exp(~ J),
3
e um vetor unitario e J1 , J2 , J3 sao matrizes 3 3 tais que [Ja , Jb ] = abc Jc . As
[0, 2), ~
matrizes Ja sao geradores de sub-grupos uniparametricos R1 , R2 e R3 de SO(3), representando rotacoes
em torno dos eixos 1, 2 e 3, respectivamente.
facil concluir que se e uma representacao de dimensao finita de SO(3), e da forma
E


~
(R(, ~)) = exp(~ (J)),
onde (J1 ), (J2 ), (J3 ) sao matrizes tais que [(Ja ), (Jb )] = abc (Jc ) e que sao os geradores da
representacao por dos sub-grupos uniparametricos R1 , R2 e R3 .
Vamos definir La = i(Ja ). Ficamos com
~
(R(, ~ )) = exp(i~ L),

(15.1)

com [La , Lb ] = iabc Lc .


importante notar que se (g) e unitaria para todo g SO(3), entao cada L a e auto-adjunta:
E
La = La .
E. 15.15 Exerccio. Prove isso.

Operador de Casimir
Um fato muito importante, valido para qualquer representacao de SO(3) como acima, e que a matriz
denotada por L2 e definida por
L2 = L21 + L22 + L23
comuta com todos os tres geradores La : [L2 , La ] = 0, para todo a = 1, 2, 3.
E. 15.16 Exerccio muito importante. Verifique essa afirmacao. Sugest
ao: prove (e use) a identidade
[A2 , B] = A[A, B] + [A, B]A, valida para quaisquer matrizes n n A e B.
6
Um operador com essa propriedade, a de comutar com todos os geradores de uma algebra de Lie, e
dito ser um operador de Casimir. Por um teorema devido a Racah, L2 e o u
nico operador de Casimir
2
de SO(3) (os demais sao combinacoes lineares de potencias de L ). A importancia dos operadores de

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

816/1304

Casimir e a seguinte. Como L2 comuta com cada La , segue facilmente de (15.1) que L2 (g) = (g)L2
para todo g SO(3). Assim, pelo Lema de Schur, se e uma representacao irredutvel, L 2 deve ser um
m
ultiplo da identidade. Isso abre o caminho para classificar as representacoes irredutveis de SO(3):
estudando os possveis autovalores de L2 . Em cada sub-espaco formado por autovetores com um dado
autovalor fixo, teremos uma representacao irredutvel.
Autovalores de L2
Sejam La , a = 1, 2, 3, matrizes complexas auto-adjuntas agindo em um espaco vetorial de dimensao
finita, satisfazendo [La , Lb ] = iabc Lc e L2 definida como acima. Vamos estudar os possveis autovalores
de L2 .
Comecemos mostrando que os autovalores de L2 sao n
umeros reais nao-negativos. Seja um
autovetor de L2 com autovalor : L2 = . Entao,
h, i = h, L2 i = h, L21 i + h, L22 i + h, L23 i = hL1 , L1 i + hL2 , L2 i + hL3 , L3 i.
Na u
ltima igualdade usamos o fato que La = La . Como hLa , La i 0, conclumos que 0, como
queramos.
Todo n
umero 0 pode ser escrito na forma = l(l + 1) com l 0. Por futura conveniencia,
escreveremos doravante os autovalores de L2 na forma l(l + 1) com l 0.

Recordemos agora o fato que, como [L2 , L3 ] = 0, podemos escolher uma base ortogonal formada
por vetores que sao simultaneamente autovetores de L2 e L3 . Denotaremos esses vetores por l,m ,
tendo-se L2 l,m = l(l + 1)l,m e L3 l,m = ml,m . Iremos em breve fazer uso dessa base.
conveniente definir L = L1 iL2 . Tem-se que L = L . Como L1 = (L+ + L )/2 e L2 =
E

(L+ L )/(2i), podemos reescrever as relacoes algebricas [La , Lb ] = iabc Lc em termos de L e L3 .


Obtemos
[L3 , L ] = L ,

(15.2)

[L+ , L ] = 2L3 .

(15.3)

L2 = L+ L + L3 (L3 ) ,

(15.4)

L2 = L L+ + L3 (L3 + ) .

(15.5)

E. 15.17 Exerccio muito importante. Prove as relacoes acima.

Fora isso,

Vamos usar essas relacoes para provar varios fatos sobre os autovalores de L 2 e L3 . De (15.5) tem-se
L L+ l,m = [l(l + 1) m(m + 1)]l,m = (l m)(l + m + 1)l,m .

(15.6)

L+ L l,m = [l(l + 1) m(m 1)]l,m = (l + m)(l m + 1)l,m .

(15.7)

De (15.4) tem-se

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

817/1304

Assim,
e

hl,m , L L+ l,m i = (l m)(l + m + 1)kl,m k2

(15.8)

hl,m , L+ L l,m i = (l + m)(l m + 1)kl,m k2 .

(15.9)

Porem, como L = L , segue que

hl,m , L L+ l,m i = hL+ l,m , L+ l,m i 0

hl,m , L+ L l,m i = hL l,m , L l,m i 0.

Logo, conclumos de (15.8) e de (15.9) que


(l m)(l + m + 1) 0,

(15.10)

(l + m)(l m + 1) 0.

(15.11)

De (15.10), segue que


a) l m 0 e l + m + 1 0, ou
b) l m 0 e l + m + 1 0.

No caso b) se somarmos ambas as desigualdades teremos 2l + 1 0. Isso e impossvel, pois l 0.


Assim, vale a) que, em particular, diz que m l. Por (15.11), isso implica l + m 0, ou seja, m l.
Conclumos entao que

l m l.

(15.12)

Assim, para cada l, os valores de m nao podem ser maiores que l nem menores que l.
Vamos agora provar a seguinte proposicao, que utilizaremos logo abaixo.

Proposi
c
ao 15.3 Seja l,m um autovetor de L2 e de L3 com autovalores l(l + 1) e m, respectivamente.
Ent
ao se L+ l,m = 0 segue que m = l. Analogamente, se L l,m = 0 segue que m = l.
2
Prova. Se L+ l,m = 0 segue, evidentemente, que L L+ l,m = 0. Por (15.6) isso implica (l m)(l + m +
1) = 0. Assim, ou m = l ou m = (l + 1). Esse u
ltimo caso e proibido por (15.12) e, portanto, m = l.
Se L l,m = 0 segue, evidentemente, que L+ L l,m = 0. Por (15.7) isso implica (l + m)(l m + 1) = 0.
Assim, ou m = l ou m = l + 1. Esse u
ltimo caso e proibido por (15.12) e, portanto, m = l.
Vamos agora prosseguir tentando estabelecer mais alguns fatos sobre os possveis valores de l e m.
Usando as relacoes de comutacao entre L3 e L+ , e facil ver que
L3 L+ l,m = [L3 , L+ ]l,m + L+ L3 l,m = (m + 1)L+ l,m .
Analogamente, usando as relacoes de comutacao entre L3 e L , tem-se
L3 L l,m = [L3 , L ]l,m + L L3 l,m = (m 1)L l,m .
Essas duas relacoes dizem-nos que L l,m e um autovetor de L3 com autovalor m 1. Note-se que,
como L2 comuta com L , tem-se tambem L2 L l,m = l(l + 1)L l,m . Assim, aplicar o operador L a
l,m aumenta (diminui) de uma unidade o autovalor de L3 sem alterar o de L2 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

818/1304

Percebemos disso que caso m = l teremos L3 L+ l, l = (l + 1)L+ l, l o que, em funcao de (15.12), so


e possvel se L+ l, l = 0. Analogamente, caso m = l teremos L3 L l, l = (l + 1)L l, l o que, em
funcao de (15.12), so e possvel se L l, l = 0. Junto com a Proposicao 15.3 isso conduz ao
Corol
ario 15.3 Seja l,m um autovetor n
ao-nulo de L2 e de L3 com autovalores l(l + 1) e m, respectivamente. Ent
ao tem-se L+ l,m = 0 se e somente se m = l. Analogamente, L l,m = 0 se e somente
se m = l.
2
Precisamos mostrar que existem autovetores nao-nulos de L3 com autovalores l. Certamente
existe um autovetor nao-nulo l,m para algum m satisfazendo (15.12). Pelo que vimos acima, Lp+ l,m
e um autovetor de L3 com autovalor m + p. Suponhamos que m < l e seja p0 0 o maior inteiro
nao-negativo tal que m + p0 l. Entao m + p0 + 1 > l, o que implica que 0 = Lp+0 +1 l,m = L+ Lp+0 l,m .
Pelo corolario 15.3 isso implica que ou Lp+0 l,m e nulo ou e autovetor de L3 com autovalor l. Se p0 = 0
entao l,m 6= 0, por hipotese. Se p0 > 0, entao, caso Lp+0 l,m = 0, concluiramos tambem pelo corolario
15.3 que Lp+0 1 l,m e autovetor nao-nulo de L3 com autovalor l. A repeticao desse argumento conduz a`
conclusao que ha um autovetor nao-nulo de L3 com autovalor l. Analogamente, conclui-se que existe
autovetor nao-nulo de L3 com autovalor l.
Estamos agora preparados para chegar a uma importante conclusao sobre os possveis valores de l,
a saber, que l so pode assumir valores inteiros ou semi-inteiros.

Ao aplicarmos repetidamente o operador L+ , ao vetor nao-nulo l,l obtemos sucessivos vetores


Lp+ l,l com autovalores l + p de L3 . Chegara um momento em que a desigualdade l m l sera
violada, ou seja, existe p tal que Lp+1
+ l,l seria o primeiro autovetor de L3 com autovalor maior que
p
l. Como isso e impossvel, segue que Lp+1
+ l,l = 0 e L+ l,l deve ser autovetor de L3 com autovalor
maximo l. Mas o autovalor de L3 em Lp+ l,l e l + p. Logo l + p = l, ou seja, 2l = p. Como p e um
n
umero inteiro, segue que l e ou um inteiro (caso p seja par) ou um semi-inteiro (caso p seja mpar).
Como os autovalores m sao da forma l + p, para p inteiro, segue que m sera inteiro se l o for ou
semi-inteiro, caso l o seja.
A conclusao importante e que os autovalores de L2 sao n
umeros da forma l(l + 1) com l 0 inteiro
ou semi-inteiro. Cada representacao irredutvel de SO(3) e caracterizada por um autovalor de L 2 e
podemos, portanto, classificar as representacoes irredutveis de SO(3) pelo ndice l: l . Esse fato e de
grande importancia na Fsica Quantica pois os n
umeros l(l + 1) e m sao associados aos autovalores dos
2
operadores de momento angular L e L3 .
Elementos de Matriz dos Geradores L1 , L2 e L3
possvel fixar a forma dos geradores La em cada representacao irredutvel l . Para isso, escolhemos
E
como base os 2l +1 vetores l,m com l m l. Nessa base L3 e diagonal tendo elemento de matriz m
na m-esima posicao da diagonal. Para obter os elementos de matriz de L1 e L2 , obtemos primeiramente
os elementos de matriz de L . Os mesmos podem ser fixados a partir de (15.8)-(15.9), que nos dizem
que,
kL+ l,m k2 = (l m)(l + m + 1) = [l(l + 1) m(m + 1)]
(15.13)
e
kL l,m k2 = (l + m)(l m + 1) = [l(l + 1) m(m 1)]

(15.14)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

819/1304

para kl,m k = 1. Sabemos que L l,m deve ser m


ultiplo de l,m1 . Com as relacoes acima, podemos
convencionar (fixando os fatores de fase como sendo iguais a 1)
p
L+ l,m =
l(l + 1) m(m + 1) l, m+1 ,
p
l(l + 1) m(m 1) l, m1 .
L l,m =
Isso fornece os elementos de matriz de L na base l,m e com os mesmos podemos obter os elementos
de matriz de L1 e L2 .

E. 15.18 Exerccio. Obtenha explicitamente as matrizes L1 , L2 e L3 nos casos l = 1/2, l = 1 e l = 3/2.


No primeiro caso, obtem-se, a menos de um fator 1/2, as matrizes de Pauli.
6
Com as expressoes acima,e ate mesmo
 possvel escrever de modo mais explcito a forma das repre~ .
sentacoes l (R(, ~)) = exp i~ L

15.3

A Medida de Haar

Seja G um grupo finito e seja f : G


uma funcao que a cada elemento g do grupo associa um
n
umero complexo f (g). Podemos definir a media de f em G por
(f ) :=

1 X
f (g),
#G gG

onde #G e o n
umero de elementos de G.
Essa nocao de media de uma funcao em um grupo finito possui algumas propriedades importantes.
Seja h um elemento fixo mas arbitrario de G e definamos as funcoes fhe (g) := f (hg), fhd (g) := f (gh) e
f i (g) = f (g 1 ). Entao vale que para qualquer h G
(fhe ) = (fhd ) = (f i ) = (f ),
ou seja, a media e invariante por multiplicacao a` direita ou a` esquerda por elementos de G ou pela
inversao do argumento de f .
E. 15.19 Exerccio. Mostre isso.

Note-se tambem que a media acima foi normalizada de modo que se f (g) = 1 para todo g G,
entao (f ) = 1. Por fim, note-se tambem que a media acima e positiva: se f 0 entao (f ) 0. Fora
isso, se f 0 e (f ) = 0, entao f (g) = 0 para todo g G.
Grupos finitos nao sao os u
nicos a possuir medias invariantes positivas. Vamos a alguns exemplos.
Para o grupo SO(2) podemos definir
1
(f ) =
2

f ()d,
0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

820/1304

facil ver que as propriedades de invariancia observadas no caso de grupos


caso a integral seja finita. E
finitos sao validas aqui tambem, inclusive a normalizacao e a positividade. Para o grupo ( , +)
podemos definir
Z


(f ) =

f (x)dx,

caso a integral seja finita. Como se ve essa media e positiva, invariante por translacoes f (x) f (x + y)
e pela troca do argumento da f por seu inverso: f (x) f (x), em analogia ao caso de grupos finitos.
Note-se, porem, que essa media nao pode ser normalizada, pois o grupo nao e compacto. Outro exemplo
e o grupo ( + , ). Aqui a media invariante e
Z
1
(f ) =
f (x) dx,
x
0


caso a integral seja finita.


E. 15.20 Exerccio.
f (1/x).

Mostre que essa media e invariante por f (x) f (xy), y

Novamente, note-se que essa media nao e normalizada, pois




+,

e por f (x)
6

nao e compacto.

Podemos nos perguntar, quais grupos possuem medias invariantes positivas como nos exemplos
acima? Uma resposta parcial foi dada por Haar3 . O teorema de Haar afirma que se G e um grupo
compacto entao existe uma medida de integracao d(g) em G, denominada medida de Haar, tal que se
a media
Z
(f ) =
f (g)d(g)
G

e bem definida, entao tem-se


Z
Z
Z
Z
f (g)d(g) =
f (hg)d(g) =
f (gh)d(g) =
f (g 1 )d(g)
G

para todo h G. ForaR isso, a media e normalizada: G d(g) = 1 e positiva: se f 0 entao


sendo que se f 0 e G f d = 0, entao f (g) = 0 para quase todo g G.

f d 0

O teorema de Haar pode ser parcialmente extendido para grupos localmente compactos (como
( , +) e ( + , )): Se G e localmente compacto existem medidas positivas de integracao de (g) e
dd (g) em G tais que
Z
Z
Z
e
e
f (g)d (g) =
f (hg)d (g) =
f (g 1 )de (g)


f (g)d (g) =
G

f (gh)d (g) =
G

f (g 1 )dd (g),
G

para quaisquer h G. Ou seja, existem uma medida invariante a` esquerda e uma outra invariante
a` direita. Em alguns casos essas medidas coincidem (por exemplo, para grupos Abelianos), mas tal
nem sempre e o caso para grupos nao-Abelianos. Note que no caso de grupos compactos a medida
3

Alfred Haar (1885-1933).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

821/1304

invariante a` esquerda e a medida invariante a` direita tambem coincidem. No caso de grupos localmente
compactos nem sempre se pode normalizar as medidas invariantes.
Na presente versao destas notas nao iremos nos estender mais no estudo da medida de Haar. O
estudante e convidado aqui a procurar os classicos do assunto (p.e. The Haar Measure, de Leopoldo
Nachbin4 ). Como veremos, a medida de Haar de grupos compactos desempenha um papel muito
importante no estudo das representacoes desses grupos.

15.4

Representa
co
es de Grupos Compactos

Seja G um grupo compacto e seja d sua medida invariante. Vamos supor que seja uma representacao
de G em um espaco vetorial complexo V no qual esteja definido um produto escalar h, i. Com o uso
de e d podemos definir em V um outro produto escalar h, iG por
Z
hx, yiG :=
h(g)x, (g)yi d(g),
G

x, y V .

O fato importante sobre esse produto escalar e o seguinte: para todo h G e todo x, y V
h(h)x, (h)yiG = hx, yiG .

E. 15.21 Exerccio. Mostre isso.

No caso de V ser um espaco vetorial complexo de dimensao finita, essa u


ltima igualdade afirma que
cada (h) e um operador unitario em relacao ao produto escalar h, iG .
Como conseq
uencia, temos a seguinte

Proposi
c
ao 15.4 Toda representaca
o de um grupo compacto em um espaco vetorial complexo de dimens
ao finita e equivalente a uma representaca
o unit
aria e, conseq
uentemente, e ou irredutvel ou
maximalmente redutvel.
2
Mais forte e o seguinte teorema, que nao provaremos aqui:
Teorema 15.1 Toda representaca
o de um grupo compacto e equivalente a uma soma direta de representaco
es irredutveis de dimens
ao finita.
Esse teorema nos diz que no caso de grupos compactos as representacoes irredutveis de dimensao
finita sao os tijolos com os quais se constroem todas as representacoes.
Note-se que o teorema acima afirma que toda representacao de um grupo compacto Abeliano e
equivalente a uma soma direta de representacoes de dimensao 1.
4

Leopoldo Nachbin (1922-1993). Vide http://www.dmm.im.ufrj.br/doc/nachbin.htm

JCABarata. Curso de Fsica-Matem


atica

15.5

Vers
ao de 29 de setembro de 2005.

Captulo 15

822/1304

O Teorema de Peter-Weyl

Um dos resultados mais profundos da teoria de representacoes de grupos compactos e um teorema sobre
a ortogonalidade das representacoes irredutveis unitarias que em varios aspectos generaliza o celebre
teorema de Fourier5 da Analise Harmonica. Como veremos, esse teorema e tambem um corolario do
Lema de Schur.
O Teorema de Peter-Weyl. Rela
co
es de Ortogonalidade
Dentro da colecao de todas as representacoes unitarias de dimensao finita de um grupo compacto
(ou finito) G podemos estabelecer uma relacao de equivalencia, como ja observamos, dizendo que duas
representacoes sao equivalentes se possurem um intertwiner invertvel. Podemos tomar em cada classe
um representante e formar assim uma colecao { , }, de todas as representacoes unitarias de
dimensao finita nao-equivalentes entre si do grupo compacto (ou finito) G. Acima designa o conjunto
de ndices que rotulam as representacoes.
Cada age em um espaco vetorial complexo V . No que segue designaremos por d a dimensao
de V .
O importante teorema de Peter6 e Weyl7 afirma que os elementos de matriz (g)ij , i, j = 1, . . . , d
sao ortogonais entre si em relacao ao produto escalar definido pela medida de Haar do grupo compacto
(ou finito) G. Mais que isso, elas formam uma base ortogonal completa no espaco de Hilbert L 2 (G, d).
Teorema 15.2 Seja { , } a coleca
o de todas as representaco
es unit
arias irredutveis de dimens
ao finita n
ao-equivalentes entre si de um grupo compacto (ou finito) G. Sejam (g)ij , i, j =
1, . . . , d seus elementos de matriz. Seja d a medida de Haar de G. Ent
ao
Z
1
(g)ij (g)kl d(g) =
ik jl .
(15.15)
d
G
Por fim, as funco
es (g)ij , i, j = 1, . . . , d formam uma base ortogonal completa no espaco de Hilbert
L2 (G, d). Com isso, toda funca
o f L2 (G, d) pode ser escrita na forma
f (g) =

d
X X

aij (g)ij ,

i, j=1

onde
aij

= d

(g)ij f (g) d(g).


G

Finalmente, para f L (G, d) vale a identidade de Parseval8 :


Z

d
X 1 X
2
a .
|f (g)| d(g) =
ij
d
i, j=1
G

Jean Baptiste Joseph Fourier (1768-1830).


F. Peter (?).
7
Hermann Klaus Hugo Weyl (1885-1955).
8
Marc-Antoine Parseval des Chenes (1755-1836). Parseval deduziu esta identidade no contexto das series de Fourier,
que correspondem aqui ao caso do grupo SO(2).
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

823/1304

2
As relacoes acima afirmam que as funcoes (g)ij , i, j = 1, . . . , d sao ortogonais em relacao ao
produto
escalar
R
P definido pela medida de Haar. No caso de G ser um grupo finito devemos substituir
1
d #G gG , de modo que, por exemplo, as relacoes de ortogonalidade ficam
G
1 X
1
(g)ij (g)kl =
ik jl .
#G gG
d

Prova. Demonstraremos aqui as relacoes de ortogonalidade. Como veremos a prova das mesmas faz
belo uso do Lema de Schur.

Seja E [i, j] a matriz d d tal que seu elemento de matriz ab seja E [i, j] ab = ia jb . Aqui i
{1, . . . , d } e j {1, . . . , d }. Considere-se a matriz
Z
[i, j]
A
:=
(g 1 ) E [i, j] (g) d(g)
G

(g) E [i, j] (g) d(g).


G

Usando as propriedades de invariancia da medida d, e facil provar que


(h) A[i, j] = A[i, j] (h)
para todo h G. (Exerccio!). Pelo Lema de Schur, ou A[i, j] = 0 ou A[i, j] e invertvel. No caso de
termos 6= , sabemos, por construcao, que e sao inequivalentes. Portanto, nesse caso temos
forcosamente A[i, j] = 0. Isso obviamente implica que todos os elementos de matriz de A[i, j] sao nulos,
ou seja,
XZ


[i, j]
0 = A
=
(g)ak E [i, j] kl (g)lb d(g)
ab
G

k, l

XZ
k, l

=
=

(g)ak ik jl (g)lb d(g)

(g)ai (g)jb d(g)


(g)ia (g)jb d(g).

Note que essa relacao vale para 6= mas i, j, a, b arbitrarios. Isso provou (15.15) para 6= .

Vamos agora tratar o caso em que = . Nesse caso, como vimos (h) A[i, j] = A[i, j] (h) para
todo h G. Aqui A[i, j] sao matrizes d d . Pelo Corolario 15.1, A[i, j] = [i, j] . Vamos determinar

JCABarata. Curso de Fsica-Matem


atica

Captulo 15

Vers
ao de 29 de setembro de 2005.

824/1304

as constantes [i, j] . Por um lado, tomando-se o traco de A[i, j] tem-se Tr(A[i, j] ) = d [i, j] . Por outro
lado, pela definicao de A[i, j] tem-se
Z


[i, j]
Tr A
=
Tr (g 1 ) E [i, j] (g) d(g)
G

Tr (g) (g 1 ) E [i, j]
G

= ij


Tr E [i, j] d(g)

d(g)

d(g)
G

= ij ,

pois Tr E [i, j] = ij . Logo,
Assim,

1
ij
d

[i, j] =

= A

[i, j]

1
ij .
d

(g) E [i, j] (g) d(g).


G

Considerando-se o elemento de matriz ab de ambos os lados da u


ltima expressao, tem-se
XZ

1
ij ab =
(g)ak E [i, j] kl (g)lb d(g)
d
k, l G
=

XZ
k, l

=
=

(g)ak ik jl (g)lb d(g)

(g)ai (g)jb d(g)


(g)ia (g)jb d(g).

Isso prova (15.15) para = , completando a prova das relacoes de ortogonalidade.


A demonstracao que as funcoes (g)ij formam uma base ortogonal completa em L2 (G, d) nao
sera apresentada na presente versao destas notas. As demais afirmacoes sao conseq
uencia das relacoes
de ortogonalidade.

Car
ateres e Fun
co
es Centrais

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

825/1304

Dada uma representacao de dimensao finita de um grupo G, define-se o car


ater de como sendo
a funcao
(g) := Tr ((g)) ,
gG
Um fato relevante sobre carateres e a seguinte identidade:



(hgh1 ) = Tr (hgh1 ) = Tr (h)(g)(h1 ) = Tr (h1 )(h)(g) = Tr ((g)) = (g)

para quaisquer g, h G. Isso sugere a seguinte definicao: uma funcao f : G e dita ser central
se f (g) = f (hgh1 ) para todos g, h G. Equivalentemente, podemos definir funcoes centrais como
sendo as funcoes tais que f (gh) = f (hg) para todos g, h G.
E. 15.22 Exerccio. Mostre a equivalencia dessas definicoes.

Carateres sao funcoes centrais. Das relacoes (15.15), tomando-se i = j, k = l e somando-se nesses
ndices, obtem-se facilmente que os carateres das representacoes irredutveis unitarias de dimensao
finita satisfazem as seguintes relacoes de ortogonalidade:
Z
(g) (g) d(g) = .
G

E. 15.23 Exerccio. Verifique.

Como conseq
uencia do Teorema de Peter-Weyl podemos igualmente provar que os carateres das
representacoes irredutveis unitarias de dimensao finita formam uma base ortogonal no espaco de Hilbert
das funcoes centrais de quadrado integravel de um grupo finito ou compacto. Nao apresentaremos a
demonstracao aqui. Notemos apenas que no caso do grupo SO(2) os carateres das representacoes
irredutveis unitarias de dimensao finita sao p () = eip , p . Assim, a afirmacao de acima, que os
carateres formam uma base no espaco das funcoes centrais de quadrado integravel, e nesse contexto
um bem conhecido resultado da teoria das series de Fourier.
Classe de Conjuga
c
ao
Seja G um grupo. Podemos estabelecer uma relacao de equivalencia em G da seguinte forma. Se
x, y G, dizemos que x y se existir algum elemento h G tal que x = hyh1 .
E. 15.24 Exerccio. Verifique que isso, de fato, define uma relacao de equivalencia.

As classes de equivalencia de G por essa relacao sao denominadas classe de conjugaca


o, ou classes
de elementos conjugados.
E. 15.25 Exerccio. Verifique que a identidade e o u
nico elemento de sua classe de equivalencia.

O fato importante sobre funcoes centrais e classes conjugadas e a seguinte afirmacao: toda funcao
central de um grupo G e constante nas classes conjugadas de G. A prova e elementar: se x, y pertencem
a` mesma classe entao existe h tal que x = hyh1 . Logo, f (x) = f (hyh1 ) = f (y).

JCABarata. Curso de Fsica-Matem


atica

Captulo 15

Vers
ao de 29 de setembro de 2005.

826/1304

Assim, para determinar uma funcao central, como um carater de uma representacao, por exemplo,
basta determinar seus valores nas classes de conjugacao. Essa observacao desempenhara um papel
abaixo.
Car
ateres de Grupos Finitos
Carateres desempenham um papel especial no caso de grupos finitos. Se G e finito, as relacoes de
ortogonalidade acima ficam
1 X
(g) (g) = .
(15.16)
#G gG
No caso e grupos finitos os carateres possuem uma propriedade de ortogonalidade adicional que e muito
u
til no estudo de propriedades desses grupos. Vamos apresenta-la.
Se f e uma funcao central de um grupo finito, entao f e automaticamente de quadrado integravel
(pois o grupo e finito) e, pelo teorema de Peter-Weyl, podemos escreve-la como
X
f (h) =
c (h),

onde
c =

1 X
(g)f (g).
#G gG

Como tanto quanto f sao constantes nas classes de equivalencia Ck , k = 1, . . . , K, de G, podemos


escrever essa u
ltima expressao como
K

1 X
=
(#Ck ) (Ck )f (Ck ),
#G k=1

onde #Ck e o n
umero de elementos do grupo que pertencem a` classe Ck e f (Ck ) e o valor de f em Ck .
Assim,
K
X 1 X
(#Ck ) (Ck )f (Ck ) (h)
f (h) =
#G

k=1

"

K
X

#Ck X
=
f (Ck )
(Ck ) (h)
#G

k=1
Tomando h Cj , teremos

"

#
#Ck X
f (Cj ) =
f (Ck )
(Ck ) (Cj ) .
#G

k=1
K
X

Como f e arbitraria, segue que




#Ck
#G

X

(Ck ) (Cj ) = jk .

(15.17)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 15

827/1304

Essa relacao de ortogonalidade especial tem varias conseq


uencias relevantes para o estudo de representacoes irredutveis unitarias de grupos finitos. Uma delas e a seguinte:
Proposi
c
ao 15.5 Se G e um grupo finito, o n
umero de representaco
es irredutveis unit
arias de G e
igual ao n
umero de de classes de conjugaca
o de G.
2
Prova. Seja G um grupo finito e Ck , k = 1, . . . , K suas classes de conjugacao. Sabemos que as funcoes
centrais sao constantes nas classes de conjugacao e, portanto, vale para toda funcao central f a seguinte
identidade
K
X
f (g) =
fk Ck (g),
k=1

onde fk e o valor que f assume em Ck e

Ck (g) :=

1, se g Ck
0, se g 6 Ck

Isso significa que o espaco vetorial C(G) das funcoes centrais de G tem uma base formada pelas funcoes
Ck , k = 1, . . . , K, e, portanto, tem dimensao K.
Por (15.16) as funcoes , , formam uma base ortogonal no espaco C(G). Portanto, o n
umero
# de representacoes irredutveis de G e menor ou igual a` dimensao de C(G), que e K, como acabamos
de ver: # K.

Por outro lado, (15.17) diz-nos que o espaco vetorial de todas as funcoes , o qual tem dimensao
# (por que?), possui um conjunto de K funcoes ortogonais, a saber, as funcoes hk () = (Ck ), .
Logo, K #. Isso completa a prova que K = #
` luz desta proposicao podemos rescrever (15.17) como
A

 K
#Ck X a
(Ck )a (Cj ) = jk .
#G a=1

(15.18)

j, k = 1, . . . , K.

Outra conseq
uencia de (15.18) e a seguinte. Tomando-se Cj = Ck = C1 , onde C1 e a classe de
conjugacao da identidade, a qual so possui um elemento, conclumos que
K
X

d2a = #G,

(15.19)

a=1

pois (C1 ) = Tr( (e)) = da .

Essa curiosa expressao nos mostra uma relacao entre as dimensoes das representacoes irredutveis de
G e a ordem de G. Em muitos casos e possvel extrair informacoes sobre as representacoes irredutveis
do grupo a partir da mesma. Isso pois (15.19) nao pode ser satisfeita por quaisquer n
umeros inteiros
K, da e #G. Por exemplo, um grupo que possua 6 elementos e 3 classes de conjugacao so pode ter
duas representacoes irredutveis unidimensionais e uma bidimensional, pois 6 = 12 + 12 + 22 e nao
ha outra forma de escrever o n
umero 6 como soma de tres quadrados. Esse, alias, e precisamente o
caso do grupo de permutacoes de 3 elementos, S3 , o qual possui 6 elementos e 3 classes de conjugacao
(identifique-as!).

Parte V
Topologia Geral, Teoria da Medida e
Integrac
ao

828

Captulo 16
Espacos M
etricos
Conte
udo
16.1 M
etricas e Espa
cos M
etricos . . . . . . . . . . . . . . . . . . . . . . . . . . . 831
16.2 Topologia de Espa
cos M
etricos . . . . . . . . . . . . . . . . . . . . . . . . . 845
16.3 Pseudo-M
etricas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 848
16.4 Espa
cos de Banach e de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . 850
16.4.1 Espacos de Seq
uencias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 852
16.A Algumas Desigualdades B
asicas . . . . . . . . . . . . . . . . . . . . . . . . . 866
16.B N
umeros reais e p-
adicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 868
16.C Aproxima
co
es para . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 875

odos estamos familiarizados com a nocao usual e intuitiva de distancia entre pontos da reta
real , do plano bidimensional 2 ou do espaco tridimensional 3 . O estudante ha de
reconhecer que boa parte do material tratado em cursos de calculo de funcoes de uma ou
varias variaveis, reais ou complexas, como as nocoes de derivacao e integracao, assenta-se
sobre nocoes como as de convergencia e limite, as quais, por suas vez, assentam-se sobre a nocao
intuitiva de distancia entre pontos. Assim, por exemplo, dizemos que uma seq
uencia xn de pontos na
reta real converge a um ponto x se a distancia |xn x| entre xn e x torna-se menor e menor a` medida
que n cresce. Mais adiante faremos essas ideias mais precisas e gerais.


Ao longo do seu desenvolvimento, especialmente apos o seculo XIX, a Matematica reconheceu


a importancia de abstrair e generalizar a nocao intuitiva de distancia de modo a aplica-la a outros
tipos de conjuntos que nao os familiares espacos de dimensao finita , 2 ou 3 . Esse desenvolvimento
conduziu a`s nocoes de metrica, de espacos metricos e de espacos metricos completos, as quais definiremos
mais adiante, e permitiu aplicar muitas das nocoes geometricas e instrumentos analticos, originalmente
desenvolvidos em espacos mais familiares, para conjuntos menos acessveis a` intuicao, como por exemplo
espacos vetoriais de dimensao infinita, tais como espacos de funcoes ou de seq
uencias. Uma importante
aplicacao dessas ideias e nocoes a` teoria das equacoes diferenciais e integrais sera vista no Captulo 17,
quando trataremos do Teorema do Ponto Fixo de Banach.


Lembramos ao estudante que o estudo de espacos de dimensao infinita nao e uma mera abstracao
desprovida de uso ou interesse pratico. Ao se decompor uma funcao f , contnua, diferenciavel e
periodica de perodo 2, em sua serie de Fourier1 ,
f (t) =

n=
1

Jean Baptiste Joseph Fourier (1768-1830).

829

eint
an
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

830/1304

tal como ocorre, por exemplo, no problema da corda vibrante, o que estamos fazendo e precisamente
expressar uma tal funcao em termos de componentes em uma base de um espaco de dimensao infinita,
eint
no caso a base formada pelas infinitas funcoes
com n .
2

Para o estudo de espacos de dimensao infinita, como o desse exemplo, seria muito importante
se pudessemos reter algumas das nocoes geometricas familiares em espacos de dimensao finita. O
emprego de ideias geometricas analogas a`quelas encontradas nos espacos , 2 ou 3 e de grande
importancia na tarefa de explorar espacos de dimensao infinita, como o espaco das funcoes contnuas
periodicas de perodo 2, justamente por trazerem tais espacos para mais perto da nossa intuicao.
Por razoes evolutivas, o cerebro humano so e capaz de produzir e desenvolver imagens em uma, duas
ou tres dimensoes e, portanto, para o estudo de espacos com mais dimensoes faz-se necessario dispor
de instrumentos abstratos que permitam desenvolver raciocnios o mais proximo possvel daqueles
empregados em espacos de dimensao 1, 2 ou 3.


Devido a`s bem-conhecidas relacoes de ortogonalidade


Z 2
1
ei(nm)t dt = n, m
2 0
sabemos que, as constantes an da decomposicao de Fourier acima sao dadas por
Z 2 int
e
f (t) dt ,
an =
2
0
e podem ser interpretadas geometricamente como as projecoes, ou componentes, da funcao f na
int
direcao das funcoes e2 . (A nocao de projecao, ou componente, de um vetor e familiar em 2
ou em 3 ). Como e bem sabido (para a teoria das series de Fourier, vide [33]), vale tambem a relacao,
conhecida como Identidade de Parseval2 ,
v
s
u
Z 2
u X
2
|an |2 .
|f (t)| dt = t


n=

Sendo o lado direito a raiz quadrada da soma do quadrado das componentes ortogonais de f , podemos
interpretar o lado esquerdo como o modulo ou comprimento da funcao f (entendida como vetor no
espaco de dimensao infinita das funcoes periodicas de perodo 2), tal como no Teorema de Pitagoras 3
em 2 ou 3 .


Se levada adiante, essa analogia geometrica nos permite definir uma possvel nocao de dist
ancia
entre duas funcoes contnuas periodicas f e g, que denotaremos por4 d2 (f, g), como o modulo (ou
comprimento) da diferenca entre duas funcoes, tal como se faz em espacos de dimensao finita:
s
Z 2
d2 (f, g) :=
|f (t) g(t)|2 dt .
0

Marc-Antoine Parseval des Chenes (1755-1836).


Pit
agoras de Samos (ci. 569 A.C. - ci. 475 A.C.).
4
A raz
ao de empregarmos o sub-ndice 2 na definica
o de d2 (f, g) ser
a esclarecida mais adiante.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

831/1304

Com esse instrumento em maos podemos agora empregar conceitos como o de convergencia e limite de
seq
uencias no espaco de dimensao infinita das funcoes contnuas periodicas e, eventualmente, prosseguir
desenvolvendo em tais espacos outros ingredientes do Calculo e da Analise.
Para implementar tais desenvolvimentos, vamos no presente captulo introduzir algumas importantes nocoes gerais, como as de metrica, de espaco metrico, de seq
uencias de Cauchy em espacos metricos,
de completamento de espacos metricos e de topologia de espacos metricos, nocoes essas que provaram
ser de grande importancia na tarefa de levar os instrumentos familiares de abordagem matematica de
espacos de dimensao finita a espacos de dimensao infinita e outros.

16.1

M
etricas e Espa
cos M
etricos

M
etricas
Uma questao importante que se coloca e a de identificar quais propriedades basicas a nocao intuitiva
de distancia possui para permitir seu emprego em varias instancias. O desenvolvimento da Matematica
conduziu a uma identificacao desses ingredientes em um conjunto de quatro propriedades, as quais
resumem tudo o que e essencialmente necessario na demonstracao de resultados nos quais a nocao de
distancia e empregada. Surgiu da identificacao dessas propriedades a nocao matematica de metrica, a
qual abstrai e generaliza a nocao intuitiva de distancia. Vamos a essa definicao.
Seja X um conjunto (entendido doravante como nao-vazio). Uma funcao d : X X
ser uma metrica em X se possuir as seguintes propriedades:


e dita

1. Positividade: d(a, b) 0 para todos a, b X.


2. Condicao de distancia nula: d(a, b) = 0 se e somente se a = b.
3. Simetria: para todos a e b X vale d(a, b) = d(b, a).
4. Desigualdade triangular: para todos a, b e c X vale d(a, b) d(a, c) + d(c, b).
A quarta propriedade acima e particularmente importante e e denominada desigualdade triangular
devido a seu significado geometrico nos espacos 2 e 3 com a metrica usual. (Justifique!)


As quatro propriedades listadas acima sao aquelas identificadas como essenciais na nocao intuitiva
de distancia e qualquer funcao d que as satisfaca, ou seja, qualquer metrica, pode potencialmente ser
empregada como equivalente a` nocao intuitiva de distancia.
Um ponto importante da definicao de metrica e a condicao que afirma que d(x, y) = 0 se e somente
se x e y forem iguais. Compare com a definicao de pseudo-metrica a` pagina 848.
Mencionamos en passant que a condicao de positividade acima e, em verdade, conseq
uencia da
desigualdade triangular e da condicao de simetria. De fato, usando essas duas condicoes, pode-se
provar o seguinte fato mais forte: para todos x, y, z M vale
d(x, y) |d(x, z) d(z, y)|,

(16.1)

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

832/1304

o que, em particular, garante que d(x, y) 0. Para provar isso, note-se que pela desigualdade triangular
d(x, z) d(x, y) + d(y, z). Logo,
d(x, y) d(x, z) d(y, z).

(16.2)

Trocando-se x por y e usando-se a condicao de simetria, obtemos tambem


d(x, y) = d(y, x) d(y, z) d(x, z).

(16.3)

Ambas as relacoes (16.2) e (16.3) dizem que d(x, y) |d(x, z) d(y, z)|, como queramos mostrar.

O exemplo mais basico de uma metrica e oferecido, no caso X = , pela funcao d(x, y) = |y x|,
x, y . Outro exemplo essencialmente identico em X = , e oferecido pela funcao d(z, w) = |z w|,
z, w . Essas sao as chamadas metricas usuais em
e , respectivamente. Deixamos ao leitor a
tarefa simples de verificar que essas funcoes satisfazem a definicao de metrica.


Espa
cos m
etricos e outros exemplos b
asicos
Se X e um conjunto e d e uma metrica em X, dizemos que o par (X, d) e um espaco metrico. Ou
seja, um espaco metrico vem a ser um conjunto munido de uma metrica.
Nota. A nocao de Espaco Metrico foi introduzida por Frechet5 em sua dissertacao de 1906. A expressao
espaco metrico, no entanto, nao foi sua invencao, tendo sido cunhada por Hausdorff 6 em 1914.
Como mencionamos, as quatro propriedades requeridas na definicao de metrica, acima, foram enunciadas sob inspiracao do exemplo familiar do proximo exerccio.
p
Verifique que a funcao d2 (x, y) := (y1 x1 )2 + + (yn xn )2 , onde x =
E. 16.1 Exerccio.
6
(x1 , . . . , xn ) e y = (y1 , . . . , yn ), e uma metrica em n (chamada de metrica Euclidiana).


importante que o estudante familiarize-se desde cedo com o fato que um conjunto X pode ter
E
varias metricas. O exemplo anterior e os dois abaixo ilustram isso.

E. 16.2 Exerccio.
Verifique que a funcao d (x, y) := max{|y1 x1 |, . . . , |yn xn |}, onde x =
(x1 , . . . , xn ) e y = (y1 , . . . , yn ), e uma metrica em n .
6


E. 16.3 Exerccio. Verifique que a funcao d1 (x, y) := |y1 x1 | + + |yn xn |, onde x = (x1 , . . . , xn )
6
e y = (y1 , . . . , yn ), e uma metrica em n .


Mais adiante mostraremos que todas as funcoes


dp (x, y) := [|y1 x1 |p + + |yn xn |p ]1/p ,
com p 1 sao metricas em

n


Uma caracterstica importante da nocao abstrata de metrica e que a mesma aplica-se tambem a
espacos outros que nao os familiares espacos n . Os exerccios abaixo ilustram isso no caso do conjunto
X = C0 ([0, 1]), que vem a ser o conjunto das funcoes contnuas reais definidas no intervalo [0, 1].


5
6

Maurice Rene Frechet (1878-1973). Frechet tambem introduziu a noca


o de compacidade.
Felix Hausdorff (1868-1942).

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

833/1304

E. 16.4 Exerccio. Seja X = C0 ([0, 1]) o conjunto de todas as funcoes reais contnuas definidas em
[0, 1]. Considere a seguinte funcao d : X X :


d (f, g) = sup |f (x) g(x)|.


x[0, 1]

Mostre que d uma metrica em X.

E. 16.5 Exerccio. Seja X = C0 ([0, 1]) o conjunto de todas as funcoes reais contnuas definidas em
[0, 1]. Considere a seguinte funcao d1 : X X :
Z 1
d1 (f, g) =
|f (x) g(x)| dx.


Mostre que d1 uma metrica em X.

E. 16.6 Exerccio. Seja X = C0 ([0, 1]) o conjunto de todas as funcoes reais contnuas definidas em
[0, 1]. Considere a seguinte funcao d2 : X X :
s
Z 1
d2 (f, g) =
|f (x) g(x)|2 dx.


Mostre que d2 uma metrica em X.

Mais adiante mostraremos que em C0 ([0, 1]) todas as funcoes


dp (f, g) =

Z

1
p

|f (x) g(x)| dx

1/p

com p 1 sao igualmente metricas.


Seq
u
encias
Antes de prosseguirmos, lembremos uma definicao basica.
Se X e um conjunto, uma funcao a : X e dita ser uma seq
uencia em X. Como e familiar ao
estudante, o valor de a em n e freq
uentemente denotado por an ao inves de a(n). Analogamente,
uma seq
uencia a : X e freq
uentemente denotada por {an }n , por {an , n }, ou ainda, com um
certo abuso de linguagem, simplesmente por an . Essa u
ltima notacao e, talvez, a mais freq
uente, mas
pode, em certas ocasioes, causar alguma confusao pois, como mencionamos, a n designa, estritamente
falando, o valor de a em n, nao a seq
uencia toda.


Vamos agora introduzir varias nocoes fundamentais, as quais provem de definicoes bem conhecidas
no contexto da reta real.
Sub-seq
u
encias

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

834/1304

Seja X um conjunto e seja a :


X uma seq
uencia em X. Seja tambem :

uma
funcao estritamente crescente (ou seja, k(m) < k(n) se m < n). Entao a : X e dita ser uma
subseq
uencia de a.


Converg
encia em espa
cos m
etricos
Seja (X, d) um espaco metrico. Dizemos que uma seq
uencia a em X converge para um elemento
x X em relacao a` metrica d se para todo  > 0 existir um n
umero natural N () (eventualmente
dependente de ) tal que d(x, an ) <  para todo n > N ().
A seguinte proposicao e fundamental, pois nos diz que, em um espaco metrico, uma seq
uencia, se
for convergente, so pode convergir a um ponto:
Proposi
c
ao 16.1 Seja (X, d) um espaco metrico e seja b uma seq
uencia em X. Suponha que b
converge a um elemento x X e a um elemento y X. Ent
ao x = y.
2
Prova. Pela desigualdade triangular, temos que
d(x, y) d(x, bn ) + d(bn , y)
para qualquer n. Agora, como b converge a x sabemos que, para qualquer  > 0 teremos d(x, b n ) < 
para todo n grande o suficiente, ou seja, para todo n maior que um certo inteiro Nx (). Analogamente,
como bn converge a y sabemos que, para qualquer  > 0 teremos d(y, bn ) <  para todo n grande
o suficiente, ou seja, para todo n maior que um certo inteiro Ny (). Assim, para todo n maior que
max{Nx (), Ny ()} teremos d(x, y) < 2. Ora, como  e um n
umero positivo arbitrario, uma tal
desigualdade so pode ser valida se d(x, y) = 0. Como d e uma metrica, isso implica x = y.
O estudante pode constatar que a demonstracao acima faz uso de todas as propriedades definidoras
da nocao de metrica, o que ilustra a importancia de nocoes abstratas como aquela.
Um pouco de notacao. Se uma seq
uencia a em X converge a x X em relacao a` metrica d entao x e
dito ser o d-limite de a, ou simplesmente o limite de a, se a metrica d estiver subentendida. Denotamos
esse fato escrevendo x = dlim
an , ou simplesmente x = lim an (se a metrica d estiver subentendida).
n
n

Outra notacao freq


uentemente empregada para dizer que x e o d-limite de a e a n x.
Seq
u
encias de Cauchy
Seja um espaco metrico X com uma metrica d. Uma seq
uencia a de elementos de X e dita ser
7
uma seq
uencia de Cauchy em relacao a` metrica d se para todo  > 0 existir um n
umero natural N ()
(eventualmente dependente de ) tal que d(ai , aj ) <  para todo i e j tais que i > N () e j > N ().
A seguinte proposicao e fundamental:
Proposi
c
ao 16.2 Seja um espaco metrico X com uma metrica d e seja b uma seq
uencia convergente
em relaca
o a
` metrica d a um elemento x X. Ent
ao b e uma seq
uencia de Cauchy em relaca
o a
`
metrica d.
7

Augustin Louis Cauchy (1789-1857).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

835/1304

Prova. Sejam m e n arbitrarios. Pela desigualdade triangular, vale


d(bn , bm ) d(bn , x) + d(x, bm ).
Agora, como b converge a x sabemos que para todo  > 0 teremos d(bn , x) < /2 e d(bm , x) < /2
desde que ambos m e n sejam maiores que algum N (/2). Nesse caso, entao, d(bn , bm ) /2 + /2 = .
Isso completa a prova.
Uma questao de fundamental importancia que agora se coloca e a seguinte: sera valida a recproca
da proposicao acima, ou seja, sera toda seq
uencia de Cauchy em um espaco metrico uma seq
uencia
convergente? A importancia dessa questao e a seguinte. Dada uma seq
uencia concreta x n em um
espaco metrico X, nao sabemos a priori se xn convergira ou nao a menos que encontremos um elemento
x em X com a propriedade desejada (para todo  > 0, existe N () tal que d(xn , x) <  sempre que
n > N ()). Nem sempre pode ser facil ou possvel encontrar explicitamente tal x, e gostaramos de
possuir um criterio baseado apenas em propriedades verific
aveis da seq
uencia x n que nos permita dizer
se ela converge ou nao. A propriedade de uma seq
uencia ser de Cauchy e uma propriedade cuja validade
ou nao depende apenas da seq
uencia e, portanto, em face a` Proposicao 16.2, e um otimo candidato a
ser um tal criterio de convergencia.
Sucede, porem, que, em geral, a resposta a` pergunta acima e negativa: existem espacos metricos nos
quais ha seq
uencias de Cauchy que nao convergem. Isso e ilustrado pelos seguintes exemplos. Considereumeros racionais e adotemos em a metrica usual: d(r, s) = |r s|, com
se o conjunto X = dos n
r, s . Ha, sabidamente, exemplos de seq
uencias de que sao de Cauchy em relacao a` metrica d
que convergem em . Um exemplo e encontrado no exerccio seguinte.
E. 16.7 Exerccio. Seja r um numero racional com r > 1. Prove que a sequencia de numeros racionais
n
X
1
r
sn =
,

e
uma
seq
u

e
ncia
de
Cauchy
e
que
a
mesma
converge
ao
n
u
mero
racional
,
n

6
a
r
r

1
a=0


O ponto, porem, e que ha tambem exemplos de seq


uencias de que sao de Cauchy em relacao a`
metrica d mas que n
ao convergem em . Um exemplo famoso, e que pode ser tratado com detalhe, e
o da seq
uencia
1
1
1
,
sn = 1 + + + +
1! 2!
n!
que e uma seq
uencia de Cauchy de racionais, mas que n
ao converge a um n
umero racional 8 . Tratamos
esse exemplo com detalhe no proximo topico. A leitura do mesmo pode ser dispensada pelo estudante
ja familiarizado com esses fatos, mas pode ser instrutiva para os demais. Por um teorema de Lambert 9
(vide [55]), sabe-se que se r e um n
umero racional nao-nulo entao er nao e racional. Assim, as seq
uencias
r
r2
rn
de racionais sn = 1 + 1! + 2! + + n! convergem a irracionais. Analogamente, esse teorema de Lambert
P (1)n rn+1
implica que ln(r) nao pode ser racional se r o for, Assim, para 1 < r < 1, a serie
n=0
n+1
converge ao irracional ln(1 + r).
P
k
Outro exemplo e a seq
uencia pn = 4 nk=0 (1)
, que converge ao irracional . Uma prova que e
2k+1
irracional pode ser encontrada em [123] ou em [55]. Vide pagina 42 para mais comentarios. Para uma
8

O estudante bem sabe que essa seq


uencia converge no conjunto dos reais ao n
umero e. Abaixo provaremos que esse
n
umero n
ao e racional.
9
Johann Heinrich Lambert (1728-1777).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

836/1304

breve discussao sobre aproximacoes para recheada de digressoes historicas, vide Secao 16.C, pagina
875.
Esses exemplos, que estao longe de ser u
nicos, ilustram um fato muito importante: existem espacos
metricos nos quais nao vale a recproca da Proposicao 16.2, ou seja, existem espacos metricos nos quais
seq
uencias de Cauchy nao sao necessariamente convergentes.
De grande importancia sao os espacos metricos onde vale a recproca da Proposicao 16.2. Tais
espacos metricos sao denominados completos e deles falaremos no pos-proximo topico, a` pagina 838.
O n
umero e
e um n
umero irracional
Seja a seq
uencia de n
umeros racionais
1
1
1
+ ++
,
1! 2!
n!
Vamos provar que essa seq
uencia e de Cauchy em relacao a` metrica usual em
converge a um n
umero racional.
sn = 1 +

, mas que a mesma nao

Primeiro provemos que esta seq


uencia e de Cauchy. Vamos supor j > i. Como a seq
uencia s n e
crescente, segue que d(si , sj ) = |si sj | = sj si (por que?). Temos, entao,
d(si , sj ) = sj si =
1
=
(i + 1)!
1

(i + 1)!
<




1
1
++
(i + 1)!
j!

1
(i + 1)!
1
+
++
1+
i + 2 (i + 2)(i + 3)
j!

1
1
1
1+
+
++
2
(i + 2) (i + 2)
(i + 2)ji1

X
1
1
(i + 1)! a=0 (i + 2)a

i+2
2
1
<
para i > 0.
(i + 1)! i + 1
(i + 1)!

(16.4)

2
pode ser feito arbitrariamente pequeno tomando-se i grande, fica provado que
(i + 1)!
a seq
uencia sn e de Cauchy.
Como o n
umero

E. 16.8 Exerccio. Justifique cada passagem acima.

Vamos agora provar que essa seq


uencia nao converge a um n
umero racional. Para isso vamos supor
o contrario e constatar que isso leva a um absurdo. Vamos entao supor que a seq
uencia converge a um
racional e. Como e e suposto ser racional, e seria da forma e = p/q onde p e q sao n
umeros inteiros
primos entre si. Da desigualdade triangular segue que
d(e, si ) d(si , sj ) + d(e, sj ) <

2
+ ,
(i + 1)!

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

837/1304

para qualquer  > 0, desde que j seja escolhido grande o suficiente (pois sj converge a e). Assim, como
a desigualdade vale para qualquer  > 0, conclu-se que
d(e, si )

2
.
(i + 1)!

Como si e uma seq


uencia crescente e si 6= sj para i 6= j, segue que d(e, si ) = e si . Logo,
0 < e si =
e, portanto,

p
2
si
q
(i + 1)!

2
p
si +
q
(i + 1)!
. Para i = 2 a relacao (16.5) fica (verifique!)
si <

para todo i


5
p
17
<

.
2
q
6

(16.5)

(16.6)

Como 17/6 < 3, conclumos que 5/2 < p/q < 3. Esse fato mostra que p/q nao e inteiro. Disso, segue
que q 2, fato que usaremos logo abaixo10 .
Como (16.5) vale para todo i, tomemos em particular i = q. A relacao (16.5) diz, entao, que
1+

1
p
1
1
2
1
++
<
1+ ++ +
.
1!
q!
q
1!
q! (q + 1)!

Multiplicando-se ambos os lados por q! conclumos que


A < p(q 1)! A +

2
< A + 1, pois q 2,
q+1

onde



1
q! q!
1
q!
A := q! 1 + + +
= q! + q! + + + +
1!
q!
2! 3!
q!
e um n
umero inteiro positivo, pois e, claramente, uma soma de inteiros positivos. Assim, o que provamos
e que A < p(q 1)! < A + 1. Agora, como A e um inteiro, essas u
ltimas desigualdades dizem que o
n
umero inteiro p(q 1)! esta contido no intervalo aberto entre dois inteiros (A e A + 1) e, portanto,
nao pode ser um e inteiro: uma contradicao. Isso prova, entao, que e nao pode ser da forma p/q e,
portanto, nao pode ser racional.
E. 16.9 Exerccio. A chamada constante de Euler11 -Mascheroni12 e o numero definido13 por


1
1
:= lim 1 + + + ln(n) ' 0, 5772156649 . . . .
n
2
n
10

E possvel extrair um pouco mais de (16.6). A primeira desigualdade em (16.6) diz-nos que p > 5q/2. Como q 2,
segue que p > 5. A segunda desigualdade em (16.6) diz-nos que q 6p/17. Como p 6, segue que q 36/17 > 2.
Assim, conclu-se que q 3.
11
Leonhard Euler (1707-1783).
12
Lorenzo Mascheroni (1750-1800).
13
Essa constante foi introduzida por Euler em 1735, o qual calculou seus 16 primeiros dgitos decimais. Em 1790,
Mascheroni calculou seus 32 primeiros dgitos decimais, dos quais apenas os primeiros 19 estavam corretos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

838/1304

A constante surge em varias situacoes, por exemplo na definicao das funcoes de Bessel de segundo tipo e
em propriedades da funcao Gama de Euler (vide Secao 8.4, pagina 453). A prova que o limite acima existe
pode ser encontrada em qualquer bom livro de Calculo, por exemplo em [123]. Ate hoje nao e conhecido se
e um numero racional ou irracional. Resolva essa questao.
6
Completeza
Dizemos que o espaco metrico X e completo em relacao a` metrica d se toda seq
uencia de Cauchy
em X convergir a um elemento de X.
Assim, em um espaco metrico completo, para garantirmos que uma seq
uencia converge basta verificarmos que a mesma e de Cauchy. Como comentamos a` pagina 835, a propriedade de uma seq
uencia
ser de Cauchy pode ser verificada analisando apenas propriedades da mesma, da sua vantagem. Dessa
forma, dada uma seq
uencia concreta {xn } em um espaco metrico completo X, para sabermos se {xn }
converge nao e necessario adivinhar o elemento ao qual converge, mas bastar constatar a propriedade
de Cauchy, o que pode ser feito apenas estudando a distancia entre elementos de {xn }.
Nota. O estudante mais adiantado deve ser advertido que a nocao de completeza de um espaco metrico
n
ao e uma nocao topologica. Vide discussao a` pagina 847.
Pelo que vimos nas u
ltimas paginas, o espaco metrico formado pelos n
umeros racionais com a
metrica usual nao e um espaco metrico completo. Vale, porem a seguinte afirmacao:
Proposi
c
ao 16.3 O conjunto dos n
umeros reais
usual: d(x, y) = |x y|, x, y .

e um espaco metrico completo em relaca


o a
` metrica
2


A demonstracao dessa proposicao pode ser encontrada em todos os bons livros de Calculo ou Analise
Real. Discutiremos com detalhe esse fato ao apresentarmos uma construcao dos n
umeros reais, devida
a Cantor14 (seguindo ideias de Weierstrass15 ), na Secao 16.B, da qual a proposicao acima e um corolario
imediato.
O mesmo vale para o conjunto dos n
umeros complexos:
Proposi
c
ao 16.4 O conjunto dos n
umeros complexos
metrica d(z, w) = |z w|, z, w .

e um espaco metrico completo em relaca


o a
`
2

Vale tambem a seguinte afirmacao, cuja demonstracao sera apresentada como caso particular de
uma outra afirmacao mais geral na Secao 16.4.1:
Proposi
c
ao 16.5 Para todo n 1, o conjunto n e um espaco metrico completo em relaca
o a
`s
metricas d , d1 , d2 e dp com p 1, definidas a
` p
agina 832.
2


Vamos a outros exemplos.


14
15

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).


Karl Theodor Wilhelm Weierstrass (1815-1897).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

839/1304

E. 16.10 Exerccio. Vamos mostrar que C0 ([0, 1]) nao e completo em relacao `a metrica d1 :
Z 1
|f (x) g(x)| dx.
d1 (f, g) =
0

Considere a seguinte sequencia de funcoes contnuas em [0, 1]:

se x [0, 1/2 1/n]


0,
n(x 1/2 + 1/n), se x (1/2 1/n, 1/2) ,
fn (x) =

1,
se x [1/2, 1]
onde n

a) Trace o grafico dessas funcoes para se convencer que sao todas contnuas e, portanto, elementos de
C0 ([0, 1]).
b) Calcule d1 (fn , fm ) e mostre que essa sequencia e uma sequencia de Cauchy em relacao `a metrica d 1 .
c) Seja agora funcao f definida por
f (x) =

Calcule

0, se x [0, 1/2],
1, se x (1/2, 1].

1
0

|fn (x) f (x)| dx e mostre que o limite dessa integral e zero quando n . Como f nao e

contnua, isso indica que a sequencia de Cauchy {f n }n nao converge a uma funcao contnua e, portanto,
C0 ([0, 1]) nao e um espaco metrico completo em relacao `a metrica d 1 .
6


Vamos agora mostrar o seguinte fato importante:


Proposi
c
ao 16.6 Seja [a, b] com < a b < um intervalo fechado e seja C 0 ([a, b]) conjunto
das funco
es contnuas (reais ou complexas) definidas em [a, b]. Ent
ao C 0 ([a, b]) e completo em relaca
o
a
` metrica d (f, g) := sup |f (x) g(x)|, f, g C0 ([a, b]).
2
x[a, b]

Prova. Seja fn uma seq


uencia de Cauchy em C0 ([a, b]). Entao para todo  > 0 existe um inteiro
positivo N () tal que supx[a, b] |fn (x) fm (x)| < , sempre que m e n sejam maiores que N (). Isso
significa que para cada x [a, b] tem-se |fn (x) fm (x)| <  sempre que m e n sejam maiores que N ().
Assim, para cada x [a, b] fixo, a seq
uencia numerica fn (x) e uma seq
uencia de Cauchy. Como (ou
, conforme o caso) e completo, segue que cada seq
uencia fn (x) e convergente. Vamos denominar por
f (x) seu limite.


Claramente [a, b] 3 x 7 f (x) e uma funcao (certo?). Essa funcao f e um forte candidato a ser
o limite da seq
uencia {fn }n na metrica d . Colocamo-nos, entao, as seguintes questoes: 1. Sera a
funcao f tambem um elemento de C0 ([a, b]), ou seja, contnua? 2. Se a resposta a` pergunta anterior for
positiva, sera que a seq
uencia fm converge a` funcao f na metrica d ? Se a resposta a essas perguntas
for positiva, estara provado que C0 ([a, b]) e completo na metrica d .


Precisamos agora mostrar que a seq


uencia {fm }m aproxima essa funcao f na metrica d .


JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

840/1304

Seja  > 0 arbitrario. Vamos definir uma seq


uencia crescente de n
umeros inteiros e positivos N k (),
k = 1, 2, 3, . . . com Nk+1 () > Nk (), da seguinte forma: Nk () e tal que d (fm , fn ) < /2k para
todos m, n > Nk (). Note que uma tal seq
uencia Nk () sempre pode ser encontrada pois, por hipotese,
fm e uma seq
uencia de Cauchy em d . Vamos agora escolher uma seq
uencia crescente de ndices
n1 < n2 < < nk1 < nk < tais que nk > Nk (). A essa seq
uencia esta associada a sub-seq
uencia
{fnk }k . Note que, pela definicao, tem-se


d (fnl+1 , fnl ) <


,
2l

pois nl e nl+1 sao maiores que Nl ().


Com essas definicoes, teremos que, para todo k > 1,
k1
X


fnl+1 (x) fnl (x) .
fnk (x) fn1 (x) =
l=1

(Justifique!). Logo,

|fnk (x) fn1 (x)|

k1
X

k1
X

l=1

|fnl+1 (x) fnl (x)|

sup |fnl+1 (x) fnl (x)| =

l=1 x[a, b]

k1
X
l=1

d (fnl+1 , fnl )



k1
X
1
1
< 
=  1 k1 .
2l
2
l=1
Daqui, conclumos que para cada x [a, b],
|f (x) fn1 (x)| = |f (x) fnk (x) + fnk (x) fn1 (x)|
|f (x) fnk (x)| + |fnk (x) fn1 (x)|


1
< |f (x) fnk (x)| +  1 k1 ,
2
ou seja,

|f (x) fn1 (x)| < |f (x) fnk (x)| +  1

.
2k1
O lado esquerdo desta expressao independe de k. Tomando-se o limite k e lembrando que a
seq
uencia numerica fnk (x) converge a f (x), conclumos que
|f (x) fn1 (x)|  .
Como isso vale para todo x, segue que
d (f, fn1 ) = sup |f (x) fn1 (x)| .
x[a, b]

(16.7)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

841/1304

Vamos agora provar que a funcao f e contnua. Para tal, notemos que para quaisquer x, y [a, b],
|f (x) f (y)| = |f (x) fn1 (x) + fn1 (x) fn1 (y) + fn1 (y) f (y)|
|f (x) fn1 (x)| + |fn1 (x) fn1 (y)| + |fn1 (y) f (y)|

sup |f (x) fn1 (x)| + |fn1 (x) fn1 (y)| + sup |fn1 (y) f (y)|

x[a, b]

y[a, b]

= 2d (f, fn1 ) + |fn1 (x) fn1 (y)|


2 + |fn1 (x) fn1 (y)| .
Notemos agora que fn1 C0 ([a, b]) e e, portanto, uma funcao contnua. Logo, pela definicao de
continuidade de funcoes, para x fixo, existe um n
umero positivo tal que |fn1 (x) fn1 (y)| <  para
todo y tal que |y x| < .
Assim, conclumos que para todo  > 0 existe > 0 tal que para todo y tal que |y x| < tem-se
|f (x) f (y)| < 3. Isso nos diz precisamente que f e contnua, como queramos provar. Note que
(16.7) diz-nos que fn converge a f em relacao a` metrica d .

Conjuntos Densos em Espa


cos M
etricos
Se M e um conjunto dotado de uma metrica d, dizemos que um conjunto S e d-denso em M (ou
simplesmente denso em M ) se todo x M puder ser aproximado por elementos de S no sentido da
metrica d, ou seja, se para todo x M e todo  > 0 existir sempre pelo menos um elemento s S
(dependente de x e de ) tal que d(x, s) < .
Espa
cos M
etricos. O Completamento Can
onico
Dado um conjunto X dotado de uma metrica d e que nao seja completo em relacao a esta metrica,
e muito importante, por vezes, identificar um conjunto X 0 , dotado de uma metrica d0 que possua as
seguintes propriedades:
a. X 0 contem X como subconjunto.
b. X e denso em X 0 em relacao a` metrica d0 .
c. d0 quando restrita a X e identica a d.
d. X 0 e completo em relacao a d0 .
Em um tal caso, dizemos que o espaco metrico (X 0 , d0 ) e um completamento do espaco metrico (X, d).
Como exemplo, mencionamos que o conjunto dos n
umeros reais e um completamento do conjunto
dos n
umeros racionais, caso adotemos neste a metrica d(r, s) = |r s|, r, s . A metrica d 0 em
seria tambem d0 (x, y) = |x y|, x, y .


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

842/1304

Dado um espaco metrico (X, d), que eventualmente nao e completo em relacao a uma metrica
d dada, podemos completa-lo usando um procedimento padrao devido a Cantor16 , conhecido como
completamento can
onico de espacos metricos. Isso e o conte
udo do seguinte teorema:
Teorema 16.1 (Completamento can
onico) Dado um conjunto X, dotado de uma metrica d, existe
e e uma aplicaca
e dotado de uma metrica d,
e tais que:
um outro conjunto X,
o injetora E : X X
e
1. d(E(x),
E(y)) = d(x, y) para todo x, y X.

e
e
2. O conjunto E(X), a imagem de X por E, e um conjunto d-denso
em X.
e
e e completo em relaca
3. X
o a
` metrica d.

Nota. Comentemos que E e uma bijecao entre X e E(X) (por ser injetora). Nesse sentido, podemos
e e um completamento de X.
tambem, com um pequeno abuso de linguagem, dizer que X

Na Secao 16.B ilustramos uma aplicacao importante do Teorema 16.1 (mais precisamente, da demonstracao do Teorema 16.1) ao delinearmos como podemos construir os n
umeros reais a partir dos
racionais. Em seguida, adotando metricas especiais no conjunto , mostraremos como construir um
conjunto especial de n
umeros, os chamados n
umeros p-adicos.

Prova do Teorema 16.1. Consideremos o conjunto Cd (X) formado por todas as seq
uencias em X que
sejam de Cauchy em relacao a` metrica d. Vamos introduzir em Cd (X) a seguinte relacao de equivalencia:
para duas seq
uencias de Cauchy a = {an }n e b = {bn }n dizemos que a e equivalente a b, a b, se
e somente se lim d(an , bn ) = 0.


E. 16.11 Exerccio. Prove que esta e, de fato, uma relacao de equivalencia. Sugestao: use a desigualdade
triangular.
6

A conjunto Cd (X) e, entao, a uniao disjunta de suas classes de equivalencia pela relacao acima 17 .
e o conjunto de todas essas classes de equivalencia. Como usualmente se faz,
Vamos denotar por X
denotaremos por [x] a classe de equivalencia de um elemento x Cd (X), ou seja, [x] e o conjunto de
todas as seq
uencias de Cauchy em X que sao equivalentes a` seq
uencia de Cauchy x.
e um espaco metrico definindo uma metrica de : X
e X
e da seguinte forma:
Podemos fazer de X


e
d([x],
[y]) = lim d(xn , yn ),
n

e
para duas seq
uencias de Cauchy x = {xi }i e y = {yi }i X.


(16.8)

A respeito da definicao (16.8) ha alguns pontos a comentar, o que faremos com os tres exerccios
que seguem. O primeiro exerccio mostra que o limite no lado direito de (16.8) de fato existe e esclarece
por que e importante o uso de seq
uencias de Cauchy na construcao, e nao seq
uencias quaisquer. O
segundo exerccio esclarece que de e de fato uma funcao de classes de equivalencia (independente dos
16

17

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).


Para as noco
es de relaca
o de equivalencia e classes de equivalencia, vide p
agina 29.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

843/1304

representantes x e y tomados em [x] e [y], respectivamente). O terceiro exerccio estabelece que de e, de


fato, uma metrica.
E. 16.12 Exerccio.
triangular,

Mostre que o limite em (16.8) existe. Para tal, note que, pela desigualdade
d(xi , yi ) d(xi , xj ) + d(xj , yj ) + d(yj , yi )

e, portanto,
|d(xi , yi ) d(xj , yj )| d(xi , xj ) + d(yj , yi ).
Como x e y sao sequencias de Cauchy o lado direito pode ser feito  para qualquer  > 0, desde que i e
j sejam feitos grandes o suficiente. Complete os detalhes faltantes.
6
E. 16.13 Exerccio. Mostre que se x0 Cd (X) e x0 [x] (ou seja x0 e uma sequencia de Cauchy
equivalente a x Cd (X)) entao
lim d(x0n , yn ) = lim d(xn , yn )

(16.9)

para toda y Cd (X). Sugestao: Usando a desigualdade triangular, tem-se que


d(xn , yn ) d(xn , x0n ) + d(x0n , yn ) .
Prove da que |d(xn , yn ) d(x0n , yn )| d(xn , x0n ) e conclua (16.9) disso.
6
Esse exerccio estabelece que a definicao (16.8) independe do particular elemento x de [x] adotado.
Analogamente, (16.8) independe do particular elemento y de [y] adotado e, portanto, de e legitimamente
uma funcao de classes de equivalencia.

e Sugestao: positividade e simetria sao evidentes.


E. 16.14 Exerccio. Mostre que de e uma metrica em X.
e
tambem facil ver que d([x],
E
[y]) = 0 se e somente se x y, o que implica [x] = [y]. Por fim, a desigualdade
e
triangular para d segue facilmente da desigualdade triangular para d. Complete os detalhes faltantes.
6

e Seja {[xa ], a }, uma seq


e e completo18 em relacao a d.
Vamos agora mostrar que X
uencia de
a
a
a
e
Cauchy em X. Cada elemento x e, ele mesmo, uma seq
uencia de Cauchy em X: {x1 , x2 , xa3 , . . .}.
e vale que, para todo  > 0, existe A()
Como [xa ], a , e uma seq
uencia de Cauchy em X
e a ], [xb ]) <  desde que a e b A(). Da segue que, pela definicao
suficientemente grande tal que d([x
de limite, existe I() tal que
d(xai , xbi ) < ,


desde que a e b A() e que i I(). Fora isso, como {xai }i e uma seq
uencia de Cauchy para cada
a, existe para todo  > 0 um Ja () tal que


d(xai , xaj ) < ,


18

Advertimos o estudante iniciante que a prova de completeza que segue e um tanto delicada e complexa e pode ser
dispensada em uma primeira leitura.

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

844/1304

desde que i, j Ja ()

Defina-se entao para n




(n) := A(1/n)

(n) := max{I(1/n), J(n) (1/n)} .


(n)

Defina-se tambem a seq


uencia x em X dada por xn = x(n) , n

. Como







(m)
(m)
(n)
(m)
(n)
(m)
d(xn , xm ) = d x(n) , x(m) d x(n) , x(n) + d x(n) , x(m) < 2/n < 20 ,

desde que m > n > 1/0 , segue que x e uma seq


uencia de Cauchy.

e da seq
e (na metrica d)
A classe de equivalencia [x] e um candidato a ser o limite em X
uencia [xa ].
Provemos que isso e de fato verdade. Temos que


e a ], [x]) = lim d xa , x(n) .
d([x
n
(n)
n

Porem,






(n)
(n)
d xan , x(n) d xan , xa(n) + d xa(n) , x(n) .



(n)
a
Para  > 0, escolhendo a A() e n > 1/, tem-se que d x(n) , x(n) < . Assim, como lim d xan , xa(n) =
n

0 (pois xa e uma seq


uencia de Cauchy), segue que

e a ], [x]) <  ,
d([x

e na metrica de e,
valido, como dissemos, tomando a A(). Isso diz-nos que [xa ] converge a [x] X
e e completo.
portanto, X

Para cada x X, podemos associar uma seq


uencia de Cauchy constante x
ei = x, i . Seja
e
E : X X definida por
e.
X 3 x 7 E(x) := [e
x] X
facil provar que E e injetora. De fato, se x, y X sao tais que E(x) = E(y), entao [e
E
x] = [e
y] e
isso implica x
e ye. Isso, por sua vez, significa que d(e
xi , yei ) = 0, Porem, x
ei = x e yei = y e, portanto,
provou-se que d(x, y) = 0, o que implica x = y, como queramos.
e x X} X.
e Temos
Ha entao uma bijecao E de X sobre o subconjunto E(X) := {E(x) X,
tambem que


e
e x], [e
d(E(x),
E(y)) = d([e
y ]) = lim d(e
xn , yen ) = lim d(x, y) = d(x, y) .
n

Assim, aprendemos que a bijecao E preserva distancias (e, portanto, o que se chama de uma isometria
entre X e E(X)).
e ou seja, qualquer elemento de X
e pode ser
Resta-nos mostrar que o conjunto E(X) e denso em X,
e por elementos de E(X). Seja entao [x] um elemento de X.
e
aproximado (no sentido da distancia d)
Como x e uma seq
uencia de Cauchy, vale que para cada  > 0 tem-se
d(xi , xj ) < 

(16.10)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

845/1304

desde que i e j sejam maiores que um certo N (). Seja a seq


uencia de Cauchy constante igual ao
elemento xN ()+1 , ou seja, x^
.
Teremos
N ()+1



e
e
d([x],
x^
N ()+1 n ) = lim d(xn , xN ()+1 )
N ()+1 ) = d([x], E(xN ()+1 )) = lim d(xn , x^
n

Agora, por (16.10),

lim d(xn , xN ()+1 ) < 

e
e pode
Logo, d([x],
E(xN ()+1 )) <  para todo  > 0, o que precisamente afirma que qualquer [x] X
ser arbitrariamente aproximado no sentido da metrica de por elementos de E(X). Isso completa a
demonstracao do Teorema 16.1.

16.2

Topologia de Espa
cos M
etricos

Conjuntos Abertos em Espa


cos M
etricos
Um espaco metrico possui, naturalmente, muitos subconjuntos. Ha, porem, uma classe de subconjuntos que tem uma importancia destacada, os chamados conjuntos abertos.
Seja X um espaco metrico com uma metrica d. Um subconjunto A de X e dito ser aberto (em
relacao a` metrica d) se tiver a seguinte propriedade: Para todo x A podemos achar um n
umero
real (x) > 0 (eventualmente dependente de x) tal que para todo x0 X com a propriedade que
d(x, x0 ) < (x) (ou seja, que dista de x menos que (x)) vale que x0 tambem e um elemento de A.
E. 16.15 Exerccio. Mostre explicitamente que, para a, b com a < b, o conjunto (a, b) = {x
| a < x < b} e um conjunto aberto em relacao `a metrica d(x, y) = |x y|.
6


E. 16.16 Exerccio. Mostre explicitamente que, para a, b com a < b, o conjunto [a, b) = {x
| a x < b} n
ao e um conjunto aberto em relacao `a metrica d(x, y) = |x y|.
6


E. 16.17 Exerccio. Mostre explicitamente que, para r > 0 a bola de raio r em 3 centrada na origem
em relacao `a metrica Euclidiana, Br = {x 3 | dE (x, 0) < r}, e um conjunto aberto na topologia definida
por essa metrica.
6


Seja I um conjunto arbitrario de ndices e {A , I} uma colecao de subconjuntos abertos de


um espaco metrico X. Os dois exerccios seguintes sao muito importantes.
[
E. 16.18 Exerccio. Mostre que
A e tambem um conjunto aberto em X.
6
I

E. 16.19 Exerccio. Mostre que se A e B sao abertos em X entao A B tambem o e.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

846/1304

As afirmativas contidas nesses dois u


ltimos exerccios sao importantes pois inspiram a definicao de
um outro conceito muito importante: o de espaco topologico. Espacos topologicos serao estudados com
mais detalhe e generalidade no Captulo 18, pagina 914.
E. 16.20 Exerccio. Seja X e um conjunto nao-vazio. Mostre que a expressao

0, se x = y ,
d(x, y) =
1, se x 6= y ,
com x, y X, define uma metrica em X, denominada metrica trivial.

Mostre que todo subconjunto de X e aberto em relacao a essa metrica.

Bolas Abertas em Espa


cos M
etricos
Seja X um espaco metrico com uma metrica d e seja x X. Define-se a bola aberta de raio r > 0
centrada em x como sendo o conjunto
B(x, r) = {y X, tal que d(x, y) < r}.
Bolas abertas desempenham um papel importante no estudo de espacos metricos.
E. 16.21 Exerccio.
Prove que toda bola aberta em um espaco metrico e um conjunto aberto na
topologia metrica desse espaco.
6
Ao contrario do que o nome sugere, bolas abertas em espacos metricos nao tem necessariamente
um formato redondo. Para ver isso, faca os exerccios abaixo.
2

E. 16.22 Exerccio. Seja o conjunto




com a metrica d definida acima:

d (x, y) = max{|x1 y1 |, |x2 y2 |},


onde x = (x1 , x2 ) e y = (y1 , y2 ). Desenhe a bola de raio 1 centrada em torno do ponto (0, 0).
2

E. 16.23 Exerccio. Seja o conjunto




com a metrica d1 definida acima:

d1 (x, y) = |x1 y1 | + |x2 y2 |,


onde x = (x1 , x2 ) e y = (y1 , y2 ). Desenhe a bola de raio 1 centrada em torno do ponto (0, 0).
E. 16.24 Exerccio. Seja o conjunto

2


com a metrica dp definida acima com p > 1:

dp (x, y) = (|x1 y1 |p + |x2 y2 |p )1/p ,


onde x = (x1 , x2 ) e y = (y1 , y2 ). Desenhe a bola de raio 1 centrada em torno do ponto (0, 0). Considere
os casos 1 < p < 2 e p > 2.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

847/1304

M
etricas equivalentes. M
etricas que geram a mesma topologia
Seja M um conjunto e sejam d1 e d2 duas metricas em M . As metricas d1 e d2 sao ditas equivalentes,
em smbolos d1 d2 , se existirem dois n
umeros c1 e c2 com 0 < c1 c2 tais que para todos x, y M
valha
c1 d1 (x, y) d2 (x, y) c2 d1 (x, y) .
E. 16.25 Exerccio. Mostre que a relacao d1 d2 define uma relacao de equivalencia no conjunto de
todas as metricas em M .
6
E. 16.26 Exerccio.
Sejam d1 e d2 duas metricas equivalentes em M . Mostre, que todo conjunto
d1 -aberto de M e d2 -aberto e vice-versa. Isso significa que se d1 e d2 sao equivalentes, ambas geram a
mesma topologia.
6
Os exerccios que seguem mostram que a recproca nao e geralmente verdadeira: metricas que geram
a mesma topologia nao sao necessariamente equivalentes (no sentido da definicao acima).
E. 16.27 Exerccio. Seja M um espaco metrico com uma metrica d(x, y), x, y M . Prove que
d0 (x, y) :=

d(x, y)
1 + d(x, y)

tambem define uma metrica em M . Sugestao: para demonstrar a desigualdade triangular sera u
til provar
antes que a funcao
x
l(x) =
1+x
e crescente na regiao x 0. Outra sugestao: de uma olhada na pagina 849.
6
E. 16.28 Exerccio. Mostre que as metricas d e d0 do exerccio E. 16.27 so sao equivalentes (no sentido
da definicao acima) se d for limitada, ou seja, se existir D > 0 tal que d(x, y) D para todos x, y M .
Sugestao: tem-se que l(x) x para todo x 0, mas mostre que nao existe nenhuma constante c > 0 tal
que cx l(x) para todo x 0. Todavia, uma tal constante pode ser achada se nos limitarmos a x [0, D].
6
E. 16.29 Exerccio. Mostre que, mesmo nao sendo equivalentes, as metricas d e d 0 do exerccio E.
16.27 definem a mesma topologia, ou seja, que todo conjunto d-aberto de M e d 0 -aberto e vice-versa. 6
Completeza de Espa
cos M
etricos e sua Topologia
Vamos neste ponto retornar a` nossa discussao sobre a topologia de espacos metricos e discutir sua
relacao com a nocao de completeza. A verdade e que os dois conceitos nao sao totalmente relacionados.
O fato de um espaco metrico ser completo nao e diretamente relacionado a` topologia adotada mas sim
a` metrica usada.
Para ver isso trataremos de exibir um exemplo de um espaco M dotado de duas metricas que
geram as mesmas topologias, sendo M completo em relacao a` primeira metrica mas nao em relacao a`

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

segunda metrica. No exemplo19 em quest


ao M = {x
1 1
d1 (x, y) = |y x| e d2 (x, y) = .
y x

848/1304

, x 1}. Em M adotaremos duas metricas:




E. 16.30 Exerccio. Mostre que d2 e de fato uma metrica em M .

O fato e que d1 e d2 geram a mesma topologia em M . Para ver isso notemos que d2 (x, y) =
d1 (x, y)/(xy) d1 (x, y) e, portanto, para todo x M e todo r > 0 vale Bd1 (x, r) Bd2 (x, r). Se A
e aberto em d2 (a topologia associada a` metrica d2 ), entao para todo x A ha uma bola Bd2 (x, r(x, A))
inteiramente contida em A e, pelo que acabamos de ver, ha tambem uma bola Bd1 (x, r(x, A)) inteiramente contida em A. Daqui se conclui que todo aberto de d2 e tambem aberto de d1 . Logo d2 d1 .
Igualmente e claro que para todo y da bola aberta Bd1 (x, r) de d1 podemos achar um r 0 suficientemente pequeno tal que Bd2 (y, r 0 ) Bd1 (x, r) (como?). Como as bolas abertas Bd1 geram d1 isso
implica d1 d2 , provando a igualdade das duas topologias.
O fato que queremos ressaltar e que M e completo em relacao a d1 mas nao em relacao a d2 . Que
M e completo em relacao a d1 pode ser provado diretamente ou pelo seguinte argumento topologico:
M e completo em relacao a d1 pois M e um subconjunto fechado de na topologia usual , induzida
por d1 (vide discussao a` pagina 937 e, em particular a Proposicao 18.7, pagina 937).


Para ver que M n


ao e completo em relacao a d2 observe que a seq
uencia an = n, n , e de Cauchy
em relacao a d2 mas nao ha nenhum elemento em M ao qual ela converge. Assim, M e completo em
relacao a d1 mas nao em relacao a d2 , embora ambas as metricas gerem a mesma topologia.


As consideracoes acima dizem-nos que completeza nao e uma nocao de natureza topologica.
Nota. Nao se pode argumentar, como fizemos com a metrica d1 , que M e completo em d2 por ser
um subconjunto fechado de na topologia induzida em por d2 , pois tal topologia nao existe! d2 e
uma metrica em M , mas nao em , ao contrario do que ocorre com d1 . Poder-se-ia, entao, argumentar
que d2 e uma metrica em X = (0, ) (de fato e, verifique!) e que M e um subconjunto fechado de
X = (0, ) nessa topologia (de fato e, verifique!). Sucede, porem, que X = (0, ) nao e completo em
relacao a d2 , pelo mesmo exemplo de acima, e isso viola uma das condicoes da Proposicao 18.7, pagina
937.


16.3

Pseudo-M
etricas

Seja M um conjunto nao-vazio. Uma funcao d : M M




que satisfaz

1. Positividade: para todos x, y M vale d(x, y) 0.


2. Simetria: para todos x, y M vale d(x, y) = d(y, x).
3. Desigualdade triangular: para todos x, y, z M vale d(x, y) d(x, z) + d(z, y).
4. Para todo x M vale d(x, x) = 0.
19

Extrado de [19].

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

849/1304

e dita ser uma pseudo-metrica em M .


Como ja provamos a` pagina 831, a condicao de positividade segue da desigualdade triangular e da
condicao de simetria.
O seguinte fato e evidente: toda metrica e uma pseudo-metrica e uma pseudo-metrica d e uma
metrica somente se d(x, y) = 0 implicar x = y. Assim, em uma pseudo-metrica pode haver pontos
distintos x e y tais que d(x, y) = 0.
Passemos agora a discutir uma outra propriedade de pseudo-metricas de particular importancia na
teoria dos chamados espacos localmente convexos. Seja d : M M uma pseudo-metrica. Entao
f : M M definida por
d(a, b)
f (a, b) =
1 + d(a, b)


e tambem uma pseudo-metrica.


Em primeiro lugar, e claro que f (a, a) = 0 para todo a M . Como a simetria de f e tambem obvia,
precisamos apenas mostrar que f satisfaz a desigualdade triangular. Para demonstrar isso, notemos
em primeiro lugar que a funcao
x
l(x) =
1+x
e crescente para x 0. De fato, se y > x 0, entao
l(y) l(x) =

yx
> 0.
(1 + y)(1 + x)

Assim, como pela desigualdade triangular para d vale que d(a, b) d(a, c) + d(c, b), teremos
f (a, b) =

d(a, b)
1 + d(a, b)

d(a, c) + d(c, b)
.
1 + d(a, c) + d(c, b)

d(a, c)
d(c, b)
+
1 + d(a, c) + d(c, b) 1 + d(a, c) + d(c, b)

d(a, c)
d(c, b)
+
1 + d(a, c) 1 + d(c, b)

= f (a, c) + f (c, b),

(16.11)

provando a desigualdade triangular para f . Acima, na passagem da terceira para a quarta linha usamos
os fatos obvios que
1 + d(a, c) + d(c, b) 1 + d(a, c)

1 + d(a, c) + d(c, b) 1 + d(c, b),

pois d e positiva.
Uma conseq
uencia disso e que se d e uma metrica entao f tambem o e.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

850/1304

E. 16.31 Exerccio. Por que?

Famlias de Pseudo-M
etricas
Em muitas situacoes sao definidas em um conjunto M nao uma mas toda uma famlia de pseudometricas: D = {d , }, sendo um conjunto arbitrario nao-vazio de ndices, onde todas as d
sao pseudo-metricas.
Diz-se que uma famlia de pseudo-metricas: D = {d , } separa pontos se para quaisquer dois
pontos distintos x, y M existir um 0 tal que d0 (x, y) 6= 0.
Tem-se a seguinte proposicao, que mostra que a toda famlia contavel de pseudo-metricas que separa
pontos vem naturalmente associada uma metrica:

avel de pseudoProposi
c
ao 16.7 Seja M um conjunto e seja D = {dn , n } uma famlia cont
metricas em M que separa pontos. Ent
ao D : M M definida por


e uma metrica em M .

X
1 dn (x, y)
D(x, y) =
2n 1 + dn (x, y)
n=1

Prova. Em primeiro lugar notemos que a soma infinita do lado direito e bem definida pois
0

dn (x, y)
1
1 + dn (x, y)

e o fator 2n garante a convergencia. Que D e uma pseudo-metrica e evidente pelo fato que cada termo
dn (x, y)/(1 + dn (x, y)) o e, como vimos acima. Resta mostrar que D(x, y) = 0 implica x = y. Como
a soma contem apenas termos positivos, D(x, y) = 0 so e possvel se dn (x, y) = 0 para todo n .
Como D separa pontos, se tivessemos x 6= y haveria pelo menos um m para o qual dm (x, y) 6= 0. Como
tal nao e o caso, tem-se forcosamente x = y.


16.4

Espa
cos de Banach e de Hilbert

Nesta secao suporemos que o leitor esta familiarizado com os conceitos de produto escalar e norma em
espacos vetoriais, conceitos esses introduzidos na Secao 2.2.3, pagina 117, e, respectivamente, na Secao
2.3, pagina 121 (vide, em particular, pagina 117). Por simplicidade, trataremos tambem apenas de
espacos vetoriais sob o corpo dos complexos.
Espa
cos de Banach
Se E e um espaco vetorial dotado de uma norma k kE , podemos definir uma metrica em E atraves
da seguinte expressao: para u, v E,
dE (u, v) = ku vkE .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

851/1304

Essa metrica e dita ser a metrica induzida pela norma k kE .


E. 16.32 Exerccio. Prove que essa expressao de fato satisfaz as propriedades definidoras de metrica.
Sugestao: para demonstrar a desigualdade triangular, use a propriedade de norma ka + bk kak + kbk para
provar que ku vkE = ku w + w vkE ku wkE + kw vkE para todos u, v, w E.
6
Como vimos, se E e um espaco vetorial normado, entao e tambem um espaco metrico com a metrica
induzida pela norma, definida acima. Com isso em mente, introduzimos entao a seguinte importante
definicao:
Defini
c
ao. Espa
cos de Banach. Um espaco vetorial B e dito ser um espaco de Banach 20 em relacao
a uma norma nele definida se for um espaco metrico completo em relacao a` metrica induzida por essa
norma.
Espa
cos de Hilbert
Seja E e um espaco vetorial dotado de um produto escalar h, iE . Como discutimos a` pap
gina 123 e
seguintes, podemos com o uso desse produto escalar definir uma norma em E por kukE := hu, uiE .
Essa norma e dita ser a norma induzida pelo produto escalar h, iE . Camos, assim, no caso de acima,
pois, sendo E um espaco vetorial normado, podemos definir uma metrica em E atraves da seguinte
expressao: para u, v E,
q
dE (u, v) = ku vkE =
h(u v), (u v)iE .
Essa metrica e dita ser a metrica induzida pelo produto escalar h, i E .

Assim, se E e um espaco vetorial dotado de um produto escalar, entao e tambem um espaco metrico
com a metrica induzida pelo produto escalar definida acima. Com isso em mente, introduzimos entao
a seguinte importante definicao:

Defini
c
ao. Espa
cos de Hilbert. Um espaco vetorial H e dito ser um espaco de Hilbert 21 em relacao
a um produto escalar nele definido se for um espaco metrico completo em relacao a` metrica induzida
por esse produto escalar.
A nocao abstrata de Espaco de Hilbert foi introduzida por Schmidt 22 , por volta
Nota hist
orica.
de 1905, inspirado em ideias de Hilbert sobre equacoes integrais, notadamente sobre a equacao de
Fredholm23 , discutida no Captulo 12. A nocao abstrata de Espaco de Banach e posterior, tendo sido
introduzida por Banach em 1920. O termo espaco de Banach foi cunhado por Frechet 24 .
O estudante deve notar que todo espaco de Hilbert e naturalmente um espaco de Banach. A
recproca nao e necessariamente verdadeira, pois um espaco de Banach nao e necessariamente dotado
20

Stefan Banach (1892-1945).


David Hilbert (1862-1943).
22
Erhard Schmidt (1876-1959). Schmidt e conhecido por v
arias contribuico
es, como o Teorema de Hilbert-Schmidt
sobre operadores compactos e, mais popularmente, pelo metodo de ortogonalizaca
o de Gram-Schmidt (Jrgen Pedersen
Gram (1850-1916)).
23
Erik Ivar Fredholm (1866-1927).
24
Maurice Renes Frechet (1878-1973).
21

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

852/1304

de um produto escalar. Para tal e necessario (e suficiente) que a norma satisfaca a identidade do
paralelogramo. Vide pagina 125 e seguintes.
Tambem ressaltamos ao estudante que nao apenas a existencia de um produto escalar e importante
na definicao de um espaco de Hilbert, mas tambem a propriedade de completeza, a qual e fundamental
para a demonstracao de varias propriedades importantes dos espacos de Hilbert.
Exemplos 16.16.1 Os espacos vetoriais de dimensao finita n sao espacos de Banach em relacao
n
a` norma kxkp := [|x1 |p + + |xn |p ]1/p para todo p 1. O caso p = 2 e importante.
e um
espaco de Hilbert em relacao ao produto escalar hx, yi := x1 y1 + xn yn O mesmo vale para os
espacos vetoriais reais n . Esses fatos serao provados logo adiante quando considerarmos os espacos
de seq
uencias tipo `p , p 1, os quais, como veremos, sao exemplos de espacos de Banach (de dimensao
infinita). O espaco `2 e um espaco de Hilbert. Outro exemplo importante de espaco de Banach e o
espaco vetorial C0 ([0, 1]). Provamos na Proposicao 16.6, pagina 839, que C0 ([0, 1]) e completo na
norma kf k := supx[0, 1] |f (x)|. Portanto, C0 ([0, 1]) e um espaco de Banach em relacao a essa norma.


Espacos de Hilbert tem uma importancia fundamental na Mecanica Quantica e na Teoria Quantica
de Campos. Na Matematica, espacos de Banach e de Hilbert sao tambem fundamentais em areas como
a teorias das equacoes diferenciais parciais (e outras). O estudo de espacos de Hilbert e de Banach, e
de operadores lineares agindo nos mesmos, e uma area da Matematica denominada An
alise Funcional.
Nestas Notas, estudaremos com mais detalhe as propriedades gerais de espacos de Hilbert no
Captulo 25. No restante desta secao apresentaremos exemplos de espacos de Hilbert e de Banach
estudando espacos de seq
uencias.

16.4.1

Espa
cos de Seq
u
encias

uencias de n
umeros complexos (reais).
Vamos denotar por S( ) (por S( )) a colecao de todas as seq
Um fato simples, mas importante de se comentar, e que S( ) e um espaco vetorial complexo (e,
respectivamente, S( ) e um espaco vetorial real). De fato, se a e b sao duas seq
uencias de n
umeros
complexos podemos, para quaisquer , definir a + b como sendo a seq
uencia (a + b) n :=
an + bn , n . (Para S( ), o caso e analogo).


Por simplicidade, iremos daqui para frente discutir apenas o espaco S( ), das seq
uencias complexas,
mas tudo o que falaremos tem seu analogo para o espaco S( ).


O espaco vetorial S( ) possui varios sub-espacos, alguns de interesse especial, como os espacos ` p ,
com p 1, e o espaco ` , os quais serao definidos mais adiante. O seguinte exerccio exibe um dos
sub-espacos de S( ).
E. 16.33 Exerccio.
Denotemos por c( ), ou simplesmente c, a colecao de todas as sequencias de
Cauchy de numeros complexos com relacao `a metrica usual d(z, w) = |w z|, z, w . Mostre
que c( ) e um sub-espaco de S( ), ou seja, mostre que se {an }n e {bn }n sao duas sequencias de
Cauchy de numeros complexos, entao para quaisquer , a sequencia {a n + bn }n e tambem
uma sequencia de Cauchy de numeros complexos.
6


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Outros exemplos de conjuntos de seq


uencias sao os seguintes25 :





` :=
{an }n S( ) sup |an | < .

Captulo 16

853/1304

c :=

c0 :=

`p :=

{an }n




S( )

{an }n




S( )



{an }n




S( )

s :=

j :=

d :=

{an }n




S( )



{an }n




S( )

{an }n





S( )

an converge na metrica usual

lim |an | = 0

X
n=1

|an |p <

lim nk |an | = 0 para todo k > 0

lim exp(rn)|an | = 0 para todo r > 0

an = 0, exceto para um conjunto finito de ns

Acima, c coincide com a colecao de todas as seq


uencias de Cauchy de complexos com relacao a` metrica
usual d(z, w) = |w z|, z, w pois e completo nessa metrica. Note que c0 c. (Por que?).
Em um exerccio a` pagina 854, discutiremos as relacoes de pertinencia entre os conjuntos de seq
uencias
acima e provaremos que d j s `p c0 c ` .
E. 16.34 Exerccio. Prove que os conjuntos d, j, s, c0 , c e ` sao espacos vetoriais.

Mais adiante provaremos que os conjuntos `p tambem sao espacos vetoriais. As provas para 0 <
p < 1 e p 1 sao diferentes.
E. 16.35 Exerccio. Mostre que as sequencias an = exp(n) e an = exp(n2 ), n
1
Mostre que nenhuma sequencia an = r , n = 1, 2, . . ., com r > 0, pertence a s.
n
Seq
u
encias ` e `p
` e o subconjunto de S( ) definido por



` := {an }n S( )


25

A ordenaca
o dessa lista de exemplos e inspirada em [103].

sup |an | <

, pertencem a s.
6

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

854/1304

Em palavras, ` e o conjunto formado por todas seq


uencias limitadas, ou seja, uma seq
uencia {a n }n
e do tipo ` se existir algum M 0 tal que, para todo n, tem-se |an | < M .

Note que as seq


uencias limitadas nao sao de Cauchy, mas toda a seq
uencia de Cauchy e limitada
(por que?). Assim, c( ) ` .

Exemplo 16.2 As seq


uencias an = , an = /n2 , an = + /n an = + en , an = (1)n ,
an = sen (n), n , n 1 sao, para todo , , elementos de ` . As seq
uencias an = (1)n
e an = sen (n) nao sao de Cauchy.

E. 16.36 Exerccio importante. Mostre que se {an }n e {bn }n sao duas sequencias do tipo `
entao, para quaisquer a sequencia {an + bn }n e tambem do tipo ` .
6


Esse exerccio diz-nos que ` nao e apenas um subconjunto, mas tambem um sub-espaco vetorial de
S( ). Mais adiante, mostraremos que ` e um espaco de Banach em relacao a uma norma conveniente,
a saber, a norma definida no proximo exerccio.
E. 16.37 Exerccio importante. Seja a {an }n ` . Mostre que


kak := sup |an |


n

define uma norma em ` .

Outra famlia importante de sub-conjuntos de S( ) e formada pelas chamadas seq


uencias ` p , com
p , p > 0:

)
(

X

|an |p < .
`p := {an }n S( )



n=1

E. 16.38 Exerccio. Seja p > 0. Mostre que para > 0 a sequencia a n =

, n = 1, 2, 3, . . ., e do
n
1
tipo `p . O que acontece se = 0? Mostre que an = , n = 1, 2, 3, . . ., e do tipo `p para todo p > 1 mas
n
nao e do tipo `1 . Mostre que a sequencia an = exp(n), n = 1, 2, 3, . . ., pertence a todos os espacos `p
com p > 0.
6
1
+
p

P
p
Pela definicao, se {an }n e uma seq
uencia de tipo `p , entao a serie
e convergente. Isso
n=1 |an |
so e possvel se limn |an | = 0. Isso, por sua vez, significa que para todo n grande o suficiente,
0
digamos, maior que um certo N0 , tem-se |an | 1. Se p0 p segue entao que |an |p |an |p para
todo n > N0 .


E. 16.39 Exerccio. Use esses fatos para concluir que


` p ` p0
para todos p, p0 com 0 < p p0 .

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

855/1304

E. 16.40 Exerccio. Conclua tambem que


d j s ` p ` p0 c 0 c ` ,
para todos p, p0 com 0 < p p0 .

E. 16.41 Exerccio. De exemplos de elementos de ` que nao pertencem a nenhum dos demais conjuntos
acima.
6
E. 16.42 Exerccio.

De exemplos de elementos de c0 que nao pertencem a nenhum `p com p > 0.

X
1
1
Sugestao: considere a sequencia an =
com n = 2, 3, 4, . . .. Mostre que
= para
ln(n)
(ln(n))p
n=2
Z u
Z
e
1
dx =
du = para todo b > 1 e
todo p > 0. Para isso, use o fato (e prove-o!) que
p
p
(ln(x))
ln(b) u
b
p .
6


Vamos agora estabelecer um fato importante sobre os conjuntos de seq


uencias: combinacoes lineares
de seq
uencias `p sao tambem seq
uencias `p .
A estrutura linear dos conjuntos `p
Proposi
c
ao 16.8 Os conjuntos `p , com p > 0, s
ao espacos vetoriais complexos.

A prova faz uso da Proposicao 16.9, pagina 867, do Apendice 16.A.


Prova. Ha dois casos a considerar em separado: 0 < p < 1 e p 1.

Caso 0 < p < 1. Sejam a, b . Como |a + b| |a| + |b|, a segunda desigualdade em (16.A.2)
implica
|a + b|p (|a| + |b|)p |a|p + |b|p .
Assim, se an e bn sao duas seq
uencias do tipo `p com 0 < p < 1, teremos

X
n=1

|an + bn | ||

X
n=1

|an | + ||

X
n=1

|bn |p <

para quaisquer , . Isso provou que a seq


uencia an + bn tambem e uma seq
uencia do tipo `p
com 0 < p < 1. Assim, `p com 0 < p < 1 e um espaco vetorial complexo.
Caso p 1. Sejam a, b . Como |a + b| |a| + |b|, a segunda desigualdade em (16.A.2) implica
|a + b|p (|a| + |b|)p 2p1 (|a|p + |b|p ) .
Assim, se an e bn sao duas seq
uencias do tipo `p com p 1, teremos

X
n=1

|an + bn | 2

p1

||

X
n=1

|an | + 2

p1

||

X
n=1

|bn |p <

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

856/1304

para quaisquer , . Isso provou que a seq


uencia an + bn tambem e uma seq
uencia do tipo `p
com p 1. Isso e o que queramos provar.
Mais adiante demonstraremos o seguinte fato muito importante: para todo p 1 os conjuntos ` p
nao sao meramente espacos vetoriais, mas tambem espacos vetoriais normados, com a norma
"
# p1
X
kakp :=
,
(16.12)
|an |p
n=1

para a {an }n `p , p 1. Que essa expressao de fato define uma norma em `p , p 1, nao e nada
obvio e sera provado mais adiante. Mais que isso, cada espaco `p , p 1, e um espaco de Banach em
relacao a` norma acima.


Veremos tambem que `2 e um espaco de Hilbert com produto escalar


ha, bi :=

a n bn ,

n=1

onde a {an }n , b {bn }n `2 .




Para p < 1 a situacao e diferente. Nesse caso, os conjuntos `p ainda sao espacos vetoriais, mas
para p < 1 a expressao (16.12) nao representa uma norma. Esse fato reduz um tanto o interesse nesses
espacos.
As desigualdades de H
older e Minkowski para seq
u
encias
Vamos aqui enunciar e demonstrar em um caso particular duas desigualdades importantes que
tornaremos a encontrar quando tratarmos da teoria da integracao e de espacos de Banach, as quais sao
conhecidas como desigualdades de Holder26 e de Minkowski27 .
Teorema 16.2 Desigualdades de H
older e de Minkowski para seq
u
encias
I. Desigualdade de H
older.
Sejam x = {xi }i `p e y = {yi }i `q com 0 < p < e 0 < q < e seja r > 0 definido
1
1 1
por + = . Ent
ao, vale
p q
r
!1/r
!1/p
!1/q

X
X
X
|xi |r |yi |r

|xi |p
|yi |q
.
(16.13)


i=1

i=1

i=1

Para todo p > 0 (incluindo p = 1) e para todos x = {xi }i `p e y = {yi }i ` vale


!1/p 
"
#1/p


X
X
p
p
p

|xi |
sup |yi | .
|xi | |yi |
(16.14)


i=1

26
27

i=1

Otto L. H
older (1859-1937).
Hermann Minkowski (1864-1909). O nome de Minkowski surge tambem na Teoria da Relatividade.

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

857/1304

II. Desigualdade de Minkowski.


Sejam x = {xi }i e y = {yi }i , ambas do tipo `p com p 1. Ent
ao, vale
!1/p
!1/p
!1/p

X
X
X
.
|yi |p
+
|xi |p

|xi + yi |p


(16.15)

i=1

i=1

i=1

2
As desigualdades de Holder e Minkowski serao demonstradas nas paginas seguintes. Vamos antes a
alguns comentarios.
O caso particular mais relevante da desigualdade de Holder acima se da para 1 < p < e 1 < q <
1 1
com + = 1. Nesse caso, a desigualdade de Holder afirma que
p q
!1/q
!1/p

X
X
X
|yi |q
.
(16.16)
|xi |p
|xi | |yi |
i=1

i=1

i=1

Um fato importante que extramos da desigualdade de Minkowski e o seguinte: se as seq


uencias
{xi }i e {yi }i sao ambas do tipo `p , p 1, entao a seq
uencia {xi + yi }i tambem o e (pois o lado
direito de (16.15) e finito). Fora isso, e claro tambem que se {xi }i e do tipo `p entao a seq
uencia
{xi }i tambem e do tipo `p para qualquer . Esses dois fatos juntos dizem-nos que as seq
uencias
do tipo `p , p 1, formam um espaco vetorial sobre os complexos. Por isso passaremos a chamar a
colecao de todas as seq
uencias do tipo `p , p 1, de espaco `p , sempre entendido como um espaco
vetorial sobre os complexos.


Mais ainda, a desigualdade de Minkowski afirma que


kxkp :=

X
i=1

|xi |p

!1/p

e uma norma nos espacos `p , p 1, pois afirma que


kx + ykp kxkp + kykp ,

x, y `p ,

as demais condicoes que definem norma sendo elementares de se provar. Mostraremos logo adiante
(pagina 863) que os espacos `p , p 1, sao exemplos de espacos de Banach em relacao a`s normas acima
e que o espaco `2 e, em particular, um espaco de Hilbert.
Com essa definicao de norma, podemos reescrever a desigualdade de Holder (16.13) na forma
kxykr kxkp kykq ,
onde xy e a seq
uencia produto (xy)i := xi yi , i

. Note que a desigualdade de Holder (16.13) afirma


1 1
1
que se x `p e y `q entao xy `r com 0 < p < e 0 < q < , sendo + = . A desigualdade
p q
r
(16.14) fica
kxykp kxkp kyk .


JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

858/1304

para todos x `p e y ` e todo p > 0, incluindo p = 1. Conclumos analogamente que se x `p e


y ` entao xy `p , p > 0.
A Desigualdade de H
older. Demonstra
c
ao
Vamos agora entao provar a desigualdade de Holder (16.13). Para comecar, notemos que a desigualdade de Holder (16.13) para r > 0 e conseq
uencia do caso particular r = 1. De fato, sejam {x i }i `p
e {yi }i `q com
1 1
1
+ = ,
p q
r
sendo 0 < p < e 0 < q < . Definindo novas seq
uencias {ai }i e {bi }i tais que |ai | = |xi |r e
|bi | = |yi |r e definindo p0 = p/r e q 0 = q/r, teremos


X
i=1

|ai |

p0

X
i=1

|xi | < ,

i=1

o que prova que {ai }i `p0 e {bi }i `q0 . Como




|bi |

q0

i=1

|yi |q <

1
1
+ 0 = 1,
0
p
q

entao, supondo valida a desigualdade de Holder (16.13) no caso r = 1, teremos


!1/r
"
#1/r

X
X
|xi |r |yi |r
=
|ai ||bi |
i=1

i=1

(16.13) com

r=1

X
i=1

X
i=1

i=1

|ai |p

|xi |p

|xi |p

!1/p0

!r/p

!1/p

X
i=1

X
i=1

X
i=1

!1/q0 1/r
0

|bi |q

|yi |q

|yi |q

!r/q 1/r

!1/q

que e a desigualdade de Holder (16.13) no caso geral r > 0. Por causa disso, basta demonstrarmos
(16.13) para o caso r = 1, que e o que faremos.
Nossa estrategia sera provar primeiro a desigualdade de Holder (16.13), com r = 1, para seq
uencias
finitas e depois generalizar para seq
uencias infinitas.
Sejam x1 , . . . , xn e y1 , . . . , yn duas seq
uencias finitas arbitrarias de n
umeros complexos (n
desigualdade de Holder afirma que
!1/p
!1/q
n
n
n
X
X
X
,
|xi ||yi |
|xi |p
|yi |q
i=1

i=1

i=1

). A

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

859/1304

1 1
+ = 1. Vamos a isso. Em primeiro
p q
lugar, note que a desigualdade e trivialmente verdadeira caso todos os xi ou todos os yi sejam nulos,
pois nesse caso tanto o lado direito quanto o lado esquerdo da desigualdade sao iguais a zero.

para quaisquer p, q com 1 < p < e 1 < q < e tais que

Vamos entao considerar o caso em que os xi e os yi nao sao todos identicamente nulos. Seja, para
um j fixo
|yj |q
|xj |p
e
b = n
.
a = n
X
X
p
q
|xi |
|yi |
i=1

i=1

Usando a desigualdade de Young (16.A.1), tratada no Apendice 16.A, pagina 866, temos que

n
X
i=1

|xi |

|xj ||yj |
!1/p
n
X
i=1

|yi |

1 |xj |p
1 |yj |q
+
.
n
n
p X
q X
p
q
|xi |
|yi |

!1/q

i=1

i=1

Somando ambos os lados da desigualdade para todo j entre 1 e n, teremos


n
X
j=1

n
X
i=1

|xi |p

|xj ||yj |

!1/p

n
X
i=1

|yi |q

!1/q

n
X

1 j=1
n
p X

|xj |

i=1

+
|xi |

n
X

1 j=1
n
q X
i=1

|yj |q
=
|yi |

1 1
+
= 1,
p q

(16.17)

que e o que queramos provar.


Vamos agora generalizar a desigualdade de Holder para seq
uencias infinitas.
uencia do tipo `p e seja {yi }i uma seq
uencia do tipo `q com 1 < p < ,
Seja {xi }i uma seq
1 < q < e 1/p + 1/q = 1. Como vimos, temos para qualquer n a desigualdade
!1/p
!1/q
n
n
n
X
X
X
|xi ||yi |
,
|xi |p
|yi |q


i=1

i=1

i=1

Assim, segue que


n
X
i=1

|xi ||yi |

X
i=1

|xi |

!1/p

X
i=1

|yi |

!1/q

< .

Essa desigualdade vale para todo n e diz, em particular, que a seq


uencia sn =

n
X
i=1

monotona crescente e limitada. Assim, existe lim sn e vale

|xi ||yi |, n

X
i=1

|xi ||yi |

X
i=1

|xi |p

!1/p

X
i=1

|yi |q

!1/q

< .

Essa u
ltima relacao e a de Holder (16.13), com r = 1. Isso provou (16.13) para todo r > 0.

, e

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

860/1304

A desigualdade de Holder (16.16) envolve seq


uencias dos tipos `p e `q com 1/p + 1/q = 1, sendo que

1 < p < e 1 < q < . E de se notar que os casos p = 1 ou q = 1 foram excludos. Ha tambem uma
desigualdade como a de Holder envolvendo a seq
uencias do tipo `p e ` , incluindo o caso p = 1. Sejam
{xi }i uma seq
uencia do tipo `p com p > 0 e {yi }i uma seq
uencia do tipo ` . Entao, e bem facil
de se verificar que
!1/p 
#1/p
"


X
X
p
p
p
sup |yi | .

|xi |
|xi | |yi |


i=1

i=1

Essa e a desigualdade de Holder (16.14).

A desigualdade de Holder pode ser generalizada ainda mais, como veremos quando tratarmos da
teoria da integracao. Vamos agora provar uma das conseq
uencias da desigualdade de Holder, conhecida
como desigualdade de Minkowski.
A Desigualdade de Minkowski. Demonstra
c
ao
Novamente, nossa estrategia sera considerar primeiro seq
uencias finitas e depois estender o obtido
para seq
uencias infinitas.
Sejam x1 , . . . , xn e y1 , . . . , yn duas seq
uencias finitas arbitrarias de n
umeros complexos (n
desigualdade de Minkowski afirma que
!1/p
!1/p
!1/p
n
n
n
X
X
X
|xi + yi |p

|xi |p
+
|yi |p
i=1

i=1

). A

i=1

para qualquer p 1. Vamos demonstra-la. O caso p = 1 e trivial (por que?). Consideremos entao
p > 1. Teremos que
n
X
i=1

|xi + yi |

n
X
i=1

n
X
i=1

|xi + yi ||xi + yi |p1


|xi ||xi + yi |

p1

n
X
i=1

|yi ||xi + yi |p1 .

Usando a desigualdade de Holder (caso r = 1) podemos dizer que


!1/p
!1/q
n
n
n
X
X
X
,
|xi ||xi + yi |p1
|xi |p
|xi + yi |q(p1)
i=1

i=1

i=1

onde 1/p + 1/q = 1, ou seja, p = q(p 1). A u


ltima desigualdade diz entao que
!1/p
!1/q
n
n
n
X
X
X
p1
p
p
|xi ||xi + yi |

|xi |
|xi + yi |
i=1

i=1

n
X

n
X

i=1

e, analogamente,

i=1

|yi ||xi + yi |p1

i=1

|yi |p

!1/p

n
X
i=1

|xi + yi |p

!1/q

(16.18)

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

861/1304

Substituindo estas duas u


ltimas relacoes em (16.18), teremos

!1/p
!1/q
!1/p n
n
n
n
X
X
X
X
p
p
p
p

|xi + yi |
|xi |
|xi + yi |
+
|yi |
,
i=1

i=1

donde tiramos que

n
X
i=1

|xi + yi |p

i=1

i=1

!1/p

que e o que queramos provar.

n
X
i=1

|xi |p

!1/p

n
X

i=1

|yi |p

!1/p

(16.19)

Assim como a desigualdade de Holder, a desigualdade de Minkowski pode ser generalizada para
uencias infinitas de de n
umeros complexos, ambas do
seq
uencias infinitas. Sejam {xi }i e {yi }i seq
tipo `p . Temos que, para qualquer n ,
!1/p
!1/p
!1/p
!1/p
!1/p
n
n
n

X
X
X
X
X
|xi + yi |p

|xi |p
+
|yi |p

|xi |p
+
|yi |p
<


i=1

i=1

i=1

i=1

i=1

Como a desigualdade vale para qualquer n, segue que a seq


uencia sn =

n
X
i=1

|xi + yi |p

!1/p

,n

, e


monotona crescente e limitada e, portanto, converge. Fora isso, vale


!1/p
!1/p
!1/p

X
X
X
|xi + yi |p
|xi |p
|yi |p

+
< .
i=1

i=1

i=1

Essa e a desigualdade de Minkowski para seq


uencias infinitas de n
umeros complexos {x i }i
{yi }i , ambas do tipo `p com p 1. Isso completa a prova do Teorema 16.2.


A Desigualdade de Cauchy para Seq


u
encias. Um produto escalar para `2
A desigualdade de Holder tem um caso particular bastante especial. Sejam {xi }i e {yi }i duas
seq
uencias de n
umeros complexos complexos do tipo `2 . Entao a desigualdade de Holder nos diz que
!1/2
!1/2

X
X
X
|xi ||yi |
|xi |2
|yi |2
.
(16.20)


i=1

i=1

i=1

Essa desigualdade e conhecida como desigualdade de Cauchy (para seq


uencias) e e, sem exagero, uma
das desigualdades mais importantes. Muitos resultados importantes sao extrados dela, alguns dos
quais iremos tratar adiante.
A expressao (16.20) mostra-nos que para quaisquer {xi }i , {yi }i `2 a serie


X
i=1

xi yi =: hx, yi`2

(16.21)

e absolutamente convergente e, portanto, finita. Com isso, o lado esquerdo define um produto escalar
em `2 , que denotamos por hx, yi`2 .

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

862/1304

Prove essas u
ltimas afirmacoes, ou seja, prove que hx, yi`2 e um produto escalar
6

E. 16.43 Exerccio.
em `2 .

Como veremos adiante, `2 e completo na norma relacionada a esse produto escalar, que e a norma
k k2 . Isso prova que `2 e um espaco de Hilbert.
Veremos agora uma aplicacao da desigualdade de Minkowski.

As M
etricas dp em
Seja X =

(ou

n


) para algum n


e seja a seguinte funcao em X X:


1

dp (x, y) = (|x1 y1 |p + + |xn yn |p ) p ,


onde p

, p 1, x = (x1 , . . . , xn )

e y = (y1 , . . . , yn )

Mostrar que, para p 1, dp define uma metrica em X e bem simples. A u


nica dificuldade esta em
demonstrar a desigualdade triangular, o que pode ser feito facilmente com o uso da desigualdade de
Minkowski mostrada acima.
E. 16.44 Exerccio.
Usando a desigualdade de Minkowski, mostre que d p satisfaz a desigualdade
triangular, ou seja, que dp (x, y) dp (x, z) + dp (z, y) para p 1 e quaisquer x = (x1 , . . . , xn ),
y = (y1 , . . . , yn ) e z = (z1 , . . . , zn ) n .
6
Para o caso particular p = 2 a metrica d2 e identica a` metrica Euclidiana dE introduzida anteriormente. Nesse sentido as metricas dp sao um tipo de generalizacao da metrica Euclidiana usual.
Semi-normas em `p , p 1
Para cada n
a` pagina 122)


podemos definir em `p , p 1, a semi-norma (o conceito de semi-norma encontra-se


kxkp, n =

"

n
X
j=1

|xj |p

#1/p

(16.22)

Note que kxkp, n e de fato uma semi-norma em `p , p 1, pois satisfaz kxkp, n = ||kxkp, n para todo
e
kx + ykp, n kxkp, n + kykp, n
(16.23)

para todos x, y `p , p 1, devido a` desigualdade de Minkowski para seq


uencias finitas (16.19).
Note tambem que

para todo x `p , p 1 e todo n




kxkp, n kxkp <

(16.24)

. Por fim, para qualquer x `p , vale


kxkp = lim kxkp, n .
n

O Teorema de Riesz-Fischer para seq


u
encias. Completeza dos espa
cos ` e `p , p 1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

863/1304

Vamos agora mostrar que os espacos `p , p 1, e ` sao completos em relacao a`s suas respectivas
normas. Essa afirmacao, especialmente na sua forma mais geral, em espacos de funcoes mensuraveis
(tratada na Secao 23.4.2, pagina 1047), e conhecida como Teorema de Riesz 28 -Fischer29 e data de 1907.
Seja p 1, fixo, e seja {am }m , uma seq
uencia de elementos de `p . Como cada am e uma seq
uencia
m
de n
umeros complexos, indicaremos seus elementos por ai , i . Assim, convencionamos que o ndice
superior indexa a seq
uencia e o inferior e o ndice de cada elemento da seq
uencia.


Suponhamos que {am }m seja uma seq


uencia de Cauchy em `p na metrica induzida pela norma
k kp . Isso significa que para todo  > 0 existe um inteiro N () > 0 tal que kan am kp <  sempre que
n
m, n > N (). Assim, se m, n > N (), e facil ver que, para os elementos am
i e ai isso significa que


n
|am
i ai |

"

X
j=1

n p
|am
j aj |

#1/p

= kan am kp < 

Isso diz-nos que, para cada i fixo, a seq


uencia de n
umeros {ani }n e uma seq
uencia de Cauchy em
e, portanto, converge (pois e completo). Seja i o limite dessa seq
uencia.


uencia {an }n na metrica


A seq
uencia = {i }i e um forte candidato a ser o limite da seq
definida pela norma k kp . Colocamo-nos, entao, as seguintes questoes: 1. Sera a seq
uencia tambem
um elemento de `p ? 2. Se a resposta a` pergunta anterior for positiva, sera que a seq
uencia a m converge
a` seq
uencia = {i }i na norma de `p ? Se a resposta a essas perguntas for positiva, estara provado
que `p e completo.


Seja  > 0 arbitrario. Vamos definir uma seq


uencia crescente de n
umeros inteiros e positivos N k (),
k = 1, 2, 3, . . . com Nk+1 () > Nk (), da seguinte forma: Nk () e tal que kam an kp < /2k para
todos m, n > Nk (). Note que uma tal seq
uencia Nk () sempre pode ser encontrada pois, por hipotese,
m
{a }m e uma seq
uencia de Cauchy em k kp . Vamos agora escolher uma seq
uencia crescente de
ndices n1 < n2 < < nk1 < nk < tais que nk > Nk (). A essa seq
uencia esta associada a
sub-seq
uencia {ank }k . Para simplificar a notacao, denotaremos bk ank , k = 1, 2, 3, . . .. Tem-se


kbl+1 bl kp <


.
2l

pois nl e nl+1 sao maiores que Nl (). Note que para cada i, bki converge a i quando k .
Com essas definicoes, teremos para todo k > 1 que (verifique!)
k

b b =
28
29

Frigyes Riesz (1880-1956).


Ernst Sigismund Fischer (1875-1954).

k1
X

l=1


bl+1 bl .

(16.25)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

864/1304

Utilizando as semi-normas k kp, n , definidas em (16.22), e usando (16.23) e (16.24) e (16.25), teremos


k1


X



1
k
l+1
l
kb kp, n = b +
b b


l=1

(16.23)

(16.24)

(16.25)

<

p, n

k1
X
l+1

b b l
kb kp, n +
p, n
1

l=1

k1
X
l+1

b b l
kb kp +
p
1

l=1

kb1 kp +

k1

X
X


1

kb
k
+
= kb1 kp +  .
p
l
l
2
2
l=1

l=1

Assim,
kbk kp, n < kb1 kp + .

P n

(16.26)


p 1/p

k
Note que o lado esquerdo e
e envolve uma soma finita de |bki |0 s. Assim, como cada bki
i=1 |bi |
converge a i quando k temos, tomando o limite k ,
#1/p
" n
#1/p
" n
X
X
|bki |p
=
|i |p
lim
= kkp, n .
k

i=1

i=1

Como o lado direito de (16.26) nao depende de k, conclumos que kkp, n kb1 kp +  para todo n
Agora, isso diz que
n
X
p
|i |p kb1 kp + 

i=1

para todo n . O lado direito nao depende de n. Como o lado esquerdo e uma seq
uencia crescente e
limitada
(pelo
lado
direito),
segue
que
o
lado
esquerdo
converge
quando
n

.
Isso
prova entao que
P
p
i=1 |i | < , ou seja, `p .


Resta-nos agora responder a` segunda pergunta colocada a` pagina 863 e mostrar que a seq
uencia a m
converge a em relacao a` norma k kp .

Repetindo o mesmo raciocnio que conduziu a (16.26), apenas mantendo b1 do lado esquerdo,
conclumos que kbk b1 kp, n < . Novamente, usando o mesmo argumento de acima, podemos tomar
o limite k e obter k b1 kp, n  Como o lado direito independe de n, segue novamente pelo
mesmo raciocnio de acima que k b1 kp  Isso significa30 que para todo  > 0 existe b1 `p tal
que k b1 kp . Como b1 e escolhido na seq
uencia am , isso prova que = limm am na topologia
definida por k kp .
Com isso, provamos que todo `p com p 1 e completo na norma definida por k kp e e, portanto,
um espaco de Banach nessa norma. Como comentamos, isso tambem implica que `2 e um espaco de
Hilbert com relacao ao produto escalar definido em (16.21).
30

agrafo que antecede (16.25).


O estudante aqui talvez tenha que recordar a maneira como b1 = an1 foi definido no par

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

865/1304

A demonstracao que ` e um espaco de Banach em relacao a` norma k k e identica, adotando-se


nesse caso as semi-normas kxk, n := sup |xi |.
1in

E. 16.45 Exerccio. Complete os detalhes da prova que ` e um espaco de Banach em relacao `a norma
k k .
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

866/1304

Ap
endices
16.A

Algumas Desigualdades B
asicas

Demonstraremos aqui algumas desigualdades numericas basicas que foram usadas no presente captulo
e serao tambem empregadas em outros.
A desigualdade de Young
A demonstracao da desigualdade de Holder faz uso de uma desigualdade numerica conhecida como
desigualdade de Young31 . Como essa desigualdade tem interesse por si so e outras aplicacoes, vamos
apresentar sua demonstracao.
Sejam a e b dois n
umeros reais, ambos maiores ou iguais a zero e sejam p e q ambos tais que
1 1
1 < p < e 1 < q < , mas tais que + = 1. Vamos entao mostrar que para todo a, b 0
p q
a1/p b1/q

a b
+ ,
p q

(16.A.1)

sendo que a igualdade so e valida caso a = b. A desigualdade (16.A.1) e denominada desigualdade de


Young.
Para prova-la, notemos em primeiro lugar note que se a = 0 ou b = 0 a (16.A.1) acima e trivialmente
satisfeita pois o lado esquerdo e sempre zero, enquanto que o lado direito e sempre maior ou igual a zero.
a b
Vamos estao supor que a e b sao ambos nao nulos. Tudo o que queremos e provar que a 1/p b1/q + +
 p q

1

e sempre maior ou igual a zero. Podemos escrever a u


ltima expressao como b t + t + q , onde
= 1/p e t = a/b. Como 1 < p < , temos que 0 < < 1 enquanto que t 0. Note-se que a funcao
1
f (x) = x + x + ,
q
e contnua para x [0, ) e que, para x > 0, tem-se

f 0 (x) = 1 x1
e
f 00 (x) = (1 )x2 > 0.

Assim, f (x) tem um u


nico mnimo local em x = 1, onde f (1) = 0 (verifique). Fora isso, f (0) = 1q > 0
e lim f (x) = +. Desses fatos conclumos facilmente que f (x) 0 para todo x 0, a igualdade so
x
se dando caso x = 1. Isso fecha o que queramos provar.
E. 16.46 Exerccio. Mostre que no caso 0 < p < 1 a desigualdade (16.A.1) se reverte ( deve ser
substitudo por ). Nesse caso 1/q < 0.
6
31

William Henry Young (1863-1942).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

867/1304

Desigualdades envolvendo somas de pot


encias
As desigualdades apresentadas na seguinte proposicao sao muito u
teis, especialmente no proposito
de demonstrar que os conjuntos de seq
uencias `p sao espacos vetoriais, o mesmo se dando com os
conjuntos de funcoes Lp (M, d) dos quais trataremos no Captulo 23.
Proposi
c
ao 16.9 Sejam a 0 e b 0 dois n
umeros reais n
ao-negativos.
I. Para todo p tal que 0 < p < 1 tem-se

ap + b p
(a + b)p ap + bp .
1p
2

(16.A.2)

II. Para todo p tal que p 1 tem-se


ap + bp (a + b)p 2p1 (ap + bp ) .

(16.A.3)
2

Prova.
Caso I. Tomemos 0 < p < 1 fixo. Vamos primeiramente provar a seguinte desigualdade: para
quaisquer a, b 0 vale
(a + b)p ap + bp .
(16.A.4)

Para a = 0 isso e obvio. Seja, entao, a > 0. Nesse caso, podemos fatorar a p e a desigualdade acima
ficaria,
 p
p

b
b
1+
.
1+
a
a

Para provar isso, tudo o que desejamos e provar que f (x) := (1 + x) p 1 xp satisfaz f (x) 0 para
todo x 0. De fato, tem-se,
"
#
1
f 0 (x) = pxp1 1
(16.A.5)
1p .
1 + x1

Como 1 + x1 1 e 1 p > 0, segue que f 0 (x) 0 para todo x 0. Com isso, provamos que f e
nao-crescente. Como f (0) = 0, segue que f (x) 0 para todo x 0. Isso provou (16.A.4).
Vamos agora provar que

ap + b p
(a + b)p .
21p
Para x 0 e 0 < p < 1 a funcao (x) = xp e concava. Portanto, para qualquer com 0 1,
tem-se
(a) + (1 )(b) (a + (1 )b) .
Para = 1/2, isso fica
ap + b p

a+b
2

p

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

868/1304

e a prova de (16.A.2) esta completa.


Caso II. Para o caso p = 1 a desigualdade (16.A.3) e evidente. Tomemos, entao, p > 1 fixo. Vamos
primeiramente provar a seguinte desigualdade: para quaisquer a, b 0 vale
ap + bp (a + b)p .

(16.A.6)

Para a = 0 isso e obvio. Seja, entao, a > 0. Nesse caso, podemos fatorar a p e a desigualdade acima
ficaria,

 p
p
b
b
1+
1+
.
a
a
Para provar isso, tudo o que desejamos e provar que f (x) := (1 + x) p 1 xp satisfaz f (x) 0 para
todo x 0. Agora, por (16.A.5),
"
p1 #

1
f 0 (x) = pxp1 1 1 +
.
x

Como 1 + x1 1 e p 1 > 0, segue que f 0 (x) 0 para todo x 0. Com isso provamos que f e
crescente. Como f (0) = 0, segue que f (x) 0 para todo x 0, provando o que queramos.
Vamos agora provar que

(a + b)p 2p1 (ap + bp ) .

Para x 0 e p > 1 a funcao (x) = xp e convexa. Portanto, para qualquer com 0 1, tem-se
(a + (1 )b) (a) + (1 )(b) .
Para = 1/2, isso fica

e a prova de (16.A.3) esta completa.

16.B

a+b
2

p

ap + b b
2

N
umeros reais e p-
adicos

Neste apendice ilustraremos a construcao do completamento canonico de espacos metricos, desenvolvida


a partir da pagina 841, apresentando brevemente uma construcao do conjunto dos n
umeros reais a partir
dos racionais que e tambem devida a Cantor. O merito dessa construcao nao e apenas ilustrativo, pois o
mesmo conjunto de ideias permite a construcao de outros conjuntos exoticos de n
umeros, os chamados
n
umeros p-adicos (p, aqui, sendo um n
umero primo).
A estudo desta secao nao e essencial ao que segue e pode ser dispensado em uma primeira leitura.
A demonstracao de completeza de , em particular, e um tanto delicada e complexa.


Uma M
etrica no Conjunto dos Racionais
Considere o conjunto
dos n
umeros racionais. e considere a funcao d :
d(r, s) = |r s|. Esta funcao tem as seguintes propriedades

dada por

JCABarata. Curso de Fsica-Matem


atica

1. d(r, s)

para todo r, s

Vers
ao de 29 de setembro de 2005.

Captulo 16

869/1304

2. d(r, s) = 0 se e somente se r = s.
3. Para todo a e b
4. Para todo a, b e c

vale d(a, b) = d(b, a).


vale d(a, b) d(a, c) + d(c, b).

A funcao d define o que se chama de uma metrica em


chamada desigualdade triangular.

. A desigualdade d(a, b) d(a, c) + d(c, b) e

Nota. Como a princpio desejamos construir o conjunto dos n


umeros reais , devemos tomar o
cuidado de definir a metrica d assumindo valores em + , o conjunto dos racionais 0, nao em + ,
como fizemos ate agora. Por essa razao, algumas adaptacoes ao que fizemos ate agora serao necessarias.


Uma seq
uencia de n
umeros racionais e uma funcao
freq
uentemente seu valor a(i) por ai para i .


. Para uma seq


uencia a denota-se

Seq
u
encias de Cauchy de N
umeros Racionais
Uma seq
uencia a de n
umeros racionais e dita ser uma seq
uencia de Cauchy 32 em relacao a` metrica
d se para todo  + existir um n
umero natural N () (eventualmente dependente de ) tal que
d(ai , aj ) = |ai aj | <  para todo i e j tais que i > N () e j > N ().
Uma seq
uencia de n
umeros racionais a converge para um n
umero racional r no sentido da metrica
d se para todo  + existir um n
umero natural N () (eventualmente dependente de ) tal que
d(r, ai ) <  para todo i > N ().
E. 16.47 Exerccio. Prove que se uma sequencia a converge a um numero racional r entao a e uma
sequencia de Cauchy. Sugestao: use a desigualdade triangular.
6
N
umeros Reais. A Constru
c
ao de Cantor. Completamento
Como ja discutimos em paginas anteriores, ha seq
uencias de Cauchy de n
umeros racionais que nao
convergem a n
umeros racionais. Esse fato e a motivacao de uma construcao muito importante: a dos
n
umeros reais.
Para mostrar como essa construcao e feita (o que faremos aqui com o objetivo de ilustrar outras construcoes analogas futuras) vamos primeiramente considerar o conjunto C C( ) de todas as
seq
uencias de Cauchy de n
umeros racionais e construir em C uma relacao de equivalencia da seguinte
forma. Dizemos que duas seq
uencias de Cauchy a e b sao equivalentes se a seq
uencia c i = ai bi ,
i
converge a zero. Ou seja, a b se para todo racional  > 0 existir inteiro N > 0 tal que
d(ai , bi ) = |ai bi | <  para todo i > N .


E. 16.48 Exerccio. Mostre que se a e b sao sequencias de Cauchy entao a sequencia c i = ai bi , i


tambem o e. Sugestao: use a desigualdade triangular.
6


32

Augustin Louis Cauchy (1789-1857).

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

870/1304

E. 16.49 Exerccio. Prove que a relacao acima e de fato uma relacao de equivalencia.

Vers
ao de 29 de setembro de 2005.

Isto posto, sabemos que o conjunto C pode ser escrito como uma uniao disjunta de suas classes de
equivalencia pela relacao acima. O conjunto dos n
umeros reais e entao definido como sendo o conjunto
formado por essas classes de equivalencia ou, se quiserem, como o conjunto formado escolhendo-se um
elemento de cada classe de equivalencia, ou seja, por uma seq
uencia de Cauchy de n
umeros racionais
em relacao a` metrica d.


Assim, uma seq


uencia de Cauchy como a seq
uencia ai = 1 + 1/1! + 1/2! + + 1/i! acima define
um n
umero real (no caso o n
umero e).
Se x e uma seq
uencia de Cauchy de racionais em relacao a` metrica d denotaremos sua classe de
equivalencia por [x]. Pela definicao, [x] e um n
umero real.
possvel definir em
uma relacao de ordem total da seguinte forma: dizemos que [x] < [y] se
E
existirem seq
uencias de racionais x0 [x] e y 0 [y] e um inteiro I tais que x0i < yj0 para todo i, j > I e
se [x0 y 0 ] 6= [0], onde [0] e a classe que contem a seq
uencia identicamente nula. (Essa u
ltima condicao
e para evitar seq
uencias com x0i < yi0 mas que se aproximem no limite i ).


E. 16.50 Exerccio. Mostre que isso define uma relacao de ordem total em


Poderamos tentar fazer de um espaco metrico, definindo, por analogia com o que fizemos anteriormente na construcao do completamento canonico, uma metrica em por


e
d([x],
[y]) = lim d(xn , yn ) .
n

Isso nao pode ser feito dessa forma, porem, pois o a seq
uencia de racionais d(x n , yn ) = |xn yn | pode
facil provar, porem, que a seq
nao ter limite nos racionais, mas sim nos reais. E
uencia de racionais
uencia de Cauchy na metrica d. Para tal, note que, pela desigualdade
d(xn , yn ), n , e uma seq
triangular,
d(xi , yi ) d(xi , xj ) + d(xj , yj ) + d(yj , yi )


e, portanto,
|d(xi , yi ) d(xj , yj )| d(xi , xj ) + d(yj , yi ).
Como o x e y sao seq
uencias de Cauchy o lado direito pode ser feito 
desde que i e j sejam feitos grandes o suficiente.

para qualquer  > 0,

Com isso, sabemos que a seq


uencia d(xn , yn ), n , pertence a alguma classe de equivalencia que
denotaremos por [d(x, y)]. Com isso, podemos agora definir uma metrica em por


e
d([x],
[y]) = [d(x, y)] .

E. 16.51 Exerccio. Mostre que essa definicao nao depende dos particulares representantes x e y que
tomarmos nas classes [x] e [y].
6
E. 16.52 Exerccio. Mostre que de define uma metrica em


JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

871/1304

Com os ingredientes de acima (a definicao de , de ordem em e da metrica de em ), podemos


definir as nocoes de convergencia em e de seq
uencia de Cauchy em de modo analogo ao que fizemos
n
anteriormente: Uma seq
uencia de reais [x] [xn ], n , converge ao real [x] se para todo [] > 0
e n , [x]) < [] sempre que n > N . Uma seq
existir um inteiro N tal que d([x]
uencia de reais [x]n e dita
ser uma seq
uencia de Cauchy em relacao a` metrica de se para todo [] > 0 existir um inteiro N tal que
e m , [x]m ) < [] sempre que m > N e n > N .
d([x]


Coloca-se entao a grande questao, sera


reais convergente a um n
umero real?

completo? Ou seja, sera toda a seq


uencia de Cauchy de

e
Provemos que sim. Seja [x]n [xn ], n , uma seq
uencia de Cauchy em relacao a` metrica d.
Entao para qualquer [] existira inteiro N ()


e m , [x]m ) = [|xm xn |] < []


d([x]

(16.B.7)

sempre que m > N () e n > N (). Vamos tomar [] um racional ou seja, suporemos que exista em []
uma seq
uencia constante i =  + .

n
A condicao (16.B.7) significa que existem seq
uencias de racionais |xm
i xi | e um inteiro I() tais
n
que |xm
i xi | <  para todos m > N () e n > N () e i > I().

Como cada xm e uma seq


uencia de Cauchy de racionais, existe para todo 
m
m
tal que |xi xj | <  sempre que i, j > Jm ().
Vamos entao tomar  = 1/k, k

a(k) := N (1/k) + 1,

um inteiro Jm ()

e definir
e

b(k) := max{I(1/k), Ja(k) (1/k)} + 1

a(k)

e xk = xb(k) . Teremos,





a(k)
a(k)
a(k)
a(k 0 )
a(k)
a(k 0 )
|xk xk0 | = xb(k) xb(k0 ) xb(k) xb(k0 ) + xb(k0 ) xb(k0 ) 2 max{1/k, 1/k 0 }.

Isso prova que {xk }k e uma seq


uencia de Cauchy de racionais. Portanto a ela esta associado o n
umero
m
e
real [x]. Resta-nos provar que [x ] converge a [x] em d quando m .
e
De fato d([x],
[xm ]) = [d(x, xm )] e


a(k)

a(k)

a(k)

a(k)

m
m
d(xk , xm
k ) = |xk xk | = |xb(k) xk | |xb(k) xk | + |xk

xm
k | < 2/l

para qualquer l , desde que m > a(l) e k > b(l). Isso prova que para m > a(l) tem-se
e Isso demonstrou que e completo.
[{d(x, xm )}m ] = [0], demonstrando que [xm ] converge a [x] em d.


possvel provar que podemos operar com esse novo conjunto de n


E
umeros da mesma forma como
operamos com os racionais, ou seja, podemos definir sua soma, seu produto, sua razao etc. Por exemplo,
a soma de duas seq
uencias de Cauchy a e b e a seq
uencia de Cauchy c dada por c i = ai + bi , i e e
facil provar que essa seq
uencia e de Cauchy, assim como e possvel provar que , se trocarmos a ou b por
um outro elemento da mesma classe de equivalencia, obteremos uma outra seq
uencia de Cauchy d da


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

872/1304

mesma classe de equivalencia da seq


uencia c. Fora isso o conjunto dos reais assim definido e provido
de uma relacao de ordem total x y.

Como essas propriedades sao conhecidas nao entraremos nos detalhes de sua demonstracao (mas nao
e difcil para o estudante entender como se faz). Gostaramos apenas de enfatizar, recordando, como
a construcao dos reais foi feita: partimos do conjunto dos racionais, definimos uma metrica sobre os
mesmos e definimos os conceitos de seq
uencias e de seq
uencias de Cauchy (em relacao a` metrica dada).
Definimos tambem o conceito de convergencia e constatamos que seq
uencias de Cauchy de racionais
nao convergem sempre a racionais. Definimos entao no espaco de todas as seq
uencias de Cauchy (em
relacao a` metrica dada) uma relacao de equivalencia e assim o conjunto de classes de equivalencia define
uma nova classe de objetos com os quais, como afirmamos, podemos operar como n
umeros. Esses sao
os n
umeros reais.
O procedimento de completar os racionais atraves da criacao das classes de equivalencia de suas
seq
uencias de Cauchy e chamado de completamento can
onico doa racionais e foi inventado por Cantor33 (seguindo ideias de Weierstrass34 ). A construcao de n
umeros reais acima e devida a Cantor (ha
35
uma outra construcao equivalente devida a Dedekind , a dos chamados cortes de Dedekind). O
completamento de Cantor e importante, pois seu metodo pode ser estendido a qualquer espaco metrico
nao completo para a obtencao de uma classe de objetos ainda maior.
Outros Completamentos dos Racionais. N
umeros p-
adicos
A construcao acima indicou um procedimento de completamento dos racionais a partir de suas
importante frisar, porem, que o conceito de seq
seq
uencias de Cauchy. E
uencia de Cauchy depende de
uma funcao metrica especfica dada previamente. Assim, toda a construcao do completamento depende
da metrica usada. O que acontece se trocarmos a metrica usada nos racionais? Podemos, ao proceder
o completamento de Cantor, obter uma classe de objetos diferente da dos reais? A resposta e positiva.
Como curiosidade vamos mostrar que ha outros completamentos possveis dos n
umeros racionais se
mudarmos a metrica usada. Seguiremos aqui parcialmente [40], onde uma outra construcao podera ser
encontrada.
Sabemos do teorema fundamental da aritmetica que todo n
umero natural nao nulo pode ser escrito de forma u
nica como um produto de n
umeros primos. Para todo n
umero racional r 6= 0 temos
conseq
uentemente a decomposicao u
nica em fatores primos
Y wp (r)
r = (1)
pi i
i

onde os pi sao n
umeros primos e wp (r) e o expoente do primo p na recomposicao do racional r. O
produto acima envolve todos os primos, porem, apenas para um n
umero finito deles tem-se w pi (r) 6= 0
(por que?).
Para um n
umero racional r 6= 0 e para um primo p (que fixamos daqui por diante), seja a funcao
wp (r) que da o exponente de p na decomposicao (
unica) de r em fatores primos dada acima. Vamos
33

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).


Karl Theodor Wilhelm Weierstrass (1815-1897).
35
Julius Wilhelm Richard Dedekind (1831-1916).

34

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

com o uso de wp definir a seguinte funcao p :


+:
 w (s)
p p , se s 6= 0, s
p (s) :=
0,
se s = 0.

873/1304

A funcao p tem as seguintes propriedades:


1. p (s) 0 para todo s

2. p (s) = 0 se e somente se s = 0.
3. p (rs) = p (r)p (s) para dois racionais quaisquer r e s.
4. Para dois racionais quaisquer r e s tem-se p (r + s) max{p (r), p (s)} e portanto p (r + s)
p (r) + p (s).
Demonstraremos apenas o item 4, deixando os demais como exerccio (facil). O item 4 e uma
conseq
uencia imediata da seguinte propriedade, que provaremos abaixo: para qualquer primo p e
quaisquer racionais r e s vale
wp (r + s) min{wp (r), wp (s)}.

Para provar essa desigualdade escrevemos r e s em sua decomposicao em fatores primos:


Y wp (r)
Y wp (s)
r = (1)
pi i ,
s = (1)
pi i .
i

Assim,
r + s = (1)

wpi (r)

pi

+ (1)

wpi (s)

pi

(16.B.8)
Multiplicando e dividindo por

min{wpi (r), wpi (s)}

pi

ficamos com
r+s =

Y
i

min{wpi (r), wpi (s)}

pi

"

(1)

wpi (r)min{wpi (r), wpi (s)}

pi

+ (1)

Y
i

wpi (s)min{wpi (r), wpi (s)}

pi

Como obviamente (por que?) wpi (r) min{wpi (r), wpi (s)} 0 e wpi (s) min{wpi (r), wpi (s)} 0,
segue que o n
umero entre colchetes e um inteiro, tendo uma decomposicao em fatores primos da forma
Y
()
pj j ,
j

onde os i sao positivos ou nulos (pois o n


umero e inteiro). Assim,
Y min{wp (r), wp (s)}+i
i
i
r+s =
pi
,
i

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

874/1304

provando que
wpi (r + s) = min{wpi (r), wpi (s)} + i min{wpi (r), wpi (s)},
para todo primo pi , o que completa a prova que queramos.
Em funcao das propriedades demonstradas no u
ltimo exerccio, podemos, com o uso dessa funcao
p , construir uma metrica em , que denotaremos por dp , dada por
dp (a, b) = p (a b)
para racionais a e b.
E. 16.53 Exerccio. Demonstre, usando as propriedades 1-4 de p mencionadas acima, que esta funcao
e de fato uma metrica, ou seja, que satisfaz
1. dp (r, s)

para todo r, s

2. dp (r, s) = 0 se e somente se r = s.
3. Para todo a e b
4. Para todo a, b e c

vale dp (a, b) = dp (b, a).


vale dp (a, b) dp (a, c) + dp (c, b).
6

Tambem aqui podemos definir a nocao de seq


uencia de Cauchy em relacao a` metrica d p . Uma
e dita ser uma seq
uencia de Cauchy (em relacao a` metrica d p ) se
seq
uencia a de elementos de
para todo  + ,  > 0, existir um n
umero natural N () (eventualmente dependente de ) tal que
dp (ai , aj ) <  para todo i e j tais que i > N () e j > N ().
converge para um elemento b
no sentido da metrica dp se para todo
Uma seq
uencia a em
 + existir um n
umero natural N () (eventualmente dependente de ) tal que dp (b, ai ) <  para
todo i > N ().
Tambem neste caso podem ser exibidas seq
uencias de Cauchy de racionais que nao convergem no
sentido da metrica dp a um outro racional. O conjunto , assim, nao e completo em relacao a` metrica
dp . Podemos entao completa-lo usando o procedimento de completamento de Cantor: tomamos o
conjunto Cp de todas as seq
uencias de Cauchy de n
umeros racionais em relacao a` d p e construmos em
Cp uma relacao de equivalencia da seguinte forma. Dizemos que duas seq
uencias de Cauchy a e b sao
equivalentes se a seq
uencia dp (ai , bi ), converge a zero quando i .
Sabemos que o conjunto Cp pode entao ser escrito como uma uniao disjunta de suas classes de
equivalencia pela relacao acima. Define-se entao uma nova classe de n
umeros, denominados n
umeros
p-
adicos, como sendo o conjunto dessas classes de equivalencia ou, se quiserem, como sendo o conjunto
formado escolhendo-se um elemento de cada classe de equivalencia, ou seja, por uma seq
uencia de
Cauchy de n
umeros racionais em relacao a` metrica dp .
possvel provar que podemos operar com esse novo conjunto de n
E
umeros da mesma forma como
operamos com os racionais, ou seja, podemos definir sua soma, seu produto, sua razao etc. (os mesmos
formam um corpo). Para a definicao de corpo vide Secao 1.2.2, pagina 51.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

875/1304

Para cada primo p, o conjunto dos n


umeros p-adicos, denominado p , e distinto do conjunto dos
reais. Possui, porem, em comum com os reais o fato de ambos terem os racionais como sub-conjunto
denso.
Note, por exemplo, que a seq
uencia de n
umeros racionais an = pn , n , diverge na reta real mas,
no conjunto p a mesma seq
uencia converge a zero (no sentido de dp ), sendo que precisamente o oposto
ocorre em relacao a` seq
uencia bn = pn , n .


ltimo paragrafo.
E. 16.54 Exerccio. Constate a veracidade das afirmativas do u

E. 16.55 Exerccio.

Verifique que, em relacao a d3 , a sequencia de numeros positivos sn =

6
n
X
a=0

2 3a

converge ao numero 1 (!). Sugestao: mostre que sn = 3n+1 1. Apos isso mostre que d3 (sn , 1) =
3 (sn + 1) = 3(n+1) , e conclua que sn 1.
6
De um certo ponto de vista, os n
umeros p-adicos formam uma classe razoavel de n
umeros que
poderiam, em princpio, substituir os reais em aplicacoes, dado que ambos podem ser aproximados
por racionais (no sentido da metrica d no caso dos reais e da metrica dp no caso dos p-adicos). Os
conjuntos p possuem propriedades extremamente curiosas, tanto do ponto de vista algebrico quando
do ponto de vista topologico, algumas das quais vimos nos exerccios acima. Aplicacoes significativas
dos n
umeros p-adicos em Fsica sao, no momento, desconhecidas. Sugestoes de seu uso, porem, ja
foram apresentadas na teoria das super-cordas.

16.C

Aproxima
co
es para

Metodos para calcular aproximacoes para o valor de sao procurados desde a Antig
uidade. Comentam
os historiadores da Matematica que a mais antiga referencia ao assunto talvez seja encontrada em um
papiro egpcio, denominado papiro de Rhind, de cerca de 1650 A.C., o qual fornecia a aproximacao
4(8/9)2 ' 3.1605 para . Arquimedes36 foi provavelmente o primeiro a propor um procedimento
sistematico de aproximacao, que consistia em aproximar um crculo de diametro 1, e permetro , por
polgonos regulares inscritos e circunscritos. O permetro de um polgono regular pode ser computado
com o uso de consideracoes geometricas simples37 . Os permetros dos polgonos regulares inscritos
fornecem limites inferiores para , enquanto que os permetros dos polgonos regulares circunscritos
fornecem limites
superiores. Usando hexagonos (vide Figura 16.C.1), por exemplo, chega-se facilmente
a 3 < < 2 3, o que fornece as aproximacoes 3 < < 3, 46, as quais sao ainda um tanto grosseiras.
10
Usando polgonos regulares de 96 lados, Arquimedes concluiu que 3 71
< < 3 17 , o que fornece as
aproximacoes 3, 0140845 < < 3, 1428571 em base decimal. Como se observa, o limite superior fornece
com o valor correto das duas primeiras casas decimais apos a vrgula. Fragmentos incompletos de
sua obra indicam que Arquimedes teria chegado a determinar a aproximacao 3, 1416 para o valor de ,
usando polgonos regulares ainda maiores.

O metodo de Arquimedes foi empregado na Europa ate meados do seculo XVII para aproximar
36
37

Arquimedes de Siracusa (ci. 287 A.C. - ci. 212 A.C.).


Vide [29], onde uma descrica
o, mais detalhada do metodo de Arquimedes pode ser encontrada.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

876/1304

Figura 16.C.1: Crculo, hexagono inscrito e circunscrito.

o valor de . Ludolph van Ceulen38 empreendeu boa parte da sua vida aperfeicoando o metodo de
Arquimedes, chegando, pouco antes de sua morte, a estimar o valor de com o uso de polgonos
regulares de 262 lados, o que fornece com 32 casas decimais de precisao.
Varias outras aproximacoes foram empregadas para aproximar . Listemos algumas.
1. Aproximacao de Wallis39 , ou Formula de Produto de Wallis, para , de 1665:
= lim 2
n

n
Y

4k 2
2 2 4 4 6 6 8 8 10 10
24n+1 (n!)4
= 2
=
lim
.
2
2
n (2n + 1) [(2n)!]
4k 1
1 3 3 5 5 7 7 9 9 11
k=1

Para uma demonstracao simples dessa formula usando integrais, vide [123].
2. Aproximacao de Gregory40 -Leibniz41 para , de 1671:


n
X
1 1 1 1
(1)k
= 4 1 + + ,
= lim 4
n
2k + 1
3 5 7 9
k=0
Essa serie provem do fato que = 4 arctan(1). O arco-tangente pode ser calculado pela serie de
Taylor42

X
(1)n x2k+1
arctan(x) =
.
2k + 1
k=0
fornecendo, assim, a aproximacao dada acima para .


Um comentario historico e que a identidade = 4 1 13 + 15 17 + 91 e por vezes atribuda
a Leibniz, que a divulgou em 1674, tres anos apos a descoberta por Gregory da serie de Taylor
da funcao arco-tangente. Historiadores comentam que Gregory provavelmente ja a conhecia.
Todavia, essa identidade ja seria conhecida por matematicos hindus seculos antes.
38

Ludolph van Ceulen (1539-1610).


John Wallis (1616-1703). Wallis foi um dos pioneiros do C
alculo Diferencial e Integral e, uma curiosidade, foi o
inventor do smbolo .
40
James Gregory (1638-1675).
41
Gottfried Wilhelm von Leibniz (1646-1716).
42
Brook Taylor (1685-1731). A serie de Taylor da funca
o arco-tangente foi, em verdade, descoberta por Gregory em
1671.
39

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

877/1304

3. Aproximacao de Newton43 . Usando uma identidade como por exemplo = 6 arcsen (1/2), Newton
empregou a serie de Taylor da funcao arco-seno
arcsen (x) = x +

X
[(2n 1)!!]2

(2n + 1)!

n=1

x2n+1

para determinar aproximacoes para . Disso resulta a identidade (prove-a!)


= 3+

X
n=1

24n1

3 (2n 1)!
.
n(2n + 1) [(n 1)!]2

(16.C.9)

Newton calculou as primeiras 15 casas decimais de (em data incerta), para o que e necessario
somar cerca de 20 termos da serie (16.C.9). Newton o fez, segundo confessou, por nao ter muito
o que fazer a` epoca.
Como, para n grande, (2n 1)! 22n n2n e [(n 1)!]2 n2n , os termos da serie (16.C.9) decaem
como 22n . Machin encontrou uma outra identidade que permite uma convergencia mais rapida.
4. Aproximacao de Machin44 para , de 1706:


n
X
(1)n
16
4
= lim
.

2k+1
2k+1
n
2k
+
1
5
239
k=0
Essa serie provem do fato, demonstrado por Machin, que
= 16 arctan(1/5) 4 arctan(1/239) .
Usando-se a serie de Taylor da funcao arco-tangente dada acima, obtem-se a serie de Machin para
.
5. Aproximacao de Euler45 para por fracoes contnuas. Euler demonstrou que
4

12

1+

32

2+

52

2+

72

2+
2+

43

Isaac Newton (1643-1727).


John Machin (1680-1751).
45
Leonhard Euler (1707-1783).
44

92
112
2+
..
.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

878/1304

Mencionamos en passant que Euler tambem obteve a seguinte expressao para e em termos de
fracoes contnuas:
1
e = 2+
,
1
1+
2
2+
3
3+
4
4+
5
5+
6
6+
..
.
que e tambem uma aproximacao para e por racionais.
Note que as aproximacoes de Wallis, Gregory, Newton, Machin e Euler acima sao aproximacoes
a por n
umeros racionais.
6. Euler tambem obteve (no ano de 1735) uma serie de identidades envolvendo series infinitas do

X
1
, com m = 1, 2, 3 etc., as quais podem ser usadas para calcular . As primeiras
tipo
k 2m
k=1
identidades sao

X
2
1
=
,
2
6
k
k=1

X
1
4
=
,
4
90
k
k=1

X
1
6
=
,
6
945
k
k=1

X
1
8
=
,
8
9450
k
k=1

X
1
10
=
93555
k 10
k=1

etc. Tais relacoes sao bem conhecidas da teoria das series de Fourier (vide [33]). Como o lado
esquerdo das igualdades acima envolve potencias de , essas series nao fornecem aproximacoes
a por racionais. As u
ltimas series a` direita convergem de modo relativamente rapido. Apenas
com os cinco primeiros termos da u
ltima serie a` direita obtem-se a aproximacao 3, 141592647 para
, cujos primeiros sete dgitos apos a vrgula estao corretos. Para obter-se uma precisao analoga
com a primeira serie a` esquerda, e preciso somar cerca de cem milhoes de termos, como e facil de
verificar usando um programa de computador (faca!).
A formula geral para as somas acima46 e a seguinte:

X
1
(1)m+1 22m1 B2m 2m
,
=
k 2m
(2m)!
k=1

m = 1, 2, 3, . . . ,

(16.C.10)

onde Bn sao os chamados n


umeros de Bernoulli47 , definidos pela serie de Taylor

X
Bn n
x
=
x .
x
e 1
n!
n=0

Essa definicao e tambem de Euler (a definicao original de Bernoulli, publicada postumamente


em 1713, era outra (vide [123])). Os n
umeros de Bernoulli satisfazem Bn = 0 para n mpar,
46

Ate a presente data, n


ao s
ao conhecidas express
oes fechadas para somas como
mpar, n 3.
47
Jacob Bernoulli (1654-1705).

1
k=1 kn

para o caso em que n e

JCABarata. Curso de Fsica-Matem


atica

Captulo 16

Vers
ao de 29 de setembro de 2005.

879/1304

exceto para n = 1, sendo B0 = 1 e B1 = 1/2. Os n


umeros de Bernoulli podem ser calculados
recursivamente pela identidade
n1  
X
n
j=0

Bj = 0,

n>1.

Os primeiros sao B0 = 1, B1 = 1/2, B2 = 1/6, B4 = 1/30, B6 = 1/42, B8 = 1/30. O leitor


interessado podera encontrar mais detalhes sobre os fatos acima envolvendo n
umeros de Bernoulli
em varios textos, por exemplo em [123] e [33]. Nesse u
ltimo texto, a relacao (16.C.10) e provada
usando series de Fourier.
Como os termos da serie do lado esquerdo de (16.C.10) decaem muito rapidamente quando n
, exceto o termo com k = 1, inferimos que
= lim

(1)n+1 (2n)!
22n1 B2n

 2n1

7. Aproximacao de Ramanujan48 para , de 191449 :


= lim

9.801

n
X
k=0

(4k)! [1.103 + 26.390 k]


(k!)4 3964n

Devido a` presenca do fator 8, esta na


o e uma aproximacao a por racionais. Isso, porem, pode
ser facilmente
remediado substituindo 8 acima por an , sendo an alguma seq
uencia de racionais
aproximando 8.
1
, onde
n pn

8. Aproximacao de Borwein e Borwein50 para , de 1987: = lim

pn

n (1)k (6k)! 212.175.710.912 61 + 1.657.145.277.365 + k 13.773.980.892.672 61 + 107.578.229.802.750


X
:= 12
.
h

i3k+3/2
k=0
(k!)3 (3k)! 5.280 236.674 + 30.303 61

umero
Aqui aplica-se o mesmo comentario de acima: devido a` presenca do n
umero 61 e do n
3/2

, a aproximacao acima nao e uma aproximacao a por racionais.
5.280 236.674 + 30.303 61
Isso, porem, pode ser remediado substituindo esses n
umeros por aproximacoes racionais.
A aproximacao de Borwein e Borwein converge a de modo impressionantemente rapido. Ja
a primeira aproximacao, 1/p0 , fornece corretamente os primeiros 24 dgitos de na base decimal!
Cada termo seguinte da seq
uencia acrescenta aproximadamente 25 dgitos corretos ao valor de na
48

Srinivasa Aiyangar Ramanujan (1887-1920).


A aproximaca
o de Ramanujan surgiu em Modular Equations and Approximations to . S. Ramanujan. The
Quarterly Journal of Pure and Applied Mathematics. 45, 350-372 (1914).
50
Jonathan M. Borwein e Peter B. Borwein s
ao irm
aos. Para mais detalhes sobre seu trabalho sobre a aproximaca
o de
, vide Pi and the AGM. A Study in Analytic Number Theory and Computational Complexity. Jonathan M. Borwein
e Peter B. Borwein. Editora John Willey and Sons. inc. 1986.
49

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 16

880/1304

base decimal. No caso da aproximacao de Ramanujan a convergencia e um pouco mais lenta: cada
termo da seq
uencia acrescenta aproximadamente 8 dgitos corretos ao valor de na base decimal. As
aproximacoes de Wallis e Gregory sao extremamente lentas. Usando-as, um super-computador do incio
dos anos 1990 levaria cerca de 100 anos para computar apenas os primeiros 100 dgitos corretos de
na base decimal. A aproximacao de Borwein e Borwein baseia-se em trabalhos de Ramanujan sobre as
chamadas equacoes modulares.
A formula de Machin (e ligeiras variantes da mesma) converge mais rapidamente que as de Wallis e
Gregory (por que?) e foi usada desde o seculo XVIII ate a decada de 1970 para calculos de (manuais
ou com computadores).
Em 1844, Dase51 calculou corretamente, usando a formula de Machin, as primeiras 205 casas decimais de . O calculo foi feito a` mao (!) e durou alguns meses. O feito de Dase foi superado em 1853 por
Shanks52 , que calculou 607 casas decimais de . O calculo tambem foi feito a` mao e custou-lhe alguns
anos de trabalho. Infelizmente, porem, Shanks cometeu erros que resultaram em que seus u
ltimos
80 dgitos estavam incorretos. Isso so foi percebido 92 anos depois (!), em 1946, por Ferguson, que
computou corretamente os primeiros 620 dgitos decimais de .
Com o advento dos computadores eletronicos tais calculos deixaram de ser feitos por meios romanticos.
Em 1987, usando a aproximacao de Borwein e Borwein, foi calculado por um super-computador com
uma precisao de cem milhoes de casas decimais. Essa precisao foi aumentada desde entao. Em 1999,
era conhecido com 3 236 = 206.158.430.208 (cerca de duzentos bilhoes) de dgitos decimais. O feito e
de Y. Kanada e D. Takahashi. Este ainda e o recorde atual (2003) e foi alcancado com dois algoritmos
distintos (para comparacao), o dos irmaos Borwein e outro denominado Gauss-Legendre. O primeiro
consumiu 46 horas de computacao em um super-computador e o segundo 37 horas.
Em 1996 Bailey, Borwein e Plouffe publicaram um algoritmo que permite determinar o n-esimo
dgito hexadecimal de sem o conhecimento dos precedentes. Em 1997 Plouffe descobriu um algoritmo
para determinar o n-esimo dgito de em qualquer base.
Outras informacoes historicas, especialmente sobre esses desenvolvimentos mais recentes, podem
ser encontradas em The quest for Pi, de D. H. Bailey, J. M. Borwein, P. B. Borwein e S. Plouffle.
The Mathematical Intelligencer 19, 50-57 (1997).
Ainda que no passado a determinacao de valores aproximados de tivesse importancia em areas
como a Fsica, a Astronomia e a Engenharia, dificilmente calculos ultra-precisos de podem ter relevancia em aplicacoes: com apenas 37 dgitos decimais e possvel computar o permetro de um crculo
com o raio do universo conhecido (cerca de 1, 3 1026 m) com uma precisao equivalente ao diametro
do um atomo de hidrogenio (cerca de 1, 0 1010 m). Ha, porem, um certo interesse matematico em
tais calculos, envolvendo conjecturas sobre a distribuicao dos dgitos decimais de . Valores precisos
de sao tambem u
teis em simulacoes numericas. Ainda assim, hoje em dia a pratica de calculos
ultra-precisos de tem motivacao predominantemente esportiva.

51
52

Zacharias Dase (1824-1861).


Willian Shanks (1812-1882).

Captulo 17
O Teorema do Ponto Fixo de Banach e Algumas de
Suas Conseq
u
encias
Conte
udo
17.1 O Teorema de Ponto Fixo de Banach . . . . . . . . . . . . . . . . . . . . . 882
17.1.1 Aplicacao a Equacoes Numericas. O Metodo de Newton . . . . . . . . . . . . 884
17.1.2 Uma Generalizacao do Teorema de Ponto Fixo de Banach . . . . . . . . . . . 888
17.2 As Equa
co
es Integrais de Fredholm e de Volterra . . . . . . . . . . . . . . 889
17.3 Aplica
co
es a
` Teoria das Equa
co
es Diferenciais Ordin
arias . . . . . . . . . 897
17.3.1 O Teorema de Picard-Lindelof

. . . . . . . . . . . . . . . . . . . . . . . . . . 897

17.3.2 Generalizando o Teorema de Picard-Lindelof. Solucoes Globais . . . . . . . . 902


17.3.3 Um Teorema de Comparacao de Solucoes de EDOs . . . . . . . . . . . . . . 903
17.4 O Teorema da Fun
ca
o Implcita e o Teorema da Fun
ca
o Inversa . . . . . 907
17.4.1 O Teorema da Funcao Implcita . . . . . . . . . . . . . . . . . . . . . . . . . . 907
17.4.2 O Teorema da Funcao Inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . 912
17.A O Lema de Gr
onwall . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 913

eja X um conjunto qualquer e f : X X uma funcao de X em X. Muitas vezes, em


problemas praticos e teoricos, estamos interessados em encontrar os pontos x que sao levados
em si mesmos pela funcao f , ou seja, os pontos x tais que
x = f (x).
Os pontos que satisfazem essa equacao sao chamados de pontos fixos da transformacao f e a equacao
acima e denominada equaca
o de ponto fixo. Veremos varios exemplos abaixo de equacoes desse tipo,
tanto no contexto de equacoes numericas quanto no de equacoes integrais e diferenciais.
Na pratica, dada uma funcao f , pode afigurar-se difcil saber se sequer existe um ponto fixo para ela.
Muitas vezes estamos interessados em saber quantos pontos fixos ha e, freq
uentemente, gostaramos de
garantir que ha um e apenas um ponto fixo de uma dada funcao (a chamada unicidade da solucao).
Teoremas que nos garantem existencia e, por vezes, unicidade de solucoes de equacoes de ponto fixo
sao chamados de teoremas de ponto fixo. Ha varios teoremas de tal tipo na literatura matematica, como
por exemplo, o Teorema de Ponto Fixo de Banach1 , o Teorema de Ponto Fixo Brouwer2 , o teorema do
ponto fixo de Schauder3 e varios outros, todos com pressupostos distintos sobre o conjunto X e sobre
a funcao f .
1

Stefan Banach (1892-1945).


Luitzen Egbertus Jan Brouwer (1881-1966).
3
Juliusz Pawel Schauder (1899-1943).

881

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Seja por exemplo o disco fechado Dn de n :



Dn := (x1 , . . . , xn )

Captulo 17

882/1304

q


2
2

x1 + + x n 1 .

O chamado Teorema do Ponto Fixo de Brouwer afirma que toda funcao contnua (na topologia usual)
de Dn em Dn tem pelo menos um ponto fixo. Aqui a unicidade nem sempre pode ser garantida: pense
no exemplo das rotacoes em 3 em torno de um eixo que passa pela origem. Todo ponto ao longo do
eixo de rotacao e levado em si mesmo pela rotacao e e, portanto, um ponto fixo da mesma.


O Teorema do Ponto Fixo de Schauder afirma que se X e um subconjunto convexo e compacto de


um espaco de Banach entao toda funcao contnua (na topologia da norma) de X em X tem um ponto
fixo.
Aqui trataremos de um teorema de ponto fixo extremamente u
til conhecido como Teorema de Ponto
Fixo de Banach, que funciona em espacos metricos completos. De fato, este e de longe o teorema de
ponto fixo com mais aplicacoes praticas, sendo que sua influencia se estende aos domnios das equacoes
integrais, das equacoes diferenciais, das equacoes numericas em , da Analise Numerica e de muitas
outras areas da Matematica pura e aplicada.
Uma das razoes de sua importancia reside no fato de o Teorema de Ponto Fixo de Banach fornecer,
junto com seu enunciado, um metodo aproximativo para a determinacao do ponto fixo, metodo este
que e muito eficiente. Vamos ao seu enunciado.

17.1

O Teorema de Ponto Fixo de Banach

Teorema 17.1 (Teorema de Ponto Fixo de Banach) Seja M um conjunto dotado de uma metrica
d e suponha M completo em relaca
o a d. Seja A um subconjunto fechado de M e seja T uma funca
o
de A em A, T : A A. Vamos ent
ao supor que exista um n
umero q com 0 q < 1 tal que para todos
os pontos x e y de A valha
d(T (x), T (y)) q d(x, y).
(17.1)
Ent
ao, a equaca
o de ponto fixo
x = T (x),

(17.2)

tem soluca
o em A e essa soluca
o e u
nica. Alem disso, para qualquer x 0 A, a seq
uencia xn = T (xn1 ),
n 1, obtida aplicando-se repetidamente T a partir de x0 , converge (rapidamente) ao ponto fixo x na
metrica d. A saber, tem-se que
qn
d(xn , x)
d(x1 , x0 ).
(17.3)
1q
2
Uma funcao T : A A tal que existe um n
umero q com 0 q < 1 e tal que para todos os pontos x
e y de A valha a desigualdade (17.1) e dita ser uma contracao. O teorema acima afirma entao que toda
contracao em um espaco metrico completo tem um e somente um ponto fixo. Esse teorema fornece um
metodo iterativo de determinar aproximadamente o ponto fixo, sendo que, por (17.3), a aproximacao
e tanto melhor quanto mais iteracoes forem feitas.

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

883/1304

Vamos primeiro provar o teorema e depois veremos varios exemplos de seu uso.
Prova do Teorema 17.1. Como A e um subconjunto fechado de um espaco metrico completo, entao A e
tambem completo em relacao a` mesma metrica (vide Proposicao 18.7, pagina 937).
Para simplificar a notacao denotaremos por T n a n-esima composicao de T consigo mesma: T
T}.
| {z

Definimos entao para um x0 A arbitrario xn = T n (x0 ), n

, n > 0.

Vamos agora provar que {xn } e uma seq


uencia de Cauchy em A. Para isso sejam m e n dois
n
umeros naturais quaisquer tais que m < n. Entao, usando a desigualdade triangular n m vezes
temos o seguinte:
d(xm , xn ) d(xm , xm+1 ) + d(xm+1 , xn )
d(xm , xm+1 ) + d(xm+1 , xm+2 ) + d(xm+2 , xn )
..
.
d(xm , xm+1 ) + d(xm+1 , xm+2 ) + + d(xn1 , xn ).
Pela propriedade de contracao, temos que
d(xa , xa+1 ) = d(T (xa1 ), T (xa )) q d(xa1 , xa ) q a d(x0 , x1 ).
Da
d(xm , xn )

e, portanto,
d(xm , xn ) q

1+q +...+q

n1m


q m + q m+1 + . . . + q n1 d(x0 , x1 )


d(x0 , x1 ) q

X
a=0

d(x0 , x1 ) =

qm
d(x0 , x1 ).
1q

Isso prova que {xn } e uma seq


uencia de Cauchy, pois q m pode ser feito arbitrariamente pequeno
tomando m grande, para qualquer n > m.
Como {xn } e uma seq
uencia de Cauchy em A e A e completo, deve haver x em A u
nico ao qual a
seq
uencia converge. Temos sempre, usando a desigualdade triangular, que
d(x, xm ) d(x, xn ) + d(xn , xm ).
Tomando n > m, temos

qm
d(x, xm ) d(x, xn ) +
d(x0 , x1 ).
1q
Como xn se aproxima de x para n grande, podemos fazer o termo d(x, xn ) arbitrariamente pequeno,
tomando n grande, sem alterar os demais. Da, conclumos que
d(x, xm )

qm
d(x0 , x1 ).
1q

(17.4)

Essa u
ltima desigualdade mostra que xm de fato se aproxima exponencialmente rapido de x.
Vamos agora provar que x, o limite da seq
uencia {xn }, e um ponto fixo. Para isso calculemos
d(x, T (x)). Teremos, pela desigualdade triangular
d(x, T (x)) d(x, xm+1 ) + d(xm+1 , T (x)),

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

884/1304

para todo m. Usando (17.4) e a contratividade de T teremos,


d(x, T (x)) <

q m+1
q m+1
q m+1
q m+1
d(x0 , x1 ) + q d(xm , x) <
d(x0 , x1 ) +
d(x0 , x1 ) = 2
d(x0 , x1 ).
1q
1q
1q
1q

Como m e arbitrario podemos fazer m e obtemos d(x, T (x)) = 0, o que implica que x = T (x).

Por fim, resta-nos provar que x e o u


nico ponto fixo de T . Para tal, vamos supor que haja um
0
0
outro: x = T (x ). Teramos, usando a contratividade, que
d(x, x0 ) = d(T (x), T (x0 )) q d(x, x0 ),

ou seja, (1 q)d(x, x0 ) 0. Como q < 1 isso implica d(x, x0 ) = 0, que implica x = x0 . Isso completa
a prova do Teorema de Ponto Fixo de Banach.
Observa
c
ao. A condicao que q < 1 e crucial, sem ela as conclusoes do teorema podem nao mais ser
validas. Vejamos o seguinte exemplo4 . Seja M = [1, ) com a metrica usual d(x, y) = |x y| e seja
T : M M dada por T (x) = x + x1 . Entao vale para todo x e y M , x 6= y,
d(T (x), T (y)) < d(x, y) .
De fato, para 1 x < y,
T (y) T (x) =

y
0

T (t)dt =
x

y
x

1
1 2
t

dt <

y
x

dt = y x,

pois 1 t2 < 1 para t > 1, sendo essa a melhor estimativa possvel. Assim,
|T (y) T (x)| < |y x| ,
como queramos provar. Note agora, porem, que T nao tem nenhum ponto fixo. De fato, T (x) = x
significa x + x1 = x, ou seja, x1 = 0, o que nao e possvel se x [1, ).

17.1.1

Aplica
c
ao a Equa
co
es Num
ericas. O M
etodo de Newton

Equa
co
es Num
ericas
Vamos a alguns exemplos simples de aplicacoes do Teorema de Ponto Fixo de Banach. Seja a reta
real e a seguinte equacao de ponto fixo em :


x = cos(x),
onde 0 < < 1 e uma constante dada. Tera essa equacao uma solucao? Sera ela u
nica? Como
T (x) := cos(x) e uma funcao de em , podemos adotar em a metrica usual em relacao a` qual


Agradeco a D. A. Cortez por mostrar-me esse exemplo.

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

885/1304

e completo. Em face do Teorema de Ponto Fixo de Banach a questao natural e saber se T e uma
contracao. Vamos provar que isso e verdade.

Z y


sen (t) dt |x y| = d(x, y),
d(T (x), T (y)) = | cos(x) cos(y)| =


pois | sen (t)| 1. Assim, vemos que T e uma contracao com q = .

O Teorema de Ponto Fixo de Banach nos afirma entao que, partindo-se de qualquer n
umero real
x0 , as iteradas sucessivas de T convergem ao n
umero x, ponto fixo de T :
xn = cos ( cos ( cos ( cos(x0 ) ))) .
|
{z
}
n vezes

No caso = 1/2, o estudante que tenha uma simples calculadora e estimulado a determinar que o
ponto fixo e x ' 0, 45018311 . . ..
E. 17.1 Exerccio. Nesse caso, tomando por exemplo x0 = 0, estime o erro da aproximacao se pararmos
apos 30 iteracoes.
6
E. 17.2 Exerccio. O que acontece na equacao de ponto fixo acima se > 1? A solucao permanece
u
nica? Faca graficos das funcoes a(x) = x e b(x) = cos(x) para esclarecer essa questao.
6
E. 17.3 Exerccio. Use o Teorema de Ponto Fixo de Banach para mostrar que, em , a equacao x = e x
tem uma e somente uma solucao. Qual e ela, aproximadamente? Estime o erro apos 40 iteracoes.
6


O m
etodo de Newton para zeros de fun
co
es
O bem conhecido metodo de Newton de determinacao de zeros de funcoes reais 5 pode ser estudado
sob a luz do Teorema de Ponto Fixo de Banach. Seja f :

uma funcao da qual desejamos


determinar um zero, ou seja, uma solucao da equacao f () = 0. Notemos que essa equacao equivale
(trivialmente) a` equacao = ff0()
, pelo menos se f 0 () 6= 0. Colocado dessa forma o problema
()
torna-se um problema de ponto fixo para a aplicacao T : definida por


T (x) := x

f (x)
.
f 0 (x)

Isso motiva a seguinte proposicao.


Proposi
c
ao 17.1 Se f for pelo menos duas vezes diferenci
avel ent
ao f possuir
a um zero , u
nico,
num dado intervalo [a, b] se existir com 0 < 1 tal que


f (x)f 00 (x)


para todo x [a, b] ,
(17.5)
(f 0 (x))2 ,
e se


f (x)


(17.6)
f 0 (x) (1 ) ,
5

Para a motivaca
o geometrica do metodo de Newton, vide discuss
ao a
` p
agina 887 sobre a Figura 17.1.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

886/1304

e := ba
. Nesse caso, tem-se = limn xn , onde a seq
uencia xn [a, b] e
onde x := a+b
2
2
determinada iterativamente por
xn+1 = xn

f (xn )
,
f 0 (xn )

n0,

sendo x0 [a, b], arbitr


ario. Ter-se-
a,
| xn |

n
n
|T (x0 ) x0 |
(b a) ,
1
1

n 0.

Se adotarmos x0 = x teremos ainda | xn | n , n 0, por (17.6).

(17.7)
2

Nota. A condicao (17.5) pressupoe f 0 (x) 6= 0 em [a, b]. Como veremos abaixo, a condicao (17.5) e
importante por garantir a contratividade de T , enquanto que (17.6) e suficiente para garantir que T
leve pontos de [a, b] em [a, b], podendo ser eventualmente substituda por outra condicao que garanta
o mesmo. Notemos, por fim, que o metodo de Newton funciona mesmo sob condicoes mais fracas sobre
a funcao f , nesse caso fora do contexto do Teorema de Ponto Fixo de Banach. A convergencia das
iteracoes pode, entao, ser mais lenta que aquela garantida em (17.7). Vide para tal qualquer bom livro
de Calculo Numerico.
Prova. Sejam x, y [a, b]. Tem-se
T (y) T (x) = y
=

y
x

f (y)
f (x)
x+ 0
0
f (y)
f (x)


Z y
f (t)
d
f (t)f 00 (t)
t 0
dt =
dt .
dt
f (t)
(f 0 (t))2
x

Assim, (17.5) garante que


|T (y) T (x)| |y x| .

Isso estaria dizendo-nos que T e um contracao. Precisamos, porem, garantir que T leve pontos de [a, b]
em [a, b]. Isso equivale a garantir que |T (x) x| para todo x [a, b], ou seja, para todo x tal que
|x x| . Uma maneira de impor isso usando (17.5) e supor valida a condicao (17.6). De fato,






f (x)
f
(x)

|T (x) T (x)| + 0
|T (x) x| = T (x) T (x) + 0
f (x)
f (x)


por (17.5)
f (x)

|x x| + 0
f (x)
por (17.6)

pois x [a, b]

|x x| + (1 )

+ (1 )

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

887/1304

Com isso, provamos que T e uma contracao que mapeia o espaco metrico completo [a, b] em si mesmo.
O Teorema de Ponto Fixo de Banach garante o resto.

E. 17.4 Exerccio-Exemplo. Usando o metodo de Newton determine um valor aproximado para 2


da seguinte forma: determine o zero positivo de f (x) = x2 2. As iteracoes serao xn+1 = T (xn ) com
2
T (x) = x 2x+2 . Que intervalo [a, b] e conveniente adotar? O que ocorre proximo a x = 0 e por que?
Partindo-se,por exemplo, de x0 = 2 obtem-se os valores sucessivos 3/2, 17/12, 577/408. Esseu
ltimo
valor aproxima 2 com um erro de 2 106 . Note que esse procedimento fornece aproximacoes de 2 por
numeros racionais.
6
E. 17.5 Exerccio-Exemplo. Faca o mesmo para

3.

O metodo de Newton pode ser motivado geometricamente pela Figura 17.1. A linha reta que passa
pelo ponto (xn , f (xn )) tangencia o grafico da funcao f . Sua inclinacao e, portanto, f 0 (xn ). Assim,
n)
o ponto xn+1 indicado na figura vale xn+1 = xn ff0(x
(verifique!). Repetindo-se o procedimento a
(xn )
partir do ponto xn+1 aproximamo-nos mais ainda do zero de f .

f(x)

f(x n)

x n+1

xn

Figura 17.1: Iteracao no metodo de Newton. O ponto e um zero de f . A linha reta tangencia o
grafico de f no ponto (xn , f (xn )) e sua inclinacao e f 0 (xn ). O ponto em que essa reta corta o eixo
horizontal determina xn+1 .

No metodo de Newton usual, a reta tangente tem uma inclinacao diferente a cada passo: f 0 (xn ).
Um metodo alternativo, por vezes denominado metodo de Newton simplificado, consiste em usar retas
de inclinacao fixa, tal como na Figura 17.2. Nessa situacao, o problema de determinar o zero de f
equivale ao problema de ponto fixo x = T (x) com
1
T (x) = x f (x) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

888/1304

f(x)

f(x n)
f(xn+1 )
f(xn+2 )
arctan

xn+2

xn+1

xn

Figura 17.2: Alternativa ao metodo de Newton. As linhas retas nao sao tangentes ao grafico de f , sao
todas paralelas, todas com inclinacao fixa . Os pontos em que essas retas cortam o eixo horizontal
sao os pontos da iteracao.

E. 17.6 Exerccio. Usando o Teorema de Ponto Fixo de Banach estude esse problema de ponto fixo e
determine condicoes suficientes sobre a funcao f e sobre a inclinacao para garantir a existencia de um
zero u
nico de f em um intervalo [a, b].
6
E. 17.7 Exerccio-desafio.
retas tangentes.

Generalize o metodo de Newton usando parabolas tangentes, ao inves de


6

O metodo de Newton descrito acima pode ser generalizado para funcoes de


trataremos disso aqui.

17.1.2

em

, mas nao

Uma Generaliza
c
ao do Teorema de Ponto Fixo de Banach

Antes de tratarmos das importantes aplicacoes do Teorema de Ponto Fixo de Banach a equacoes
integrais vamos a uma pequena generalizacao do mesmo. Esta nos sera u
til, por exemplo, quando
tratarmos da equacao integral de Volterra. Ocorre por vezes que uma aplicacao T , como discutida
acima, nao e uma contracao, mas alguma de suas potencias o e. Nesse caso, podemos tambem garantir
os mesmos resultados do Teorema de Ponto Fixo de Banach. Temos o seguinte:
Proposi
c
ao 17.2 Seja M um conjunto dotado de uma metrica d e suponha M completo em relaca
o
a d. Seja A um subconjunto fechado em M e seja T uma funca
o de A em A, T : A A. Vamos
o T m seja uma contraca
o, cujo ponto fixo u
nico
supor que exista um n
umero m tal que a aplicaca
e x A. Ent
ao, T tambem tem um ponto fixo u
nico, a saber, o mesmo x.
2


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

889/1304

Prova. Para provar que x e tambem ponto fixo de T , notemos que, como x = T m (x), temos tambem
que
T (x) = T m+1 (x) = T m (T (x)).
Isso diz que T (x) e ponto fixo de T m . Pelo Teorema de Ponto Fixo de Banach este u
ltimo e x e e u
nico.
Da T (x) = x. Ora, isso diz precisamente que x e ponto fixo de T .
Provemos agora que x e tambem o u
nico ponto fixo de T . Para tal, suponha que haja um outro:
y. Entao y = T (y). Daqui tiramos que T (y) = T 2 (y). Juntando as duas vemos que y = T (y) = T 2 (y).
Repetindo esse procedimento, chegamos a y = T (y) = T 2 (y) = = T m (y). Isso diz que y e ponto
fixo de T m . Agora, pelas hipoteses, o u
nico ponto fixo de T m e x. Logo y = x.

17.2

As Equa
co
es Integrais de Fredholm e de Volterra

Vamos aqui tratar de dois tipos de equacoes integrais, as chamadas equacoes integrais de Fredholm 6 e
as equacoes integrais de Volterra7 . Ambas surgem em problemas de Fsica-Matematica e trataremos
de exemplos de aplicacoes adiante. A razao de tratarmos das mesmas aqui esta na possibilidade de
utilizar o Teorema de Ponto Fixo de Banach para estudar a existencia de solucoes. O mesmo teorema
fornece, tambem neste caso, um poderoso metodo iterativo de solucao, de grande importancia pratica.
Para uma introducao a` teoria das equacoes integrais, vide [102] e [128]. Para um tratamento extensivo
da equacao integral de Volterra, vide [92].
Antes de tratarmos dessas equacoes integrais, vamos discutir uma condicao que estaremos usando
adiante.
A condi
c
ao de Lipschitz
Seja f :

uma funcao. f e dita satisfazer a condica


o de Lipschitz8 em toda a reta real se
existir uma constante M 0 tal que, para todos x e x0 em tenhamos


|f (x0 ) f (x)| M |x0 x|.


Note que toda funcao que satisfaz a condicao de Lipschitz para algum M e necessariamente uma
funcao contnua (por que?).
Para que uma funcao satisfaca a condicao de Lipschitz ha uma condicao suficiente que e u
til. Seja
f :

uma funcao diferenciavel e tal que |f 0 (y)| M , para algum M 0 e para todo y .
Entao f satisfaz a condicao de Lipschitz. Para provar isso, notemos que, pelo teorema fundamental do
calculo vale
Z 0


f 0 (y)dy.

f (x ) f (x) =

Erik Ivar Fredholm (1866-1927).


Vito Volterra (1860-1940).
8
Rudolf Otto Sigismund Lipschitz (1832-1903).
7

JCABarata. Curso de Fsica-Matem


atica

Da,

Vers
ao de 29 de setembro de 2005.

Captulo 17

890/1304

Z 0

Z x0
Z x0
x



0
0
0
|f (x ) f (x)| =
f (y)dy
|f (y)|dy
M dy = M |x0 x|.
x

x
x

(Aqui tomamos x < x0 , sem perda de generalidade).

E. 17.8 Exerccio. Mostre que as funcoes sen e cos satisfazem a condicao de Lipschitz. Qual M pode
ser adotado para ambas?
6
E. 17.9 Exerccio. Mostre que a funcao f (y) = y 2 nao pode satisfazer a condicao de Lipschitz em toda
a reta real. Sugestao: tome x0 = 0 e note que a relacao |x2 | M |x| nao pode ser valida para todo x
com M 0 fixo qualquer.
6


Uma funcao que satisfaz a condicao de Lipschitz e dita ser Lipschitz contnua. Para a demonstracao
de resultados e muito u
til, por vezes, (veremos exemplos adiante) mostrar-se que uma funcao dada e
Lipschitz contnua.
A condicao discutida acima tem, alias, uma generalizacao da qual nao faremos uso aqui. Uma
funcao f : e dita ser -Lipschitz contnua se existirem M 0 e > 0 tais que para todos x e
x0 em valha
|f (x0 ) f (x)| M |x0 x| .


A condicao anterior e o caso particular deste onde = 1.


As Equa
co
es Integrais de Fredholm
Seja I o intervalo [a, b] da reta real (com a e b dados e a < b) e sejam duas funcoes f : I
K : I I que consideraremos contnuas em seus domnios de definicao.


A chamada equaca
o integral de Fredholm e a seguinte equacao integral:
Z b
u(x) = f (x) +
K(x, y, u(y)) dy.
a

ucleo da equacao integral,


Acima u : I e a funcao incognita. Note que K, que e chamada de n
e uma funcao de tres variaveis e que a incognita u(y) aparece na posicao de seu terceiro argumento,
dentro da integral.


Seja C0 (I) a colecao de todas as funcoes contnuas de I em . Ja vimos anteriormente (Proposicao


16.6, pagina 839) que C0 (I) e um espaco metrico completo em relacao a` metrica


d (h, l) = sup |h(x) l(x)|,


xI

onde h e l pertencem a C0 (I).


Seja T a aplicacao que leva C0 (I) em si mesmo dada por
Z b
K(x, y, h(y)) dy.
T (h)(x) = f (x) +
a

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

891/1304

Note que se h e uma funcao contnua em I entao T (h) tambem e uma funcao contnua em I. A equacao
integral de Fredholm pode ser entao entendida como a equacao de ponto fixo em C 0 (I) dada por
u = T (u).
natural, portanto, procurar condicoes que facam de T uma contracao no espaco metrico completo
E
neste momento que a
C0 (I), pois assim poderemos evocar o Teorema de Ponto Fixo de Banach. E
condicao de Lipschitz se faz u
til. Vamos supor que a funcao K satisfaca a condicao de Lipschitz para
a terceira variavel: vamos supor que existe M 0 tal que para todo x, y I e todos z e z 0 valha


|K(x, y, z 0 ) K(x, y, z)| M |z 0 z|.

(17.8)

Entao, pelo menos no caso em que M (b a) < 1, a aplicacao T e uma contracao em C 0 (I) com relacao
a` metrica d dada. Para provar isso, usamos que, para duas funcoes h, l C0 (I) temos
Z b
T (h)(x) T (l)(x) =
(K(x, y, h(y)) K(x, y, l(y))) dy,
a

donde tiramos que

|T (h)(x) T (l)(x)|

|K(x, y, h(y)) K(x, y, l(y))| dy

a
b
a

M |h(y) l(y)| dy

M (b a) sup |h(y) l(y)| = M (b a) d (h, l) .

(17.9)

yI

Logo,
d (T (h), T (l)) = sup |T (h)(x) T (l)(x)| M (b a) d (h, l).
xI

Assim, vimos que, sob as hipoteses acima, T e uma contracao se M (b a) < 1. Essa condicao,
se satisfeita, garante, pelo Teorema de Ponto Fixo de Banach, que ha uma e somente uma funcao u
em C0 (I) que e solucao da equacao integral de Fredholm. Com isso, a solucao pode ser aproximada
(exponencialmente, na metrica d ) partindo-se de qualquer u0 C0 (I) atraves da seq
uencia iterada
un = T (un1 ), n , n 1.


A condicao suficiente para termos contratividade M (b a) < 1 e, em suma, uma condicao sobre a
funcao K e sobre o intervalo I. Note-se que nao ha qualquer restricao a` funcao f , alem da que seja
contnua.
E. 17.10 Exerccio. Mostre que a equacao integral de Fredholm


Z 1
yu(y)
u(x) = 2 cos(x) +
dy ,
sen x +
2
0

x [0, 1] ,


yz 
tem uma solucao u
nica em C0 ([0, 1]). Sugestao: neste caso a funcao K e K(x, y, z) = sen x +
2
(certo?). Mostre que a mesma e Lipschitz contnua em relacao a z com M = 1/2. Para tal estude a
derivada parcial de K em relacao a z e mostre que |z K(x, y, z)| 1/2 para todo x, y I e todo z .
6


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

892/1304

As Equa
co
es Integrais de Volterra
A chamada equaca
o integral de Volterra e a seguinte equacao integral:
Z x
K(x, y, u(y)) dy.
u(x) = f (x) +
a

Acima u : I , I := [a, b] com b > a e a funcao incognita e f e K sao definidas tal como no caso
das equacoes integrais de Fredholm. Note que K, que e chamada de n
ucleo da equacao integral, e uma
funcao de tres variaveis e que a incognita u(y) aparece na posicao de seu terceiro argumento, dentro da
integral. Note tambem que a equacao integral de Volterra difere da equacao integral de Fredholm pelo
aparecimento de mais uma dependencia em x, a saber, no limite superior do intervalo de integracao.


Seja T a aplicacao que leva C0 (I) em si mesmo dada por


Z x
T (h)(x) = f (x) +
K(x, y, h(y)) dy.
a

Note que se h e uma funcao contnua em I entao T (h) tambem e uma funcao contnua em I. A equacao
integral de Volterra pode ser entao entendida como a equacao de ponto fixo em C 0 (I) dada por
u = T (u).
Como no caso da equacao integral de Fredholm, poderamos procurar condicoes que facam de T uma
contracao no espaco metrico completo C0 (I) pois, assim, poderamos novamente evocar o Teorema de
Ponto Fixo de Banach. Todavia, como veremos, podemos aqui proceder de um modo diferente do caso
da equacao de Fredholm e obter condicoes mais fracas para garantir a existencia de solucao. O que
faremos nao e procurar condicoes que garantam que T seja uma contracao, mas provaremos que T m o
e, para algum m > 0. Assim, poderemos evocar a generalizacao do Teorema de Ponto Fixo de Banach
fornecida na Proposicao 17.2, pagina 888.
Para tal, procedemos como antes e assumimos ser a funcao K Lipschitz contnua em relacao a`
terceira variavel, ou seja, que valha a condicao descrita em (17.8). Daqui tiramos, para x I,
Z x
(K(x, y, h(y)) K(x, y, l(y))) dy,
T (h)(x) T (l)(x) =
a

donde segue que


|T (h)(x) T (l)(x)|

|K(x, y, h(y)) K(x, y, l(y))| dy

a
x
a

M |h(y) l(y)| dy

M (x a) sup |h(y) l(y)| = M (x a) d (h, l) .


yI

A diferenca entre essa u


ltima expressao e a expressao correspondente (17.9) para a equacao de Fredholm
e que aqui surge o fator (x a), que ainda depende de x, ao inves do fator constante (b a). Como se

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

893/1304

vera no que segue, essa diferenca e importante. Vamos agora provar por inducao que para todo n
tem-se
(x a)n
d (h, l),
x I.
(17.10)
|T n (h)(x) T n (l)(x)| M n
n!
Como ja vimos que isso e verdade para n = 1, assumamos que essa relacao e valida para um certo n
generico. Entao,
Z x
n+1

n+1
T
|K(x, y, T n (h)(y)) K(x, y, T n (l)(y))| dy
(h)(x) T
(l)(x)


M |T n (h)(y) T n (l)(y)| dy

Z

= M n+1
o que prova (17.10) para todo n


M
a

n (y


a)n
dy d (h, l)
n!

(x a)n+1
d (h, l) ,
(n + 1)!

, por inducao. Assim, temos tambem que

d (T n (h), T n (l)) M n

(b a)n
d (h, l),
n!

n


Note-se agora que, para quaisquer M , a e b fixos, existe n grande o suficiente tal que
[M (b a)]n
< 1
n!
(por que?). Assim, para um tal n, T n sera uma contracao. Pela generalizacao do Teorema de Ponto
Fixo de Banach fornecida pela Proposicao 17.2, pagina 888, vemos que T tem tambem um ponto fixo
u
nico. Isso garante existencia e unicidade das solucoes da equacao de Volterra em C 0 (I). Note-se que,
aqui, foi suficiente assumir que K satisfaca a relacao descrita em (17.8), nao havendo restricoes ao valor
do produto M (b a), ao contrario do que ocorreu no caso da equacao de Fredholm.
Equa
co
es Diferenciais de Segunda Ordem e as Equa
co
es Integrais de Volterra
Vamos aqui tratar de mostrar algumas aplicacoes das equacoes integrais de Volterra a` resolucao de
problemas, muito freq
uentemente encontrados em Fsica, envolvendo equacoes diferenciais de segunda
ordem com certas condicoes iniciais dadas.
Para tal, faremos uso da seguinte identidade, valida para qualquer funcao que seja pelo menos
duas vezes diferenciavel em :
Z t

0 ) dt0 .
(t) = (t0 ) + (t0 )(t t0 ) +
(t t0 )(t
(17.11)


t0

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

894/1304

E. 17.11 Exerccio. Prove essa identidade. Sugestao: use as identidades


(t) = (t0 ) +

) dt
(t
0

) = (t
0) +
(t
0

t0

t0

00 ) dt00
(t

t0

e use integracao por partes.

Para ilustrar o uso que podemos fazer da identidade (17.11), vamos considerar a bem conhecida
equacao do pendulo simples
g

(t)
= sen ((t))
l

(para g > 0 e l > 0) com condicoes iniciais (0) = 0 e (0)


= 0 . Substituindo o lado direito em
(17.11) temos
Z
g t
(t t0 ) sen ((t0 )) dt0 ,
(17.12)
(t) = 0 + 0 t
l 0
que e uma equacao integral de Volterra nao-linear para .

E. 17.12 Exerccio. Constate que o nucleo dessa equacao integral


g
K(t, t0 , z) = (t t0 ) sen (z)
l
satisfaz a condicao de Lipschitz para t e t0 contidos em qualquer intervalo finito [T, T ], 0 < T < . 6
Deste u
ltimo exerccio conclumos que a equacao do pendulo simples, com as condicoes iniciais
dadas, tem solucao u
nica em qualquer intervalo finito [T, T ], 0 < T < .
E. 17.13 Exerccio. Calcule as duas primeiras aproximacoes para a solucao da equacao integral (17.12)
seguindo o procedimento iterativo. Tome como ponto de partida a funcao identicamente nula: 0 (t) 0.
Voce consegue, olhando o resultado do computo das duas primeiras aproximacoes, interpretar fisicamente o
que elas representam?
6
E. 17.14 Exerccio de meditaca
o. Pode-se obter solucoes oscilantes para a equacao do pendulo simples
acima pelo procedimento iterativo que advem do Teorema de Ponto Fixo de Banach?
6
E. 17.15 Exerccio. Seja a conhecida equacao do pendulo simples no limite de pequenas oscilacoes:
g

(t)
= (t),
l

com condicoes iniciais (0) = 0 e (0)


= 0 . Usando (17.11) transforme-a em uma equacao integral de
Volterra e resolva-a pelo metodo iterativo, tomando como ponto de partida a funcao identicamente nula:
0 (t) 0. Para tal, determine a n-esima iterada n exatamente
e mostre que a mesma converge a uma
r
g
certa combinacao linear de cos(t) e sen (t), onde =
. Para tal voce precisara lembrar-se da serie
l
de Taylor das funcoes sen e cos.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

895/1304

Uma outra ilustracao do uso das equacoes integrais de Volterra, e sua resolucao via Teorema de
Ponto Fixo de Banach, pode ser encontrada no estudo das equacoes diferenciais lineares de segunda
ordem nao-homogeneas com coeficientes nao necessariamente constantes
u
(t) + a(t)u(t)
+ b(t)u(t) = c(t),

(17.13)

com condicoes iniciais dadas do tipo u(0) = u0 e u(0)

= v0 . Tais equacoes sao muito freq


uentemente
encontradas em problemas de Fsica-Matematica e o estudante certamente ja as viu surgir, por exemplo,
em Mecanica Classica.
Nosso objetivo e transformar o problema de determinar a solucao u da equacao diferencial com
condicoes iniciais acima no problema de resolver uma equacao integral de Volterra equivalente.
Ha mais de uma maneira de se obter uma tal equacao integral a partir de (17.13). Para o proposito
de demonstrar existencia e unicidade da solucao, com condicoes pouco exigentes sobre as funcoes a, b
e c, vamos considerar primeiro uma equacao integral para u
. Uma outra equacao integral diretamente
para u sera vista depois.
Vamos supor aqui que haja um intervalo fechado finito I = [T, T ], 0 < T < , onde as funcoes
a, b e c que aparecem acima sejam contnuas. Pelo teorema fundamental do calculo e pela identidade
(17.11), temos que
Z t
u(t)

= v0 +
u
(t0 ) dt0 ,
(17.14)
0

u(t) = u0 + v0 t +

t
0

(t t0 ) u
(t0 ) dt0 .

(17.15)

Substituindo-se em (17.13) u e u pelo lado direito de (17.14) e (17.15), respectivamente, teremos


Z t
u
(t) = f (t) +
K(t, t0 ) u
(t0 )dt0 ,
(17.16)
0

onde
e

f (t) := c(t) (b(t)t + a(t))v0 b(t)u0

(17.17)

K(t, t0 ) := a(t) b(t)(t t0 ).

(17.18)

E. 17.16 Exerccio. Verifique tudo isso.

A equacao (17.16) e claramente uma equacao de Volterra linear para u


que, pelas hipoteses de
continuidade sobre as funcoes a, b e c, possui solucao u
nica no intervalo I, dado que nesse intervalo
K e limitado (por que?). A funcao u pode ser entao obtida integrando-se duas vezes a solucao u
da
equacao (17.16) ou usando-se novamente a identidade (17.11).
O que vimos acima pode ser entao resumido no seguinte teorema:
Teorema 17.2 Sejam as funco
es a, b e c contnuas no intervalo I = [T, T ]. Ent
ao, nesse intervalo,
a soluca
o da equaca
o diferencial linear de segunda ordem n
ao-homogenea
u
(t) + a(t)u(t)
+ b(t)u(t) = c(t),

(17.19)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

896/1304

com condico
es iniciais dadas do tipo u(0) = u0 e u(0)

= v0 , existe e e u
nica.

notavel que seja suficiente exigir tao pouco (so continuidade dos coeficientes) para garantir-se
E
existencia e unicidade da equacao acima. Ha funcoes contnuas que nao sao diferenciaveis em parte
alguma (voce conhece um exemplo?) ou mesmo algumas que sao crescentes mas tem derivada nula
quase em toda parte (a funcao de Cantor tratada no captulo de teoria da medida e um exemplo) e
mesmo com tais funcoes nos coeficientes de (17.13) tem-se garantida existencia e unicidade da solucao.
Para um outro tratamento da equacao (17.13) usando a chamada serie de Dyson, vide Captulo 7.
A equacao integral (17.16) e uma equacao para u
. O leitor pode estar se perguntando se nao
podemos ter uma equacao integral diretamente para u. A resposta e positiva. Fazendo mais uma vez
uso da identidade (17.11), temos
Z t
u(t) = u0 + v0 t +
(t t0 ) [a(t0 )u(t
0 ) b(t0 )u(t0 ) + c(t0 )] dt0 .
(17.20)
0

Integrando-se por partes obtemos


u(t) = f (t) +

K(t, t0 )u(t0 ) dt0 ,

onde agora
f (t) := u0 + t(v0 + a(0)u0 ) +
e

(17.21)

t
0

(t t0 )c(t0 )dt0

(17.22)

K(t, t0 ) := a(t0 ) + (t t0 )(a0 (t0 ) b(t0 )).

(17.23)

E. 17.17 Exerccio. Verifique isso.


0

Novamente, se a, a e b forem contnuas no intervalo I, assim como a funcao

t
0

(t t0 )c(t0 )dt0 , entao

a existencia e a unicidade da solucao da equacao tratada estarao garantidas no mesmo


Z t intervalo I.
Note-se que aqui podemos admitir tambem casos em que c nao e contnua, desde que
(t t0 )c(t0 )dt0
0

o seja.

E. 17.18 Exerccio. Seja a equacao do pendulo simples forcado no limite de pequenas oscilacoes
+ 2 (t) = f (t)
(t)
0
onde f representa (a menos de uma constante) uma forca externa dependente do tempo. Considere o caso
em que f e periodica de perodo T > 0, f (t) = f (t + nT ), n , com f dada no intervalo [0, T ) por

f0 , se 0 t T /2,
f (t) =
.
0,
se T /2 < t < T,
Transforme essa equacao em uma equacao integral de Volterra equivalente e mostre como a mesma pode
ser resolvida iterativamente.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

897/1304

E. 17.19 Exerccio. O mesmo para a equacao do pendulo simples forcado


+ 2 sen (t) = f (t)
(t)
com a mesma f dada acima.

17.3

Aplica
co
es `
a Teoria das Equa
co
es Diferenciais Ordin
arias

Iremos agora tratar de algumas das mais importantes aplicacoes do Teorema de Ponto Fixo de Banach,
a saber, a` teoria das equacoes diferenciais ordinarias (EDOs). O principal resultado que obteremos
e o celebre Teorema de Picard-Lindelof que fornece condicoes suficientes para existencia e unicidade
de solucoes de EDOs. Obteremos tambem resultados sobre a dependencia de solucoes com relacao a
condicoes iniciais e a parametros. Trataremos de equacoes diferenciais de uma classe bastante geral, a
saber, equacoes diferenciais em espacos de Banach, de modo a incluir sistemas de equacoes diferenciais
ordinarias definidas em n e n . O leitor e convidado a uma leitura previa do Captulo 5, pagina 260,
que trata de tais assuntos de forma introdutoria.


17.3.1

O Teorema de Picard-Lindel
of
Esta subseca
o foi originalmente escrita por Daniel A. Cortez

Uma das principais aplicacoes do Teorema de Ponto Fixo de Banach da-se, talvez, no contexto de
espacos de funcoes, mais precisamente, quando o mesmo e empregado na teoria das equacoes diferenciais
ordinarias (EDOs). Como veremos, o Teorema de Ponto Fixo de Banach e crucial para a demonstracao
de um famoso teorema sobre existencia e unicidade de solucoes para EDOs devido a Picard 9 e Lindelof10 .
Antes de entrarmos nos detalhes tecnicos, gostaramos de fazer uma pequena nota historica: originalmente, a demonstracao de existencia e unicidade de solucoes para EDOs se deve a Lindelof. Entretanto,
o metodo que aplicaremos aqui para a sua demonstracao, fazendo uso explcito do Teorema de Ponto
Fixo de Banach, deve-se a Picard11 . Esses trabalhos datam da decada de 90 do Seculo XIX.
No que segue procuraremos apresentar uma versao bastante geral do teorema sobre existencia e unicidade de solucoes para EDOs valido para equacoes definidas em espacos de Banach B. Consideremos,
a saber, o seguinte tipo de equacao diferencial de primeira ordem
x(t)

= f (t, x(t)) ,

(17.24)

onde t e x : B representa uma funcao de uma variavel real assumindo valores em um espaco
de Banach B. Acima, f : B B e uma funcao de t e x B sobre a qual suporemos certas
hipoteses convenientes de continuidade etc.


O leitor deve ter em mente o caso em que B = (ou B = ), quando a equacao acima representa
uma equacao de primeira ordem de uma funcao real (complexa) desconhecida x(t), ou o caso em que


Charles Emile
Picard (1856-1941).
Ernst Leonard Lindel
of (1870-1946).
11
Chamado de Metodo das aproximaco
es sucessivas.
9

10

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

898/1304

B = n (ou B = n ), quando a equacao acima representa um sistema de equacoes de primeira ordem


de um vetor real (complexo) desconhecido de n componentes: x(t) = (x1 (t), . . . , xn (t)). Tais sistemas
foram discutidos no Captulo 5, pagina 260.


Um problema de valor inicial consiste de uma equacao diferencial ordinaria, como a dada acima,
mais uma condica
o inicial
x(t0 ) = x0 ,
(17.25)
onde t0 e x0 B sao dados. Com essa pequena definicao, estamos prontos para enunciar o teorema
de existencia e unicidade de Picard-Lindelof:


Teorema 17.3 (Teorema de Picard-Lindel


of. Exist
encia e unicidade de solu
co
es de EDOs)
Seja f : B B n
ao-identicamente nula e contnua na regi
ao fechada


R Ra, b, t0 , x0 := { (t, x)


B : |t t0 | a, kx x0 k b } ,

(17.26)

para certos valores a > 0 e b > 0, onde k k representa a norma do espaco de Banach B. Claro e que
f e limitada em R. Seja c > 0 definida por
c :=

sup kf (t, x)k .

(17.27)

(t, x)R

Suponha ainda que f seja Lipschitz contnua em R com relaca


o ao seu segundo argumento, ou seja,
existe uma constante k 0 tal que para todos (t, x) e (t, y) R valha
kf (t, x) f (t, y)k k kx yk .

(17.28)

Ent
ao, pelo menos no intervalo fechado [t0 , t0 + ], onde


b
:= min a,
,
c

(17.29)

o problema de valor inicial descrito pelas relaco


es x(t)

= f (t, x(t)) com x(t 0 ) = x0 apresenta uma


soluca
o, a qual e u
nica.
Uma condica
o suficiente para que a condica
o de Lipschitz acima se cumpra e que y f (t, y) exista em
todo R e l
a seja limitada, em cujo caso a constante de Lipschitz seria dada por k := sup ky f (t, y)k.
(t, y)R

2
Antes de apresentarmos a demonstracao, gostaramos de notar o seguinte: embora de importante
aplicacao na maioria das situacoes praticas na teoria das EDOs, o Teorema de Picard-Lindelof nao e o
mais forte que existe em sua categoria. Para uma lista completa dos diversos teoremas sobre existencia
e/ou unicidade de solucao para EDOs, vide [1]. Na Secao 5.3, pagina 274, apresentamos exemplos
de aplicacao do Teorema de Picard-Lindelof e exemplos nos quais o mesmo nao se aplica, tendo por
conseq
uencia a inexistencia ou nao-unicidade da solucao.
Descrevamos agora a tecnica a ser utilizada em nossa demonstracao. O primeiro passo consiste
em convertermos a equacao diferencial (17.24) em uma equacao integral, definindo-se para isso uma
transformacao T . Em seguida, sob as hipoteses do teorema, mostraremos que existe uma certa potencia

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

899/1304

da transformacao T , digamos T m , m 1, tal que T m e uma contracao. Feito isso, utilizando o Teorema
de Ponto Fixo de Banach em sua versao generalizada (Proposicao 17.2, pagina 888), concluiremos a
existencia e a unicidade do ponto fixo para a transformacao T , o qual sera justamente a solucao de
nosso problema. Faremos uso nessa demonstracao, de dois resultados previos, que escrevemos sob a
forma de dois lemas. O primeiro deles, e a Proposicao 16.6, pagina 839, que recordamos aqui.
Lema 17.1 Seja C([a, b], B) o espaco das funco
es contnuas definidas no compacto [a, b]
assumindo valores no espaco e Banach B. Ent
ao, C([a, b], B) e um espaco de Banach em relaca
o a
`
metrica do supremo, definida por


d (f, g) := sup kf (t) g(t)k ,


t[a, b]

para f, g C([a, b], B).

A demonstracao e identica a` da Proposicao 16.6, pagina 839, e nao precisa se repetida aqui. O
segundo lema que utilizaremos e o seguinte.
e C([a, b], B) o sub-espaco de C([a, b], B)
Lema 17.2 Sejam [a, b] e para > 0 fixo, seja C
formado pelas funco
es x : [a, b] B tais que


kx(t) x0 k ,

t [a, b] .

(17.30)

e e um sub-espaco fechado de C([a, b], B).


Ent
ao, C

Prova. Tudo o que precisamos fazer e mostrar que qualquer seq


uencia convergente (x n ) de elementos de

e
e
C converge para um x que tambem esta em C (se voce nao entendeu a razao dessa afirmacao, confira
e para todo n , temos
a Proposicao 18.7 da pagina 937). De fato, como xn C


kxn (t) x0 k ,

t [a, b] .

Ja que essa expressao nao depende de t, podemos escrever


d (xn , x0 ) = sup kxn (t) x0 k .

(17.31)

tI

Por outro lado, como por hipotese a seq


uencia (xn ) converge para x , entao, dado > 0, existe N > 0
tal que para todo n > N vale:
d (xn , x ) .
(17.32)
Vamos agora utilizar a desigualdade triangular:

d (x , x0 ) d (x , xn ) + d (xn , x0 ) + ,

(17.33)

onde, na u
ltima desigualdade, fizemos uso das relacoes (17.31) e (17.32). Uma vez que (17.33) e
verdadeira para qualquer > 0, conclumos entao que
kx (t) x0 k sup kx (t) x0 k = d (x , x0 ) ,
t[a, b]

t [a, b] ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

900/1304

e
mostrando que x tambem pertence a C.

Prova do Teorema 17.3. Seja J o intervalo [t0 , t0 + ]


e considere o espaco C(J, B) das
funcoes contnuas em J assumindo valores em B, dotado com a metrica do supremo. Considere ainda
e C(J, B) formado pelo conjunto das funcoes x(t) tais que
o sub-espaco C


kx(t) x0 k c ,

t J .

(17.34)

Pelo Lema 17.1, sabemos que C(J, B) e um espaco de Banach. Por outro lado, do Lema 17.2 vemos
e e fechado em C(J, B). Logo, da Proposicao 18.7 da pagina 937, conclumos
que o subespaco C
e tambem e um espaco de Banach. Essa e uma conclusao importante da qual
imediatamente que C
faremos uso adiante.
Definamos agora uma transformacao T pela seguinte relacao:
Z t
f (, x( )) d .
(T x)(t) := x0 +

(17.35)

t0

e em C,
e ou seja, T : C
e C.
e De fato, para J e
Vamos mostrar que T e uma aplicacao que leva C
e como c b, conclumos de (17.26) que (, x( )) R. Logo a curva J 3 7 (, x( ))
x( ) C,
B e contnua e esta inteiramente contida na regiao R, onde f e contnua por hipotese. Assim,
J 3 7 f (, x( )) B e contnua e a sua integral estara bem definida. Conclumos da que T pode
e Agora vamos mostrar que T x e novamente um elemento em C.
e
ser aplicada a funcoes de C.


e
Utilizando a relacao (17.27) de limitacao da funcao f no retangulo R, tem-se para x C,

Z t
Z t



kf (, x( ))k d c|t t0 | c ,
k(T x)(t) x0 k =
f (, x( )) d
t0

t0

e Resta-nos
provando que T x dista de x0 menos que c, uma das condicoes definidores do conjunto C.
e Para tal, ja vimos que para x C
e fixo, J 3 7 f (, x( )) B
provar que T x e contnua caso x C.
e igualmente contnua e, portanto, limitada, ou seja, existe Nx > 0 tal que kf (, x( ))k Nx para
todo J. Logo, para t, t0 J, com t0 t

Z 0
Z t0

t


0
kf (, x( ))k d Nx |t0 t| .
f (, x( )) d
k(T x)(t ) (T x)(t)k =

t
t

Como o lado direito vai a zero para t t0 provou-se que (T x)(t) e contnua como funcao de t J.
e se x C.
e
Assim, T x C
e satisfaz o nosso
Chegamos agora ao ponto crucial de nossa demonstracao. Observe que se x(t) C
problema de valor inicial (relacoes (17.24) e (17.25)), entao certamente x(t) pode ser escrita como
Z t
f (, x( )) d .
(17.36)
x(t) = (T x)(t) = x0 +
t0

Para tal, procedemos como no tratamento da equacao integral de Volterra, pagina 893, assumindo
que a funcao f seja Lipschitz contnua em relacao a` segunda variavel, ou seja, que valha a condicao

JCABarata. Curso de Fsica-Matem


atica

e
descrita em (17.28). Para t J, e h, l C,

Z t

(T h)(t) (T l)(t) =

Captulo 17

Vers
ao de 29 de setembro de 2005.

t0

901/1304


f (, h( )) f (, l( )) d,

donde segue que (assumimos sem perda de generalidade que t t0 )


Z t
k(T h)(t) (T l)(t)k
kf (, h( )) f (, l( ))k d
t0

t
t0

kh( ) l( )k d

|t t0 | sup kh( ) l( )k = |t t0 | d (h, l) .


J

Vamos agora provar por inducao que para todo n


k(T n h)(x) (T n l)(x)k n

tem-se


|t t0 |n
d (h, l),
n!

t J.

(17.37)

Como ja vimos que isso e verdade para n = 1, assumamos que essa relacao e valida para um certo n
generico. Entao,
Z t
n+1

n+1
(T

kf (, (T n h)( )) f (, (T n l)( ))k d
h)(t) (T
l)(t)
t0

t0

k(T n h)( ) (T n l)( )k d

Z

= n+1
o que prova (17.37) para todo n


t0

n |

t 0 |n
d
n!

d (h, l)

|t t0 |n+1
d (h, l) ,
(n + 1)!

e todo t J, por inducao. Assim, temos tambem que

d (T n h, T n l)

()n
d (h, l),
n!

n


(17.38)
n

Note-se agora que, para quaisquer e fixos, existe n grande o suficiente tal que []
< 1. Assim,
n!
n
e
e e um
para um tal n, T sera uma contracao do espaco completo C e si mesmo (a afirmativa de que C
e e um espaco de Banach). Nessas condicoes,
espaco completo, baseia-se no fato ja provado de que C
podemos certamente evocar a versao generalizada do Teorema de Ponto Fixo de Banach fornecida pela
e satisfazendo (17.36).
Proposicao 17.2, pagina 888, garantindo a existencia e a unicidade de x(t) C,
Mas isso implica justamente a existencia e unicidade de solucao em C(J, B) do problema de valor
inicial considerado, demonstrando o Teorema 17.3.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

902/1304

*
No Captulo 5, especialmente na Secao 5.3.1, pagina 276 e seguintes, sao discutidos exemplos de
equacoes diferenciais ordinarias que violam as condicoes do Teorema de Picard-Lindelof.

17.3.2

Generalizando o Teorema de Picard-Lindel


of. Solu
co
es Globais

Nesta sub-secao demonstraremos um teorema que fornece condicoes suficientes para a existencia de
solucoes globais de problemas de valor inicial. O primeiro teorema abaixo e um resultado preparatorio
que estende o Teorema de Picard-Lindelof, Teorema 17.3, pagina 898.
Em toda esta secao, B denota um espaco de Banach com norma k k e, para a > 0 e t 0
denotamos por Fa, t0 B a faixa de largura a centrada em t0 definida por


Fa, t0 := { (t, y)


B : |t t0 | a , y B arbitrario} .

o f : Fa, t0
Teorema 17.4 Suponhamos que para um certo a > 0 e para t0 tenhamos uma funca
B que seja contnua. Suponhamos tambem que f e Lipschitz contnua em relaca
o a
` segunda vari
avel,
ou seja, existe uma constante ka (denominada constante de Lipschitz) tal que para todos (t, y), (t, v)
Fa, t0 vale kf (t, y) f (t, v)k ka ky vk. Ent
ao, para qualquer = x0 B, o problema de valor inicial
x(t)

= f (t, x(t)) com x(t0 ) = x0 apresenta uma soluca


o u
nica v
alida para todo t [t 0 a, t0 + a].


Uma condica
o suficiente para que a condica
o de Lipschitz acima se cumpra e que y f (t, y) exista
a seja limitada, em cujo caso a constante de Lipschitz pode ser escolhida
em todo ponto de Fa, t0 e l
como ka := sup ky f (t, y)k.
2
(t, y)Fa, t0

O leitor deve notar que esse teorema difere do Teorema de Picard-Lindelof primeiro na hipotese de
que f seja Lipschitz contnua em uma faixa infinita Fa, t0 de largura 2a centrada no instante inicial t0 ,
e nao apenas em uma regiao compacta como o R do Teorema 17.3; segundo na conclusao, que afirma
que a solucao existe em todo intervalo [t0 a, t0 + a] e nao em um intervalo eventualmente menor.
Prova. A demonstracao segue passos semelhantes aos da prova do Teorema de Picard-Lindelof. Seja J
o intervalo fechado [t0 a, t0 + a]. Considere o espaco C(J, B) das funcoes contnuas em J assumindo
valores em B, dotado com a metrica do supremo. Pelo Lema 17.1, sabemos que C(J, B) e um espaco
de Banach. Como na prova do Teorema de Picard-Lindelof, definimos a transformacao
Z t
(T x)(t) := x0 +
f (, x( )) d .
(17.39)
t0

Vamos mostrar que T e uma aplicacao que leva C(J, B) em C(J, B). De fato, para J e x C(J, B)
tem-se obviamente que (, x( )) Fa, t0 . Logo, a curva J 3 7 (, x( )) B e contnua e esta
inteiramente contida na regiao Fa, t0 , onde f e contnua por hipotese. Assim, J 3 7 f (, x( )) B
e contnua e a sua integral estara bem definida. Conclumos da que T pode ser aplicada a funcoes de
C(J, B). Agora vamos mostrar que T x e novamente um elemento em C(J, B) e para tal e preciso
provar que T x e contnua caso x C(J, B). Para x C(J, B) fixo, vimos que J 3 7 f (, x( )) B


JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

903/1304

e igualmente contnua e, portanto, limitada, ou seja, existe Nx > 0 tal que kf (, x( ))k Nx para
todo J. Logo, para t, t0 J, com t0 t

Z 0
Z t0

t


0
kf (, x( ))k d Nx |t0 t| .
f (, x( )) d
k(T x)(t ) (T x)(t)k =

t
t
Como o lado direito vai a zero para t t0 provou-se que (T x)(t) e contnua como funcao de t J.
Assim, T x C(J, B) se x C(J, B).

Para provar que T possui um ponto fixo u


nico em C(J, B) segue-se os mesmos passos da demonstracao do Teorema de Picard-Lindelof que conduziram a` (17.38), que no presente caso assume a
forma
(aa )n
d (T n h, T n l)
(17.40)
d (h, l), n .
n!


Note-se agora que, para quaisquer a e a fixos, existe n grande o suficiente tal que [an!a ] < 1. Assim,
para um tal n, T n sera uma contracao do espaco completo C(J, B) e si mesmo. Nessas condicoes,
podemos certamente evocar a versao generalizada do Teorema de Ponto Fixo de Banach fornecida pela
Proposicao 17.2, pagina 888, garantindo a existencia e a unicidade de x(t) C(J, B), satisfazendo
(17.36). Mas isso implica justamente a existencia e unicidade de solucao em C(J, B) do problema de
valor inicial considerado, demonstrando o Teorema 17.4.
Chegamos finalmente ao
Teorema 17.5 (Exist
encia e unicidade de solu
co
es globais) Seja f : B B contnua em
todo B. Suponhamos tambem que para todo a > 0, f seja Lipschitz contnua em relaca
o a
` segunda
vari
avel na faixa Fa, t0 , ou seja, para cada a > 0 existe uma constante ka (eventualmente dependente de a
e denominada constante de Lipschitz) tal que para todos (t, y), (t, v) Fa, t0 vale kf (t, y)f (t, v)k
ka ky vk. Ent
ao, para qualquer x0 B, o problema de valor inicial x(t)

= f (t, x(t)) com x(t0 ) = x0


apresenta uma soluca
o u
nica v
alida para todo t .


Uma condica
o suficiente para que a condica
o de Lipschitz acima se cumpra e que y f (t, y) exista
em todo B e seja limitada em cada faixa Fa, t0 , a > 0, em cujo caso as constantes de Lipschitz
2
podem ser escolhidas como ka := sup ky f (t, y)k.


(t, y)Fa, t0

Prova. A prova e imediata pelo Teorema 17.4.


Sugerimos aqui os exerccios da pagina 283 e os comentarios que se lhe seguem.

17.3.3

Um Teorema de Compara
c
ao de Solu
co
es de EDOs

Nesta secao estabeleceremos um resultado fundamental para a analise da dependencia de solucoes de


EDOs para com as condicoes iniciais e para com os parametros que definem a equacao, duas questoes
importantes em aplicacoes. Esse resultado esta expresso no Teorema 17.6 que permite comparar a
evolucao de solucoes de equacoes diferenciais distintas, com condicoes iniciais distintas. Apos seu
enunciado e demonstracao faremos alguns comentarios relevantes.

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

Teorema 17.6 Seja B um espaco de Banach, f1 , f2 :


soluco
es dos problemas de valor inicial


B B duas funco
es e sejam y1 , y2 : I B

x(t)

= f1 (t, x(t)) ,

x(t0 ) = x1 ,

x(t)

= f2 (t, x(t)) ,

x(t0 ) = x2 ,

respectivamente, v
alidas em um intervalo I que contem o ponto t0
Seja R

904/1304

B uma regi
ao fechada da forma
R = { (t, x)


B : |t t0 | a, kx x0 k b } ,

(17.41)

para certos a > 0, b > 0 e x0 B, onde k k representa a norma do espaco de Banach B. Vamos supor
que R que satisfaca as seguintes condico
es:
1. I [t0 a, t0 + a].
2. (t0 , x1 ) R e (t0 , x2 ) R.
3. f1 e f2 s
ao contnuas em R.
4. f1 e Lipschitz contnua em R com constante 1 > 0, ou seja, para todos (t, u) e (t, v) R vale
kf1 (t, u) f1 (t, v)k 1 ku vk .

(17.42)

5. Os gr
aficos de y1 e y2 est
ao ambos contidos em R, ou seja,
ky1 (t) x0 k b

ky2 (t) x0 k b

para todo t I [t0 a, t0 + a].


Ent
ao, para todo t I vale a desigualdade
1
ky1 (t) y2 (t)k kx1 x2 k e1 |tt0 | +
1

"

sup kf1 (t, x) f2 (t, x)k

(t, x)R


e1 |tt0 | 1 .

(17.43)
2

Prova. Como vimos, podemos sob as hipoteses escrever, para t I,


Z t
Z t
f2 (, y2 ( )) d .
f1 (, y1 ( )) d
e
y2 (t) = x2 +
y1 (t) = x1 +
t0

t0

Disso segue que


y1 (t) y2 (t) = x1 x2 +
= x1 x2 +

Z th
t0

Z th
t0

i
f1 (, y1 ( )) f2 (, y2 ( )) d
i

f1 (, y1 ( )) f1 (, y2 ( )) d +

Z th
t0

i
f1 (, y2 ( )) f2 (, y2 ( )) d .
(17.44)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

905/1304

Na u
ltima igualdade acima fizemos uso da hipotese 5 do Teorema 17.6, de modo que f 1 (, y2 ( )) esta
bem definido para I. Supondo, sem perda de generalidade, que t t0 , temos pela condicao de
Lipschitz para f1 ,
Z t h
Z t
Z t

i





ky1 ( )y2 ( )kd .
f1 (, y1 ( )) f1 (, y2 ( )) d
f1 (, y1 ( ))f1 (, y2 ( )) d 1


t0

t0

t0

Definindo-se

C :=

sup kf1 (t, x) f2 (t, x)k ,

(t, x)R

tem-se

Z t h
i



C (t t0 ) .
f
(,
y
(
))

f
(,
y
(
))
d
1
2
2
2


t0

Definindo-se tambem D := kx1 x2 k, segue de (17.44) que


Z t
ky1 (t) y2 (t)k D + 1
ky1 ( ) y2 ( )k d + C (t t0 ) ,

(17.45)

t0

desigualdade essa que pode ser trivialmente escrita na forma







Z t
C
C
C
D+
+ 1
d .
ky1 ( ) y2 ( )k +
ky1 (t) y2 (t)k +
1
1
1
t0

(17.46)

Nessa forma, vemos pelo Lema 17.3, pagina 913, que podemos aplicar a desigualdade de Gronwall,
expressao (17.A.2), obtendo




C
C
ky1 (t) y2 (t)k +
D+
e1 (tt0 ) ,
1
1
ou seja
ky1 (t) y2 (t)k De1 (tt0 ) +
O caso t < t0 e analogo. Isso completa a prova.


C  1 (tt0 )
e
1 .
1

Passemos a alguns comentarios sobre o Teorema 17.6.


Coment
ario ao Teorema 17.6. Continuidade em rela
c
ao `
as condi
co
es iniciais
No caso em que f1 = f2 , tem-se C = 0 e a desigualdade (17.43) reduz-se a
ky1 (t) y2 (t)k kx1 x2 k e1 |tt0 | .

(17.47)

Essa desigualdade informa-nos que em intervalos finitos de tempo, sob as condicoes do Teorema 17.6,
as solucoes do problema de valor inicial x(t)

= f1 (t, x(t)), x(t0 ) = x1 dependem continuamente da


condicao inicial x1 . A desigualdade acima informa-nos tambem que variando-se as condicoes iniciais as
solucoes da equacao diferencial acima pode no maximo divergir exponencialmente para curtos intervalos
de tempo.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

906/1304

O Expoente de Lyapunov
O chamado expoente de Lyapunov12 no ponto x1 associado ao problema de valor inicial acima e
definido por13


1
ky1 (t) y2 (t)k
,
ln
x1 := lim lim
tt0 x2 x1 |t t0 |
kx1 x2 k

caso esses limites existam14 . De (17.47) ve-se que 0 x1 1 . A nocao de expoente de Lyapunov tem
uma certa relevancia no estudo equacoes diferenciais com comportamento caotico (vide, por exemplo,
[65] para uma introducao a` teoria dos sistemas dinamicos), por fornecer uma indicacao qualitativa
de quao rapida se da a divergencia das solucoes para curtos intervalos de tempo por mudancas nas
condicoes iniciais, pois permite-nos a aproximacao
ky1 (t) y2 (t)k kx1 x2 kex1 |tt0 |
para |t t0 | pequeno e kx1 x2 k pequeno. Alguns autores caracterizam a presenca de caos no sistema
definido pela equacao diferencial que tratamos atraves da presenca de um expoente de Lyapunov
positivo (nao-nulo). Essa caracterizacao, ainda que popular em certos crculos, nao e geral o suficiente
e e substituda por outras caracterizacoes melhores, notadamente em textos matematicos (vide, por
exemplo, [65]).
Coment
ario ao Teorema 17.6. Continuidade por mudan
cas de par
ametros
No caso em que x1 = x2 , tem-se D = 0 e a desigualdade (17.43) reduz-se a
"
#

1
ky1 (t) y2 (t)k
sup kf1 (t, x) f2 (t, x)k e1 |tt0 | 1 .
1 (t, x)R

Essa desigualdade informa-nos que em intervalos finitos de tempo, as solucoes do problema de valor
inicial x(t)

= f1 (t, x(t)), x(t0 ) = x1 dependem continuamente de deformacoes da funcao f1 (por exemplo, deformacoes por mudancas dos parametros que definem a funcao f1 ) que respeitem as condicoes
do Teorema 17.6. Essas deformacoes podem, inclusive, ser tais que f1 seja levada a uma funcao naoLipschitz contnua f2 (note que no enunciado do Teorema 17.6 assumimos a continuidade de Lipschitz
apenas para a funcao f1 ).
A continuidade em relacao a parametros tambem pode ser inferida do seguinte argumento elegante.
Seja o problema de valor inicial x(t)

= f1 (t, x(t), p0 ), x(t0 ) = x1 , onde f1 depende de um parametro


p0 , como indicado. Como p0 e constante, esse problema equivale ao sistema de equacoes diferenciais
x(t)

= f1 (t, x(t), p(t)) ,


p(t)

= 0,
12

Aleksandr Mikhailovich Lyapunov (1857-1918). O nome de Lyapunov e grafado de diversas outras formas: Liapunov,
Liapounov, Liapounoff etc.
13
O leitor deve ser advertido do fato de haver outras definico
es de expoente de Lyapunov na literatura, nem todas
totalmente equivalentes a essa.
14
Pode ser necess
ario substituir os limites por lim sups e lim infs.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

907/1304

com condicoes iniciais x(t0 ) = x1 , p(t0 ) = p0 . A esse sistema aplicam-se tambem os teoremas anteriores
sobre existencia, unicidade e continuidade em relacao a condicoes iniciais, o que nos permite inferir a
continuidade desejada caso, adicionalmente, f1 (t, x, p) seja Lipschitz contnua na sua dependencia com
o parametro p em uma vizinhanca de p0 .

17.4

O Teorema da Fun
c
ao Implcita e o Teorema da Fun
c
ao
Inversa

O Teorema de Ponto Fixo de Banach pode ser utilizado para demonstrar dois teoremas importantes:
o Teorema da Funcao Implcita e o Teorema da Funcao Inversa. Esses teoremas sao bem-conhecidos
da Analise em n e iremos apresenta-los e demonstra-los aqui no contexto bastante geral de espacos
de Banach. Nessa forma geral esses teoremas desempenham um papel relevante em areas tais como a
teoria das equacoes diferenciais (ordinarias e parciais), na geometria diferencial e na teoria dos sistemas
dinamicos, como no celebre Teorema KAM15 . A importancia do Teorema da Funcao Implcita reside
no fato de o mesmo garantir condicoes suficientes para a solubilidade de uma classe bastante geral de
equacoes funcionais.


Como veremos, a demonstracao do Teorema da Funcao Implcita faz tambem uso do Teorema do
Valor Medio e da nocao de derivada de Frechet, ambas discutidas na Secao 23.2.2, pagina 1011 (o Teorema do Valor Medio e o Teorema 23.1, pagina 1014). Familiaridade com aquela secao e recomendada
ao leitor. Para o estudante e tambem interessante notar que a demonstracao do Teorema da Funcao
Implcita que apresentaremos guarda forte semelhanca com as ideias por tras do metodo de Newton,
o qual discutimos paginas acima. Isso nao e por acaso, mas deixamos ao leitor como exerccio de meditacao entender por que. Para uma discussao geral, com notas historicas, sobre o Teorema da Funcao
Implcita e suas aplicacoes, vide [76]16 .

17.4.1

O Teorema da Fun
c
ao Implcita

Para o enunciado e demonstracao do Teorema da Funcao Implcita abaixo faremos uso da nocao de
derivada parcial introduzida a` pagina 1015 e seguintes e da notacao correspondente.
Teorema 17.7 (Teorema da Fun
c
ao Implcita em Espa
cos de Banach) Sejam X e Y espacos
de Banach, A X e B Y dois abertos e seja F : A B Y contnua e diferenci
avel com derivada
1
contnua (ou seja, de classe C ). Suponhamos ainda que existam x0 A e y0 B tais que F (x0 , y0 ) = 0
e que a aplicaca
o linear D2 F (x0 , y0 ) = F 0 (x0 , y0 )Y : Y Y seja invertvel. Ent
ao, existem abertos
A0 A e B0 B contendo x0 e y0 , respectivamente, e uma funca
o contnua f : A0 B0 satisfazendo
f (x0 ) = y0 e F (x, f (x)) = 0 para todo x A0 . Para cada x A0 o ponto f (x) B0 e o u
nico que
satisfaz F (x, y) = 0. A funca
o f e contnua e diferenci
avel com derivada contnua, sendo

1
(17.48)
f 0 (x) = D2 F (x, f (x)) D1 F (x, f (x)) .
15
16

Andrey Nikolaevich Kolmogorov (1903-1987); Vladimir Igorevich Arnold (1937-); J


urgen Moser (1928-1999).
Agradecemos a D. A. Cortez por essa referencia.

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

908/1304

Prova. Para simplificar a notacao denotemos o operador linear D2 F (x0 , y0 ) : Y Y por L. A ideia
da prova e usar o Teorema do Ponto Fixo de Banach para mostrar que para cada x suficientemente
proximo de x0 a aplicacao Tx : B Y dada por Tx (y) T (x, y) := y L1 F (x, y) tem um ponto
fixo u
nico (que denotaremos por f (x)) em uma vizinhanca suficientemente pequena de y0 . Assim
f (x) = Tx (f (x)), ou seja, L1 F (x, f (x)) = 0, o que implica F (x, f (x)) = 0. Para provar os fatos
delineados acima, provaremos que existe um aberto B1 B que contem y0 e que e levado em si mesmo
por Tx , desde que x esteja proximo o suficiente de x0 . Em seguida provaremos que Tx e uma contracao
quando restrito ao fecho de B1 . O Teorema do Ponto Fixo de Banach garante, entao, a existencia e
unicidade do ponto fixo. As demais afirmacoes do enunciado (continuidade e diferenciabilidade de f )
seguem de certas estimativas que encontraremos no caminho.
Para x fixo em A, a derivada de Tx (y) em relacao a y e a derivada parcial
D2 T (x, y) =

L1 D2 F (x, y) .

(17.49)

Trata-se de um operador linear e limitado de Y em Y. Analogamente,


D1 T (x, y) = L1 D1 F (x, y) .

(17.50)

Trata-se de um operador linear e limitado de X em Y.


Tomemos 0 < q < 1 fixo. O fato que D2 F (x0 , y0 ) = L implica que Y L1 D2 F (x, y) anula-se no
ponto (x0 , y0 ). Assim, a continuidade de D2 F (x, y) como funcao de x e y garante que existe 1 > 0
tal que se kx x0 kX 1 e ky y0 kY 1 entao
k

L1 D2 F (x, y)k < q .

(17.51)

Como veremos logo abaixo, e importante sabermos estimar a norma de diferencas como T (x, y)
T (x0 , y 0 ). Com uso do Teorema 23.1, pagina 1014, podemos escrever17


Z 1

x x0
0
0
0
0
0
T (x, y) + (1 )(x , y ) d
.
(17.52)
T (x, y) T (x , y ) =
y y0
0
Usando a representacao (23.14) e escrevendo

T 0 (x, y) = D1 T (x, y) X + D2 T (x, y) Y ,


ficamos com
0

T (x, y) T (x , y )

Z

Z

+
17

Z

Z

1
0

D1 T (x, y) + (1 )(x , y ) X d

0
1

D2 T (x, y) + (1 )(x , y ) Y d

0
1

D1 T (x, y) + (1 )(x , y ) d

0
1
0

D2 T (x, y) + (1 )(x , y ) d





x x0
y y0

x x0
y y0

(x x0 )
(y y 0 ) .

Para sermos estritos quanto a


` notaca
o, deveramos escrever a combinaca
o linear convexa que surge no argumento de

0
T em (17.52) na forma de vetores-coluna: xy + (1 ) xy0 . Renunciamos a esse preciosismo, porem.
0

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

909/1304

Assim,
kT (x, y) T (x0 , y 0 )k 1 kx x0 kX + 2 ky y 0 kY ,
onde



j := sup Dj T (x, y) + (1 )(x0 , y 0 ) ,

(17.53)

j = 1, 2 .

[0, 1]

Observe-se que se tivermos x, x0 A1 e y, y 0 B1 , onde


A1 := {x00 X| kx00 x0 kX < 1 }

B1 := {y 00 Y| ky 00 y0 kY < 1 } ,

poderemos estimar


sup D1 T (x, y) + (1 )(x0 , y 0 )

1 =

[0, 1]



sup L1 D1 F (x, y) + (1 )(x0 , y 0 )

[0, 1]

sup

x00 A1 , y 00 B1

e
2

1

L D1 F (x00 , y 00 ) =: ,



sup D2 T (x, y) + (1 )(x0 , y 0 )

[0, 1]

(17.51)

<

sup

x00 A1 , y 00 B1

sup
x00 A1 , y 00 B1

kD2 T (x00 , y 00 )k


L1 D2 F (x00 , y 00 )

q.

(17.54)

Podemos escolher um n
umero 2 > 0 satisfazendo simultaneamente 2 < 1 e 2 < (1 q)1 (se
1 a segunda condicao implica a primeira) e definir
A2 := {x00 X| kx00 x0 kX < 2 } .
evidente que A2 A1 e que as estimativas 1 e 2 < q permanecem validas se tivermos x, x0 A2
E
e y, y 0 B1 .

Isto posto, tomemos x A2 , y B1 e consideremos a diferenca Tx (y) y0 = T (x, y) y0 . Como


T (x0 , y0 ) = y0 (pois F (x0 , y0 ) = 0), temos que Tx (y) y0 = T (x, y) T (x0 , y0 ). Por (17.53), teremos
kTx (y) y0 k = kT (x, y) T (x0 , y0 )k 1 kx x0 kX + 2 ky y0 kY 2 + q1 < 1 , (17.55)
a u
ltima desigualdade devendo-se a 2 < (1 q)1 . A expressao (17.55) ensina-nos que se x A2
entao Tx e uma aplicacao de B1 em si mesmo.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

910/1304

Tambem para x A2 e y, y 0 B1 teremos


kTx (y) Tx (y 0 )k = kT (x, y) T (x, y 0 )k

(17.53)

2 ky y 0 k

(17.54)

<

q ky y 0 k ,

provando que Tx e uma contracao. Como B1 e um espaco metrico completo, podemos agora evocar o
Teorema de Ponto Fixo de Banach e assim estabelecer que para cada x A2 a aplicacao Tx : B1 B1
tem um u
nico ponto fixo em B1 , que denotaremos por f (x). A equacao de ponto fixo f (x) = Tx (f (x))
significa F (x, f (x)) = 0, como comentamos no incio da demonstracao.
Para x, x0 A2 e pela equacao de ponto fixo tem-se f (x) f (x0 ) = Tx (f (x)) Tx0 (f (x0 )) =
T (x, f (x)) T (x0 , f (x0 )) e, novamente por (17.53) com 1 , 2 < q, segue que
kf (x) f (x0 )kY < kx x0 kX + qkf (x) f (x0 )kY ,
ou seja, kf (x) f (x0 )kY < (1 q)1 kx x0 kX , o que implica que f e contnua em A2 .
Pela unicidade, tem-se tambem que f (x0 ) = y0 .

A diferenciabilidade de f pode ser estabelecida, sob as hipoteses dadas, escrevendo-se



f (x + h) f (x) = S(x, h) + T(x, h) + D1 T (x, f (x)) h + D2 T (x, f (x)) f (x + h) f (x) , (17.56)

onde,

S(x, h) :=

T (x + h, f (x + h)) T (x, f (x + h)) D1 T (x, f (x + h)) h

h
i
+ T (x, f (x + h)) T (x, f (x)) D2 T (x, f (x)) f (x + h) f (x)

T(x, h) := (D1 T (x, f (x + h)) D1 T (x, f (x))) h .


E. 17.20 Exerccio. Verifique a validade da expressao (17.56) observando que os termos do lado direito
simplesmente se cancelam para dar o lado esquerdo.
6
Disso obtem-se que
h
i1 
 h
f (x+h)f (x) =
S(x, h)+T(x, h) +
Y D2 T (x, f (x))
o que, por (17.49) e (17.50), simplifica-se para

Y D2 T (x,

f (x))

i1

D1 T (x, f (x)) h ,

h
i1 

h
i1
S(x, h) + T(x, h) .
f (x + h) f (x) + D2 F (x, f (x)) D1 F (x, f (x)) h = L1 D2 F (x, f (x))
E. 17.21 Exerccio. Verifique!

JCABarata. Curso de Fsica-Matem


atica

Captulo 17

Vers
ao de 29 de setembro de 2005.

911/1304

h
i1
Observe-se, de passagem, que da continuidade de D2 F (x, y), da hipotese que D2 F (x, y)
existe
no ponto (x0 , y0 ) e do fato de f ser contnuo com f (x0 ) = y0 , segue que D2 F (x, f (x)) e igualmente
invertvel em uma vizinhanca suficientemente pequena de x0 , pois o conjunto de elementos invertveis
em uma algebra de Banach com unidade (como a algebra dos operadores lineares limitados de Y em
Y, da qual D2 F (x, f (x)) faz parte) e aberto (Corolario 26.4, pagina 1160). Isso justifica a expressao
acima.
Do hipotese que F (e, portanto, T ) e diferenciavel em relacao a seus dois argumentos segue que

e que

Portanto,

i
1 h
T (x + h, f (x + h)) T (x, f (x + h)) D1 T (x, f (x + h)) h = 0
lim
h0 khkX
i
1 h
lim
T (x, f (x + h)) T (x, f (x)) D2 T (x, f (x)) f (x + h) f (x) = 0 .
h0 khkX
1
S(x, h) = 0 .
h0 khkX
lim

Da continuidade de f e da hipotese que D1 T (x, y) e contnua, segue tambem que



 h
1
T(x, h) = lim D1 T (x, f (x + h)) D1 T (x, f (x))
= 0.
h0
h0 khkX
khkX
lim

Provamos, assim, que


h
i1
1
lim
f (x + h) f (x) + D2 F (x, f (x)) D1 F (x, f (x)) h
h0 khkX

= 0,

o que prova que f e diferenciavel e que (17.48) e verdadeira.

Exemplos e contra-exemplos
E. 17.22 Exerccio. Seja a funcao F (x, y) = x2 + y com x, y . No ponto (x0 , y0 ) = (0, 0) a
funcao F se anula. Verifique que as condicoes do Teorema da Funcao Implcita sao satisfeitas nesse caso e
6
que f (x) = x2 satisfaz f (x0 ) = y0 e F (x, f (x)) = 0 em todo . Cheque a validade de (17.48).


Os exerccios a seguir exibem algumas patologias.


E. 17.23 Exerccio-exemplo. Esse exerccio mostra uma situacao na qual nao existe nenhuma funcao f
satisfazendo f (x0 ) = y0 e F (x, f (x)) = 0. Seja a funcao F (x, y) = x2 + y 2 com x, y . No ponto
(x0 , y0 ) = (0, 0) a funcao F se anula, mas nao existe nenhuma f tal que f (x 0 ) = y0 e F (x, f (x)) = 0 em
uma vizinhanca de x0 , pois (0, 0) e o u
nico zero de F . Quais hipoteses do Teorema da Funcao Implcita
falham nesse caso?
6


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

912/1304

E. 17.24 Exerccio-exemplo. Esse exerccio mostra uma situacao na qual existe mais de uma funcao f
satisfazendo f (x0 ) = y0 e F (x, f (x)) = 0. Seja F definida por F (x, y) = x2 y 2 com x, y . No
ponto (x0 , y0 ) = (0, 0) a funcao F se anula e f (x) = x satisfazem f (x0 ) = y0 e F (x, f (x)) = 0.
Quais hipoteses do Teorema da Funcao Implcita falham nesse caso? A relacao (17.48) vale para ambas as
funcoes f ?
6


E. 17.25 Exerccio-exemplo. Seja a funcao F (x, y) = x2 + y 3 com x, y . No ponto (x0 , y0 ) =


(0, 0) a funcao F se anula e f (x) = x2/3 satisfaz f (x0 ) = y0 e F (x, f (x)) = 0 em . No entanto, f
nao e diferenciavel em (x0 , y0 ). Note, porem, que D2 F nao e invertvel em (x0 , y0 ). Isso mostra que as
condicoes do Teorema da Funcao Implcita sao condicoes suficientes mas nao necessarias para a existencia
de solucao contnua. Cheque tambem a validade de (17.48).
6


E. 17.26 Exerccio-exemplo. Seja a funcao F (x, y) = x4 + y 3 com x, y . No ponto (x0 , y0 ) =


(0, 0) a funcao F se anula e f (x) = x4/3 satisfaz f (x0 ) = y0 e F (x, f (x)) = 0. f e contnua com
derivada contnua. D2 F , porem, nao e invertvel em (x0 , y0 ). Isso mostra que as condicoes do Teorema
da Funcao Implcita sao condicoes suficientes mas nao necessarias para a existencia de solucao contnua e
diferenciavel. Cheque tambem a validade de (17.48).
6


17.4.2

O Teorema da Fun
c
ao Inversa

Uma das conseq


uencias diretas do Teorema da Funcao Implcita e um teorema que garante condicoes
suficientes para que uma funcao entre espacos de Banach seja localmente invertvel. Esse e o importante
Teorema da Funcao Inversa.
Teorema 17.8 (Teorema da Fun
c
ao Inversa) Sejam X e Y dois espacos de Banach e A X um
aberto onde encontra-se definida uma funca
o g : A Y. Seja x0 A e seja g(x0 ) = y0 . Vamos
supor que g seja contnua e diferenci
avel com derivada contnua em A, de forma que a aplicaca
o linear
0
g (x0 ) : X Y tenha inversa limitada. Ent
ao existem um aberto B Y contendo y 0 e uma funca
o
h : B X, contnua e diferenci
avel, tal que h(y0 ) = x0 e g(h(y)) = y para todo y B. Vale tambem

1
h0 (y) = g 0 (h(y)) .
2
Prova. Defina-se F : Y A Y por F (y, x) = g(x) y. Teremos D1 F (y, x) = Y e D2 F (y, x) =
g 0 (x). Assim, F e diferenciavel com derivada contnua. Verifica-se que F (y0 , x0 ) = 0 e, por hipotese,
D2 F (y0 , x0 ) = g 0 (x0 ) tem inversa limitada. Portanto, vale para F o Teorema da Funcao Implcita, que
nos garante a existencia de um aberto B Y contendo y0 e uma funcao h : B X tal que h(y0 ) = x0
e tal que para todo y B vale F (y, h(y)) = 0. Essa u
ltima expressao significa que g(h(y)) y = 0,

1
que e o que queramos provar. h e contnua e diferenciavel e, por (17.48), vale h 0 (y) = g 0 (h(y)) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 17

913/1304

Ap
endices
17.A

O Lema de Gr
onwall

O Lema de Gronwall18 , que apresentamos abaixo, e de demonstracao muito simples mas possui varias
aplicacoes na teoria das equacoes diferenciais ordinarias ou parciais. Usamo-lo, por exemplo, na demonstracao do Teorema 17.6, pagina 904, teorema esse que, sob hipoteses, estabelece a continuidade
de solucoes de equacoes diferenciais ordinarias em relacao a mudancas nas condicoes iniciais e a deformacoes de parametros.
Lema 17.3 (Lema de Gr
onwall, ou Desigualdade de Gr
onwall) Seja u : [t0 , T ] [0, ),
uma funca
o contnua e n
ao-negativa definida em algum intervalo [t 0 , T ], T > t0 , e suponha que
existam duas constantes 0 e 0 tais que valha
Z t
u(t) +
u( ) d
(17.A.1)
t0

para todo t [t0 , T ]. Ent


ao,
para todo t [t0 , T ].

u(t) e(tt0 )

(17.A.2)
2

A desigualdade (17.A.2) e denominada desigualdade de Gr


onwall. Note que (17.A.2) implica que u
e identicamente nula, caso = 0. Para generalizacoes do Lema de Gronwall, vide [94].
Prova. No caso = 0 as desigualdades (17.A.1)
e (17.A.2) equivalem e nao ha o que se demonstrar,
Rt
Assumamos entao > 0. A funcao v(t) := t0 u( ) d e contnua e diferenciavel e dtd v(t) = u(t). Assim,
a relacao (17.A.1) afirma-nos
que dtd v(t)v(t) . Multiplicando essa expressao por e(tt0 ) ficamos

com dtd e(tt0 ) v(t) e(tt0 ) . Integrando ambos os lados dessa desigualdade
entre t0 e t (sendo


(tt0 )
(tt0 )
t0 t T ) e usando que v(t0 ) = 0, obtem-se e
v(t) 1 e
Multiplicando ambos os
+(tt0 )
lados por e
, obtem-se

 (tt0 )
v(t)
e
1 .
(17.A.3)

A expressao (17.A.1) afirma que u(t) + v(t). Com a desigualdade (17.A.3), segue disso que
u(t) e(tt0 ) , como queramos provar.

18

Thomas Hakon Gr
onwall (1877-1932).

Captulo 18
Espacos Topol
ogicos e Espacos Mensur
aveis.
Definico
es e Propriedades B
asicas
Conte
udo
18.1 Defini
co
es, Propriedades Elementares e Exemplos . . . . . . . . . . . . . . 915
18.2 Algumas Constru
co
es Especiais e Exemplos . . . . . . . . . . . . . . . . . 920
18.2.1 Topologias e -algebras Geradas . . . . . . . . . . . . . . . . . . . . . . . . . 920
18.2.2 Bases de Espacos Topologicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 924
18.2.3 Topologias e -algebras Induzidas . . . . . . . . . . . . . . . . . . . . . . . . 930
18.2.4 Topologias e -algebras Produto . . . . . . . . . . . . . . . . . . . . . . . . . 932
18.3 Interior e Fecho de Conjuntos em Espa
cos Topol
ogicos . . . . . . . . . . . 932
18.3.1 Fecho de Conjuntos em Espacos Metricos . . . . . . . . . . . . . . . . . . . . 936

ntroduziremos neste captulo dois conceitos de importancia fundamental em Matematica, o


conceito de Espaco Topol
ogico e o conceito de Espaco Mensur
avel. O primeiro conceito e
uma generalizacao do conceito de Espaco Metrico, introduzido no Captulo 16, e o segundo
e moldado de forma a permitir uma definicao consistente do conceito intuitivo de medida
(como comprimento, area, volume etc.) de um conjunto. De modo muito simplificado, podemos dizer
que Topologias desempenham um papel quando se faz necessario o emprego de nocoes como as de convergencia e continuidade, enquanto que Espacos Mensuraveis sao especialmente relevantes na teoria da
integracao e na teoria de probabilidades. As nocoes de Espaco Topologico e Espaco Mensuravel penetram areas da Matematica tao variadas quanto a Analise a Analise Funcional a Geometria Diferencial,
a Teoria das Equacoes Diferenciais, a Teoria de Grupos, a Teoria de Probabilidades e outras, atraves
das quais exercem tambem sua influencia sobre praticamente toda a Fsica. Falaremos um pouco mais
sobre o significado e sobre a importancia de cada conceito adiante.
Dado um conjunto X (doravante considerado nao-vazio), denota-se por (X) a colecao de todos
os sub-conjuntos de X. Assim, em smbolos, podemos expressar o fato de um conjunto A ser um
natural que X (X) e convenciona-se que
sub-conjunto de X escrevendo A X ou A (X). E
(X).

Estamos muitas vezes interessados em estudar propriedades de certas colecoes de sub-conjuntos de


X (ou seja de sub-conjuntos de (X)) que possuem certas caractersticas de interesse. Ha dois tipos
de colecoes de sub-conjuntos que merecem particular atencao: as chamadas topologias e as chamadas
-algebras. Vamos a`s definicoes.

914

JCABarata. Curso de Fsica-Matem


atica

18.1

Vers
ao de 29 de setembro de 2005.

Captulo 18

915/1304

Defini
co
es, Propriedades Elementares e Exemplos

Topologia
Uma colecao de subconjuntos de X, ou seja,
seguintes requisitos forem satisfeitos:

(X), e dito ser uma topologia em X se os

1. e X .
2. Se A e B entao A B .
3. Se I e um conjunto arbitrario de ndices e A para todo I entao
elemento de .

A tambem e um

-
algebra
Uma colecao M de subconjuntos de X, ou seja, M (X), e dita ser uma -
algebra em X se os
seguintes requisitos forem satisfeitos:
1. M e X M.
2. Se A M entao Ac = X \ A M.
3. Se {An , n


} e uma colecao enumeravel arbitraria de elementos de M, entao

e um elemento de M.

An tambem

Coment
arios e Nomenclatura
Um conjunto X dotado de uma topologia e dito ser um espaco topol
ogico. De um modo um
pouco mais tecnico, um espaco topol
ogico e um par (X, ) onde X e um conjunto nao-vazio e
(X) e uma topologia em X.
Um conjunto X dotado de uma -algebra M e dito ser um espaco mensur
avel. De um modo um
pouco mais tecnico, um espaco mensur
avel e um par (X, M) onde X e um conjunto nao-vazio e
M (X) e uma -algebra em X.
Ideias relacionadas a` de Topologia ja habitam a Matematica ha muito, mas foi nas duas primeiras
decadas do seculo XX que as mesmas comecaram a ser sistematizadas e abstradas, como resultado
do trabalho de varios indivduos, como Cantor1 , Frechet2 , Riesz3 e Hausdorff4 . A nocao de
1

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).


Maurice Rene Frechet (1878-1973).
3
Frigyes Riesz (1880-1956).
4
Felix Hausdorff (1868-1942). Hausdorff foi um dos criadores da Topologia e da moderna Teoria dos Conjuntos.
Perseguido pelo nacional-socialismo, suicidou-se em 1942 para evitar ser enviado a um campo de concentraca
o.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

916/1304

conjuntos abertos e fechados (na topologia usual da reta real) foi introduzida por Cantor. Frechet
percebeu sua conexao com a nocao de metrica (a qual introduziu). A nocao moderna de Espaco
Topologico foi introduzida pela primeira vez por Hausdorff em 1914. Hausdorff tambem cunhou
a expressao espaco metrico, nocao criada por Frechet em 1906, e foi o primeiro a introduzir a
nocao de medida, entre outras coisas.
A palavra algebra na designacao -algebra tem origem historica em uma analogia observada
por Felix Hausdorff entre certas operacoes envolvendo conjuntos, tais como uniao e interseccao
e operacoes algebricas de soma e multiplicacao. Apesar disso o conceito de -algebra nao deve
ser confundido de forma alguma com o conceito usual de a
lgebra (um espaco vetorial com um
produto entre seus elementos). A analogia a que nos referimos e a de que a operacao de uniao de
conjuntos disjuntos pode ser entendida como uma soma de conjuntos com um elemento neutro,
a saber, o conjunto vazio (pois A = A para qualquer conjunto A). O papel de multiplicacao
entre conjuntos seria exercido pela interseccao, onde novamente o conjunto vazio seria o elemento
neutro (pois sempre A = ).

Ainda sobre a nomenclatura, o do nome -algebra e usado em funcao da propriedade 3 da


definicao, que se refere ao fato de -algebras serem fechadas em relacao a operacoes envolvendo
unioes (omas) enumeraveis de conjuntos. Aqui o ponto importante e a enumerabilidade e,
da, usar-se essa nomenclatura com o smbolo em outras areas da matematica onde a enumerabilidade desempenha algum papel (como na topologia chamada de -fraca, por exemplo).

Os subconjuntos A X que sao membros de uma topologia sao chamados de conjuntos abertos
(em relacao a` topologia ). Se um subconjunto F X e tal que F c , entao F e dito ser um
conjunto fechado. Note que ha conjuntos que podem ser simultaneamente abertos e fechados em
relacao a` mesma topologia. Por exemplo, e X sao ao mesmo tempo abertos e fechados (por
que?). Alem destes conjuntos pode haver outros tambem. Veremos exemplos.
Os subconjuntos A X que sao membros de uma -algebra M sao chamados de conjuntos
mensur
aveis (em relacao a` -algebra M). Sera para conjuntos mensuraveis que se definira o
conceito de medida.
Note que, pela definicao, se A1 , . . . , An e uma colecao de n conjuntos abertos de uma topologia
entao A1 An e tambem um conjunto aberto (por que?).
Note que, no item 3 da definicao de topologia, nenhuma restricao e feita em relacao ao conjunto
de ndices I, podendo o mesmo ser ate um conjunto nao-contavel.
Note que se A1 , . . . , An e uma colecao (finita) de n elementos de uma -algebra M entao A1
An e tambem um elemento de M. Para ver[isso note que, se definssemos Am = para todo
Aa que e um elemento de M pelo item 3 da
m > n teramos claramente A1 An =
definicao de -algebra.

Se M e uma -algebra em X e A, B M entao A B M. Isso e facil de ver, pois A B =


(Ac B c )c . Pelo item 2 da definicao de -algebra, Ac e B c sao tambem elementos de M. Pela
observacao acima, sua uniao Ac B c tambem o e. Por fim, o complemento de Ac B c pertence
a M, novamente pelo item 2 da definicao de -algebra.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

917/1304

Au
ltima afirmacao estende-se facilmente para intersec
Tcoes contaveis de conjuntos mensuraveis:
se M e uma -algebra em X e An M, n , entao n An M. Isso segue facilmente de
!c
\
[
An =
(An )c


e dos itens 2 e 3 da definicao de -algebra.


Exemplos b
asicos de topologias
Seja X um conjunto nao-vazio.
Considere o conjunto, formado por apenas dois elementos, dado por = {, X}. Entao e
chamada de topologia indiscreta ou trivial e e a menor topologia
uma topologia (verifique!). E
que se pode formar em X.
Seja a colecao e todos os subconjuntos de X: = (X). Entao e uma topologia (verifique!).
chamada de topologia discreta e e a maior topologia que se pode formar em X. Pelo Exerccio
E
E. 16.20, pagina 846, (X) e uma topologia metrica.
Seja X um espaco metrico com uma metrica d e seja d o colecao de todos os seus subconjuntos
abertos em relacao a d. Um subconjunto A de X e dito ser aberto (em relacao a` metrica d) se tiver
a seguinte propriedade: para todo x A podemos achar um n
umero real (x) > 0 (eventualmente
0
dependente de x) tal que para todo x X com a propriedade que d(x, x0 ) < (x) (ou seja, que
dista de x menos que (x)) vale que x0 tambem e um elemento de A. Entao, conforme ja vimos
vimos em exerccios na Secao 16.2, pagina 845, d e, de fato, uma topologia, chamada de topologia
induzida pela metrica d.
No caso do conjunto dos reais, podemos introduzir a topologia metrica definida pela metrica
d(x, y) = |x y|. Essa topologia e denominada de topologia usual da reta e para designa-la usaremos aqui o smbolo . Esse nome e auto-explicativo: quase toda a Analise Real e feita com o uso
dessa topologia. Conforme o costume de toda a literatura, sempre que falarmos de uma topologia
nos reais pensaremos nessa topologia usual, salvo mencao explcita em contrario. Fique claro porem
que sobre os n
umeros reais podem ser definidas outras topologias alem (e da topologia trivial e da
topologia discreta). Exemplos serao vistos adiante.


E. 18.1 Exerccio. Mostre, seguindo as definicoes, que todo intervalo (a, b) com a < b
elemento de e que todo intervalo [a, b] com a b e um conjunto fechado em relacao a .


e um
6

Exemplos b
asicos de -
algebras
Seja X um conjunto nao-vazio.
Considere M o conjunto, formado por apenas dois elementos, dado por M = {, X}. Entao M
e uma -algebra (verifique!) e e a menor -algebra que se pode formar em X. Essa -algebra e
chamada de -algebra indiscreta ou trivial.

JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

918/1304

Seja M a colecao e todos os subconjuntos de X: M = (X). Entao M e uma -algebra (verifique!)


e e a maior -algebra que se pode formar em X. Essa -algebra e chamada de -algebra discreta.
Seja X um conjunto e A X. Entao a colecao M = {, A, Ac , X} e uma -algebra (verifique!).
Outros exemplos menos triviais de -algebras serao vistos adiante. Exemplos realmente interessantes
de -algebras requerem construcoes elaboradas, como a da -algebra de Lebesgue 5 , a qual trataremos
com certo detalhe no Captulo 20.
E. 18.2 Exerccio. Sejam , e tres objetos distintos (por exemplo, tres letras distintas do alfabeto
grego). Mostre que


M = , {, }, {}, {, , }
e uma -algebra em X = {, , }.

E. 18.3 Exerccio. Sejam , e tres objetos distintos (por exemplo, tres letras distintas do alfabeto
grego). Mostre que


M = , {}, {}, {}, {, }, {, }, {, }, {, , }
e uma -algebra em X = {, , }.

Abertos e Fechados
Sejam X um conjunto e uma topologia em X. Denotemos por F( ) a colecao de todos os conjuntos
fechados de X em relacao a` , ou seja, a colecao de todos os conjuntos F de X tais que F c e um aberto,
ou seja, um elemento de .
muito importante o estudante notar que F( ) pode conter elementos que n
E
ao sao elementos de .
Porem F( ) e nunca sao conjuntos disjuntos, pois ambos sempre tem elementos em comum. Sempre
se tem, por exemplo, que {, X} F( ) .
E. 18.4 Exerccio. Mostre que se F( ) entao F( ) = .

E. 18.5 Exerccio. Mostre que se F( ) entao = F( ).

Exemplos de topologias onde = F( ) sao a topologia trivial e a topologia discreta (por que?). Ha,
porem, muitos outros exemplos, como mostra o proximo exerccio.
E. 18.6 Exerccio. Seja a reta real e X o seguinte subconjunto de : X = (0, 1) (1, 2). Mostre
que a colecao de subconjuntos de X dada por = {, (0, 1), (1, 2), X} e uma topologia em X e que
F( ) = . Note que nao e nem a topologia trivial nem a discreta de X.
6


Henri Leon Lebesgue (1875-1941).

JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

919/1304

A colecao F( ) de todos os conjuntos fechados em relacao a uma topologia em X possui uma


serie de propriedades especiais:
1. F( ) e X F( ).
2. Se F F( ) e G F( ) entao F G F( ).
3. Se I e um conjunto arbitrario de ndices e F F( ) para todo I entao
elemento de F( ).

F tambem e um

E. 18.7 Exerccio muito importante. Justifique as afirmativas acima.

E. 18.8 Exerccio. Sejam as seguintes colecoes de conjuntos fechados na reta real (na topologia usual):
{Fn = \
[1/n, 1 + 1/n], n , n > 0} e {Gn = [1/n,
[ 1 1/n], n , n > 1}. Mostre explicitamente
[
Fn e um conjunto fechado mas que
Gn e um conjunto aberto. Note que
Gn
que


n , n>0


n , n>1

n , n>1

nao e uma uniao finita!

Seja agora (reciprocamente) uma colecao F de subconjuntos de um conjunto X tal que as seguintes
condicoes (que chamaremos de axiomas de conjuntos fechados) sao verdadeiras:
1. F e X F.
2. Se F F e G F entao F G F.
3. Se I e um conjunto arbitrario de ndices e F F para todo I entao
elemento de F.

F tambem e um

Entao, a colecao (F) = {A X, tais que Ac F} e uma topologia em X.


E. 18.9 Exerccio muito importante. Justifique essa u
ltima afirmativa.

Mais Exemplos de Topologias: a Topologia Co-cont


avel e a Co-finita
Vamos ilustrar o que acabamos de ver com dois exemplos (importantes, pois deles se extraem alguns
exemplos e contra-exemplos de propriedades de topologias, como veremos adiante).
Seja X um conjunto e Cc a colecao de todos os conjuntos contaveis de X. Entao vamos mostrar
que a colecao C = {, X} Cc satisfaz os axiomas de conjuntos fechados.

As propriedades que C e X C sao obvias por definicao. Se F e G sao elementos de C entao


F G tambem e um elemento de C, basicamente pois a uniao de dois conjuntos contaveis e tambem um
conjunto contavel. Finalmente a interseccao arbitraria de conjuntos contaveis e tambem um conjunto
contavel (pois, como vimos acima, qualquer subconjunto de um conjunto contavel tambem e contavel)
e, com isso, fica tambem verificado o axioma 3.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

920/1304

Com isso, e com o que dissemos anteriormente, vemos que a colecao (C) e uma topologia em X.
Todo elemento de (C) e entao , X ou da forma X \ C, onde C e um conjunto contavel. Chamaremos
a topologia cc (C) de topologia co-cont
avel de X.
E. 18.10 Exerccio. Seja X um conjunto e cf a colecao
cf = {A X, A = X \ U onde U X e um conjunto finito} {}.
Mostre que cf e uma topologia em X (chamada de topologia co-finita de X). Como sao os conjuntos
fechados em relacao a cf ?
6
E. 18.11 Exerccio. Verifique que cf cc . Para que tipo de conjunto X podemos ter cf = cc ?

A topologia co-contavel tem a seguinte propriedade incomum. Sejam A e B dois abertos nao vazios
quaisquer da topologia co-contavel de um conjunto X e suponha que X nao seja um conjunto contavel.
Entao AB sempre e um conjunto nao vazio. Para provar isso, notemos que, pelas hipoteses, A = X \C 1
e B = X \ C2 , para dois subconjuntos contaveis C1 e C2 de X. Da, A B = (X \ C1 ) (X \ C2 ) =
C1c C2c = (C1 C2 )c . Agora, como C1 C2 e tambem um conjunto contavel, seu complemento e nao
vazio pois X nao e contavel.
Assim, provamos que dois abertos nao-vazios quaisquer da topologia co-contavel de um conjunto
nao contavel (como, por exemplo, o conjunto dos reais) sempre se interceptam. Como veremos, isso
significa que tais espacos topologicos nao sao do tipo Hausdorff (a definicao de espaco Hausdorff vira
a` pagina 980).
Sejam A e B dois abertos nao vazios quaisquer da topologia co-finita de um
E. 18.12 Exerccio.
conjunto X e suponha que X nao seja um conjunto finito. Mostre, entao, que A B sempre e um conjunto
nao vazio.
6

18.2

Algumas Constru
co
es Especiais e Exemplos

18.2.1

Topologias e -
algebras Geradas

A No
c
ao de Topologia Gerada
Vamos agora discutir um metodo importante de gerar topologias e -algebras.
Seja X um conjunto e { , I} uma colecao de topologias em X (cada uma indexada por um
elemento de um conjunto de ndices I arbitrario). Como cada topologia e por si um subconjunto de
(X), podemos considerar unioes e interseccoes de topologias.
Em particular para uma colecao generica de topologias como { , I}, temos o seguinte resultado
importante:
\
Proposi
c
ao 18.1 O subconjunto I de (X) dado por I =
e tambem uma topologia em X. 2
I

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

921/1304

Prova. Em primeiro lugar e claro pelas definicoes que I e que X I .

Vamos agora mostrar que se A e B sao elementos de I entao A B tambem o e. Para tal, note que
se A e B sao elementos de I entao A e B sao elementos de toda topologia com I. Assim, como
para cada particular tem-se A e B , segue que A B (pois e uma topologia). Assim,
mostramos que A B pertence a toda topologia com I e, portanto, A B I .

Por fim, temos que provar que se {A , [J} e uma colecao de elementos de I (onde J e uma
colecao arbitraria de ndices), entao segue que
A e tambem um elemento de I .
J

Para tal, note-se que se {A , J} e uma colec[


ao de elementos de I entao cada A e um elemento
de cada . Da, para cada particular segue que
A e tambem um elemento de (pois e uma
J

topologia). Como isso vale para todo I, segue que

A I , como queramos provar.

Este resultado tem um uso de grande importancia: fornecer um metodo de gerar topologias. Seja A
uma colecao qualquer de subconjuntos de X. Considere a colecao de todas as topologias que contem A
como um subconjunto. Como vimos, a interseccao de todas essas topologias e tambem uma topologia
que denotaremos por [A]. A topologia [A] e chamada de topologia gerada por A.
Assim, cada colecao A de subconjuntos de um conjunto X tem automaticamente uma topologia
associada a si: a topologia gerada pela colecao. Muitas topologias podem ser produzidas dessa forma,
como sendo geradas por uma colecao conveniente de subconjuntos de X.
Mostre que A [A] e que [A] e a menor topologia que contem A como
E. 18.13 Exerccio.
subconjunto, ou seja, se houver uma topologia 0 [A] que contem A, entao 0 = [A].
6
E. 18.14 Exerccio. Mostre que se A e uma topologia entao [A] = A.

E. 18.15 Exerccio. Seja X um conjunto e A X. Mostre que [{A}] = {, A, X}.

E. 18.16 Exerccio. Seja X um conjunto e A = {{x}, x X} a colecao de subconjuntos de X


formada apenas por todos os conjuntos de um elemento de X. Mostre entao que [A] e a topologia discreta
de X. Sugestao: use o item 3 da definicao de topologia para mostrar que todo subconjunto de X e um
elemento de [A].
6
E. 18.17 Exerccio. Seja X um conjunto e A = {{x, y}, x, y X e x 6= y} a colecao de subconjuntos
de X formada apenas por todos os conjuntos de dois elementos distintos de X. Mostre entao que [A] e a
topologia discreta de X.
6
O metodo de gerar topologias descrito acima e muito usado e sera reencontrado adiante em outros
exemplos.
Mais Sobre a Topologia Usual de


JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

922/1304

Ja definimos a topologia usual da reta como sendo a topologia induzida pela metrica d(x, y) =
|y x|. Vamos mostrar aqui que ha uma outra caracterizacao da mesma topologia.

Seja A a colecao de todos os intervalos abertos (a, b) de com a < b. Vamos provar que = [A],
ou seja, que a topologia usual e identica a` topologia gerada pela colecao de todos os intervalos abertos
de .


Ja sabemos que A , pois todo intervalo do tipo (a, b), a < b, e aberto de . Como por
definicao [A] e a menor topologia que contem A, tem-se que [A] . Tudo o que precisamos fazer,
entao, e provar que [A].


Seja 0 uma topologia qualquer que contenha A. Isso significa que unioes arbitrarias de elementos
de A sao tambem elementos de 0 (pois 0 e uma topologia e pelo item 3 da definicao de topologia).
Se B e um elemento de isso significa que para cada x B existe (x) > 0 tal que y B desde que
|y x| < (x). Nao e difcil ver entao que isso significa que podemos escrever
[
B =
(x (x), x + (x)).


xB

Como todo intervalo do tipo (x (x), x + (x)) e um elemento de A, segue que B 0 . Como isso
vale para todo B isso significa que 0 . Esse u
ltimo fato vale, porem, para qualquer que seja
a topologia 0 , desde que contenha a colecao A. Portanto, conclu-se que [A], como queramos
mostrar.


A Topologia de Sorgenfrey de


Seja S a colecao de todos os intervalos semi-abertos de


do tipo [a, b) com a < b, a, b
topologia [S] e denominada topologia de Sorgenfrey6 dos reais.


. A

E. 18.18 Exerccio. Mostre que e um subconjunto proprio de [S]. Sugestao: mostre que todo
intervalo aberto (a, b), a < b, e um elemento de [S] e conclua a partir da que [S]. Para ver que
[S] \ nao e vazio, note apenas que um um intervalo semiaberto [a, b), a < b e um elemento de [S],
mas nao de .
6


Note ainda que [S] e menor que a topologia discreta


nao sao elementos de [S].

( ) pois intervalos fechados [a, b], a b




E. 18.19 Exerccio. Justifique esta u


ltima afirmativa.
Assim, vimos nos dois u
ltimos exerccios que
proprias.


[S]

6
( ), onde todas essas inclusoes sao


A topologia [S] e rica em conjuntos que sao simultaneamente abertos e fechados.


E. 18.20 Exerccio. Mostre que na topologia de Sorgenfrey de
a < b e simultaneamente aberto e fechado.
6

Robert Sorgenfrey (1915 - 1996).

todo intervalo do tipo [a, b) com


6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

923/1304

E. 18.21 Exerccio. O u
ltimo exerccio inspira a seguinte questao. Sera que em [S] todo conjunto aberto
e tambem fechado? Verifique que isso nao e verdade mostrando que o conjunto A = (, a) (b, ),
com a b, e aberto segundo [S] mas que seu complemento A c = [a, b] nao e aberto segundo [S].
6

A No
c
ao de -Algebra
Gerada
O metodo de construcao de topologias descrito acima tem um analogo quase literal entre as algebras.
Seja X um conjunto e {M , I} uma colecao de -algebras em X (cada uma indexada por um
elemento de um conjunto de ndices I arbitrario). Como cada -algebra e por si um subconjunto de
(X) podemos considerar unioes e interseccoes de -algebras.
Em particular, para uma colecao generica de -algebras como {M , I}, temos o seguinte
resultado importante:
\
Proposi
c
ao 18.2 O subconjunto MI de (X) dado por MI =
M e tambem uma -
algebra em X.
I

Prova. Em primeiro lugar e claro pelas definicoes que MI e que X MI .

Vamos agora mostrar que se A X e um elemento de MI entao Ac = X \ A tambem o e. Se


A MI entao A M para todo I e, portanto Ac M para todo I pois cada M e uma
-algebra. Assim, segue que Ac MI .
[
An
Por fim, vamos provar que se {An , n } e uma colecao contavel de elementos de MI entao


tambem o e. Se {An , n } e uma colecao contavel de [


elementos de MI entao cada An pertence a
cada M e, portanto, para cada particular segue que
An tambem e um elemento de M . Da


segue imediatamente que

An MI , que e o que queramos provar.

Este resultado tem um uso de grande importancia: fornecer um metodo de gerar -algebras. Seja A
uma colecao qualquer de subconjuntos de X. Considere a colecao de todas as -algebras que contem A
como um subconjunto. Como vimos, a interseccao de todas essas -algebras e tambem uma -algebra
que denotaremos por M[A]. A -algebra M[A] e chamada de -
algebra gerada por A.
Assim, cada colecao A de subconjuntos de um conjunto X tem automaticamente uma -algebra
associada a si: a -algebra gerada pela colecao. Muitas -algebras podem ser produzidas dessa forma,
como sendo geradas por uma colecao conveniente de subconjuntos de X.
E. 18.22 Exerccio. Mostre que A M[A] e que M[A] e a menor -algebra que contem A como
subconjunto, ou seja, se houver uma -algebra M0 M[A] que contem A, entao M0 = M[A].
6
E. 18.23 Exerccio. Mostre que se A e uma -algebra entao M[A] = A.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

924/1304

A -
algebra de Borel
Dentre os muitos tipos de -algebras existentes particular destaque tem as -algebras geradas por
topologias.
Seja X um conjunto e uma topologia em X. Como e uma colecao de subconjuntos de X podemos
considerar a -algebra M[ ] gerada pela topologia . Essa -algebra e chamada de -
algebra de Borel 7
associada a` topologia em X e seus elementos sao chamados de conjuntos de Borel ou Borelianos.
E. 18.24 Exerccio. Considere a reta real . Mostre que intervalos como (a, b), [a, b), (a, b] com
a < b e [a, b] com a b sao elementos da -algebra de Borel M[ ]. Que outros elementos de M[ ] voce
poderia identificar?
6


Como veremos, as -algebras de Borel desempenham um papel importante na Teoria da Medida.

18.2.2

Bases de Espa
cos Topol
ogicos

Base de uma Topologia


Seja X um espaco com uma topologia . Uma colecao de abertos B e dita ser uma base da
topologia
[ se todo aberto de puder ser escrito como uniao de elementos de B: se A entao
A=
B , onde todos os B sao elementos de B. Note que a uniao nao necessita ser finita ou mesmo

contavel.

Um fato basico e o seguinte: se B e uma base de uma topologia entao = [B].


Provar isso e bem simples. Primeiramente note-se que, como e uma topologia que contem B e
[B] e, por definicao, a menor topologia com essa propriedade, entao segue que [B] . Por outro
lado, como vimos, se A entao A e a uniao de elementos de B e, portanto, A e um elemento de [B].
Logo [B], completando a prova.

Para evitar confusoes e ao mesmo tempo clarificar ideias, o estudante deve notar, porem, o seguinte
fato. Se A e uma colecao de subconjuntos de um conjunto X entao nao e em geral verdade que A ou
mesmo A X sejam uma base de [A]. Tome-se o seguinte exemplo: X = e A = {(i/2, i/2 + 1), i
}. Entao o intervalo (1/2, 1) e um elemento de [A] pois e interseccao dos intervalos (0, 1) e
(1/2, 3/2) mas nao pode ser escrito como uniao de elementos de A.


E. 18.25 Exerccio.
Seja X um espaco metrico e B a colecao de todas as bolas abertas de X:
{B(x, r), x X, r > 0}. Mostre que B e uma base da topologia metrica de X.
6
Produzindo Bases de Topologias
A discussao do u
ltimo paragrafo pode ser usada para introduzir e motivar mais um modo importante
de se produzir bases de topologias, o qual sera usado quando discutirmos o conceito de topologia gerada
7

Felix Edouard
Justin Emile
Borel (1871-1956).

JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

925/1304

por famlias de funcoes, um topico importante, por exemplo, em estudos mais avancados de propriedades
de espacos de Banach e de Hilbert.
Como ja vimos, se X e um conjunto e A e uma colecao arbitraria de subconjuntos de X nao podemos
em geral garantir que A e uma base de [A]. Ha, porem, uma maneira de se produzir uma base a partir
de A que discutiremos a seguir.
Considere a colecao AI formada por todos os conjuntos que podem ser escritos como um intersecca
o
finita de elementos de A X . Ou seja, A X pertence a AI se puder ser escrito da forma
A = B1 B2 Bn , para algum n finito, onde cada Bi ou e igual a X ou ou e um elemento de A.
claro pela definicao que A AI (por que?) e tambem que AI [A] (por que?). Assim, temos
E
que A AI [A].

Notemos agora que se B e C sao duas colecoes de subconjuntos de X com B C, entao [B] [C]
(por que?).

Da segue, pelo que vimos, que [A] [AI ] [ [A]]. Como [A] e uma topologia temos, por
um exerccio anterior que [ [A]] = [A]. Assim, provamos que [A] = [AI ] e vamos agora explorar
conseq
uencias desse fato.
Vamos mostrar que AI e uma base de [AI ] e, portanto, de [A].
Para isso consideremos a colecao U formada por todas as possveis unioes de elementos de A I : se
A U entao
[
A =
A ,

com A AI para todo .

Vamos agora provar que U e uma topologia em X.

claro tambem que unioes arbitrarias


Pela definicao e claro que U e que X U (por que?). E
de elementos de U sao novamente elementos de U . Resta-nos provar que se A e B sao elementos de U
entao A B tambem o e.
Sejam entao A e B da forma

A =

A ,

B =

B ,

onde todo A e todo B sao elementos de AI . Note que podemos acima, sem perda de generalidade,
usar o mesmo conjunto de ndices tanto para A quanto para B, pois podemos fazer alguns A e/ou
alguns B iguais ao conjunto vazio se necessario, de modo a igualar ambos os conjuntos de ndices.
Com isso temos, entao, que
AB =

B 0

, 0

(A B0 ) ,

que claramente e um elemento de U , pois os conjuntos A B0 sao elementos de AI .

Dado que provamos que U e uma topologia, vamos ver as conseq


uencias desse fato. Em primeiro
lugar, e claro pela definicao de U que AI U . Como U e uma topologia, segue que [AI ] U .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

926/1304

Por outro lado, temos tambem que os elementos de U sao unioes de elementos de A I e, portanto,
sao elementos de qualquer topologia que contenha AI , como, em particular, a topologia [AI ]. Assim,
U [AI ]. Com isso, vimos que [A] = [AI ] = U . Pela definicao de U , isso diz que todos os elementos
de [A] podem ser escritos como unioes de elementos de AI e, assim, fica provado que AI e uma base
para [A].
Espa
cos Topol
ogicos Separ
aveis e Espa
cos Topol
ogicos Segundo-Cont
aveis
Seja um espaco X dotado de uma topologia . Dizemos que um conjunto A X e denso em X se
o fecho de A for igual a X, ou seja, se nao houver outro conjunto fechado que nao X contendo A.
Um espaco topologico X e dito ser separ
avel se possuir um subconjunto denso contavel.
Exemplo. A reta real com a topologia usual e separavel pois
e denso em . Vide abaixo.

, o conjunto dos racionais e contavel

Um espaco topologico X e dito ser segundo-cont


avel (second countable) se possuir uma base
contavel.
Pelo que vimos, se A for uma colecao contavel de subconjuntos de X entao a topologia gerada por
A possui uma base tambem contavel e e, portanto, segundo-contavel.
Vamos mostrar a seguinte afirmativa:
Proposi
c
ao 18.3 Todo espaco segundo-cont
avel e separ
avel.

Prova. Seja X segundo-contavel e Bn , n , uma base em X . Vamos formar conjuntos An , n ,


da seguinte forma: A0 e formado por um elemento escolhido arbitrariamente em B0 e[
An , n 1, e
formado por um elemento escolhido arbitrariamente em Bn \ A0 An1 . Seja A :=
An . Vamos


mostrar que A e denso em X. Suponha que haja um conjunto fechado F que contem A e que seja
menor que X. Entao C = X \ F e aberto e A C = . Ou seja, An C = para todo n. Isso significa
que Bn C = para todo n (por que?). Mas isso nao e possvel se os Bn s formam uma base e C e
aberto, pois nesse caso deve haver uma sub-colecao contavel de Bn s cuja uniao e C. Logo A e denso
em X.
interessante notar que a recproca do proposicao acima nao e verdadeira: ha espacos separaveis
E
que nao sao segundo-contaveis. Como exemplo, mostraremos que a topologia de Sorgenfrey e separavel
mas nao e segundo-contavel (pagina 929). Tal, porem, nao e verdade para espacos metricos em geral.
Proposi
c
ao 18.4 Um espaco metrico e separ
avel se e somente se for segundo-cont
avel.

Prova. Pela proposicao anterior resta-nos apenas mostrar que se X e um espaco metrico separavel entao
tem uma base enumeravel. Seja A um conjunto contavel denso em X e seja o conjunto de todas as
bolas centradas em elementos de A com raio racional positivo: B(a, r), a A e r + . O colecao de
todas essas bolas e contavel (por que?). Vamos provar que e uma base em X. Seja C um aberto contido
em X. Para cada ponto a em A C podemos achar um raio ra tal que B(a, ra ) esta inteiramente

JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

927/1304

contido em C (pela definicao de conjunto aberto em um espaco metrico). Vamos mostrar que
[
C =
B(a, ra ).
aCA

S
Suponha que haja z C que nao esteja em aCA B(a, ra ). Como A e denso em X, toda bola
aberta B(z, ) contem elementos de A (doutra forma seu complemento seria fechado e conteria A, o
que nao e possvel se A e denso). Em particular se  for suficientemente pequeno B(z, ) e B(z, /4)
estarao inteiramente contidas em C. Logo, para um racional r com /4 < r < /2 teremos z B(a 0 , r)
0
para algum a0 B(z, /4) A sendo que B(a0 , r) B(z, ) C. Lembrando que
S a C A e que
0
0
0
podemos escolher /2 < ra0 , teremos B(a , r) B(a , ra0 ). Assim, z B(a , r) aCA B(a, ra ).

A Topologia
e Separ
avel


Vamos mostrar que e separavel mostrando explicitamente que e segundo-contavel e para isso
vamos mostrar que pode ser gerada por uma colecao contavel de subconjuntos de . Esse fato e
importante por varias razoes, uma delas conectada a` -algebra de Borel e sua relacao com a -algebra
de Lebesgue, que introduziremos quando falarmos da Teoria da Medida (vide Captulo 20).


Para a e b > 0 vamos denotar por B(a, b) a bola aberta de raio b centrada em a que, neste
caso, e o intervalo aberto (a b, a + b) centrado em a com largura 2b.


Vamos primeiramente ver que qualquer intervalo B(a, b), a , b > 0, pode ser escrito como
uma uniao contavel de intervalos abertos. Para isso considere uma seq
uencia s i de n
umeros racionais
positivos tais que si < b mas tais que a seq
uencia si converge a b quando i . Entao e claro que
[
B(a, b) =
B(a, si ),


que e uma uniao contavel.


Pela definicao, se A e um aberto nao-vazio em , A 6= , entao para cada x A podemos encontrar
um n
umero (x) > 0 (que eventualmente depende de x) de forma que B(x, (x)) A. Para A aberto
e x A vamos denotar por A (x) o maior n
umero com essa propriedade, ou seja,


A (x) = sup{b > 0, tal que B(x, b) A}.


Como A 6= , A (x) e sempre finito para x A. (Por que?).
bem claro entao que
E
[
A =
B(x, A (x)).


xA

E. 18.26 Exerccio. Por que?

Vamos provar a seguinte afirmativa:


A =

rA

B(r, A (r)).

JCABarata. Curso de Fsica-Matem


atica

Para tal, seja

Vers
ao de 29 de setembro de 2005.

A0 =

Captulo 18

928/1304

B(r, A (r)),

rA

suponha que A \ A0 6= e seja w A \ A0 . Considere entao o conjunto aberto B(w, A (w)). Tomemos
s B(w, A (w)) de tal forma que |s w| < A (w)/2 (isso e sempre possvel. Por que?). Entao
teremos que A (w)/2 < A (s) < A (w) e, portanto w B(s, A (s)), mostrando que w A0 : um
contradicao. Portanto A = A0 .
Caso A =


podemos sempre escrever


=


B(r, p),

para qualquer p > 0.


O que acabamos de provar e que todo aberto nao vazio A de pode ser escrito como uma uniao
contavel de intervalos abertos. Por outro lado, vimos tambem que cada intervalo aberto B(r, A (r))
pode ser escrito ele mesmo como uma uniao contavel de intervalos abertos do tipo B(r, s) onde r e
s > 0 sao n
umeros racionais.


Seja R a colecao de todos os intervalos abertos do tipo B(r, s) com r, s e s > 0. A colecao R
e claramente uma colecao contavel e R (pois todos esses intervalos sao abertos). Logo [R] ,
pois [R] e, por definicao, a menor topologia que contem R. Por outro lado, qualquer topologia que
contenha R contem tambem qualquer elemento que possa ser escrito como uniao de elementos de R
e, como vimos, todo aberto de pode ser escrito como uma uniao (contavel) de elementos de R e e,
conseq
uentemente, um elemento de qualquer topologia que contenha R. Logo [R].


Vemos, portanto, que

= [R]


e, assim, e o que se chama de uma topologia segundo-contavel, pois tem uma base contavel obtida
tomando-se interseccoes finitas de elementos de R, como vimos acima.


Para finalizar, vamos mostrar a seguinte identidade:


M[ ] = M[R],

(18.1)

ou seja, vamos mostrar que a -algebra de Borel da reta real e a -algebra gerada por R coincidem.
Como R , e claro que R M[ ]. Da segue que M[R] M[ ], dado que M[R] e, por
definicao, a menor -algebra que contem R. Por outro lado, M[R] contem (pela definicao de -algebra)
qualquer conjunto que seja uma uniao contavel de elementos de R. Vimos acima que qualquer elemento
de tem essa propriedade. Logo M[R] e, assim, M[ ] M[R], provando que M[ ] = M[R].


Os fatos aqui discutidos serao importantes quando apresentarmos a chamada -algebra de Lebesgue
no Captulo 20.

A Topologia de Sorgenfrey n
ao
e uma Topologia M
etrica
Mostraremos agora que a Topologia de Sorgenfrey e separavel mas nao e segundo-contavel e, portanto, nao e metrica.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

929/1304

Para mostrar que a topologia de Sorgenfrey [S] e separavel, provemos que e denso em segundo
[S]. Suponha que nao seja. Entao existiria z e aberto em [S] contendo z que nao contem nenhum
n
umero racional. Como um tal aberto e uniao de interseccoes finitas de intervalos semi-abertos de S,
isso e impossvel.


Vamos agora mostrar que [S] nao e segundo-contavel. Suponhamos que B seja uma base para [S]
e seja x . Pela hipotese existe um subconjunto B0 = {B , } de B tal que
[
[S] 3 [x, ) =
B ,


com B B0 . Mas isso so e possvel se existir pelo menos um conjunto de B0 que contem x. Denotemo claro que B(x) nao pode conter nenhum y com y < x (por que?). Logo, a aplicacao
lo B(x) . E
3 x 7 B(x) B e injetora, o que nos diz que a cardinalidade de B e pelo menos a cardinalidade de
. Isso mostra que B nao pode ser contavel.


Como vimos acima (pagina 926), um espaco metrico e separavel se e somente se for segundo-contavel.
Isso mostra que a topologia de Sorgenfrey nao e uma topologia metrica!
A Topologia Gerada por um Ordenamento Total
Seja X um conjunto no qual esta definida uma relacao de ordem total . Se a, b X dizemos
que a < b se a b mas a 6= b. Fixados a, b X com a < b definamos
(a, b) := {x X| a < x e x < b},
(a, ) := {x X| a < x},
(, b) := {x X| x < b}.
Seja A a colecao
com

A := Alim A A ,
Alim := {(a, b), para todos a, b X com a < b} ,
A := {(a, ), para todo a X} ,
A := {(, b), para todo b X} .

A topologia [A] e denominada topologia gerada pelo ordenamento total .


E. 18.27 Exerccio. Mostre que a topologia gerada pelo ordenamento usual da reta real coincide com a
topologia usual da reta.
6
E. 18.28 Exerccio. Mostre que a topologia gerada pelo ordenamento lexicografico de
32) e uma topologia Hausdorff.

2


(vide pagina
6

JCABarata. Curso de Fsica-Matem


atica

18.2.3

Vers
ao de 29 de setembro de 2005.

Captulo 18

930/1304

Topologias e -
algebras Induzidas

A Topologia Induzida (ou Relativa)


Vamos agora estudar mais uma maneira de produzir topologias que tambem tem seu analogo para
as -algebras.
Seja X um conjunto e uma topologia em X. Seja tambem Y um subconjunto arbitrario de X
(Y nao precisa ser um elemento de ). Podemos construir uma topologia no conjunto Y usando a
topologia de X da seguinte forma. Definimos a seguinte colecao Y de subconjuntos de Y :
Y = {A Y, tal que A = Y T para algum T }.
Em palavras, Y e formado por todos os subconjuntos de Y que podem ser escritos como interseccao
de Y com algum aberto de .
Entao afirmamos que Y e uma topologia em Y . Vamos provar isso. Primeiro e claro que Y
pois = Y e . Em segundo lugar e tambem claro que Y Y pois Y = Y X (dado que
Y X) e X .

Vamos entao agora mostrar que se A e B Y entao A B Y . Para isso note que, como
A e B Y entao existem A0 e B 0 de forma que A Y A0 e B Y B 0 . Logo A B =
(Y A0 ) (Y B 0 ) = Y (A0 B 0 ) (por que?) e, como A0 B 0 , segue que A B Y .

Para finalizar, falta-nos mostrar que se {A , [


I} e uma colecao de elementos de Y (indexados
A Y . Pelas hipoteses, cada A e da forma
por um conjunto arbitrario de ndices I), entao
I

A = Y T com T e portanto
[

Assim, como

A =

(Y T ) = Y

T fica provado que

(por que?).

A Y como queramos demonstrar.

Vimos entao que Y e uma topologia em Y . Essa topologia e chamada de topologia induzida (pela
topologia ).
E. 18.29 Exerccio. Verifique que, usando a mesma notacao usada acima, X = .

E. 18.30 Exerccio. Seja Y = [0, 1] e seja a topologia usual de . Mostre que conjuntos da
forma [0, x) com 0 < x 1 sao abertos na topologia Y induzida em Y por . Mostre que conjuntos da
forma (x, 1] com 0 x < 1 sao abertos na topologia Y induzida em Y por .
6


Para o estudante e importante ver que, no exerccio acima, nem [0, x) nem (x, 1] sao abertos em
! Isso mostra que topologias induzidas podem trazer elementos novos ao jogo.


E. 18.31 Exerccio. Mostre que a topologia Y do exerccio anterior e igual `a topologia induzida em Y
pela metrica d(x, y) = |y x|.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

E. 18.32 Exerccio. Seja Y = e seja a topologia induzida em


conjunto de um elemento {r} com r e um conjunto fechado segundo .


931/1304

por . Mostre que todo


6


Essa topologia do u
ltimo exerccio tem propriedades curiosas. Seja x um n
umero irracional e
seja o conjunto = (, x) . Entao e ao mesmo tempo aberto e fechado em . O fato
que e aberto e evidente pois (, x) e aberto em . O fato que e fechado segue da constatacao
que o complemento de em e o conjunto c = [x, ) e que [x, ) = (x, ) pois x e
irracional. Assim, c e aberto em pois (x, ) e aberto em . Logo , que e o complemento de c
nos racionais, e fechado por .


E. 18.33 Exerccio. Seja Y =

e seja a topologia induzida em


por . Mostre que o
intervalo aberto de racionais {x , e < x < } e um conjunto aberto e fechado em .
6


Seja X um conjunto com uma topologia e considere Y X e a topologia


E. 18.34 Exerccio.
induzida por em Y : Y . Considere agora um terceiro conjunto Z com Z Y X. Podemos, em
princpio, construir duas topologias induzidas em Z: 1) a topologia induzida por em Z e 2) a topologia
induzida por Y em Z. Mostre que essas topologias sao na verdade identicas.
6
E. 18.35 Exerccio. Seja Y = (0, 1) (1, 2) munido da topologia Y induzida pela topologia .
Mostre que os subconjuntos (0, 1) e (1, 2) sao ambos simultaneamente abertos e fechados nessa topologia
Y .
6


A -Algebra
Induzida
Seja X um conjunto e seja M uma -algebra em X. Seja tambem Y um subconjunto generico de
X. Podemos fazer de Y um espaco mensuravel construindo com o auxlio de M uma -algebra entre
os subconjuntos de Y . A construcao a analoga a`quela da topologia induzida.
Seja MY a seguinte colecao de subconjuntos de Y :
MY = {A Y, A = Y M para algum M M}.
Vamos mostrar que MY e uma -algebra em Y . Os fatos que MY e que Y MY podem ser
provados tal como no caso da topologia induzida. Queremos agora provar que se A M Y entao seu
complemento em Y , Ac = Y \ A, tambem e um elemento de MY . Por hipotese A e da forma A = Y M
com M M e, portanto,
Ac = Y \ (Y M ) = Y (X \ M ).
Assim, como X \ M e um elemento de M, segue que Ac = Y \ A e um elemento de MY .

Finalmente
queremos provar que se {An , n
[
entao
An tambem o e.
n

} e uma famlia enumeravel de elementos de MY

JCABarata. Curso de Fsica-Matem


atica

Pelas hipoteses cada An e da forma Y Mn com Mn M. Da


[

Como

An =

Captulo 18

Vers
ao de 29 de setembro de 2005.

(Y Mn ) = Y

932/1304

Mn .

Mn e tambem um elemento de M, a afirmativa esta provada.

A -algebra MY a chamada de -
algebra induzida em Y pela -algebra M.

18.2.4

Topologias e -
algebras Produto

A Topologia Produto de Espa


cos Topol
ogicos
Uma construcao muito importante e a da chamada topologia produto de espacos topologicos. Muito
pode ser dito sobre essa topologia (para mais detalhes vide, por exemplo, [17]), mas vamos nos restringir
por ora somente a` sua definicao para o caso de produtos cartesianos finitos.
Seja {X1 , . . . , Xn } umaQ
colecao finita de conjuntos e seja, para cada a In = {1, . . . , n}, a uma
topologia em Xa . Seja X = na=1 Xa o produto cartesiano
de todos os Xa , a In e seja B a colecao de
Q
todos os subconjuntos de X que sejam da forma aIn Aa onde Aa a , ou seja, cada Aa e um aberto
em Xa segundo a topologia a . Entao a topologia gerada por B, [B] e chamada de topologia produto
dos espacos topologicos Xa , a .
E. 18.36 Exerccio. Seja o espaco 2 = e considere que cada fator e munido da topologia
usual . Mostre que a topologia produto obtida em 2 e identica `a topologia metrica usual de 2 definida
pela metrica usual
p
(y1 x1 )2 + (y2 x2 )2 ,
d(x, y) =


onde x = (x1 , x2 ) e y = (y1 , y2 ).

A -Algebra
Produto
Ha uma construcao analoga para -algebras. Seja Xa , a In umaQcolecao finita de conjuntos e
seja, para cada a In , Ma uma -algebra em Xa . Seja como antes X = aIn Xa o produto cartesiano
de
Q todos os Xa , a In . Definimos D a colecao de todos os subconjuntos de X que sejam da forma
e mensuravel em Xa segundo a -algebra Ma . Entao a
aIn Ma onde Ma Ma , ou seja, cada Ma
-algebra gerada por D, M[D] e chamada de -
algebra produto das -algebras M a .

18.3

Interior e Fecho de Conjuntos em Espa


cos Topol
ogicos

Seja X um espaco dotado de uma topologia . Podemos associar a cada subconjunto generico B de X
tres conjuntos importantes, o chamado fecho de B, o chamado interior de B e a chamada fronteira ou
bordo de B. Vamos discutir agora esses conceitos.

JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

933/1304

Fecho
Para B X generico, definamos a colecao
FB := {F X, F e fechado e tal que F contem B: F B}
A colecao FB e entao a colecao de todos os conjuntos fechados (segundo a topologia ) que contem
o conjunto B. Sabemos que a interseccao arbitraria de conjuntos fechados e tambem um conjunto
fechado. Isso motiva a seguinte definicao:
\
F.
B :=
F FB

O conjunto B e chamado de fecho do conjunto B na topologia e e, pela propria definicao, um conjunto


fechado.
E. 18.37 Exerccio. Pode-se dizer que o fecho de um conjunto B e o menor conjunto fechado que
contem B. Justifique isso em face da definicao dada acima de B.
6
E. 18.38 Exerccio importante. Um conjunto B e fechado se e somente se B = B. Prove isso.

Conclui-se desse exerccio que em qualquer espaco topologico X tem-se = e X = X.


E. 18.39 Exerccio. Seja X = . A tabela abaixo mostra o fecho dos conjuntos (a, b), [a, b), [a, b] e
{a}, com < a < b < , em varias topologias. Mostre cada um dos casos.


I : (a, b) =
cf ( ) : (a, b) =

cc ( ) : (a, b) =


[a, b) =

[a, b) =

[a, b) =

[a, b] =

[a, b] =

[a, b] =


{a} =

{a} = {a}.

{a} = {a}.

[a, b) = [a, b], [a, b] = [a, b], {a} = {a}.

: (a, b) = [a, b],




[S] : (a, b) = [a, b), [a, b) = [a, b), [a, b] = [a, b], {a} = {a}.
( ) : (a, b) = (a, b), [a, b) = [a, b), [a, b] = [a, b], {a} = {a}.


Acima, I = {, } e a topologia indiscreta de , cf ( ) e a topologia co-finita de


co-contavel de , e a topologia usual de , [S] e a topologia de Sorgenfrey de
e a topologia discreta de .


, cc ( ) e a topologia
(pagina 922) e ( )
6


Note no exerccio acima que as topologias escolhidas estao postas em ordem crescente de inclusao:
I cf ( ) cc ( ) [S] ( ).


O caso do conjunto (a, b) (e os outros) ilustra claramente um fato importante, a saber, que quanto
maior a topologia menor e o fecho de um dado conjunto.

JCABarata. Curso de Fsica-Matem


atica

E. 18.40 Exerccio muito importante.

Captulo 18

Vers
ao de 29 de setembro de 2005.

934/1304

Seja B o fecho de um conjunto qualquer B, segundo uma


0

topologia . Seja 0 uma outra topologia tal que 0 . Mostre que B B .

Interior
Para B X generico, definamos a colecao
AB := {A X, A e aberto e tal que A esta contido em B: A B}
A colecao AB e entao a colecao de todos os conjuntos abertos (segundo a topologia ) contidos no
conjunto B. Sabemos que a uniao arbitraria de conjuntos abertos e tambem um conjunto aberto. Isso
motiva a seguinte definicao:
[
B 0 :=
A.
AAB

O conjunto B 0 e chamado de interior do conjunto B na topologia e e, pela propria definicao, um


conjunto aberto.

E. 18.41 Exerccio. Pode-se dizer que o interior de um conjunto B e o maior conjunto aberto contido
em B. Justifique isso em face da definicao dada acima de B 0 .
6
E. 18.42 Exerccio. Um conjunto B e aberto se e somente se B = B 0 . Prove isso.

E. 18.43 Exerccio. Seja X = . A tabela abaixo mostra o interior dos conjuntos (a, b), [a, b), [a, b]
e {a}, com < a < b < , em varias topologias. Mostre cada um dos casos.


I : (a, b)0 = ,

[a, b)0 = ,

[a, b]0 = ,

{a}0 = .

cf ( ) : (a, b)0 = ,

[a, b)0 = ,

[a, b]0 = ,

{a}0 = .

cc ( ) : (a, b)0 = ,

[a, b)0 = ,

[a, b]0 = ,

{a}0 = .

: (a, b)0 = (a, b), [a, b)0 = (a, b), [a, b]0 = (a, b), {a}0 = .


[S] : (a, b)0 = (a, b), [a, b)0 = [a, b), [a, b]0 = [a, b), {a}0 = .
( ) : (a, b)0 = (a, b), [a, b)0 = [a, b), [a, b]0 = [a, b],


{a}0 = {a}.
6

O caso do conjunto [a, b] ilustra claramente um fato importante, a saber, que quanto maior a
topologia maior e o interior de um dado conjunto.
E. 18.44 Exerccio. Seja (B 0 ) o interior de um conjunto qualquer B, segundo uma topologia . Seja
0
6
0 uma outra topologia tal que 0 . Mostre que (B 0 ) (B 0 ) .

JCABarata. Curso de Fsica-Matem


atica

Captulo 18

Vers
ao de 29 de setembro de 2005.

935/1304

Por fim, note que para qualquer conjunto B X vale sempre, em qualquer topologia , que
B 0 B B.
Fronteira ou Bordo
Para B X generico, definamos a sua fronteira ou bordo (na topologia ) como sendo o conjunto
B := B \ B 0 = B (B 0 )c .
Dessa definicao e claro que B e sempre um conjunto fechado (por que?).
E. 18.45 Exerccio. Seja X = . A tabela abaixo mostra o bordo dos conjuntos (a, b), [a, b) [a, b]
{a}, com < a < b < , em varias topologias. Mostre cada um dos casos.


I : (a, b) =
cf ( ) : (a, b) =

cc ( ) : (a, b) =


[a, b) =

[a, b) =

[a, b) =

[a, b] =

[a, b] =

[a, b] =

{a} =

{a} = {a}.

{a} = {a}.

: (a, b) = {a, b}, [a, b) = {a, b}, [a, b] = {a, b}, {a} = {a}.


[S] : (a, b) = {a},

[a, b) = ,

[a, b] = {b},

{a} = {a}.

( ) : (a, b) = ,

[a, b) = ,

[a, b] = ,

{a} = .

6
E. 18.46 Exerccio. Seja B o fecho de um conjunto qualquer B, segundo uma topologia . Seja 0
0
uma outra topologia tal que 0 . Mostre que B B.
6
Note que a afirmativa do u
ltimo exerccio e confirmada pela tabela do pen
ultimo.
Outra Caracteriza
c
ao do Fecho de um Conjunto
O conceito de fecho de um conjunto e de grande importancia. Uma das razoes, como veremos,
e que no caso de espacos metricos o fecho de um conjunto B caracteriza o conjunto de todos os
limites de seq
uencias de elementos de B. Em particular um conjunto so e fechado em um espaco
metrico se contiver todos os limites de seq
uencias de seus elementos. Muitos resultados importantes
em Matematica decorrem dessa observacao.
Vamos nos preparar para apresentar esse fato, assim como outros em espacos topologicos gerais.
Seja X um conjunto e uma topologia em X (nao necessariamente metrica). Seja tambem B um
subconjunto qualquer nao-vazio de X.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

936/1304

Proposi
c
ao 18.5 Seja B X, sendo X dotado de uma topologia . Um ponto x X e um elemento
de B se e somente se a seguinte propriedade for v
alida: todo aberto A x que contem o ponto x tem uma
intersecca
o n
ao-vazia com B, ou seja,
B = {x X| Ax B 6= , Ax com x Ax }.
2
Prova. Suponha que x B e que haja aberto Ax que contem x e tal que Ax B = . Isso implica que
B Acx B, pois
B Acx B Acx = B.

Assim, B Acx e um conjunto fechado que contem B e, portanto, B B Acx , dado que o fecho de B
e o menor fechado que contem B. Isso, por sua vez, diz que B Acx , o que significa que B Ax = .
Mas isso contradiz as hipoteses de partida que diziam que x B e x Ax . Portanto, se x B entao
Ax B 6= para todo aberto Ax que contem x.
Suponhamos agora que para um ponto x X valha que Ax B 6= para todo aberto Ax que contem
c
x. Se supormos que x 6 B entao x B , que e um aberto. Assim, deveramos ter, pelas hipoteses que
c
B B 6= . Como B B isso e impossvel. Assim, supor que Ax B 6= para todo aberto Ax que
contem x implica que x B. Isso completa a demonstracao da proposicao.

18.3.1

Fecho de Conjuntos em Espa


cos M
etricos

Fecho de Conjuntos em Espa


cos M
etricos
Seja X um espaco metrico com metrica d e d a topologia induzida em X por essa metrica. Seja
B X. Vamos apresentar agora uma caracterizacao importante do fecho de B, que anunciamos acima.

Uma seq
uencia {xn , n } de elementos de X e dita convergir na metrica d a um elemento x X
se para todo  > 0 existir N () tal que xn Bd (x, ) para todo n > N ().


Se uma seq
uencia converge a um ponto x, este e dito ser um limite da seq
uencia.

Mais sobre o conceito de convergencia de seq


uencias em espacos metricos sera visto na secao sobre
continuidade e convergencia em espacos topologicos.
Temos entao a seguinte proposicao:
Proposi
c
ao 18.6 Um ponto x X pertence ao fecho na topologia d de um subconjunto B de X se e
somente se existir uma seq
uencia de elementos de B que converge a x na metrica d.
2
Prova. Suponha que x seja um limite de uma seq
uencia xn de elementos de B. Seja Ax um aberto que
contem x. Como Ax e um aberto de um espaco metrico, existe uma bola aberta centrada em x com
um raio positivo suficientemente pequeno, que chamaremos de , tal que Bd (x, ) Ax . Da, como a
seq
uencia converge a x, vale que B 3 xn Bd (x, ), desde que n seja grande o suficiente. Mas isso diz

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 18

937/1304

que, para tais xn s tem-se xn Ax tambem. Logo Ax B 6= , pois pelo menos esses xn s pertencem
aos dois conjuntos. Note que isso vale para qualquer aberto Ax que contem x. Da, pelo que vimos na
Proposicao 18.5, conclumos que x B.

Assim, vimos que se uma seq


uencia de elementos de B converge a um ponto x em um espaco
metrico, entao esse ponto x e um elemento do fecho de B. Vamos agora provar a recproca.
Vamos agora supor que x B e vamos provar que existe uma seq
uencia de elementos de B que
converge a x.

Como x B vale que Bd (x, 1/n) B 6= para todo n , n > 0. Da, podemos escolher, para
cada n , n > 0, um elemento xn do conjunto Bd (x, 1/n) B. Com isso formamos uma seq
uencia
{xn } de elementos de B que converge a x, completando a prova.


Conjuntos Fechados em Espa


cos M
etricos e Completeza
Seja M um espaco metrico em relacao a uma metrica d. Qualquer subconjunto nao-vazio de M e
tambem um espaco metrico com metrica d (por que?). Porem, se M e completo em relacao a d e se
F M e um conjunto fechado, entao F e tambem um espaco metrico completo em relacao a d.

Provar isso e bem simples. Se fn F e uma seq


uencia de Cauchy em relacao a d em F entao fn e
tambem uma seq
uencia de Cauchy em relacao a d em X. Como X e completo existe f X ao qual a
uencia de Cauchy
seq
uencia converge. Mas, devemos ter, pelo que vimos, f F = F . Assim, toda seq
em relacao a d em F converge a um elemento de F . Isso prova completeza de F .
A recproca e tambem verdadeira. Seja M completo em relacao a d e seja B X tambem completo
em relacao a d. Entao B e fechado. Para ver isso note que toda seq
uencia de elementos de B que
converge em X e uma seq
uencia de Cauchy em X e, portanto, e tambem uma seq
uencia de Cauchy
em B. Logo, uma tal seq
uencia converge a um elemento de B, pois B e completo. Mas isso equivale a
dizer que B B, o que implica B = B.
Provamos entao o seguinte:

Proposi
c
ao 18.7 Se X e um espaco metrico completo em relaca
o a uma metrica d, ent
ao F X e
fechado na topologia induzida por essa metrica se e somente se F for igualmente completo em relaca
o
a
` metrica d.
2

Captulo 19
Medidas
Conte
udo
19.1 O Problema da Teoria da Medida

. . . . . . . . . . . . . . . . . . . . . . . 938

19.2 Medidas de Conjuntos. Defini


ca
o, Exemplos e Propriedades B
asicas . . 941
19.3 Construindo Medidas. A Medida Exterior e o Teorema de Caratheodory 945

presente captulo visa apresentar ao estudante a nocao de medida de conjuntos, algumas


de suas propriedades basicas e exemplos elementares e, por fim, discutir uma construcao
importante de medidas devida a Caratheodory1 . O caso importante da chamada medida
de Lebesgue2 e discutido com essa base no Captulo 20. Comecaremos com uma discussao
parcialmente informal sobre os problemas basicos por tras da nocao intuitiva de medida de conjuntos.

19.1

O Problema da Teoria da Medida

Em uma primeira instancia, o objetivo da area da Analise conhecida como Teoria da Medida e dar
fundamento a`s ideias intuitivas de comprimento, area, volume etc. de sub-conjuntos de n . Grandezas
como comprimento, area, volume etc. de subconjuntos de n sao referidas genericamente como medidas
de tais conjuntos e a` Teoria da Medida cabe nao so apresentar definicoes precisas de tais conceitos mas
tambem cabe determinar que classes de conjuntos sao mensur
aveis, ou seja, a quais conjuntos tais
conceitos sao aplicaveis.


Talvez surpreenda ouvir pela primeira vez que tais conceitos nao possam ser aplicados a qualquer
conjunto e que os mesmos, se usados sem o devido cuidado, possam envolver situacoes paradoxais.
Entretanto, como mostra o exemplo do conjunto de Vitali, tratado na proxima secao, existem, ja no
simples caso da reta real, conjuntos para os quais o conceito de comprimento nao pode ser definido. A
dificuldade que temos de sequer imaginar como devem ser tais conjuntos reside, talvez, no fato que os
mesmos serem de construcao incomum (a construcao, como veremos, faz uso explcito do Axioma da
Escolha).
A Teoria da Medida nao se restringe, porem, a tratar de conceitos geometricos como comprimento,
area etc., sendo que o conceito formal de medida de um conjunto extrapola em muito esse campo de
aplicacoes, como veremos. Fora isso, a Teoria da Medida nao se limita apenas ao estudo do conceito
de medida e de conjuntos mensuraveis, mas tem como seu mais importante objetivo formalizacao da
teoria da integracao. Que os conceitos de medida e de integral sao conectados diz-nos ja a velha nocao
de integral como area sob o grafico de uma funcao. De fato, a teoria da medida fornece material
poderoso para um tratamento mais profundo do conceito de integral e de suas extensoes.
1
2

Constantin Caratheodory (1873-1950).


Henri Leon Lebesgue (1875-1941).

938

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

939/1304

Todos esses conceitos serao tratados de modo cuidadoso adiante, mas achamos por bem comecar
mostrando ao estudante a origem de toda a problematica: a existencia de conjuntos nao mensuraveis.
O Exemplo de Vitali
Considere-se o conjunto dos n
umeros reais e seus subconjuntos. Temos uma nocao intuitiva clara
do que seja o comprimento de intervalos da reta real como (a, b) ou [a, b] ou [a, b) ou (a, b]. Em
todos esses casos o comprimento e o n
umero positivo (ou nulo) b a. Para um intervalo I como os de
acima, denotemos por m(I) o seu comprimento. Assim, por exemplo, m([a, b]) = b a, para todo a e
b com b a.


Se um conjunto A for formado pela uniao disjunta de dois intervalos I e J como os de acima,
e tambem intuitivo que o comprimento de A seja dado por m(A) = m(I) + m(J), ou seja, pela soma
dos comprimentos dos intervalos disjuntos que formam A. Se A for formado por uma uniao disjunta
contavel de intervalos Ia , a , entao, igualmente, e natural dizer que o comprimento total de A e
dado por

X
m(A) =
m(Ia ).


a=1

Note-se que nao exclumos a possibilidade de A ser um conjunto com comprimento infinito, como e
o caso da semi-reta [0, ), que, alias pode ser escrita como a uniao contavel disjunta de intervalos de
comprimento 1 do tipo [n, n + 1) com n . Conjuntos com comprimento zero, como conjuntos com
um so elemento {x} tambem podem existir.


Dessas nocoes extramos o seguinte princpio: se um conjunto A puder ser escrito como uma uniao
disjunta contavel de outros conjuntos Ba , a , que possuem um comprimento bem definido (finito
ou nao), entao o comprimento de A deve ser dado pela soma dos comprimentos de cada B a , seja essa
soma finita ou nao:
!
[
X
m
Ba =
m(Ba ) .


Outra propriedade razoavel que devemos supor do conceito de comprimento de um conjunto e que
se A e B sao conjuntos e A B entao m(A) m(B). Note que podemos ter a igualdade mesmo que A
seja um subconjunto proprio de B. Esse e, por exemplo, o caso dos conjuntos A = (1, 3) e B = [1, 3]
onde tanto A quanto B tem o mesmo comprimento, a saber 2.
Por fim, uma u
ltima condicao razoavel que o comprimento de subconjuntos da reta deve satisfazer
e o de invariancia por translacoes. Seja E . Denotaremos por Ex , ou por E + x, o conjunto E
transladado por um n
umero x , ou seja:


Ex = {y


, com y = a + x para algum a E}.

Entao, o que dizemos e que e razoavel supor que m(Ex ) = m(E) para qualquer x

O que vamos agora fazer e mostrar que existem subconjuntos da reta real para os quais nao ha a
menor possibilidade de definir um comprimento m que satisfaca os requerimentos razoaveis delineados
acima.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

940/1304

O exemplo que construiremos e conhecido como exemplo de Vitali3 . Vamos supor que a todo
subconjunto E da reta real possamos associar um comprimento m(E) com as condicoes mencionadas
acima. Seja entao o intervalo I = [0, 1]. Vamos construir em I uma relacao de equivalencia da seguinte
forma. Dois pontos x e y, ambos elementos de I, sao ditos ser equivalentes, x y, se e somente se
x y for um n
umero racional.
E. 19.1 Exerccio. Prove que isso define de fato uma relacao de equivalencia.

O fato de termos assim criado uma relacao de equivalencia em I significa que I pode ser escrito
como uma uniao disjunta das classes de equivalencia por essa relacao. Usando o Axioma da Escolha
podemos construir um conjunto, que chamaremos de V , tomando um e somente um elemento arbitrario
de cada classe de equivalencia de I. Obviamente temos V I.

Seja agora Vr o conjunto obtido transladando-se o conjunto V por um n


umero r . Vamos
mostrar que Vr Vs = se r 6= s com r, s , ou seja, que Vr e Vs sao disjuntos se r e s forem
elementos distintos de . Para ver isso suponhamos o contrario, ou seja, que exista um elemento
u Vr Vs . Como u Vr entao u = v + r, para algum elemento v V . Por outro lado, como u Vs
entao u = v 0 + s, para algum elemento v 0 V . Portanto v + r = v 0 + s e v v 0 = s r. Como s r
e um racional entao v v 0 . Mas isso so e possvel se v = v 0 pois, ao construirmos V , tomamos um e
somente um elemento de cada classe de equivalencia de I, o que significa dizer que elementos distintos
de V nao podem ser equivalentes. Por outro lado, se v = v 0 a relacao v v 0 = s r diz que s = r, o
que contraria as hipoteses. Logo Vr Vs = se r, s com r 6= s.
1

Vamos denotar por 1 o conjunto de todos os n


umeros racionais contidos no intervalo [1, 1]:
= [1, 1]. Afirmamos que as seguintes relacoes de inclusao sao validas:
[
[0, 1]
Vr [1, 2].
r

Vamos provar isso. A relacao

Vr [1, 2] e obvia pois V e um subconjunto do intervalo

[0, 1] e, ao transladarmos V por um n


umero r do conjunto 1 podemos no maximo cair dentro de
[1, 2].
[
A relacao [0, 1]
Vr pode ser vista da seguinte forma. Se x [0, 1] entao x pertence a
r

uma classe de equivalencia V. Seja v o elemento de V que foi escolhido para comparecer em V como
o representante de V. Como x e v sao membros da mesma classe de equivalencia, entao x v e um
racional s. Como x e v sao elementos de [0, 1], entao sua diferenca deve ser um elemento de [1, 1].
Assim, vemos
[ que s 1 . Logo, x Vs com s 1 . Como isso vale para todo x [0, 1], segue que
[0, 1]
Vr como queramos mostrar.
r

Que conseq
uencias isso tudo tem? Pela hipotese que se A B entao m(A) m(B), segue que
!
[
Vr m([1, 2]),
m([0, 1]) m
r

Giuseppe Vitali (1875-1932).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

ou seja,
1 m
Pelo que vimos acima a uniao

Vr

Captulo 19

941/1304

3,

Vr e uma uniao disjunta e contavel (pois os racionais sao

contaveis). Logo, pelas nossas hipoteses sobre m, temos que


!
[
X
m
Vr =
m(Vr ).
r

A desigualdade acima fica entao


1

m(Vr ) 3.

Por fim, pela hipotese que m e invariante por translacoes, segue que m(Vr ) = m(V ) e, portanto,
X
1
m(V ) 3.
r

Agora, essa relacao e absurda pois nao pode ser nunca satisfeita para m(V ) 0. Se m(V ) = 0 a
primeira desigualdade e violada e se m(V ) > 0 (ou infinito) a segunda o e pois a soma e infinita.
O que esta errado? O erro esta em supor que se possa atribuir ao conjunto V um comprimento
m(V ). O conjunto V , que e chamado conjunto de Vitali, e um exemplo de um conjunto nao-mensuravel.
A ele nao e possvel atribuir um comprimento, nem nulo, nem finito, nem infinito.
Para finalizar essa discussao fazemos notar que fizemos uso de modo crucial do Axioma da Escolha
na construcao do conjunto V acima. Em outros esquemas axiomaticos sobre a teoria dos conjuntos
subjacente a` Matematica o Axioma da Escolha pode ser substitudo por um outro axioma que impeca
a construcao de conjuntos como V .

19.2

Medidas de Conjuntos. Defini


c
ao, Exemplos e Propriedades B
asicas

A Defini
c
ao de Medida
Uma vez visto que problemas com a mensurabilidade de conjuntos podem existir, vemo-nos forcados
a tratar o problema reunindo instrumentos mais solidos para sua abordagem.
Seja X um conjunto e M uma -algebra em X. Vamos definir o conceito formal de medida. Uma
medida em M e uma funcao que associa a cada elemento da -algebra M um n
umero real 0 ou
infinito, ou seja, : M + {} e de tal forma que as seguintes condicoes sejam satisfeitas:


1. () = 0.

JCABarata. Curso de Fsica-Matem


atica

2. Se Ai , i


Vers
ao de 29 de setembro de 2005.

Captulo 19

, e uma colecao contavel e disjunta de elementos de M entao


!
X
[

An =
(An ).
n

942/1304

(19.1)

A propriedade 2 e por vezes denominada aditividade cont


avel, ou ainda -aditividade.
Uma palavra tem que ser dita aqui sobre o significado dessa definicao. Conforme vimos, ha conjuntos
em aos quais nao podemos atribuir uma nocao razoavel de comprimento. O problema consiste entao
em identificar classes de conjuntos para os quais esta definicao pode fazer sentido sem que venhamos
a cair em paradoxos como os envolvendo o conjunto de Vitali. A experiencia mostrou que -algebras
sao justamente o ambiente ideal para desenvolver a nocao de medida de conjuntos, sem que se recaia
em dificuldades serias. Da restringirmos a definicao de medida a` -algebras. A propriedade (19.1) e
de importancia crucial para o desenvolvimento da teoria de medida (e como tal, um achado historico)
e e chamada de propriedade de -aditividade.


Exemplos
Vamos a alguns exemplos basicos de medidas.
1. A Medida de Contagem. Seja X um conjunto nao-vazio e M = (X). Para E M definimos

umero de elementos de E, caso E seja um conjunto finito,


o n
c (E) :=

,
caso E nao seja um conjunto finito.

Entao, c define uma medida em M (verifique!), a qual conta o n


umero de elementos de cada
conjunto E, da sua designacao.

2. A Medida de Dirac4 em x0 . Seja X um conjunto nao-vazio, seja M = (X) e seja x0 um elemento


de X. Para E M definimos

1, caso x0 E,
x0 (E) :=
(19.2)

0, caso x0 6 E.
Entao, x0 e uma medida (verifique!) que diz se o ponto x0 fixado e um elemento de E ou nao.

3. A Medida de Dirac Sobre Um Conjunto Cont


avel C. Seja X um conjunto nao-vazio, seja M =
(X) e seja C um subconjunto contavel de X. Para E M definimos

umero de elementos de E C, caso E C seja um conjunto finito,


o n
C (E) :=

,
caso E C nao seja um conjunto finito.
Entao, C e uma medida (verifique!) que generaliza a medida x0 acima.

Paul Adrien Maurice Dirac (1902-1984).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

943/1304

4. Sejam , 0 e seja X um conjunto nao-vazio que possua um sub-conjunto proprio nao-vazio A


(para isso basta que X tenha mais de um elemento). Considere a -algebra M = {, A, Ac , X}.
Se definirmos () = 0, (A) = , (Ac ) = e (X) = + , entao sera uma medida em M.
Mostre isso!
Por estes exemplos vemos que a nocao de medida extrapola a nocao geometrica de comprimento,
area, volume etc. de um conjunto, conceitos esses que, ademais, so se aplicam a certos sub-conjuntos de
n
. Outros exemplos mais elaborados de medidas serao vistos adiante, em especial aqueles referentes
justamente a`s nocoes geometricas de comprimento, area etc. de subconjuntos de n . Tais medidas sao
conhecidas como medidas de Lebesgue e serao discutidas adiante.


E. 19.2 Exerccio. Sejam , e tres objetos distintos (por exemplo, tres letras distintas do alfabeto
grego). Mostre que


M = , {}, {, }, {, , }
e uma -algebra em X = {, , }. Mostre que : M
() = 0,

({}) = 1,

+,


definida por

({, }) = 0,

({, , }) = 1

e uma medida em M.

E. 19.3 Exerccio. Sejam , e tres objetos distintos (por exemplo, tres letras distintas do alfabeto
grego). Mostre que


M = , {}, {, }, {, , }
e uma -algebra em X = {, , }. Mostre que : M
() = 0,

({}) = 2,

+,


definida por

({, }) = 1,

({, , }) = 3

e uma medida em M.

E. 19.4 Exerccio. Sejam , e tres objetos distintos (por exemplo, tres letras distintas do alfabeto
grego). Mostre que


M = , {}, {}, {}, {, }, {, }, {, }, {, , }
e uma -algebra em X = {, , }. Mostre que : M
() = 0,

({}) = 0,

({}) = 0,

definida por

({}) = 1,

({, }) = 0,
e uma medida em M.

({, }) = 1,

({, }) = 1,

({, , }) = 1
6

JCABarata. Curso de Fsica-Matem


atica

Captulo 19

Vers
ao de 29 de setembro de 2005.

944/1304

Propriedades B
asicas de Medidas
Vamos agora extrair algumas conseq
uencias basicas da definicao de medida [110]. Abaixo, seja X
um conjunto nao-vazio, M uma -algebra em X e uma medida em M.
1. Se A1 , . . . , An e uma colecao finita de elementos disjuntos de M entao (A1 An ) = (A1 ) +
+ (An ).
[
Prova. Defina-se Am = para m > n. Entao, A1 An =
Aj e, portanto,
j

(A1 An ) =

Aj

(Aj ) = (A1 ) + + (An ),

pois () = 0.
2. Se A e B sao elementos de M e A B entao (A) (B).

Prova. Como A B, segue que B = A (Ac B), uma uniao disjunta de elementos de M (por
que?). Logo, pelo item anterior segue que (B) = (A) + (Ac B). Como (Ac B) 0, segue
que (B) (A).

3. Se Aj , j
onde A =

, sao elementos de M com Aj Aj+1 para todo j




, entao lim (An ) = (A),


n

An .

Prova. Defina-se B1 = A1 e Ba = Aa \ Aa1 para a 2. Entao, pelas hipoteses,


An = B 1 B n
e
A =

Ba ,

onde, em ambos os casos, as unioes sao disjuntas. Assim,


(An ) = (B1 ) + + (Bn )
e
(A) =

X
a

(Ba ).

Portanto, (A) = lim (An ), como queramos provar.


n

4. Se Aj , j , sao elementos de\M com Aj+1 Aj para todo j


lim (An ) = (A), onde A =
An .


, e se (A1 ) for finito, entao

Prova. Seja Ca = A1 \ Aa . Entao, pelas hipoteses, Cj Cj+1 . Como vimos no item anterior, isso
diz que
lim (Cn ) = (C),
n

JCABarata. Curso de Fsica-Matem


atica

onde C =

Vers
ao de 29 de setembro de 2005.

Captulo 19

945/1304

Ca = A1 \ A. Temos agora que A1 = An Cn e A1 = A C, duas unioes disjuntas.

Portanto (An ) + (Cn ) = (A) + (C). Assim, lim (An ) + lim (Cn ) = (A) + (C) e,
n
n
entao,
lim (An ) + (C) = (A) + (C).
n

Como (A1 ) e finito, entao (C) e (A) tambem sao finitos (pois sao subconjuntos de A1 ). Logo,
podemos cancelar (C) da u
ltima igualdade e obtemos o desejado.
Os dois primeiros itens acima sao resultados desejados pela nocao intuitiva de medida. O pen
ultimo
diz que a medida de um conjunto A pode ser aproximada por dentro pelas medidas de conjuntos
mensuraveis que convergem a A e o u
ltimo item diz que se um conjunto A tem medida finita e se
ha conjuntos An tambem com medida finita que contem A e convergem a A entao tambem podemos
aproximar a medida de A pela dos aproximantes externos An .

19.3

Construindo Medidas. A Medida Exterior e o Teorema


de Caratheodory

Ha muitos processos que permitem construir medidas com certas propriedades desejadas. Vamos aqui
delinear um processo que sera particularmente importante para a construcao da chamada medida de
Lebesgue da reta real.
A construcao a que nos referimos exige que introduzamos mais um conceito. O de medida exterior.
Uma medida exterior em um conjunto nao-vazio X e uma funcao que associa a cada subconjunto
de X um n
umero real maior ou igual a zero ou infinito e de tal forma que:
1. () = 0.
2. Se A B entao (A) (B).
3. Para qualquer colecao contavel Aj , j

, de subconjuntos de X tem-se que


!
X
[
Aj
(Aj ).


Notas.
Um exemplo elementar de medida exterior, e que ilustrara o Teorema de Caratheodory, abaixo,
e encontrado no Exerccio E. 19.6 da pagina 951.
Enfatizamos que medidas exteriores sao definidas sobre a totalidade dos subconjuntos de X ao
contrario de medidas, que sao definidas apenas sobre -algebras em X (e que podem ser menores
que (X)).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

946/1304

Uma outra distincao relevante entre medidas exteriores e medidas e a seguinte. Seja A um
conjunto e sejam A1 e A2 dois subconjuntos disjuntos proprios do conjunto A tais que A = A1 A2 .
Entao, ha casos em que (A) 6= (A1 ) + (A2 ). Esse fato e contrario a` intuicao por tras da nocao
de medida de um conjunto. Para uma medida isso nunca pode ocorrer se A, A1 e A2 forem
elementos da -algebra dos conjuntos mensuraveis por , pela propria definicao de medida dada
acima.
Se A1 e A2 sao dois subconjuntos de X sempre temos que (A1 A2 ) (A1 ) + (A2 ). Isso e
facil de se ver
[ pela definicao de medida exterior pois, tomando-se Aj = para j > 2 temos que
Aj .
A1 A 2 =
j

Vamos agora mostrar o seguinte resultado fundamental e que e a verdadeira razao de ser do conceito
de medida exterior.
Teorema 19.1 (Teorema de Caratheodory) 5 Seja M a coleca
o de todos os subconjuntos A de
X que tenham a seguinte propriedade: Para todo E X vale que
(E) = (E A) + (E Ac ),
onde Ac = X \ A. Ent
ao, M e uma -
algebra. Fora isso, e uma medida em M .

Antes de provarmos esse teorema, facamos algumas observacoes sobre o mesmo. Apesar de o
teorema acima nao ser, admitidamente, muito intuitivo, o mesmo fornece um metodo importante de
construcao de medidas. A razao e que, como veremos no caso da construcao da medida de Lebesgue,
e em muitos casos mais facil construir-se primeiro uma medida exterior sobre um conjunto X que
uma medida, o que exigiria a identificacao previa de uma -algebra conveniente. O teorema acima ja
permite exibir uma tal -algebra, no caso M , para a qual e uma medida. Historicamente o teorema
acima representou tambem uma simplificacao importante, especialmente na construcao da medida de
Lebesgue, dado que a mesma era originalmente alcancada por vias mais trabalhosas (identificando-se
a medida exterior com o que se chama de medida interior, da qual nao trataremos aqui).
Um exemplo elementar que ilustra o Teorema de Caratheodory e encontrado no Exerccio E. 19.6
da pagina 951. O estudante podera estuda-lo antes de mergulhar na demonstracao do teorema.
A prova do do Teorema de Caratheodory e um pouco longa e precisamos de um resultado preparatorio.
Lema 19.1 Sejam A e B dois elementos de M . Ent
ao, A B e tambem um elemento de M .

Prova. Tudo o que queremos provar e que


(E) = (E (A B)) + (E (A B)c )
para um subconjunto E X generico.
5

Em sua forma original esse teorema e devido ao matem


atico Constantin Caratheodory (1873-1950) e por isso vamos
denomin
a-lo dessa forma, ainda que tal nomenclatura n
ao seja comum.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

947/1304

Seja E 0 o conjunto E 0 = (A B) E. Entao, como A M , segue que


(E 0 ) = (E 0 A) + (E 0 Ac ),
ou seja,
((A B) E) = ((A B) E A) + ((A B) E Ac ).

facil de se ver agora (faca!) que


E

(A B) E A = A E
e que
(A B) E Ac = Ac E B.
Assim,
((A B) E) = (A E) + (Ac E B) .
Vamos fazer uso dessa u
ltima igualdade logo abaixo.
Notemos agora que, como A e B sao elementos de M , temos que
(E) = (A E) + (Ac E)
= (A E) + (Ac E B) + (Ac E B c ) .
Acabamos de ver que a soma dos dois primeiros termos da u
ltima igualdade vale ((A B) E) e
c
c
c
para o u
ltimo termo vale (A B E) = ((A B) E), pois Ac B c = (A B)c . Assim, provamos
que
(E) = (E (A B)) + (E (A B)c ) ,
que e o que queramos demonstrar.
Note que o resultado acima tambem diz que se A1 , . . . , An sao elementos de M entao o conjunto
A1 An tambem e elemento de M para qualquer n finito.
Passemos agora a` prova do Teorema de Caratheodory.

Prova do Teorema de Caratheodory


Parte I. Vamos nesta parte I provar que o conjunto M e, de fato, uma -algebra.
Em primeiro lugar, note-se que se A M entao Ac tambem e um elemento de M pois (Ac )c = A
e portanto, para todo E X,
(E (Ac )) + (E (Ac )c ) = (E (Ac )) + (E A) = (E),
por hipotese. Assim, podemos tambem ver que tanto quanto X sao elementos de M pois, claramente,
para qualquer E X
(E) = (E ) + (E ()c )
dado que c = X, que E X = E, que E = e que () = 0.

JCABarata. Curso de Fsica-Matem


atica

Captulo 19

Vers
ao de 29 de setembro de 2005.

948/1304

Vimos no Lema 19.1 que se A e B sao elementos de M entao A B tambem o e. Como A B =


(Ac B c )c entao conclumos que A B tambem e elemento de M , o mesmo valendo para A \ B pois
A \ B = A B c.
[
Aj
Resta-nos provar que se {Aj , j } e uma colecao contavel de elementos de M entao A =


tambem o e.

Seja E um subconjunto generico de X. Claramente temos que E = (E A) (E Ac ), o que,


pelo que observamos acima, significa que (E) (E A) + (E Ac ). Tudo o que precisamos
fazer, entao, e provar que (E) (E A) + (E Ac ) o que significaria entao que A M , como
queremos provar.
Para provar esta desigualdade, observemos primeiro que, para qualquer conjunto E 0 e qualquer
elemento A de M vale, por definicao, (E 0 ) = (E 0 A) + (E 0 Ac ). Da, tomando-se E 0 da forma
E 0 = (A B) E, com E X e A, B M com A B = , temos
((A B) E) = (A E) + (B E),
pois, como A B = , tem-se que (A B) E A = A E e (A B) E Ac = B E.
E. 19.5 Exerccio. Verifique estas u
ltimas afirmativas.

Isso significa, em particular que, se B1 , . . . , Bn sao elementos disjuntos de M , entao


(E (B1 Bn )) = (E B1 ) + + (E Bn ).
Vamos definir B1 = A1 , Bn = An \ (A1 An1 ) para n 2. Entao, pelo que ja observamos,
cada Bj e elemento de M e Bi Bj = se i 6= j. Fora isso,
[
[
Bi =
Ai .
i

Como cada Bi e elemento de M , entao ja vimos que para cada n finito

n
[

i=1
n
[

(E) = E
para todo E X. Agora
E
pois os Bi s sao disjuntos.
Por outro lado
E

n
[

i=1

Bi

i=1

n
[

i=1

Bi

Bi

!!

!!

!c !

n
[

+ E

n
X
i=1

i=1

Bi

!c !

(Bi E)

Bi

!c !

Bi M , ou seja,

JCABarata. Curso de Fsica-Matem


atica

dado que
[

Bi

!c

n
[

Captulo 19

Vers
ao de 29 de setembro de 2005.

Bi

i=1

!c

(Por que?)

Logo, vimos que


(E)

n
X
i=1

949/1304

(Bi E) + E

Bi

!c !

Bi

!c !

Como essa desigualdade vale para qualquer n, segue que


(E)

X
i=1

(Bi E) + E

Por fim, pela propria definicao de medida exterior, temos que


!!

X
[
(Bi E) E
Bi
i=1

(por que?)

e, portanto,

(E) E

= E

Bi

Ai

!!
!!

+ E

+ E

Bi

!c !

Ai

!c !

Isso e exatamente o que queramos provar. Assim, mostramos que M e de fato uma -algebra e a
prova da parte I do teorema esta completa.
Parte II. Vamos nesta parte II provar que a medida exterior e de fato uma medida quando restrita
aos elementos da -algebra M .
Tudo o que queremos provar e a propriedade seguinte: se Bi , i
entao
!
[
X

Bi =
(Bi ).
i

, sao elementos disjuntos de M ,




Pelo que ja vimos na parte I, temos que


(E)

X
i=1

(Bi E) + E

E
= (E)

Bi

!!

+ E

Bi

!c !
[

Bi

!c !

JCABarata. Curso de Fsica-Matem


atica

Captulo 19

Vers
ao de 29 de setembro de 2005.

950/1304

onde a u
ltima igualdade e precisamente a afirmativa que foi provada na parte I. Assim, como (E)
aparece no comeco e no fim da cadeia de desigualdades, todos os smbolos de podem ser substitudos
por smbolos de igualdade = (por que?). Ou seja, temos que
!c !

X
[
(E) =
(Bi E) + E
Bi
.
i=1

Como isso vale para todo E X, tomemos, em particular, E =

Bi

Bi . A u
ltima formula fica

(Bi )

i=1

que e exatamente o que queramos provar. Isso completa a prova do Teorema de Caratheodory.
*
No Captulo 20 vamos ilustrar o uso do Teorema de Caratheodory na construcao de uma medida
muito importante: a medida de Lebesgue da reta real. O Teorema de Caratheodory pode ser utilizado
em varias outras construcoes de medidas, as mais notaveis talvez sejam medidas em conjuntos fractais,
conjuntos que nao possuem dimensao inteira, tais como o conjunto de Cantor6 , a curva de Koch7 (Fig.
19.1) e outras.

Figura 19.1: A curva de Koch.

Uma ilustra
c
ao elementar do Teorema de Caratheodory
O seguinte exerccio-exemplo ilustra o Teorema de Caratheodory.
6
7

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).


Niels Fabian Helge von Koch (1870-1924).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

951/1304

E. 19.6 Exerccio-exemplo. Sejam , e tres objetos distintos (por exemplo, tres letras distintas do
alfabeto grego). Seja X = {, , } e seja


(X) = , {}, {}, {}, {, }, {, }, {, }, {, , } .
Mostre que : (X)
() = 0,

+,

({}) = 1,

definida por
({}) = 1,

({}) = 2,

({, }) = 1,

({, }) = 3,

({, }) = 3,

({, , }) = 3,

e uma medida exterior em (X). Podemos, entao, nos perguntar: quais conjuntos A X tem a propriedade
de Caratheodory
(E) = (E A) + (E Ac )
para todo E (X)? Mostre explicitamente (ou seja, analisando caso-a-caso) que os elementos de


M = , {}, {, }, {, , }

possuem essa propriedade. Tem-se porem que


1. Para A = {} a propriedade falha com E = {, , } e com E = {, }.
2. Para A = {} a propriedade falha com E = {, , } e com E = {, }.
3. Para A = {, } a propriedade falha com E = {, , } e com E = {, }.
4. Para A = {, } a propriedade falha com E = {, , } e com E = {, }.
Constate tudo isso. Assim, apenas os elementos de M, acima, possuem a propriedade de Caratheodory.
Os fatos, garantidos pelo Teorema de Caratheodory, que M e uma -algebra e que restrita a M, ou
seja
() = 0, ({}) = 2, ({, }) = 1, ({, , }) = 3
e uma medida em M, podem ser facilmente verificados diretamente e, de fato, ja o fizemos no Exerccio E.
19.3, pagina 943.
6
Medidas Completas
Uma medida em uma -algebra M e dita ser completa se para todo A M com a propriedade que
(A) = 0 valer que todo B A e tambem elemento de M. Em palavras mais simples, e completa se
qualquer subconjunto de um conjunto de medida nula for tambem mensuravel.
Um exemplo de uma medida nao-completa e o aquele encontrado no Exerccio E. 19.2 da pagina 943.
Aquela medida nao e completa pois {, } e um conjunto de medida nula, mas possui sub-conjuntos,
{} e {}, que nao sao elementos de M.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

952/1304

Esse exemplo, ainda que um tanto elementar, ilustra que para uma medida ser completa deve estar
definida em uma -algebra rica o suficiente para poder conter todos os sub-conjuntos dos conjuntos de
medida nula. O Exerccio seguinte ilustra isso.
E. 19.7 Exerccio. Mostre que a medida definida no Exerccio E. 19.4, pagina 943, e completa. Compare
com a medida do Exerccio E. 19.2, pagina 943, em particular, compare as -algebras desses dois exerccios.
6
A medida do Exerccio E. 19.3, pagina 943, e completa pois la e o u
nico conjunto de medida
nula. A razao profunda daquela medida ser completa, porem, esta relacionada ao fato, estudado no
Exerccio E. 19.6, pagina 951, que aquela medida provem de uma medida exterior. Esse e o nosso
proximo assunto.
Medidas Completas e o Teorema de Caratheodory
Mostraremos que qualquer medida construda pelo procedimento de Caratheodory, ou seja, a partir
de uma medida exterior, e completa. Isso e o conte
udo do seguinte teorema:
Teorema 19.2 Seja uma medida exterior em um conjunto n
ao-vazio X e sejam M e a -
algebra
o de Caratheodory. Ent
ao, e completa, ou seja, se A e
e a medida associadas a pela construca
um conjunto -mensur
avel e (A) = 0 segue que todo B A e tambem -mensur
avel (um fato n
ao
trivial!) e (B) = 0.
2
Prova. Para provar a afirmativa note que, se E X e B A com A sendo -mensuravel, entao
(E B) (E A) (A) = (A) = 0,

(19.3)

(E B c A) (A) = (A) = 0,

(19.4)

(E A) (A) = (A) = 0,

(19.5)

pois E B c A e E A sao ambos subconjuntos de A e, para medidas exteriores, vale que se M N

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 19

953/1304

entao (M ) (N ). Logo,
(19.3)

(E B) + (E B c )

e -mensur
avel

(E B c Ac ) + (E B c A)

(E (B A)c ) + (E B c A)

BA

(E Ac ) + (E B c A)

(19.4)

(E Ac )

(19.5)

(E Ac ) + (E A)

(E B c )

e -mensur
avel

(E) .

Assim, estabeleceu-se que para todo E X vale (E) = (E B) + (E B c ) e, portanto, B e


-mensuravel. O fato que (B) = 0 e agora trivial pois B A e, portanto, (B) (A) = 0.
Nota. Nao poderamos logo de partida ter concludo que (B) = 0 do fato que B A e, portanto,
(B) (A) = 0, pois nao estava ainda estabelecido que B era -mensuravel e que (B) estivesse
definido.
A medida de Lebesgue, que construiremos no Captulo 20, e completa, pois e tambem construda
por uma medida exterior, seguindo Caratheodory. Ja a medida de Borel-Lebesgue, tambem tratada
naquele captulo, nao e completa.

Captulo 20
A Medida de Lebesgue
Conte
udo
20.1 A Constru
ca
o da Medida de Lebesgue . . . . . . . . . . . . . . . . . . . . . 954
20.1.1 A -algebra de Borel em


e a Medida de Borel-Lebesgue . . . . . . . . . . . 957

20.1.2 A Medida Produto e a Medida de Lebesgue em

n


. . . . . . . . . . . . . . . 960

20.2 Conjuntos de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 961


20.3 Bases de Hamel e a Medida de Lebesgue . . . . . . . . . . . . . . . . . . . 973

medida de Lebesgue1 em e o nome dado a` medida de comprimento usual de certos subconjuntos adequados da reta real. O termo adequado e crucial aqui pois, como discutimos no
incio do Captulo 19, nao e para qualquer subconjunto de que o conceito de comprimento
portanto, essencial determinar -algebras para cujos elementos a nocao de
esta definido. E,
comprimento nao envolva paradoxos como os que encontramos quando tratamos do comprimento do
conjunto de Vitali (pagina 939). Fora isso, desejamos que essa medida de comprimento satisfaca certas
condicoes adicionais, a mais importante sendo a invariancia por translacoes. Desejamos tambem que
os intervalos (a, b), [a, b], (a, b] e [a, b) sejam todos mensuraveis e com medida b a.


Para construir a medida de Lebesgue seguiremos a estrategia sugerida pelo Teorema de Caratheodory (Teorema 19.1, pagina 946): vamos primeiro construir uma medida exterior sobre os subconjuntos
de
que seja conveniente aos nossos propositos. O Teorema de Caratheodory, entao, afirma que
existe uma -algebra M sobre a qual a medida exterior e uma medida. Essa -algebra e denominada
-
algebra de Lebesgue e a medida correspondente e denominada medida de Lebesgue.


20.1

A Constru
c
ao da Medida de Lebesgue

Seja Ia, b o intervalo aberto (a, b) com < a < b < e sigamos a convencao que I a, b = caso
a = b. Como a e b sao finitos, Ia, b e dito ser um intervalo aberto finito. Para cada intervalo desse tipo
definamos o comprimento l(Ia, b ) = b a 0. Para duas seq
uencias de n
umeros reais {ai , i } e
{bi , i } satisfazendo < ai bi < para todo i , vamos definir


I{ai }, {bi } := {Iai , bi , i




},

que e uma colecao contavel formada por intervalos abertos finitos ou pelo conjunto vazio. O conjunto
de todas as colecoes I{ai }, {bi } sera denotado por I.
Doravante, para nao sobrecarregar a notacao, denotaremos as colecoes I {ai },{bi } apenas por I, quando
nao houver perigo de confusao.
1

Henri Leon Lebesgue (1875-1941).

954

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

Seja I uma colecao contavel de intervalos abertos finitos Iai , bi , i


comprimento total L(I) de I por
X
l(Iai , bi ).
L(I) :=
i

955/1304

, como acima. Definamos o

Note que os intervalos Iai , bi podem sobrepor-se. Assim, L(I) e apenas a soma do comprimento dos
intervalos de I, nao a medida de comprimento da uniao de todos os Iai , bi em I.
Seja agora E um sub-conjunto arbitrario de
(
IE =

. Denotemos por IE a colecao


)
[
Iai , bi com Iai , bi I .
I I, tal que E


Em palavras, IE e a colecao de todas as colecoes de intervalos abertos (ou conjunto vazio) cuja uniao
contem E. Se I IE , dizemos que a colecao de intervalos I cobre E.
Definamos entao

L (E) := inf L(I).

(20.1)

IIE

Vamos provar que L e uma medida exterior.


Em primeiro lugar, e facil ver pela definicao que L () =[0. Em segundo lugar, se A B entao
Iai , bi com Iai , bi I entao obviamente
IB IA pois se uma colecao de intervalos I e tal que B
i
[
A
Iai , bi pois A B. Portanto, L (A) L (B) dado que


inf L(I) inf L(I)

IIA

IIB

pois IB IA (e claro para voce a razao disso?).


!
X
[
Ai
L (Ai ) onde Ai sao subconjuntos de
Falta-nos apenas provar que L
i

. Observemos

em primeiro lugar o seguinte. Seja A um subconjunto qualquer da reta real e seja o conjunto I A de
todas as colecoes contaveis de intervalos cuja uniao contem A. Afirmamos que, para qualquer n
umero
real positivo r dado podemos encontrar pelo menos uma colecao I em IA tal que L(I) = L (A) + r.
Provar isso e simples. Se pela definicao L (A) = inf L(I) entao para qualquer > 0 deve haver
IIA

uma colecao I IA tal que L(I ) L (A) < . Vamos escolher < r e consideremos a colecao
I0 = I {(a, a)}, onde
r L(I ) + L (A)
a =
.
2
Como L(I ) L (A) < e r > , temos que a > 0. Fora isso e obvio que I0 IA , pois se a colecao I
ja cobre A entao I0 tambem deve faze-lo. Finalmente, e claro pela construcao que
L(I0 ) = L(I ) + l((a, a)) = L(I ) + r L(I ) + L (A) = L (A) + r.
Isto posto, seja para cada b


a colecao de intervalos Ib IAb tal que


L(Ib ) = L (Ab ) +


2b

JCABarata. Curso de Fsica-Matem


atica

para  > 0. A colecao J =


[

Ai . Fora isso,

956/1304

L(J) =
Como J cobre

Captulo 20

Ib e tambem uma colecao contavel de intervalos que cobrem o conjunto

Vers
ao de 29 de setembro de 2005.


X

L (Ab ) +

b=1

X

=
L (Ab ) + .
2b
b


Ai , segue que

Ai

L(J) =

L (Ab ) + .

Como isso vale para qualquer  > 0, segue que


L

Ai

X
b

L (Ab ).

Isso completa entao a prova que L e uma medida exterior.


Com isso em maos, temos agora permissao para evocar o Teorema de Caratheodory e afirmar que
a colecao ML formada por todos os subconjuntos A de X que tenham a propriedade que para todo
E X vale que
L (E) = L (E A) + L (E Ac ),
e uma -algebra e que L e uma medida em ML , que denotaremos por L . A medida L assim definida
e chamada de medida de Lebesgue e ML e chamada de -
algebra de Lebesgue. Os elementos de ML
sao chamados de conjuntos mensur
aveis por Lebesgue.
Antes de mostrarmos que a colecao ML e de fato nao-trivial (um fato que nao e obvio ate aqui), o
que faremos na Secao 20.1.1, vamos exibir duas propriedades basicas da medida de Lebesgue: invariancia
por translacoes e regularidade.
Invari
ancia de L por transla
co
es
A medida e Lebesgue da reta real satisfaz um requerimento basico associado a` nocao usual de
comprimento de conjuntos da reta real: invariancia por translacoes. Mais precisamente, tem-se que
para todo A ML e todo x
o conjunto transladado Ax e tambem elemento de ML e tem-se
L (Ax ) = L (A). A demonstracao desses fatos e simples e e deixada como exerccio ao estudante.


E. 20.1 Exerccio. Prove que para todo A ML e todo x tem-se Ax ML e que L (Ax ) =
L (A). Sugestao: Prove primeiro que para todo E e todo x tem-se L (Ex ) = L (E). Para isso,
use a definicao (20.1) e o fato evidente que l(Ia+x, b+x ) = l(Ia, b ). Em seguida, use esse fato para mostrar
que se A e mensuravel por Lebesgue entao Ax tambem o e (para qualquer x ), ou seja, mostre que se
L (E) = L (E A) + L (E Ac ) para todo E entao L (E) = L (E Ax ) + L (E Acx ) para todo
E . Conclua dos fatos acima que L (Ax ) = L (A) para todo A ML e todo x .
6


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

957/1304

Regularidade de L
A medida L possui as seguintes propriedades. Para todo B ML vale
L (B) = sup{L (C), C compacto com C B} (regularidade interior)
L (B) = inf{L (A), A aberto com A B}
Aqui, a topologia considerada e a topologia usual de

(20.2)

(regularidade exterior)

, .


As propriedades acima sao tambem validas em n . Nao apresentaremos as demonstracoes aqui e


o leitor podera encontra-las nos bons livros. Mencionamos que as propriedades de regularidade acima
sao importantes em varios desenvolvimentos.


*
Uma questao muito importante agora e saber se ML nao e uma -algebra trivial e se certos conjuntos razoaveis, tais como intervalos abertos, fechados e semi-abertos, sao mensuraveis por Lebesgue.
A resposta a esta questao e dada na proxima secao, onde discutiremos a relacao entre a -algebra de
Lebesgue em e a -algebra de Borel.


20.1.1

A -
algebra de Borel em


e a Medida de Borel-Lebesgue

A chamada -
algebra de Borel2 em e, por definicao, a menor -algebra que contem a topologia usual
de , . Ou seja, e a -algebra M[ ] gerada pela topologia . Vide definicao a` pagina 924. Como
veremos, essa -algebra esta relacionada a` -algebra de Lebesgue definida acima, sendo um subconjunto
da mesma (vide abaixo). Historicamente essa relacao foi estudada por Hausdorff, que provou tambem
que a cardinalidade de M[ ] e a de , enquanto que a de ML e maior.


Vamos primeiramente mostrar que qualquer intervalo aberto (a, b) e um elemento da -algebra
ML . Sem perda de generalidade, vamos considerar o intervalo aberto I = (0, 1). Tudo o que queremos
provar e que, para todo E , tem-se L (E) = L (I E) + L (I c E). Como E = (I E) (I c E)
temos sempre que L (E) L (I E) + L (I c E), pela propriedade 3 da definicao de medida exterior.
Desejamos entao provar que tambem vale L (E) L (I E) + L (I c E).


Vamos aqui adotar a seguinte convencao. Se A e uma uniao finita de intervalos disjuntos: A =
I1 In , entao definimos l(A) := l(I1 ) + + l(In ). Para tres conjuntos A, B e C quaisquer
formados por unioes finitas de intervalos disjuntos temos sempre que
l(A B C) = l(A) + l(B) + l(C) l(A B) l(A C) l(B C) + l(A B C).

(20.3)

E. 20.2 Exerccio. Prove isso. Sugestao: verifique primeiro que, se A 0 e C sao unioes finitas de intervalos
disjuntos, vale que sempre que l(A0 C) = l(A0 ) + l(C) l(A0 C) e entao adote A0 = A B para dois
conjuntos A e B, tambem formados por unioes finitas de intervalos disjuntos.
6
2

Felix Edouard
Justin Emile
Borel (1871-1956).

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

958/1304

Seja I IE uma colecao [


contavel de intervalos abertos finitos cuja uniao cobre E: I = {I j , j
, Ij = (ai , bi )} com E
Ij . Fixemos um  com 0 <  < 1 e definamos, para todo j , os


intervalos

Jj := Ij I,


Kj := Ij , j ,
2



Kj0 := Ij 1 j , .
2
(20.4)
Como Ij = Jj Kj Kj0 , segue por (20.3) que
l(Ij ) = l(Jj ) + l(Kj ) + l(Kj0 ) l(Jj Kj ) l(Jj Kj0 )
pois Kj Kj0 = . Como Jj Kj = Ij (0, /2j ) e Jj Kj0 = Ij (1 /2j , 1) temos l(Jj Kj ) /2j
e l(Jj Kj0 ) /2j .
Assim,

l(Ij ) l(Jj ) + l(Kj ) + l(Kj0 )


2j1

Defina agora
J := {Jj , j
K := {Kj , j

}.


} {Kj0 , j


}.

Pelas desigualdades acima sobre l(Jj ) e l(Kj ) temos


L(I) L(J) + L(K) 2.

(20.5)

Por outro lado, temos que a colecao de intervalos J cobre E I e K cobre E I c (por que?). Da
L(J) L (E I) e L(K) L (E I c ). Logo, (20.5) diz que
L(I) L (E I) + L (E I c ) 2.

(20.6)

Pela definicao da medida exterior L , sempre podemos escolher I de forma que L(I) L (E) +  (esta
claro para voce o porque disso?). Assim,
L (E) L (E I) + L (E I c ) 3.
Como essa desigualdade vale para todo  com 0 <  < 1, segue que
L (E) L (E I) + L (E I c ).

(20.7)

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

959/1304

Isso e o que queramos provar, pois implica entao que


L (E) = L (E I) + L (E I c ),
que afirma que I e um conjunto mensuravel por Lebesgue, de acordo com a definicao de Caratheodory.
A demonstracao acima nao vale somente para o intervalo I = (0, 1), mas pode ser repetida para
todo intervalo aberto finito (a, b) com < a < b < . Em verdade, uma simples inspecao mostra
que a mesma demonstracao pode ser repetida para intervalos finitos como [a, b], [a, b) ou (a, b]. Sem
surpresa, verifica-se que L ((a, b)) = b a etc.

Isso tem a seguinte conseq


uencia: como ML e uma -algebra, ML devera conter todo conjunto
que puder ser escrito como uma uniao contavel de intervalos abertos finitos. Vimos, quando mostramos
que e separavel, que qualquer aberto da topologia usual pode ser escrito como uma uniao contavel
e s > 0. Portanto temos que ML , de onde
de intervalos abertos finitos B(r, s) com r, s
segue que
M[ ] ML .
(20.8)


Um fato importante, mas que nao provaremos com todos os detalhes aqui, e que a -algebra de
Borel M[ ] e um subconjunto proprio3 de ML , ou seja, que ha conjuntos que sao mensuraveis de
Lebesgue mas que nao sao elementos da -algebra de Borel. Exemplos nao sao faceis de exibir, mas
uma classe deles sera discutido na Secao 20.3, pagina 973. Para discutirmos o fato de que a -algebra
de Borel M[ ] e um subconjunto proprio de ML facamos primeiro notar o seguinte resultado (que,
ademais, tem importancia por si so):


Proposi
c
ao 20.1 A medida de Lebesgue L e completa. Ou seja, se A e um conjunto mensur
avel por
Lebesgue e L (A) = 0 ent
ao todo B A e tambem mensur
avel de Lebesgue (um fato n
ao trivial!) e
L (B) = 0 4 .
2
Essa proposicao e um mero corolario do Teorema 19.2, pagina 952.
Como veremos quando discutirmos o chamado conjunto de Cantor, ha conjuntos na -algebra de
e tem medida de Lebesgue nula. Como
Lebesgue que sao nao-contaveis, tem a cardinalidade de
vimos, todos os subconjuntos de tais conjuntos sao tambem mensuraveis e, portanto, a colecao de
todos esses subconjuntos tem a cardinalidade de ( ) (que e maior que a de ). Entretanto, sabe-se
(por um teorema de Hausdorff) que M[ ] tem a cardinalidade de
e portanto M[ ] deve ser um
subconjunto proprio de ML .


Dada a relacao (20.8) podemos considerar a restricao da medida de Lebesgue a` -algebra de Borel
importante
M[ ]. Essa restricao da medida de Lebesgue e denominada medida de Borel-Lebesgue. E
notar que a maioria dos resultados importantes da Analise, especialmente da teoria de integracao,
pode ser obtida considerando-se apenas a medida de Borel-Lebesgue e muitos autores preferem trata-la
preferencialmente a` medida de Lebesgue. A medida de Borel-Lebesgue nao e completa.


Conjuntos cont
aveis da reta real t
em medida de Lebesgue nula
3
4

Aos estudantes: um conjunto A e dito ser um sub-conjunto pr


oprio de um conjunto B se A B mas A 6= B.
Isso vale tambem para conjuntos mensur
aveis de Lebesgue em n .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

960/1304

bastante facil de ser ver pela definicao que se a


E
entao L ({a}) = 0, ou seja, a medida de
Lebesgue de um conjunto constitudo por apenas um ponto e nula. Pela aditividade da medida, e
evidente da tambem que a medida de Lebesgue de qualquer sub-conjunto finito de
e igualmente
nula, pois se {a1 , . . . , an } e um conjunto com n elementos distintos, tem-se


L ({a1 , . . . , an }) = L ({a1 } {an }) = L ({a1 }) + + L ({an }) = 0 ,


pois L ({ak }) = 0, k {1, . . . , n}.

Da mesma forma, pela aditividade contavel (relacao (19.1), pagina 942), verifica-se que a medida
de Lebesgue de qualquer sub-conjunto contavel da reta e nula. De fato, se {an | n }
e
contavel, com todos os ak distintos, tem-se
!
[
X
L ({an | n }) = L
{an } =
L ({an }) = 0 ,


tambem pois L ({ak }) = 0, k . Assim, conclumos, por exemplo, que o conjunto dos n
umeros
umeros algebricos sao conjuntos de medida de Lebesgue nula.
racionais e o conjunto 0 dos n


Um ponto que nao pode deixar mencionado e que ha tambem sub-conjuntos nao-enumeraveis de
que tambem tem medida de Lebesgue nula. Veremos exemplos quando tratarmos dos chamados
conjuntos de Cantor na Secao 20.2, pagina 961.


Quase em toda parte


Se X e um conjunto no qual esta definida uma medida , uma afirmacao a respeito dos elementos
de X que for falsa apenas em um conjunto de medida nula e dita valer quase em toda a parte em
relacao a , ou -quase em toda parte. Abreviadamente, escreve-se tambem q.t.p. ou -q.t.p. 5 Nesse
esprito, dizemos que, em relacao a` medida de Lebesgue, quase todo n
umero real e irracional, pois so
nao sao irracionais os n
umeros racionais, que formam um conjunto de medida nula. Analogamente, em
relacao a` medida de Lebesgue, quase todo n
umero e transcendente.

20.1.2

A Medida Produto e a Medida de Lebesgue em

n


Vamos aqui discutir uma construcao geral de um espaco de medida em um espaco produto. Seja X um
conjunto com uma -algebra M e uma medida e seja tambem Y um conjunto com uma -algebra N
e uma medida . Considere o espaco produto Z = X Y . Podemos construir em Z uma -algebra e
uma medida da seguinte forma. Seja E um subconjunto arbitrario de Z e seja E a colecao de todas as
colecoes da forma da forma C = {Ai Bi , i } com Ai M e Bi N e tais que
[
E
Ai B i .


Defina para cada colecao C dessa forma a grandeza


X
m(C) =
(Ai )(Bi ).
i

Em lngua inglesa usa-se a.e.: almost everywhere.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

961/1304

Seja entao
(E) = inf m(C).
CE

E. 20.3 Exerccio. Mostre que e uma medida exterior em Z.

Com o resultado do u
ltimo exerccio e com o teorema de Caratheodory podemos construir uma
-algebra M em Z com uma medida que e denominada medida produto de com .
Com esta construcao podemos definir a medida produto da medida de Lebesgue em espacos

20.2

n


Conjuntos de Cantor

O conjunto de Cantor tern


ario
Dentre os subconjuntos mais interessantes e curiosos da reta real encontram-se os chamados conjuntos de Cantor6 . Ha varios tipos de conjuntos ditos de Cantor (para uma definicao tecnica geral,
vide pagina 1075). Iremos aqui apresentar alguns deles, comecando pelo mais simples e tradicional, o
chamado conjunto de Cantor tern
ario, C1/3 , o qual sera primeiramente definido de maneira informal.
Em seguida trataremos de modo mais preciso do mesmo, junto com suas generalizacoes.
O conjunto de Cantor ternario C1/3 e informalmente definido da seguinte forma. Comecamos com o
conjunto fechado T0 = [0, 1] do qual subtramos o conjunto aberto (1/3, 2/3) que consiste do conjunto
aberto de largura 1/3 da largura de T0 situado bem no meio de T0 . O que se obtemos e o conjunto
fechado T1 = [0, 1/3] [2/3, 1], formado pela uniao de dois intervalos fechados disjuntos. Em seguida,
subtramos de cada um desses intervalos fechados os conjuntos abertos situados no meio de ambos e
cuja largura e 1/3 da largura de cada um desses intervalos. Esses abertos serao (1/9, 2/9) para o
intervalo [0, 1/3] e (7/9, 8/9) para o intervalo [2/3, 1]. O que resulta disso e o conjunto fechado
T2 = [0, 1/9] [2/9, 1/3] [2/3, 7/9] [8/9, 1]. O passo seguinte repete os anteriores: subtramos de
cada um desses intervalos fechados os conjuntos abertos situados no meio de ambos e cuja largura e
1/3 da largura de cada um desses intervalos.
O processo e ilustrado na Figura 20.1. A linha de cima ilustra os intervalos abertos que vao sendo
sucessivamente subtrados do intervalo fechado T0 = [0, 1] e a linha de baixo os varios intervalos
fechados que resultam dessa subtracao. O primeiro conjunto aberto subtrado e (1/3, 2/3), indicado
por 1 na figura. O segundo conjunto aberto subtrado e (1/9, 2/9) (7/9, 8/9), indicado por 2 na
figura, e assim por diante.
O conjunto de Cantor C1/3 e o conjunto que resulta desse processo apos infinitos passos. C1/3 nao e
vazio, pois os pontos situados nas bordas dos intervalos fechados que vao sendo sucessivamente produzidos sobrevivem ao processo de subtracao. Isso se ve na Figura 20.1, pois os conjunto {0, 1}, que forma
a borda de T0 , surge novamente em T1 , T2 , T3 etc., assim como o conjunto {0, 1/3, 2/3, 1}, que forma a
borda de T1 , surge novamente em T2 , T3 etc., e como o conjunto {0, 1/9, 2/9, 1/3, 2/3, 7/9, 8/9, 1},
que forma a borda de T2 , surge novamente em T3 etc. C1/3 e um conjunto fechado por ser o complemento em [0, 1] de uma uniao de abertos (aqueles que vao sendo sucessivamente subtrados). Outra
6

Georg Ferdinand Ludwig Philipp Cantor (1845-1918).

JCABarata. Curso de Fsica-Matem


atica

1/27 2/27

( )

7/27 8/27

(
1/9

Captulo 20

Vers
ao de 29 de setembro de 2005.

19/27 20/27

( )

2/9

1/3

2/3

( )

25/27 26/27

(
7/9

( )

8/9

T1

1/3

T2

1/9

[
0

T3

962/1304

]
1/27 2/27

[ ]

1/9

[ ]

2/9

2/9

]
7/27

[ ]

8/27

]
7/9

2/3

1/3

2/3

2/3 19/27 20/27 7/9

1/3

[ ]

[ ]

[ ]

8/9

[
8/9

]
25/27 26/27 1

[ ]

[ ]

Figura 20.1: As tres primeiras etapas da construcao do conjunto de Cantor ternario C 1/3 .

forma de ver isso e notar que T1 T2 T3 T4 , ou seja, Tm Tn para todos m > n, o que nos
leva a concluir que

\
C1/3 =
Tn .
(20.9)
n=0

Como se sabe, uma interseccao de fechados e tambem um fechado.

Um aspecto um tanto surpreendente sobre C1/3 e que seu interior e vazio, ou seja, C1/3 nao contem
nenhum aberto. Isso segue do fato que intervalos fechados que formam os conjuntos Tn tem, cada
um, largura (1/3)n e, portanto, seu interior vai diminuindo a medida que n cresce. A afirmacao que
C1/3 nao contem nenhum aberto pode ser provada da seguinte forma. Se C1/3 contivesse um aberto,
conteria algum intervalo aberto (a, b) (por que? Lembre-se da definicao de conjuntos abertos em
espacos metricos). Assim, (a, b) = (a, b) C1/3 . Por (20.9), teramos
!



\
\
Tn =
(a, b) Tn .
(20.10)
(a, b) = (a, b) C1/3 = (a, b)
n=0

n=0

Agora, para todo n grande o suficiente tal que (1/3)n < ba, os conjuntos (a, b)Tn sao sub-conjuntos
proprios7 de (a, b), pois cada intervalo fechado que compoe Tn tem largura (1/3)n . Portanto, o lado
direito de (20.10) e um sub-conjunto proprio de (a, b) e a igualdade em (20.10) passa a ser absurda.
Um conjunto com a propriedade de nao conter nenhum aberto e dito ser denso em parte alguma
(para tais definicoes, vide Secao 24.1).
Por ser fechado, C1/3 e um conjunto mensuravel por Lebesgue, ou seja, possui um comprimento.
facil perceber que L (Tn+1 ) =
Um ponto importante e determinar a medida de Lebesgue de C1/3 . E
7

Aos estudantes: um conjunto A e dito ser um sub-conjunto pr


oprio de um conjunto B se A B mas A 6= B.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

963/1304

(2/3)L (Tn ), pois a cada etapa e eliminado um terco dos intervalos fechados de Tn . Assim, como
L (T0 ) = 1, segue que L (Tn ) = (2/3)n . Da8 L (C1/3 ) = limn L (Tn ) = limn (2/3)n = 0, ou seja,
o conjunto ternario de Cantor C1/3 e um conjunto de medida de Lebesgue nula.
A cardinalidade de C1/3
Um outro fato importante sobre C1/3 e que o mesmo tem a cardinalidade de , sendo, portanto,
um exemplo de um conjunto nao-contavel de medida de Lebesgue nula. Vamos mostrar isso e, para
tal, comecaremos provando que C1/3 nao e contavel.


Para provar que C1/3 nao e contavel, demonstremos a seguinte afirmacao, que apresentamos para
futura referencia na forma de uma proposicao. Essa proposicao equivale a uma outra caracterizacao de
C1/3 (de fato, alguns autores definem C1/3 dessa forma):
Proposi
c
ao 20.2 C1/3 e o subconjunto de [0, 1] composto por todos os n
umeros c que podem ser

X
tn
, sendo que cada tn pode apenas assumir os valores 0 ou 2. Isso equivale
escritos na forma c =
n
3
n=1
a dizer que c C1/3 se e somente se for representado na base tern
aria na forma c = 0, t1 t2 t3 t4 . . . onde
cada dgito tn vale ou 0 ou 2.
2
Antes de entrar na prova dessa proposicao, recomendamos ao estudante o seguinte exerccio.
E. 20.4 Exerccio. Sabemos que 1/3 pertence a C1/3 . Esse numero pode ser representado na base
ternaria por 0, 1, o que parece contradizer o que afirmamos acima sobre os elementos de C 1/3 . Porem, essa
nao e a u
nica forma de representar 1/3. Mostre que na base ternaria 1/3 tambem pode ser escrito como
0, 0222222 . . ..
6
Prova da Proposicao 20.2. Tentemos localizar onde, no intervalo [0, 1], encontram-se os n
umeros cujo
n-esimo dgito na base ternaria e 1, sendo que entre os seguintes pelo menos um e nao-nulo. Tais
n
umeros sao da forma 0, t1 tn1 1tn+1 . . ., sendo que pelo menos um dos tm com m n+1 e nao-nulo.
Alguns segundos de meditacao nos levam a concluir que esses n
umeros encontram-se no intervalo aberto
situado entre 0, t1 tn1 1 e 0, t1 tn1 2, ou seja, em ( 0, t1 tn1 1, 0, t1 tn1 2 ). Agora,
0, t1 tn1 1 = 0, t1 tn1 +

1
3n

0, t1 tn1 2 = 0, t1 tn1 +

Assim, o intervalo ( 0, t1 tn1 1, 0, t1 tn1 2 ) e o intervalo




2
1
,
3n 3n

2
3n

transladado de 0, t1 tn1 .


1
2
Observe-se, entao, que esse intervalo
,
e um dos intervalo abertos subtrado de Tn1
3n 3n
quando do processo de construcao do conjunto C1/3 , a saber, o mais proximo de 0 (vide
20.1).
 Figura 
1
2
Devemos entao nos perguntar: quais sao os outros intervalos obtidos transladando
, n por
n
3
3
8

O por que de valer L (C1/3 ) = limn L (Tn ) e intuitivo, mas ser


a justificado com base em uma propriedade geral
de medidas ao discutirmos sua generalizaca
o, a equaca
o (20.18), p
agina 969.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

964/1304

todos n
umeros da forma 0, t1 tn1 ? Como todos os n
umeros da forma 0, t1 tn1 podem ser obti1
dos somando repetidamente o n
umero n1 (certo?) conclumos que os intervalos podem ser obtidos
3


1
1
2
transladando-se
sucessivamente
por
,
a` direita. Mais uma curta meditacao nos leva
3n 3n
3n1
a concluir que os intervalos assim obtidos ou sao precisamente aqueles subtrados de T n1 quando do
processo de construcao do conjunto C1/3 ou estao contidos nos intervalos subtrados anteriormente dos
conjuntos Tm com m < n 1.
Conclumos, assim, que os n
umeros da forma 0, t1 tn1 1tn+1 . . ., sendo que pelo menos um dos
tm com m n + 1 e nao-nulo, nao pertencem a C1/3 .

O que fizemos nao exclui ainda de C1/3 n


umeros que sejam da forma 0, t1 tn1 1, com tj {0, 2},
j = 1, . . . , n 1. Tais n
umeros tambem pertencem a C1/3 , pois formam uma das bordas de alguns
conjuntos abertos ( 0, t1 tn1 1, 0, t1 tn1 2 ) que tratamos acima. Porem, o Exerccio E. 20.4,
acima, nos ensina que tais n
umeros podem ser tambem representados como 0, t1 tn1 022222 . . ., com
o n-esimo dgito igual a 0 seguido de infinitos 2s.
E. 20.5 Exerccio. Certo?

Com isso a prova da Proposicao 20.2 esta concluda.


A afirmacao da Proposicao 20.2 conduz diretamente a` conclusao que C 1/3 nao e enumeravel. Por
aquela proposicao, todo c C1/3 e (fatorando o n
umero 2) da forma c = 20, d1 d2 d3 . . . com dn {0, 1}
para todo n. Assim, a demonstracao que C1/3 nao e enumeravel e, mutatis mutantis, identica a`
demonstracao que
nao e contavel fornecida no Captulo 1 na prova do Teorema 1.4, pagina 39.
Deixamos os detalhes como exerccio.


E. 20.6 Exerccio. Faca-o!

E. 20.7 Exerccio.
Mostre que 1/4 e 1/13 pertencem a C1/3 pois, na base ternaria, 1/4 pode ser
representado como 0, 02020202 . . . e 1/13 como 0, 002002002002 . . .. Note que 1/4 e 1/13 nao pertencem
`a borda de nenhum Tn !
6
O seguinte fato sera usado em outros lugares.
Lema 20.1 Todo elemento x [0, 1] pode ser escrito na forma x = c1 + c2 /2 com c1 , c2 C1/3 .

X
tn
Prova. Todo elemento x [0, 1] pode ser representado na forma x =
, onde tn {0, 1, 2}
3n
n=1
(representacao na base ternaria). A soma acima pode ser quebrada em duas, uma contendo apenas
X tn
1 X 2
+
, onde Nx := {n| tn
termos onde cada tn vale 0 ou 2 e outra onde tn = 1: x =
3n 2
3n
nNx

n6Nx

{0, 2}}. Agora, os elementos de C1/3 sao precisamente aqueles cujos dgitos na representacao na base
ternaria sao 0 ou 2 (Proposicao 20.2). Logo, vimos que todo x [0, 1] pode ser escrito na forma
x = c1 + c2 /2, com c1 , c2 C1/3 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

965/1304

Chegamos agora a`
Proposi
c
ao 20.3 C1/3 tem a cardinalidade de


Prova. Pelo Lema 20.1 todo elemento x [0, 1] pode ser escrito como x = c1 + c2 /2 com c1 , c2 C1/3 .
Isso mostra que [0, 1] (e, portanto, ) tem a cardinalidade de um subconjunto de C1/3 C1/3 , cuja
cardinalidade e menor ou igual a de 2 que, por sua vez, tem a cardinalidade de
(Proposicao 1.7,
pagina 40). Logo C1/3 C1/3 tem a cardinalidade de . Paralelamente, o mesmo argumento usado na
prova da Proposicao 1.7 conduz a` conclusao que C1/3 e C1/3 C1/3 tem a mesma cardinalidade. Isso
completa a prova.


O conjunto de Cantor tern


ario
e denso em si mesmo e totalmente desconexo
Vamos provar agora que o conjunto de Cantor ternario e denso em si mesmo e totalmente desconexo.
Para as definicoes e fatos basicos que usaremos, recomenda-se a leitura previa da Secao 24.1, pagina
1070.
Para mostrar que C1/3 e um conjunto denso em si mesmo, sejam c, c0 C1/3 e que, portanto,
tenham representacoes em base ternaria 0, c1 c2 c3 . . . e 0, c01 c02 c03 . . ., respectivamente, com cn , c0n {0, 2}
para todo n (Proposicao 20.2). Entao, se os primeiros m dgitos de c e c0 forem identicos, teremos
|c c0 | 2/3m . Escolhendo m grande o suficiente isso pode ser feito menor que qualquer  > 0 dado.
Isso mostra que qualquer aberto contendo c C1/3 contem outros elementos de C1/3 diferentes de c,
provando que C1/3 e um conjunto denso em si mesmo.
O mesmo tipo de argumento tambem mostra que arbitrariamente proximo a qualquer elemento
c C1/3 ha elementos que nao pertencem a C1/3 . Se c tem a representacao ternaria 0, c1 c2 c3 . . .,
escolhamos x [0, 1] da seguinte forma: seus m primeiros dgitos sao iguais ao de c, o m-esimo dgito
de x e 1 e dentre os seguintes pelo menos um e nao-nulo. Um tal x nao pertence a C1/3 , mas a distancia
do mesmo a c e menor que 2/3m . Essa distancia, porem, pode ser feita menor que qualquer  > 0 dado,
se escolhermos m grande o suficiente.
facil de se ver que C1/3 e um sub-conjunto desconexo de
na topologia , pois um par de
E
abertos como A1 = (1, 1/2) e A2 = (1/2, 2) desconecta C1/3 (verifique!). Pelo que acabamos de ver,
dados c, c0 C1/3 com c < c0 , existe x 6 C1/3 tal que c < x < c0 . Assim, os abertos A1, x = (1, x)
e A2, x = (x, 2) tambem desconectam C1/3 . Dessa forma, nao existe nenhum sub-conjunto conexo de
C1/3 que contenha c e c0 (um tal conjunto seria desconectado pelos abertos A1, x e A2, x ). Logo, c e
c0 pertencem a componentes conexas distintas. Como isso vale para todos c e c0 em C1/3 com c < c0 ,
conclumos que as componentes conexas de C1/3 possuem exatamente um elemento. Isso significa que
C1/3 e totalmente desconexo, como queramos mostrar.


*
Em resumo, conclumos que C1/3 e um sub-conjunto fechado e limitado de , mensuravel de Lebesgue, nao-contavel, com a cardinalidade de , denso em parte alguma, denso em si mesmo e totalmente
desconexo. Pelo fato de C1/3 ser fechado e limitado, C1/3 e um conjunto compacto. Pelo fato de C1/3


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

966/1304

ser fechado e denso em si mesmo, C1/3 e um conjunto perfeito. Por ser tambem totalmente desconexo,
C1/3 e um conjunto de Cantor segundo a definicao geral da Secao 24.1.
Mais exemplos de conjuntos de Cantor
Vamos agora generalizar e formalizar as ideias desenvolvidas na construcao de C 1/3 e construir
outros conjuntos semelhantes.
Diremos que um intervalo fechado [a, b] e finito se < a < b < . Note que exclumos a = b.
Denotaremos por F0 a colecao de todos os sub-conjuntos da reta real que sejam formados por unioes
finitas de intervalos fechados finitos e disjuntos. Assim, se F F0 , entao F e da forma
F = F1 Fk
para algum k , k 1, onde cada Fj e um intervalo fechado finito Fj = [aj , bj ] com < aj <
bj < e onde os Fj s sao disjuntos dois-a-dois, ou seja, Fi Fj = caso i 6= j.


Por ser uma uniao finita de fechados, cada elemento de F0 e tambem um conjunto fechado.

tal que 0 < f < 1. Denominaremos um tal f uma fraca


o9 . Para cada fracao f
Seja f
definiremos uma aplicacao Tf : F0 F0 da seguinte forma: Para um intervalo finito F = [a, b]
definimos




a(1 + f ) + b(1 f ) [ a(1 f ) + b(1 + f )
Tf (F ) = Tf ([a, b]) := a,
, b
(20.11)
2
2


Para um elemento generico F = F1 Fk de F0 , definimos

Tf (F) = Tf (F1 Fk ) := Tf (F1 ) Tf (Fk ) .

(20.12)

Note que para 0 < f < 1 tem-se


a(1 f ) + b(1 + f )
a(1 + f ) + b(1 f )
<
<b.
2
2
Portanto, para todo intervalo finito F , tem-se
a <

Tf (F ) F.
Em verdade, Tf (F ) e um sub-conjunto proprio de F . Segue facilmente disso que, para todo F F0 ,
Tf (F) F.
E. 20.8 Exerccio. Verifique todas as afirmacoes acima.

Qual a interpretacao geometrica de Tf ? Para isso, vamos descrever o que e Tf ([a, b]). Esse conjunto
e obtido subtraindo-se do intervalo fechado finito [a, b] o conjunto aberto de largura f (b a) centrado
no ponto a+b
, que fica bem no centro de [a, b]. Como e facil ver, esse intervalo aberto e
2




a + b f (b a) a + b f (b a)
a(1 + f ) + b(1 f ) a(1 f ) + b(1 + f )
=
.

,
+
,
2
2
2
2
2
2
9

Exclumos os casos f = 0 e f = 1 pois, como poder-se-


a constatar, eles levam a situaco
es triviais

JCABarata. Curso de Fsica-Matem


atica

Assim,
Tf ([a, b]) = [a, b] \

Vers
ao de 29 de setembro de 2005.

Captulo 20

a(1 + f ) + b(1 f ) a(1 f ) + b(1 + f )


,
2
2

967/1304

Operando em F = F1 Fk , a operacao Tf subtrai de cada Fj o intervalo aberto de largura f


centrado no ponto intermediario de Fj .
importante notar que se F F0 e composto por k intervalos fechados finitos disjuntos entao,
E
Tf (F) e composto por 2k intervalos fechados finitos disjuntos.
Como Tf e uma aplicacao de F0 em F0 , podemos compor Tf consigo mesma. Denotamos, para
n ,
Tfn Tf Tf .
{z
}
|
n vezes
Com isso, se F e um intervalo fechado finito, Tfn (F ) e um elemento de F0 composto por 2n intervalos
fechados finitos disjuntos, todos eles contidos em F .


Para o que segue e muito importante determinarmos a medida de Lebesgue dos conjuntos Tfn (F ),
que vem a ser a soma dos comprimentos dos 2n intervalos fechados finitos disjuntos que o compoe. Para
isso, e importante ver que se F = [a, b], entao




a(1 + f ) + b(1 f ) [ a(1 f ) + b(1 + f )
L (Tf (F )) = L (Tf ([a, b])) = L
a,
, b
2
2




a(1 + f ) + b(1 f )
a(1 f ) + b(1 + f )
= L a,
, b
+ L
2
2





a(1 + f ) + b(1 f )
a(1 f ) + b(1 + f )
=
a + b
2
2
= (1 f )(b a)
= (1 f )L (F ) .

(20.13)

tambem claro que para todo F F0 da forma F = F1 Fk , onde os Fj sao intervalos fechados
E
finitos e disjuntos, tem-se
L (F) = L (F1 ) + + L (Fk ) .
Segue tambem de (20.12) que se F = F1 Fk entao
L (Tf (F)) = L (Tf (F1 ) Tf (Fk )) = L (Tf (F1 )) + + L (Tf (Fk ))
= (1 f )

k
X
j=1

L (Fj ) = (1 f )L (F) ,

ou seja,
L (Tf (F)) = (1 f )L (F) .

(20.14)

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

968/1304

Desses fatos, e muito facil provar por inducao que


L (Tfn (F )) = (1 f )n L (F ) .
para todo n


(20.15)

e todo intervalo fechado finito F .

E. 20.9 Exerccio. Prove isso!

bastante evidente por (20.11) que os bordos a e b de um intervalo fechado finito F = [a, b]
E
satisfazem a Tf (F ) e b Tf (F ). Da, conclu-se tambem que a e b sao elementos de todos os
conjuntos Tfn (F ). Assim,
Un, f (F ) := F \ Tfn (F ) = F (Tfn (F ))c = F 0 (Tfn (F ))c .

Aqui F 0 := (a, b), o interior de F . Como os conjuntos Tfn (F ) sao fechados, os conjuntos Un, f (F ) sao
sub-conjuntos abertos de F , por serem a interseccao de dois abertos: F 0 e (Tfn (F ))c . Note-se que
Un, f (F ) Un+1, f (F ),

n


(20.16)

pois Tfn+1 (F ) = Tf (Tfn (F )) Tfn (F ).


Teremos tambem que

L (Un, f (F )) = L (F ) L (Tfn (F )) = [1 (1 f )n ] L (F ) .
Para um intervalo fechado finito para F = [a, b] e uma fracao f , definimos o Cf (F ) por
\
Cf (F ) :=
Tfn (F ) .
n

O conjunto de Cantor ternario C1/3 , que definimos informalmente paginas acima, corresponde a C1/3 ([0, 1]).
Note que Cf (F ) nao e vazio, pois contem pelo menos os pontos a e b, assim como os pontos
)
e a(1f )+b(1+f
e, em verdade, todos os pontos que formam as bordas de cada intervalo
2
fechado finito que compoe os conjuntos Tfn (F ), pois, como observamos acima, cada aplicacao Tf mantem
esses pontos no conjunto resultante.
a(1+f )+b(1f )
2

A primeira observacao que fazemos sobre Cf (F ) e que se trata de um sub-conjunto fechado de F ,


pois e uma interseccao de fechados. Definimos tambem
Uf (F ) := F \ Cf (F ) = F (Cf (F ))c = F 0 (Cf (F ))c ,

(20.17)

que e naturalmente um sub-conjunto aberto de F , por ser a interseccao de dois abertos: F 0 e (Cf (F ))c .
Vemos que
!c
!
[
[
\
[

c 
c
Uf (F ) = F 0
Tfn (F )
Tfn (F )
F 0 Tfn (F )
=
Un, f (F ) .
= F0
=
n

possvel tambem provar (mas nao o faremos aqui) que Cf (F ) tem a mesma cardinalidade de .
E
Fora isso, Cf (F ) compacto (por ser fechado e limitado) totalmente desconexo, denso em parte alguma


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

969/1304

e denso em si mesmo e, portanto, e perfeito. (Essas definicoes sao apresentadas na Secao 24.1, pagina
1070). Assim, pela definicao geral da pagina 1075, Cf (F ) e um conjunto de Cantor.
Vamos agora determinar a medida de Lebesgue de Cf (F ) e de Uf (F ), comecando pela segunda.
Por (20.16), podemos aplicar a propriedade geral de medidas 3 da pagina 944 e concluir que
L (Uf (F )) = lim L (Un, f (F )) = lim [1 (1 f )n ] L (F ) = L (F ),
n

(20.18)

ja que 0 < (1 f ) < 1. Por (20.17) tem-se tambem que L (Uf (F )) = L (F ) L (Cf (F )) e conclumos
que
L (Cf (F )) = 0 .
Cf (F ) e assim um sub-conjunto fechado, denso em parte alguma, denso em si mesmo e com a
cardinalidade de
mas com medida de Lebesgue nula! Seu complemento em F , que e o aberto Uf ,
tem a mesma medida que F !


Os conjuntos de Cantor Cf (F ) tem uma outra propriedade interessante: sao conjuntos fractais. A
umero inteiro,
eles pode-se atribuir uma dimensao (chamada de dimens
ao de Hausdorff) que nao e um n
no caso, um n
umero real positivo menor que 1 relacionado a f . Especificamente para o conjunto de
Cantor ternario C1/3 , a dimensao de Hausdorff e ln(2)/ ln(3) (vide e.g. [37]). Apesar de os mesmos
terem medida de Lebesgue nula, ha uma outra medida (denominada medida de Hausdorff) que pode
ser definida em F e que nao se anula em Cf (F ). Nao trataremos de sua construcao na presente versao
destas Notas, mas a mesma segue passos semelhantes a` construcao da medida de Lebesgue, atraves
de uma medida exterior e evocando o Teorema de Caratheodory. O leitor interessado podera colher
informacoes mais tecnicas sobre tais assuntos em textos como [53] e, especialmente, [37].
Ainda mais exemplos de conjuntos de Cantor (com uma surpresa)
As ideias a a construcao dos conjuntos de Cantor Cf (F ), acima, podem ser generalizadas ainda
mais. Seja {f } := {fj , j } uma seq
uencia de fracoes. Cada fj satisfaz 0 < fj < 1, mas nao
precisam ser todos iguais. Para n , defina-se


n
T{f
} T fn T fn .

(20.19)

n
Pelas mesmas razoes que acima (confira!), cada T{f
e tambem uma aplicacao de F0 em F0 .
}
n
Nota. O estudante deve atentar para o fato que o n que aparece no expoente de T {f
} representa o
n
umero de aplicacoes que aparecem compostas no lado direito de (20.19), nao uma potencia de uma
u
nica aplicacao.

Para um intervalo fechado e finito F = [a, b], tem-se tambem que


n
T{f
} (F ) = Tfn Tfn (F ) F .
n
Como antes, os conjuntos T{f
ao compostos por 2n intervalos fechados e as bordas desses intervalos
} (F ) s
m
estarao contidas em todos os conjuntos T{f
} (F ) com m > n. Fora isso,
m
n
T{f
} (F ) T{f } (F ),

para todos m > n .

(20.20)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

970/1304

m
n
Em verdade os T{f
ao sub-conjuntos proprios de T{f
em que
} (F ) s
} (F ) para todos m > n. Temos tamb
n
n
c
0
n
c
Un, {f } (F ) := F \ T{f
} (F ) := F (T{f } (F )) = F (T{f } (F )) .
n
Como os conjuntos T{f
ao fechados, os conjuntos Un, {f } (F ) sao sub-conjuntos abertos de F , por
} (F ) s
n
c
serem a interseccao de dois abertos: F 0 e (T{f
} (F )) . Note-se novamente que

Un, {f } (F ) Um, f (F ),

n<m,

(20.21)

por (20.20).
Definimos entao, em completa analogia com o apresentado acima, os conjuntos
\
n
C{f } (F ) :=
T{f
} (F ) .
n

e
U{f } (F ) := F \ C{f } (F ) = F (C{f } (F ))c = F 0 (C{f } (F ))c .
C{f } (F ) e tambem um sub-conjunto fechado de F , pois e uma interseccao de fechados. U{f } (F ) e um
sub-conjunto aberto de F , por ser a interseccao de dois abertos: F 0 e (C{f } (F ))c . Vemos novamente
que
!c
!
[
\
[
[

c 
c
n
n
n
T{f
F 0 T{f
=
U{f } (F ) = F 0
T{f
Un, {f } (F ) .
=
= F 0
} (F )
} (F )
} (F )
n

possvel tambem provar (mas nao o faremos aqui) que C{f } (F ) tem a mesma cardinalidade de
E
. Fora isso, C{f } (F ) compacto (por ser fechado e limitado) totalmente desconexo, denso em parte
alguma e denso em si mesmo e, portanto, e perfeito. (Essas definicoes sao apresentadas na Secao 24.1,
pagina 1070). Assim, pela definicao geral da pagina 1075, Cf (F ) e um conjunto de Cantor.


Quanto a` medida de Lebesgue de C{f } (F ), ocorre aqui uma surpresa. Como antes, temos que
L (U{f } (F )) = L (F ) L (C{f } (F )) e que
L (U{f } (F )) = lim L (Un, {f } (F )) .
n

Vamos porem, calcular L (Un, {f } (F )). Sabemos que


n
L (Un, {f } (F )) = L (F ) L (T{f
} (F )) .

Agora,
n1
n1
n
L (T{f
} (F )) = L (Tfn T{f } (F )) = (1 fn )L (T{f } (F )) = (1 fn ) (1 f1 )L (F ) ,

onde, acima, usamos (20.14). Dessa forma,


L (Un, {f } (F )) =

"

n
Y
j=1

(1 fj ) L (F )

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

971/1304

e, portanto, usando novamente a propriedade geral de medidas 3 da pagina 944, tem-se


"
#
"
#
n
n
Y
Y
L (U{f } (F )) = lim 1
(1 fj ) L (F ) = 1 lim
(1 fj ) L (F ) .
n

j=1

j=1

O ponto, porem, e que, aoQcontrario do caso anterior quando todos os f j s eram iguais, nao se pode
sempre concluir que limn nj=1 (1 fj ) = 0 mesmo que 0 < (1 fj ) < 1 para todo j. Tomemos, por
2
exemplo, a seq
uencia fj = 1 e1/j . Teremos
!
!

n
n
X
Y
X
1
1
2 /6
=
exp

=
e
> 0
lim
(1 fj ) = lim exp
2
2
n
n
j
j
j=1
j=1
j=1
e, com isso,
L (U{f } (F )) =
e

1e

2 /6

L (C{f } (F )) = e

2 /6

L (F ) < L (F )

L (F ) > 0 .

O conjunto de Cantor C{f } (F ) com a seq


uencia {f } dada acima tem medida de Lebesgue nao-nula.
Condi
c
ao para os conjuntos C{f } (F ) terem medida de Lebesgue n
ao-nula
Voltando a seq
uencias {fj , j } gerais, conclumos do Lema 20.2, a seguir, que uma condicao
necessaria e suficiente para que C{f } (F ) tenha medida de P
Lebesgue nao-nula e que a seq
uencia de

fracoes {f } = {fj , 0 < fj < 1, j } seja somavel, ou seja j=1 fj < .


P
No caso do conjunto de Cantor ternario C1/3 , essa condicao e violada, pois obviamente
j=1 1/3 =
, o mesmo se dando para os conjuntos Cf (com 0 < f ).


uencia de n
umeros tais que 0 < fj < 1 para todo j, ent
ao a
Lema 20.2 Se {fj , j } e uma seq
n

Y
X
condica
o para que lim
(1 fj ) > 0 e equivalente a
` condica
o
ln(1 fj ) < . Essa por sua vez


j=1

e equivalente a
` condica
o

j=1

j=1

fj < .

Prova. Notemos primeiro que


n
Y
j=1

Qn

(1 fj ) = exp

n
X
j=1

[ ln(1 fj )]

P
Logo, limn j=1 (1 fj ) > 0 se e somente se a serie de n
umeros positivos
j=1 [ ln(1 fj )] for
finita. Estudemos uma condicao necessaria e suficiente para que isso ocorra. Para x [0, 1) tem-se
que x ln(1 x). Isso se ve notando que a funcao
f (x) := x ln(1 x)

satisfaz

f 0 (x) =

x
0
(1 x)

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

972/1304

para x [0, 1), o que mostra que


Pnf e crescente
Pn nesse intervalo. Como f (0) = 0, conclumos que
f (x) 0 para
x

[0,
1).
Assim,
f

umeros
j=1 j
P
P j=1 ln(1 fj ), mostrando que se a serie de n
positivos j=1 ln(1 fj ) for finita, a serie j=1 fj tambem o sera.
P
umero fixo tal que 0 < M < 1.
Reciprocamente, suponhamos que
j=1 fj converge. Seja M um n
Vamos mostrar que existe um J tal que fj < M para todo j > J. Para isso, vamos supor o contrario
e assumir que
colecao infinita fj1 , fj2 , . . . tal que fjl M para todo l 1. Teramos que
P
P
Phaja uma

cao. Assim, a colecao fj1 , fj2 , . . . deve ser finita e


j=1 fj
l=1 fjl
l=1 M = , uma contradi
podemos tomar J como o maior dos ndices jl . Podemos entao escrever

fj =

j=1

J
X
j=1

fj +

fj

j=J+1

com a garantia que na, u


ltima soma, todo fj satisfaz 0 < fj < M para um certo 0 < M < 1 fixado.
Agora, observemos que no intervalo [0, M ] a funcao g(x) := ln(1 x) e contnua, limitada,
diferenciavel e satisfaz g 00 (x) = 1/(1 x)2 > 0. Assim, g e convexa10 naquele intervalo e, portanto,
tem-se
(g(M ) g(0))
g(x) g(0) +
x,
M
ou seja,
ln(1 M )
x,
(20.22)
ln(1 x)
M
desigualdade essa que pode ser constatada graficamente11 . Logo,

X
j=1

ln(1 fj ) =

Todavia, a soma

j=J+1

J
X
j=1

ln(1 fj )

j=J+1

ln(1 fj )

J
X
j=1

fj e finita, por hipotese, provando que

ln(1 fj )
P

j=1

ln(1 M ) X
fj .
M
j=J+1

ln(1 fj ) tambem o e.

*
Vimos assim que existem in
umeros conjuntos de Cantor C{f } (F ) com medida de Lebesgue naonula. A existencia de conjuntos com tais propriedades e um dos fatos mais surpreendentes da Teoria
da Medida. Nenhuma intuicao a justifica ou esclarece.
Conjuntos de Cantor e outros conjuntos fractais (como a curva de Koch da Figura 19.1, pagina
950) podem ser contrudos em varias dimensoes e nao sao apenas uma curiosidade matematica, pois
podem ser observados na natureza. A Figura 20.2, pagina 975, mostra imagens dos aneis de Saturno, os
quais exibem uma complexa estrutura de lacunas em varias escalas, muito a` semelhanca dos conjuntos
C{f } (F ). As lacunas sao causadas por ressonancias dos perodos das orbitas das partculas que compoe
10

O estudante poder
a encontrar um estudo detalhado das propriedades de funco
es convexas em v
arios textos, por
exemplo em [123].
11
O estudante poder
a convencer-se da validade da desigualdade (20.22) se fizer um gr
afico das funco
es ln(1 x) e
ln(1M )
M x no intervalo [0, M ].

JCABarata. Curso de Fsica-Matem


atica

Captulo 20

Vers
ao de 29 de setembro de 2005.

973/1304

os aneis com perodos das orbitas de alguns satelites de Saturno. Lacunas desse tipo ocorrem tambem
no cinturao de asteroides e sao conhecidos como gaps de Kirkwood 12 . No caso do cinturao de asteroides,
as lacunas sao causadas por ressonancias com o perodo da orbita de J
upiter 13 . Vide Figura 20.3, pagina
976.
Conjuntos como os de Cantor e outros conjuntos fractais ocorrem tambem em diversos sistemas
dinamicos e no espectro de certos operadores Hamiltonianos na Mecanica Quantica. A Figura 20.4,
pagina 977, exibe a chamada borboleta de Hofstadter14 , que representa o espectro quantico de um
eletron se movendo em um plano bidimensional sob a acao de um potencial periodico e de um campo
magnetico constante perpendicular a esse plano. O eixo horizontal representa o espectro de energias
e o vertical o fluxo do campo magnetico em cada celula do potencial periodico bidimensional (em
unidades de hc/e). Quando e um racional da forma = p/q (com p e q irredutveis) o espectro possui
q bandas e q + 1 lacunas. Quando e irracional, o espectro e um conjunto de Cantor.
Todos esses assuntos sao objeto de pesquisa atual.

20.3

Bases de Hamel e a Medida de Lebesgue

Nesta secao discutiremos um exemplo de sub-conjunto da reta real


que tem a propriedade de ser
Lebesgue-mensuravel mas que nao e Boreliano. A saber, mostraremos que existem bases de Hamel
da reta real (definidas a` pagina 96 e seguintes) que sao mensuraveis por Lebesgue sendo que, porem,
nenhuma base de Hamel e um conjunto Boreliano.


O primeiro resultado e o seguinte:


Proposi
c
ao 20.4 Se B0 e um sub-conjunto do conjunto de Cantor C1/3 [0, 1] que seja maximalmente linearmente independentes por racionais, ent
ao B = B0 + e uma Base de Hamel.
2
Notemos que B0 e mensuravel por Lebesgue, por ser subconjunto de um conjunto de medida de
Lebesgue nula, a saber, C1/3 (vide Proposicao 20.1, pagina 959). Portanto, L (B) = L (B0 ) = 0.
Naturalmente, B e uma base de Hamel mensuravel por Lebesgue, por ser uniao contavel de conjuntos
mensuraveis pode Lebesgue.
Prova. Pelo Lema 20.1, pagina 964, todo x [0, 1] pode ser escrito como uma combinacao linear
por racionais de dois elementos do conjunto de Cantor ternario C1/3 . Por uma simples aplicacao
do Lema de Zorn (faca!), pode-se facilmente provar que C1/3 possui pelo menos um subconjunto de
elementos linearmente independentes por racionais. Denotemos um tal sub-conjunto por B0 . Assim,
12

Daniel Kirkwood (1814-1895). Os gaps, ou lacunas, de Kirkwood foram descobertos no cintur


ao de aster
oides em
1866.
13
Mais coment
arios e referencias sobre o assunto podem ser encontrados em Regular and Irregular Motion. M. V.
Berry. Topics in Nonlinear Dynamics (ed. S. Jorna) Am. Inst. Phys. Conf. Proc. 46 16-120 (1978). Vide tambem
Nature of the Kirkwood Gaps in the asteroid belt, S. F. Dermott and C. D. Murray. Nature 301, 201-205 (1983).
Ambos os trabalhos encontram-se republicados em [89].
14
Douglas R. Hofstadter. Energy levels and wave functions of Bloch electrons in rational and irrational magnetic
fields. Phys. Rev. B 14, 2239 (1976).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

974/1304

todo elemento de C1/3 pode ser escrito como uma combinacao linear finita por racionais de elementos
de B0 . Juntando isso a` observacao anterior, conclumos que todo elemento de [0, 1] pode ser escrito
como combinacao linear finita por racionais de elementos de B0 . Repetindo-se isso em cada intervalo
[m, m + 1] com m a proposicao esta demonstrada.
Isso demonstrou que ha bases de Hamel mensuraveis por Lebesgue. Tem-se porem, o seguinte fato,
devido a Sierpi
nski15 , cuja demonstracao omitiremos:
Teorema 20.1 Nenhuma base de Hamel em


e Boreliana.

Com isso, a base de Hamel construda acima a partir de um sub-conjunto linearmente independentes
por racionais do conjunto de Cantor e um exemplo de um conjunto mensuravel por Lebesgue mas naoBoreliano.
Em verdade nem toda base de Hamel e mensuravel por Lebesgue. Vale, todavia, o seguinte fato,
que provaremos abaixo: uma base de Hamel e mensuravel por Lebesgue se e somente se sua medida de
Lebesgue for nula. Precisaremos da seguinte proposicao:
Proposi
c
ao 20.5 Se A
e um conjunto com medida de Lebesgue positiva, ou seja, L (A) > 0,
ent
ao existe um intervalo aberto I = (, ), > 0, tal que todo elemento x de I pode ser escrito
na forma x = a1 a2 , com a1 , a2 I .
2


A proposicao acima tem uma generalizacao no contexto da medida de Haar em grupos topologicos
localmente compactos (como e o caso da medida de Lebesgue na reta real).
Proposi
c
ao 20.6 Uma base de Hamel B da reta real e mensur
avel por Lebesgue se e somente se
L (B) = 0.
2
Prova. Se B nao for mensuravel por Lebesgue nao ha o que se provar. Suponhamos entao que B e
mensuravel por Lebesgue. Entao, ou L (B) = 0 ou L (B) > 0. Vamos supor que L (B) > 0. Pela
Proposicao 20.5 existem n
umeros racionais nao-nulos r e s (ambos contidos em algum intervalo (, )
conveniente) tais que r = b1 b2 e s = b3 b4 , com b1 , b2 , b3 , b4 B. Seja t = r/s, que obviamente
e racional. Conclumos de r = ts que b1 b2 = t(b3 b4 ). Mas isso e impossvel, pois essa expressao
contraria o fato de que os elementos de B sao linearmente independentes por racionais. Logo, se B e
mensuravel por Lebesgue so podemos ter L (B) = 0.
A Proposicao 20.4 mostrou que a proposicao anterior nao e vazia no seguinte sentido: existem bases
de Hamel mensuraveis por Lebesgue.

15

Waclaw Sierpi
nski (1882-1969). O Teorema 20.1 encontra-se em Sur la question de la mesurabilite de la base de M.
Hamel. Fund. Math. 1, 105-111 (1920).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

975/1304

Figura 20.2: As tres imagens acima mostram trechos em diferentes escalas dos aneis de Saturno. As
imagens foram obtidas pelas sondas Voyager 1 e 2. A Voyager 1 fez sua melhor aproximacao a Saturno
em 12 de novembro de 1980 e a Voyager 2 em 26 de agosto de 1981, a distancias de 124.000 km e
101.000 km, respectivamente.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

Figura 20.3: Histograma exibindo os Gaps de Kirkwood do cinturao de asteroides.

976/1304

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 20

977/1304

Figura 20.4: A borboleta de Hofstadter. O eixo horizontal representa o espectro quantico de energias
de um eletron movendo-se em um plano bidimensional sob a acao de um potencial periodico e de um
campo magnetico constante perpendicular a esse plano. O eixo vertical representa o fluxo do campo
magnetico em cada celula do potencial periodico bidimensional (em unidades de hc/e). Na figura,
varia entre 0 e 1.

Captulo 21
Converg
encia, Pontos Limite e Pontos de
Acumulac
ao em Espacos Topol
ogicos
Conte
udo
21.1 Primeiras Defini
co
es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 978
21.2 Espa
cos Hausdorff . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 980
21.3 O Limite do
Infimo e o Limite do Supremo . . . . . . . . . . . . . . . . . . 981
21.4 Redes e o Caso de Espa
cos Topol
ogicos Gerais . . . . . . . . . . . . . . . . 986
21.4.1 Redes em Espacos Metricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 988

amos neste captulo tratar de forma mais aprofundada o conceito de convergencia, o qual
foi introduzido anteriormente para o caso especial de seq
uencias em espacos metricos (vide
Captulo 16). Sera dada particular atencao aos espacos do tipo Hausdorff, que serao definidos
abaixo, e a` nocao de rede em um espaco topologico geral.

21.1

Primeiras Defini
co
es

Dado um espaco topologico X, uma seq


uencia x e uma funcao x :
X. Por vezes estamos
interessados em considerar uma seq
uencia apenas atraves de seu conjunto imagem: Im x = {x(n)
X, n }. Os elementos da seq
uencia sao os valores x(n), que freq
uentemente sao denotados apenas
por xn . Com um certo abuso de linguagem e costume referir-nos a` seq
uencia x como sendo {x(n)
X, n }, ou denotamo-la por {xn , n } ou mesmo por {xn } ou ate apenas por xn . Em geral,
essas notacoes sao mais praticas e nao causam confusao. A nocao tradicional de convergencia de uma
seq
uencia em um espaco metrico e a seguinte:


Seja M um espaco metrico com metrica d e seja {an } uma seq


uencia em M . Dizemos que {an }
converge a um elemento a M se para todo  > 0 existir N N () tal que d(a n , a) <  sempre
que n > N .


Abaixo vamos apresentar uma nova nocao de convergencia de seq


uencias em espacos topologicos
gerais que e equivalente a`quela apresentada acima no caso de espacos metricos. Comecemos com duas
nocoes u
teis. Seja x uma seq
uencia em X e A X.
1. Dizemos que a seq
uencia x esta eventualmente em A se existir um natural N N (A) (que pode
eventualmente depender de A) tal que xn A para todo n > N .
2. Dizemos que a seq
uencia x esta freq
uentemente em A se houver infinitos valores de n para os
quais xn A.
978

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

979/1304

Se uma seq
uencia x esta eventualmente em A, entao ela esta freq
uentemente em A, mas a recproca
nao e necessariamente verdadeira. Por exemplo, a seq
uencia de n
umeros reais a n = (1)n esta freq
uentemente no intervalo (0, 2), mas nao eventualmente.
Nota. Nas definicoes aqui apresentadas estamos fazendo uso do ordenamento usual de
geral vide a Secao 21.4 sobre redes em espacos topologicos.


. Para o caso

Definamos agora as nocoes de ponto de acumulacao e ponto limite de uma seq


uencia x em X, um
conjunto dotado de uma topologia .
1. Um ponto x em X e dito ser um ponto de acumulaca
o da seq
uencia x em relacao a` topologia
de X se x esta freq
uentemente em todo aberto A que contem x.
2. Um ponto x em X e dito ser um ponto limite, ou simplesmente limite, da seq
uencia x em relacao
a` topologia de X se x esta eventualmente em todo aberto A que contem x.
Note que todo limite e um ponto de acumulacao, mas a recproca nao e verdadeira.
E. 21.1 Exerccio. Mostre que {1, +1} sao os pontos de acumulacao da sequencia x n := (1)n +1/n,
n , n > 0 na topologia usual de . Essa sequencia tem limites nessa topologia? E a sequencia
xn := 1/n2 , n , n > 0?
6


E. 21.2 Exerccio. Seja uma sequencia r :


tal que Im r = (tais sequencias existem pois
e contavel). Mostre que e o conjunto de todos os pontos de acumulacao de r na topologia usual de .
Mostre que r nao tem limites na topologia usual de .
6


E. 21.3 Exerccio. Seja a sequencia do exerccio anterior, mas agora tome a topologia discreta ( ).
Mostre que r nao tem pontos de acumulacao nessa topologia se a funcao r for injetora.
6


Se x e um limite da seq
uencia xn dizemos que xn converge a x e escrevemos x = lim xn .
n

E. 21.4 Exerccio. Mostre que as duas nocoes de convergencia que apresentamos acima sao equivalentes
no caso de sequencias em espacos metricos.
6
Ou
ltimo exerccio nos afirma a equivalencia, no caso de espacos metricos, dos dois conceitos de convergencia que apresentamos, mas e importante frisar que a convergencia de uma seq
uencia e fortemente
dependente da topologia adotada. Isso pode ser claramente visto no exemplo discutido a seguir.
Uma seq
uencia {xn } em X e dita ser eventualmente constante se existir x X e N
xn = x para todo n > N .


tais que

Seja, entao, X um conjunto nao-enumeravel ( , por exemplo) e seja a topologia co-contavel 1 em


X: cc (X). Entao, nenhuma seq
uencia que nao seja eventualmente constante tem limites em X em
relacao a cc (X). Isso segue do seguinte. Seja x uma seq
uencia em X e seja x X um ponto qualquer
e seja ainda A := (Im x)c {x} = (Im x {x}c )c . Como Im x {x}c e contavel, entao A e aberto em


A topologia co-cont
avel foi definida a
` p
agina 919.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

980/1304

cc (X) e contem x. Porem, x nao esta eventualmente em A se nao for eventualmente constante, pois
Im x A = Im x {x}. Assim, para qualquer x X podemos achar um aberto que contem x onde x
nao esta eventualmente. Logo, nenhuma seq
uencia x tem limites na topologia considerada.
Um exemplo ilustrativo e o da seq
uencia xn = 1/n, n , n > 0, em . Na topologia co-contavel
cc ( ) essa seq
uencia nao converge a zero, ao contrario do que ocorre na topologia usual, pois o conjunto
A := \ {1/n, n , n > 0} e aberto, contem x = 0, mas nao contem nenhum elemento da seq
uencia
xn .


Em funcao de exemplos como esses, ha pouca utilidade no conceito de convergencia de seq


uencias
em certos espacos topologicos nao-metricos. O que entao normalmente se faz nesses casos e considerar
uma generalizacao do conceito de seq
uencia, conhecido como rede (net em ingles). Para esse novo
conceito ha uma definicao analoga de convergencia que funciona de modo mais efetivo em espacos
topologicos gerais. Disso trataremos na Secao 21.4.

21.2

Espa
cos Hausdorff

Um espaco topologico X dotado de uma topologia e dito possuir a propriedade de Hausdorff 2 se para
quaisquer pontos distintos x, y X existirem dois abertos Ax e Ay em tais que x Ax , y Ay mas
Ax Ay = .

Um espaco topologico que tem a propriedade Hausdorff e dito simplesmente ser um espaco Hausdorff,
ou do tipo Hausdorff. Vamos primeiro a alguns exemplos de espacos que nao tem a propriedade
Hausdorff.

Seja X qualquer com a topologia indiscreta. Esse espaco nao tem a propriedade de Hausdorff. Seja
X nao finito com a topologia co-finita. Esse espaco nao tem a propriedade de Hausdorff. Seja X
nao-contavel com a topologia co-contavel. Esse espaco nao tem a propriedade de Hausdorff. Para esses
dois u
ltimos exemplos, vide pagina 920.
E. 21.5 Exerccio. Prove as afirmativas do u
ltimo paragrafo.

Agora temos a seguinte proposicao:


Proposi
c
ao 21.1 Todo espaco metrico tem a propriedade de Hausdorff.

Demonstracao. Seja M espaco metrico com metrica d, sejam x, y M distintos e seja r = d(x, y) > 0.
Sejam entao os abertos Ax = Bd (x, r/3) e Ay = Bd (y, r/3). Suponha que exista um ponto z Ax Ay .
Entao, como z pertence ao mesmo tempo a Bd (x, r/3) e Bd (y, r/3), vale que d(x, z) < r/3 e
d(z, y) < r/3. Agora, pela desigualdade triangular tem-se r = d(x, y) d(x, z) + d(z, y) < 2r/3.
Porem, a desigualdade r < 2r/3 e absurda. Da, nao pode existir qualquer ponto z em A x Ay .
Nem todo espaco Hausdorff e metrico. A topologia de Sorgenfrey3 [S] de (pagina 922) e Hausdorff
(prove isso!) mas nao e metrica (vimos isso a` pagina 929). O mesmo vale para a topologia ( ).


2
3

Felix Hausdorff (1868-1942).


Robert Sorgenfrey (1915 - 1996).

JCABarata. Curso de Fsica-Matem


atica

Captulo 21

Vers
ao de 29 de setembro de 2005.

981/1304

Chegamos agora a uma propriedade importante de espacos Hausdorff, sejam eles espacos metricos
ou nao.
Proposi
c
ao 21.2 Uma seq
uencia em um espaco Hausdorff pode ter no m
aximo um ponto limite.

Prova. Suponha que uma seq


uencia a em um espaco Hausdorff X com topologia tenha dois limites
distintos x e y. Sejam Vx 3 x e Vy 3 y dois abertos disjuntos de contendo x e y, respectivamente. Que
tais abertos sempre existem e garantido pela propriedade de Hausdorff, que esta sendo suposta. Entao,
como a converge a x e a y, temos que an Vx para todo n > N (Vx ) e an Vy para todo n > N (Vy ).
Logo, an Vx Vy para todo n > max{N (Vx ), N (Vx )}. Isso contraria a hipotese que Vx Vy = .
Corol
ario 21.1 Uma seq
uencia em um espaco metrico pode ter no m
aximo um limite.

Note que seq


uencias em espacos Hausdorff podem ter muitos pontos de acumulacao.
E. 21.6 Exerccio. Seja A a colecao de todos os subconjuntos de 2 do tipo {(x, y) 2 , com a <
y < b para < a < b < } (faca um desenho de um tal conjunto). Seja [A] a topologia gerada por
tais conjuntos.


1. Mostre que [A] nao e Hausdorff. Para tal, tente ver se e possvel encontrar dois abertos nessa
topologia que contenham os pontos x = (0, 0) e y = (1, 0), respectivamente, mas que nao se
interceptem.
2. Mostre que a sequencia xn = (0, 1/n), n , n > 0 tem por limite todos os pontos da forma (x, 0)
para todo x . (Na topologia usual de 2 o u
nico limite dessa sequencia e o ponto (0, 0)).


21.3

O Limite do Infimo e o Limite do Supremo

Recordemos a definicao de conjunto dirigido. Um conjunto I e dito ser um conjunto dirigido se for
dotado de uma relacao de ordem parcial, que denotaremos por , e se for dotado da seguinte
propriedade: para quaisquer dois elementos a e b de I existe pelo menos um terceiro elemento c I
tal que a  c e b  c.
Seja I um conjunto dirigido e : I
no ponto i I.

uma funcao de I em

. Denotaremos por i o valor de

Define-se o limite do nfimo da funcao como sendo


lim inf = sup inf k ,
I

nI kn

(21.1)

ou, numa notacao mais completa (e algo pedante),


lim inf = sup ({inf ({k , k  n, k I}) , n I}) .
I

(21.2)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

982/1304

Analogamente, define-se o limite do supremo da funcao como sendo


lim sup = inf sup k ,
nI kn

(21.3)

ou,
lim sup = inf ({sup ({k , k  n, k I}) , n I}) .

(21.4)

As definicoes acima indicam que tanto o limite do supremo quanto o do nfimo dependem da ordem
adotada . Omitiremos essa dependencia para nao carregar a notacao.
facil provar que sempre se tem
E
lim inf lim sup .
I

(21.5)

Caso lim inf I = lim supI o limite de e definido como sendo


lim = lim inf = lim sup .
I

(21.6)

Invari
ancia por Redu
c
ao Inicial do Domnio
Que interesses ha nas definicoes acima? Ha varios. Um deles reside na seguinte propriedade.
Suponha que I possa ser escrito como uma uniao I = I0 J onde I0 e J tem as seguintes propriedades
1. Para todo i0 I0 existe pelo menos um j J tal que i0  j.
2. J e um conjunto dirigido pela mesma relacao de ordem .
3. Para todo j J vale que se k  j entao k J.
Entao vale que
lim inf = lim inf
J

e que
lim sup = lim sup ,
J

ou seja, os limites do nfimo e do supremo de uma funcao em um conjunto dirigido nao mudam se
subtrairmos de I um conjunto do comeco de I (no caso, I0 ). Essa propriedade, que e uma das
principais razoes de ser das definicoes de limite acima e que tem uma importancia fundamental, sera
denominada aqui invari
ancia por reduca
o inicial do domnio.
Vamos prova-la para o limite do nfimo. O caso do limite do supremo e analogo. Como
sup(A B) = max{sup(A), sup(B)}
segue que
lim inf = max {sup ({inf ({k , k  n, k I}) , n I0 }) , sup ({inf ({k , k  n, k I}) , n J})} .
I

(21.7)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

983/1304

Pelas hipoteses, existe para todo i0 I0 pelo menos um elemento j(i0 ) J com a propriedade que
j(i0 )  i0 . Logo, para cada i0 I0 tem-se
{ak , k  j(i0 ), k I} {ak , k  i0 , k I}
e, assim,
inf({ak , k  j(i0 ), k I}) inf({ak , k  i0 , k I}).
Dado que
sup ({inf ({k , k  j, k I}) , j J}) inf ({k , k  j(i0 ), k I})

segue que para cada i0 I0 fixo

sup ({inf ({k , k  j, k I}) , j J}) inf({ak , k  i0 , k I}).


Assim,
sup ({inf ({k , k  j, k I}) , j J}) sup ({inf ({k , k  n, k I}) , n I0 }) .
Como lim inf I e o maximo entre os elementos de cada lado da u
ltima desigualdade (veja (21.7)),
provou-se que
lim inf = sup ({inf ({k , k  n, k I}) , n J}) .
I

Claramente, para cada n J


{k , k  n, k I} = {k , k  n, k J}
pois se k  n com n J entao tem-se que k J (propriedade 3 da definicao de I0 e J). Assim,
lim inf = sup ({inf ({k , k  n, k J}) , n J}) = lim inf .
I

Limite do Supremo e Limite do Infimo de um Conjunto


Recordemos a seguinte definicao. Seja X um conjunto com uma topologia . Seja A um subconjunto
de X. Um ponto x X e dito ser um ponto limite de A se todo aberto T que contiver x contiver
pelo menos um ponto de A distinto x. Ou seja, se x T entao (T A) \ {x} 6= .
Denotaremos por pt(A) o conjunto de pontos limite de de A.

Vamos supor que X seja parcialmente ordenado. Definimos entao


lim sup A = sup(pt(A))

e
lim inf A = inf(pt(A)).

desde, e claro, que os supremos e nfimos existam em X. Como antes essa definicao depende do
ordenamento adotado em X.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

984/1304

Advert
encia
Seja I como antes um conjunto dirigido e seja uma funcao : I . Denotemos por Im() a
imagem de . Adotemos em a topologia usual e o ordenamento usual.
entao tentador fazermos a seguinte pergunta: sera verdade que lim inf I = lim inf Im() e que
E
lim supI = lim sup Im()?


A resposta pode ser sim ou nao dependendo do tipo de ordenamento adotado em I. Vejamos os
seguintes exemplos.
Exemplo 1. Adotemos I =
e em
seq
uencia definida da seguinte forma


n :=

adotemos o ordenamento usual. Tomemos como funcao a




1 1/n, para n par


.
1 + 1/n, para n mpar

O conjunto Im() tem dois pontos limite, a saber, 1 e +1. Assim,


lim inf Im() = 1 e

lim sup Im() = 1.

tambem facil de provar que


E
lim inf = 1 e

lim sup = 1.

E. 21.7 Exerccio. Verifique isso.

Exemplo 2. Adotemos X =
e em
adotemos o seguinte ordenamento : se n e m sao ambos
pares ou ambos mpares entao n  m se n m. Entanto, se n e par e m e mpar temos sempre que
n m.


Esse ordenamento coloca todos os pares como menores que todos os mpares. Entre os pares e
entre os mpares o ordenamento e o usual.
Tomemos a mesma seq
uencia definida acima. Claramente continuamos tendo
lim inf Im() = 1 e

lim sup Im() = 1.

Porem, com o ordenamento dos naturais adotado, temos que


lim inf = 1 e


,

lim sup = 1.


,

E. 21.8 Exerccio. Verifique isso.


Mais Sobre O Limite do Supremo e Sobre o Limite do Infimo

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

985/1304

Verificamos acima que nao e verdadeira em geral a afirmativa que o limite do supremo de uma
seq
uencia coincide com o supremo dos pontos limite de sua imagem. Ha porem uma relacao entre o
limite do supremo e os pontos de acumulacao da seq
uencia.
Tomemos I como sendo o conjunto dos naturais com o ordenamento usual e seja : I
seq
uencia. Adotamos em a topologia usual e o ordenamento usual.


uma

Seja Ac() o conjunto de todos os pontos de acumulacao da seq


uencia .
Tem-se entao que
lim inf = inf(Ac())
I

e que
lim sup = sup(Ac()).
I

Nao apresentaremos a prova aqui. Observamos, porem, que esse fato e verdadeiro qualquer que seja
o ordenamento adotado em . Para provar isso precisamos ainda introduzir o conceito de ponto de
acumulacao para funcoes definidas em conjuntos dirigidos gerais, o que faremos na Secao 21.4 sobre
redes.


E. 21.9 Exerccio. Seja a sequencia cn = sen (1/n), n = 1, 2, 3, . . .. Determine seus pontos de


acumulacao, lim sup cn e lim inf cn .
6
E. 21.10 Exerccio.
desigualdades.

Sejam cn e dn duas sequencias limitadas de numeros reais. Mostre as seguintes

1. lim sup(cn + dn ) lim sup cn + lim sup dn .


n

2. lim sup(cn dn ) (lim sup cn )(lim sup dn ).


n

3. Para todo a > 0 vale lim sup(acn ) = a lim sup cn .


n

4. Para todo a < 0 vale lim sup(acn ) = a lim inf cn .


n

6
O estudante pode estar se perguntando por que nao temos sempre simplesmente a igualdade
lim sup(cn + dn ) = lim sup cn + lim sup dn . Veja o que ocorre no exemplo simples onde cn = (1)n
e dn = (1)n . Aqui temos lim sup(cn + dn ) = lim sup 0 = 0, mas lim sup cn = +1 e lim sup dn = +1.
Logo, lim sup(cn + dn )0 < 2 = lim sup cn + lim sup dn e a igualdade, portanto, nao e valida nesse caso.
E. 21.11 Exerccio. Seja an uma sequencia de numeros reais. Mostre que
lim sup(an ) = lim inf an .
n

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

986/1304

E. 21.12 Exerccio. Sejam cn e dn duas sequencias de numeros reais tais que cn dn para todo n
Mostre que
lim sup cn lim sup dn e lim inf cn lim inf dn .
n

21.4

Redes e o Caso de Espa


cos Topol
ogicos Gerais

Seja I um conjunto dirigido com respeito a` uma relacao de ordem parcial  (a nocao de conjunto
dirigido foi introduzida a` pagina 32). Se X e um conjunto nao-vazio, uma funcao f : I X e
denominada uma rede baseada no conjunto dirigido I com respeito a . O estudante deve observar
que uma seq
uencia e uma rede baseada em , que e um conjunto dirigido com respeito a` ordem usual
dos naturais.


Redes sao, portanto, generalizacoes da nocao de seq


uencias e assumem em espacos topologicos gerais
um papel semelhante ao de seq
uencias em espacos metricos.
De modo analogo ao que costumeiramente se faz com seq
uencias, designaremos uma rede x : I X
por {x }I , por {x , I}, ou simplesmente por x , sendo I e  subentendidos.
Vamos a algumas definicoes. Seja uma rede {x }I em X com I sendo dirigido por .

1. Dizemos que {x }I esta freq


uentemente em A X se para todo I existir um 0 I com
0
 tal que x0 A.
2. Dizemos que {x }I esta eventualmente em A X se existe 0 I tal que x A para todo
 0 .
3. Se (X, ) for um espaco topologico, dizemos que x X e um ponto de acumulacao de {x }I
com respeito a se {x }I estiver freq
uentemente em qualquer -aberto que contem x. Nesse
caso, dizemos que {x }I acumula-se em x com respeito a .
4. Se (X, ) for um espaco topologico, dizemos que x X e um ponto limite de {x }I com
respeito a se {x }I estiver eventualmente em qualquer -aberto que contem x. Nesse caso,
dizemos que {x }I converge a x com respeito a .
O estudante deve notar que essas definicoes correspondem perfeitamente a`quelas introduzidas para
seq
uencias a` pagina 978 e seguinte.
Se (X, ) for um espaco topologico e x X, seja Ix a colecao de todos os -abertos que contem x.
Entao, Ix e um conjunto dirigido pelo ordenamento parcial definido pela inclusao de conjuntos .
E. 21.13 Exerccio. Prove essa afirmacao.

Seja (X, ) um espaco topologico, x X e B X. A colecao Ix, B := {A B, A Ix } e um


conjunto dirigido pelo ordenamento parcial definido pela inclusao de conjuntos .
E. 21.14 Exerccio. Prove essa afirmacao.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

987/1304

Esses dois exerccios nos preparam para as seguintes proposicoes relevantes.


Proposi
c
ao 21.3 Sejam (X, ) um espaco topol
ogico, x X e Ix a coleca
o de todos os -abertos que
contem x. Seja {xA }AIx uma rede em X com base no conjunto dirigido Ix . Se a rede {xA }AIx tiver
a propriedade que xA A para todo A Ix , ent
ao {xA }AIx converge a x.
2
A prova e quase imediata pelas definicoes e deixada ao leitor como exerccio.
Proposi
c
ao 21.4 Se (X, ) for um espaco topol
ogico e B X, ent
ao x B se e somente se existir
uma rede em B que converge a x.
2
Prova. Precisamos primeiro provar que se x B entao existe uma rede {x }I que converge a x com a
propriedade que x B para todo I. Sabemos que todo elemento de Ix tem interseccao nao-vazia
com B, pela definicao de fecho de um conjunto. Assim o conjunto Ix, B definido em exerccio acima
e nao vazio, e um subconjunto de B e e um conjunto dirigido pelo ordenamento parcial definido pela
inclusao de conjuntos . Por uma ligeira variacao da proposicao anterior, e facil ver que qualquer rede
baseada em Ix, B e que a cada A Ix, B associe xA A converge a x e esta, claramente, contida em B.

Vamos agora provar que se uma rede {x }I com x B para todo I converge a x, entao
x B. Se {x }I converge a x, entao {x }I esta eventualmente em cada aberto A que contem x.
Isso implica que cada aberto A que contem x contem elementos de {x }I , que estao em B. Logo,
A B 6= , provando que x B.
O conceito de rede permite mais uma caracterizacao de espacos Hausdorff. A proposicao abaixo
generaliza um fato bem conhecido de espacos metricos.
Proposi
c
ao 21.5 Um espaco topol
ogico (X, ) e do tipo Hausdorff se e somente se toda rede em X
que for convergente tiver apenas um ponto limite.
2
Prova. Seja (X, ) e do tipo Hausdorff e seja {x }I uma rede em X que converge a a e a b com
a 6= b. Podemos encontrar A contendo a e B contendo b tais que A B = . Mas isso e
impossvel, pois se {x }I converge a a e a b, entao {x }I esta eventualmente em A e B, o que
contradiz A B = .
Vamos agora supor que o espaco topologico (X, ) tem a propriedade que toda rede em X que
for convergente tem apenas um ponto limite. Se (X, ) nao e do tipo Hausdorff entao existem a e b,
elementos distintos de X, tais que cada elemento de Ia tem interseccao nao-vazia com cada elemento
de Ib .

Entao, para cada par (A, B) com A Ia e B Ib podemos escolher um elemento em x(A, B) AB
a com isso, construir uma aplicacao Ia Ib X. Gostaramos agora de identificar uma relacao de
ordem parcial que faca de Ia Ib um conjunto dirigido. Essa relacao e a seguinte: (A, B)  (A0 , B 0 )
se A0 B 0 A B.
E. 21.15 Exerccio. Verifique que isso faz de Ia Ib um conjunto dirigido. Para tal, constate que se
a = (A, B) e b = (C, D) Ia Ib , entao c = (A C, B D) Ia Ib e valem a  c e b  c.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

988/1304

Note agora que se A Ia entao x(A, B) A B A e se (A0 , B 0 )  (A, B) entao x(A0 , B 0 )


A B 0 A B A. Isso significa que a rede {x(A, B) , (A, B) Ia Ib } esta eventualmente em
A. Como isso vale para todo A Ia , entao a rede {x(A, B) , (A, B) Ia Ib } converge a a. Mutatis
mutantis, constata-se analogamente que a rede {x(A, B) , (A, B) Ia Ib } converge a b. Como a 6= b,
isso contradiz a hipotese e, portanto, (X, ) e do tipo Hausdorff.
0

A nocao de rede e tambem importante por permitir uma caracterizacao do conceito de continuidade
de funcoes em espacos topologicos. Trataremos disso na Secao 22.2.1 e a` pagina 995.

21.4.1

Redes em Espa
cos M
etricos

Seja M um conjunto dotado de uma metrica d e seja I um conjunto dirigido com respeito a uma relacao
de ordem parcial . Uma rede f : I M e dita ser uma rede de Cauchy em relacao a` metrica d se
para todo  > 0 existir um n() I (possivelmente dependente de ) tal que d(f (i), f (j)) <  para
todos i e j tais que i  n() e j  n().
bastante claro que essa definicao generaliza a nocao de seq
E
uencia de Cauchy encontrada a` pagina
834. Naquele caso o conjunto dirigido e o conjunto dos naturais com a relacao de ordem usual.


Lembremos que um conjunto M dotado de uma metrica d e dito ser completo (ou seq
uencialmente
completo) em relacao a essa metrica se vale a afirmacao que uma seq
uencia converge em M se e somente
ser for uma seq
uencia de Cauchy.
Para entendermos a relacao entre as nocoes de seq
uencias de Cauchy e redes de Cauchy em espacos
metricos completos a seguinte proposicao e essencial.
Proposi
c
ao 21.6 Seja M completo em relaca
o a
` metrica d, ou seja, tal que uma seq
uencia converge
em M se e somente ser for uma seq
uencia de Cauchy. Ent
ao vale a afirmaca
o que uma rede converge
em M se e somente ser for uma rede de Cauchy.
2
Prova. Se uma rede f : I M e convergente, entao existe m M tal que para todo  > 0 existe
n() I tal que d(f (i), m) <  para todo i I com a propridade i  n(). Assim, se i e j I sao tais
que i  n() e j  n(), vale pela desigualdade triangular d(f (i), f (j)) d(f (i), m) + d(m, f (j))
 + , o que prova que f e uma rede de Cauchy.
Provemos agora a recproca. Seja f : I M uma rede de Cauchy. Entao para todo k , k > 0,
existe n(1/k) I tal que d(f (i), f (j)) 1/k para todos i e j tais que i  n(1/k) e j  n(1/k). Seja
definido z1 := n(1) e escolhamos indutivamente para cada k , k 2, um elemento zk I tal que
claro que
zk  zk1 e zk  n(1/k). E


z1  z 2  z 3  z 4 

com n(1/k)  zk para todo k




Logo,
n(1/k)  zk  zk+1  zk+2  .
Assim, para todos n > m > k vale d(f (zm ), f (zn )) < 1/k. Portanto, {f (zl ), l } e uma seq
uencia de
Cauchy em M e como M e (seq
uencialmente) completo, segue que {f (zl ), l } converge a um certo


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 21

elemento m M , o que equivale a dizer que para todo  > 0 existe N ()
sempre que n > N ().


989/1304

tal que d(f (z n ), m) < 

Seja agora  > 0 fixo e escolhamos k de forma que 1/k < . Se i I satisfaz i  n(1/k), vale
d(f (i), m) d(f (i), f (zn )) + d(f (zn ), m). Tomando n > max{N (), k} teremos d(f (i), f (zn )) < 
pois i  n(1/k) e zn  n(1/k) e tambem teremos d(f (zn ), m) <  pois n > N (). Logo, d(f (i), m)
2, provando que f converge (a m M ). Isso completa a prova.


Captulo 22
Continuidade de Funco
es em Espacos Topol
ogicos
Conte
udo
22.1 Fun
co
es Contnuas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 990
22.2 Outras Caracteriza
co
es do Conceito de Continuidade em Espa
cos Topol
ogicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 993
22.2.1 Continuidade e Convergencia . . . . . . . . . . . . . . . . . . . . . . . . . . . 994

odo estudante possui uma nocao mais ou menos clara do conceito usual de continuidade
de funcoes reais da reta real. Aqui, vamos estender este conceito a funcoes entre espacos
topologicos gerais. A possibilidade de se estender o conceito de continuidade das situacoes
mais comuns e familiares, encontradas na topologia usual da reta real, para situacoes mais
gerais e, em verdade, uma das principais razoes pelas quais topologias mais gerais que aquelas produzidas por metricas sao definidas e estudadas. Percebeu-se que, tomados os devidos cuidados, muitos
dos resultados passveis de demonstracao no caso metrico estendem-se tambem para topologias nao
derivaveis de uma metrica. Fora isso, aprenderemos, ao elevar o nvel de abstracao com que o conceito
de continuidade e apresentado, que muitas caracterizacoes distintas, gerais e u
teis do mesmo podem
ser apresentadas. Uma conseq
uencia desse alargamento de horizontes e uma maior facilidade para a
demonstracao de resultados importantes.

22.1

Fun
co
es Contnuas

Sejam M e N dois conjuntos, o primeiro dotado da topologia M e o segundo da topologia N . Seja f


uma funcao f : M N . Vamos a uma definicao de continuidade, que chamaremos de definicao de
continuidade n
umero 1.
DC 1. Uma funca
o f : M N , como acima, e dita ser uma funca
o contnua em relaca
o a
`s topologias
1
M e N se f (A) M para todo aberto A de N .

Em outras palavras, uma funcao e dita ser contnua se a imagem inversa de qualquer conjunto
aberto na topologia do conjunto imagem for igualmente um conjunto aberto na topologia do conjunto
domnio.
A seguinte afirmacao e uma conseq
uencia imediata da definicao acima.

Proposi
c
ao 22.1 Sejam M1 , M2 e M3 espacos topol
ogicos com topologias M1 , M2 e M3 , respectivamente. Seja f : M1 M2 , contnua em relaca
o a
`s topologias M1 e M2 , e g : M2 M3 , contnua em
relaca
o a
`s topologias M2 e M3 . Ent
ao g f : M1 M3 e contnua em relaca
o a
`s topologias M1 e M3 .
2

990

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 22

991/1304

Prova. Exerccio.

Uma serie de questoes vem a` mente de qualquer estudante que se depara com a definicao acima
pela primeira vez. Por exemplo, as seguintes: 1) No caso de funcoes reais definidas na reta real o que a
definicao acima tem a ver com a nocao de continuidade tao bem conhecida e ensinada? 2) Na definicao
acima, o conceito de continuidade parece ser fortemente dependente das topologias M e N escolhidas
no domnio e na imagem da funcao. Pode acontecer de uma funcao dada ser contnua em relacao a
estranho que na definicao acima a nocao de
algumas topologias mas nao em relacao a outras? 3) E
continuidade seja apresentada em termos de uma propriedade da imagem inversa f 1 da funcao f . Isso
tem mesmo que ser assim? 4) Sera possvel caracterizar a propriedade de continuidade diretamente em
termos de propriedades da f ?
Todas essas questoes sao muito pertinentes e serao respondidas uma a uma no que segue.
Fazemos notar que, na definicao nova de continuidade que apresentamos acima, as topologias M e
N sao genericas, nao necessitando ser, por exemplo, topologias metricas em M ou N , respectivamente.
Vamos, porem, discutir agora o caso tradicional em que M e N sao iguais a` reta real dotada da topologia
metrica usual .


A No
c
ao Usual de Continuidade na Reta Real
Seja f :
uma funcao. A nocao usual de continuidade diz que f e contnua em se e somente
se para todo x
e para todo n
umero  > 0 existir um n
umero = (x, ) > 0 (eventualmente
dependente de x e ) tal que, sempre que para algum y tivermos |yx| < (x, ) entao |f (y)f (x)| < .


Essa definicao pode ser facilmente generalizada para o caso de espacos metricos gerais.

DCEM 1. Sejam M1 e M2 dois espacos metricos com metricas d1 e d2 , respectivamente. Seja f :


M1 M2 uma funca
o entre estes dois espacos metricos. A funca
o f e dita ser contnua (no sentido
usual) se para todo x M1 e para todo n
umero  > 0 existir um n
umero (x, ) > 0 tal que se
y Bd1 (x, (x, )) ent
ao f (y) Bd2 (f (x), ). Acima Bdi (a, r), i = 1, 2, e a bola aberta de raio r
centrada em torno de a segundo a metrica di .
Vejamos um exemplo de uma funcao real que nao e contnua segundo a definicao acima. Seja a
funcao

1, se t 0
H(t) :=
.
(22.1)
0, se t < 0
Entao, para x = 0 e para  = 1/10 (por exemplo) nao e possvel achar um n
umero tal que se
|y x| = |y| < tenhamos |H(y) H(x)| = |H(y) 1| < 1/10. A razao e que para qualquer y 0
temos |H(y) 1| = 0 que e menor que 1/10, mas para qualquer y < 0 temos |H(y) 1| = 1 que,
obviamente, e sempre maior que 1/10.
E. 22.1 Exerccio. Seja a funcao g(t) = t2 . Mostre explicitamente que g e contnua pela definicao
acima. Como pode ser (x, ) como funcao de x e  nesse caso? Determine explicitamente (x, ).
6
As linhas acima recordam-nos a definicao usual de continuidade, tal como aprendida nos cursos
iniciais de Calculo. Qual a conexao com a nova nocao de continuidade (DC 1) que apresentamos acima?
Vamos esclarecer este ponto agora, provando que as duas definicoes sao equivalentes, se adotarmos a
topologia usual da reta (definida pela metrica d(x, y) = |y x|) no domnio e na imagem da funcao f .

JCABarata. Curso de Fsica-Matem


atica

Captulo 22

Vers
ao de 29 de setembro de 2005.

992/1304

Seja uma funcao f :


tal que f 1 (A) e um aberto em para todo A . Sejam entao
um ponto x no domnio da f e f (x) sua imagem. Seja A = (f (x) , f (x) + ) um aberto em (com
 > 0). Assim, pelas hipoteses, o conjunto f 1 (A) e um aberto em que deve conter o ponto x (pois
f (x) A). Deve haver assim uma bola aberta, de raio nao nulo, centrada em x inteiramente contida
no aberto f 1 (A). Chamemos seu raio de = (x, ) (em geral, o raio deve depender de A e, portanto,
de x e ). Em
essa bola e o intervalo B = (x , x + ). Note-se que, como B f 1 (A), segue
que f (B) A = (f (x) , f (x) + ). Isso, finalmente, e exatamente a afirmacao que f e contnua no
sentido usual.


Vamos agora supor que f e uma funcao contnua no sentido usual e provar que ela tambem e
contnua no sentido novo (DC 1). Isso, junto com o visto no u
ltimo paragrafo, mostra que as duas
nocoes sao equivalentes.
Seja A um aberto qualquer em e vamos supor, sem perder a generalidade (por que?), que A
contem elementos da imagem de f . Seja x f 1 (A). Seja, para algum  > 0, B(f (x), ) a bola aberta
de raio  centrada em f (x). Como A e aberto e f (x) A teremos B(f (x), ) A se escolhermos
 pequeno o suficiente (ainda com  > 0). Pela hipotese que f e contnua no sentido usual, existe
(x, ) tal que se y B(x, (x, )) entao f (y) B(f (x), ) A. Assim, y f 1 (A). Mas isso
significa dizer que para todo x no conjunto f 1 (A) somos capazes de identificar um raio = (x, )
(para o  escolhido) tal que todo elemento que dista de x menos que e tambem elemento do conjunto
f 1 (A). Isso e afirmar que f 1 (A) e um conjunto aberto, pela propria definicao de conjuntos abertos
na topologia metrica usual da reta.


Isso demonstrou a equivalencia que queramos estabelecer e respondeu a pergunta 1) acima.


Continuidade por partes
Uma outra nocao importante e a de continuidade por partes.
Defini
c
ao. Sejam M e N nao-vazios e dotados de topologias M e N , respectivamente. Uma funcao
f : M N e dita ser uma funcao contnua por partes em relacao a`s topologias M e N se existir um
m
[
conjunto finito de abertos disjuntos A1 , . . . , Am em M satisfazendo M =
Ak e tais que:
k=1

1. Para todo k vale que (f  Ak ) : Ak N , a restricao de f ao aberto Ak , e contnua, em relacao a`


topologia induzida por M sobre Ak e em relacao a` N .
2. Para todo k existe uma extensao de f  Ak sobre o fechado Ak a qual e contnua em relacao a`
topologia induzida por M sobre Ak e em relacao a` N .
Alguns autores dispensam a condicao de que a colecao de abertos Ak seja finita.

JCABarata. Curso de Fsica-Matem


atica

22.2

Vers
ao de 29 de setembro de 2005.

Captulo 22

993/1304

Outras Caracteriza
co
es do Conceito de Continuidade
em Espa
cos Topol
ogicos

A caracterizacao DC 1 do conceito de continuidade de uma funcao entre dois espacos topologicos que
apresentamos no incio da sub-secao anterior e equivalente a uma serie de outras caracterizacoes que
discutiremos agora, as quais podem, eventualmente, ser mais u
teis que descrita acima.
Vamos a uma outra definicao de continuidade, que chamaremos de definicao de continuidade n
umero
2. Sejam M e N dois conjuntos, o primeiro dotado da topologia M e o segundo da topologia N . Seja
f uma funcao f : M N .

DC 2. Uma funca
o f : M N , como acima, e dita ser uma funca
o contnua em relaca
o a
`s topologias
1
M e N se f (F ) for um conjunto fechado para a topologia M para todo conjunto fechado F segundo
N .
Em outras palavras, uma funcao e dita ser contnua se a imagem inversa de qualquer conjunto
fechado na topologia do conjunto imagem for igualmente um conjunto fechado na topologia do conjunto
domnio.
Desejamos provar a equivalencia das definicoes DC 1 e DC 2. Para tal, notemos que, para qualquer
conjunto C N , vale f 1 (C) = f 1 (C c )c , ou seja,
f 1 (C) = M \ f 1 (N \ C).
E. 22.2 Exerccio (f
acil). Demonstre essa relacao.

Com essa relacao em maos fica facil provar que se f for contnua segundo DC 1 entao a imagem
inversa de qualquer conjunto C fechado em N e fechado em M . Mutatis mutantis, se f e contnua
segundo DC 2 entao a imagem inversa de qualquer aberto C em N e aberto em M . Isso estabelece
que as duas definicoes sao equivalentes.
Vamos agora a uma terceira definicao de continuidade que sera u
til quando tratarmos do conceito
de continuidade em espacos metricos.
DC 3. Uma funca
o f : M N como acima e dita ser uma funca
o contnua em relaca
o a
`s topologias
M e N se f D f (D) para qualquer conjunto D M . Aqui, D e o fecho de D M .

Note-se aqui dois fatos: 1) nesta nova definicao a continuidade e caracterizada em termos de propriedades das imagens da funcao f e nao em termos das suas imagens inversas; 2) acima D e um conjunto
qualquer de M , nao apenas um aberto ou um fechado.
Vamos provar agora que a definicao DC 3 e equivalente a` definicao DC 2 (e, portanto, a` definicao
DC 1). Para tal, notemos que as seguintes afirmativas sao verdadeiras: sejam X M e Y N dois
conjuntos quaisquer. Entao
f (f 1 (Y )) Y e f 1 (f (X)) X.
E. 22.3 Exerccio (f
acil). Mostre isso.
Fora isso, e tambem claro que se X M e Y N sao tais que f (X) Y , entao f 1 (Y ) X.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 22

994/1304

Seja entao f contnua segundo DC 3 e seja F N , fechado. Teremos que




f f 1 (F ) f (f 1 (F )) F = F,

ou seja,



f f 1 (F ) F.

Logo,

f 1 (F ) f 1 (F ).

Como um conjunto qualquer e sempre subconjunto e seu fecho, essa u


ltima relacao diz que f 1 (F ) =
1
f 1 (F ), que e o mesmo que dizer que f (F ) e fechado. Assim, se f e contnua segundo DC 3 e
tambem segundo DC 2.
Seja agora f contnua segundo DC 2. E seja D M , qualquer. Tomando Y = f (D), vimos acima
que



f f 1 f (D) f (D).
(22.2)

Agora,


f (D) .

D f (f (D)) f



1
1
Mas f
f (D) e fechado, pois f e contnua segundo DC 2 e f (D) e fechado. Assim, D f
f (D) ,




pois D e o menor fechado que contem D. Disso segue que f D f f 1 f (D) . Juntando-se isso

a` (22.2), conclumos que f D f (D), provando a equivalencia desejada.


22.2.1

Continuidade e Converg
encia

Continuidade e Converg
encia em Espa
cos M
etricos
Vamos agora tratar de mais uma caracterizacao do conceito de continuidade de funcoes, caracterizacao esta especializada ao caso de funcoes entre espacos metricos. Uma primeira definicao do
conceito de continuidade de funcoes entre espacos metricos e a definicao DCEM 1, que encontra-se
a` pagina 991. O ponto importante da caracterizacao que aqui descreveremos e que a mesma trata a
nocao de continuidade em termos de convergencia de seq
uencias, sendo por isso de especial importancia
pratica.
Sejam M e N dois espacos metricos dotados de metricas dM e dN , respectivamente. Sejam dM e
dN as topologias induzidas por essas metricas em M e N , respectivamente. Seja f : M N uma
funcao entre esses dois espacos metricos. Temos a seguinte definicao:
DCEM 2. Uma funca
o f : M N , como a descrita acima, e contnua se para todo x M e para
toda seq
uencia {xn , n } que converge a x em relaca
o a
` metrica dM tivermos


f (x) = lim f (xn ),


n

ou seja,
f

lim xn

= lim f (xn ),
n

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 22

995/1304

onde a convergencia de f (xn ) se d


a em relaca
o a
` metrica dN .
Vamos mostrar que esta u
ltima definicao de continuidade e, no caso de espacos metricos, equivalente
a`s definicoes DC 1, 2 e 3. No caso de espacos topologicos nao metricos tal equivalencia pode nao ser
valida. Lembramos o comentario que fizemos na Secao 21 que ha espacos topologicos nao-metricos nos
quais nenhuma seq
uencia e convergente, fora as seq
uencias eventualmente constantes. Um exemplo e
o de um conjunto X nao contavel dotado da topologia co-contavel. Essa e a raiz da dificuldade em se
estender a definicao DCEM 2 para espacos topologicos nao-metricos.
Prova da equival
encia. Vamos supor que f seja contnua segundo DCEM 2 e provar que f e entao
contnua segundo DC 3. Seja D M generico e nao-vazio e seja x D (o caso D = e trivial). Entao,
como M e um espaco metrico existe uma seq
uencia xn D que converge a x. Pelas hipoteses entao,
f (x) = lim f (xn ). Como x pode ser qualquer elemento de D e como os pontos f (xn ) sao elementos
n

do conjunto f (D), isso significa que f D f (D), o que prova que f e contnua segundo DC 3.

Vamos agora supor f contnua segundo DC 1 e vamos mostrar que ela entao o e segundo DCEM
2. Suponha que para x M haja uma seq
uencia xn em M convergindo a x segundo dM e suponha
que f (xn ) nao converge a f (x). Entao existe um aberto A de N contendo f (x) e tal que f (x n ) nao
esta eventualmente em A. Isso significa que xn nao esta eventualmente em f 1 (A) (por que?). Como
pelas hipoteses f 1 (A) e um aberto e x f 1 (A) (por que?), isso diz que xn nao converge a x, uma
contradicao. Logo lim f (xn ) = f (x) e a equivalencia esta provada.
n

E. 22.4 Exerccio. Seja a funcao H definida em (22.1). Adotando a topologia usual de


tanto na
imagem quanto no domnio de H, exiba sequencias x n em convergindo a x = 0 tais que lim H(xn ) =
6


H(0).

Continuidade e Converg
encia em Espa
cos Topol
ogicos Gerais
Como observamos acima, a definicao de continuidade DCEM 2 nao pode ser diretamente transposta a espacos topologicos gerais, pois nesses casos ocorrem dificuldades especiais concernentes a`
convergencia de seq
uencias. Como aprendemos e discutimos na Secao 21.4, pagina 986, essas dificuldades podem ser superadas com o emprego da nocao mais geral de rede, como alternativa a`s seq
uencias.
De fato, e possvel apresentar mais uma definicao do conceito de continuidade, equivalente a`s anteriores,
nas mesmas linhas de DCEM 2, mas com a nocao de rede substituindo a de seq
uencia.
Para uma melhor compreensao do que segue, recomendamos uma re-leitura da Secao 21.4, pagina
986.
Sejam M e N dois espacos topologicos e sejam M e N as topologias em M e N , respectivamente.
Seja f : M N uma funcao entre esses dois espacos topologicos. Temos a seguinte definicao:

DC 4. Uma funca
o f : M N , como a descrita acima, e contnua se para todo x M e para toda
rede {x , I} em M que tem x como ponto limite na topologia M , a rede {f (x ), I} em N
tiver f (x) como ponto limite na topologia N .
Note que, acima, as redes {x , I} e {f (x ), I} podem tem outros pontos limite alem de x
e f (x), respectivamente, pois M e N nao sao necessariamente do tipo Hausdorff nas suas respectivas
topologias.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 22

996/1304

Vamos mostrar que esta u


ltima definicao de continuidade equivale a`s definicoes DC 1, 2 e 3.
Prova da equival
encia. Vamos supor que f seja contnua segundo DC 4 e provar que f e entao
contnua segundo DC 3. Seja D M generico e nao-vazio e seja x D (o caso D = e trivial).
Entao, pela Proposicao 21.4, pagina 987, existe uma rede {x , I} em D tem x como ponto limite
em M . Pelas hipoteses entao, f (x) e ponto limite de {f (x ), I} em N . Como x pode ser qualquer
elemento de D e como os pontos f (x) sao elementos do conjunto f (D), isso significa, tambem pela
Proposicao 21.4, pagina 987, que f D f (D), o que prova que f e contnua segundo DC 3.

Vamos agora supor f contnua segundo DC 1 e vamos mostrar que ela, entao, o e segundo DC
4. Suponha que para x M haja uma rede {x , I} em M que tem x como ponto limite em M
e suponha que f (x) nao e ponto limite de {f (x ), I} em N . Entao existe um aberto A de N
contendo f (x) e tal que {f (x ), I} nao esta eventualmente em A. Isso significa que {x , I}
nao esta eventualmente em f 1 (A) (por que?). Como pelas hipoteses f 1 (A) e um aberto e x f 1 (A)
(por que?), isso diz que x nao e ponto limite de {x , I} em M , uma contradicao. Logo f (x) e
ponto limite de {f (x ), I} em N e a equivalencia esta provada.

Captulo 23
Elementos da Teoria da Integrac
ao
Conte
udo
23.1 Coment
arios Preliminares . . . . . . . . . . . . . . . . . . . . . . . . . . . . 998
23.2 A Integra
ca
o no Sentido de Riemann . . . . . . . . . . . . . . . . . . . . . 1000
23.2.1 A Integral de Riemann Impropria . . . . . . . . . . . . . . . . . . . . . . . . . 1009
23.2.2 Diferenciacao e Integracao em Espacos de Banach . . . . . . . . . . . . . . . 1011
23.3 A Integra
ca
o no Sentido de Lebesgue . . . . . . . . . . . . . . . . . . . . . 1016
23.3.1 Funcoes Mensuraveis e Funcoes Simples . . . . . . . . . . . . . . . . . . . . . 1017
23.3.2 A Integral de Lebesgue. Integracao em Espacos Mensuraveis . . . . . . . . . 1023
23.3.3 A Integral de Lebesgue e sua Relacao com a de Riemann . . . . . . . . . . . 1032
23.3.4 Teoremas Basicos sobre Integracao e Convergencia . . . . . . . . . . . . . . . 1035
23.3.5 Alguns Resultados de Interesse . . . . . . . . . . . . . . . . . . . . . . . . . . 1038
23.4 Os Espa
cos Lp e Lp

. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1040

23.4.1 As Desigualdades de Holder e de Minkowski . . . . . . . . . . . . . . . . . . . 1043


23.4.2 O Teorema de Riesz-Fischer. Completeza . . . . . . . . . . . . . . . . . . . . 1047
23.A Demonstra
ca
o da Proposi
ca
o 23.3 . . . . . . . . . . . . . . . . . . . . . . . 1048
23.B Caracteriza
co
es e Propriedades de Fun
co
es Mensur
aveis . . . . . . . . . . 1049
23.C Prova do Lema 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1055
23.D Demonstra
ca
o de (23.22) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1056
23.E A Equival
encia das Defini
co
es (23.23) e (23.24) . . . . . . . . . . . . . . . 1057
23.F Prova do Teorema da Converg
encia Mon
otona . . . . . . . . . . . . . . . . 1059
23.G Prova do Lema de Fatou . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1060
23.H Prova do Teorema da Converg
encia Dominada . . . . . . . . . . . . . . . . 1061
23.I Prova dos Teoremas 23.2 e 23.3 . . . . . . . . . . . . . . . . . . . . . . . . . 1062
23.J Prova das Desigualdades de H
older e Minkowski . . . . . . . . . . . . . . 1065
23.K Prova do Teorema de Riesz-Fischer

. . . . . . . . . . . . . . . . . . . . . . 1067

presentaremos neste captulo ingredientes basicos da chamada teoria da integracao, centrada


na nocao de integral de funcoes definidas em espacos mensuraveis, a integral de Lebesgue
sendo uma de suas instancias de particular importancia. Iniciaremos com uma breve digressao
sobre o desenvolvimento historico e recordaremos a nocao de integrabilidade no sentido de
Riemann, passando a seguir a` nocao mais geral de integracao em espacos de medida. Advertimos o
leitor que os assuntos tratados neste captulo envolvem por vezes nocoes e problemas matematicamente
muito sutis, sendo difcil apresenta-los de modo resumido ou simplificado. Por essa razao, optamos por
997

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

998/1304

apresentar certas demonstracoes mais tecnicas nao no texto principal, mas nos apendices que se iniciam
a` pagina 1048. Nossa intencao e, antes de tudo, guiar o leitor, apontando-lhe os ingredientes de maior
importancia e de modo a eventualmente motivar seu interesse em um estudo mais aprofundado.
Como referencias gerais para a teoria da medida e da integracao, recomendamos [110] (fortemente),
e tambem [95], [74], [109], [41] ou ainda [87, 88]. Um texto classico e [53]. Para estas Notas tambem
coletamos material de [59, 60], [58] e de [9].

23.1

Coment
arios Preliminares

parte essencial da formacao de todo fsico ou matematico aprender as nocoes basicas do Calculo,
E
como os conceitos de limite, de derivada e de integral de funcoes. Nos passos iniciais dessa formacao e
importante dar enfase a metodos de calculo de derivadas e integrais de funcoes e, conseq
uentemente, e
e natural que assim seja, pouco se discute sobre certas sutilezas ocultas por tras de tais conceitos.
A nocao de integral de uma funcao e uma das ideias fundamentais de toda a Matematica e originouse no seculo XVII com os trabalhos de Newton1 e Leibniz2 , ainda que tenha razes muito mais antigas,
remontando pelo menos a Arquimedes3 . Intuitivamente, a integral de uma funcao real em um intervalo
compacto [a, b] e entendida como a area descrita sob o grafico dessa funcao nesse intervalo. Essa
nocao simples e suficiente para motivar e sustentar os primeiros passos de qualquer aluno iniciante e,
mesmo em um plano historico, satisfez as mentes matematicas ate cerca de meados do seculo XIX,
pois as aplicacoes almejadas pela Fsica e pela Matematica de entao pouco requeriam alem dessa nocao
intuitiva.
Mesmo hoje, pode ser difcil a um estudante, acostumado com o calculo de integrais de funcoes
elementares, entender que a nocao de integral envolve questoes sutis, principalmente pois essas sutilezas envolvem primordialmente a questao de caracterizar para quais funcoes o conceito de integral se
aplica. Considere-se, por exemplo, as seguintes funcoes:

1, se x for irracional
sen (x), se x for transcendente
f (x) =
, ou f (x) =
. (23.1)

0, se x for racional
x2 ,
se x for algebrico

Terao essas funcoes uma integral em um dado intervalo compacto [a, b]? Como essas funcoes sao
descontnuas em todos os pontos, e facil reconhecer que a nocao de integral como area sob o grafico
de uma funcao e aqui muito problematica (o leitor nao convencido deve tentar desenhar os graficos
dessas funcoes e se perguntar qual a area sob os mesmos).

Na grande maioria das aplicacoes com as quais nos acostumamos, funcoes como essas nao ocorrem,
mas sim funcoes contnuas e suficientemente diferenciaveis, para as quais a nocao intuitiva de integral
dificilmente e problematica. No entanto, uma serie de desenvolvimentos teoricos na Matematica conduziram a` necessidade de estender a nocao de integral a classes mais abrangentes de funcoes, como as
do exemplo acima. Seria precipitado enumerar neste ponto quais foram precisamente esses desenvolvimentos que pressionaram por um aprofundamento da nocao de integral, pois para tal uma serie de
1

Isaac Newton (1643-1727).


Gottfried Wilhelm von Leibniz (1646-1716).
3
Arquimedes de Siracusa (ci. 287 A.C. - ci. 212 A.C.).
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

999/1304

comentarios e definicoes teria que ser antecipada. Discutiremos isso no devido momento. Mencionamos, porem, que esse avanco foi possibilitado pelo desenvolvimento concomitante da Teoria da Medida,
que, como ja discutimos alhures, fundamentou e estendeu nocoes como comprimento, area, volume etc.,
de conjuntos. A area da Matematica que surgiu desse desenvolvimento e usualmente conhecida como
Teoria da Integraca
o.
Um outro avanco importante obtido atraves da Teoria da Integracao foi o seguinte. As nocoes
de integracao que aprendemos nos cursos de Calculo aplicam-se a integrais de funcoes definidas em
conjuntos como , n , etc. Uma das conseq
uencias mais importantes do desenvolvimento da teoria da
integracao foi a possibilidade de definir a nocao de integral mesmo para funcoes definidas em conjuntos
mais exoticos que os supra-citados, tais como conjuntos fractais, conjuntos de curvas, de funcoes e
outros.


Esse desenvolvimento relevou-se de grande importancia para a Fsica tambem. Na Mecanica


Quantica, por exemplo, ocorrem as chamadas integrais funcionais, que sao integrais de funcoes definidas em conjuntos de curvas contnuas. Dados dois pontos x e y no espaco, um metodo importante
desenvolvido por Feynman4 permite expressar certas funcoes de Green G(x, y) de sistemas quanticos
em termos de integrais sobre o conjunto Cx, y de todas as curvas contnuas no espaco que conectam
x a y. Na Teoria Quantica de Campos, o analogo das integrais de Feynman e ainda mais abstrato e
envolve integrais sobre conjuntos de distribuicoes 5 . Como se percebe, tais aplicacoes requerem muito
mais que definir a nocao de integral como area ou volume sob um grafico.
Tentativas informais de caracterizar a nocao de integral sao tao antigas quanto o Calculo. Leibniz
tentou definir integrais e derivadas a partir da nocao de infinitesimos. A nocao de infinitesimos carece
de respaldo matematico mas, como outras ideias filosofico-especulativas infelizes do passado, estende
sua perversa influencia ate o presente, causando em alguns, especialmente em cursos de fsica e engenharia, uma falsa percepcao de compreensao da nocao de integral que impede o entendimento de
outros desenvolvimentos. A nocao de limite, que acabou por expurgar os infinitesimos da linguagem
matematica, era praticamente desconhecida dos fundadores do Calculo, tendo sido usada pela primeira
vez em 1754 por dAlembert6 para definir a nocao moderna de derivada.
Um dos primeiros passos importantes no sentido de dotar a nocao de integral definida de fundamentos mais solidos foi dado por Riemann7 em 1854, em sua famosa tese de livre-docencia8 . A motivacao de
Riemann foi o estudo das series de Fourier. Ao estudar condicoes que garantam um rapido decaimento
dos coeficientes de Fourier de funcoes periodicas, Riemann deparou-se com a necessidade de caracterizar mais precisamente a nocao de integrabilidade de funcoes ou, melhor dizendo, de caracterizar
quais funcoes podem ser dotadas de uma integral. Um dos problemas com que Riemann se debateu foi
demonstrar
o que hoje em dia e conhecido como Lema de Riemann-Lebesgue: a afirmacao que o limite
Z
b

lim

f (x) sen (x)dx vale zero se f for contnua por partes. Esse fato e importante para a teoria

Richard Phillips Feynman (1918-1988). A formulaca


o da Mec
anica Qu
antica em termos das integrais funcionais de
Feynman surgiu em cerca de 1942.
5
Para uma exposica
o introdut
oria sobre a integraca
o funcional de Feynman na Mec
anica Qu
antica, vide, por exemplo,
[99], ou bons livros de Mec
anica Qu
antica. Para a integraca
o funcional de Feynman-Kac, definida no espaco-tempo
Euclidiano, vide e.g. [48] ou [103, 104, 105, 106].
6
Jean Le Rond dAlembert (1717-1783).
7
Georg Friedrich Bernhard Riemann (1826-1866).
8
Uber die Darstellbarkeit einer Function durch eine trigonometrische Reihe. Publidada em 1867.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1000/1304

das series de Fourier e sua demonstracao (que pode ser acompanhada, por exemplo, em [33]), requer
compreender a integral como limite de somas de Riemann (a serem definidas abaixo).
A nocao de integrabilidade de Riemann, que sera recordada abaixo, e a primeira a ser ensinada em
(bons) cursos de Calculo mas, como discutiremos mais adiante, tambem nao e plenamente satisfatoria.
Para a grande maioria dos propositos modernos, a nocao mais satisfatoria de integrabilidade e a de
dessa nocao de integral que emergem os desenvolLebesgue, que tambem apresentaremos adiante. E
vimentos mais importantes, na teoria das series de Fourier, dos espacos de Banach e de Hilbert etc.
Adiantamos que no caso de funcoes limitadas reais definidas em conjuntos compactos da reta real, as
integrais de Riemann e de Lebesgue coincidem. Nesse sentido, a integracao de Lebesgue estende a de
Riemann. Trataremos disso de modo mais preciso nos Teoremas 23.2 e 23.3, da Secao 23.3.3, pagina
1032.
Nesse momento e conveniente que encerremos esse palavreado preliminar e elevemos a discussao a
um nvel mais solido.

23.2

A Integra
c
ao no Sentido de Riemann

Na presente serao recapitularemos um pouco, mas em um nvel talvez mais avancado, da teoria da
integracao de Riemann no intuito de preparar a discussao, que lhe seguira, concernente a nocao de
integral de Lebesgue. Apresentaremos apenas as definicoes e os resultados estruturais mais relevantes.
Tendo em vista outras aplicacoes (vide, por exemplo, o tratamento do Teorema da Funcao Implcita
em espacos de Banach da Secao 17.4, pagina 907), nosso intuito e tambem o de apresentar a nocao de
integral de Riemann de modo a permitir sua extensao para funcoes de uma variavel real assumindo
valores em um espaco de Banach. Essa preocupacao, ainda que sem maior importancia para a abordagem da teoria de integracao de Lebesgue, sub-jaz boa parte dos tratamento da integracao de Riemann
que se segue.
Por simplicidade, restringiremos nossa discussao aqui a funcoes de uma variavel real. A definicao
de integral de Riemann e feita inicialmente em intervalos fechados [a, b] finitos, ou seja, com <
a < b < . Integrais de Riemann em intervalos nao-finitos sao definidas posteriormente (Secao 23.2.1,
pagina 1009), tomando-se limites de integrais em intervalos finitos, caso esses limites existam.
Parti
co
es
Importante para a definicao da integral de Riemann e a nocao de partica
o de um intervalo compacto
[a, b]. Trata-se de um conjunto finito de pontos {x1 , . . . , xn } satisfazendo a = x1 < x2 < < xn1 <
xn = b, o n
umero n podendo ser arbitrario, com n 2.

O conjunto de todas as particoes possveis (com n


umero de pontos arbitrario) de um intervalo
compacto [a, b] sera denotado por P([a, b]), ou simplesmente P, se [a, b] estiver sub-entendido. Uma
particao particular sera denotada por P P([a, b]).

A cada particao P = {x1 , . . . , xn } P([a, b]), com n pontos, estao associados n 1 intervalos
fechados I1 , . . . , In1 , sendo Ik = [xk , xk+1 ]. Denotaremos por |Ik | o comprimento do k-esimo
intervalo: |Ik | := xk+1 xk .

Outra nocao u
til e a de fineza de uma particao P, denotada por |P|. Se P = {x1 , . . . , xn } P([a, b])

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1001/1304

definimos |P| := max{|I1 |, . . . , |In1 |}. Assim, |P| e o maximo comprimento dos intervalos definidos
por P em [a, b].
Podemos fazer de P([a, b]) um conjunto dirigido9 , definindo a seguinte relacao de ordem parcial:
P  P0 se P P0 . Assim, dizemos que uma particao P0 e mais fina que uma particao P se P for um
sub-conjunto de P0 . Note-se que se P  P0 entao |P| |P0 |.
E. 23.1 Exerccio. Mostre que isso define uma relacao de ordem parcial em P([a, b]) e que isso faz de
P([a, b]) um conjunto dirigido.
6

Se P e P0 sao duas particoes de [a, b] dizemos que P0 e um refinamento de P se P  P0 , ou seja, se


P P0 . Se P1 e P2 sao duas particoes de [a, b] entao e evidente que P1 P2 e um refinamento de P1 e
de P2 .

Dada uma particao P = {x1 , . . . , xn } P([a, b]) com n pontos, podemos associar a` mesma um
conjunto de n 1 pontos distintos = {1 , . . . , n1 }, com a 1 < < n1 b, escolhendo
k Ik , k = 1, . . . , n 1, ou seja, escolhendo cada k no k-esimo intervalo da particao P. Se
e associado a P da forma descrita acima, denotamos esse fato em smbolos por P. Considere-se
cada par (P, ) e denotemos por X([a, b]) colecao formada por todos esses pares (P, ), para todas
as particoes P P([a, b]) e todas os conjuntos possveis associados a cada P:
X([a, b]) := {(P, ) com P P([a, b]) e P} .
Tal como P([a, b]), o conjunto X([a, b]) e tambem um conjunto dirigido se definirmos a relacao de
ordem (P, )  (P0 , 0 ) se P  P0 , ou seja, se P P0 (independentemente de e 0 !).
Somas de Riemann. Integrabilidade de Riemann
Dada uma funcao real limitada f , definida em [a, b], e dado um par (P, ) X([a, b]), com
P = {x1 , . . . , xn } e = {1 , . . . , n1 }, k Ik , k = 1, . . . , n 1, distintos, definimos a soma de
Riemann de f associada ao par (P, ), denotada por S[(P, ), f ], como
S[(P, ), f ] :=

n1
X
k=1

f (k )|Ik | .

Vide Figura 23.1.


Para f fixa, a aplicacao X([a, b]) 3 (P, ) 7 S[(P, ), f ]
e uma rede10 . Podemos, assim,
perguntar-nos se essa rede possui pontos de acumulacao e pontos limite. Notemos que, como e do
tipo Hausdorff, se essa rede possuir um ponto limite, o mesmo e u
nico (pela Proposicao 21.5, pagina
987). Essa questao nos conduz a` seguinte definicao:


Defini
c
ao. Integrabilidade de Riemann I. Uma funcao limitada f : [a, b] e dita ser integr
avel
por Riemann no intervalo compacto [a, b] se a rede X([a, b]) 3 (P, ) 7 S[(P, ), f ] possuir um
ponto limite S(f ) .


9
10

Para a definica
o, vide p
agina 32.
A definica
o de rede encontra-se a
` p
agina 986. Note que X([a, b]) e um conjunto dirigido, pelo comentado acima.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1002/1304

f(x)
f( 6)
f(5 )

f( 1)

a=x 1

x2

x3

x5

x4

x6

b=x

Figura 23.1: Representacao da soma de Riemann de uma funcao f no intervalo [a, b] com a particao
P = {a = x1 , x2 , x3 , x4 , x5 , x6 , x7 = b}, com os pontos intermediarios = {1 , 2 , 3 , 4 , 5 , 6 }.
O k-esimo retangulo tem altura f (k ) e largura |Ik | = xk+1 xk . A soma das areas desses retangulos
fornece S[(P, ), f ].

Se f : [a, b] for integravel por Riemann no intervalo compacto [a, b] o limite S(f ) e denominado
integral de Riemann de f em [a, b]. Como e bem conhecido, a integral de Riemann de f em [a, b] e
Rb
mais freq
uentemente denotada11 por a f (x) dx, ou seja,


S(f )

f (x) dx .
a

Para tornar essa definicao um pouco mais palpavel, vamos reformula-la um pouco lembrando a
e um
definicao de ponto limite de uma rede da Secao 21.4, pagina 986. Dizemos que S(f )
ponto limite da rede X([a, b]) 3 (P, ) 7 S[(P, ), f ] , se para todo  > 0 existir um par
(P0 , 0 ) X([a, b]) tal que S[(P, ), f ] pertence ao intervalo aberto (S(f ) , S(f ) + ) para todo
par (P, ) X([a, b]) tal que (P, )  (P0 , 0 ).


Assim, f : [a, b] e dita ter uma integravel por Riemann S(f )


um par (P0 , 0 ) X([a, b]) tal que




S[(P, ), f ] S(f ) < 


se para todo  > 0 existir

para todo par (P, ) tal que (P, )  (P0 , 0 ). O n


umero S(f ) e denotado por
11

O smbolo

foi introduzido por Leibniz, sendo uma estilizaca


o da letra S, de soma.

Rb
a

f (x) dx.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1003/1304

Em palavras, uma funcao f e integravel no sentido de Riemann se o processo de refinamento de


particoes, fazendo-as incluir mais e mais pontos com espacamentos cada vez menores, conduzir a um
limite u
nico das somas de Riemann. A integral de Riemann de f e entao esse limite das somas das
areas dos retangulos descritos na Figura 23.1, para quando as particoes sao feitas cada vez mais finas.
Integrabilidade de Riemann. Crit
erios alternativos
Pela Proposicao 21.6, pagina 988, a rede X([a, b]) 3 (P, ) 7 S[(P, ), f ] possui um ponto
limite se e somente se for uma rede de Cauchy12 . Assim, o criterio de Integrabilidade de Riemann I
pode ser equivalentemente reformulado da seguinte forma:


Defini
c
ao. Integrabilidade de Riemann I. Uma funcao limitada f : [a, b] e dita ser integr
avel
por Riemann no intervalo compacto [a, b] se a rede X([a, b]) 3 (P, ) 7 S[(P, ), f ] for uma


rede de Cauchy, ou seja, se para todo  > 0 existir (P ,  ) tal que S[(P, ), f ] S[(P0 , 0 ), f ] < 
para todos P, P0 com P  P e P0  P e todos , 0 .


Fun
co
es contnuas s
ao integr
aveis por Riemann
Ate o momento nao apresentamos exemplos de funcoes integraveis por Riemann. Vamos agora
fechar parcialmente essa lacuna, exibindo uma classe importante de funcoes que satisfazem o criterio
de integrabilidade de Riemann I. Uma visao completa de quais funcoes sao integraveis por Riemann e
fornecida pelo criterio de Lebesgue, discutido brevemente a` pagina 1007.
Proposi
c
ao 23.1 Toda funca
o real contnua definida em um intervalo compacto [a, b] e integr
avel por
Riemann.
2
Para a demonstracao, necessitamos do seguinte lema:
Lema 23.1 Seja f real contnua definida em um intervalo compacto [a, b]. Seja P = {x 1 , . . . , xn }
P([a, b]) uma partica
o de [a, b] com n pontos a
` qual est
ao associados n 1 intervalos fechados
0
I1 , . . . , In1 , com Ik = [xk , xk+1 ]. Se P e um refinamento de P, ent
ao




(23.2)
S[(P, ), f ] S[(P0 , 0 ), f ] W(f, P) |b a|

para quaisquer e 0 , onde

W(f, P) :=

max

k=1, ..., n1

sup |f (x) f (y)|

x, yIk

.
2

` particao P0 = {x01 , . . . , x0m } P([a, b]), com m pontos, estao associados m 1 intervalos
Prova. A
0
fechados I10 , . . . , Im1
, sendo Ik0 = [x0k , x0k+1 ]. Como P P0 , o intervalo I1 e a uniao de, digamos, l
12

Isso e sempre verdade se f assume valores em um espaco metrico completo.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

intervalos de P0 : I1 = I10 Il0 . Assim, |I1 | =


f (1 )|I1 |

l
X
a=1

f (0a )|Ia0 |

l
X
a=1

Captulo 23

1004/1304

|Ia0 | e
l
X
a=1


f (1 ) f (0a ) |Ia0 | ,

o que evidentemente implica





X
l
l
l


X
X



0 0
0
0

sup |f (x) f (y)|
f (1 ) f (a ) |Ia |
|Ia0 |
f (a )|Ia |
f (1 )|I1 |


x, yI1
a=1

a=1

a=1

sup |f (x) f (y)|

x, yI1

|I1 | W(f, P) |I1 | .

Na segunda desigualdade usamos simplesmente o fato que cada a pertence a I1 . Como o mesmo
raciocnio aplica-se aos demais sub-intervalos de P, segue imediatamente a validade de (23.2).
Prova da Proposicao 23.1. Por um teorema bem conhecido, toda funcao contnua f definida em um
intervalo compacto [a, b] e uniformemente contnua, ou seja, para todo  > 0 existe > 0 tal que
|f (y) f (x)| <  sempre que x e y encontrem-se ambos em algum sub-intervalo de [a, b] que tenha
largura menor que .
Fixado um  > 0, escolhamos uma particao P tal que |P | < . Seja P um refinamento de P Todos
os intervalos de P tem largura menor ou igual a e isso implica W(f, P ) < . Assim, o Lema 23.1
diz-nos que




S[(P
,

),
f
]

S[(P,
),
f
]

W(f, P ) |b a|  |b a| .


Com isso vemos que o criterio I de integrabilidade de Riemann e satisfeito, que e o que queramos
demonstrar.
O seguinte corolario e imediato e sua prova e deixada como exerccio.
Corol
ario 23.1 Toda funca
o real contnua por partes13 definida em um intervalo compacto [a, b] e
integr
avel por Riemann.
2
Esse fato e importante, pois a grande parte, se nao a totalidade, das funcoes encontradas na pratica
das ciencias naturais e da engenharia e formada por funcoes contnuas ou contnuas por partes. No
Exerccio E. 23.5, pagina 1007, adiante, exibimos um exemplo de uma funcao que nao e contnua por
partes mas e integravel por Riemann.
Fun
co
es com valores em espa
cos de Banach. Integrabilidade de Riemann
13

Para a definica
o geral de continuidade por partes, vide p
agina 992.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1005/1304

Ate o momento tratamos apenas de caracterizar a nocao de integral de Riemann para funcoes
definidas em conjuntos compactos [a, b] assumindo valores reais. O estudante e convidado a constatar,
no entanto, que as construcoes acima (incluindo a Proposicao 23.1) permanecem inalteradas se as
funcoes consideradas assumirem valores em espacos de Banach.
Se B e um espaco de Banach e f : [a, b] B e uma funcao assumindo valores em B, a soma de
Riemann de f associada ao par (P, ) e analogamente definida por
S[(P, ), f ] :=

n1
X
k=1

Temos, assim:

f (k )|Ik | B.

(23.3)

Defini
c
ao. Integrabilidade de Riemann para espa
cos de Banach. Seja B um espaco de Banach
com norma k kB . Uma funcao limitada f : [a, b] B e dita ser integr
avel por Riemann no intervalo
compacto [a, b] se a rede X([a, b]) 3 (P, ) 7 S[(P, ), f ] B for uma rede de Cauchy, ou seja, se


para todo  > 0 existir P tal que S[(P, ), f ] S[(P , 0 ), f ] <  para todo P com P  P.
B

Tem-se, analogamente, a importante

Proposi
c
ao 23.2 Toda funca
o contnua definida em um intervalo compacto [a, b] e assumindo valores
em um espaco de Banach e integr
avel por Riemann.
2
A demonstracao repete os mesmos passos da demonstracao da Proposicao 23.1 se substituirmos os
modulos das funcoes e das somas de Riemann por normas em espacos de Banach.
Alguns desenvolvimentos sobre a integracao e diferenciacao de funcoes assumindo valores em espacos
de Banach serao apresentados na Secao 23.2.2, pagina 1011.
Somas de Darboux

Os criterios de integrabilidade que apresentamos acima sao essencialmente aqueles apresentados


por Riemann em 1854. Da maneira como os formulamos, podemos aplica-los para definir a nocao de
mas que
integral (de Riemann) mesmo para funcoes definidas em intervalos compactos [a, b]
assumam valores em espacos de Banach. Uma desvantagem dos criterios de integrabilidade acima e
a de fazerem o uso da nocao de rede e pontos limite de redes, que talvez nao sejam intuitivas para
todos. Felizmente, no caso de funcoes reais, ha uma outra caracterizacao da nocao de integrabilidade
de Riemann, devida a Darboux14 , que e mais transparente e prescinde dessas nocoes. Trataremos disso
agora.


Dada uma funcao real limitada f , definida em [a, b] e dada uma particao P P([a, b]), com
P = {x1 , . . . , xn }, definimos as somas de Darboux (inferior e superior) de f no intervalo [a, b],
associadas a` P por


n1 
n1 
X
X
sup f (y) |Ik | ,
Di [P, f ] :=
inf f (y) |Ik |
e
Ds [P, f ] :=
(23.4)
k=1

yIk

k=1

yIk

respectivamente. Vide Figura 23.2.


14

Jean Gaston Darboux (1842-1917). O trabalho de Darboux sobre a integral de Riemann data de 1875.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1006/1304

f(x)

f(x)
sup f(y)
y

inf f(y)
y 6

sup f(y)
y 1

inf f(y)
y

a=x 1

x2

x3

x4

x5

x6

b=x

a=x 1

x2

x3

x4

x5

x6

b=x

Figura 23.2: Representacao das somas de Darboux da mesma funcao e da mesma particao da Fig.
23.1. A soma das areas dos retangulos a` esquerda fornece Di [P, f ] e a soma das areas dos retangulos
a` direita fornece Ds [P, f ].
evidente pela definicao que Di [P, f ] Ds [P, f ] para qualquer particao P. Fora isso, tem-se
E
tambem os fatos compreendidos nos seguintes exerccios:
E. 23.2 Exerccio. Mostre que para quaisquer particoes P e P0 P([a, b]) com P  P0 tem-se
Di [P, f ] Di [P0 , f ] e Ds [P, f ] Ds [P0 , f ]. Sugere-se provar isso por inducao no numero de pontos da particao.
6
E. 23.3 Exerccio. Mostre que para quaisquer particoes P e P0 P([a, b]) tem-se Di [P, f ] Ds [P0 , f ].
6
E. 23.4 Exerccio. Mostre que para quaisquer particoes P e P0 P([a, b]) com P  P0 tem-se
Ds [P0 , f ] Di [P0 , f ] Ds [P, f ] Di [P, f ]. Sugestao: isso segue dos dois exerccios anteriores.
6
O exerccio E. 23.2 sugere a seguinte definicao. Definimos as integrais de Darboux (inferior e superior) de f no intervalo [a, b] por
Z b
Z b
f (x) dx :=
sup Di [P, f ]
e
f (x) dx :=
inf Ds [P, f ] ,
a

PP([a, b])

PP([a, b])

respectivamente. O fato estabelecido no exerccio E. 23.3 acima que Di [P, f ] Ds [P0 , f ] para
quaisquer particoes P e P0 P([a, b]) implica (por que?)
Z b
Z b
f (x) dx
f (x) dx .
a

Tudo isso sugere a seguinte definicao.


Defini
c
ao. Integrabilidade de Riemann II. Uma funcao limitada f e dita ser integr
avel por RieRb
Rb
mann no intervalo compacto [a, b] se a f (x) dx = a f (x) dx. Nesse caso a integral de Riemann de f

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1007/1304

no intervalo [a, b] e definida por


Z b
Z b
Z b
f (x) dx .
f (x) dx =
f (x) dx =
a

Sobre a relacao entre as definicoes I e II, acima, tem-se o seguinte:


Proposi
c
ao 23.3 Se uma funca
o real f e integr
avel no sentido da definica
o I ent
ao tambem o e no
sentido da definica
o II, e vice-versa.
2
Por ser bastante tecnica e sem relevancia especial para o que segue, apresentamos a demonstracao
dessa proposicao nao aqui, mas no Apendice 23.A, pagina 1048.
Crit
erio de Lebesgue para integrabilidade de Riemann
Ha uma caracterizacao da integrabilidade de Riemann, devida a Lebesgue, que permite precisar
quais funcoes sao integraveis no sentido de Riemann:
Criterio de Lebesgue para integrabilidade de Riemann. Uma funcao limitada f : [a, b] e integravel
no sentido de Riemann se e somente se for contnua quase em toda parte (em relacao a` medida de
Lebesgue), ou seja, se a colecao de pontos onde f e descontnua tiver medida de Lebesgue nula.


Nao apresentaremos a demonstracao desse fato aqui (vide [59]). Uma conseq
uencia desse criterio
(que tambem pode ser obtida por meios mais diretos, como vimos acima) e que toda funcao limitada
e contnua por partes15 e integravel no sentido de Riemann.
curioso e relevante observar tambem que nao sao apenas as funcoes contnuas por partes que sao
E
integraveis no sentido de Riemann. O seguinte exerccio ilustra isso.
E. 23.5 Exerccio-desafio. Aqui vamos designar numeros racionais r na forma r = p/q, supondo p e q
primos entre si. Seja a seguinte funcao:

1
p

1 + , se x = for racional
q
q
f (x) =
.

1,
se x for irracional

Mostre que f e contnua em x se x for irracional mas que f e descontnua em x se x for racional. Sugestao:
lembre que se x e irracional, entao para toda sequencia p n /qn de racionais que aproxima x tem-se que
qn para n .

Como os racionais tem medida de Lebesgue zero, segue pelo criterio de Lebesgue que f e integravel de
Rb
Rb
Riemann. Prove diretamente da definicao que a f (x) dx = a f (x) dx = b a para todos a < b. Note que
Rb
Rb
o fato que a f (x) dx = b a e evidente, a dificuldade esta em provar que a f (x) dx = b a.
6
Defici
encias da integral de Riemann
15

Lembremos: uma funca


o e dita ser contnua por partes se for descontnua apenas em um n
umero finito de pontos.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1008/1304

As nocoes de funcao integravel no sentido de Riemann e de integral de Riemann que apresentamos


acima sao a base de todo o Calculo elementar e delas se extrai uma serie de conseq
uencias bem
conhecidas e que nao repetiremos aqui, tais como a linearidade da integral, o teorema fundamental do
calculo, metodos de integracao (como a integracao por partes) etc. Para uma ampla exposicao, vide
e.g. [87]-[88]. A integral de Riemann, porem, possui algumas deficiencias que ilustraremos abaixo.
Essas deficiencias conduziram a` procura de uma nocao mais forte de integrabilidade, da qual falaremos
posteriormente.
Seja [a, b], a < b, um intervalo compacto e considere-se a seguinte funcao D : [a, b]

0, se x for racional
D(x) =
.

1, se x for irracional

:
(23.5)

Sera essa funcao integravel em [a, b] sentido de Riemann? A resposta e nao, pois como facilmente se
constata,
Z b
Z b
D(x) dx = 0
mas
D(x) dx = b a,
a

ja que, para qualquer sub-intervalo Ik = [xk , xk+1 ] de qualquer particao de [a, b] teremos
inf D(y) = 0

yIk

mas

sup D(y) = 1 ,
yIk

pois Ik sempre contera n


umeros racionais e irracionais. Assim, aprendemos que ha funcoes limitadas
que nao sao integraveis no sentido de Riemann. Esse exemplo, porem, ilustra um outro problema de
conseq
uencias piores.
Seja o conjunto Q = [a, b] de todos os racionais do intervalo [a, b]. Como esse conjunto e
contavel, podemos representa-lo como Q = {r1 , r2 , r3 , r4 , . . .} = {rk , k }, onde 3 k rk Q
e uma contagem de Q. Seja definida agora a seguinte seq
uencia de funcoes:

0, se x {r1 , . . . , rn }
Dn (x) =
.

1, de outra forma


facil ver que para todo x [a, b] tem-se D(x) = lim Dn (x), onde D esta definida em (23.5).
E
n
Cada funcao Dn e integravel no sentido de Riemann, pois e contnua por
R bpartes, sendo descontnua

apenas nos pontos do conjunto finito {r1 , . . . , rn }. E muito facil ver que a Dn (x) dx = b a e assim,
Z b
Z b

Dn (x) dx = ba. Entretanto, trocar a integral pelo limite
lim
lim Dn (x) dx nao faz sentido,
n

pois a funcao D(x) = lim Dn (x) nao e integravel no sentido de Riemann.


n

A licao que se aprende disso e que a integracao de Riemann nao pode ser sempre cambiada com o
limite pontual de funcoes16 . Esse e um fato desagradavel, que impede manipulacoes onde gostaramos
de poder trocar de ordem integrais e limites. O problema reside no fato de o criterio de integracao
16
A troca de ordem de integrais de Riemann e limites de seq
uencias de funco
es e permitida, porem, se o limite for
uniforme.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1009/1304

de Riemann nao ser suficientemente flexvel de modo a permitir integrar um conjunto suficientemente
grande de funcoes ou, melhor dizendo, o conjunto das funcoes integraveis no sentido de Riemann nao
e grande o suficiente. Como vimos no criterio de Lebesgue, so sao integraveis no sentido de Riemann
as funcoes que sao contnuas quase em toda parte. Esse conjunto, que exclui funcoes como D, acaba
sendo pequeno demais para dar liberdade a certas manipulacoes de interesse.
E. 23.6 Exerccio. Por que D nao e contnua quase em toda parte? Para responder isso, mostre que D
nao e contnua em nenhum ponto. Sugestao: recorde que todo x irracional pode ser aproximado por uma
sequencia de racionais e que todo x racional pode ser aproximado por uma sequencia de irracionais. Mostre
entao que para qualquer x existem sequencias xn com lim xn = x, mas com lim D(xn ) = D(x).
6
n

Um outro problema, de outra natureza, diz respeito a` propriedade de completeza da colecao das
funcoes integraveis por Riemann.
Tais conjuntos nao formam espacos metricos completos em relacao a`
Rb
metricas como d1 (f, g) = a |f (x) g(x)|dx. Como a propriedade de completeza e muito importante,
faz-se necessario aumentar o conjunto de funcoes integraveis para obter essa propriedade. De fato, como
veremos, o conjunto de funcoes integraveis no sentido de Lebesgue e completo e esse fato e importante
na teoria dos espacos de Hilbert e de Banach.

23.2.1

A Integral de Riemann Impr


opria

Vamos aqui tratar de definir a integral de Riemann impr


opria

f (x) dx de uma funcao f definida

em toda a reta real . De maneira intuitiva, essa integral deve ser definida como o limite de integrais
Z
b
f (x) dx tomando a indo a e b indo a de diversas formas, sem afetar o resultado.


Uma possibilidade provisoria seria a seguinte definicao. Se f : e uma funcao integravel por
Riemann em cada intervalo [a, b], poderamos definir a integral de Riemann impropria de f por
Z A
Z
f (x) dx ,
(23.6)
f (x) dx := lim


caso o limite exista. A definicao provisoria (23.6) apresenta, porem, um problema que requer alguns
Z A
f (x) dx exista, mas nao, por exemplo,
comentarios. Em certos casos, pode ocorrer que o limite lim
A A
Z A
Z A2
x dx =
f (x) dx, ou outros. Tal e o caso da funcao f (x) = x. Tem-se aqui que lim
o limite lim
A A
A A
Z A2
x dx diverge.
0 mas lim
A

Por causa disso e insatisfatorio tomar (23.6) como definicao das integrais de Riemann improprias.
prudente elaborar uma definicao mais conservadora e que leve em conta o que pode acontecer em
E
todos as integrais em intervalos [a, b] quando a e b , independentemente. Isso e feito da
seguinte forma.
Denotemos por C a colecao de todos os intervalos finitos [a, b] . Notando que os intervalos
[a, b] podem ser ordenados por inclusao, percebemos facilmente que C e um conjunto dirigido (vide


JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1010/1304

definicao a` pagina 32).


Seja f :

C dada por


uma funcao fixa, integravel por Riemann em cada intervalo [a, b]. A aplicacao

F[a, b] :=

f (x) dx

(23.7)

forma uma rede. O conceito de limite em relacao a uma rede e bem definido (a nocao de rede, limites
de redes e suas propriedades foram estudadas na Secao 21.4, pagina 986). Isso nos permite estabelecer
a definicao precisa de integral de Riemann impropria.
Dizemos, que uma funcao f : , integravel por Riemann em cada intervalo [a, b], possui uma
integral de Riemann impr
opria se a rede F[a, b] , [a, b] C possuir um ponto limite (o qual sera u
nico,
pois e um espaco Hausdorff na topologia usual. Vide Proposicao 21.5, pagina 987).


Assim, f possui uma integral de Riemann impropria se


Z b
f (x) dx
lim F[a, b] = lim
[a, b]C

[a, b]C

existir, o limite acima sendo o da rede, com os intervalos ordenados por inclusao. Se f tiver essa
propriedade, definimos a integral de Riemann impr
opria de f por
Z b
Z
f (x) dx .
f (x) dx := lim F[a, b] = lim
[a, b]C

[a, b]C

Para tornar essa definicao um pouco mais palpavel, vamos reformula-la um pouco lembrando a
definicao de ponto limite de uma rede da Secao 21.4, pagina 986. Dizemos que F e um ponto limite
da rede F[a, b] , [a, b] C, se para todo  > 0 existir um intervalo [A, B] tal que F[a, b] (F , F + )
para todo [a, b] [A, B].


Assim, f :
, integravel por Riemann em cada intervalo finito, e dita ter uma integral de
Riemann impropria F se para todo  > 0 existir um intervalo [A, B] C tal que
Z b




f (x) dx F < 



para todo [a, b] [A, B], [a, b] C. O n


umero F e denotado por

f (x)dx.
Z
Z a
De maneira analoga definem-se as integrais de Riemann improprias
f (x) dx e
f (x) dx, para
a

Z A
Z a
f (x) dx e lim
a , finito, como os limites lim
f (x) dx, respectivamente, caso existam.

Notemos en passant, que na definicao da integral de Riemann em intervalos finitos [a, b], que
apresentamos na Secao 23.2, pagina 1000, faz-se
R necessario supor que a funcao f seja limitada. Para
a definicao da integral de Riemann impropria f (x) dx isso nao e necessario, e f pode divergir em
 
3
, desde que o limite da integral exista! Um exemplo e a funcao f (x) = x2 sen ex , que nao e
3

limitada para x +. Como facilmente se ve com a mudanca de variaveis u = ex ,


Z
Z
 3

1 sen (u)
2
x
du =
.
dx =
x sen e
3 0
u
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1011/1304

Au
ltima igualdade pode ser obtida pelo m
etodo dos resduos. Um outro exemplo do mesmo tipo e a
R
funcao x cos(x4 ), que nao e limitada mas a x cos(x4 )dx < para qualquer a finito.
*

No sentido da definicao acima, a funcao f (x) = x nao possui uma integral de Riemann impropria
Z A2
bem definida pois, como observamos, limites como lim
x dx divergem. Para funcoes que possuem
A

uma integral de Riemann impropria bem definida vale, obviamente, a expressao (23.6) e para elas vale
tambem
Z A2
Z A
Z
f (x) dx = lim
f (x) dx
etc.
f (x) dx = lim

Rb

ou seja, o limite de a f (x) dx pode ser tomado com a indo a e b indo a de diversas formas,
sem afetar o resultado.
Para iniciarmos a discussao precisamos de definicoes adequadas das nocoes de derivacao e integracao
(de Riemann) de funcoes entre espacos de Banach.

23.2.2

Diferencia
c
ao e Integra
c
ao em Espa
cos de Banach

Vamos na presente secao (cuja leitura e dispensavel para o desenvolvimento da teoria de integracao de
Lebesgue que se lhe segue) aprofundar um pouco mais a teoria da integracao de funcoes com valores
em espacos de Banach no sentido de reproduzir, nesse contexto geral, alguns dos resultados basicos do
Calculo Diferencial e Integral17 .
A nocao de integral de Riemann para funcoes de uma variavel real com valores em um espaco de
Banach foi apresentada na Secao 23.2, em especial a` pagina 1004. Nosso principal proposito agora e
demonstrar o Teorema do Valor Medio e obter outros resultados preparatorios para a demonstracao
do Teorema da Funcao Implcita, tratado na Secao 17.4, pagina 907. O primeiro passo e apresentar a
nocao geral de diferenciacao de funcoes entre espacos de Banach.
Aplica
co
es diferenci
aveis em espa
cos de Banach. A derivada de Fr
echet
Sejam M e N dois espacos de Banach. Seja M um aberto em M e g : M N uma aplicacao (naonecessariamente linear). Dizemos que g e diferenci
avel em um ponto x M se existir uma aplicacao
linear limitada Gx : M N tal que





g(x + y) g(x) Gx y
g(x + y) g(x) Gx y
N
lim
= 0,
ou seja,
lim
= 0.
y0
y0
kykM
kykM
Se g e diferenciavel em x, ou seja, se um tal Gx existir, entao e unicamente definido. De fato,
suponhamos que exista H : M N linear e limitado tal que



g(x + y) g(x) Hy
N
= 0.
lim
y0
kykM
17

Seguiremos proximamente a exposica


o de [60].

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

Seja v M com kvkM = 1 e seja y M tal que lim

y0

1012/1304

y
= v. Entao,
kykM

k(H Gx )ykN
y0
kykM

 





[g(x + y) g(x) Gx y [g(x + y) g(x) Hy
N
= lim
y0
kykM






[g(x + y) g(x) Hy
[g(x + y) g(x) Gx y
N
N
+ lim
lim
y0
y0
kykM
kykM

k(H Gx )vkN = lim

= 0.
Logo, H Gx anula-se em todo vetor norma 1 e, portanto, anula-se em todo M.

O estudante pode facilmente convencer-se que a definicao acima corresponde a` nocao bem-conhecida
de diferenciabilidade de funcoes de n m . O operador linear limitado Gx pode ser interpretado
como a melhor aproximacao linear a` funcao g na vizinhanca de x.


Se g e diferenciavel em todo ponto x do aberto M e se a aplicacao M 3 x 7 Gx B(M, N) for


contnua em norma, dizemos que g e uma aplicaca
o de classe C 1 .
Para manter uma familiaridade notacional, denotaremos os operadores lineares limitados G x definidos acima por (Dg)(x) ou mesmo por g 0 (x). O operador linear limitado (Dg)(x) representa, assim,
a derivada de g no ponto x, tambem denominada derivada de Frechet18 de g em x.
E. 23.7 Exerccio. Mostre que se g e diferenciavel no ponto x de acordo com a definicao acima entao
e tambem contnua em x.
6
Diferencia
c
ao e integra
c
ao de fun
co
es de uma vari
avel real
De particular interesse e o caso em que M =
reta real. Aqui, tem-se o seguinte:


e M = (a, b)


, um intervalo aberto finito da

Proposi
c
ao 23.4 Seja N um espaco de Banach e seja g : [a, b] N uma funca
o contnua. Seja
G : [a, b] N definida por
Z x
G(x) :=
g(t)dt , x [a, b] .
(23.8)
a

Ent
ao G e diferenci
avel em todo intervalo (a, b) e (DG)(x) G0 (x) = g(x).
Prova. Pela definicao da integral de Riemann e evidente que
Z t2
Z t3
Z
g(t) dt +
g(t) dt =
t1

18

Maurice Rene Frechet (1878-1973).

t2

t3

g(t) dt
t1

(23.9)

JCABarata. Curso de Fsica-Matem


atica

tambem facil ver que


para todos t1 , t2 , t3 [a, b]. E
Z b

Z b



g(t) dt
kg(t)kN dt


a

Captulo 23

Vers
ao de 29 de setembro de 2005.

1013/1304

(23.10)

pois para as somas de Riemann (23.3) tem-se kS[(P, ), g]kN

n1
X
k=1

kg(k )kN |Ik | , o que implica

(23.10), tomando-se os limites. De (23.10) obtem-se trivialmente a estimativa



Z b


|b a| max kg(t)k

g(t)
dt
N


t[a, b]
a

(23.11)

que usaremos logo abaixo. Seja G definida em (23.8). Tem-se por (23.9) que G(x + y) G(x) =
Z
x+y
g(t)dt para todo x, y (a, b) com x + y (a, b). Logo,
x

G(x + y) G(x) g(x)y =


Assim, por (23.11),


G(x + y) G(x) g(x)y

donde segue que




G(x + y) G(x) g(x)y
N
lim
y0
|y|

lim

x+y
x

|y|


g(t) g(x) dt .
max kg(t) g(x)kN ,

t[x, x+y]

max kg(t) g(x)kN

continuidade

y0 t[x, x+y]

0.

Isso provou que G e diferenciavel em todo x (a, b) com (DG)(x) G0 (x) = g(x).
Na demonstracao do Teorema do Valor Medio faremos uso do lema a seguir (cujo enunciado e
demonstracao foram extrados de [60]). O estudante deve cuidadosamente observar que, ao contrario
do que uma primeira impressao pode sugerir, esse lema nao e conseq
uencia da Proposicao 23.4.
Lema 23.2 Seja N um espaco de Banach e f : [a, b] N contnua e diferenci
avel em todo (a, b) mas
de modo que f 0 (x) = 0 para todo x (a, b). Ent
ao f e constante.
2
Prova.19 Sejam s e t (a, b), arbitrarios, com s < t. Desejamos mostrar que f (s) = f (t). Como s e t
sao arbitrarios e f e contnua, isso implica que f e constante em todo intervalo fechado [a, b]. Vamos
definir uma seq
uencia de intervalos (sn , tn ) (s, t), n , satisfazendo


(sn , tn ) (sn1 , tn1 )


19

De [60].

|tn sn | = 2n |t s|

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1014/1304

dados da seguinte forma: (s0 , t0 ) = (s, t) e para n 1,





sn1 +tn1 
f (sn1 ) f sn1 +tn1 f sn1 +tn1 f (tn1 ) ,
,
caso
s
,

n1
2
2
2

(sn , tn ) :=






sn1 +tn1
n1
n1
, tn1 , caso f sn1 +t
f (tn1 ) f (sn1 ) f sn1 +t
.
2
2
2

Em palavras, quebramos a cada passo o intervalo (sn1 , tn1 ) ao meio e escolhemos (sn , tn ) como
claro por essa escolha que
sendo a metade na qual a variacao de f em norma foi maior. E


 





s
+
t
s
+
t
n1
n1
n1
n1
+ f

kf (sn1 ) f (tn1 )k

f
(t
)
f
(s
)

f
n1
n1



2
2
2 kf (sn ) f (tn )k

e, portanto, tem-se para todo n

kf (s) f (t)k 2n kf (sn ) f (tn )k .

(23.12)

Pela construcao, sn e uma seq


uencia nao-decrescente e limitada superiormente por t, enquanto que t n
e uma seq
uencia nao-crescente e limitada inferiormente por s. Assim, ambas convergem a pontos no
intervalo [s, t]. Como, porem, |tn sn | = 2n |t s|, segue que ambas as seq
uencias sn e tn convergem
e a um mesmo ponto [s, t]. Fora isso, e tambem claro que [sn , tn ] para todo n.

Pela hipotese, vale f 0 () = 0. Pela definicao de f 0 , isso significa que para todo  > 0 existe > 0 tal
que kf (x) f ()k/|x | <  sempre que |x | . Como sn e tn convergem a , podemos escolher
n grande o suficiente de modo que |sn | e |tn | . Teremos, assim, para tais ns,

kf (sn ) f (tn )k kf (sn ) f ()k + kf () f (tn )k  |sn | + | tn | .
Como [sn , tn ] para todo n, segue que |sn | + | tn | = |tn sn | = 2n |t s|. Logo, obtivemos
kf (sn ) f (tn )k 2n |t s| .

Voltando a (23.12) isso implica kf (s) f (t)k 2n kf (sn ) f (tn )k |t s|. Como  > 0 e arbitrario,
segue disso que kf (s) f (t)k = 0, completando a prova.
Com esse lema e com a Proposicao 23.4 a prova do Teorema do Valor Medio torna-se elementar.
O Teorema do Valor M
edio
Teorema 23.1 (Teorema do Valor M
edio) Sejam M e N espacos de Banach e M M um conjunto aberto e conexo de M. Seja g : M N contnua e diferenci
avel. Ent
ao, para todos x, y M
vale
Z

1

g(x) g(y) =

g 0 ( x + (1 )y) d

(x y)

assim como a estimativa


0

kg(x) g(y)kN Kx, y kx ykM ,

onde Kx, y := max kg (tx + (1 t)y)k.


t[0, 1]

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1015/1304

Prova. Para x, y M fixos, seja h : [0, 1] N definida por h(t) := g(tx + (1 t)y). Pela regra da
cadeia, h0 (t) = g 0 (tx + (1 t)y)(x y). Defina-se tambem
Z t
H(t) :=
g 0 ( x + (1 )y)(x y) d , t [0, 1] .
0

Pela Proposicao 23.4, H e diferenciavel e H 0 (t) = g 0 (tx + (1 t)y)(x y). Assim, H 0 (t) = h0 (t), o
que implica, pelo Lema 23.2, que a diferenca H(t) h(t) e constante para todo t [0, 1]. Como
H(0) = 0, segue que H(t) h(t) = h(0) = g(y) para todo t [0, 1]. Para t = 1 essa igualdade fica
H(1) h(1) = g(y) e como h(1) = g(x) conclumos que
Z 1
g(x) g(y) =
g 0 ( x + (1 )y)(x y) d .
0

Usando (23.11), segue disso que


0

kg(x) g(y)kN max kg (tx + (1 t)y)(x y)kN


t[0, 1]

max kg (tx + (1 t)y)k k(x y)kM ,

t[0, 1]

o que completa a demonstracao.


Derivadas parciais
Sejam X e Y dois espacos normados com normas k kX e k kY , respectivamente. Podemos fazer
do produto cartesiano X Y = {(x, y), x X, y Y} um espaco vetorial normado declarando as
operacoes de soma e produto por escalares por 1 (x1 , y1 ) + 2 (x2 , y2 ) := (1 x1 + 2 x2 , 1 y1 + 2 y2 )
e definindo a norma k(x, y)kXY := kxkX + kykY . Mais que isso, se X e Y forem espacos de Banach
em relacao a`s suas respectivas normas, e facil constatar que X Y tambem o e em relacao a norma
k(x, y)kXY .
E. 23.8 Exerccio. Prove que k kXY e de fato uma norma e que X Y e um espaco de Banach em
relacao `a mesma se X e Y o forem em relacao `as suas respectivas normas.
6
Para distinguirmos a estrutura de espa
 co vetorial de X Y definida acima, denotaremos os vetores
x
(x, y) X Y como vetores-coluna: y .
Definamos as projecoes X : X Y X e Y : X Y Y por
 
 
x
x
:= y ,
:= x ,
Y
X
y
y

respectivamente, e definamos X : X X Y e Y : Y X Y por


 
 
x
0
X x :=
,
Y y :=
,
0
y
um exerccio elementar (mas importante) mostrar que X , Y , X e Y sao lineares
respectivamente. E
e contnuas se dotarmos X, Y e X Y das topologias das normas k kX , k kY e k kXY , respectivamente.
igualmente elementar constatar que
E
X X =

Y Y =

X X + Y Y =

XY

(23.13)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1016/1304

Seja Z um terceiro espaco de Banach com norma k kZ . Para A X e B B dois abertos convexos,
seja F : A B Z uma funcao contnua e diferenciavel, sendo F 0 : A B Z sua derivada. Para
cada (x, y) A B a expressao F 0 (x, y) define um operador linear e contnuo X Y Z.
Para y fixo em B podemos considerar tambem a funcao A 3 x 7 F (x, y), assim como para
x fixo em A podemos considerar a funcao B 3 y 7 F (x, y). Se essas funcoes forem diferenciaveis
denotaremos suas derivadas por D1 F e D2 F , respectivamente. Note-se que D1 F e uma aplicacao linear
X Z e D2 F e uma aplicacao linear Y Z.
Vamos mostrar que se F 0 existe entao essas duas funcoes sao tambem diferenciaveis e vamos estabelecer relacoes entre D1 F , D2 F e F 0 . De fato, da existencia de F 0 sabemos que
 
a
kR(a, b)kZ
0
F (x + a, y + b) F (x, y) = F (x, y)
= 0.
+ R(a, b) ,
com
lim
(a, b)0 k(a, b)kXY
b

para todos (a, b) X Y. Em particular, para b = 0 teremos


 
a
0
F (x + a, y) F (x, y) = F (x, y)
+ R(a, 0) ,
com
b

kR(a, 0)kZ
= 0,
a0 k(a, 0)kXY
lim

ou seja, escrevendo R(a, 0) R(a) e lembrando que k(a, 0)kXY = kakX , tem-se


F (x + a, y) F (x, y) = F (x, y) X a + R(a) ,
0

com

lim

a0

kR(a)kZ
= 0,
kakX

o que nos permite concluir que


D1 F (x, y) = F 0 (x, y)X .
Analogamente, podemos concluir que
D2 F (x, y) = F 0 (x, y)Y .
Dessas expressoes extrai-se facilmente a continuidade de D1 F (x, y) e D2 F (x, y) como funcoes de
(x, y) A B. Da u
ltima das relacoes em (23.13) obtemos
F 0 (x, y) = D1 F (x, y) X + D2 F (x, y) Y .

(23.14)

As u
ltimas tres expressoes valem para todo (x, y) A B.

D1 F e D2 F definem as derivadas parciais de F em relacao a seu primeiro e segundo argumentos,


respectivamente.

23.3

A Integra
c
ao no Sentido de Lebesgue

A presente secao e dedicada a` teoria da integracao de funcoes definidas em espacos mensuraveis. A


nocao de integracao da qual trataremos foi introduzida por Lebesgue entre 1901 e 1902 20 e redescoberta
20

O trabalho de Lebesgue sobre a teoria da integraca


o, intitulado Integrale, longueur, aire foi apresentado como
dissertaca
o a
` Universidade de Nancy em 1902.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1017/1304

independentemente por Young21 dois anos mais tarde. A teoria de integracao introduzida por Lebesgue representa uma importante extensao da teoria de integracao de Riemann e desde cedo encontrou
aplicacoes em diversas areas da Matematica (como, para ficar em um u
nico exemplo, na teoria das
series de Fourier), com reflexos tambem na Fsica.
A teoria da integracao de Lebesgue faz amplo uso de nocoes da teoria da medida e necessita, em
particular, da nocao de funcao mensuravel, que iremos discutir antes de passarmos a` definicao geral da
integral de Lebesgue propriamente dita.

23.3.1

Fun
co
es Mensur
aveis e Fun
co
es Simples

Comecemos com uma definicao que sera amplamente empregada no que segue, a de funcao caracterstica
de um conjunto.
A fun
c
ao caracterstica de um conjunto
Seja M e um conjunto nao-vazio e A M . A funcao A : M

1, se x A
A (x) :=
0, se x 6 A


definida por

e denominada funca
o caracterstica do conjunto A, ou funca
o indicatriz do conjunto A.
E. 23.9 Exerccio. Seja M um conjunto nao-vazio e A, B M . Mostre que
A (x)B (x) = AB (x) ,

x M .

(23.15)
6

Fun
co
es mensur
aveis. Defini
c
ao e coment
arios
Apresentemos uma importante definicao, a de funcao mensuravel. Sejam (M, M) e (N, N) dois
espacos mensuraveis, sendo M e N dois conjuntos nao-vazios e M (M ) e N (N ) -algebras em
M e N , respectivamente.
Uma funcao f : M N dita ser uma funca
o mensur
avel em relacao a`s -algebras M e N, ou
[M, N]-mensuravel, se f 1 (A) M para todo A N, ou seja, se a pre-imagem de todo conjunto
mensuravel segundo N for um conjunto mensuravel segundo M.
O estudante deve comparar essa definicao com a definicao de funcao contnua DC 1, pagina 990.
Devido ao seu seu papel preponderante na teoria da integracao (de Lebesgue), vamos primeiro estudar
algumas das propriedades basicas das funcoes mensuraveis, especialmente das funcoes numericas, ou
seja, aquelas cuja imagem esta em ou em .


A primeira propriedade elementar e bastante geral: se (M1 , M1 ), (M2 , M2 ) e (M3 , M3 ) sao tres
espacos mensuraveis e se f : M1 M2 e g : M2 M3 sao duas funcoes mensuraveis (f sendo
21

William Henry Young (1863-1942).

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1018/1304

[M1 , M2 ]-mensuravel e g sendo [M2 , M3 ]-mensuravel) entao g f : M1 M3 e mensuravel em relacao


a M1 e M3 (ou seja, [M1 , M3 ]-mensuravel). A prova e imediata pela definicao.
Dado um espaco mensuravel (M, M) estaremos, como dissemos, primordialmente interessados em
funcoes f : M . Qual -algebra adotar em ? As duas possibilidades mais importantes sao a
-algebra de Lebesgue22 ML , dos conjuntos mensuraveis pela medida de Lebesgue L , e a -algebra
de Borel23 M[ ] que, por definicao, e a menor -algebra que contem a topologia usual da reta . A
-algebra de Borel foi estudada no Captulo 18 (vide especialmente a pagina 924). Vimos na Secao
20.1.1, pagina 957, que M[ ] ML .


Para a grande maioria dos propositos da teoria da integracao e suficiente considerar em


a algebra de Borel M[ ]. Assim, dado um espaco mensuravel (M, M) estaremos interessados em
funcoes f : M , dotando da -algebra de Borel M[ ].


Os conjuntos que compoe M[ ] sao denominados conjuntos Borelianos. Que conjuntos sao estes?
Recordando o que aprendemos nos captulos supra-citados, todos os conjuntos abertos ou fechados de
(na topologia usual ) sao Borelianos. Sao tambem Borelianos intervalos semi-abertos como [a, b)
ou (a, b], assim como unioes contaveis dos mesmos e seus complementos.


Ha em , alem dos intervalos semi-abertos, outros conjuntos S


Borelianos que nao sao nem abertos
nem fechados. O conjunto dos racionais, , e Boreliano, pois = r {r}, uma uniao contavel de conjuntos Borelianos {r} (que contem apenas um ponto e sao Borelianos por serem fechados). O conjunto
dos irracionais e Boreliano por ser o complemento de , que e Boreliano. Analogamente o conjunto
dos n
umeros reais algebricos e Boreliano, assim como o conjunto dos n
umeros reais transcendentes.
Generalizando o raciocnio, todo conjunto finito ou contavel de
e Boreliano e seu complemento
tambem.


Se f : M e mensuravel em relacao a`s -algebras M e M[ ], f dita ser uma funca


o Boreliana.
Se f : M e mensuravel em relacao a`s -algebras M e ML , f dita ser mensur
avel de Lebesgue.
Como M[ ] ML , toda funcao mensuravel de Lebesgue e Boreliana. Que funcoes sao Borelianas?
difcil dar uma descricao geral, mas no caso importante de funcoes f : onde adotamos M[ ]
E
como a -algebra tanto do domnio quando da imagem, e relativamente facil provar que toda funcao
contnua e Boreliana. A prova e apresentada no Apendice 23.B, pagina 1049, quando tratarmos de
funcoes mensuraveis entre espacos topologicos.


Sao tambem Borelianas as funcoes contnuas por partes, ou seja, aquelas que possuem um n
umero
finito de descontinuidades. Ha ainda outras funcoes que sao Borelianas mas que nao sao nem contnuas
nem contnuas por parte. Exemplos sao as funcoes de (23.1).
E. 23.10 Exerccio. Justifique!

Um exemplo de uma funcao nao-mensuravel, mais especificamente, de uma funcao f :

que nao e Boreliana, e a funcao caracterstica de um conjunto nao-mensuravel (ou nao Boreliano),
como a funcao caracterstica V (x) do conjunto de Vitali V que introduzimos no Captulo 19 (vide
especialmente a pagina 939). Funcoes nao-mensuraveis sao praticamente desconsideradas na teoria da
integracao.


22
23

Henri Leon Lebesgue (1875-1941).

Felix Edouard
Justin Emile
Borel (1871-1956).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1019/1304

No Apendice 23.B, pagina 1049, estuda-se com mais profundidade a nocao de funcao mensuravel.
Para os nossos propositos, o principal resultado que la obtemos e o seguinte:
Proposi
c
ao 23.5 Se (M, M) e um espaco de medida, ent
ao o conjunto de todas as funco
es f : M
que sejam [M, M[ ]]-mensur
aveis forma uma a
lgebra real. Mais precisamente, se f : M
e
g : M s
ao ambas [M, M[ ]]-mensur
aveis, ent
ao


1. Para todos ,

vale que f + g e [M, M[ ]]-mensur


avel.


2. O produto f g e [M, M[ ]]-mensur


avel.

Fun
co
es mensur
aveis complexas
Uma funcao f : M e [M, M[ ]]-mensuravel se e somente se suas partes real e imaginaria
forem [M, M[ ]]-mensuraveis. Isso e demonstrado nas Proposicoes 23.14 e 23.15, das paginas 1054 e
seguintes.


Usando a Proposicao 23.5 e facil ver que o conjunto de todas as funcoes complexas mensuraveis e
tambem uma algebra complexa. Vide Proposicao 23.16, pagina 1055.
Fun
co
es definidas por sups e infs
Se {fn } e uma seq
uencia de funcoes definidas em M assumindo valores em
sup fn , inf fn , lim sup fn e lim inf fn sao definidas para cada x M por
n

, entao as funcoes

sup fn (x) := sup (fn (x)) ,


n


inf fn (x) := inf (fn (x)) ,
n

lim sup fn (x) := lim sup (fn (x)) ,


lim inf fn (x) := lim inf (fn (x)) .
n

Se (M, M) for um espaco de medida e as funcoes fn forem todas [M, M[ ]]-mensuraveis, entao
todas as funcoes definidas acima sao tambem [M, M[ ]]-mensuraveis.


Por exemplo, para provar que a funcao f := sup fn e mensuravel, notamos que para qualquer a


((a, )) =

n=1

fn1 ((a, )).

E. 23.11 Exerccio. Certo? Sugestao: Secao 1.1.4, pagina 43.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1020/1304

Pela Proposicao 23.10, pagina 1051, cada conjunto fn1 ((a, )) pertence a M, portanto, a uniao
acima tambem, pois e uma uniao contavel. Logo, f 1 ((a, )) M para todo a
e, novamente
pela Proposicao 23.10, isso implica que f e [M, M[ ]]-mensuravel.


Analogamente, prova-se que f := inf fn e [M, M[ ]]-mensuravel, pois nesse caso




((, a)) =

fn1 ((, a)).

n=1

Para o caso de f = lim sup fn , notamos que lim sup fn = inf sup fn . Pelo argumentado acima, cada
n

m1 nm

sup fn e [M, M[ ]]-mensuravel e assim o e seu nfimo para todo m. Finalmente, o caso da funcao


nm

lim inf fn e analogo.


n

Partes positiva e negativa de uma fun


c
ao
Para f : M


f + (x) :=

, definimos

f (x), se f (x) 0,

0,

f (x) :=

se f (x) < 0,

f (x), se f (x) 0,

0,

se f (x) > 0,

claro que f + (x) 0 e


f + e denominada parte positiva de f e f e denominada parte negativa de f . E
facil ver que
que f (x) 0 para todo x. E
f (x) + |f (x)|
2

f (x) + |f (x)|
2

f (x) =

f = f+ f

|f | = f + + f .

f + (x) = f (x)F + (x)

f (x) = f (x)F (x)

F + = {x M | f (x) 0}

F = {x M | f (x) 0} .

f + (x) =
e, conseq
uentemente,
igualmente facil ver que
E

(23.16)

sendo que
Se f e mensuravel, F + e F sao conjuntos mensuraveis, por serem as pre-imagens por f dos Borelianos
[0, ) e (, 0], respectivamente. Assim, as funcoes caractersticas F sao mensuraveis. Como o
produto de duas funcoes mensuraveis e mensuravel (Proposicao 23.5), conclumos de (23.16) que f + e
f sao funcoes mensuraveis. Da, como |f | = f + + f , segue tambem que |f | e mensuravel, pois e a
soma de duas funcoes mensuraveis (novamente, Proposicao 23.5).
A representa
c
ao normal
Se M e um conjunto nao-vazio, dizemos que uma funcao real ou complexa f : M , ou f :
M
possui uma representacao normal se para algum m
existirem n
umeros 1 , . . . , m ,


JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1021/1304

nao necessariamente distintos, e conjuntos B1 , . . . , Bm tais que Bi Bj = para i 6= j, que M =


B1 Bm e que
m
X
f (x) =
k Bk (x)
(23.17)
k=1

A soma do lado direito de (23.17) e dita ser uma representaca


o normal de f . Note que nem toda
funcao f possui uma representacao normal. Alem disso, se f possui uma representacao normal esta
nao e necessariamente u
nica: podemos dividir alguns dos conjuntos Bk em sub-conjuntos disjuntos
menores e obter uma nova representacao normal. Ou podemos tomar a uniao de conjuntos B k com
valores iguais de k e obter uma nova representacao normal.
importante notar que se f admite uma representacao normal, entao f assume um n
E
umero finito
de valores (certo?). Veremos que essa e uma condicao necessaria e suficiente para que uma funcao f
possua uma representacao normal.
Fun
co
es simples

Se M e um conjunto nao-vazio, uma funcao s : M , ou s : M , e dita ser elementar ou


simples se assumir apenas um n
umero finito de valores, ou seja, se sua imagem for =(s) = {s 1 , . . . , sn },
para algum n , com si 6= sj para i 6= j, sendo que cada sk e um elemento de ou de , conforme
o caso. Se s e simples e =(s) = {s1 , . . . , sn }, defina-se os conjuntos Ak M por Ak = s1 (sk ), ou
seja, Ak e a pre-imagem de sk por s:


Ak = {x M | s(x) = sk }.

bastante evidente que Ai Aj = para i 6= j, que M = A1 An e que


E
s(x) =

n
X

sk Ak (x) .

(23.18)

k=1

Vemos com isso que toda funcao simples possui pelo menos uma representacao normal.
Uma representacao normal como a de (23.18), na qual as constantes sk sao todas distintas, e dita
ser uma representaca
o normal curta da funcao simples s. O leitor podera facilmente convencer-se que
a representacao normal curta de uma funcao simples e u
nica.
Um ponto importante e a seguinte observacao: uma funcao simples e mensuravel (em relacao a
uma -algebra M definida em M ) se e somente se cada Ak acima for um conjunto mensuravel (ou seja
Ak M). A prova e evidente e dispensavel.
A
algebra das fun
co
es simples
As funcoes simples formam uma algebra. As funcoes simples e mensuraveis tambem formam uma
algebra. A prova dessas afirmacoes e bem simples e deixada ao leitor. O proximo exerccio e mais
detalhado quanto a`s propriedades algebricas das funcoes simples.
E. 23.12 Exerccio (f
acil). Se s e r sao funcoes simples definidas em M com representacoes normais
s(x) =

n
X
k=1

sk Ak (x)

r(x) =

m
X
l=1

rl Bl (x)

JCABarata. Curso de Fsica-Matem


atica

mostre que
r(x)s(x) =

Captulo 23

Vers
ao de 29 de setembro de 2005.

n X
m
X
k=1 l=1

1022/1304

sk rl Ak Bl (x) .

Isso segue facilmente da identidade A B = AB . Para qualquer numero tem-se, obviamente,


s(x) =

n
X

sk Ak (x) .

k=1

Por fim, mostre que


r(x) + s(x) =

n X
m
X
k=1 l=1

(sk + rl ) Ak Bl (x) .

(23.19)

Para provar isso, voce devera usar os fatos que A1 An = M e que B1 Bm = M , sendo ambas
unioes de conjuntos disjuntos, para mostrar que
1 =

n
X

Ak (x)

k=1

1 =

m
X

Bl (x) .

l=1

Disso, segue facilmente, usando a identidade A B = AB , que


Ak (x) =

m
X
l=1

Ak Bl (x)

Bl (x) =

n
X
k=1

Bl Al (x) ,

e disso, segue facilmente (23.19).

Fun
co
es mensur
aveis e fun
co
es simples
Toda funcao real nao-negativa, mensuravel por Lebesgue ou Boreliana, pode ser aproximada por
funcoes simples. Mais precisamente temos o seguinte lema (de [58]) que, embora um tanto tecnico,
revela uma relacao subjacente entre funcoes mensuraveis em geral e funcoes simples mensuraveis.
Lema 23.3 Se M e um espaco de medida com uma -
algebra M, toda funca
o f : M n
ao-negativa
e Boreliana (ou mensur
avel por Lebesgue) e o limite de uma seq
uencia mon
otona n
ao-decrescente de
funco
es simples mensur
aveis e n
ao-negativas. Se f for tambem limitada, a convergencia e ate mesmo
uniforme.
2


A prova encontra-se no Apendice 23.C, pagina 1055. O Lema 23.3 tem o seguinte
Corol
ario 23.2 Se M e um espaco de medida com uma -
algebra M, toda funca
o f : M
seja Boreliana e o limite de uma seq
uencia de funco
es simples mensur
aveis.


que
2

Prova. A diferenca com relacao ao Lema 23.3 e que f nao e necessariamente nao-negativa. Pelo que
observamos, porem, f = f + f , sendo ambas f nao-negativas e Borelianas. A elas, portanto,
aplica-se o Lema 23.3, o que encerra a prova.

JCABarata. Curso de Fsica-Matem


atica

23.3.2

Captulo 23

Vers
ao de 29 de setembro de 2005.

1023/1304

A Integral de Lebesgue. Integra


c
ao em Espa
cos Mensur
aveis

Passamos agora a` empreitada de definir o conceito de integral de Lebesgue em espacos mensuraveis.


O processo segue varias etapas sucessivas, iniciando com a definicao de integral de funcoes simples
mensuraveis, que serao usadas para definir a integral de funcoes positivas mensuraveis e assim por
diante.
Integra
c
ao de fun
co
es simples
Seja agora M um espaco mensuravel com uma -algebra M, na qual esta definida uma medida .
Se s e uma funcao simples e nao-negativa
(ou seja, se s(x) 0 para todo x), M-mensuravel e com
Pn
representacao normal curta s(x) = k=1 sk Ak (x), a integral de s em M com respeito a
` medida e
definida por
Z
Z
n
X
sk (Ak ) .
(23.20)
s d
s(x) d(x) :=
M

k=1
sk 6=0

Observa
co
es.
1. Note-se que na soma a` direita na expressao (23.20) exclui-se os valores de k para os quais s k = 0.
Para tais valores de k pode eventualmente valer (Ak ) = . Se convencionarmos que 0 = 0,
podemos reescrever a definicao acima de forma mais simplificada como
Z

s d

s(x) d(x) :=
M

n
X

sk (Ak ) .

k=1

Para simplificar a notacao, essa convencao 0 = 0 e adotada por muitos autores e nos
juntaremos a eles nestas Notas. Observemos tambem que a soma do lado esquerdo pode valer
, caso (Ak ) = para algum k com sk > 0.
2. Na definicao (23.20) usamos a representacao normal curta da funcao s, mas isso nao e necessario
pois qualquer representacao normal de s pode ser usada com identico resultado. De fato, sejam
s(x) =

p
X

k Bk (x)

s(x) =

q
X

l Cl (x)

(23.21)

l=1

k=1

duas representacoes normais de s, com Bi Bj = para i 6= j, com M = B1 Bp e igualmente


Ci Cj = para i 6= j, com M = C1 Cq . Entao,
p
X
k=1

k (Bk ) =

q
X

l (Cl ) .

(23.22)

l=1

A prova de (23.22) e apresentada no Apendice 23.D, pagina 1056. A validade de (23.22) mostra
que a definicao de integral de uma funcao simples dada acima e intrnseca e nao depende da
particular representacao normal adotada.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1024/1304

Uma funcaoPsimples (nao necessariamente positiva) e M-mensuravel s, com uma representacao


normal s(x) = nk=1 sk Ak (x), e dita ser -integr
avel se (Ak ) < para todo k com sk 6= 0. Observese que para os valores de k para os quais sk = 0 nao estamos impedidos de ter (Ak ) = . Para uma
tal funcao definimos igualmente
Z
Z
n
n
X
X
sk (Ak ) =
sk (Ak ) .
s d
s(x) d(x) :=
M

k=1

k=1
sk 6=0

Na u
ltima igualdade usamos a convencao 0 = 0. Note que para s integravel,

s d < .

A definicao de integral de funcoes simples que empreendemos acima e o primeiro passo da definicao
mais geral de integral de funcoes em espacos mensuraveis. Antes de prosseguirmos, facamos alguns
comentarios de esclarecimento sobre as definicoes acima.
Alguns esclarecimentos
O estudante deve reparar nos cuidados tomados nas definicoes acima: so definimos a nocao de
integral para funcoes simples e mensuraveis que sejam ou nao-negativas ou integraveis. Ao definirmos
a integral de funcoes simples nao-negativas permitimos ter (Ak ) = para algum k com sk > 0. Aqui,
a condicao de s ser nao-negativa e importante para evitar o aparecimento de somas to tipo ,
que nao estao definidas. Isso seria o caso de uma funcao simples como

+2, se x (1, )
s(x) =
.
1, se x (, 1]
Essa fun
R cao e mensuravel de Lebesgue. Porem, para a medida de Lebesgue L , a integral dessa
funcao
s dL = +2L ((1, )) + (1)L ((, 1]) nao esta definida, pois L ((1, )) = e
L ((, 1]) = e nao temos como definir a diferenca +2L ((1, )) + (1)L ((, 1]). Ja para a
funcao simples e mensuravel

+2, se x (1, )
s(x) =
0, se x (, 1]
R
teremos
s dL = +2L ((1, )) + (0)L ((, 1]) = +2L ((1, )) = . Para as funcoes simples
integraveis tais problemas nao ocorrem ja que os termos sk (Ak ) sao finitos (positivos ou negativos).
De fato, para funcoes simples integraveis so se tera (Ak ) = se sk = 0 e nesse caso convenciona-se
sk (Ak ) = 0. O seguinte exemplo ilustra isso: com relacao a` medida de Lebesgue a funcao simples

+2, se x (1, 4)
s(x) =
0, se x 6 (1, 4)
R
e mensuravel e integravel e M s dL = +2L ((1, 4)) + (0)L ( \ (1, 4)) = 2 3 + 0 = 2 3 = 6.


Integrais indefinidas de fun


co
es simples

Se s e simples mensuravel nao-negativa ou s e simples mensuravel e integravel e se E M com


E M, definimos
Z
Z
n
X
sk (Ak E) .
s d :=
s E d =
E

k=1

JCABarata. Curso de Fsica-Matem


atica

Au
ltima igualdade segue de s(x)E (x) =
que

sE d =
M

n
X
k=1

n
X

Captulo 23

Vers
ao de 29 de setembro de 2005.

sk Ak (x)E (x)

(23.15)

k=1

sk (Ak E) , como desejamos. As integrais

integrais definidas da funcao simples s.

n
X

k=1

1025/1304

sk Ak E (x), de onde extrai-se

s d sao por vezes denominadas


E

Propriedades elementares da integra


c
ao de fun
co
es simples
As seguintes propriedades das integrais de funcoes simples sao validas e podem ser facilmente
verificadas:
Z
Z
(s) d =
s d ,
E

(sa + sb ) d =

s1 d

sa d +
E

s2 d

sb d ,
E

se

s1 (x) s2 (x),

x E .

Acima, s, sa e sb sao funcoes simples, integraveis e complexas quaisquer e


sao funcoes simples, integraveis e reais quaisquer.

, constante. s 1 e s2

Medidas definidas pela integral de fun


co
es simples n
ao-negativas
O seguinte resultado (de [110]), que tem interesse por si so, sera usado mais adiante, por exemplo
quando demonstrarmos o Teorema da Convergencia Monotona, Teorema 23.4, pagina 1035.
Lema 23.4 Seja M n
ao-vazio, M uma -
algebra de M na qual definimos uma medida . Seja s uma
funca
o simples, n
ao-negativa e [M, M[ ]]-mensur
avel e integr
avel. Para E M defina-se
Z
Z
s (E) :=
s d =
s E d .


Ent
ao s e uma medida em M.

Prova. Em primeiro lugar, note-se que s () = 0, pois e identicamente nula. Como s e nao-negativa,
s (E) 0 para todo E M.
P
Seja uma representacao normal de sP
= nk=1 sk Ak (com Ak M S
para todo k, pois s e mensuravel).
n

Teremos para cada E M, s (E) = k=1 sk (Ak E).


SSe E = m=1 Em e uma uniao disjunta e
contavel com Em M para todo m, vale que Ak E = m=1 (Ak Em ), tambem uma uniao disjunta
e contavel de elementos de M. Logo, como e uma medida, vale que
!
!

[
[
X
Em =
(Ak E) = Ak
(Ak Em ) =
(Ak Em ).
m=1

m=1

m=1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1026/1304

Assim,
s

m=1

Em

n
X
k=1

sk Ak

m=1

Em

n X

sk (Ak Em ) =

k=1 m=1

X
n
X

m=1 k=1

sk (Ak Em )

s (Em ) .

m=1

Isso provou que s e -aditiva e, portanto, e uma medida.


E. 23.13 Exerccio. O que justifica a troca de ordem das somas feita na demonstracao acima?

Integra
c
ao de fun
co
es mensur
aveis. A integral de Lebesgue
Como acima, seja M nao-vazio, M uma -algebra de M na qual definimos uma medida .
Seja f : M + uma funcao nao-negativa e mensuravel. Denotaremos por S(f ) a colecao de
todas as funcoes simples, mensuraveis, nao-negativas e menores ou iguais a f :


S(f ) := {s : M


| s e simples, mensuravel e 0 s(x) f (x) para todo x M } .

O Lema 23.3 nos ensinou que S(f ) e nao-vazio e que ha ate mesmo seq
uencias em S(f ) que convergem
a f . Definimos entao para E M com E M,
Z
Z
f d := sup
s d .
(23.23)
E

sS(f )

Essa expressao define a integral de Lebesgue da funca


o f sobre o conjunto E em respeito a
` medida .
A definicao acima foi introduzida por Lebesgue como substituto a` definicao de integral devida a
Riemann. Discutiremos suas virtudes mais adiante. Note que a definicao acima e bastante geral, no
sentido de nao ser especificado o que e o conjunto M nem a medida . Por ora, a definicao acima
limita-se a funcoes nao-negativas f . Logo mostraremos como essa definicao pode ser estendida para
funcoes que podem ser negativas ou complexas.
Se fn e uma seq
uencia monotona nao-decrescente de funcoes simples mensuraveis de S(f ) que
converge a f (que tal existe, garante-nos o Lema 23.3) e possvel mostrar que
Z
Z
f d = lim
fn d .
(23.24)
E

R
A expressao (23.24) pode ser tomada como definicao alternativa equivalente de E f d e, de fato,
alguns autores assim o fazem. A equivalencia das duas definicoes e demonstrada no Apendice 23.E,
pagina 1057. Seu estudo e dispensavel em uma primeira leitura.
A integra
c
ao de Lebesgue e conjuntos de medida zero
Dentre as propriedades da integral definida acima, a seguinte observacao tera um papel importante
a desempenhar.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1027/1304

Proposi
c
ao 23.6 Seja
(M, M) um espaco de medida e seja f : M + uma funca
o [M, M[ ]]R
mensur
avel tal que E f d = 0 para algum E M. Ent
ao f = 0 -q.t.p. em E.
2


Prova. Seja En = {x M | f (x) > 1/n} E = {x E| f (x) > 1/n}. Pela Proposicao 23.10 da pagina
claro pela definicao de En que f 1 En . Portanto, a funcao simples 1 En e
1051, tem-se En M. E
n
n
um elemento de S(f ) e, pela definicao (23.23) da integral de Lebesgue, segue que
Z
Z
1
1
0 =
f d
En d = (En ) ,
n
E
E n
S
ou seja, (En ) = 0 paraPtodo n . Note-se agora que {x E| f (x) > 0} =
n=1 En . Logo,
({x E| f (x) > 0})
(E
)
=
0,
provando
que
f
=
0
-q.t.p
em
E.
n
n=1


Fun
co
es integr
aveis
Como acima, seja M nao-vazio, M uma -algebra de M na qual definimos uma medida . Seja
f : M uma funcao mensuravel. f e dita ser integr
avel em M se
Z
|f | d < .


R
+

Como
|f
|
=
f
+
f
,
sendo
ambas
f
n
a
o-negativas
e
mensur
a
veis,
segue
que
f + d < e
M
R
f d < . Com isso, e como f = f + f , sendo ambas f nao-negativas, e natural definir
M
Z
Z
Z
+
f d :=
f d
f d .
M

As integrais do lado direito sao finitas e, portanto, sua diferenca esta bem definida.
Propriedades elementares da integra
c
ao
As seguintes propriedades das integrais de funcoes integraveis sao validas e podem ser facilmente
verificadas:
Z
Z
(f ) d =
f d ,
(23.25)
E

(fa + fb ) d =
E

f1 d

fa d +
E

f2 d
E

fb d ,

(23.26)

se

f1 (x) f2 (x),

Acima, f , fa , fb , f1 e f2 sao funcoes integraveis reais quaisquer e




x E .

(23.27)

, constante.

E. 23.14 Exerccio (recomendado a quem deseja testar se est


a realmente acompanhando a exposica
o).
Demonstre as propriedades elementares acima.
6

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

Uma outra propriedade relevante de demonstracao simples e a seguinte se f : M



Z
Z


f d
|f | d .

for integravel,
(23.28)

Isso segue das seguintes linhas:



Z


f d =

1028/1304

Z

Z
Z

Z





+

f d
f d f d + f d

E

f d +

f d =

(f + + f ) d

|f | d .

Fun
co
es complexas integr
aveis
Caso f seja uma funcao complexa, f : M , procede-se de forma semelhante. Como antes, f e
dita ser integr
avel em M se
Z
|f | d < .
M

p
Denotemos por Re(f ) e Im(f ) as partes real e imaginaria de f . Como |f | = |Re(f )|2 + |Im(f )|2 e
mensuravel pela Proposicao 23.14, pagina 1054, e claro que |Re(f )| |f |, |Im(f )| |f | e, de (23.27),
segue que
Z
Z
Z
Z
|Re(f )| d
|f | d <
e
|Im(f )| d
|f | d < .
(23.29)
M

Com isso, tanto Re(f ) quanto Im(f ) sao funcoes reais e integraveis e podemos aplicar a definicao acima
e escrever
Z
Z
Z
+
Re(f ) d =
(Re(f )) d
(Re(f )) d ,
M

Im(f ) d =
M

(Im(f )) d

Com isso, e natural definir a integral de f por


Z
Z
Z
f d :=
Re(f ) d + i
Im(f ) d
M

Z

(Im(f )) d .
M

(Re(f )) d

(Re(f )) d + i
M

Z

(Im(f )) d

(Im(f )) d .(23.30)
M

Todos os quatro termos acima sao finitos e a soma dos mesmos e, portanto, bem definida.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1029/1304

Chegamos dessa forma ao proposito de definir a nocao de integral para funcoes mensuraveis e
integraveis, reais ou complexas. Recapitulando, nossos passos foram 1) definir a integral de funcoes
simples nao-negativas e integraveis; 2) definir a integral de funcoes reais, mensuraveis e nao-negativas
a partir da integral de funcoes simples; 3) definir a integral de funcoes reais e integraveis a partir da
integral de funcoes reais, mensuraveis e nao-negativas ; 4) definir a integral de funcoes complexas e
integraveis a partir da integral de suas partes real e imaginaria.
Propriedades elementares da integra
c
ao de fun
co
es complexas
As seguintes propriedades das integrais de funcoes integraveis sao validas e podem ser facilmente
verificadas:
Z
Z
(f ) d =
f d ,
(23.31)
E

(fa + fb ) d =
E

fa d +
E

fb d ,

(23.32)

Acima, f , fa e fb sao funcoes integraveis e complexas quaisquer e , constante.


E. 23.15 Exerccio (recomendado a quem deseja testar se est
a realmente acompanhando a exposica
o).
Demonstre as propriedades elementares acima. Sugestao: use a definicao (23.24).
6
A desigualdade (23.28) se deixa generalizar para funcoes integraveis complexas, mas a prova e mas
engenhosa: se f : M for integravel, entao
Z

Z


f d
|f | d .
(23.33)


E

p
Para provar isso, notemos que, pela Proposicao 23.14, pagina 1054, |f | = (Re(f ))2 + (Im(f ))2 e
[M, M[ ]]-mensuravel se Re(f )Re Im(f ) o forem. Fora isso, ja vimos acima que Re(f ) e Im(f ) sao
integraveis se f o for. A integral E f d e um n
umero complexo e, portanto, pode ser escrito na forma
polar
Z

Z


i
f d = e f d .


A funcao g := e f e mensuravel e integravel, como facilmente se ve. Temos que


Z
Z
Z
Z
Z
(23.31)
i
i
Re(g) d + i
Im(g) d =
g d =
e f d = e
f d =
E

Z



f d 0 .


E

R

R
R
Como E f d e um n
umero real, segue que E Im(g) d = 0 e que E Re(g) d 0. Logo,

Z

Z
Z
Z
Z
Z
(23.29)
(23.28)



f d =
|Re(g)| d
|g| d =
|f | d ,
Re(g) d = Re(g) d


E

completando a prova de (23.33).


Os conjuntos Lp (M, d)

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1030/1304

Antes de passarmos a exemplos, vamos rapidamente introduzir uma notacao importante.


Se (M, M) e um espaco mensuravel e e uma medida em M , denotaremos o conjunto das funcoes
integraveis em M em relacao a` medida por L1 (M, d):



Z

L1 (M, d) := f : M f e [M, M[ ]]-mensuravel e
|f | d < .


Muito importantes sao tambem os espacos Lp (M, d), definidos por




Z


Lp (M, d) := f : M f e [M, M[ ]]-mensuravel e

|f | d <

onde p, em princpio, e um n
umero real positivo p > 0. Os espacos Lp (M, d) com p 1 serao
discutidos com mais detalhe adiante.
Exemplos. Integra
c
ao com a medida delta de Dirac
Vamos a alguns exemplos ilustrativos. Considere M =
medida delta de Dirac definida no item 2 da pagina 942.
Seja s(x) uma funcao simples definida em


, M=

( ) e = x0 para x0


com forma normal s(x) =

n
X

, a

sk Ak (x). Vamos supor

k=1

claro que s(x0 ) = sk0 . Teremos tambem pela definicao (19.2), pagina 942,
que x0 Ak0 . E
Z

s dx0 =


n
X

sk x0 (Ak ) = sk0 = s(x0 ) .

(23.34)

k=1

Se f :

e mensuravel, e fn e uma seq


Ruencia de funcoes simples que converge a f , teremos
obviamente que fn (x0 ) f (x0 ) e, por (23.34),
fn dx0 = fn (x0 ). Assim, por (23.24), segue que
Z
f dx0 = f (x0 ) .
(23.35)


O estudante deve constatar que essa expressao corresponde precisamente a` bem conhecida propriedade
Z
f (x)(x x0 )dx = f (x0 )

que comummente se associa em textos de Fsica a` funcao delta de Dirac.


Nota para os estudantes mais avancados. Alem da medida delta de Dirac existe tambem a distribuica
o
delta de Dirac. Ainda que muito semelhantes, esses objetos sao distintos matematicamente: o primeiro
e uma medida, o segundo e uma distribuicao, ou seja, um funcional linear contnuo em um certo espaco
de Frechet de funcoes infinitamente diferenciaveis (e que decaem rapido o suficiente no infinito). Com
a medida delta de Dirac podemos integrar qualquer funcao, como em (23.35). Com a distribuicao delta
de Dirac podemos integrar funcoes infinitamente diferenciaveis (e que decaem rapido o suficiente no
infinito). Essa aparente limitacao e compensada pelo fato de se poder falar em derivadas da distribuicao
delta de Dirac, mas nao da medida delta de Dirac.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1031/1304

Exemplos. Integra
c
ao com a medida de contagem. Rela
c
ao com os espa
cos `p
Seja M = {m1 , . . . , mn } um conjunto finito e seja M = (M ). Toda funcao f : M
e
simples e mensuravel em relacao a M e M[ ] (por que?). Seja c a medida de contagem em M , que
foi introduzida a` pagina 942. Tem-se que
Z
n
X
f dc =
f (mk ) .


Seja M =
simples entao

, M =


( ) e seja c a medida de contagem em




Uma funcao f :


k=1

f dc =
M

. Se f :


e uma funcao

f (k) .

k=1

e c -integravel se
Z

X
|f | dc =
|f (k)| < ,
M

e sua integral e

k=1

f dc =
M

f (k) .

k=1

P
P
Observe que o fato de
|f
(k)|
<

implica
que
a
s
e
rie
e convergente (por ser uma serie
k=1
k=1 f (k)
absolutamente somavel. Vide os bons livros de Calculo).
E. 23.16 Exerccio. Demonstre todas as afirmacoes feitas acima.

O estudante pode convencer-se com o apresentado acima que o conjunto L1 ( , dc ) das funcoes
f : integraveis em relacao a` medida de contagem c coincide com o conjunto de seq
uencias `1
que introduzimos na Secao 16.4.1, pagina 852. Os conjuntos Lp ( , dc ) coincidem com os conjuntos
de seq
uencias `p , tambem la introduzidos.


Exemplos. A integral de Lebesgue em




Um outro importante exemplo e aquele no qual tomamos M = , M = M[ ], a -algebra dos


conjuntos Borelianos de
e = L , a medida de Lebesgue. O conjunto L1 ( , L ) de funcoes
2
integraveis inclui funcoes contnuas que decaem rapidamente no infinito, tais como ex , (1 + x2 )1 etc.
O conjunto L1 ( , L ) inclui funcoes que nao sao limitadas. Um exemplo a se ter em mente e o da
funcao
1

|x| , 0 < |x| 1


f (x) =

0, x = 0 ou |x| > 1
p
Essa funcao, apesar de divergir para x 0, e um elemento de L1 ( , L ), pois a singularidade 1/ |x|
e integravel em 0.


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1032/1304

E. 23.17 Exerccio. Mostre isso!

Um tanto surpreendentemente, L1 ( , L ) tambem contem funcoes nao-limitadas, mas que sao


limitadas em qualquer regiao finita. Um exemplo interessante e o da funcao



1

n, para x em cada intervalo n, n + 3 , n 1 ,


n
f (x) =

0, de outra forma ,


ou seja,

f (x) =

X
n=1

n [n, n+ 1 ) (x) .
n3

claro que f nao e limitada em todo , mas e limitada em qualquer regiao finita. Tem-se, porem,
E
Z

X
1
<
|f | dL =
n2
n=1


e, portanto, f L1 (


, L ).

E. 23.18 Exerccio. Mostre isso!


E. 23.19 Exerccio.
funcoes limitadas.

23.3.3

Construa exemplos analogos de elementos de L p (




6
, L ), p 1, que nao sao
6

A Integral de Lebesgue e sua Rela


c
ao com a de Riemann

Uma vez desenvolvidos os ingredientes basicos da teoria de integracao de Lebesgue, voltemo-nos brevemente a` questao de estabelecer sua relacao com a integracao de Riemann.
As integrais de Riemann e Lebesgue em intervalos compactos
Tratemos primeiramente de funcoes definidas em conjuntos compactos da reta real. Vale a seguinte
afirmacao:
Teorema 23.2 Seja f : [a, b]
uma funca
o Boreliana e limitada. Ent
ao, se f for integr
avel no
sentido de Riemann, f e tambem integr
avel no sentido de Lebesgue (para a integral de Lebesgue em
[a, b]) e as duas integrais s
ao identicas.
2


Esse teorema afirma que em intervalos finitos como [a, b] a integral de Lebesgue coincide com a de
Riemann, pelo menos para funcoes integraveis por Riemann e limitadas. Esse resultado e satisfatorio
pois diz-nos que a teoria da integracao de Lebesgue estende a de Riemann, pelo menos nesse sentido.
A demonstracao do Teorema 23.2 e apresentada no Apendice 23.I, pagina 1062, e faz uso do Lema de
Fatou e do Teorema da Convergencia Dominada, que introduziremos na Secao 23.3.4, logo adiante.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1033/1304

O Teorema 23.2 estabeleceu uma relacao entre as integrais de Riemann e de Lebesgue no caso de
intervalos finitos da reta real. O que se pode dizer para intervalos nao-finitos? Como a integral de
Riemann foi definida na Secao 23.2, pagina 1000, apenas para funcoes limitadas em intervalos finitos,
a primeira questao a resolver e defin-la em intervalos nao-finitos, como . Isso foi discutido na Secao
23.2.1, pagina 1009, ao introduzirmos a nocao de integral de Riemann impropria.


A integral de Riemann impr


opria e sua rela
c
ao com a de Lebesgue em


No caso de f ser tambem positiva (o que nao e necessario para a definicao 23.6) tambem podemos
estabelecer uma relacao entre as integral de Riemann impropria e de Lebesgue. Isso e expresso no
seguinte
Teorema 23.3 Seja f : + uma funca
o positiva e Boreliana e tal que f e integr
avel no sentido
de Riemann em todo intervalo finito [a, b]. Ent
ao, f e integr
avelZno sentido de Lebesgue em
se e


somente se a integral de Riemann impr


opria existir e, nesse caso,
Z
f dL .
de Lebesgue

f (x) dx coincide com a integral

A demonstracao desse teorema tambem encontra-se no Apendice 23.I, pagina 1062.


As condicoes dos Teoremas 23.2 e 23.3 nao sao ainda as mais gerais possveis para garantir a
igualdade entre a integral de Riemann (normal ou impropria) e a de Lebesgue, mas nao trataremos
de generalizacoes aqui e remetemos o leitor interessado aos bons livros. Nesse contexto, vale fazer o
seguinte comentario. O Teorema 23.3 estabeleceu a relacao entre a integral de Riemann impropria
e a integral de Lebesgue em , mas somente para funcoes nao-negativas. Valera uma relacao assim
para funcoes mais gerais? A resposta, infelizmente, pode ser negativa em alguns casos, como mostra o
exemplo do qual trataremos a seguir.


Limita
co
es da integral de Lebesgue
importante chamar a atencao do leitor para uma limitacao da integracao de Lebesgue em , a
E
qual pode ser ilustrada pelo exemplo a seguir (encontrado em varios livros-textos).
sen x
Seja a funcao f (x)
R = x . E claro que f e Boreliana (pois e contnua) e limitada. Sera f integravel
em , ou seja, sera
|f | dL < ? Como f satisfaz f (x) = f (x) para todo x, e suficiente estudar
f para x 0. Em cada intervalo [(n 1), n], com n = 1, 2, 3, . . ., vale


Assim, para todo N




ex


+,

|f |(x)
e

Z


|f | dL

Z
N
X
1

n
n=1


| sen x|
| sen x|

.
|x|
n

N
X
1
| sen x| [(n1), n] (x)
n
n=1

| sen x| [(n1), n] (x) dL

Z
N
X
1
=
| sen x| dL .
n [(n1), n]
n=1

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1034/1304

claro que a funcao | sen x| e Boreliana (pois e contnua) e limitada. Aplicando o Teorema 23.2, tem-se
E
Z
Z n
| sen x| dx ,
| sen x| dL =
(n1)

[(n1), n]

a integral a` direita sendo a familiar integral de Riemann. Fazendo a mudanca de variaveis x


x (n 1), escrevemos
Z
Z
Z n
n1
sen x dx = 2 ,
|(1)
sen x| dx =
| sen x| dx =
0

(n1)

pois sen x e nao-negativa em [0, ]. Assim, para todo N


Z


|f | dL

N
2X 1
.
n=1 n

Agora, como e bem sabido, a soma do lado direito diverge quando N . Logo,
conseq
uentemente,
Z
|f | dL = .

R


|f | dL = e,
(23.36)

f dL sao finitas (justifique!).


R
A expressao (23.36) significa que f 6 L1 ( , dL ) e, portanto,
f dL nao esta definida. Sucede,
porem, que a integral de Riemann impr
opria (vide definicao (23.6)),

Note que nem mesmo

f + , dL ou

sen x
dx := lim
A
x

A
A

sen x
dx
x

existe, e vale .
Esse exemplo ensina-nos que ha funcoes que possuem uma integral de Riemann impropria, mas nao
uma integral de Lebesgue em .
RA
R sen x

dL nao? A resposta reside na observacao que
Por que o limite A senx x dx existe mas
x
R A sen x
nas
integrais
dx que
a funcao senx x troca de sinal infinitas vezes e isso produz cancelamentos
A
x

sen x

permitem a convergencia do limite A . A funcao x , porem, e cega a essas trocas de sinal,
devido a` presenca do modulo.


Na integracao de Lebesgue, ao concentrarmo-nos na integrabilidade do modulo de uma funcao f ,


como a de acima, perdemos informacao sobre oscilacoes e trocas de sinal da mesma que podem ser
relevantes para certos propositos24 . Esse fato pode ser interpretado como uma deficiencia da integracao
de Lebesgue.
24

Aos estudantes mais avancados notamos que esse e um dos problemas que tem impedido a definica
o matematicamente
precisa da integraca
o funcional de Feynman da Mec
anica Qu
antica e da Teoria Qu
antica de Campos (quando formuladas
no espaco-tempo de Minkowski). J
a a chamada integral funcional de Feynman-Kac, definida no espaco-tempo Euclidiano,
pode ser bem definida, por n
ao sofrer desses problemas (vide e.g. [48] ou [103, 104, 105, 106]). Para uma exposica
o
introdut
oria sobre a integraca
o funcional de Feynman na Mec
anica Qu
antica, vide, por exemplo, [99], ou bons livros de
Mec
anica Qu
antica.

JCABarata. Curso de Fsica-Matem


atica

23.3.4

Vers
ao de 29 de setembro de 2005.

Captulo 23

1035/1304

Teoremas B
asicos sobre Integra
c
ao e Converg
encia

Nesta secao apresentaremos alguns teoremas importantes sobre a integral de Lebesgue e que descrevem
o comportamento da mesma relativamente a operacoes de tomada de limites. De um ponto de vista
tecnico esses teoremas tem uma importancia central e pode-se mesmo dizer que sua validade e uma
das principais razoes do interesse na integral de Lebesgue, em comparacao a outras integrais, como a
de Riemann. Historicamente os teoremas de convergencia abaixo emergiram de trabalhos de Lebesgue,
Levi25 e Fatou26 .
O Teorema da Converg
encia Mon
otona
Teorema 23.4 (Teorema da Converg
encia Mon
otona) Seja (M, M) um espaco mensur
avel onde
encontra-se definida uma medida . Seja {fn } uma seq
uencia n
ao-decrescente de funco
es n
ao-negativas
fn : M , ou seja, 0 f1 (x) f2 (x) f3 (x) , sendo todas [M, M[ ]]-mensur
aveis.
Suponhamos tambem que f : M seja tal que para cada x M a seq
uencia f n (x) convirja a f (x).


avel e
Ent
ao, a funca
o f e tambem [M, M[ ]]-mensur
Z
Z
lim
fn d =
f d .


(23.37)

2
A demonstracao e apresentada no Apendice 23.F, pagina 1059.
Para apreciarmos a relevancia do Teorema
S da Convergencia Monotona, consideremos o seguinte
= {r1 , r2 , r3 , r4 , . . .} = n=1 {rk }, onde
3 k rk e uma contagem de .
exemplo. Seja
Defina-se

se x {r1 , . . . , rn }
2,
fn (x) =
.
x2
e , de outra forma


facil ver que cada funcao fn e [M[ ], M[ ]]-mensuravel (faca-o!) e que fn fn+1 para todo n.
E

Essas
funcoes Rfn sao integraveis
R
por Riemann (pois sao contnuas por partes). E tambem facil ver

x2
dx = .
que
fn dL = e


Agora, f (x) = lim fn (x) e dada por


n

f (x) =

2,

se x

ex ,

se x 6
R

e e tambem mensuravel. Tem-se tambem que


fn dL = . Assim,
Z
Z
lim
fn dL =
f dL ,
n

25
26

Beppo Levi (1875-1961).


Pierre Joseph Louis Fatou (1878-1929).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1036/1304

como se ve, e como garante o Teorema da Convergencia Monotona. Essa igualdade, porem, nao faria
sentido para a integral de Riemann, pois f , ao contrario das funcoes fn , nao e integravel por Riemann.
Condicoes suficientes para se poder comutar uma integral de Riemann com um limite de uma
seq
uencia de funcoes sao geralmente muito mais restringentes que o exigido no Teorema da Convergencia
Monotona e requerem, por exemplo, convergencia uniforme dessa seq
uencia.
O Lema de Fatou
O seguinte lema, denominado Lema de Fatou, possui varias aplicacoes, sendo tambem importante
na demonstracao do Teorema da Convergencia Dominada, do qual trataremos logo adiante, assim como
na demonstracao do Teorema 23.2, da pagina 1032, acima, que tratou da relacao entre as integrais de
Riemann e Lebesgue em intervalos finitos da reta real.
O Teorema da Convergencia Monotona, Teorema 23.4, tratava de seq
uencias monotonas naodecrescentes de funcoes positivas e mensuraveis da reta real e estabelecia a possibilidade de troca
de limites com a integracao expressa em (23.37). Podemos nos perguntar, e se tivermos uma seq
uencia
de funcoes positivas e mensuraveis mas que nao seja monotona nao-decrescente? Valera a inversao de
limites com a integral em (23.37)? A resposta, em geral, e nao, mas ainda assim, vale o seguinte:
Teorema 23.5 (Lema de Fatou) Seja (M, M) um espaco mensur
avel onde encontra-se definida
aveis fn :
uma medida . Seja {fn } uma seq
uencia de funco
es n
ao-negativas e [M, M[ ]]-mensur
M . Ent
ao,
Z 
Z

lim inf fn d lim inf
fn d .
(23.38)


A demonstracao encontra-se no Apendice 23.G, pagina 1060. O Lema de Fatou sera usado logo
abaixo para demonstrar um outro resultado ainda mais relevante, o Teorema da Convergencia Dominada.
Nem sempre vale a igualdade em (23.38). Isso e mostrado nos dois exerccios seguintes.
E. 23.20 Exerccio. Seja a seguinte sequencia de funcoes Borelianas da reta real
1
n , se x [n, n],
fn (x) =

0, se x 6 [n, n],

para n

, n > 0. Mostre que lim inf fn = 0 e, portanto,


n

Z 


Por outro lado,

R


lim inf fn dL = 0 .
n

fn = 2 para todo n e, portanto,


Z
lim inf
fn dL = 2 .
n

JCABarata. Curso de Fsica-Matem


atica

Assim,

Z 

lim inf fn d < lim inf


n

Captulo 23

Vers
ao de 29 de setembro de 2005.

1037/1304

fn d .


Em alguns casos pode-se ter uma igualdade em (23.38).


E. 23.21 Exerccio. Seja a seguinte sequencia de funcoes Borelianas da reta real
1
n2 , se x [n, n],
fn (x) =

0, se x 6 [n, n],

para n

, n > 0. Mostre que lim inf fn = 0 e, portanto,


n

Z 


Porem,

R


lim inf fn dL = 0 .
n

fn = 2/n para todo n e, portanto,


Z

lim inf
n

Assim,

Z 


fn dL = 0 .


lim inf fn d = lim inf


n

fn d .


O Teorema da Converg
encia Dominada
Teorema 23.6 (Teorema da Converg
encia Dominada) Seja (M, M) um espaco mensur
avel onde
encontra-se definida uma medida . Seja {fn } uma seq
uencia de funco
es [M, M[ ]]-mensur
aveis
fn : M , n , tais que o limite f (x) = lim fn (x) existe para todo x M . Suponha ainda que


exista uma funca


o n
ao-negativa F L1 (M, d) tal que |fn (x)| F (x) para todo n
Ent
ao:

e todo x M .

1. f L1 (M, d),
2.
lim

3.
lim

fn d =
M

|f fn | d = 0 ,

lim fn d =

f d ,
M

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1038/1304

A demonstracao encontra-se na Apendice 23.H, pagina 1061.


Para estudar uma situacao na qual o do Teorema da Convergencia Dominada, Teorema 23.6, se
aplica, faca o seguinte exerccio.
E. 23.22 Exerccio. Seja a seguinte sequencia de funcoes Borelianas da reta real
1
n2 , se x [n, n],
fn (x) =

0, se x 6 [n, n],

onde n

, n > 0. Mostre que ha uma funcao F L1 (

dL ) tal que |fn (x)| F (x) paraZtodo n


. Justifique entao, com base nesse fato, se a inversao da integral pelo limite lim
fn dL =


e todo x
Z
( lim fn ) dL e possvel. Verifique explicitamente que a igualdade e verdadeira.


Para constatar a relevancia da condicao basica do Teorema da Convergencia Dominada, Teorema


23.6, a saber, a existencia de uma funcao nao-negativa F L1 (M, d) tal que |fn (x)| F (x) para
todo n e todo x M , faca o seguinte exerccio.


E. 23.23 Exerccio. Seja a seguinte sequencia de funcoes Borelianas da reta real


1
n , se x [n, n],
fn (x) =

0, se x 6 [n, n],

para n , n > 0. Mostre que nao ha nenhuma funcao F L1 ( , dL ) tal que |fn (x)| F (x) para
todo n
e todo x . Sugestao: construa
a menor funcao F que satisfaz |f n (x)| F (x) para
R
todo Zn
e todo
e mostre que
|F | dL = . Verifique explicitamente que a igualdade
Z x
fn dL = ( lim fn ) dL nao e verdadeira.
6
lim


23.3.5

Alguns Resultados de Interesse

Os teoremas de convergencia que vimos acima tem varias conseq


uencias importantes. Trataremos de
algumas aqui. A primeira, e muito interessante, e uma generalizacao (de [110]) do Lema 23.4, pagina
1025.
Proposi
c
ao 23.7 Seja M n
ao-vazio, M uma -
algebra de M na qual definimos uma medida . Seja
f uma funca
o n
ao-negativa e [M, M[ ]]-mensur
avel. Para E M defina-se
Z
Z
f (E) :=
f d =
f E d .


Ent
ao f e uma medida em M.
mensur
avel g tem-se

Alem disso, para qualquer funca


o n
ao-negativa e [M, M[ ]]Z
Z
g df =
g f d .
(23.39)


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1039/1304

2
A relacao, (23.39) diz-nos algo como df = f d. Essa relacao tem apenas sentido simbolico, pois
nao atribumos significado aos smbolos df e d. Ainda assim, podemos interpretar df = f d como
estabelecendo uma relacao entre as medidas f e por uma especie de mudanca de variaveis.
claro que f () = 0, pois e identicamente nula. Seja Ek , k
Prova da Proposicao 23.7. E
S
colecao contavel e disjunta de elementos de M e seja E :=
k=1 Ek . Como para todo x M
E (x) = lim

n
X

Ek (x)

(por que?), segue que

(f E )(x) = lim

k=1

n
X
k=1

, uma

fk (x), x M,

P
onde fk := f Ek . A funcoes Fn := nk=1 fk sao nao-negativas, [M, M[ ]]-mensuraveis e Fn Fn+1
para todo n . Aplica-se, entao o Teorema da Convergencia Monotona, Teorema 23.4, pagina 1035,
e tem-se
!
!
!
Z
Z

n
n
[
X
X
Teor. 23.4
Ek
=
lim
f
fk d
=
lim
fk d


linearidade da integral

lim

lim

lim

provando que f e uma medida.


f .

k=1

n Z
X
k=1

n Z
X
k=1

n
X

k=1

k=1

fk d
M

f Ek d
M

f (Ek ) ,

k=1

Para provar (23.39), procedemos da seguinte forma. Para E M tem-se pela propria definicao de
Z

E df = f (E) =
M

E f d .
M

Assim, (23.39) vale pelo menos no caso espacial em que g = E . Logo, vale tambem no caso em que
g e uma funcao simples. Seja por fim uma funcao g nao-negativa e mensuravel geral. Se g n for uma
seq
uencia nao-decrescente de funcoes simples e nao-negativas de S(g) que converge a g (que tal existe,
garante-nos o Lema 23.3, pagina 1022), tem-se pela definicao (23.24)
Z
Z
Z
g df = lim
gn df = lim
gn f d .
E

Agora, gn f e uma seq


uencia nao-decrescente (por que?) de funcoes positivas e mensuraveis e que
converge a g f (por que?). Aplicando mais uma vez o Teorema da Convergencia Monotona, Teorema
23.4, pagina 1035, ao lado direito da u
ltima expressao, segue que
Z
Z 
Z

g df =
lim gn f d =
(g f ) d ,
E

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1040/1304

completando a demonstracao.
Para entendermos melhor o significado de (23.39), tomemos o caso em que M = , M = M[ ],
a -algebra de Borel, = L , a medida de Lebesgue e f : , uma funcao Boreliana e limitada
em todos os intervalos finitos. Para E = [a, b], um intervalo finito, teremos pelo Teorema 23.2, pagina
1032,
Z
Z


f ([a, b]) =

f dL =

[a, b]

Se f for tal que existe uma F :


diz-nos que


f (x) dx .

com F 0 (x) = f (x), o Teorema Fundamental do Calculo

f ([a, b]) = F (b) F (a) .

Note que F 0 (x) = f (x) 0 e, portanto F e crescente. Isso fornece uma nocao do que representa a
medida f desses intervalos.

23.4

Os Espa
cos Lp e Lp

Daqui por diante M sera um conjunto nao-vazio com uma -algebra M, para a qual encontra-se definida
uma medida .
Definimos a` pagina 1030 os conjuntos Lp (M, d), p > 0, como sendo o conjunto de todas as funcoes
complexas definidas em M tais que sua p-esima potencia e integravel. O estudo das propriedades desses
conjuntos e de grande importancia em varias areas da Matematica e da Fsica. Na Fsica Quantica
um papel muito especial e reservado aos conjuntos L2 ( , dL ) e L2 ( n , dL ) (mais precisamente, aos
seus parentes proximos, os conjuntos L2 ( , dL ) e L2 ( n , dL ), que serao definidos abaixo), pois os
mesmos descrevem os estados puros de sistemas quanticos com um n
umero finito de graus de liberdade.


A razao de os conjuntos Lp (M, d) serem importantes reside no fato que, para p 1, todos eles sao
menos de uma tecnicalidade que discutiremos abaixo espacos de Banach. Os espacos L 2 (M, d),
em particular, sao a menos dessa tecnicalidade espacos de Hilbert27 . Nosso objetivo na presente
secao e estudar esses fatos de forma precisa e geral.
Por razoes pedagogicas comecaremos estudando os espacos L1 (M, d) e depois passaremos ao caso
p > 1.
L1 (M, d)
e um espa
co vetorial complexo
Se f : M e g : M sao dois elementos quaisquer de L1 (M, d) e , sao n
umeros complexos quaisquer, e claro que |f + g| |||f | + |||g|. Esse simples fato tem a seguinte conseq
uencia:
Z
Z
Z
|f + g| d ||
|f | d + ||
|g| d .
M
M
M
R
R
Como, por hipotese, M |f | d < e M |g| d < , segue da que a funcao obtida pela combinacao
linear f + g e tambem um elemento de L1 (M, d). Como essa afirmacao e valida para todos
f, g L1 (M, d) e , , conclumos que L1 (M, d) e um espaco vetorial complexo.
27

Espacos de Banach e de Hilbert foram definidos na Seca


o 16.4, p
agina 850.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1041/1304

Por essa razao passaremos a nos referir aos conjuntos L1 (M, d), como espacos L1 (M, d). O uso
da palavra espaco, aqui, e uma referencia ao fato de serem espacos vetoriais. Logo abaixo, veremos
que os mesmos sao tambem, a menos de uma tecnicalidade, espacos metricos.
Os conjuntos Lp (M, d) com p 0 tambem sao espacos vetoriais complexos e isso sera mostrado
na Proposicao 23.8, logo adiante.
Uma pseudo-m
etrica em L1 (M, d)
Para f : M

e g : M , dois elementos quaisquer de L1 (M, d), consideremos a expressao


Z
d1 (f, g) :=
|f g| d .
M

evidente que d1 (f, f ) = 0 e que


Como (f g) L1 (M, d), e claro que 0 d1 (f, g) < . E
d1 (f, g) = d1 (g, f ). Como tambem, para qualquer h L1 (M, d), vale que f g = (f h) + (h g),
tem-se |f g| |f h| + |h g| e, portanto,
d1 (f, g) d1 (f, h) + d1 (h, g),
a chamada desigualdade triangular. Com isso, estabelecemos que d 1 e uma pseudo-metrica em L1 (M, d).
Para a definicao geral de pseudo-metrica, vide Secao 16.3, pagina 848.
R
Por que d1 nao e uma metrica? Pois no conjunto L1 (M, d), o fato de ter-se M |f g| d = 0
nao implica que f (x) = g(x) para todo x M , mas implica apenas que f = g -q.t.p. (Proposicao
23.6, pagina 1027). Esse fato em geral28 impede-nos de fazer de L1 (M, d) um espaco metrico, mas
ha uma maneira simples de remediar isso: identificando entre si as funcoes que diferem apenas em um
conjunto de medida nula. Esse e o nosso proximo passo.
Os espa
cos L1 (M, d)
No conjunto das funcoes [M, M[ ]]-mensuraveis estabelecemos uma relacao de equivalencia dizendo que funcoes f e g, sao equivalentes, f g, se f = g -q.t.p., ou seja, se ({x M | f (x) 6=
g(x)}) = 0. Constatemos que, de fato, isso define uma relacao de equivalencia. Que f f e evidente,
assim como que f g equivale a g f . Para provar a transitividade, consideremos tres funcoes f , g
e h. Notemos que se x M e tal que f (x) 6= h(x), entao ou f (x) 6= g(x) ou g(x) 6= h(x) ou ambas.
Logo,
{x M | f (x) 6= h(x)} = {x M | f (x) 6= g(x)} {x M | g(x) 6= h(x)} ,


sendo que a uniao acima nao e necessariamente disjunta. Logo,








{x M | f (x) 6= h(x)} {x M | f (x) 6= g(x)} + {x M | g(x) 6= h(x)} .

Assim, se f g e g h, o lado direito vale zero e, portanto, segue que f h, provando a transitividade.
E. 23.24 Exerccio. Mostre que {x M | f (x) 6= g(x)} M. Sugestao: prove e use o fato que
{x M | f (x) 6= g(x)} = {x M | f (x) > g(x)} {x M | f (x) < g(x)} e use a Proposicao 23.11, da
pagina 1052.
6
28

Exceto nos casos especiais em que M e s


ao tais que e o u
nico conjunto de medida nula.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1042/1304

O conjunto L1 (M, d) quebra-se em classes de equivalencia pela relacao de equivalencia acima.


Duas funcoes de uma mesma classe diferem apenas em um conjunto de medida igual a zero. Definimos
o conjunto L1 (M, d) como sendo o conjunto dessas classes de equivalencia: em smbolos
L1 (M, d) := L1 (M, d)/ .
Uma outra forma mais concreta de encarar L1 (M, d) e considera-lo como o conjunto obtido
tomando um e apenas um representante arbitrario de cada classe. Essa forma de ver L 1 (M, d) tem
a vantagem de permitir constatar de modo imediato que L1 (M, d) tambem e um espaco vetorial
complexo. Alem disso, nessa maneira de ver, L1 (M, d) e um sub-conjunto de L1 (M, d) e, portanto,
d1 esta definido em L1 (M, d). Agora, porem, vale que se f, g L1 (M, d) e d1 (f, g) = 0,
entao f = g -q.t.p. Ora, isso so e possvel se f = g, pois L1 (M, d) foi construdo tomando-se
um e apenas um elemento de cada classe de equivalencia de L1 (M, d). Constatamos, assim, que d1 e
agora uma metrica em L1 (M, d), nao apenas uma pseudo-metrica.
Resumindo L1 (M, d), e um espaco vetorial complexo e tambem um espaco metrico em relacao a`
metrica d1 .
O leitor que deseja permanecer em um nvel mais abstrato e continuar encarando L1 (M, d) como
uma colecao de classes, podera proceder da seguinte forma para constatar as afirmacoes do u
ltimo
paragrafo. Seja [f ] a classe a qual pertence um elemento f L1 (M, d). Defina-se para e e
para duas classes [f ] e [g] a operacao linear [f ] + [g] := [f + g]. Com essa operacao de combinacao
linear, a colecao de classes L1 (M, d) adquire a estrutura de um espaco vetorial complexo, tendo
como vetor nulo a classe [0], que contem a funcao identicamente nula. Para introduzir uma metrica na
colecao de classes L1 (M, d), defina-se D1 ([f ], [g]) := d1 (f, g).
E. 23.25 Exerccio. Mostre que a combinacao linear definida acima, assim como a metrica D 1 , estao
bem definidas, no sentido de serem independentes dos representantes f e g tomados em cada classe. Mostre
que D1 e de fato uma metrica, e nao apenas uma pseudo-metrica, ou seja, satisfaz todos os postulados da
definicao de uma metrica.
6
Optaremos tacitamente daqui por diante pela visao mais concreta de L1 (M, d) como o conjunto
obtido tomando um e apenas um representante arbitrario de cada classe de equivalencia de L 1 (M, d).
Nao ha grandes diferencas tecnicas entre as duas visoes e raramente e necessario recorrer a` definicao
precisa em termos de classes de equivalencia. Uma excecao se dara quando discutirmos o problema da
completeza dos espacos L1 (M, d). A visao concreta tem a vantagem de permitir prosseguir encarando
os elementos de L1 (M, d) como funcoes integraveis de M em e nao como classes abstratas de funcoes.
Informalmente, a diferenca entre L1 (M, d) e L1 (M, d) e que em L1 (M, d) identificamos funcoes
que diferem apenas em um conjunto de medida nula como se fossem a mesma funcao.
A estrutura linear dos espa
cos Lp (M, d)
Proposi
c
ao 23.8 Os conjuntos Lp (M, d), com p > 0, s
ao espacos vetoriais complexos.

A prova e essencialmente identica a` da Proposicao 16.8, pagina 855, sobre os conjuntos de seq
uencias
`p e faz uso da Proposicao 16.9, pagina 867, do Apendice 16.A.

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1043/1304

Prova. Ha dois casos a considerar em separado: 0 < p < 1 e p 1.

Caso 0 < p < 1. Sejam f, g Lp (M, d), arbitrarios. Como |f (x) + g(x)| |f (x)| + |g(x)|, a
segunda desigualdade em (16.A.2), pagina 867, implica
|f + g|p (|f | + |g|)p |f |p + |g|p .
Assim,

|f + g| d ||

|f | d + ||

|g|p d <

para quaisquer , . Isso provou que f + g Lp (M, d) e, portanto, para 0 < p < 1 o conjunto
Lp (M, d) e um espaco vetorial complexo.
Caso p 1. Sejam f, g Lp (M, d), arbitrarios. Como |f (x) + g(x)| |f (x)| + |g(x)|, a segunda
desigualdade em (16.A.3), pagina 867, implica
|f + g|p (|f | + |g|)p 2p1 (|f |p + |g|p) .
Assim,

|f + g| d 2

p1

||

|f | d + 2

p1

||

|g|p d <

para quaisquer , . Isso provou que f + g Lp (M, d) e, portanto, para p 1 o conjunto


Lp (M, d) e um espaco vetorial complexo. Isso e o que queramos provar.
Mais adiante, mostraremos que em Lp (M, d), para p 1, a expressao
dp (f, g) :=

Z

|f g| d

1/p

define uma pseudo-metrica. De forma analoga ao que fizemos acima, e usando a mesma relacao de
equivalencia definida acima, o conjunto de classes Lp (M, d), definido por
Lp (M, d) := Lp (M, d)/ ,
e um espaco vetorial complexo e tambem um espaco metrico com a metrica induzida por d p . Tambem
iremos encarar Lp (M, d) como o conjunto obtido tomando um e apenas um representante arbitrario
de cada classe de equivalencia de Lp (M, d).

23.4.1

As Desigualdades de H
older e de Minkowski

Vamos agora tratar de duas desigualdades de importancia primordial no estudo dos espacos L p (M, d),
as desigualdades de Holder29 e de Minkowski30 . Ja as encontramos no caso particular de espacos de
seq
uencias e, naquele caso, delas tratamos no Teorema 16.2 da pagina 856.
29
30

Otto L. H
older (1859-1937).
Hermann Minkowski (1864-1909).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1044/1304

Teorema 23.7 (As desigualdades de H


older e de Minkowski) Seja M um conjunto n
ao-vazio,
M uma -
algebra em M e seja uma medida em M.
A desigualdade de H
older e a afirmaca
o que se p e q s
ao tais que 1 < p < , 1 < q < e
satisfazem 1/p + 1/q = 1, ent
ao para quaisquer f Lp (M d) e g Lq (M d) vale
Z
1/p Z
1/q
Z
p
q
|f | |g| d
|f | d
.
(23.40)
|g| d
M

A desigualdade de Minkowski e a afirmaca


o que se p e tal que 1 p < , ent
ao para quaisquer
f, g Lp (M d) tem-se
Z
1/p
Z
1/p Z
1/p
p
p
p
|f g| d

|f | d
+
|g| d
.
(23.41)
M

2
A demonstracao e apresentada no Apendice 23.J, pagina 1065. Em [109] uma interessante demonstracao alternativa da desigualdade de Minkowski, usando a convexidade da funcao x p , e apresentada.
Aquela demonstracao fornece tambem a versao da da desigualdade de Minkowski para o caso 0 < p < 1:
1/p
Z
1/p Z
Z
1/p
p
p
p
.
(23.42)
+
|g| d

|f | d
|f + g| d
M

Essa expressao, no entanto, so vale para f e g nao-negativas.


A desigualdade de Holder acima pode ser generalizada.
Corol
ario 23.3 Sejam f Lp (M d) e g = Lq (M d) onde p e q s
ao tais que 1 < p < e
1
1 1
ao, vale
1 < q < . Defina-se r > 0 por + = . Ent
p q
r
Z
1/r
Z
1/p Z
1/q
r
r
p
q
|f | |g| d

|f | d
|g| d
.
(23.43)
M

2
A prova do Corolario 23.3 tambem encontra-se no Apendice 23.J, pagina 1065.
As desigualdades de Holder e Minkowski tem uma serie de conseq
uencias, em particular sobre a
estrutura dos espacos Lp (M, d) e Lp (M, d). Vamos explorar algumas.
Lp (M, d), p 1, s
ao espa
cos vetoriais complexos e normados
Ja observamos acima (Proposicao 23.8) que os conjuntos Lp (M d) sao espacos vetoriais complexos.
No caso p 1 os mesmos possuem uma pseudo-norma definida por
kf kp :=

Z

|f | d

1/p

(23.44)

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1045/1304

A propriedade basica de uma pseudo-norma, a saber kf + gkp || kf kp + || kgkp para todos


f, g Lp (M d) segue da desigualdade de Minkowski, pois a mesma nos garante que
Z

|f + g| d

1/p

||

Z

|f | d

1/p

+ ||

Z

|g| d

1/p

A proposito, as desigualdades de Holder e Minkowski (23.40) e (23.41) assumem com a notacao de


(23.44) a forma
kf gk1 kf kp kgkq
e
kf gkp kf kp + kgkp ,
respectivamente.
Por que k kp e uma pseudo-norma e nao uma norma em Lp (M d)? Pois, como discutimos no caso
p = 1, a relacao kf kp = 0 nao implica f = 0, mas apenas f = 0 -q.t.p. Se, no entanto, considerarmos
o espaco Lp (M, d), definido acima, k kp sera uma norma! Conclumos disso que para p 1, os
conjuntos Lp (M, d) sao espacos vetoriais complexos e normados. Por serem normados, sao tambem
espacos metricos com as metricas induzidas pelas normas k kp :
dp (f, g) := kf gkp =

Z

|f g| d

1/p

Como veremos logo adiante, os espacos Lp (M, d) com p 1 sao espacos de Banach, por serem
completos em relacao a` metrica dp acima.
A desigualdade de Cauchy-Schwarz. Um produto escalar em L2 (M, d)
A desigualdade de Holder (23.40) tem um caso particular muito importante, a saber, quando p =
q = 2: para f, g L2 (M, d) vale
Z

|f | |g| d

Z

|f | d

1/2 Z

R
R
Como tambem M f g d M |f | |g| d, segue que
Z



Z

f g d

|f | d

1/2 Z

|g| d

|g| d

1/2

1/2

< .

< .

As duas desigualdades acima sao denominadas desigualdades de Cauchy-Schwarz. A segunda esta nos
dizendo que para f, g L2 (M, d) a expressao
Z
f g d
hf, gi :=
M

e um n
umero complexo finito e, como facilmente se verifica, define um produto escalar em L2 (M, d).
E. 23.26 Exerccio. Demonstre as afirmacoes acima.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1046/1304

tambem elementar constatar que a norma associada a esse produto escalar e a norma k k 2 .
E
Como veremos logo abaixo, L2 (M, d) e completo em relacao a` metrica d2 que essa norma induz.
Conseq
uentemente, L2 (M, d) e um espaco de Hilbert.
Rela
co
es de inclus
ao entre os conjuntos Lp (M, d) quando (M ) <
Se o conjunto M e a medida sao tais que (M ) < , entao a funcao g(x) = 1 (identicamente
R
igual a 1 para todo x M ) pertence a todo Lq (M, d), 0 < q < . Isso e evidente, pois M 1q d =
(M ) < . Disso e da desigualdades de Holder (23.43), extraem-se algumas conseq
uencias sobre
relacoes de inclusao entre os varios espacos Lp (M, d).
Para 1 < p < e 1 < q < arbitrarios, tomando-se f Lp (M, d) e g = 1, obtem-se de (23.43)
que
Z
1/p
Z
1/r
p
r
[(M )]1/q < ,
(23.45)

|f | d
|f | d
M

para 1/r = 1/p + 1/q. Como 1 < q < , segue que r < p. Como q e arbitrario, a desigualdade (23.45)
diz que se f Lp (M, d) entao f Lr (M, d) para todo r p, ou seja, Lp (M, d) Lr (M, d)
sempre que r p com 1 < p < . Note que o caso r = 1 nao esta excluido (basta escolher q tal que
1/p + 1/q = 1). Assim, tem-se, por exemplo,
L4 (M, d) L3 (M, d) L2 (M, d) L1 (M, d) .
Essas relacoes de inclusao nao sao geralmente validas caso (M ) = . Vide proximo exerccio.
E. 23.27 Exerccio. Mostre que a funcao
f (x) =

1,

1
,
|x|

x [1, 1]
x 6 [1, 1]

pertence a L2 ( , dL ) mas nao a L1 ( , dL ).




Mostre que a funcao


f (x) =

|x| , 0 < |x| 1

0,

pertence a L1 ( , dL ) mas nao a L2 ( , dL ).




Mostre que a funcao


f (x) =
pertence a L2 ( , dL ) L1 ( , dL ).


1,

1
,
|x|2

x = 0 ou |x| > 1

x [1, 1]
x 6 [1, 1]
6

Revisitando a desigualdade de H
older

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1047/1304

Se p e q sao tais que 1 < p < , 1 < q < e satisfazem 1/p + 1/q = 1, entao para quaisquer
f Lp (M, d) e g Lq (M, d) a desigualdade de Holder (23.40) implica que
Z



Z

f g d

|f | d

1/p Z

|g| d

1/q

< .

(23.46)

Como facilmente se verifica, a aplicacao

g 7

f g d
M

e um funcional linear em Lq (M, d). Mais que isso, (23.46) diz-nos que se trata de um funcional linear
contnuo31 (na topologia de Lq (M, d)).
Conclumos disso que se 1 < p < , 1 < q < e satisfazem 1/p + 1/q = 1, entao L p (M, d) e um
sub-conjunto do dual topologico de Lq (M, d) e vice-versa.
E. 23.28 Exerccio. Justifique as afirmacoes acima

23.4.2

O Teorema de Riesz-Fischer. Completeza

Vamos agora formular um importante teorema que e uma das principais justificativas do interesse na
integral de Lebesgue e, em um certo sentido, coroa nossos esforcos neste Captulo. Trata-se do Teorema
de Riesz32 -Fischer33 , o qual data de 1907.
Teorema 23.8 (Teorema de Riesz-Fischer) Para p 1 os espacos L p (M, d) s
ao espacos metricos
completos na metrica dp definida acima.
2
Do Teorema de Riesz-Fischer e das consideracoes acima conclumos que os espacos L p (M, d) com
p 1 sao espacos de Banach e o espaco L2 (M, d) e um espaco de Hilbert.
A prova do Teorema de Riesz-Fischer encontra-se no Apendice 23.K, pagina 1067.

31

As noco
es de funcional linear e funcional linear contnuo foram introduzidas na Seca
o 2.1.3 do Captulo 2.
Frigyes Riesz (1880-1956).
33
Ernst Sigismund Fischer (1875-1954).
32

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1048/1304

Ap
endices
Nos varios apendices que seguem apresentamos as demonstracoes mais tecnicas de alguns dos teoremas e proposicoes da nossa exposicao.

23.A

Demonstra
c
ao da Proposi
c
ao 23.3

Demonstraremos aqui a Proposicao 23.3, pagina 1007. Recordamos que as nocoes de lim inf e lim sup
de conjuntos dirigidos, as quais usaremos abaixo, sao introduzidas na Secao 21.3, pagina 981.
Prova da Proposicao 23.3. Pelo exerccio E. 23.2 da pagina 1006, a rede P([a, b]) 3 P 7 D i [P, f ]
e crescente, enquanto que a rede P([a, b]) 3 P 7 Ds [P, f ] e decrescente. Assim,
Z b
lim inf Di [P, f ] =
sup Di [P, f ] =
f (x) dx


PP([a, b])

PP([a, b])

lim sup Ds [P, f ] =


PP([a, b])

inf

PP([a, b])

Ds [P, f ] =

f (x) dx .
a

(Vide definicoes (21.1)-(21.2) e (21.3)-(21.4)). Temos obviamente que


Di [P, f ] S[(P, ), f ] Ds [P, f ]
para todo P P([a, b]) e todo P. Porem, ve-se pelas definicoes de Di e Ds que
Di [P, f ] = inf S[(P, ), f ]

Ds [P, f ] = sup S[(P, ), f ]


P

e, portanto,
lim inf Di [P, f ] =

PP([a, b])

lim inf

(P, )X([a, b])

S[(P, ), f ]

lim sup Ds [P, f ] =


PP([a, b])

lim sup

S[(P, ), f ] .

(P, )X([a, b])

Logo,
Z

f (x) dx = lim inf Di [P, f ] =


a

PP([a, b])

lim inf

(P, )X([a, b])

lim sup

S[(P, ), f ]

S[(P, ), f ] = lim sup Ds [P, f ] =

(P, )X([a, b])

PP([a, b])

f (x) dx ,
a

onde a u
nica desigualdade que ocorre acima segue da propriedade (21.5). Dessa expressao, ve-se que
Rb
Rb
f
(x)
dx
=
f (x) dx se e somente se
a
a
lim inf

(P, )X([a, b])

S[(P, ), f ] =

lim sup

(P, )X([a, b])

S[(P, ), f ]

JCABarata. Curso de Fsica-Matem


atica

e, portanto, por (21.6), se e somente se existe

Vers
ao de 29 de setembro de 2005.

lim

(P, )X([a, b])

Captulo 23

1049/1304

S[(P, ), f ]. Isso prova a equivalencia das

definicoes I e II da nocao de integrabilidade de Riemann.

23.B

Caracteriza
co
es e Propriedades de Fun
co
es Mensur
aveis

Vamos aqui estudar com mais detalhe e profundidade caracterizacoes e propriedades elementares das
funcoes mensuraveis. Advertimos que a presente secao e, infelizmente, mas inevitavelmente, um pouco
tecnica. Sugerimos a um estudante iniciante dispensar a leitura das demonstracoes e concentrar-se
apenas nas definicoes e enunciados.
Uma condi
c
ao para mensurabilidade de fun
co
es
O proximo teorema (de [58]) e de importancia fundamental e sera usado em varios lugares mais
abaixo. A nocao de -algebra gerada por uma colecao de conjuntos foi introduzida no Captulo 18.
Teorema 23.9 Sejam (M, M) e (N, N) dois espacos mensur
aveis e suponhamos que N seja a a
lgebra gerada por uma coleca
o A de subconjuntos de N : N = M[A]. Ent
ao, uma funca
o f : M N
e [M, N]-mensur
avel, ou seja, [M, M[A]]-mensur
avel, se e somente se
f 1 (A) M
para todo A A.

(23.B.1)
2

Prova. Se A A segue que A M[A]. Logo, se f e mensuravel em relacao a M e N = M[A], entao,


pela definicao de funcao mensuravel, f 1 (A) M.
Vamos provar a recproca, ou seja, vamos supor que (23.B.1) valha para todo A A e mostrar que
f mensuravel em relacao a M e N = M[A]. Seja
A0 := {A0 N | f 1 (A0 ) M} .
Por (23.B.1) e claro que A A0 . Mostremos agora que A0 e uma -algebra em N . Que e N
pertencem a A0 e claro, pois f 1 (N ) = M (isso segue de f (M ) N ). Se A0 A0 , entao f 1 ((A0 )c ) =
f 1 (N \ A0 ) = f 1 (N ) \ f 1 (A0 ) = M \ f 1 (A0 ) = (f 1 (A0 ))c . (Vide Proposicoes 1.21.4, pagina 26).
Por hipotese, f 1 (A0 ) M. Logo, como M e uma -algebra, (f 1 (A0 ))c M.
Resta-nos provar que uma uniao contavel de elementos de A0 e tambem elemento de A0 . Para isso,
sejam conjuntos A0k A0 , k . Sabemos que (vide Proposicoes 1.21.4, pagina 26)
!
[
[
f 1
A0k =
f 1 (A0k ) .


Me uma -algebra, uma


avel de seus
Por hipotese, cada f 1 (A0k ) pertence a M. Como
S
S uniao0 cont
1
0
0
elementos tambem pertence a M. Logo, f
k Ak M. provando que
k Ak A .


JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1050/1304

Como, por definicao, M[A] e a menor -algebra contendo A e A0 tambem e uma -algebra contendo
A, segue que M[A] A0 . Ora, pela definicao de A0 , isso diz que a pre-imagem por f de qualquer
elemento de N = M[A] e um elemento de M. Isso significa precisamente que f e mensuravel em relacao
a M e N, completando a prova.

Fun
co
es mensur
aveis entre espa
cos topol
ogicos
Ja observamos acima a semelhanca entre as definicoes de funcoes contnuas e funcoes mensuraveis.
As duas nocoes combinam-se elegantemente nos resultados que seguem.
O Teorema 23.9 tem uma aplicacao imediata para funcoes contnuas definidas em espacos topologicos. Sejam M e N dois conjuntos nao-vazios dotados de topologias M e N , respectivamente, e sejam M[M ] e M[M ] as -algebras geradas por essas topologias. Afirmamos que se f : M N e contnua
com respeito a`s topologias M e N , entao f e mensuravel em relacao a`s -algebras M[M ] e M[N ],
ou seja, e [M[M ], M[N ]]-mensuravel. De fato, pelo Teorema 23.9 basta provar que f 1 (A) M[M ]
para todo A N . Agora, por f ser contnua, vale que f 1 (A) M se A N . Como obviamente
M M[M ], a afirmacao esta provada.

Note que se em M adotarmos uma -algebra M que contem a -algebra M[M ], a mesma afirmacao
e verdadeira: uma funcao f : M N contnua com respeito a`s topologias M e N e mensuravel em
relacao a`s -algebras M[M ] e M M[M ].

contnua em relacao a` topologia


Disso segue que toda funcao f :
mensuravel e tambem [M[ ], ML ]-mensuravel.


e [M[ ], M[ ]]

A proposicao adiante e um mero corolario das observacoes acima.


Proposi
c
ao 23.9 Sejam X, Y e Z tres conjuntos n
ao-vazios, sendo o conjunto X dotado de uma
-
algebra MX e os conjuntos Y e Z dotados de topologias Y e Z , respectivamente. Sejam f : X Y
e g : Y Z duas funco
es tais que f e [MX , M[Y ]]-mensur
avel e g e contnua em relaca
o a
`s topologias
Y e Z . Ent
ao, g f : X Z e [MX , M[Z ]]-mensur
avel.
2
Prova. Pelo que acabamos de comentar, g e [M[Y ], M[Z ]]-mensuravel. Assim, g f e uma funcao
[MX , M[Z ]]-mensuravel por ser a composicao de uma funcao [MX , M[Y ]]-mensuravel com uma
funcao [M[Y ], M[Z ]]-mensuravel.

Aplica
c
ao para fun
co
es num
ericas
Notemos que o Teorema 23.9 e aplicavel ao caso de funcoes f : M , onde M dotada de uma
-algebra M e da -algebra de Borel M[ ]. Nesse caso A = . Em verdade, provamos no Captulo
18, mais especificamente na expressao (18.1), pagina 928, que M[ ] = M[R], onde R e a colecao de
todos os intervalos abertos (a, b), com a e b racionais. Podemos, portanto, tomar A = R, nesse caso.
Conseq
uentemente, para provar que uma funcao f : M e mensuravel em relacao a M e M[ ], e
suficiente, pelo Teorema 23.9, provar que f 1 ((a, b)) M para todo intervalo aberto (a, b), com a e b
racionais.


JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1051/1304

Observemos agora, que


(a, b) = (, b)

TE. 23.29 Exerccio.
, a + n1 .
n


[

1
, a +
n

c !

Prove isso! Sugestao: use (a, b) = (, b) \ (, a] e escreva (, a] =


6

Isso significa que

f 1 ((a, b)) = f 1 ((, b))

[

f 1

1
, a +
n

c !

(Vide Proposicoes 1.21.4, pagina 26). Logo, pelos raciocnios usuais sobre unioes contaveis, interseccoes finitas e complementos de elementos de uma -algebras, segue que se f 1 ((, c)) M para
todo c , entao f 1 ((a, b)) M para todos com a e b racionais, provando que f e mensuravel em
relacao a M e M[ ].


Um raciocnio identico nos leva a concluir que se f 1 ((c, )) M para todo c


mensuravel em relacao a M e M[ ].


, entao f e

Resumimos essas consideracoes na seguinte proposicao, que usaremos logo abaixo:


Proposi
c
ao 23.10 Consideremos uma funca
o numerica f : M , sendo M dotada de uma a
lgebra M e
da -
algebra de Borel M[ ]. Uma condica
o necess
aria e suficiente para que f seja
[M, M[ ]]-mensur
avel e que para todo a valha


{x M | f (x) < a} = f 1 ((, a)) M.

(23.B.2)

Equivalentemente, podemos substituir o conjunto de (23.B.2) por qualquer um dos seguintes tres conjuntos:
{x M | f (x) a} = f 1 ((, a]) M,

(23.B.3)

{x M | f (x) > a} = f 1 ((a, )) M,

(23.B.4)

{x M | f (x) a} = f 1 ([a, )) M.

(23.B.5)
2

Prova. Que as condicoes sao necessarias e evidente, pois os quatro conjuntos (23.B.2)-(23.B.5) sao a
pre-imagem por f dos conjuntos Borelianos (, a), (, a], (a, ) e [a, ).

Acima, ja provamos a recproca para os conjuntos (23.B.2) e (23.B.4). Os dois casos restantes sao
conseq
uencia desses dois se lembrarmos que f 1 ((, a]) = (f 1 ((a, )))c e que f 1 ([a, )) =
1
(f ((, a)))c .
Nosso proximo resultado e o seguinte:

JCABarata. Curso de Fsica-Matem


atica

Proposi
c
ao 23.11 Se f : M

eg:M


Captulo 23

Vers
ao de 29 de setembro de 2005.

1052/1304

s
ao ambas [M, M[ ]]-mensur
aveis, ent
ao


{x M | f (x) < g(x)} M,

(23.B.6)

{x M | f (x) g(x)} M,

(23.B.7)

{x M | f (x) > g(x)} M,

(23.B.8)

{x M | f (x) g(x)} M.

(23.B.9)
2

Prova. Para demonstrar a primeira linha, notemos que



[
{x M | f (x) < r} {x M | g(x) > r} .
{x M | f (x) < g(x)} =
r

E. 23.30 Exerccio. Mostre isso! Sugestao: lembre-se que f (x) < g(x) se e somente se existir pelo
menos um racional r tal que f (x) < r < g(x), ou seja, f (x) < r e r < g(x).
6
Como observamos acima, tanto {x M | f (x) < r} quanto {x M | g(x) > r} sao elementos de
M. Pelas propriedades de -algebras, sua interseccao tambem o e. Por fim, a uniao acima tambem
o e, por ser uma uniao contavel de elementos de M (essa e uma das propriedades definidoras de uma
-algebras). A prova que {x M | f (x) > g(x)} M e analoga:

[
{x M | f (x) > g(x)} =
{x M | f (x) > r} {x M | g(x) < r}
r

e nao requer mais comentarios. Por fim, notemos que {x M | f (x) g(x)} = {x M | f (x) > g(x)} c
e que {x M | f (x) g(x)} = {x M | f (x) < g(x)}c . Como uma -algebra e fechada pelo
complemento, segue do que ja foi provado que {x M | f (x) g(x)} M e {x M | f (x) g(x)}
M.

A
algebra das fun
co
es mensur
aveis
Vamos aqui provar a seguinte afirmativa, a qual coroa os resultados obtidos ate aqui sobre funcoes
numericas mensuraveis: o conjunto das funcoes numericas mensuraveis forma uma algebra. Mais
precisamente, tem-se
Proposi
c
ao 23.12 Se f : M
1. Para todos ,

eg:M

s
ao ambas [M, M[ ]]-mensur
aveis, ent
ao


vale que f + g e [M, M[ ]]-mensur


avel.


2. O produto f g e [M, M[ ]]-mensur


avel.


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1053/1304

Prova. Para simplificar a linguagem, usaremos nesta prova a expressao funca


o mensur
avel no sentido
de [M, M[ ]]-mensuravel.


Seja . Afirmamos que f e igualmente mensuravel. Se = 0 a afirmativa e trivial. Se 6= 0,


notemos que para todo a


{x M | f (x) < a} = {x M | f (x) < a/} M


por (23.B.2), ja que, por hipotese, f e mensuravel. Como isso vale para todo a
Proposicao 23.10 que f e igualmente mensuravel.


, segue pela mesma

O mesmo tipo de argumento tem outra conseq


uencia semelhante. Se h : M
entao que para todo b vale


e mensuravel,

{x M | b + h(x) < a} = {x M | h(x) < a b} .


Como h e mensuravel, {x M | h(x) < a b} M. Como isso vale para todo a
igualdade acima que b + h e mensuravel.


, conclumos da

Observe-se agora que


{x M | f (x) + g(x) < a} = {x M | f (x) < a g(x)} .
Definindo-se h(x) = a g(x), constatamos pelas consideracoes de acima que se trata de uma funcao
mensuravel. Assim, pela Proposicao 23.11, segue que {x M | f (x) + g(x) < a} M para todo a, o
que implica que f + g e mensuravel.
Conclumos disso tudo que para todos , a funcao f + g e mensuravel em relacao a M
e M[ ]. Resta-nos ainda mostrar que o produto f g e mensuravel. Provemos primeiro que se f e
mensuravel entao f 2 tambem o e. De fato, para a < 0


{x M | f (x)2 < a} = M
mas para a 0,



x M | f (x) < a x M | f (x) < a .

Como f e mensuravel, segue que {x M | f (x) < a} M. Logo {x M | f (x)2 < a} M e como
isso vale para todo a , segue que f 2 e mensuravel.
{x M | f (x)2 < a} =

A prova que f g e mensuravel segue da relacao


f g =

e reunindo tudo o que vimos.


1
(f + g)2 (f g)2
4

A seguinte proposicao tambem e relevante:


Proposi
c
ao 23.13 Se f : M e [M, M[ ]]-mensur
avel e f (x) 0 para todo x M , ent
ao
e tambem [M, M[ ]]-mensur
avel.


f
2

JCABarata. Curso de Fsica-Matem


atica

Prova. Para f : M
a 0,

Captulo 23

Vers
ao de 29 de setembro de 2005.

, basta observar que para a < 0 vale {x M |


p

1054/1304

p
f (x) < a} = M e para

f (x) < a} = {x M | f (x) < a2 } M ,

pois f e mensuravel. Isso provou que f e [M, M[ ]]-mensuravel.


{x M |

Fun
co
es complexas mensur
aveis
O conjunto dos n
umeros complexos
e um espaco topologico metrico completo com a metrica
d(z, w) = |w z|, z, w . Denotaremos por a topologia que essa metrica induz, a topologia
usual de . A essa topologia vem associada a -algebra Boreliana M[ ].


Vamos demonstrar a seguinte proposicao:


Proposi
c
ao 23.14 Seja (M, M) um espaco mensur
avel e f : M uma funca
o complexa [M, M[ ]]mensur
avel definida em M . Ent
ao Re(f ), Im(f ) e |f | s
ao funco
es reais [M, M[ ]]-mensur
aveis. 2


dada por Re(z) = (z + z)/2 e contnua,


Prova. Comecemos por observar que a funcao Re :
assim como a funcao Im : dada por Im(z) = (z z)/(2i).


E. 23.31 Exerccio simples. Prove isso!

Com isso em mente, podemos entender a funcao Re(f ) : M


como a composicao Re f da
funcao [M, M[ ]]-mensuravel f com a funcao Re que e contnua em relacao a`s topologias e .
Assim, pela Proposicao 23.9, pagina 1050, segue que Re(f ) : M
e [M, M[ ]]-mensuravel. A
prova para Im(f ) e identica.


A funcao modulo | | : e tambem uma funcao contnua entre e . (Isso e totalmente obvio,
pois a metrica em e definida por essa funcao!). Assim o mesmo argumento se aplica novamente.


Outra maneira de provar que | | :

e [M, M[ ]]-mensuravel e lembrar que (Re(f ))2 +


(Im(f
))2 e [M, M[ ]]-mensuravel pela Proposicao 23.12 e, portanto, pela Proposicao 23.13, |f | =
p
(Re(f ))2 + (Im(f ))2 e [M, M[ ]]-mensuravel.


A Proposicao 23.14 tem parcialmente uma recproca:

Proposi
c
ao 23.15 Se u : M
e [M, M[ ]]-mensur
avel.


ev:M

s
ao [M, M[ ]]-mensur
aveis ent
ao f : u+iv : M


Prova. (De [110]). Seja I1 um intervalo aberto do eixo real e I2 um intervalo aberto do eixo imaginario.
Entao R = I1 I2 e um retangulo aberto em . Agora, e facil ver que f 1 (R) = u1 (I1 ) v 1 (I2 ).
Pelas hipoteses, u1 (I1 ) e v 1 (I2 ) pertencem a` -algebra M. Logo, f 1 (R) tambem.SLembremos que
todo aberto A de pode ser ser escrito como uniao contavel de tais retangulos: A = n Rn . Agora,
por (1.14), pagina 26,
!
[
[
f 1 (A) = f 1
Rn =
f 1 (Rn ) .


JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1055/1304

Mas como vimos f 1 (Rn ) M para todo n e, como a uniao acima e contavel, segue que f 1 (A) M.
Pela Proposicao 23.9, isso prova que f e [M, M[ ]]-mensuravel.


Para as funcoes complexas mensuraveis vale a mesma afirmacao feita sobre as funcoes reais: elas
formam uma algebra. Mais precisamente, tem-se
Proposi
c
ao 23.16 Se f : M
1. Para todos ,

eg:M

s
ao ambas [M, M[ ]-mensur
aveis, ent
ao


vale que f + g e [M, M[ ]]-mensur


avel.


2. O produto f g e [M, M[ ]]-mensur


avel.

Prova. A prova e elementar com o que acumulamos ate aqui, pois e facil provar (usando as Proposicoes
23.12 e 23.14) que as partes reais e imaginarias de f + g e de f g sao [M, M[ ]]-mensuraveis. Da,
pela Proposicao 23.15, f + g e f g sao [M, M[ ]]-mensuraveis.


23.C

Prova do Lema 23.3

A prova (extrada com modificacoes de [58]) consiste em exibir uma seq


uencia f n de funcoes simples
mensuraveis e nao-negativas e verificar as propriedades. A seq
uencia e

n2 
X
k1
n

fn (x) :=

k=1

onde
Fn, k := f
e



k1 k
, n
2n
2

2n



Fn, k (x) + nGn (x) ,



k1
k
x M
f (x) < n ,
2n
2

Gn := f 1 ([n, ]) = {x M | n f (x) } .

Como por hipotese f e Boreliana,


 k1 k  e imediato que Fn, k e Gn sao mensuraveis (ou seja, elementos de
M), ja que os intervalos 2n , 2n e [n, ] sao Borelianos. Assim, cada fn e uma funcao simples e
mensuravel.

Queremos provar que fn e nao-decrescente e que converge a f . Para isso, e preciso entender melhor
como a seq
uencia fn esta definida. Para cada n, divide-se o intervalo semi-aberto
[0, n) em n2n sub
intervalos semi-abertos menores de tamanho 21n , que sao os intervalos k1
, 2kn com k variando entre
2n
n
1 e n2 . Os conjuntos Fn, k sao as pre-imagens por f desses sub-intervalos semi-abertos. A divisao
de [0, n) em n2n sub-intervalos semi-abertos de tamanho 21n significa que cada intervalo semi-aberto
[l, l + 1), com l = 0, . . . , n 1, e dividido em 2n intervalos semi-abertos de igual tamanho, a saber,
1
.
2n


Se x e tal que f (x) cai em k1
, 2kn , entao fn (x) e definido como sendo k1
. Se x e tal que f (x) n,
2n
2n
entao fn (x) e definido como sendo n. Assim, para todo x, fn (x) e sempre menor o igual a f (x).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1056/1304

1
, que e a metade do anterior.
Se passarmos de n para n + 1, cada intervalo
passa a ter tamanho 2n+1

k
k1
,
Assim
cada
intervalo
semi-aberto
passa
a
ser
dividido
em
dois
intervalos
semi-abertos disjun2n
2n 
 k1 k   2k2 2k1   2k1
2k
tos: 2n , 2n = 2n+1 , 2n+1 2n+1 , 2n+1 . Como as novas subdivisoes estao contidas nas anteriores,
o valor de cada fn+1 (x) so pode aumentar em relacao ao de fn . Mais precisamente, para x Fn, k a
funcao fn vale k1
. Apos a primeira subdivisao (ao passarmos de n a n + 1) o conjunto Fn, k passa a ser
2n
a uniao dos dois conjuntos disjuntos Fn+1, 2k1 e Fn+1, 2k . No primeiro fn+1 (x) vale 2k2
= k1
= fn (x)
2n+1
2n
2k1
k1
e no segundo fn+1 (x) = 2n+1 > 2n = fn (x), o que prova o que afirmamos.

Para ver que fn converge a f , observe-se que se f (x) e finito,


ao para todo n > f (x) tem-se
 k1 ent
k
obviamente que f (x) [0, n) e, portanto, vale que f (x) 2n , 2n para algum k entre 1 e n2n .
Teremos entao, pela definicao, que fn (x) = k1
e, portanto, |fn (x) f (x)| 21n , o que prova que
2n
fn (x) f (x) quando n . Se f (x) nao e finito, fn (x) = n para todo n, pela definicao e, portanto,
fn (x) quando n .

Resta apenas provar que se f e finito a convergencia e uniforme. Se A > 0 e tal que 0 f (x) < A
para todo x M
, entao e certo que se n > A teremos que para cada x havera um k entre 1 e n2 n
 k1
e |fn (x) f (x)| 21n , Ora, o lado direito dessa
tal que f (x) 2n , 2kn . Nesse caso fn (x) = k1
2n
desigualdade nao depende de x, o que mostra que a mesma e uniforme em todo M , completando a
prova do Lema 23.3, pagina 1022.

23.D

Demonstra
c
ao de (23.22)

Provemos a relacao (23.22). Temos que, para todo Bk vale


Bk = Bk M = Bk (C1 Cq ) = (Bk C1 ) (Bk Cq )

sendo que a uniao do lado direito e disjunta, pois (Bk Ci ) (Bk Cj ) = (Ci Cj ) Bk = para
i 6= j. Com isso, se e uma medida,
q
X
(Bk Cl ) .
(23.D.10)
(Bk ) = ((Bk C1 ) (Bk Cq )) =
l=1

Analogamente, para todo Cl vale

Cl = Cl M = Cl (B1 Bp ) = (Cl B1 ) (Cl Bp )

tambem uma uniao disjunta e tambem tem-se

(Cl ) = ((Cl B1 ) (Cl Bp )) =


Assim,
p
X
k=1

k (Bk )

(23.D.10)

p
q
X
X
k=1 l=1

k (Bk Cl ) =

q
p
X
X
l=1 k=1

p
X
k=1

(Cl Bk ) .

l (Bk Cl )

(23.D.11)

(23.D.11)

q
X

l (Cl ) ,

l=1

o que prova (23.22). Na segunda igualdade, acima, trocamos k por l e a razao de podermos fazer
isso e a seguinte. Se Bk Cl = entao (Bk Cl ) = 0, o que autoriza a substituicao. Se Bk Cl 6= ,
entao k = l , pois se x Bk Cl , vale pelas representacoes normais de (23.21) que s(x) = k e que
s(x) = k .

JCABarata. Curso de Fsica-Matem


atica

23.E

Captulo 23

Vers
ao de 29 de setembro de 2005.

1057/1304

A Equival
encia das Defini
co
es (23.23) e (23.24)

Vamos aqui mostrar a equivalencia das duas definicoes (23.23) e (23.24) da integral de Lebesgue. Nosso
tratamento segue [58], com ligeiras adaptacoes e melhorias. Vamos supor que s S(f ) e que f n e uma
seq
uencia monotona crescente de funcoes simples mensuraveis de S(f ) que converge a f (que tal existe,
garante-nos o Lema 23.3). Vamos primeiramente mostrar que
Z
Z
s d lim
fn d .
n

R
s d = e II quando M s d < .
R
I. No primeiro caso desejamos provar
R n . Facamos isso. Se s tem
Pn que M fn d diverge quando
representacao normal curta s(x) = k=1 sk Sk (x), entao o fato de M s d = implica que existe um
k0 com sk0 > 0 e (Sk0 ) = . Fixemos um  tal que 0 <  < sk0 e definamos os conjuntos
Ha dois casos a tratar, I quando

An := { x M | fn (x) +  > s(x) } .


facil ver que Am An para todos m n, pois fn e uma seq
E
uencia crescente. Fora isso,
[
An = M .
n

Isso se deve ao seguinte. Se x M entao, como fn (x) converge a f (x) s(x), segue que para algum
n grande o suficiente teremos fn (x) +  > s(x). Assim, todo x M pertence a algum An .
Temos, com isso, que

S k0 = S k0 M = S k0

An =

(An Sk0 )

Como Am Sk0 An Sk0 para todos m n, podemos evocar a propriedade geral de medidas 3 da
pagina 944 e escrever (Sk0 ) = limn (An Sk0 ), o que nos diz que limn (An Sk0 ) = . Agora,
Z
Z
Z
fn d >
fn An Sk0 d >
(s ) An Sk0 d
M

(sk0 ) An Sk0 d

= (sk0 )

An Sk0 d

= (sk0 )(An Sk0 ) .


A segunda desigualdade (primeira linha) se deve ai fato que em An tem-se fn (x) > s(x) . A primeira
igualdade (segunda linha) se deve ao fato que em Sk0 a funcao s vale sk0 .
Z
h
i
fn d > (sk0 ) lim (An Sk0 ) = , como queramos mostrar.
Assim, lim
n

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1058/1304

R
Pn
II. Consideremos
agora
o
caso
R
Pn M s d < . Seja s(x) = k=1 sk Sk (x) a representacao normal
curta de s. Como M s d = k=1 sk (Sk ) < , segue que (Sk ) < para todo k com sk > 0.
facil ver que
Seja T := {x M | s(x) > 0}. E

T =

Sk .

k=1, ..., n
sk >0

Tem-se entao (T ) =

k
sk >0

que
Z

(Sk ) < . Vamos escolher um  fixo tal que 0 <  < minsk >0 {sk }. Segue

fn d
>
=
=

=
=
=

fn An T d

(s ) An T d
Z

s An T d 

s An T d (An T )

s An T d (T )

s An T T d (T )

s T d
s d

An T d

s (1 An T ) T d (T )

s (T An T ) d (T )

R
Acima,
usamos
em
v
a
rios
lugares
que

.
Na
u

ltima
igualdade
usamos
que
s T d =
A
T
A
T
T
n
n
M
R
s d. Agora, se definirmos sm = supxM s(x) = max{s1 , . . . , sn } 0, teremos
M
Z
Z
s (T An T ) d sm
(T An T ) d = sm ((T ) (An T )) .
M

Pelo mesmo argumento usado na parte I, vale limn (An T ) = (T ). Com isso, teremos que
sm ((T ) (An T ))  para todos os ns grandes o suficiente. Assim, para todos os ns grandes o
suficiente,
Z
Z
fn d >

s d  (T ) .

JCABarata. Curso de Fsica-Matem


atica

O lado direito nao depende de n. Logo,


Z
Z
fn d >
lim
n

s d  (T ) .

Como essa desigualdade vale para  arbitrario, segue que lim

prova para o caso II.

Captulo 23

Vers
ao de 29 de setembro de 2005.

fn d

1059/1304

s d, completando a
M

fn d
s d mostra que lim
fn d sup
s d. Agora, como
n M
sS(f ) M
M
Z
Z
fn S(f ), e claro que lim
fn d sup
s d. Isso mostra que se fn e qualquer seq
uencia
A desigualdade lim

sS(f )

monotona crescente de funcoes simples mensuraveis de S(f ) que converge a f vale


Z
Z
lim
fn d = sup
s d ,
n

sS(f )

provando a equivalencia das duas definicoes (23.23) e (23.24).

23.F

Prova do Teorema da Converg


encia Mon
otona

Apresentamos aqui a demonstracao do Teorema 23.4, o Teorema da Convergencia Monotona.


Prova do Teorema 23.4.34 Pelas hipoteses f = supn fn , assim, pela discussao da pagina 1019 sobre
funcoes definidas pelo supremo de seq
uencias, f e mensuravel.
R
Pelas hipoteses, a seq
uRencia M fn d ou converge a algum n
umero finito nao-negativo ou diverge.
Assim,
seja RF := limn M fn d com F + {}. Como fn (x) < f (x) para todo x, segue que
R
f
d
M f d. Logo,
M n
Z
F
f d.
(23.F.12)


Seja agora s S(f ), ou seja, s e simples, [M, M[ ]]-mensuravel e 0 s f . Tomando-se uma


constante c fixa no intervalo (0, 1), definamos para cada n os conjuntos


En := {x M | fn (x) cs(x)}.
Pela Proposicao 23.11, pagina 1052, os conjuntos En sao todos mensuraveis (ou seja, pertencem a M).
Como {fn } e crescente, e tambem imediato que En En+1 para todo n.

Se x M e f (x) = 0, entao x E1 , pois nesse caso f1 (x) = s(x) = f (x) = 0. Se x M e f (x) > 0,
entao cs(x) < f (x), pois c foi escolhido menor que 1. Como
fn (x) f (x), havera algum n para o qual
S
fn (x) cs(x) e, portanto, x En . Isso provou que n En = M . Pelo Lema 23.4, pagina 1025, e
pela propriedade geral de medidas do item 3, pagina 944, isso implica que
Z
Z
s d =
s d .
lim


34

En

A demonstraca
o abaixo e encontrada de forma quase identica em v
arios textos, por exemplo, em [110]

JCABarata. Curso de Fsica-Matem


atica

Como fn fn En , vale que


Z
Z
fn d
M

fn En d =

Captulo 23

Vers
ao de 29 de setembro de 2005.

En

fn d

c s d = c
En

1060/1304

s d .
En

R
para todo n. Tomando o limite n em ambosRos lados, conclumos que F c M s d. Como
isso
vale para todo Rc entre 0 e 1, segue que F R M s d. Agora, recordando que,Rpela definicao,
R
f d R= supsS(f ) M s d, conclumos que F M f, d. Por (23.F.12), segue que M f d = F =
M
limn M fn d. Isso completa a demonstracao do Teorema 23.4.

23.G

Prova do Lema de Fatou

Prova do Lema de Fatou. Sejam as funcoes gn : M definidas da seguinte forma: para cada x M
claro que cada gn e nao-negativa e, pelos comentarios da pagina 1019,
tem-se gn (x) = inf fk (x). E


kn

tambem claro que gn (x) gn+1 (x) para todo n e para todo x M e que
[M, M[ ]]-mensuravel. E
fn (x) gn (x), tambem para todo n e para todo x M . Agora, para cada x M


lim gn (x) = sup gn (x) = sup inf fk (x) = lim inf fn (x) .

n1 kn

n1

(A u
ltima igualdade e a definicao de lim inf). Como fn (x) gn (x) tem-se
Z
Z
fn d
gn d
M

para todo n, e assim,


inf

kn

fk d inf

kn

Como gn (x) gn+1 (x) para todo n, tem-se que


Z
Z
gk d =
inf
kn

e, portanto,
inf

kn

Conseq
uentemente,
sup inf

n1 kn

Agora, por definicao


lim inf
n

e, alem disso,
sup
n1

Z
Z

fk d

gk d .
M

gn d
M

gn d .
M

fk d sup
n1

gn d .
M

fn d = sup inf
M

n1 kn

gn d = lim
M

fk d
M

gn d ,
M

(23.G.13)

JCABarata. Curso de Fsica-Matem


atica

pois

Captulo 23

Vers
ao de 29 de setembro de 2005.

1061/1304

gn d e crescente. Portanto, provamos que


M

lim inf
n

fn d lim

gn d .
M

Como gn satisfaz os requisitos do Teorema da Convergencia Monotona, Teorema 23.4, pagina 1035,
vale que
Z
Z
lim
gn d =
lim gn d
n

e, assim,

lim inf
n

M n

fn d

lim gn d .

(23.G.14)

M n

Por fim, sabemos por (23.G.13) que lim gn = lim inf fn (x) e, assim, (23.G.14) estabeleceu que
n

lim inf
n

fn d

lim inf fn d ,
M

que e o que queramos provar.

23.H

Prova do Teorema da Converg


encia Dominada

Seguiremos aqui [110].


claro que se f (x) = lim f (x) e |fn (x)| F (x) para
Prova do Teorema da Convergencia Dominada. E
n

todo n
e todo x M , entao |f (x)| F (x) para todo xR M . ComoR f e tambem [M, M[ ]]mensuravel (por ser o limite de funcoes mensuraveis), entao M |f | d < M F d < e, portanto,
f L1 (M, d). Isso provou o item 1 do Teorema 23.6.


Em segundo lugar, notemos que |f fn | |f | + |fn | 2F . Assim, as funcoes gn = 2F |f fn |


sao nao-negativas e podemos aplicar o Lema de Fatou, Lema 23.5, que diz-nos que
Z
Z
lim inf (2F |f fn |) d lim inf
(2F |f fn |) d .
n

Por um lado, temos que


lim inf (2F |f fn |) = 2F lim sup |f fn | = 2F ,
n

pois lim inf |f fn | = lim sup |f fn | = 0. (Justifique!) Por outro lado,


n

lim inf
n

(2F |f fn |) d =

Porem, vale que


lim inf
n

2F d + lim inf
n

|f fn | d = lim sup
n

|f fn | d .

|f fn | d .

JCABarata. Curso de Fsica-Matem


atica

(Justifique!) Assim, provamos que


Z
Z
2
F d 2
M

Vers
ao de 29 de setembro de 2005.

F d lim sup
n

Captulo 23

1062/1304

|f fn | d .

R
R
Como M F d (pois F L1 (M, d)), podemos subtrair o termo 2 M F d de ambos os lados
da expressao acima e concluir que
Z
lim sup
|f fn | d 0 .
n

Como

|f fn | d 0, segue que
lim

|f fn | d = 0 .

Isso provou o item 2 do Teorema 23.6. Como |f fn | 2F , segue que (f fn ) L1 (M, d) e podemos
aplicar (23.33) e concluir que
Z




(f fn ) d = 0 ,
lim
n
M

ou seja,

f d = lim

Isso provou o item 3 do Teorema 23.6.

23.I

fn d .

Prova dos Teoremas 23.2 e 23.3

Aqui apresentamos a demonstracao dos Teoremas 23.2 e 23.3, os quais tratam da relacao entre as
integrais de Riemann e Lebesgue. Seguiremos essencialmente [58], que por sua vez segue [9]. Para uma
outra demonstracao ligeiramente diferente do Teorema 23.2 vide, por exemplo, [41].
Prova do Teorema 23.2. A prova que apresentamos requer o Lema de Fatou e o Teorema da Convergencia
Dominada, tratados na Secao 23.3.4, pagina 1035.
Dada uma funcao real limitada e integravel por Riemann f , definida em [a, b], e dada uma particao
Pn = {x1 , . . . , xn } de [a, b] com a = x1 < . . . < xn = b, sejam as somas de Darboux
Di [Pn , f ] :=

n1 
X
k=1

inf f (y)

yIk

|Ik |

Ds [Pn , f ] :=

n1 
X
k=1

sup f (y)
yIk

|Ik | ,

onde Ik = [xk , xk+1 ) e |Ik | = xk+1 xk = L (Ik ).


Definamos tambem as funcoes simples
n :=

n1 
X
k=1

inf f (y)

yIk

I k

n :=

n1 
X
k=1

sup f (y)
yIk

I k .

(23.I.15)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1063/1304

bastante claro que n e n sao funcoes mensuraveis Borelianas, pois os intervalos Ik = [xk , xk+1 )
E
tambem evidente que
sao Borelianos. E
Z
Z
Di [Pn , f ] =
n dL
e
Ds [Pn , f ] =
n dL .
[a, b]

[a, b]

Se f e integravel por Riemann entao existe uma seq


uencia de particoes P 1 , P2 , P3 , . . ., com Pn+1
mais fina que Pn para todo n e tais que Di [Pn , f ] e Ds [Pn , f ] para algum . Esse e,
Z b
f (x)dx. Assim,
por definicao, a integral de Riemann de f em [a, b], ou seja, =


lim

n dL = lim

[a, b]

e
lim

[a, b]

n dL = ,
[a, b]

(n n ) dL = 0.

A seq
uencia qn = n n e nao-crescente, pois n e nao-crescente e n e nao-decrescente (certo?).
Assim, a funcao q = inf qn = lim qn e Boreliana (vide discussao a` pagina 1019). Pelo Lema de Fatou
n

(Lema 23.5, pagina 1036),


Z

q dL =
[a, b]

lim qn dL =

[a, b] n

lim inf qn dL
[a, b]

lim inf
n

qn dL = lim

[a, b]

[a, b]

(n n ) dL = 0.

Como qn = n n 0 (certo?), segue pela Proposicao 23.6, pagina 1027, que q = 0 L -q.t.p. em
[a, b].
Como n f n para todo n, segue que f = lim n L -q.t.p. em [a, b]. Como f e limitada,
n

existe M > 0 tal que |f | < M . Mas isso implica tambem que |n | < M pois, por (23.I.15), vale

n1
n1
X
X


inf f (y) I M
|n |
I k = M .
yIk
k
k=1

k=1

R
A funcao constante igual a M e integravel em [a, b] (pois [a, b] M dL = M (b a) < ). Logo,
podemos aplicar o Teorema da Convergencia Dominada, Teorema 23.6, pagina 1037, e concluir do fato
que f = limn n que f e integravel e que,
Z
Z
Z b
f dL = lim
n dL = lim Di [Pn , f ] = =
f (x) dx .
[a, b]

[a, b]

provando a igualdade da integral de Riemann e a de Lebesgue no caso tratado. Isso encerra a prova
do Teorema 23.2.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1064/1304

Passemos agora a` prova do Teorema 23.3.


Prova do Teorema 23.3. (De [58], com aperfeicoamentos). A prova que apresentamos requer o Teorema
da Convergencia Monotona, tratado na Secao 23.3.4, pagina 1035.
Z n
Seja a integral de Riemann
f (x) dx, a qual existe para todo para n , por hipotese. Pelo


Teorema 23.2,

f (x) dx =
n

f dL ,
[n, n]

a integral a` direita sendo a de Lebesgue. Podemos escrever


Z
Z
f dL =
f [n, n] dL .
[n, n]

Agora, as funcoes fn = f [n, n] sao Borelianas, sao nao-negativas e formam uma seq
uencia naodecrescente, pois fn fn+1 para todo n , ja que [n, n] [(n + 1), n + 1]. Assim, podemos
aplicar o Teorema da Convergencia Monotona, Teorema 23.4, pagina 1035, e obter
Z 
Z
Z n
Z

lim
f (x) dx = lim
fn dL =
lim fn dL =
f dL .
(23.I.16)


Acima, o fato que limn fn (x) = f (x) para cada x


quanto n .

e conseq
uencia de que [n, n] (, )

R Assim, conclumos da igualdade em (23.I.16) que se f possuir uma integral


R n de Riemann impropria
f (x) dx (definida na Secao 23.2.1, pagina 1009), entao o limite limn n f (x) dx, existe e e igual

R
R
f dL e finita e, portanto, f e integravel no sentido
a f (x) dx e, com isso conclumos que
de Lebesgue (como f e nao-negativa, e obvio que f = |f |).
R
Por outro lado, se f for integravel Rno sentido de Lebesgue, entao F :=
f dL < e, pela
n
igualdade em (23.I.16), o limite limn n f (x) dx existe e e igual a F . Portanto, para qualquer  > 0
existe n0 n0 () tal que
Z n0




< .
f
(x)
dx

F
(23.I.17)




n0

Para todo intervalo finito


e nao0 , n0 ] vale f [n0 , n0 ] f [a, b] f pois f
Z [a, b] com [a,
Z b] [nZ
f d, ou seja,
negativa. Isso implica
f d
f d
[n0 , n0 ]

[a, b]

n0
n0

f (x) dx

b
a

f (x) dx F .

Conseq
uentemente, por (23.I.17) e (23.I.18),
Z b




< .
f
(x)
dx

(23.I.18)

R
Esse fato diz-nos que a rede [, ] f (x) dx esta eventualmente em qualquer intervalo aberto
(F , F + ). (Para a definicao de estar eventualmente, vide Secao 21.4, pagina 986). Isso diz-nos

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1065/1304

que F e um ponto limite dessa rede, o qual, se existe, e u


nico, pois
e um espaco Hausdorff (vide
Proposicao 21.5, pagina 987). Assim, pela defini
c
a

o
da
Se
c
a

o
23.2.1,
p
a
gina
1009, f possui uma integral
R
de Riemann impropria e essa e igual a F :=
f dL .


23.J

Prova das Desigualdades de H


older e Minkowski

Prova do Teorema 23.7. Provaremos primeiro a desigualdade de Holder e dela extrairemos a de Minkowski.
A prova da desigualdade de Holder (23.40) segue os mesmos passos daquela do Teorema 16.2, pagina
16.2. Lembremos, em primeiro lugar a desigualdade demonstrada a` pagina 866, que estabelece que
a1/p b1/q

a b
+ ,
p q

(23.J.19)

para a 0, b 0 e p e q ambos tais que 1 < p < e 1 < q < , e que


igualdade se da se e apenas se a = b.

1 1
+ = 1. Em (23.J.19), a
p q

R
Notemos primeiramente que no caso de termos M |f |p d = 0, a desigualdade (23.40) e automaticamente satisfeita, pois valera |f | = 0 -q.t.p. e, Rportanto, |f g| = 0 -q.t.p., o que implica
que o lado
R
q
p
esquerdo de (23.40) e nulo. O mesmo se da caso M |g| d = 0. No caso de termos M |f | d = a
desigualdade em (23.40) e tambem trivial. Com isso, podemos supor que
Z
Z
p
0 <
|f | d <
e
0 <
|g|q d < .
M

Para x M , tomemos

a = Z

|f (x)|p

b = Z

|f | d

A relacao (23.J.19) diz-nos que


Z

|f (x)|
p

|f | d

1/p Z

|g(x)|
q

|g| d

1/q

|g(x)|q

|g| d

1 |g(x)|q
1 |f (x)|p
Z
+ Z
p
q
|f |p d
|g|q d
M

R
Tomando a integral M ( ) d da expressao acima, tem-se
Z
Z
Z
p
|f | d
|g|q d
|f ||g| d
1
1
M
ZM
+ ZM

Z
1/p Z
1/q
p
q
|f |p d
|g|q d
|f |p d
|g|q d
M

o que demonstra a desigualdade de Holder (23.40).

1 1
+
= 1,
p q

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1066/1304

Provemos
agora a desigualdade
deRMinkowski (23.41). O caso p = 1, e evidente, pois |f g| |f |+|g|
R
R
implica M |f g| d M |f | d + M |g| d. Podemos entao tomar p > 1.
Comecemos observando que para p > 1 a funcao xp e convexa para x > 0. Logo,

p
1
|f | + |g|
(|f |p + |g|p) .
2
2

como |f g| |f | + |g|, segue que

|f g|
2

p

1
(|f |p + |g|p) .
2

(23.J.20)

Disso conclumos que se f e g pertencem a Lp (M, d), entao


f g Lp (M, d) .
(23.J.21)
R
R
R
p
p
Tambem de (23.J.20), extramos que se M |f g|p d = ent
Rao M |f |p d + M |g| d = e a
desigualdade de Minkowski (23.41) e satisfeita. Tambem no caso M |f g| d = 0 (23.41) e satisfeita,
pois a o lado esquerdo de (23.41) e nulo. Podemos entao supor
Z
0 <
|f g|p d < .
(23.J.22)
M

Escrevamos agora
|f g|p = |f g| |f g|p1 (|f | + |g|) |f g|p1 = |f | |f g|p1 + |g| |f g|p1 .
Isso diz-nos que
Z

|f g| d

|f | |f g|

p1

d +

A desigualdade de Holder (23.40) diz-nos que


Z
1/p Z
Z
p1
p
|f | |f g| d
|f | d
M

|g| |f g|p1 d .

|f g|

(p1)q

1/q

(23.J.23)

onde q e tal que 1/q + 1/p = 1, ou seja, q = p/(p 1). Por isso, |f g|(p1)q = |f g|p e a expressao
acima faz sentido por (23.J.21). Assim,
Z
1/p Z
1/q
Z
p1
p
p
.
|f | |f g| d
|f | d
|f g| d
M

e, analogamente

|g| |f g|

p1

Z

|g| d

Inserindo essas duas relacoes em (23.J.23), segue que


Z
1/p Z
Z
p
p
+
|f g| d
|f | d
M

1/p Z

|g| d

|f g| d

1/p ! Z

1/q

|f g| d

1/q

JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

Como estamos sob a suposicao (23.J.22), podemos dividir ambos os lados acima por
e, como 1 1/q = 1/p, obtemos a desigualdade de Minkowski (23.41).

R

1067/1304

|f g|p d

1/q

Prova do Corolario 23.3. Mostraremos que a desigualdade de Holder generalizada (23.43) e conseq
uencia
do seu caso particular para r = 1, a desigualdade de Holder (23.40), que suporemos valida.
Definindo-se p0 = p/r e q 0 = q/r, tem-se
1
r r
1
+ 0 = + = 1.
0
p
q
p q
Definindo-se F = |f |r , G = |g|r , valera
Z
Z
p0
F d =
|f |p d <
M

q0

G d =
M

|g|q d <

e, portanto, F Lp0 (M, d) e G Lq0 (M, d).


Assim,

Z

|f | |g| d

1/r

(23.40)

Z

F G d
M

" Z
" Z
Z

1/r

p0

F d
M

f p d
M

f d
M

1/p0 Z

1/p0 Z

1/p Z

q0

G d
M

g q d
M

g d
M

1/q0 #1/r

1/q0 #1/r

1/q

que e a desigualdade de Holder (23.43).

23.K

Prova do Teorema de Riesz-Fischer

Seja {fn }, n
uma seq
uencia em Lp (M, d) e que seja de Cauchy na norma k kp , ou seja, para
todo  > 0 existe N () tal que kfn fm kp <  para todos m e n maiores que N ().


Vamos primeiramente mostrar que {fn } possui uma sub-seq


uencia {gn } com a propriedade que
kgl+1 gl kp <

1
.
2l

(23.K.24)

para todos l . Vamos definir uma seq


uencia crescente de n
umeros inteiros e positivos N k , k =
1, 2, 3, . . . com Nk+1 > Nk , da seguinte forma: Nk e tal que kfm fn kp < 1/2k para todos m, n > Nk .


JCABarata. Curso de Fsica-Matem


atica

Captulo 23

Vers
ao de 29 de setembro de 2005.

1068/1304

Note que uma tal seq


uencia Nk sempre pode ser encontrada pois, por hipotese, fm e uma seq
uencia
de Cauchy em k kp (basta tomar Nk := N (1/2k )). Vamos agora escolher uma seq
uencia crescente de
ndices n1 < n2 < < nk1 < nk < tais que nk > Nk para todo k. A essa seq
uencia esta associada
a sub-seq
uencia {fnk }k . Para simplificar a notacao, denotaremos gk fnk , k = 1, 2, 3, . . .. Disso e
imediato que (23.K.24) vale, como queramos mostrar, pois nl e nl+1 sao maiores que Nl .


Defina-se
hk =

k
X
l=1

|gl+1 gl |

h =

X
l=1

|gl+1 gl | .

Pela desigualdade de Minkowski e por (23.K.24), vale para cada k que




k
k
k

X
X
X
1


|gl+1 gl |p
|gl+1 gl |
kgk kp =
.
l


2
l=1
l=1
l=1
p

Logo,

gkp

Pelo Lema de Fatou, segue que


Z

lim inf
M

gkp d

lim inf
k

gkp

k
X
1
2l
l=1

!p

d lim inf
k

k
X
1
2l
l=1

!p

= 1.

Agora, como {gk } e uma seq


uencia nao-decrescente, {gkp } tambem o e converge a g p . Logo, lim inf gkp =
k

g p e conclumos que

g p d 1,

o que implica que kgkp 1. Disso segue que g(x) < -q.t.p.
Assim, provamos que a serie

g1 (x) +

n
X
l=1

(gl+1 (x) gl (x))

converge absolutamente para -q.t. x (ou seja, so nao converge absolutamente em um conjunto de
medida nula). Note-se agora que
g1 (x) +

n1
X
l=1

(gl+1 (x) gl (x)) = gn (x) .

Assim, conclumos que lim gn (x) existe -q.t.p.


n

Vamos denotar por G o conjunto dos xs em M onde esse limite existe (como vimos (M \ G) = 0)
e definamos uma funcao f : M da seguinte forma:

lim gn (x), para x G


n
f (x) :=
.

0,
para x M \ G

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 23

1069/1304

Queremos provar que kf fn kp 0 para n , ou seja, que a funcao f definida acima e o limite em
Lp (M, d) da seq
uencia {fn }. Fixando  > 0, sabemos que se m e n forem maiores que N () valera
kfn fm kp < . Logo, o Lema de Fatou diz-nos que se m > N (),
Z
Z
Z
p
p
|f fm | d
lim inf |gl fm | d lim inf
|gl fm |p d = lim inf (kgl fm kp )p p .
M

(23.K.25)
Isso provou que f fm Lp (M, d). Como f = fm + (f fm ), isso implica que f Lp (M, d), pois
Lp (M, d) e um espaco vetorial. Sem perda de generalidade, podemos tomar f Lp (M, d) tambem
(certo?). Ao mesmo tempo, (23.K.25) afirma que kf fm k 0 para m .

Assim, mostramos que a seq


uencia de Cauchy {fn } de Lp (M, d) possui um limite na norma k kp
que e tambem elemento de Lp (M, d). Isso provou que Lp (M, d) e um espaco metrico completo na
norma de Lp (M, d), completando a demonstracao.

Captulo 24
Alguns T
opicos Especiais em Topologia e An
alise
Conte
udo
24.1 Uma Colet
anea de Defini
co
es . . . . . . . . . . . . . . . . . . . . . . . . . . 1070
24.2 A No
ca
o de Topologia Fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . 1076
24.3 A Topologia Produto de Espa
cos Topol
ogicos . . . . . . . . . . . . . . . . 1077
24.4 O Teorema da Categoria de Baire . . . . . . . . . . . . . . . . . . . . . . . 1079
24.5 Aproxima
ca
o de Fun
co
es . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1080
24.5.1 Aproximacao de Funcoes Contnuas por Polinomios . . . . . . . . . . . . . . . 1080

presente captulo, o qual esta ainda bastante incompleto, contem uma miscelanea de assuntos relacionados a espacos topologicos e suas aplicacoes. Sao aqui coletadas varias definicoes
e resultados empregados alhures nestas Notas. Devida a` natureza do captulo as diferentes secoes nao estao necessariamente ligadas entre si e sua leitura pode ser feita de modo
independente.

24.1

Uma Colet
anea de Defini
co
es

Apresentamos nesta secao algumas definicoes importantes empregadas em varios lugares. Exemplos
ilustrativos simples sao, quando possvel, apresentados ao final da secao.
Conjuntos densos
Sejam X um conjunto nao-vazio, uma topologia em X e F X um conjunto fechado em relacao
a` topologia . Um conjunto R F e dito ser denso em F (em relacao a` topologia ) se seu fecho 1 for
F : R = F . Evocando a Proposicao 18.5, pagina 936, conclumos que R e denso em F se e somente
se todo aberto que possuir interseccao nao-vazia com F possuir tambem interseccao nao-vazia com A.
Como X e fechado, conclumos tambem que um conjunto R e denso em X se e somente se para todo
aberto nao-vazio A valer A R 6= .
Conjuntos densos em parte alguma
Um conjunto S X e dito ser denso em parte alguma (em relacao a` topologia ) se seu fecho nao
contiver nenhum aberto de . Em outras palavras, S e denso em parte alguma se o interior de seu
0
0
fecho S for vazio2 . Em smbolos, S e dito ser denso em parte alguma se S = .
1

Por definica
o, o fecho de R de um conjunto R em um espaco topol
ogico e o menor fechado que contem R. Vide
Captulo 18.
2
Por definica
o, o interior de T 0 de um conjunto T em um espaco topol
ogico e o maior aberto contido em T . Vide
Captulo 18.

1070

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1071/1304

Na topologia usual de o conjunto dos racionais nao e denso em parte alguma pois = , que
obviamente possui um interior nao vazio (( )0 = ). O mesmo vale para os irracionais. Os inteiros
formam um conjunto denso em parte alguma.


Conjuntos densos em si mesmo


Um conjunto nao-finito T e dito ser denso em si mesmo (em relacao a` topologia ) se tiver a seguinte
propriedade: para todo t T vale que todo -aberto A que contem t contem tambem pontos de T
distintos de t. Uma definicao alternativa e dizer que T e denso em si mesmo se todo ponto de T for
um ponto de acumulacao de T .
conjuntos fechados, densos em parte alguma e
Pode surpreender o estudante saber que ha em
densos em si mesmo (na topologia usual de ). Os exemplos mas proeminentes sao os conjuntos de
Cantor tratados na Secao 20.2, pagina 961. Vide tambem adiante.


Conjuntos perfeitos
Um sub-conjunto P de X e dito ser perfeito se for fechado e denso em si mesmo.
Abertos densos
Sejam X um conjunto nao-vazio e uma topologia em X. De particular interesse sao os conjuntos
G X que tem a propriedade de serem abertos e densos em X.

Se e uma topologia metrica em X e G X e um aberto denso, entao todo ponto de X que nao
pertence a G (ou seja, todo ponto de X \ G) esta arbitrariamente proximo de um ponto de G (pois
G e denso), mas nenhum ponto de G esta arbitrariamente proximo de um ponto de X \ G (pois G e
aberto).

Exemplo 24.1 Seja X = 2 com a topologia metrica usual e seja L uma linha reta em 2 . Entao,
G = 2 \ L e um aberto denso. Se L1 , . . . , Ln e uma colecao finita de retas em 2 , entao G =
2
\ (L1 . . . Ln ) e um aberto denso.

Exemplo 24.2 Em X = , com a topologia metrica usual, nem o conjunto dos racionais nem o dos
irracionais e aberto denso (ambos sao densos, mas nao sao abertos).

A seguinte propriedade de conjuntos abertos densos pode ser facilmente estabelecida: se G 1 e G2


sao abertos densos em X, entao G1 G2 e um aberto denso em X. Para provar, notemos primeiramente
que G1 G2 e um aberto (por ser interseccao de dois abertos). Em segundo lugar, se A e um aberto
nao-vazio qualquer, tem-se que A (G1 G2 ) e nao-vazio. Para ver isso, notemos que esse conjunto e
igual a (A G1 ) G2 , mas A G1 e aberto e nao-vazio, por hipotese (G1 e suposto ser denso em X)
e, pela mesma razao, (A G1 ) G2 e igualmente aberto e nao-vazio.
Por inducao, pode-se sem dificuldade provar a seguinte generalizacao:

Proposi
c
ao 24.1 Sejam X um conjunto n
ao-vazio e uma topologia em X. Se G1 , . . . , Gn e uma
coleca
o finita de abertos densos em X, ent
ao a intersecca
o G 1 . . . Gn e um aberto denso em X. 2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1072/1304

A proposicao acima diz-nos intuitivamente que conjuntos abertos e densos sao conjuntos topologicamente grandes dentro de X. Essa ideia e a raz da nocao de propriedade generica, que apresentaremos
logo adiante.
Igualmente facil de demonstrar e a seguinte proposicao:
Proposi
c
ao 24.2 Sejam X um conjunto n
ao-vazio e uma topologia em X. Ent
ao, a coleca
o formada
pelos abertos densos em X e pelo conjunto vazio forma uma topologia em X.
2
Prova. X e um aberto denso, trivialmente. Unioes arbitrarias de abertos densos sao tambem abertos e
densos, trivialmente. Por fim, pela Proposicao 24.1, interseccoes finitas de abertos e densos sao abertos
e densos.
2
Propriedades gen
ericas
Sejam X um conjunto nao-vazio e uma topologia em X. Uma propriedade P e dita ser uma
propriedade generica, ou v
alida genericamente, na topologia se for valida em um aberto denso em X.
Como, intuitivamente falando, abertos densos sao subconjuntos topologicamente grandes de X,
uma propriedade generica e uma propriedade valida em todo X, exceto em um conjunto topologicamente pequeno. Em situacoes em que se dispoe de uma topologia mas nao de uma medida, a nocao
de propriedade generica substitui a nocao de propriedade valida quase em toda parte em relacao a
uma medida (ou seja, valida exceto em um conjunto de medida nula. Vide pagina 960).
E. 24.1 Exerccio-Exemplo. Seja Mat ( , n) a algebra das matrizes complexas n n com a topologia
metrica usual definida pela norma operatorial (vide Captulo 4, pagina 222). Mostre que a propriedade de
uma matriz ter todos os seus autovalores distintos e valida genericamente.
6
Exemplo 24.3 Em , a propriedade de um n
umero ser irracional nao e valida genericamente em
relacao a` topologia metrica usual, mas e valida quase em toda parte em relacao a` medida de Lebesgue.
Ja a propriedade de um n
umero ser racional nao e valida nem genericamente em relacao a` topologia
metrica usual, nem e valida quase em toda parte em relacao a` medida de Lebesgue.

Conjuntos desconexos
Um conjunto D X e dito ser desconexo (em relacao a ) se existirem dois abertos A 1 , A2 ,
com
1. D A1 6= e D A2 6= ,
2. (D A1 ) (D A2 ) = ,
3. D = (D A1 ) (D A2 ).
Se D e desconexo, dizemos que um par de abertos A1 , A2 que satisfazem as tres condicoes acima
desconectam D.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1073/1304

Conjuntos conexos
Um conjunto C X e dito ser conexo (em relacao a ) se nao for desconexo.
O seguinte teorema e relevante nesse contexto.

Teorema 24.1 Seja X um conjunto e uma topologia em X. Sejam Ka e Kb dois conjuntos conexos
de X segundo e tais que Ka Kb 6= . Ent
ao Kc := Ka Kb e tambem conexo segundo .
2
Prova. A prova e feita por contradicao. Vamos assumir que Kc nao seja conexo e sejam dois abertos
A1 , A2 satisfazendo
(a) (Kc A1 ) 6= e (Kc A2 ) 6= ,
(b) (Kc A1 ) (Kc A2 ) = ,
(c) Kc = (Kc A1 ) (Kc A2 ).
Assim3 ,
(c)

Kc = [(Ka Kb ) A1 ] [(Ka Kb ) A2 ]
= (Ka A1 ) (Kb A1 ) (Ka A2 ) (Kb A2 )

 

=
Ka (A1 A2 ) Kb (A1 A2 ) .

(24.1)

Ao mesmo tempo,
(b)

= (Kc A1 ) (Kc A2 ) =
=

i h
i
(Ka Kb ) A1 (Ka Kb ) A2

i h
i
(Ka A1 ) (Kb A1 ) (Ka A2 ) (Kb A2 )


h
i [
h
i
= (Ka A1 ) (Ka A2 ) (Kb A2 )
(Kb A1 ) (Ka A2 ) (Kb A2 )
=

h

(Ka A1 ) (Ka A2 ) (Ka A1 ) (Kb A2 )


[ h

i

(Kb A1 ) (Ka A2 ) (Kb A1 ) (Kb A2 )

i

(24.2)

Advertencia ao estudante: as pr
oximas passagens e o restante da demonstraca
o usam abundantemente as propriedades distributivas de uni
oes e intersecco
es de conjuntos. Vide Proposica
o 1.1, p
agina 25.

JCABarata. Curso de Fsica-Matem


atica

Captulo 24

Vers
ao de 29 de setembro de 2005.

1074/1304

Notemos que se uma uniao B1 B2 B3 B4 e vazia, entao cada Bj e vazio. De (24.2) conclumos,
entao, que
= (Ka A1 ) (Ka A2 )

(24.3)

= (Ka A1 ) (Kb A2 )

(24.4)

= (Kb A1 ) (Ka A2 )

(24.5)

= (Kb A1 ) (Kb A2 )

(24.6)

Dessas relacoes, usaremos mais abaixo (24.3) e (24.6).


Voltemos agora a (24.1). Temos que
Ka = K a K c
=

(24.1)

Ka

Ka (A1 A2 )

\

 [

Ka (A1 A2 ) Kb (A1 A2 )


(Ka Kb ) (A1 A2 ) .


(24.7)

Como Ka Kb Ka , temos que (Ka Kb ) (A1 A2 ) Ka (A1 A2 ) e, assim, (24.7) se simplifica


para Ka = Ka (A1 A2 ). Disso conclumos que
Ka = (Ka A1 ) (Ka A2 ) .

(24.8)

De maneira totalmente analoga prova-se que


Kb = (Kb A1 ) (Kb A2 ) .

(24.9)

Analisemos agora as conclusoes (24.3) e (24.8). Se ambos os conjuntos Ka A1 e Ka A2 forem


nao-vazios, teramos que Ka e desconexo (basta lembrar a definicao de conjunto desconexo, acima).
Logo, como Ka foi suposto ser conexo, pelo menos um dos dois deve ser vazio. Digamos, sem perda de
generalidade, que Ka A2 = . Analogamente, por (24.6) e (24.9) conclu-se que pelo menos um dos
conjuntos Kb A1 e Kb A2 deve ser vazio. Se tambem tivessemos Kb A2 = , entao (Ka Kb )A2 = ,
ou seja Kc A2 = , contrariando (a). Logo,
Ka A 2 =

K b A1 = .

De (24.8) segue que Ka = Ka A1 , o que significa que Ka A1 . Sabemos, por hipotese, que Ka Kb
e nao-vazio. Seja x Ka Kb . Como x Ka segue que x A1 . Mas isso contradiz Kb A1 = ,
pois x Kb . Chegamos assim a uma contradicao que nos leva a concluir que Ka Kb e conexo se
Ka Kb 6= .
Componentes conexas
Seja como antes X um conjunto nao-vazio com uma topologia .
trivial constatar que cada conjunto {x} com x X, composto por um u
E
nico elemento, e conexo.

JCABarata. Curso de Fsica-Matem


atica

Captulo 24

Vers
ao de 29 de setembro de 2005.

1075/1304

Se K X podemos estabelecer uma relacao de equivalencia entre seus elementos da seguinte forma:
k, k 0 sao equivalentes, k k 0 , se existir um subconjunto conexo de K que contem ambos. K se quebra,
assim, em uma uniao disjunta de classes de equivalencia pela relacao acima. Cada classe e dita ser uma
componente conexa de K.
Mostremos que o definido acima e, de fato, uma relacao de equivalencia em K. Que k k e
evidente. Que k k 0 implica k 0 k tambem e. Se k1 k2 e k2 k3 , sejam Ka K e Kb K
conexos tais que k1 , k2 Ka e k2 , k3 Kb . Entao Kc = Ka Kb K contem k1 e k3 (e tambem k2 )
e e conexo, pelo Teorema 24.1, pagina 1073.
Conjuntos totalmente desconexos
Um conjunto T X e dito ser totalmente desconexo se todas as suas componentes conexas tiverem
apenas um ponto.
Conjuntos de Cantor
Um conjunto que em uma topologia metrica seja 1) totalmente desconexo, 2) compacto e 3) perfeito
e dito ser um conjunto de Cantor.
Exemplos de conjuntos de Cantor encontram-se na Secao 20.2, pagina 961.
Uns poucos exemplos
Mencionemos alguns exemplos ilustrativos. Seja X =
e = , a topologia usual de . O
conjunto Q1 = [0, 1] , formado por todos e racionais do intervalo [0, 1], e denso em [0, 1]. Q1
e tambem denso em si mesmo e denso em parte alguma, mas nao e perfeito (pois nao e fechado). O
conjunto dos irracionais em [0, 1] e tambem denso em [0, 1], denso em si mesmo, denso em parte
alguma mas nao e perfeito por nao ser fechado. O conjunto {1/n, n , n 1} e denso em parte
alguma em [0, 1] e nao e denso em si mesmo.


E. 24.2 Exerccio. Justifique as afirmacoes acima.

Seja com a topologia . O conjunto A = (a, b) (c, d) com a < b c < d e desconexo, mas
nao totalmente desconexo. Suas componentes conexas sao (a, b) e (c, d). Todo sub-conjunto finito de
e totalmente desconexo.


E. 24.3 Exerccio. Justifique as afirmacoes acima.

O conjunto dosracionais e desconexo


como subconjunto de com a topologia , pois com os

abertos A1 = (, 2) e A2 = ( 2, ) teremos
= ( A1 ) ( A2 ), sendo ambos A1
e
A2 nao-vazios e ( A1 ) ( A2 ) = . Em verdade, podemos tomar A1 e A2 na forma
A1 = (, x) e A2 = (x, ) para qualquer irracional x que o mesmo sera valido.


O conjunto
dos racionais e totalmente desconexo como subconjunto de
pois suas componentes conexas sao do tipo {r} com r racional.
E. 24.4 Exerccio. Justifique as afirmacoes acima.

com a topologia ,


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

E. 24.5 Exerccio. O conjunto irracionais e desconexo como subconjunto de


totalmente desconexo?

1076/1304

com a topologia ? E
6


E. 24.6 Exerccio. O conjunto 0 dos numeros algebricos e desconexo como subconjunto de


totalmente desconexo?
topologia ? E

com a
6


E. 24.7 Exerccio. O conjunto dos numeros transcendentes e desconexo como subconjunto de


totalmente desconexo?
topologia ? E


24.2

com a
6

A No
c
ao de Topologia Fraca

A Topologia Fraca de uma Cole


c
ao de Fun
co
es

Um papel muito importante em Analise Funcional e Algebra


de Operadores desempenham as chamadas topologias fracas, que descreveremos inicialmente em um contexto geral.
Dada uma funcao f : X Y , onde X e Y sao conjuntos dotados de topologias X e Y , respectivamente, sabemos que quanto maior (mais fina) a topologia X mais chances f tera de ser contnua. Por
exemplo, no caso extremo em que X = (X) a funcao f sera certamente contnua. Fixada a topologia
Y e uma questao importante saber qual a menor topologia X que faz de f uma funcao contnua.
Esta questao pode ser, entretanto, estudada de forma muito mais geral se, ao inves de considerarmos
uma u
nica funcao, considerarmos uma colecao de funcoes de X em diversos espacos topologicos Y a e
nos perguntarmos qual a menor topologia em X que faz todas as funcoes da colecao serem contnuas.
O caso anterior de uma u
nica funcao e claramente um caso particular desse e, em verdade, esse caso
mais geral e tambem mais relevante em aplicacoes.
Vamos a`s definicoes. Seja X um conjunto e Ya , a , uma colecao de espacos topologicos com
topologias Ya , respectivamente, onde e um conjunto arbitrario de ndices. Seja tambem F uma
colecao de funcoes de X em algum Ya : F = {fa : X Ya , a }.

Denotamos por (X, F) a menor topologia em X tal que toda funcao de F e contnua. Mais
formalmente definimos (X, F) simplesmente como a interseccao da colecao de todas as topologias
para as quais todas as funcoes de F sao contnuas. Que tal colecao de topologias e nao-vazia mostra
o fato que na topologia (X) toda funcao de F sempre e contnua e, portanto, na pior das hipoteses
tem-se que (X, F) = (X).
Vamos aqui demonstrar alguns resultados basicos sobre a topologia (X, F). Tomaremos sempre
as topologias Ya como fixadas (mas e, por vezes, bom recordar que (X, F) depende na verdade das
Ya ).
Proposi
c
ao 24.3 Seja D a coleca
o de todos os conjuntos de X que sejam a imagem inversa de alguma

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1077/1304

aberto de algum Ya pela funca


o fa da coleca
o F:
D = {A X, tal que A = fa1 (Ua ), para algum aberto Ua de algum Ya e fa de F}.
Ent
ao, (X, F) = [D].

Prova. Em primeiro lugar e claro que toda funcao de F e contnua na topologia [D] pois a imagem
inversa de qualquer aberto por uma funcao de F esta (por definicao) em D e, portanto, em [D]. Assim,
estabelecemos que (X, F) [D], posto ser (X, F) a interseccao de todas as topologias onde todas
as funcoes de F sao contnuas. Vamos mostrar que D (X, F), o que implica que [D] (X, F),
estabelecendo a igualdade (X, F) = [D]. A prova que D (X, F) e feita por absurdo. Vamos
supor que exista um conjunto A na colecao D que nao seja elemento da topologia fraca (X, F). Sejam
porem Ua aberto de Ya e fa funcao de F tais que A = fa1 (Ua ). Como A 6 (X, F), a funcao fa nao
e contnua na topologia fraca pois a imagem inversa do aberto Ua de Ya por fa nao e um aberto nessa
topologia. Isso contradiz a definicao da topologia fraca e, portanto, D (X, F).
u
E
til tambem lembrar um resultado que provamos quando definimos o conceito de base de uma
topologia (pagina 925): a colecao DI formada por interseccoes finitas de elementos de D, X e e uma
base de [D] e, portanto, da topologia fraca.
Exemplo. Para o leitor familiarizado com o conceito de operador limitado em um espaco de Hilbert
considere-se o seguinte exemplo. Seja X = B(H) a colecao de todos os operadores limitados em um
espaco de Hilbert H. Como sabemos X e um espaco de Banach com a norma operatorial kAk =
kAk
. Essa norma define em B(H) uma topologia que e chamada de topologia uniforme (ou
sup
H, 6=0 kk
usual) de B(H).
Seja Y =
e seja a seguinte famlia de funcoes X Y : E = {fx, y : X Y, fx, y (A) =
(x, Ay), com x, y H}. Ou seja, E e a colecao de todas as funcoes que associam a cada operador
limitado A o n
umero complexo (x, Ay) com vetores x, y H. Cada funcao e assim indexada por um
par de vetores x e y H.
Define-se a topologia operatorial fraca em B(H) como sendo a menor topologia para a qual toda
funcao de E e contnua. Esta topologia e mais fraca que a topologia uniforme. Trataremos com mais
detalhe dessa topologia (e de outras correlatas) adiante.

24.3

A Topologia Produto de Espa


cos Topol
ogicos

Seja {X1 , . . . , Xn }Quma colecao finita de conjuntos e seja, para cada a {1, . . . , n}, a uma topologia
em Xa . Seja X = na=1 Xa o produto cartesiano
de todos os Xa , a In e seja B a colecao de todos
Q
os subconjuntos de X que sejam da forma aIn Aa onde Aa a , ou seja, cada Aa e um aberto em
Xa segundo a topologia a . Entao a topologia gerada por B, [B] e chamada de topologia produto dos
espacos topologicos Xa , a .
Q
No caso de produtos cartesianos arbitrarios X a ideia acima de tomar-se produtos de abertos como geradores da topologia do espaco produto pode ser repetida, mas conduz a uma topologia

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1078/1304

(denominada em ingles box product topology) com poucas propriedades importantes. Muito mais
u
til e importante e seguir a sugestao de Tychonov e considerar no espaco produto uma topologia, dita
topologia produto Q
de Tychonov ou simplesmente topologia produto, definida da seguinte forma. Sejam
as projecoes : X X definidas por

ou, alternativamente, interpretando x


X , entao

= x ,

X como uma funcao de em

(x) = x().

X tal que x()

Entao a topologia produto de Tychonov e definida como sendo a menor topologia para qual todas as
projecoes , sao contnuas, ou seja, e a topologia fraca gerada pela famlia de funcoes , .
Para o caso de produtos finitos nao ha distincao entre a box product topology e a topologia
produto de Tychonov. Para essa topologia produto de Tychonov vale entre outros o celebre e importantssimo teorema de Tychonov: produtos cartesianos arbitrarios de espacos topologicos compactos
sao compactos.

Facamos mais clara a distincao entre a box product topology e a topologia produto de Tychonov.
Seja Q
{X , } uma colecao de conjuntos e seja, para cada , uma topologia em X . Seja
X = X o produto cartesiano
de todos os X , . Seja B a colecao de todos os subconjuntos
Q
de X que sejam da forma A onde A , ou seja, cada A e um aberto em Q
X segundo a
topologia . Seja B B colecao de todos os subconjuntos de X que sejam da forma A onde
A , e onde apenas para um n
umero finito de fatores tenhamos A 6= X . Entao a topologia
gerada por B, [B], e a chamada box product topology dos espacos topologicos X a , a , enquanto que a
claro pelas definicoes
topologia gerada por B , [B ], e identica a` topologia produto de Tychonov. E
que [B ] [B].
Notemos que no caso de produtos finitos B = B e, portanto, a box product topology e a
topologia produto de Tychonov coincidem.
Mostremos que a topologia produto de Tychonov e de fato [B ]. Se A ,
Y
1 (A ) =
S

onde S = A e S = X para 6= . Seja D a colecao


D = {1 (A ), A , }.
Conforme observamos na secao 24.2, pagina 1076, a topologia gerada por D e a menor topologia na
qual todas as funcoes sao contnuas. Assim, a topologia produto de Tychonov e identica a [D].
Sabemos tambem de consideracoes gerais (vide pagina 924) que o conjunto D I formado por interseccoes
finitas de elementos de D e uma base em [D]
Q e que [D] = [DI ] (vide discussao a` pagina 924). Ora,
os elementos de DI sao produtos de abertos A onde apenas uma colecao finita de A s difere de
X (por que?), ou seja, DI = B , provando que [D] = [DI ] = [B ].

JCABarata. Curso de Fsica-Matem


atica

24.4

Captulo 24

Vers
ao de 29 de setembro de 2005.

1079/1304

O Teorema da Categoria de Baire

Seja X um conjunto e uma topologia em X. Um conjunto C e dito ser denso em parte alguma na
topologia se seu fecho tiver interior vazio, ou seja, (C)0 = .

Seja X um conjunto e uma topologia em X. X e dito ser de


S primeira categoria se existir uma
famlia contavel Nn , n , de subconjuntos de X tais que X = n Nn e tais que todos os Nn sao
densos em parte alguma.


X e dito ser de segunda categoria se nao for de primeira categoria.

Teorema 24.2 (Teorema da Categoria de Baire para espa


cos m
etricos) Todo espa
S co metrico
completo e de segunda categoria, ou seja, se M e um espaco metrico completo e M = n Nn para
alguma famlia cont
avel de conjuntos Nn M ent
ao existe pelo menos um Nm tal que (Nm )0 6= . 2


Prova. Seja M um espaco metrico completo em relacao a uma metrica d e seja S


uma alguma famlia
contavel de conjuntos Nn M , todos densos em parte alguma e tais que M = n Nn . A
S prova e
feita por contradicao, exibindo-se um elemento x que pertence a M mas que nao pertence a n Nn .


Facamos em primeiro lugar algumas observacoes basicas que serao usadas repetidamente no que
segue. Como os conjuntos Nn sao densos em parte alguma, seus fechos Nn nao podem ser iguais a
M , pois M e aberto. Logo os abertos (Nn )c = M \ Nn sao todos nao-vazios. Fora isso, para qualquer
bola aberta nao-vazia B devemos ter tambem B (Nn )c 6= , pois se tivessemos B (Nn )c = isso
implicaria B Nn , contrariando a hipotese que Nn interior vazio.

SComo dissemos, a estrategia da prova e exibir um elemento x que pertence a M mas que nao pertence
a n Nn . Esse elemento x sera construdo como limite de uma seq
uencia de Cauchy conveniente,
explorando o fato de M ser completo.


Passemos a` construcao da seq


uencia de Cauchy. Como (N1 )c 6= , tomemos um elemento x1
c
c
arbitrario de (N1 ) . Como (N1 ) e aberto existe uma bola B1 (r1 , x1 ) centrada em x1 e de raio r1
claro que B1 (r1 , x1 ) N1 = e que
suficientemente pequeno inteiramente contida em (N1 )c . E
x1 6 N1 .

Analogamente, como (N2 )c e aberto e nao-vazio, tem-se que B1 (r1 , x1 ) (N2 )c 6= . Escolhemos entao x2 B1 (r1 , x1 ) (N2 )c e tomemos uma bola B2 (r2 , x2 ) inteiramente contida no aberto
B1 (r1 , x1 ) (N2 )c . Sem perda, podemos escolher r2 satisfazendo r2 < r1 /2 e tal que B2 (r2 , x2 )
B1 (r1 , x1 ). Note-se tambem que B2 (r2 , x2 ) N2 = e, como B2 (r2 , x2 ) B1 (r1 , x1 ), vale tambem
que B2 (r2 , x2 ) N1 = . Em resumo, B2 (r2 , x2 ) (N1 N2 ) = . e x2 6 N1 N2 .

Podemos agora proceder indutivamente. Para n > 2, (Nn )c e aberto e nao-vazio, tem-se que
Bn1 (rn1 , xn1 ) (Nn )c 6= . Escolhemos entao xn Bn1 (rn1 , xn1 ) (Nn )c e tomemos uma bola
Bn (rn , xn ) inteiramente contida no aberto Bn1 (rn1 , xn1 ) (Nn )c . Sem perda, podemos escolher
rn satisfazendo rn < rn1 /2 < 21n r1 e tal que Bn (rn , xn ) Bn1 (rn1 , xn1 ). Note-se tambem que
Bn (rn , xn ) Nn = e, como Bn (rn , xn ) Bn1 (rn1 , xn1 ), vale tambem que Bn (rn , xn ) Nn1 = .
Em resumo, Bn (rn , xn ) (N1 Nn ) = . e xn 6 N1 Nn .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1080/1304

A seq
uencia xn e uma seq
uencia de Cauchy pois (para m < n),
d(xm , xn )

nm1
X

d(xm+i , xm+i+1 )

i=0

pela desigualdade triangular (por que?) e como xn Bn1 (rn1 , xn1 ), segue que d(xm+i , xm+i+1 )
rm+i < 21mi r1 . Logo,
d(xm , xn )

nm1
X

21mi r1 < 21m r1

i=0

2i = 22m r1

i=0

que vai a zero quando m .

Como xn e uma seq


uencia de Cauchy e M e completo, existe x M ao qual a seq
uencia x n converge.

Fixando um J temos que todo xn com n J e elemento de BJ (rJ , xJ ). Logo, x BJ (rJ , xJ )


BJ1 (rJ1 , xJ1 ). Como BJ1 (rJ1 , xJ1 ) NJ1 = conclumos que x 6 N
SJ1 . No entanto, J e
arbitrario e, portanto,
x
n
a
o
pertence
a
nenhum
N
.
Assim,
x
n
a
o
pertence
a
n
n Nn , contrariando
S
a hipotese que M = n Nn .


24.5

Aproxima
c
ao de Fun
co
es

Na Fsica muitas vezes estamos interessados em resolver problemas cuja solucao nao pode ser obtida
exatamente. No caso de equacoes diferenciais, por exemplo, sao muito raras as situacoes nas quais uma
solucao pode ser expressa em termos de funcoes elementares, tais como polinomios, exponenciais,
logaritmos, senos, co-senos ou combinacoes das mesmas. Na grande maioria dos casos apresentamse metodos de solucao em termos de aproximacoes que, sob hipoteses adequadas, podem estar tao
portanto, uma questao importante desenvolver
proximas quanto se queira da solucao correta. E,
metodos de aproximar funcoes com certas propriedades e e disso, basicamente, que trataremos neste
captulo. Nao pretendemos aqui esgotar o assunto, o que ademais seria impossvel, dada a sua extensao,
mas tratar de dois tipos fundamentais de aproximacoes de funcoes: as aproximacoes por polinomios e
as aproximacoes por polinomios trigonometricos. Este u
ltimo topico e o domnio das chamadas series
de Fourier e suporemos que o leitor ja possua alguma familiaridade com seus aspectos mais elementares
e suas aplicacoes. Como veremos, aproximacoes por polinomios e por polinomios trigonometricos sao
dois assuntos relacionados. Ambos os metodos de aproximacao estao tambem na raiz de muitos outros
desenvolvimentos, como na teoria dos espacos de Hilbert e mesmo em temas mais abstratos, como na
algebra de operadores. Sua aplicacao pratica e enorme e ambos os assuntos tem dominado boa parte
das aplicacoes da Matematica a` problemas de Fsica e de Engenharia desde o seculo XVIII.

24.5.1

Aproxima
c
ao de Fun
co
es Contnuas por Polin
omios

O Teorema de Weierstrass

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1081/1304

Um dos teoremas fundamentais da Analise e o chamado Teorema de Weierstrass4 que afirma que
toda funcao contnua definida em um intervalo fechado finito [a, b] da reta real pode ser uniformemente
aproximada nesse intervalo por polinomios, ou seja, para todo  > 0 podemos encontrar um polinomio
p tal que |p (x) f (x)|  para todo x [a, b]. Nestas Notas, fazemos uso desse importante teorema
em diversas ocasioes. Para futura referencia enunciamos o teorema da seguinte forma:
Teorema 24.3 (Teorema de Weierstrass) Seja f uma funca
o real ou complexa, contnua em um
intervalo fechado finito [a, b] . Ent
ao, f pode ser aproximada uniformemente por polin
omios nesse
intervalo, ou seja, para todo  > 0 existe um polin
omio p tal que kp f k = sup |p (x) f (x)| .


x[a, b]

2
Ha in
umeras demonstracoes do Teorema 24.3 na literatura. Vide, por exemplo, [138] para uma
prova usando os chamados polinomios de Bernstein5 , dados, para uma funcao contnua f , definida no
intervalo [0, 1], por
 
n
X
n p
x (1 x)np .
pn (x) :=
f (p/n)
p
p=0

O texto [75] apresenta diversas demonstracoes do Teorema 24.3, inclusive a interessantssima demonstracao original de Weierstrass, a qual faz uso de propriedades do chamado n
ucleo de calor (a saber, a
propriedade que o n
ucleo de calor forma uma seq
uencia delta de Dirac). Tambem muito interessante e
a demonstracao encontrada em [44], talvez a mais elementar, e que aparentemente e devida a Lebesgue.
No que segue iremos provar uma forma mais forte do Teorema de Weierstrass, a saber:
Teorema 24.4 (Teorema de Weierstrass) Seja f uma funca
o real ou complexa, contnua em um
intervalo fechado [a, b] e tal que suas k primeiras derivadas existam e sejam contnuas nesse intervalo. Ent
ao, f pode ser aproximada uniformemente por polin
omios nesse intervalo e suas k primeiras
derivadas podem ser aproximadas uniformemente
desses polin
omios, ou seja, para todo

pelas derivadas
(l)
(l)
(l)
 > 0 existe um polin
omio p tal que p(l)

f
=
sup
|p
(x)

f
(x)|
 para todo 0 l k.



x[a, b]

Como o leitor pode perceber essa generalizacao afirma que nao apenas e possvel aproximar uniformemente funcoes contnuas em intervalos compactos por polinomios mas, no caso de a funcao ser k
vezes diferenciavel, e possivel encontrar aproximantes polinomiais cujas k primeiras derivadas tambem
aproximam uniformemente as respectivas derivadas da funcao a ser aproximada.
Adiante, apresentaremos uma prova do teorema mais geral, Teorema 24.4. Seguiremos muito proximamente a demonstracao apresentada em [27] mas, para a facilidade do estudante, acrescentaremos
alguns detalhes6 . Antes de iniciarmos a prova do Teorema 24.4 precisamos fazer um comentario sobre
um fato que usaremos.
4

Karl Theodor Wilhelm Weierstrass (1815-1897). O Teorema de Weierstrass data de 1885. A referencia original pode
ser encontrada em [27].
5
Sergi Natanovich Bernstein (1880-1968). Berstein introduziu os polin
omios que levam seu nome em trabalho de 1911
sobre o Teorema de Weierstrass e interpolaco
es polinomiais.
6
Nossa prova e tambem ligeiramente mais precisa que a de [27], pois l
a o par
ametro (vide abaixo) e tomado na
forma 0 < < 1 mas, para evitar problemas em certos limites de integraca
o, o correto e tom
a-lo como faremos adiante.

JCABarata. Curso de Fsica-Matem


atica

Captulo 24

Vers
ao de 29 de setembro de 2005.

1082/1304

Certas extens
oes contnuas de fun
co
es
Seja f uma funcao contnua definida em um intervalo fechado limitado [a, b] assumindo valores
reais ou complexos e que tenha suas k primeiras derivadas igualmente contnuas nesse intervalo. Seja
um intervalo fechado limitado [, ] que contem [a, b] no seu interior, ou seja, com < < a <
b < < . Entao, existe pelo menos uma funcao f definida em [, ] com as seguintes propriedades:
1. f coincide com f no intervalo [a, b].
2. f e suas k primeiras derivadas sao contnuas em [, ].
3. f e suas k primeiras derivadas anulam-se nos extremos e do intervalo [, ].
A funcao f e, assim, uma extensao de contnua de f ao intervalo [, ] cujas k primeiras derivadas
sao extensoes contnuas das respectivas k primeiras derivadas de f ao intervalo [, ]. Alem disso, f
e suas k primeiras derivadas anulam-se nos extremos do intervalo [, ] em que estao definidas.
Ha infinitas funcoes f com tais propriedades. Uma maneira de construir uma tal funcao e escolhe-la
de modo que seja identica a f no intervalo [a, b], seja infinitamente diferenciavel nos intervalos [, a)
e (b, ] mas de modo que limxa f(l) (x) = f (l) (a) no intervalo [, a) e limxb f(l) (x) = f (l) (b) no
intervalo (b, ], para todo 0 l k.
Exemplo 24.4 Uma possvel escolha de uma funcao f com as propriedades acima e a seguinte:

f (x) ,
axb

!
X
k

(k)

f
(a)

(x a)l F, a (x) ,
x<a

l!
,
f (x) =
l=0

(k)
X

f
(b)

(x b) (1 Fb, (x)) , b < x

l!
l=0

onde, para u < v, a funcao Fu, v : [u, v] [0, 1] e definida por




Z x
1
1
1
exp

dy ,
Fu, v (x) :=
Nu, v u
(y u)2 (y v)2
Nu, v sendo a constante de normalizacao

Z v
Nu, v :=
exp
u

1
1

2
(y u)
(y v)2

u x v,

dy .

Essa funcao Fu, v e contnua, estritamente crescente, infinitamente diferenciavel no intervalo u < x < v
e satisfaz
lim Fu, v (x) = 0,

xu

lim Fu, v (x) = 1,

xv

lim Fu,(l)v (x) = lim Fu,(l)v (x) = 0,

xu

xv

l1.

JCABarata. Curso de Fsica-Matem


atica

Captulo 24

Vers
ao de 29 de setembro de 2005.

1083/1304

Com isso, e facil ver que f satisfaz as propriedades requeridas: e contnua e k-vezes diferenciavel em
[, ] e satisfaz
f() = 0 = f() ,

f(l) () = 0 = f(l) () , l 1 ,

f(l) (a) = f (l) (a)

f(l) (b) = f (l) (b) ,

(24.10)

0lk ,

alem de, obviamente, ser uma extensao de f .

E. 24.8 Exerccio. Verifique as afirmacoes feitas acima.

Para o que segue, a forma especfica de f, como aquela do exemplo acima, nao sera relevante, apenas
suas propriedades.
Prova do Teorema de Weierstrass
Daqui por diante, consideraremos sem perda de generalidade que [a, b] (0, 1), ou seja, tomamos
0 < a b < 1, e consideraremos f uma extensao de f a todo o intervalo [0, 1] com as propriedades
acima (adotando = 0 e = 1). Com uma tal funcao podemos definir os polinomios
Z 1

n
1
pn (x) :=
f(u) 1 (u x)2 du
(24.11)
2Dn (0) 0
com x [0, 1], onde, para [0, 1], definimos
Dn () :=

1 v2

n

dv .

Os pn sao claramente polinomios de grau menor ou igual a 2n. Como veremos, esses polinomios sao
aqueles que aproximam f com as propriedades requeridas. Para mostrar isso, fixemos x [a, b] e
comecemos observando que
1
pn (x) =
2Dn (0)

1
0


n
f(u) 1 (u x)2 du

v=ux

1
2Dn (0)

1x
x


n
f(v + x) 1 v 2 dv
= A1 + A2 + A3 ,

com
1
A1 :=
2Dn (0)


n
f(v + x) 1 v 2 dv, A2 :=

1
2Dn (0)

A3 :=

1
2Dn (0)

Z
Z


n
f(v + x) 1 v 2 dv ,

1x

(24.12)


n
f(v + x) 1 v 2 dv ,

onde satisfaz 0 < < min{a, 1 b} e sera convenientemente fixado mais adiante 7 . Vamos tratar de
estimar cada uma das tres expressoes Aj acima. Como f e contnua no intervalo [0, 1], seu modulo
7

Como 0 < < min{a, 1 b} e x [a, b], segue que > x e < 1 x. Assim, os tres intervalos de integraca
o em
(24.12) s
ao crescentes.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1084/1304





assume um valor maximo, que denotaremos por F , ou seja, em smbolos, F := sup f(x) . Com isso
x[0, 1]

podemos escrever que


1
|A3 |
2Dn (0)

1x


n
|f(v + x)| 1 v 2 dv

F
2Dn (0)

1x

2Dn (0)


n
1 v 2 dv
1


n
Dn ()
1 v 2 dv = F
, (24.13)
2Dn (0)

onde, na u
ltima desigualdade, usamos que 1 x 1. De forma totalmente analoga, prova-se que vale
tambem
Dn ()
.
(24.14)
|A1 | F
2Dn (0)
O termo A2 pode ser manipulado da seguinte forma. Usando a identidade
R
R
n
2 n
[1 v 2 ] dv + 2Dn ()
[1

v
]
dv
+
D
()
Dn (0)
n

0
1 =
=
=
,
Dn (0)
Dn (0)
2Dn (0)
escrevemos
A2

:= f(x) f(x) 1 +

1
2Dn (0)

1
Dn ()
+
= f(x) f(x)
Dn (0) 2Dn (0)


n
f(v + x) 1 v 2 dv

f(v + x) f(x)

De (24.13), (24.14) e (24.15) extramos, assim, que para x [a, b],


n
1 v 2 dv .

Z

n
F Dn () Dn ()
1

|pn (x) f (x)|


+ f (x)
+
f (v + x) f(x) 1 v 2 dv .
Dn (0)
Dn (0) 2Dn (0)


Como x [a, b], podemos substituir f por f no lado esquerdo. Fora isso, f (x) F e, assim,
chegamos a
Z

n
1
Dn ()

+
|pn (x) f (x)| 2F
f (v + x) f (x) 1 v 2 dv .
Dn (0) 2Dn (0)

Observemos neste ponto que uma funcao que seja contnua em um intervalo compacto, como f, e
uniformemente contnua nesse intervalo. Assim, para cada
 > 0 dado podemos encontrar um > 0,


pequeno o suficiente e independente de x de forma que f (v + x) f(x) <  desde que |v| < . Temos,

JCABarata. Curso de Fsica-Matem


atica

Captulo 24

Vers
ao de 29 de setembro de 2005.

1085/1304

portanto,
Dn ()

|pn (x) f (x)| 2F
+
Dn (0) 2Dn (0)

Dn ()
+
= 2F
Dn (0) Dn (0)
= 2F


n
1 v 2 dv
1 v2

n

dv

Dn ()

+
(Dn (0) Dn ())
Dn (0) Dn (0)

= (2F )
2F

Dn ()
+
Dn (0)

Dn ()
+.
Dn (0)

Para fechar a demonstracao dessa parte, precisamos agora mostrar que para qualquer fixo com
0 < 1 a razao Dn ()/Dn (0) pode ser feita tao pequena quanto se queira, fazendo-se n crescer.
Como em [27], notamos que para v [0, 1] vale v 2 < v. Assim,
Z 1
Z 1
1
2 n
(1 v)n dv =
,
(1 v ) dv
Dn (0) =
n+1
0
0
calculando explicitamente a u
ltima integral. Paralelamente,
Z 1
Z 1
2 n
2 n
Dn (0) =
(1 v ) dv (1 )
dv = (1 2 )n (1 ) (1 2 )n

e, portanto,
Dn ()
(n + 1)(1 2 )n .
Dn (0)
Como 0 < 1 2 < 1, o limite para n do lado direito, acima, e zero. Assim, conclumos que para
n grande o suficiente, independente de x, tem-se |pn (x) f (x)| 2. Isso estabelece que a seq
uencia
de polinomios pn converge uniformemente a f no intervalo [a, b]. Com isso provou-se o Teorema 24.3.
(l)

Vamos provar agora que para cada l com 1 l k as derivadas pn tambem convergem uniformemente a`s derivadas f (l) quando n . Notemos que, pela definicao de pn ,
Z 1
n
l 
1
(l)
f(u) l 1 (u x)2 du .
pn (x) =
2Dn (0) 0
x
n

Agora, devido ao fato de a funcao [1 (u x)2 ] ser simetrica pela troca u x, vale
l 

n
l 
2 n
l
1

(u

x)
=
(1)
1 (u x)2 .
l
l
x
u

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 24

1086/1304

Assim,
p(l)
n (x)

int. por partes

(1)l
2Dn (0)

1
0

n
l 
f(u) l 1 (u x)2 du
u


Z
l1 
n u=1 (1)l1 1 (1)
n
l1 


+
f (u) l1 1 (u x)2 du .
(1) f (u) l1 1 (u x)
u
2Dn (0) 0
u
u=0
|
{z
}
= 0 , pois f(0)=f(1)=0
l

Repetindo-se l vezes o processo de integracao por partes e usando o fato que f e suas derivadas anulamse em 0 e em 1, por construcao, obtemos,
Z 1

n
1
(l)
pn (x) =
f(l) (u) 1 (u x)2 du .
2Dn (0) 0

(l)
Ja vimos, porem, que essa igualdade implica que pn converge uniformemente a f(l) no intervalo [a, b]
para n . Isso completa a prova do Teorema de Weierstrass, Teorema 24.4.

Parte VI
An
alise Funcional

1087

Captulo 25
Noco
es B
asicas Sobre Espacos de Hilbert
Conte
udo
25.1 Aspectos Topol
ogicos B
asicos de Espa
cos de Hilbert . . . . . . . . . . . . 1088
25.2 Aspectos Geom
etricos B
asicos de Espa
cos de Hilbert . . . . . . . . . . . . 1090
25.2.1 Bases Ortonormais Completas em Espacos de Hilbert . . . . . . . . . . . . . 1095
25.3 Funcionais Lineares e o Dual Topol
ogico de um Espa
co de Hilbert . . . . 1109
25.3.1 O Teorema da Representacao de Riesz . . . . . . . . . . . . . . . . . . . . . . 1110

m espaco vetorial H sobre o corpo dos complexos e dotado de um produto escalar u, v


H 7 hu, vi e dito ser um espaco de Hilbert1 se for completo em relacao a` metrica d
definida por esse produto escalar:
p
hu v, u vi,
u, v H.
(25.1)
d(u, v) = ku vk =

Advertimos o estudante que dentre as propriedades definidoras de espacos de Hilbert destaca-se nao
apenas a existencia de um produto escalar, mas tambem a propriedade de completeza, sem a qual
muitas propriedades geometricas nao seriam validas. Vide adiante.

Espacos de Hilbert desempenham um papel fundamental em toda a Fsica Quantica2 e em varias


areas da Matematica. Exemplos de espacos de Hilbert sao os espacos de dimensao finita n , o espaco
`2 , das seq
uencias de quadrado somavel, estudado na Secao 16.4.1, pagina 852, e os espacos L 2 (M, d),
das funcoes de quadrado integravel em relacao a uma medida definida em um espaco mensuravel M .
Esses espacos foram estudados na Secao 23.4, pagina 1040.
Sobre a origem da nocao abstrata de Espaco de Hilbert, vide nota historica a` pagina 851. As nocoes
de espacos de Banach e de Hilbert foram introduzidas nestas Notas na Secao 16.4, pagina 850.
Para a leitura deste captulo uma certa familiaridade com a nocao de produto escalar e de norma e
necessaria, assim como e necessario conhecer a desigualdade de Cauchy-Schwarz. O conceito de produto
escalar foi apresentado na Secao 2.2.3, pagina 117, a desigualdade de Cauchy-Schwarz foi demonstrada
no Teorema 2.6, pagina 114 e o conceito de norma foi introduzido na Secao 2.3, pagina 121.

25.1

Aspectos Topol
ogicos B
asicos de Espa
cos de Hilbert

Por sua definicao, um espaco de Hilbert H e um espaco metrico com a metrica dada em (25.1) e,
a essa topologia a que normalportanto, existe uma topologia metrica naturalmente definida em H. E
mente nos referiremos quando falarmos de convergencia de seq
uencias e de continuidade de funcoes em
H.
1

David Hilbert (1862-1943).


H
a um dito corrente (e an
onimo) que a Mec
anica Qu
antica e uma agrad
avel introduca
o ao estudo dos espacos de
Hilbert...
2

1088

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1089/1304

Assim, dizemos que uma seq


uencia {xn }n de vetores de um espaco de Hilbert H converge a um
vetor x de H se para todo  > 0 existir N () tal que kx xi k  para todo i N (). Em outras
palavras, x = limn xn se e somente se limi kx xi k = 0.


O estudante deve ser advertido que outras ha outras topologias de interesse no estudo dos espacos
de Hilbert, como a topologia fraca induzida pelos produtos escalares. No estudo introdutorio que
pretendemos nesse captulo tais topologias nao serao consideradas.
Conjuntos fechados em espa
cos de Hilbert

Muito freq
uentemente estaremos estudando o fecho de subconjuntos de um espaco de Hilbert e H
propriedades de conjuntos fechados em um espaco de Hilbert H e vale a pena lembrar nesse contexto
as seguintes caracterizacoes de tais conceitos, validas em espacos metricos gerais (vide pagina 937),
caracterizacoes estas das quais faremos freq
uente uso no que segue:
1. O fecho C de um subconjunto C de um espaco de Hilbert H e o conjunto de todos os vetores de
H que sao pontos limite de seq
uencias convergentes formada por elementos de C.
2. Um subconjunto F de um espaco de Hilbert H e fechado se toda seq
uencia convergente formada
por elementos de F convergir em H a um vetor que tambem e elemento de F .
O fecho de um subespa
co linear
e tamb
em um subespa
co linear
Vamos ilustrar os conceitos acima mostrando um simples resultado do qual faremos uso adiante.
Seja E um subespaco de um espaco de Hilbert H. Vamos mostrar que seu fecho E e tambem um
sub-espaco de H. Para isso devemos mostrar que se x, y E, entao qualquer vetor de H que seja
da forma z = x + y, com , , e tambem elemento de E. Se x e y E, entao existem duas
seq
uencias xi e yi , i , de vetores de E tais que xi x e yi y. Como E e um subespaco, todos
facil, porem, mostrar que zi z. De fato
os vetores zi = xi + yi sao tambem elementos de E. E


kz zi k = k(x + y) (xi + yi )k = k(x xi ) + (y yi )k ||kx xi k + ||ky yi k.


Agora, por hipotese, tanto kx xi k quanto ky yi k vao a zero quando i , mostrando que zi z.
Isso mostra, entao, que elementos como z sao pontos limite de seq
uencias de elementos de E (no caso
{zi }i ) e, portanto, pertencem tambem ao fecho de E que e, portanto, um subespaco de H.


Uma propriedade da norma


Se a e b sao dois vetores de um espaco vetorial normado V (como um espaco de Hilbert, por
exemplo), entao vale que




(25.2)
ka bk kbk kak .
Para mostrar isso, notemos que a relacao ka bk kak + kbk implica
kak ka bk kbk.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1090/1304

Com a substituicao b a b, tiramos tambem que


kak kbk ka bk.
As duas desigualdades dizem que kak | ka bk kbk |, como queramos provar.
Continuidade da norma e do produto escalar
De acordo com a definicao de continuidade de funcoes entre espacos metricos (vide discussao a`
pagina 994) uma funcao f : H , de um espaco de Hilbert H nos n
umeros complexos e contnua
se para toda seq
uencia convergente de vetores {xi }i a seq
uencia de n
umeros {f (xi )}i for tambem
convergente e


lim f (xn ) = f lim xn .


Um exemplo banal de uma tal funcao contnua e a norma f (x) = kxk. De fato, se xn x,
isso significa que kxi xk 0. Logo |f (x) f (xi )| = |kxk kxi k|. Mas, pela desigualdade (25.2),
tomando-se a = x xi e b = xi , conclumos
|f (x) f (xi )| kx xi k,
como o lado direito vai a zero quando i . conclumos que






lim f (xn ) = f lim xn = f (x),
ou seja,
lim kxn k = lim xn = kxk ,
n

demonstrando a continuidade da norma.

Ha um outro exemplo igualmente banal, mas importante. Seja H um vetor fixo e seja a funcao
f : H dada por
f (x) = h, xi.
Que f e contnua pode ser demonstrado com uso da desigualdade de Cauchy-Schwarz (Teorema 2.6,
pagina 114), que diz que se xn x, entao
|f (x) f (xi )| = |h, (x xi )i| kk kx xi k
e o lado direito vai a zero quando i , demonstrando a continuidade. Analogamente, fixando-se
H, a funcao f (x) = hx, i e contnua.

25.2

Aspectos Geom
etricos B
asicos de Espa
cos de Hilbert

Conjuntos convexos
Seja V um espaco de vetorial (sobre os reais ou complexos). Uma combinacao linear de dois vetores
x e y V que seja do tipo x + (1 )y com [0, 1] e dita ser uma combinaca
o linear convexa de
x e y. Um conjunto A V e dito ser um conjunto convexo se para todo x, y A e todo [0, 1] o
vetor x + (1 )y tambem for elemento de A.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1091/1304

Note-se que qualquer subespaco de V e tambem um conjunto convexo.


Teorema do melhor aproximante
O seguinte teorema e de importancia fundamental na teoria dos espacos de Hilbert.
Teorema 25.1 Seja A um sub-conjunto convexo e fechado de um espaco de Hilbert H. Ent
ao, para
todo x H existe um vetor y A tal que a dist
ancia kx yk entre x e y e igual a mnima dist
ancia
possvel entre x e A, ou seja,
kx yk = inf
kx y 0 k.
0
y A

Fora isso esse vetor y e o u


nico vetor em A com essa propriedade.

Prova. A ideia da demonstracao e construir um vetor y com a propriedade mencionada a partir de


uma seq
uencia de Cauchy de vetores de A, mostrar que essa seq
uencia converge a um vetor de A,
mostrar que esse vetor satisfaz a propriedade de mnima distancia mencionada e, por fim, mostrar sua
unicidade.
Seja D 0 definida como

D = inf
kx y 0 k.
0
y A

Seja, para cada n




um vetor yn A com a propriedade que


kx yn k2 < D 2 +

1
.
n

Notemos que tais vetores sempre existem. Se tal nao fosse o caso, ou seja, se para algum n, digamos
n0 , nao existisse vetor nenhum y 0 em A tal que kx y 0 k2 < D 2 + n10 , isso significaria que para todo
y 0 A valeria que kx y 0 k2 D 2 + n10 . Mas isso contraria a definicao de D como o nfimo de kx y 0 k,
y 0 A.
Vamos agora provar que toda seq
uencia yn como acima e uma seq
uencia de Cauchy em H. Para
tal, usaremos a identidade do paralelogramo (vide pagina 125) e o fato de A ser convexo.
A identidade do paralelogramo diz que para todos a, b H tem-se que
ka + bk2 + ka bk2 = 2kak2 + 2kbk2 .
Adotemos, entao, a = x yn e b = x ym . Teremos que
k2x (ym + yn )k2 + kym yn k2 = 2kx yn k2 + 2kx ym k2 .
Isso pode ser reescrito (verifique) como

2


y
+
y
m
n
.
kym yn k = 2kx yn k + 2kx ym k 4
x

2
2

Usando agora o fato que kx yn k2 < D 2 +

1
n

para todo n , ficamos com



2




1
1
y
+
y
m
n
2
2
.
kym yn k 4D + 2
+
4
x


n m
2

(25.3)

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1092/1304

n
A pois o lado esquerdo e uma combinacao linear convexa de
Notemos agora tambem que ym +y
2
elementos de A e A e um conjunto convexo. Assim, pela definicao de D,

2


x ym + y n D 2 .


2

Portanto, temos que

kym yn k 4D + 2

1
1
+
n m

4D = 2

1
1
+
n m

O lado direito pode ser feito arbitrariamente pequeno, tomando-se m e n ambos grandes o suficiente.
Ora, isso diz-nos precisamente que {yn }n e uma seq
uencia de Cauchy.


Com essa informacao. e lembrando que H e um espaco metrico completo, segue que y n converge a
um elemento y H. Na verdade podemos dizer tambem que y A, pois fizemos a hipotese que A e
fechado (lembre-se da caracterizacao de conjuntos fechados em espacos metricos da pagina 937).
Uma vez encontrado esse y A, vamos mostrar que kx yk = D. De fato, para todo n vale que
r
1
D 2 + + ky yn k.
kx yk = k(x yn ) (y yn )k kx yn k + ky yn k
n
Tomando-se n , e usando o fato que yn converge a y, conclumos que kx yk D (verifique). Por
outro lado, e evidente pela definicao de D que kx yk D, pois y A. Da, segue que kx yk = D,
como queramos provar.
Resta-nos demonstrar que esse y e o u
nico elemento de A com essa propriedade. Para tal, vamos
0
supor que haja outro y A com kx y 0 k = D e usemos novamente a identidade do paralelogramo
(25.3), mas agora com a = x y e b = x y 0 . Teremos que
k2x (y + y 0 )k2 + ky y 0 k2 = 2kx yk2 + 2kx y 0 k2 = 4D 2 ,
ou seja,

2


y + y0
.

ky y k = 4D k2x (y + y )k = 4D 4 x
2
0 2

Como

y+y 0
2

A, por ser uma combinacao linear convexa, segue que

e, portanto,
o que so e possvel se y = y 0 .

Complementos ortogonais



0 2

y
+
y
x
D2

2
ky y 0 k2 0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1093/1304

Se E e um subconjunto de um espaco de Hilbert H, define-se seu complemento ortogonal E como


o conjunto de todos os vetores de H que sao ortogonais a todos os vetores de E:
E = {y H| hy, xi = 0 para todo x E} .
Temos a seguinte proposicao:
Proposi
c
ao 25.1 O complemento ortogonal E de um subconjunto E de H e um sub-espaco linear
fechado de H.
2
Prova. Que E e um subespaco e facil de se verificar pois se x, y E , entao, para quaisquer , ,
hx + y, zi = hx, zi + hy, zi = 0
para todo z E, o que mostra que x + y E . Que E e um conjunto fechado segue do seguinte
argumento. Se xn e uma seq
uencia de elementos de E que converge a um x H, entao, para todo
z E vale
D
E
hx, zi = lim xn , z = lim hxn , zi = 0
(25.4)
n

pois hxn , zi = 0 para todo n, ja que xn E . Isso prova que x E , que e assim, fechado. Na
pen
ultima igualdade em (25.4) usamos a continuidade do produto escalar.
Faremos adiante uso do seguinte lema:
Lema 25.1 Se A e B s
ao dois conjuntos de um espaco de Hilbert H e A B, ent
ao, B A .

Prova. Por definicao, se y B , y e ortogonal a todo elemento de B. Como A e subconjunto de B, y


e tambem ortogonal a todo elemento de A, ou seja, y A .
Teorema da decomposi
c
ao ortogonal
O teorema do melhor aproximante que apresentamos acima tem uma conseq
uencia importante.
Como todo sub-espaco linear de um espaco de Hilbert e convexo, segue que sub-espacos lineares fechados
satisfazem as hipoteses do teorema. Assim, se M e um sub-espaco linear fechado de um espaco de Hilbert
H vale para todo x H que existe um y M u
nico tal que
kx yk = inf
kx y 0 k.
0
y M

Usaremos esse fato para demonstrar o seguinte teorema, de importancia central na teoria dos espacos
de Hilbert:
Teorema 25.2 (Teorema da Decomposi
c
ao Ortogonal) Seja M um sub-espaco linear fechado de
um espaco de Hilbert H. Ent
ao, todo x H pode ser escrito de maneira u
nica na forma x = y + z,

com y M e z M .
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1094/1304

Prova. Vamos escolher y como o elemento de M tal que kx yk = inf y0 M kx y 0 k, cuja existencia foi
garantida pelo Teorema 25.1, pagina 1091. Se definirmos z = x y tudo que nos restaria fazer e provar
que z M e que tais y e z sao u
nicos. Vamos provar primeiro que z M , o que equivale a provar
que hz, y 0 i = 0 para todo y 0 M. Isso e feito indiretamente, observando primeiro que, pela definicao
de y, vale que
kx yk2 kx y y 0 k2

ltima relacao diz,


para todo e todo y 0 M, ja que y + y 0 M, pois M e um subespaco. Essa u
pela definicao de z, que
kzk2 kz y 0 k2
para todo . Escrevendo o lado direito como hz y 0 , z y 0 i e expandindo, teremos
kzk2 kzk2 2Re(hz, y 0 i) + ||2 ky 0 k2 ,
ou seja,
2Re(hz, y 0 i) ||2 ky 0 k2 .

(25.5)

Agora, como todo n


umero complexo, hz, y 0 i e da forma hz, y 0 i = |hz, y 0 i|ei , para algum real. Como
(25.5) vale para todo , vale em particular para da forma = tei , onde escolhemos t > 0.
Inserindo esse em (25.5), a mesma fica
2t|hz, y 0 i| t2 ky 0 k2 ,
ou seja,

t 0 2
ky k ,
2
desigualdade esta que vale para todo t > 0. Ora, isso so e possvel se o lado esquerdo e nulo: |hz, y 0 i| =
0. Como y 0 e um elemento arbitrario de M, isso demonstra que z M , como queramos.
|hz, y 0 i|

Demonstrar a unicidade da escolha de y e z e bem facil. Suponha que tambem possamos escrever
x = y 0 + z 0 com y 0 M e z 0 M . Teramos y + z = y 0 + z 0 , ou seja, y y 0 = z 0 z. Agora, o lado
esquerdo e um elemento de M, enquanto que o lado direito e um elemento de M (por que?). Porem,
ou
nico elemento que M e M podem ter em comum e o vetor nulo (por que?), o que implica y = y 0 e
z = z0.

Fechos e complementos ortogonais


Proposi
c
ao 25.2 O fecho E de um sub-espaco E de H e E = (E ) . Em particular, se E e um
sub-espaco fechado de H, ent
ao E = (E ) .
2
Prova. Notemos primeiramente que E (E ) , pois (E ) e o conjunto de todos os vetores perpendiculares a cada elemento de E e todo elemento de E tem essa propriedade. Como (E ) e um
conjunto fechado (pela Proposicao 25.1, pagina 1093), segue que E (E ) pois, por definicao, E e o
menor fechado que contem E.
Vamos agora provar a relacao oposta, ou seja, que E (E ) . Para isso vamos mostrar que todo
elemento de (E ) esta no fecho de E. Seja x (E ) . Como E e um subespaco linear fechado, a

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1095/1304

ele se aplica o Teorema de Decomposicao Ortogonal e podemos afirmar que x pode ser escrito como
x = y + z com y E e z (E) . Se provarmos que z = 0, teremos estabelecido que x = y E, que e
o que queremos. Para isso, notemos que
hx, zi = hy, zi + kzk2 .
Como hy, zi = 0 (pois y E e z (E) ), segue que kzk2 = hx, zi. Queremos agora provar que esse
produto escalar e nulo, o que implica z = 0.

Como E E segue pelo Lema 25.1, pagina 1093, que E E . Logo z E . Como x (E ) ,
segue imediatamente que x e z sao perpendiculares, completando a prova.

25.2.1

Bases Ortonormais Completas em Espa


cos de Hilbert

Conjuntos ortonormais
Um conjunto E de vetores de um espaco de Hilbert e dito ser um conjunto ortonormal se a norma
de todos os seus elementos for igual a 1 e se vetores distintos de E forem ortogonais entre si, ou seja,
kuk = 1, u E e hu, vi = 0, u, v E com u 6= v.
Vamos a alguns exemplos. No espaco de Hilbert L2 ([0, 2], dx) o conjunto


1 inx
en (x) = e , n
2

(25.6)

e um conjunto ortonormal de vetores. No espaco de Hilbert `2 das seq


uencias de quadrado integravel
(vide Secao 16.4.1, pagina 852), as seq
uencias enm = n, m formam um conjunto ortonormal de vetores.
Podemos representa-las como

en = 0, . . . , 0, 1, 0, . . . ,
| {z }
n1

n 1.

No espaco de Hilbert L2 ([1, 1], dx) um conjunto ortonormal e formado pelos polinomios de Legendre
(normalizados)
(
)
r
2n + 1
en (x) =
Pn (x), n
,
2


pois, como e bem sabido, valem para os polinomios de Legendre3 Pn (x), definidos por
[n/2]
X (1)k (2n 2k)!
1 dn 2
n
Pn (x) = n
(x

1)
=
xn2k
n k!(n k)!(n 2k)!
2 n! dxn
2
k=0

as relacoes

Pn (x)Pm (x) dx =
1

Adrien-Marie Legendre (1752-1833).

2
n, m .
2n + 1

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1096/1304

No espaco de Hilbert L2 ( , dx), de particular importancia para a Mecanica Quantica, ha varios


conjuntos ortonormais bem-conhecidos, como por exemplo
(
)
1
x2 /2
, n
en (x) = p
,
Hn (x) e
m
2 m!


onde Hn sao os polinomios de Hermite4

Hn (x) = (1)n ex
os quais satisfazem

dn x2
e ,
dxn

2
Hm (x) Hn (x) ex dx = 2m m! m n .

O espa
co das fun
co
es almost-peri
odicas. Uma digress
ao
Ha espacos de Hilbert onde, em contraste com os exemplos de acima, existem conjuntos ortonormais nao-contaveis de vetores. Um exemplo importante e o espaco AP ( ), das funcoes ditas almostperiodicas em . Sem entrarmos em detalhes (para um tratamento completo, vide e.g. [71] e [24]), sao
denominadas almost-periodicas as funcoes f : que podem ser escritas como limites uniformes
de series trigonometricas como
X
f (t) =
fn ein t , t ,
(25.7)


onde fn sao constantes e {n , n } e um sub-conjunto contavel arbitrario de . As constantes n


sao denominadas freq
uencias de f e as constantes fn sao denominadas amplitudes. Um caso particular
importante e aquele no qual as freq
uencias n sao da forma n = n, para algum > 0, denominado
freq
uencia fundamental. Como o estudante facilmente reconhece, funcoes como
X
f (t) =
fn eint , t


sao periodicas de perodo 2/. Se a serie do lado direito converge uniformemente, f e contnua
(certo?). Assim, AP ( ) contem as funcoes contnuas e periodicas. O conjunto AP ( ) contem tambem
funcoes nao-periodicas. Por exemplo, funcoes como


f (t) = 2 cos(1 t) + 2 cos(2 t) = ei1 t + ei1 t + ei2 t + ei2 t ,

1 > 0 e 2 > 0 ,

(25.8)

sao elementos de AP ( ), mas sao periodicas se e somente se a razao 2 /1 for um n


umero racional.
Se 2 /1 for racional da forma 2 /1 = p/q com p e q inteiros e primos entre si, entao a f dada acima
e periodica de perodo T = 2p/2 = 2q/1 .


E. 25.1 Exerccio. Justifique todas as afirmacoes acima. Em particular, prove que a funcao f de (25.8)
nao e periodica se 2 /1 for irracional.
6
4

Charles Hermite (1822-1901).

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1097/1304

Um exemplo de uma funcao de AP ( ) que nao e periodica e

f (t) = 2 cos( 2t) + 2 cos(t) = ei 2t + ei 2t + eit + eit ,

que nao e periodica, pois 2 6 .




Funcoes como a f de (25.8) nao sao periodicas se 2 /1 for irracional. Como, porem, todo n
umero
irracional pode ser aproximado por seq
uencias de n
umeros racionais, uma tal f possui perodos aproximados (mas nao exatos!). Essa e a origem da denominacao de tais funcoes como almost-periodicas 5 .

Foi demonstrado por H. Bohr (vide nota historica, abaixo) que o conjunto AP ( ) gera um espaco
de Hilbert com produto escalar dado por
Z T
1
hf, giAP := lim
f (x)g(x) dx .
(25.9)
T 2T T


um exerccio facil mostrar que o conjunto de funcoes


E


AP ( )
e (x) = eix ,


(25.10)

e um conjunto ortonormal em relacao ao produto escalar (25.9). Trata-se, claramente, de um conjunto


nao-contavel.
E. 25.2 Exerccio. Mostre que he , e iAP = 1 para todo
, com =
6 .


e que he , e iAP = 0 para todos


6

*
Nota hist
orica. A teoria das funcoes almost-periodicas reais foi originalmente desenvolvida por H.
6
Bohr , irmao de N. Bohr7 , em varios trabalhos publicados entre 1924 e 1926. H. Bohr, porem, menciona
dois predecessores: Bohl8 , em tese publicada em 1893, e Esclangon9 , em tese de 1904, os quais obtiveram
resultados semelhantes sobre as funcoes ditas quase-periodicas, um caso especial das funcoes almostperiodicas estudadas por H. Bohr. Os trabalhos de H. Bohr podem ser encontradas na edicao em
tres volumes [13] de suas obras completas. Bohr nao conhecia previamente os trabalhos anteriores
de Bohl e Esclangon sobre as funcoes quase-periodicas e menciona ter sido chamado a` atencao sobre
existencia dos mesmos por Hadamard10 . H. Bohr distinguiu-se tambem pelo desenvolvimento da teoria
das funcoes almost-periodicas de uma variavel complexa. O conceito foi posteriormente generalizado
por von Neumann11 para funcoes definidas em grupos. Para definicoes e alguns resultados nesse caso
geral, vide [138].
O Teorema de Pit
agoras
5

Em Portugues seria mais adequado dizer quase-peri


odicas. Porem, essa nomenclatura e usada em v
arias lnguas
para designar um certo sub-conjunto de funco
es de AP ( ). Por isso optamos pelo barbarismo almost-peri
odicas.
6
Harald August Bohr (1887-1951).
7
Niels Henrik David Bohr (1885-1962).
8
Piers Bohl (1865-1921).
9
Ernest B. Esclangon (1876-1954).
10
Jacques Salomon Hadamard (1865-1963).
11
John von Neumann (1903-1957).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1098/1304

Proposi
c
ao 25.3 Seja E = {e1 , . . . , en } um conjunto ortonormal finito de um espaco de Hilbert H
e sejam 1 , . . . , n n
umeros complexos. Ent
ao,
2

n
n

X
X


|a |2 .
a e a =



a=1

a=1

Prova.

n
2
* n
+
n
n
n X
n
X

X
X
X
X


a e a =
a b hea , eb i =
|a |2 ,
a e a ,
b e b =

a=1

a=1
a=1
a=1
b=1

b=1

pois hea , eb i = a, b .

A proposicao acima e denominada Teorema de Pit


agoras12 por ser uma obvia generalizacao do bem
conhecido teorema da geometria plana.
Conjuntos ortonormais e s
eries convergentes
Exploraremos aqui uma conseq
uencia do Teorema de Pitagoras da qual faremos uso adiante. Tratase de uma condicao necessaria e suficiente para que certas seq
uencias formadas por combinacoes lineares
de elementos de um conjunto ortonormal contavel de um espaco de Hilbert H sejam convergentes,
seq
uencias estas muito comummente encontradas na Mecanica Quantica e outras aplicacoes da teoria
dos espacos de Hilbert.
Proposi
c
ao 25.4 Seja H um espaco de Hilbert e {en , n
H. Ent
ao, uma seq
uencia de vetores
sn =

n
X
a=1

converge em H se e somente se

X
a=1

a e a ,

} um conjunto ortonormal cont


avel em


n


|a |2 < .
2

Prova. Se sn converge e uma seq


uencia de Cauchy. Isso significa que para todo  > 0 existe N () tal
que para todo m e n maiores que N () tem-se ksm sn k . Vamos supor sem perda de generalidade
que m < n. Pelo Teorema de Pitagoras
2

n
n

X
X


|a |2 = |lm ln |,
(25.11)
a e a =
ksm sn k2 =


a=m+1

12

Pit
agoras de Samos (ci. 569 A.C. - ci. 475 A.C.).

a=m+1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

onde
ln =

n
X
a=1

Captulo 25

1099/1304

|a |2 .

Conclumos que |lm ln | 2 para todo m e n maiores que N (), ou seja, ln e uma seq
uencia de Cauchy
de n
umeros reais e que, portanto, converge. Assim,

X
a=1

|a |2 < .

P
2
Vamos mostrar a recproca. Se
ao ln e limitada superiormente e, por ser uma
a=1 |a | < , ent
seq
uencia monotonamente crescente, converge (por que?). Assim, ln e uma seq
uencia de Cauchy. A
mesma identidade (25.11) nos diz, entao, que sn e uma seq
uencia de Cauchy em H e, portanto, converge
a um vetor de H.
Sub-espa
cos gerados por conjuntos ortonormais finitos
elementar
Seja E = {e1 , . . . , en } um conjunto ortonormal finito de um espaco de Hilbert H. E
verificar que o conjunto E de todos os vetores de H que sejam da forma
n
X

a e a

a=1

para a complexos e um subespaco de H, denominado subespaco gerado por E.


Proposi
c
ao 25.5 Se E e um subespaco gerado por um conjunto ortonormal finito, ent
ao E e um
conjunto fechado.
2
Prova. Seja {xi }i uma seq
uencia de elementos de E que converge a x H. Cada xi e da forma


n
X

x =

ia ea .

a=1

Vamos provar que para cada a a seq


uencia {ia }i e uma seq
uencia de Cauchy de n
umeros complexos.
i
Se {x }i e convergente, entao e uma seq
uencia de Cauchy. Logo, para todo  > 0 existe N () tal que
kxi xj k  para todos i, j N (). Assim, para i, j N ()

2
n
n
X

X


2
i
j 2
i
j
 kx x k = (a a )ea =
|ia ja |2 .




a=1

a=1

uencia de
Mas isso diz que para i, j N () tem-se para cada a |ia ja | , ou seja, {ia }i e uma seq
Cauchy de n
umeros complexos. Assim, cada uma dessas seq
uencias converge a um n
umero complexo
a . Seja
n
X
0
x =
a e a .


a=1

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1100/1304

Claramente x0 e um elemento de E. Vamos mostrar que, na verdade, x0 = x. Para tal basta mostrar
que xi converge a x0 e lembrar a unicidade de pontos limite em espacos metricos, como um espaco de
Hilbert (vide Corolario 21.1, pagina 981). Mostrar que xi converge a x0 e trivial, pois
2

n
n

X
X


i
i
0 2
|ia a |2
kx x k = (a a )ea =


a=1

a=1

e como ia a o lado direito fica arbitrariamente pequeno quando i . Logo xi x0 e, portanto,


x0 = x.
A desigualdade de Bessel
Vamos estudar algumas propriedades de conjuntos ortonormais finitos ou contaveis, a mais importante sendo a desigualdade de Bessel, a qual chegaremos adiante.
Proposi
c
ao 25.6 Seja E = {e1 , . . . , en } um conjunto ortonormal finito de um espaco de Hilbert H
e sejam 1 , . . . , n n
umeros complexos. Ent
ao, para todo x H vale que
2

n
n
n


X
X
X


2
2
|a hea , xi|
|hea , xi|2 .
(25.12)
a ea = kxk +
x


a=1

a=1

a=1

Prova.
2

*
+
n
n
n


X
X
X


x
a e a , x
b e b
a e a =
x


a=1

a=1

b=1

= kxk2
= kxk2 +

n 
X

a hea , xi a hea , xi + |a |2

= kxk2 +

n 
X

n
 X
|hea , xi|2 a hea , xi a hea , xi + |a |2
|hea , xi|2

= kxk +
2

= kxk +

b=1

b hx, eb i

a=1

a=1

n
X
a=1

n
X
a=1

n
X


2
n
X



a hea , xi +
a e a

n
X

a=1

a=1

a=1

(a hea , xi) (a hea , xi)


2

|a hea , xi|

n
X
a=1

n
X
a=1

|hea , xi|2 .

|hea , xi|2
(25.13)

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1101/1304

Ja vimos acima (pagina 1099) que o subespaco E gerado por um conjunto ortonormal finito E =
{e1 , . . . , en } e fechado. Vale, portanto, o teorema do melhor aproximante: para todo x H existe
um y E tal que a distancia kx yk e a mnima possvel. Se y 0 E, y 0 e da forma
0

y =

n
X

a e a .

a=1

Logo,
kx y 0 k2 = kxk2 +

n
X
a=1

|a hea , xi|2

n
X
a=1

|hea , xi|2 .

evidente que o lado direito assume seu valor mnimo quando a = hea , xi para todo a entre 1 e n,
E
ou seja,
n
X
hea , xiea ,
(25.14)
y =
a=1

0 2

D = inf
kx y k = kx yk = kxk
0
y E

n
X
a=1

|hea , xi|2 .

(25.15)

Retornando a` relacao (25.15), notemos que a mesma afirma que


2

kxk

n
X
a=1

|hea , xi|2 0,

ou seja, para todo x H e para todo conjunto ortonormal finito E = {e1 , . . . , en } vale
n
X
a=1

Se E = {en , n


|hea , xi|2 kxk2 .

(25.16)

} e um conjunto ortonormal contavel, segue que tambem vale

X
a=1

E. 25.3 Exerccio. Justifique!

|hea , xi|2 kxk2 .

(25.17)

Estas duas u
ltimas desigualdades sao conhecidas como desigualdades de Bessel. Como veremos em
breve, as mesmas desempenham um papel importante.
Bases ortonormais completas
Chegamos agora ao importante conceito de Base Ortonormal Completa de um espaco de Hilbert.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1102/1304

Defini
c
ao. Um conjunto ortonormal B de vetores em um espaco de Hilbert H e dito ser um conjunto
ortonormal completo ou uma base ortonormal completa se o u
nico vetor de H que e ortogonal a todos
os vetores de B for o vetor nulo.
Notemos que B da definicao acima nao precisa ser necessariamente um conjunto finito ou contavel.
De fato, como veremos, ha espacos de Hilbert que so admitem bases ortonormais completas naocontaveis.
Bases ortonormais completas desempenham um papel de grande importancia em espacos de Hilbert
e suas aplicacoes. Vamos estuda-las aqui. Primeiramente demonstremos que as mesmas sempre existem.
Teorema 25.3 Todo espaco de Hilbert possui pelo menos uma base ortonormal completa.

Prova. A demonstracao faz uso do Lema de Zorn, pagina 36. Seja E a colecao de todos os conjuntos
ortonormais de um espaco de Hilbert H. Podemos introduzir em E uma ordem parcial, denotada por
, dizendo que E1  E2 se E1 E2 , para dois conjuntos ortonormais E1 e E2 .
Seja {E , } um conjunto linearmente ordenado em E pela relacao de ordem acima. Isso
significa que ou E E ou E E para quaisquer , .

Esse conjunto {E , } possui um majorante em E, a saber, o conjunto ortogonal obtido


tomando-se a uniao de todos os E :
[
E .

E. 25.4 Exerccio. Por que razao

E e tambem um conjunto ortonormal?

Assim, conclumos que em E, com a relacao de ordem dada acima, vale sempre que qualquer conjunto
linearmente ordenado possui um majorante em E. Ora, essas sao precisamente as hipoteses do Lema de
Zorn e, assim, conclumos que existe um elemento maximal B em E, ou seja, um conjunto ortonormal
que nao esta contido propriamente em nenhum outro conjunto ortonormal.
Vamos, entao, mostrar que esse B e uma base ortonormal completa. Para tal vamos supor o oposto,
ou seja, vamos supor que haja y H nao nulo que seja ortogonal a todos os elementos de B, claramente
y nao pode pertencer a B, pois para isso teria que ser ortogonal a si mesmo, ou seja, kyk 2 = hy, yi = 0.
Se um tal y existisse, entao B1 = B {y} seria tambem um conjunto ortonormal (por que?) que contem
B como subconjunto proprio. Ora, isso contraria o fato que B e maximal. Logo tal y nao existe e B e
uma base ortonormal completa.
A importancia das bases ortonormais completas reside no fato que todo vetor de um espaco de
Hilbert pode ser escrito como limite de seq
uencias de vetores obtidos por combinacoes lineares finitas
de elementos de uma base ortonormal completa. Tornaremos isso preciso em breve. Facamos antes
porem a seguinte observacao crucial:
Teorema 25.4 Seja B uma base ortonormal completa de um espaco de Hilbert H. Para cada y H,
o conjunto de todos os e B tais que he , yi 6= 0 e um conjunto cont
avel.
2
Note-se que nao esta excludo que a a base B, no enunciado acima, possa ser nao-contavel.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1103/1304

Prova. Comecemos lembrando que se {e1 , . . . , em } e um subconjunto finito da base B, entao a


desigualdade de Bessel diz que
m
X
(25.18)
|hea , yi|2 kyk2 .
a=1

bastante claro tambem que a base B pode ser escrita como a seguinte uniao disjunta:
E
B = Z y By

(25.19)

com
Z y := {e B| he , yi = 0}

B y := {e B| he , yi 6= 0} .

igualmente claro que podemos escrever B y como


E
B

Bny ,

(25.20)

n=1

onde, para n = 1, 2, . . .,
Bny






kyk2 kyk2
2

= e B |he , yi|
.
,
n+1
n

E. 25.5 Exerccio. Convenca-se que (25.19) e de fato verdade e que aquela uniao e disjunta, assim
como a uniao em (25.20).
6

Desejamos mostrar que B y e um conjunto contavel. A observacao crucial e que cada Bny e um
conjunto finito. De fato, podemos facilmente mostrar que cada Bny tem no maximo n elementos.
Mostramos isso por contradicao com a desigualdade de Bessel (25.18). Vamos supor que houvesse em
Bny mais que n elementos e tomemos em Bny um conjunto {e1 , . . . , en+1 } com n + 1 elementos. Como
todos sao elementos de Bny , tem-se que
|hea , yi|2 >

kyk2
n+1

para todo a = 1, . . . , n + 1. Logo


n+1
X
a=1

|hea , yi|2 > (n + 1)

kyk2
= kyk2 ,
n+1

contrariando a desigualdade de Bessel (25.18). Assim, cada Bny pode ter no maximo n elementos.
S
y
Isso nos diz que B y =
e um conjunto contavel (eventualmente ate finito), completando a
n=1 Bn
demonstracao.
A decomposi
c
ao de vetores em bases ortogonais completas
Chegamos agora ao resultado mais importante sobre bases ortogonais completas e que e a verdadeira
razao de ser de sua definicao.

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1104/1304

Teorema 25.5 Seja y um vetor de um espaco de Hilbert H e B uma base ortonormal completa em
H. Como vimos acima, o subconjunto de B definido por B y = {e B| he , yi 6= 0} e um conjunto
cont
avel. Vamos escrever os elementos de B y como ea com a . Ent
ao, vale que


y = lim

e que
2

kyk =

n
X
a=1

X
a=1

hea , yi ea

(25.21)

|hea , yi|2 .

(25.22)
2

A expressao (25.22) pode ser interpretada como uma generalizacao to Teorema de Pitagoras para
dimensao infinita.
Prova do Teorema 25.5. Pela desigualdade de Bessel sabemos que

X
a=1

|hea , yi|2 kyk2 .

Pela Proposicao 25.4, pagina 1098, isso nos diz que a seq
uencia de vetores s n =

a=1

em H a um vetor que chamaremos de y 0 :


0

y = lim

n
X
a=1

n
X

hea , yi ea =

X
a=1

hea , yi ea converge

hea , yi ea .

Queremos provar que y 0 = y. Para tal, tomemos um elemento arbitrario e em B e calculemos o


produto escalar he , y y 0 i. Ha dois casos a considerar: 1) e B y e, portanto, = k para algum
k e 2) e 6 B y e, portanto, he , yi = 0 e 6= k para todo k .


No caso 1) temos

he , y 0 i =
=

e , lim

lim

e ,

n
X

hea , yi ea

n
X

hea , yi ea

a=1

a=1

= hek , yi
= he , yi.
Logo,
he , y y 0 i = he , yi he , y 0 i = he , yi he , yi = 0.

(25.23)

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1105/1304

No caso 2) temos
*

he , y 0 i =

e , lim

lim

n
X
a=1

n
X
a=1

hea , yi ea

hea , yi he , ea i

= 0,

(25.24)

pois 6= k para todo k e, portanto, he , ea i = 0. Logo,


he , y y 0 i = he , yi he , y 0 i = 0 0 = 0.
Em ambos os casos o resultado e zero, ou seja, he , y y 0 i = 0 para todo e B. Pela definicao de
B como base ortonormal completa, o u
nico vetor ortogonal a todos os elementos de B e o vetor nulo.
0
Logo y = y .
n
X
Por (25.14), o vetor mais proximo de y no subespaco gerado por {e1 , . . . , en } e
hea , yiea .
a=1

Segue de (25.15) que


2
n
n


X
X


2
hea , yiea , = kyk
|hea , yi|2 .
y


a=1
a=1

Tomando-se o limite n o lado esquerdo vai a zero como vimos e, portanto, conclumos que
2

kyk =

X
a=1

|hea , yi|2 .

importante chamar a` atencao do estudante o fato que na expressao


E
y =

X
a=1

hea , yi ea

a soma e realizada em elementos de B y que, para cada y, e um conjunto contavel. Mas B y depende
de y e assim, para ys diferentes comparecem conjuntos diferentes de vetores e B na soma. Isso e
importante no caso de a base B ser nao-contavel. Se B for contavel podemos fazer a soma sobre todos
os elementos de B pois os elementos de Z y nao contribuem.
Apesar de termos demonstrado que todo espaco de Hilbert possui uma base ortonormal completa,
demonstrar que um conjunto ortonormal B dado concretamente e uma base ortonormal completa pode
ser um problema envolvente que requer um trabalho cuidadoso de analise. Tal e o caso, por exemplo,
bem sabido, e facil de se verificar,
do conjunto ortonormal (25.6) do espaco de Hilbert L2 ([0, 2]). E
inx
e
, n } e um conjunto ortonormal. Demonstrar
que o conjunto (contavel) de vetores {en (x) =
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1106/1304

que e completo, porem, envolve mais trabalho e requer uso do teorema do qual trataremos no proximo
topico abaixo, que discute caracterizacoes alternativas do conceito de base ortonormal completa.
Bases ortonormais completas e bases topol
ogicas
Em um espaco vetorial V a varredura linear (linear span) de um conjunto nao-vazio A V e a
colecao, denotada por span (A), de todos os vetores de V que podem ser escrito como uma combinacao
linear finita de elementos de A:
span (A) = {v V | v = 1 a1 + + n an , para algum n


, para i

e ai A}.

elementar constar que para A nao-vazio span (A) e um subespaco de V .


E
Em um espaco vetorial topologico V um conjunto B e dito ser uma base topol
ogica se seus elementos
forem linearmente independentes e se span (B) for um conjunto denso em V , ou seja, se seu fecho for
V : span (B) = V .
O teorema que demonstraremos a seguir mostra que, em um espaco de Hilbert, um conjunto B e
uma base ortonormal completa se e somente se for uma base topologica.
Teorema 25.6 Se B = {e , } e um conjunto ortonormal em um espaco de Hilbert H, ent
ao
s
ao equivalentes as seguintes afirmativas:
1. B e uma base ortonormal completa de H.
2. B e uma base topol
ogica de H, ou seja, span (B) = H.
3. Para todo y H a conjunto B y = {e B| he , yi 6= 0} e cont
avel e vale
X
kyk2 =
|he , yi|2 .
e B y

2
Prova. Que 1 implica 2 e que 1 implica 3 ja foi demonstrado acima (Teorema 25.5, pagina 1104).
Vamos mostrar que 3 implica 1.
A demonstracao e feita supondo que 3 vale e que 1 nao vale e mostrando que isso leva a um absurdo.
Se B nao e uma base ortonormal completa, entao existe um vetor x H nao-nulo que e ortogonal a
todo elemento de B, ou seja, he , xi = 0 para todo e B. Por 3, isso implica que
X
kxk2 =
|he , xi|2 = 0,
e B x

uma contradicao.
Por fim, mostremos que 2 implica 1.
A demonstracao e feita supondo que 2 vale e que 1 nao vale e mostrando que isso leva a um absurdo.
Se B nao e uma base ortonormal completa, entao existe um vetor x H nao-nulo que e ortogonal a

JCABarata. Curso de Fsica-Matem


atica

Captulo 25

Vers
ao de 29 de setembro de 2005.

1107/1304

todo elemento de B, ou seja, he , xi = 0 para todo e B. Entao, o conjunto {x} e um subespaco


linear fechado que contem B e span (B) (por que?). Como span (B) e, por definicao, o menor fechado
que contem span (B), vale tambem que span (B) {x} . Como {x} e um subconjunto proprio de H
(pois nao contem x nem o subespaco gerado por x), conclumos que span (B) e um subconjunto proprio
de H, uma contradicao com a hipotese que 2 e verdadeiro.
Espa
cos de Hilbert separ
aveis
Recordemos duas nocoes introduzidas a` pagina 926.
Seja um espaco X dotado de uma topologia . Dizemos que um conjunto A X e denso em X se
o fecho de A for igual a X, ou seja, se nao houver outro conjunto fechado que nao X contendo A. Um
espaco topologico X e dito ser separ
avel se possuir um subconjunto denso contavel.
Definimos acima a nocao de varredura linear de um conjunto A H, que denotamos por span (A).
Um conceito associado e o de varredura linear por racionais de um conjunto A H, que denotamos
por span (A): a colecao, de todos os vetores de H que podem ser escrito como uma combinacao linear
finita por racionais de elementos de A:
span (A) = {v V | v = r1 a1 + + rn an , para algum n

, para ri

e ai A},

onde
denota o conjunto de todos os n
umeros complexos racionais, ou seja, de todos os n
umeros
complexos cujas partes real e imaginaria sao racionais.
Como
e denso em , e claro que todo elemento de span (A) pode ser aproximado (na topologia
de H) por elementos de span (A). De fato, se {(rj )m , m } e uma seq
uencia de n
umeros em
que aproxima j , entao (r1 )m a1 + + (rn )m an aproxima 1 a1 + + n an na norma de H, pois


k((r1 )m a1 + + (rn )m an ) (1 a1 + + n an )k = k((r1 )m 1 )a1 + + ((rn )m n )an k


|(r1 )m 1 | ka1 k + + |(rn )m n | kan k .
que converge a zero para m . Isso significa que para todo A H vale span (A) span (A) e,
conseq
uentemente, span (A) span (A). No entanto, como span (A) span (A), vale tambem que
span (A) span (A). Logo, span (A) = span (A).
Assim, pelo Teorema 25.6, conclumos que B H e uma base ortonormal completa se e somente
se span (B) = H.

Se A H for contavel, e muito facil ver que span (A) e tambem contavel (por ser uma uniao
contavel de conjuntos contaveis). Logo, se B for uma base ortonormal completa contavel, o conjunto
span (B) e um conjunto contavel denso em H. Conclumos disso que H sera um espaco topologico
separavel se possuir uma base ortonormal completa contavel.
A recproca e tambem verdadeira: se um espaco de Hilbert H for um espaco topologico separavel,
entao toda base ortonormal completa de H e contavel. Para ver isso, vamos supor que H seja separavel
e seja D H contavel e denso em H: D = H. Seja tambem B uma base ortonormal completa em H.
Notemos que
[
BD :=
Bx
xD

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1108/1304

e contavel, por ser uma uniao contavel de conjuntos contaveis (pois D e contavel, assim como cada
B x , pelo Teorema 25.4, pagina 1102.). Pelo Teorema 25.5, pagina 1104, cada x D e um elemento
de span (B x ). Conclumos disso que D span (BD ). Logo, como D e denso em H, segue que H =
span (BD ). Agora, BD e um conjunto ortonormal (por ser subconjunto de B). Logo, conclumos pelo
Teorema 25.6 que BD e uma base ortonormal completa.
Disso conclumos tambem que B = BD , pois se BD fosse um sub-conjunto proprio de B haveria
v B, v 6= 0, que nao pertence a BD . Como B e um conjunto ortonormal, segue que v e ortogonal
a todos os elementos de BD . Isso contraria o fato provado que BD e uma base ortonormal completa.
Vimos entao que toda base ortonormal completa de um espaco de Hilbert separavel deve ser contavel.
Resumimos nossas conclusoes no seguinte:
Proposi
c
ao 25.7 Se um espaco de Hilbert H possui uma base ortonormal completa cont
avel ent
ao
e um espaco topol
ogico separ
avel (ou seja, possui um sub-conjunto cont
avel denso). Por outro lado,
se um um espaco de Hilbert H for separ
avel, ent
ao todas as suas bases ortonormais completas s
ao
cont
aveis.
2
O seguinte corolario e evidente:
Corol
ario 25.1 Se um espaco de Hilbert H possui uma base ortonormal completa cont
avel ent
ao todas
as demais bases ortonormais completas de H s
ao cont
aveis
2
Nesse contexto, a seguinte observacao e relevante:
Proposi
c
ao 25.8 Se um espaco de Hilbert H possui uma conjunto ortonormal n
ao-cont
avel ent
ao H
n
ao e separ
avel.
2
Prova. Seja C um conjunto ortonormal nao-contavel de H. Se C for uma base ortonormal completa
nao ha o que provar. Se nao o for, podemos acrescentar elementos a C pertencentes a C de modo a
obter uma base ortonormal completa. Essa base nao pode ser contavel, pois contem C.
Os espacos de Hilbert L2 ([a, b], dx), assim como L2 ( , dx), sao separaveis. O espaco de Hilbert AP ( ) das funcoes almost-periodicas e nao-separavel, pois possui um conjunto ortonormal naocontavel, a saber, aquele de (25.10).


Finalizamos mencionando que no caso de espacos de Hilbert separaveis podemos refrasear o Teorema
25.5, acima, da seguinte forma:
Teorema 25.7 Seja y um vetor de um espaco de Hilbert separ
avel H e B uma base ortonormal completa (e, portanto, cont
avel) em H. Vamos escrever os elementos de B como e a com a . Ent
ao,
vale que
n
X
y = lim
hea , yi ea
(25.25)


e que

kyk =

a=1

X
a=1

|hea , yi|2 .

(25.26)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1109/1304

2
Au
nica diferenca em relacao ao Teorema 25.5 e que agora as somas acima nao precisam mais ser
restritas apenas aos elementos de B y , mas sao feitas sobre todos os elementos de B, independente do
vetor y H considerado. Eventualmente alguns termos dessas somas serao nulos (tal e o caso se para
um dado a tivermos ea Z y , ou seja, hea , yi = 0), mas isso nao alterara o resultado.

25.3

Funcionais Lineares e o Dual Topol


ogico de um Espa
co
de Hilbert

Funcionais lineares
Um funcional linear l definido em um espaco de Hilbert H e uma funcao cujo domnio e um subespaco
vetorial E de H assumindo valores complexos, l : E , e de tal forma que para todo x, y E e todo
, tem-se
l(x + y) = l(x) + l(y).
Funcionais lineares contnuos
De grande importancia sao os funcionais lineares contnuos definidos em H. Estes sao funcionais
lineares com domnio igual a H e tais que se {xi }i e uma seq
uencia de vetores que converge a x H,
entao vale


lim l(xn ) = l lim xn = l(x).


Se l e l0 sao funcionais lineares sobre H definimos para , um funcional linear l + l 0 como


elementar mostrar que
sendo o funcional linear que a cada x H associa o n
umero l(x) + l 0 (x). E
0
o funcional l + l e tambem contnuo. O conjunto de todos os funcionais lineares contnuos de um
espaco e Hilbert H e tambem, portanto, um espaco vetorial que denotaremos por H . O espaco H e
denominado o dual topol
ogico de H.
Funcionais lineares limitados
Um funcional linear l sobre um espaco de Hilbert H e dito ser limitado se existir uma constante
M 0 tal que para todo x H vale
|l(x)| M kxk.

A seguinte proposicao mostra que os conceitos de funcional linear contnuo e de funcional linear
limitado sao identicos.
Proposi
c
ao 25.9 Em um espaco de Hilbert H um funcional linear e contnuo se e somente se for um
funcional linear limitado.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1110/1304

Prova. Se l e um funcional linear limitado e se {xj }j e uma seq


uencia de vetores que converge a
x H, entao
|l(x) l(xj )| = |l(x xj )| M kx xj k


e o lado direito vai a zero quando j , provando que l e contnuo.

Suponhamos reciprocamente que l e um funcional linear contnuo. Entao, para um  > 0 fixo existe
> 0 tal que |l(v)|  para todo vetor v com kvk . Seja u um vetor nao-nulo qualquer de H.
Entao,
u
v =
kuk

e tal que kvk = . Logo, como l e linear, vale que









u



kuk l(u) = l kuk .
Assim,


kuk,

provando que l e limitado (podemos adotar M = /).


|l(u)|

Mencionamos que a Proposicao 25.9 pode ser generalizada: uma aplicacao linear entre dois espacos
normados e contnua se e somente se for limitada (Proposicao 26.1, pagina 1116).

25.3.1

O Teorema da Representa
c
ao de Riesz

Um exemplo de funcional linear contnuo e o seguinte. Seja H um vetor fixado. Defina-se entao,
l(x) = h, xi,

x H.

evidente que esse l e um funcional linear. Esse l e tambem contnuo, pela continuidade do produto
E
escalar (vide pagina 1090).
Esse exemplo nao foi colocado aqui apenas como ilustracao, pois demonstraremos agora que o todo
funcional linear contnuo e da forma l(x) = h, xi para algum de H. Esse resultado, conhecido
como Teorema da Representaca
o de Riesz13 , ou simplesmente como Lema de Riesz, e um dos resultados fundamentais da teoria dos espacos de Hilbert e do mesmo muitas conseq
uencias serao extradas,
especialmente na teoria de operadores lineares em espacos de Hilbert. Vamos a seu enunciado e demonstracao.
Teorema 25.8 (Teorema da Representa
c
ao de Riesz) Seja l um funcional linear contnuo em
um espaco de Hilbert H. Ent
ao, existe H, u
nico, tal que
l(x) = h, xi,

x H.
2

13

Frigyes Riesz (1880-1956).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1111/1304

Prova. Seja l um funcional linear contnuo em um espaco de Hilbert H. Seja N H o n


ucleo de l, ou
seja, o conjunto de todos os vetores de H que sao anulados por l:
N = {y H| l(y) = 0} .
Vamos mostrar que N e um subespaco linear fechado de H. Que N e um subespaco e elementar pois,
se x, y N , entao l(x + y) = l(x) + l(y) = 0 + 0 = 0. Que N e fechado pode ser visto pelo
fato que podemos caracterizar N como a imagem inversa do n
umero 0 de por l: N = l 1 ({0}). O
conjunto {0}, constitudo por um u
nico ponto, e fechado em e funcoes contnuas sao tais que sua
imagem inversa mapeia fechados em fechados. Logo N e fechado.
E. 25.6 Exerccio. Mostre tambem que N e fechado, demonstrando que se x i e uma sequencia de
elementos de N que converge a x H entao, pela continuidade, segue que l(x) = 0, provando que x N .
6
Caso N seja identico a H, isso significa que l(x) = 0 para todo x H e o teorema estaria provado,
adotando-se para tal = 0.
Vamos supor que N 6= H. Como N e fechado, pelo Teorema da Decomposicao Ortogonal todo
x H e da forma x = y + z com y N e z N . Como N 6= H, devem existir elementos nao nulos
em N , doutra forma teramos x = y N para todo x H.14
obvio que l(z0 ) 6= 0.
Seja, entao, z0 um vetor nao-nulo de N . E
Para qualquer vetor u H vale que l(z0 )u l(u)z0 e um elemento de N , pois
l (l(z0 )u l(u)z0 ) = l(z0 )l(u) l(u)l(z0 ) = 0.
Assim, como l(z0 )u l(u)z0 e um elemento de N e z0 e um elemento de N , ambos sao ortogonais
entre si, ou seja,
0 = hz0 , l(z0 )u l(u)z0 i.
Isso diz, porem, que
0 = l(z0 )hz0 , ui l(u)kz0 k2 ,
ou seja,
l(z0 )
l(u) =
hz0 , ui =
kz0 k2

+
l(z0 )
z0 , u .
kz0 k2

Definindo
=
fica provado que para todo u H

l(z0 )
z0 ,
kz0 k2

l(u) = h, ui,

como queramos.
14

Nota. Fazemos notar ao estudante que e somente neste par


agrafo, interessantemente, que a condica
o de continuidade
de l e usada, a saber, atraves da afirmativa que N e fechado e que, portanto, N e formado por algo alem do vetor
nulo (caso l n
ao seja identicamente zero). Note-se tambem o uso importante que foi feito do Teorema da Decomposica
o
Ortogonal na demonstraca
o.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 25

1112/1304

Por fim, para demonstrar que tal e u


nico, suponhamos que exista um outro 0 tal que tambem
0
valha l(u) = h , ui, para todo u H. Teramos, entao, h, ui = h0 , ui, ou seja, h 0 , ui = 0
para todo u H. Como essa relacao vale para todo u H, vale tambem para u = 0 . Logo
0 = h 0 , 0 i = k 0 k2 e, portanto, = 0 .
Incidentalmente, o Lema de Riesz diz-nos que, fora o caso em que l e identicamente nulo, tem-se
sempre que N e um subespaco unidimensional de H, a saber, o subespaco gerado pelo vetor .

Captulo 26
Operadores Lineares Limitados em Espacos de
Banach e de Hilbert
Conte
udo
26.1 Operadores Lineares em Espa
cos Vetoriais Normados . . . . . . . . . . . 1115
26.1.1 Espacos de Banach de Operadores . . . . . . . . . . . . . . . . . . . . . . . . 1119
26.1.2 O Dual Topologico de um Espaco de Banach . . . . . . . . . . . . . . . . . . 1123
26.1.3 O Teorema de Hahn-Banach e Algumas Conseq
uencias do Mesmo . . . . . . 1127
26.1.4 O Teorema de Banach-Steinhaus ou Princpio de Limitacao Uniforme . . . . 1133
26.1.5 O Teorema da Aplicacao Aberta e o Teorema do Grafico Fechado . . . . . . . 1134
26.2 Operadores Limitados em Espa
cos de Hilbert . . . . . . . . . . . . . . . . 1142
26.2.1 O Adjunto de um Operador em um Espaco de Hilbert . . . . . . . . . . . . . 1144

26.3 Algebras
de Banach e Algebras
C . . . . . . . . . . . . . . . . . . . . . . . 1152

26.3.1 Algebras
de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1152
26.3.2 A Inversa de Operadores Limitados . . . . . . . . . . . . . .

26.3.3 O Espectro de Operadores em Algebras


de Banach . . . . .

26.3.4 O Homomorfismo de Gelfand em Algebras


C . . . . . . . .

26.3.5 Razes Quadradas de Operadores em Algebras


de Banach .

. . . . . . . . . . 1155
. . . . . . . . . . 1161
. . . . . . . . . . 1171
. . . . . . . . . . 1174

26.3.6 Elementos Positivos de Algebras


C . . . . . . . . . . . . . . . . . . . . . . . 1175
26.3.7 O Lema da Raiz Quadrada em espacos de Hilbert. A Decomposicao Polar . . 1179

26.4 Um Pouco sobre Estados e Representa


co
es de Algebras
C . . . . . . . . 1183
26.5 O Espectro de Operadores em Espa
cos de Banach

. . . . . . . . . . . . . 1193

26.6 Operadores Compactos em Espa


cos de Banach e de Hilbert . . . . . . . . 1202
26.6.1 O Teorema Espectral para Operadores Compactos Auto-adjuntos . . . . . . . 1215
26.7 O Teorema Espectral para Operadores Limitados Auto-adjuntos em Espa
cos
de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1223
26.7.1 O Calculo Funcional Contnuo e o Homomorfismo de Gelfand . . . . . . . . . 1223
26.7.2 Generalizando o Calculo Funcional Contnuo. As Medidas Espectrais . . . . . 1225
26.7.3 Medidas com Valores em Projecoes Ortogonais . . . . . . . . . . . . . . . . . 1235
26.7.4 Os Projetores Espectrais e o Teorema Espectral . . . . . . . . . . . . . . . . . 1240
26.7.5 A Relevancia do Teorema Espectral para a Fsica Quantica (um pouco de
Fsica, finalmente) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1244
26.A Prova do Teorema 26.18 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1253

1113

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1114/1304

ste captulo tenciona ser uma pequena introducao a` teoria dos operadores lineares limitados
(contnuos) em espacos de Banach e de Hilbert. O assunto e de central importancia em varias
areas da Fsica e da Matematica, desde a Mecanica Quantica e a Teoria Quantica de Campos
ate a Teoria das Equacoes Diferenciais Parciais.
Na Secao 26.1 apresentamos nocoes basicas e demonstramos uma serie de teoremas de importancia
fundamental para toda a teoria de operadores em espacos de Banach e de Hilbert: o Teorema BLT, o
Teorema de Hahn-Banach, o Teorema de Banach-Steinhaus, o Teorema da Aplicacao Aberta, o Teorema
da Aplicacao Inversa e o Teorema do Grafico Fechado. Na Secao 26.2 estudamos a teoria basica de
operadores em espacos de Hilbert. A Secao 26.3 e uma introducao a`s algebras de Banach e a`s algebras
C , com uma certa enfase na teoria espectral dessas algebras. Na Secao 26.4 desenvolvemos um pouco
mais a teoria das algebras C e discutimos sua relacao com algebras de operadores em espacos de
Hilbert. Na Secao 26.5 especializa a teoria espectral para o contexto de operadores limitados agindo
em espacos de Banach e de Hilbert. Na Secao 26.6 desenvolvemos a teoria dos operadores compactos
em espacos de Banach e de Hilbert e obtemos o Teorema Espectral para operadores compactos autoadjuntos em espacos de Hilbert e generalizacoes. A Secao 26.7 e dedicada a` demonstracao do Teorema
Espectral para operadores limitados auto-adjuntos agindo em espacos de Hilbert. A Secao 26.7.5 discute
a relevancia desse teorema para a Fsica Quantica.
Operadores Lineares
Sejam V e W dois espacos vetoriais1 . Um operador linear, ou simplesmente operador2 T entre V e
W e uma funcao cujo domnio e V, Dom (T ) = V, e cuja imagem e um subconjunto de W, Im(T ) W,
tal que, para todo , e todo u, v V tem-se
T (u + v) = T (u) + T (v).
Note-se que isso em particular implica T (0) = 0.
Notaca
o. Na teoria dos operadores lineares em espacos vetoriais e costume denotar-se T (u) simplesmente por T u.
Nomenclatura. Se T : V W e um operador entre espacos vetoriais V e W e comum dizer-se que
T age entre V e W.
Neste captulo iremos nos dedicar ao estudo de propriedades basicas de operadores lineares em
espacos de Hilbert3 . Algumas dessas propriedades podem ser estudadas em um contexto mais geral
como propriedades de operadores lineares em espacos vetoriais normados ou em espacos de Banach 4 ,
sem referencia a propriedades especficas de espacos de Hilbert.
O estudo de funcoes entre espacos vetoriais normados e de grande importancia em matematica e
na fsica, em especial na fsica quantica. O maior papel, porem, e seguramente desempenhado pelas
1

Daqui por diante sempre trataremos de espacos vetoriais sobre o corpo dos complexos.
Como nestas notas s
o falaremos de operadores lineares, vamos freq
uentemente omitir o qualificativo linear e falar
apenas em operadores. Operadores lineares s
ao tambem denominados transformaco
es lineares ou aplicaco
es lineares.
3
David Hilbert (1862-1943).
4
Stefan Banach (1892-1945).
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1115/1304

funcoes lineares entre espacos normados, das quais falaremos agora.

26.1

Operadores Lineares em Espa


cos Vetoriais Normados

Sejam entao V e W dois espacos vetoriais normados, cujas normas serao denotadas por k k V e k kW ,
respectivamente. Por exemplo V e W podem ser dois espacos de Banach ou de Hilbert, mas por ora
nao vamos requerer nada sobre a completeza dos mesmos.
Um dos problemas basicos da teoria dos operadores lineares entre espacos vetoriais normados e
classifica-los de acordo com caractersticas que permitam associar-lhes propriedades comuns. Veremos
varias dessas classificacoes ao longo destas notas, a mais basica, da qual trataremos a seguir, sendo a
continuidade. Outras classificacoes que veremos, em particular no contexto de espacos de Hilbert, sao
a classificacao de operadores em limitados ou nao-limitados, fechados ou nao-fechados, de fechaveis ou
nao-fechaveis, de operadores auto-adjuntos ou nao auto-adjuntos, de operadores compactos ou nao etc.
Os exemplos mais bem conhecidos de operadores sao as matrizes, que sao operadores entre espacos
de dimensao finita como V = n e W = m . Acreditamos que os estudantes destas notas ja tenham
nocoes bem definidas sobre matrizes mas, apesar disso, ou mesmo por isso, vale advertir que iremos
aqui desenvolver a teoria de operadores entre espacos vetoriais normados gerais, mesmo de dimensao
infinitas e, por isso, muito da intuicao que desenvolvemos sobre matrizes nao e mais valida. Por
exemplo, matrizes agindo entre n e m (com as normas usuais) sao sempre operadores contnuos, um
fato nao mais necessariamente verdadeiro para operadores lineares entre espacos vetoriais normados de
dimensao infinita. Tal e a origem de boa parte da dificuldades no estudo de operadores lineares agindo
entre espacos vetoriais normados em geral.
Operadores Contnuos
Se V e W sao dois espacos vetoriais normados ambos sao espacos metricos com a metrica definida por
suas normas e, portanto, sao espacos topologicos metricos. Conseq
uentemente, ao falarmos de funcoes
entre V e W coloca-se a questao da continuidade dessas funcoes como funcoes entre dois espacos
topologicos metricos. Essa questao e de grande relevancia, pois em espacos vetoriais de dimensao
infinita e muito freq
uente o aparecimento de operadores lineares nao-contnuos. De fato, na mecanica
quantica, por exemplo, quase todos os operadores com os quais tipicamente lidamos, como os operadores
de posicao e de momento, nao sao contnuos. O ponto e que, como veremos, operadores nao-contnuos
podem ter propriedades drasticamente diferentes das de operadores contnuos.
Como V e W sao dois espacos metricos, valem as definicoes usuais de continuidade em espacos
metricos. Assim, dizemos que um operador T : V W e contnuo se


T lim xn = lim T xn
n

para qualquer seq


uencia convergente {xn }n em V. Note que, na u
ltima igualdade, o limite do lado
esquerdo refere-se a` topologia de V enquanto que o limite do lado direito refere-se a` topologia de W.


Equivalentemente (vide discussao a` pagina 991) um operador T : V W e contnuo se para todo


 > 0 e todo u V existir 0 (eventualmente dependente de  e de u) tal que kT u T vkW 
sempre que v for tal que ku vkV .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1116/1304

Adiante (vide por exemplo, pagina 1117) veremos exemplos de operadores nao-contnuos. Passemos
primeiro a uma definicao igualmente importante e que se mostrara equivalente a` de continuidade.
Operadores Limitados
De grande importancia e tambem a seguinte definicao. Um operador T : V W e dito ser limitado
se existir uma constante M > 0 tal que para todo u V tem-se
kT ukW M kukV .
Note-se que a constante M acima deve ser a mesma para todo u.
A seguinte proposicao tem importancia fundamental:
Proposi
c
ao 26.1 Um operador linear T agindo entre dois espacos vetoriais normados V e W e limitado se e somente ser for contnuo.
2
Prova. Seja T limitado, ou seja, tal que existe M > 0 satisfazendo kT ukW M kukV para todo u V.
Seja  um n
umero positivo arbitrario e sejam u e v dois vetores de V tais que ku vk V /M . Entao
kT u T vkW = kT (u v)kW M ku vkV M


= .
M

Assim, adotando-se = /M vemos que T satisfaz a definicao de continuidade.


Provemos a recproca. Seja T contnuo. Entao, vale que para todo  0 e todo u V existe > 0
tal que kT u T vkW  sempre que v for tal que ku vkV . Tomemos u = 0 e fixemos um .
Temos entao que
kT vkW 
sempre que kvkV . Lembremos que a constante independe de v e que sempre podemos escolher
> 0.
Seja entao u um vetor nao-nulo arbitrario de V e seja

u
kukV

v =
e claro que
kvkV






=
kukV u

=
V

kukV = .
kukV

Portanto, para esse v vale kT vkW  e, entao






= kT vkW ,
kT ukW = T
u
kukV
kukV W

ou seja,

kT ukW


kukV .

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1117/1304

Definindo M = / mostramos estao que kT ukW M kukV para todo u 6= 0. Para u = 0 essa relacao
e trivialmente satisfeita e, portanto, vale para todo u V, mostrando que T e limitado.
Exemplo de Operador N
ao-Limitado. O Funcional Delta de Dirac
Vamos a um exemplo de um operador agindo entre dois espacos vetoriais normados e que nao e
limitado e, portanto, nao e contnuo.
Seja V = C([1, 1], ), o conjunto de todas as funcoes contnuas do intervalo [1, 1]
valores complexos e adotemos como norma em V a norma L2 :
kf kV =
Seja W =

Z

1
2

|f (x)| dx

1/2

f C([1, 1],

com

).

e adotemos em W a norma usual


kzkW = |z|,

z .

Seja T0 : V W o seguinte operador linear:


T0 f = f (0),
que associa a cada funcao f C([1, 1], ) o seu valor no ponto 0. T0 e denominado funcional delta
elementar mostrar que T0 e linear. Mostremos que T0 , porem, nao pode ser contnuo.
de Dirac. E
Para isso, seja g(x) uma funcao de C([1, 1], ) com a propriedade que g(1) = g(1) = 0 e que
g(0) 6= 0. Para n defina

g(nx), para x [1/n, 1/n],
un (x) =
0,
de outra forma.


Como g foi escolhida de modo que g(1) = g(1) = 0, e facil verificar que un C([1, 1],
que?).
Temos que
kun kV =

"Z

1/n
2

1/n

|g(nx)| dx

#1/2

1
=
n

Z

1
2

|g(x)| dx

e, portanto, kun kV 0 quando n .

) (por

1/2

Por outro lado T0 un = un (0) = g(0) 6= 0 e constante, ou seja, nao depende de n. Assim, temos que


T0 lim un = T0 0 = 0
n

mas

lim T0 un = g(0) 6= 0,

o que mostra que T0 nao pode ser contnuo nem, portanto, limitado.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1118/1304

facil verificar que T0 tambem nao seria contnuo se adotassemos em V a norma Lp (com p 1):
E
kf kV =

Z

1
p

|f (x)| dx

1/p

f C([1, 1],

ltima afirmacao.
E. 26.1 Exerccio. Complete os detalhes da prova dessa u

).

Se, porem, adotassemos em V a norma do supremo


kf kV =

sup |f (x)|

x[1, 1]

entao T0 seria contnuo.


E. 26.2 Exerccio. Complete os detalhes dessa u
ltima afirmacao.

Esses exemplos mostram mais uma vez que a continuidade de uma aplicacao depende das topologias
adotadas.
O espa
co vetorial B(V, W)
Sejam V e W dois espacos vetoriais normados, cujas normas serao denotadas por k k V e k kW ,
respectivamente. Denotamos por B(V, W) o conjunto de todas os operadores lineares contnuos de V
em W.
O conjunto B(V, W) e um espaco vetorial sobre os complexos. De fato, dados dois operadores
quaisquer T e U B(V, W) podemos definir o operador T + U , com , , como sendo o
trivial ver que T + U e
operador que associa a cada v V o vetor de W dado por T v + U v. E
tambem um operador linear e que tambem e contnuo.
Mais que isso, B(V, W) e um espaco vetorial normado, onde para cada operador T definimos sua
norma operatorial kT k como
kT ukW
.
(26.1)
kT k = sup
uV, u6=0 kukV
Notemos que o lado direito de (26.1) e finito pois T e limitado.
E. 26.3 Exerccio.
pela definicao acima.

Verifique que as propriedades que caracterizam uma norma sao de fato satisfeitas
6

Notemos tambem que se T B(V, W) entao para todo u V vale que


kT ukW kT k kukV.
E. 26.4 Exerccio. Por que?

Mais adiante veremos que se W for um espaco de Banach entao B(V, W) tambem e um espaco de
Banach em relacao a` norma definida acima. Esse fato e importante para toda a teoria dos operadores

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1119/1304

limitados em espacos de Hilbert e abre caminho para a teoria das chamadas algebras de Banach e das
chamadas algebras C .
Extens
oes de Operadores
Convidamos neste momento o leitor a reler a definicao do conceito de extensao de funcoes a` pagina
27. Esse conceito se aplica diretamente a` teoria dos operadores lineares agindo entre espacos vetoriais.
Sejam V e W dois espacos vetoriais e T : V W um operador linear agindo entre eles. Suponha
que V seja sub-espaco de um espaco vetorial V 0 . Uma extensao do operador T ao espaco V 0 seria um
funcao T 0 : V 0 W tal que T 0 (v) = T v para todo v V . Se uma extensao T 0 de T for tambem um
operador linear de V 0 em W , entao T 0 e dita ser uma extens
ao linear de T .
Como veremos, extensoes lineares desempenham um papel importante no estudo de operadores
nao-limitados em espacos de Hilbert.

26.1.1

Espa
cos de Banach de Operadores

O Teorema BLT
Vamos agora enunciar e demonstrar um resultado sobre extensoes lineares que sera freq
uentemente
usado adiante, muitas vezes ate sem mencao explcita.
Seja V um espaco vetorial normado, cuja norma e denotada por k kV . O espaco vetorial V e
assim um espaco metrico e na discussao iniciada a` pagina 841 discutimos o conceito de completamento
o completamento canonico de V. Como
canonico de um espaco metrico generico. Chamemos de V
discutimos a` pagina 841 e seguintes, existe uma bijecao natural isometrica de V em um subconjunto
de modo que podemos, com um pequeno abuso, considerar V como um subconjunto (denso)
denso de V,
no mesmo sentido que usamos quando dizemos que o conjunto dos racionais e um subconjunto
de V,
denso dos reais, embora em princpio os reais sejam classes de equivalencias de racionas e, portanto,
objetos de natureza diferente dos racionais.
Na discussao deste topico adotaremos essa convencao de entender V como um subconjunto denso

de V.
Muitas vezes nos e apresentado um operador limitado T agindo entre dois espacos vetoriais normados
V e W, sendo V um espaco metrico nao-completo. Muitas vezes e u
til, conveniente ou mesmo necessario
de V. Veremos abaixo
saber se e possvel estender o operador T para o completamento canonico V
aplicacoes em que tal procedimento e u
til. Sera isso sempre possvel? Sera a extensao tambem contnua?
E se o for, sera a extensao obtida a u
nica possvel?
O teorema seguinte nos da condicoes suficientes para que uma tal extensao exista e seja u
nica, a
saber, basta que W seja completo. Esse teorema e denominado por alguns autores de Teorema BLT
(bounded linear transformation).
Teorema 26.1 (BLT) Seja V um espaco vetorial normado, cuja norma e denotada por k k V e seja
W um espaco vetorial normado, cuja norma e denotada por k k W . Suponha que W seja completo na
metrica definida pela norma kkW , ou seja, suponha que W seja um espaco de Banach. Ent
ao para todo

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1120/1304

W que tambem e
operador linear limitado T : V W, T B(V, W), existe uma extens
ao T : V
W), e tal que kTk
um operador linear limitado, T B(V,
ao
B(V, W) = kT kB(V, W) . Fora isso, tal extens
e a u
nica com as propriedades mencionadas.
2
Prova. A demonstracao consiste em construir a extensao T e mostrar que a mesma satisfaz as propriedades mencionadas. A primeira etapa e a construcao de T .
todo elemento de V
e limite de uma seq
Como entendemos V como um subconjunto denso de V,
uencia

de elementos de V. Seja entao x V e seja {xn }n uma seq


uencia de elementos de V que converge a
x. Como {xn }n converge, e uma seq
uencia de Cauchy.


Seja yn = T xn W. Mostremos que {yn }n e um seq


uencia de Cauchy de elementos de W. De
fato,


kym yn kW = kT (xm xn )kW kT kB(V, W) kxm xm kV = kT kB(V, W) kxm xm kV .


o lado direito pode ser feito menor que qualquer  > 0
uencia de Cauchy em V,
Como {xn }n e uma seq
dado, desde que m e n sejam grandes o suficiente, mostrando que {yn }n e de fato um seq
uencia de
Cauchy de elementos de W. O ponto crucial e que estamos supondo que W seja completo e, portanto
{yn }n converge a um elemento de W que chamaremos de y. Esse e o ingrediente que nos permite
definir T como sendo a funcao que associa x a y:


T(x) := y,
ou seja,

T(x) := lim T xn .
n

Um ponto logico que ainda tem que ser exibido antes de passarmos adiante e mostrar que essa definicao
Para isso basta mostrar
nao depende da particular seq
uencia {xn }n adotada que converge a x V.
que se {x0n }n e uma outra seq
uencia que converge a x entao {T x0n }n tambem converge ao mesmo
y. A demonstracao disso esta nas seguintes desigualdades. Seja y 0 o limite de {T x0n }n (que existe
pelos mesmos argumentos de acima). Entao


ky y 0 kW = k(y T xn ) + T (xn x0n ) + (T x0n y 0 )kW


ky T xn kW + kT (xn x0n )kW + kT x0n y 0 kW
ky T xn kW + kT kB(V, W) kxn x0n kV + kT x0n y 0 kW .
= ky T xn kW + kT kB(V, W) k(xn x) (x0n x)kV + kT x0n y 0 kW
ky T xn kW + kT kB(V, W) (kxn xkV + kx0n xkV ) + kT x0n y 0 kW .

(26.2)

facil agora ver que, pelas hipoteses, cada um dos termos da u


E
ltima linha vai a zero quando n ,
mostrando que ky y 0 kW = 0 e que, portanto, y = y 0 .
em W. Temos agora que mostrar que 1o T e
Assim, T esta bem definido como uma funcao de V
uma extensao de T ; 2o T e linear; 3o kT kB(V,
W) = kT kB(V, W) .

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1121/1304

com a seq
Provemos 1 com a observacao que cada x V e identificado em V
uencia constante xn = x.
T (x) = lim T xn = lim T x = T x,
n

mostrando que T e T coincidem em V.


e {vn V}n converge
Para mostrar a linearidade notemos que se {un V}n converge a u V
entao {un + vn V}n converge a u + v.
avV


E. 26.5 Exerccio. Se isso nao e obvio para voce, complete os detalhes.

Da, segue imediatamente que


T (u + v) = lim T (un + vn ) = lim T un + lim T vn = T (u) + T(v).
n

Passemos a` demonstracao do ponto 3. Pela continuidade da norma (vide pagina 1090) temos que
e toda seq
para todo x V
uencia xn de elementos de V que converge a x
kT xkW = k lim T xn kW = lim kT xn kW kT kB(V, W) lim kxn kV
n

= kT kB(V, W) k lim xn kV = kT kB(V, W) kxkV ,


n

que demonstra que T e limitado e que kT kB(V,


W) kT kB(V, W) .
Tem-se, porem, que, pela definicao de norma operatorial,
kTkB(V,
W) =

kT ukW

u6=0 kukV
uV,
sup

kTukW
=
uV, u6=0 kukV
sup

kT ukW
= kT kB(V, W) ,
uV, u6=0 kukV
sup


que demonstra que kT kB(V,
W) kT kB(V, W) , estabelecendo, assim, a igualdade kT kB(V,
W) = kT kB(V, W) .

B(V, W)
e um espa
co de Banach se W o for
Ja vimos que se V e W sao espacos normados, com normas k kV e k kW , respectivamente, entao
B(V, W), o espaco vetorial dos operadores contnuos agindo entre V e W, e tambem um espaco
normado, com a chamada norma operatorial
kT k =

kT ukW
,
uV, u6=0 kukV
sup

T B(V, W).

B(V, W) e um espaco metrico na metrica definida pela norma. Essa topologia metrica definida em
B(V, W) pela norma operatorial e denominada topologia uniforme.
Vamos mostrar aqui o seguinte teorema, de grande importancia na teoria dos operadores limitados
em espacos de Hilbert e que abre caminho para a teoria das chamadas algebras de Banach e para as
chamadas algebras C .

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1122/1304

Teorema 26.2 Se W e um espaco vetorial normado completo, ou seja, se e um espaco de Banach,


ent
ao B(V, W) e tambem um espaco vetorial normado completo.
2
Prova. O que temos que mostrar e que se An , n , for uma seq
uencia de Cauchy em relacao a`
metrica definida pela norma operatorial, entao An converge nessa metrica a um operador que tambem
e linear e limitado, ou seja, tambem um elemento de B(V, W). A estrategia que seguiremos, como
na demonstracao do Teorema BLT, e exibir um candidato a ser o limite da seq
uencia A n , mostrar que
esse candidato e um operador linear e contnuo e, por fim mostrar que ele e, de fato, limite dos A n s
na topologia uniforme.


Seja entao An , n uma seq


uencia de Cauchy em relacao a` metrica definida pela norma operatorial. Portanto, para todo  > 0 existe N () tal que para todo m, n N () tem-se kA m An k .


Seja x V e seja a seq


uencia em W dada por

yn = An x.
facil mostrar que yn , n
E


, e uma seq
uencia de Cauchy em W. De fato, se m, n N (),

kym yn kW = kAm x An xkW = k(Am An )xkW k(Am An )k kxkV kxkV ,


mostrando que yn , n

, e uma seq
uencia de Cauchy.

O ponto crucial e que fizemos a hipotese que W e um conjunto completo. Assim, a seq
uencia y n
converge a um elemento de W que denominaremos y. Como cada yn depende de x, o vetor y tambem
depende de x, que e um vetor arbitrario de V. Definimos entao A : V W como sendo a funcao que
associa cada x V ao vetor y W correspondente:
A(x) = y,
ou seja,
A(x) = lim An x,
n

onde o limite e entendido na topologia metrica de W definida pela norma k kW .

Essa funcao A e nossa candidata a ser o limite da seq


uencia An n , na topologia uniforme. Para
o
tal, temos que demonstrar que 1 A e um operador linear; 2o A e um operador limitado e, portanto,
um elemento de B(V, W) e 3o A e o limite da seq
uencia An n , na topologia uniforme.


Prova de 1. Pela definicao, para quaisquer ,

e quaisquer u, v V,

A(u + v) = lim An (u + v) = lim An u + lim An v = A(u) + A(v),


n

provando a linearidade de A.
Prova de 2. Para provar que A e limitado (e, portanto, contnuo) precisamos antes mostrar que a
seq
uencia de n
umeros reais positivos kAn k, n , converge.


Para tal, fazemos uso da desigualdade (2.19), pagina 123. Temos


| kAm k kAn k | kAm An k.

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1123/1304

Assim, se o lado direito e menor que  para m e n N (), o lado esquerdo tambem e, provando que
kAn k, n , e uma seq
uencia de Cauchy de n
umeros reais. Como
e completo, essa seq
uencia
converge a um n
umero que chamaremos A 0.


Assim, usando a continuidade da norma (vide pagina 1090),




kAxkW = k lim An xkW = lim kAn xkW lim kAn k kxkV = AkxkV ,
n

que mostra que A e limitado e, portanto, contnuo.

Prova de 3. Acabamos de mostrar que A e um elemento de B(V, W). Resta apenas mostrar que A
e o limite dos An s na topologia uniforme.
Para qualquer n e qualquer x V, tem-se pela continuidade da norma que






k(A An )xkW = lim (Am An )x = lim k(Am An )xkW
lim k(Am An )k kxkV .
m

Assim,

kA An k =

k(A An )xkW
lim k(Am An )k
m
kxkV
xV, x6=0
sup

Como An , n , e um seq
uencia de Cauchy, vale para qualquer  > 0 que k(Am An )k  sempre
que m e n N (). Assim, limm k(Am An )k  sempre que n N (). Logo, pelo que mostramos,
kA An k  sempre que n N (), o que diz que A e o limite dos An s na topologia uniforme, como
queramos provar.


26.1.2

O Dual Topol
ogico de um Espa
co de Banach

Seja V um espaco vetorial sobre corpo . Uma aplicacao l : V , definida sobre todo V , e dita ser
um funcional linear se
l(x + y) = l(x) + l(y)
para todo x, y V e todo , .

O conjunto de todas os funcionais lineares de V em e denominado espaco dual algebrico de V e


denotado V 0 . O conjunto V 0 e feito um espaco vetorial (sobre ), atraves da seguinte relacao:
(l + m)(x) = l(x) + m(x),

para todo l e m V 0 ; , e todo x V . O vetor nulo de V 0 e o funcional linear que associa


trivialmente todo vetor de V a zero: l(x) = 0, x V .

Seja X um espaco de Banach. O conjunto de todos os funcionais lineares contnuos sobre X e dito
ser o dual topol
ogico de X. O dual topologico de X sera denotado nestas notas por X . Note-se que

0
X X.

Pela sua definicao, podemos identificar X com o conjunto B(X,


X e igualmente um espaco normado com a norma
klkX =

|l(x)|
.
xX, x6=0 kxkX
sup

). Isso nos leva a concluir que

(26.3)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1124/1304

Mais que isso, o Teorema 26.2, pagina 1122, diz-nos que X e tambem um espaco de Banach em relacao
a essa norma. Conseq
uentemente o espaco (X ) , o dual topologico de X , e igualmente um espaco de
Banach, e assim por diante. (X ) e por vezes denominado o dual (topol
ogico) duplo de X ou bidual
(topol
ogico) de X. Podemos nos perguntar qual a relacao entre esses espacos.
De maneira geral podemos sempre identificar X com um subconjunto de (X ) , no seguinte sentido:
existe uma aplicacao injetora de X em (X ) . Denominemos essa aplicacao D : X (X ) . Podemos
defini-la da seguinte forma. Se x X definimos D(x) como sendo o elemento de (X ) que a cada
l X associa o n
umero l(x):
D(x)(l) = l(x).
facil verificar que D e linear e injetora, nao o faremos aqui. Que D(x) e contnuo segue do fato que
E
uma conseq
|D(x)(l)| = |l(x)| kxkX klkX , que mostra que D(x) e limitado. E
uencia do Teorema de
Hahn-Banach, mais precisamente, a Proposicao 26.4, pagina 1132, que D e uma isometria, ou seja,
kD(x)k(X ) = kxkX

(26.4)

E. 26.6 Exerccio. Prove essa afirmacao usando a Proposicao 26.4. Essa afirmacao e um caso particular
da Proposicao 26.10, pagina 1151.
6
Espa
cos Reflexivos
Essas observacoes dizem-nos que, em um certo sentido, podemos considerar X como um subconjunto de seu bidual topologico (X ) pois D(X) (X ) . Quando estudamos o dual algebrico de
espacos vetoriais (secao 2.1.3, pagina 101 e seguintes) demonstramos um teorema (Teorema 2.5, pagina
106) que afirma que o bidual algebrico de um espaco vetorial V de dimensao algebrica infinita e sempre
estritamente maior que V . No caso do bidual topologico de espacos de Banach isso nao e mais necessariamente verdade, pois ha espacos de Banach que possuem a propriedade que D(X) = (X ) . Tais
espacos sao ditos reflexivos.
Os espacos Lp ( , dx) com 1 < p < sao reflexivos pois (Lp ( , dx)) = Lq ( , dx) com p1 +q 1 =
1, de onde segue facilmente que ((Lp ( , dx)) ) = Lp ( , dx) (por que?). Para uma prova que
(Lp ( , dx)) = Lq ( , dx) vide, por exemplo, [109]. Os espacos L1 ( , dx) e L ( , dx) nao sao
reflexivos.


Um fato importante e que todos os espacos de Hilbert sao reflexivos. Isso segue o Teorema da
Representacao de Riesz (pagina 1110) e de algumas consideracoes simples, como mostraremos agora.
Espa
cos de Hilbert s
ao reflexivos
O Teorema da Representacao de Riesz (pagina 1110) afirma que se H e um espaco de Hilbert e
l H e um funcional linear contnuo agindo em H entao existe um e somente um elemento l H
tal que l(x) = hl , xi para todo x H. Vamos denominar por R : H H a funcao que associa cada
l H a seu vetor l H:
l(x) = hR(l), xi,
x H.
(26.5)

O Teorema de Representacao de Riesz diz-nos que R e injetora. De fato R : H H e tambem bijetora


pois e sobrejetora. Para ver isso, notemos que se H entao H 3 x 7 f (x) = h, xi define um

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1125/1304

funcional contnuo em H e, portanto, R(f ) = , mostrando que todo elemento de H esta na imagem
de R.
Devido a`s propriedades do produto escalar, R e uma aplicacao anti-linear, ou seja,
R(l + l0 ) = R(l) + R(l0 )
para todos ,

e todos l, l0 H , pois devemos ter


(l + l0 )(x) = l(x) + l0 (x)

e, com a anti-linearidade de R temos de fato


(l + l0 )(x) = hR(l + l0 ), xi = hR(l) + R(l0 ), xi = hR(l), xi + hR(l0 ), xi = l(x) + l0 (x)
como desejado.
Com essas observacoes e facil ver que o espaco H e um espaco vetorial com produto escalar, dado
por
Repare a ordem invertida!

hl, miH = hR(m), R(l)i = m(R(l)).

E. 26.7 Exerccio. Mostre que todas as propriedades de produto escalar estao satisfeitas.

(26.6)

Com essa definicao de produto escalar podemos introduzir em H uma norma, que denotaremos
provisoriamente por klk1 , dada por
p
klk1 =
hR(l), R(l)i = kR(l)k.

Para mostrar que H e um espaco de Hilbert precisamos mostrar que o mesmo e completo em relacao
a essa norma k k1 . A chave para isso e mostrar que as normas k k1 e k kH (definida em (26.3)) sao
iguais e lembrar que pelo, Teorema 26.2, pagina 1122, H e completo em relacao a` norma k kH .

Proposi
c
ao 26.2 Sejam H um espaco de Hilbert e H seu espaco dual topol
ogico. Ent
ao a norma
norma k k1 definida acima e a norma k kH s
ao iguais.
2

Prova. Seja l H . Queremos provar que klk1 = klkH . Se l = 0 a identidade e trivial. Seja entao
l 6= 0. Pela definicao
klkH =

|l(x)|
=
xH, x6=0 kxk
sup

|hR(l), xi|
|hR(l), R(l)i|

= kR(l)k = klk1 .
kxk
kR(l)k
xH, x6=0
sup

Por outro lado, pela desigualdade de Cauchy-Schwarz, tem-se para x 6= 0


kR(l)k kxk
|hR(l), xi|

= kR(l)k.
kxk
kxk
Logo,
klkH =

|l(x)|
=
xH, x6=0 kxk
sup

|hR(l), xi|
kR(l)k = klk1 ,
kxk
xH, x6=0
sup

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1126/1304

provando que klkH = klk1 .


Isso diz-nos, entao, que H e nao apenas um espaco com um produto interno, mas e completo em
relacao a norma definida por esse produto interno pois essa norma coincide com a norma k k H em
relacao a` qual H e completo pelo Teorema 26.2, pagina 1122. Em resumo: H e tambem um espaco
de Hilbert!
Vamos com isso mostrar agora que H e reflexivo.
Proposi
c
ao 26.3 Se H e um espaco de Hilbert ent
ao D(H) = (H ) , ou seja, todo espaco de Hilbert
e reflexivo.
2
Prova. Acabamos de ver que se H e um espaco de Hilbert entao H e, conseq
uentemente, (H ) tambem
sao espacos de Hilbert.
Ja vimos acima que R : H H e uma aplicacao anti-linear bijetora. Assim, possui uma inversa
R1 : H H que tambem e anti-linear e bijetora. Como H e tambem um espaco de Hilbert,
segue pelo Teorema da Representacao de Riesz que tambem existe uma aplicacao anti-linear bijetora
S : (H ) H com uma inversa S1 : H (H ) igualmente anti-linear e bijetora.
Por analogia com (26.5), vale que para todo J (H ) e todo l H que
J(l) = hS(J), liH .
Note que, por (26.6),
J(l) = hS(J), liH = hR(l), R(S(J))i.
Como S1 e R1 sao ambas anti-lineares e bijetoras, a composicao S1 R1 : H (H ) e linear
(por que?) e bijetora. Podemos verificar que S1 R1 e, em verdade, igual a D pois, para todo l H
e todo x H,
(S1 R1 (x))(l) = hS(S1 R1 (x)), liH
= hR1 (x), liH
= hR(l), R(R1 (x))i
= hR(l), xi
= l(x)
= D(x)(l),

(26.7)

provando que S1 R1 = D.

Assim, como S1 R1 e bijetora, D tambem o e, mostrando que D(H) = (H ) .

E. 26.8 Exerccio. Voce entendeu mesmo todas as passagens de (26.7)?

JCABarata. Curso de Fsica-Matem


atica

26.1.3

Captulo 26

Vers
ao de 29 de setembro de 2005.

1127/1304

O Teorema de Hahn-Banach e Algumas Conseq


u
encias do Mesmo

A existencia de funcionais lineares em espacos vetoriais satisfazendo certas propriedades e de extensoes


dos mesmos e um assunto recorrente na Analise Funcional. Um papel de central importancia no estudo
desse tipo de questao e o Teorema de Hahn5 -Banach6 , ao qual dedicamos a presente secao. Antes de
enunciarmos esse teorema (em suas varias formas), lembremos algumas nocoes referentes a funcionais
definidos em espacos vetoriais reais.
Funcionais sub-aditivos, sub-lineares e convexos
Seja V um espaco vetorial real. Um funcional real h : V

e dito ser


1. positivo-homog
eneo se h(x) = h(x) para todo x V e todo 0,
2. aditivo se h(x + y) = h(x) + h(y) para todos x, y V .
3. sub-aditivo se h(x + y) h(x) + h(y) para todos x, y V ,
4. sup-aditivo se h(x + y) h(x) + h(y) para todos x, y V ,
5. sub-linear se for positivo-homogeneo e sub-aditivo,
6. sup-linear se for positivo-homogeneo e sup-aditivo,
7. linear se h(x + y) = h(x) + h(y) para todos x, y V e todos ,


8. convexo se h(x + (1 )y) h(x) + (1 )h(y) para todos x, y V e todo [0, 1],
9. c
oncavo se h(x + (1 )y) h(x) + (1 )h(y) para todos x, y V e todo [0, 1].
sub-aditiv.

Se h : V
e sub-linear, entao e convexo, pois se [0, 1], vale h(x + (1 )y)

homogen. pos.
h(x) + h((1 )y)
=
h(x) + (1 )h(y). Analogamente, se h e sup-linear, entao e concavo.
A recproca nao e necessariamente verdadeira. Por exemplo, h : dada por h(x) = x 2 e convexo,
mas nao e sub-aditivo, nem positivo-homogeneo.


O Teorema de Hahn-Banach, que apresentaremos a seguir, aplica-se a funcionais convexos e, portanto, abrange tambem os funcionais sub-lineares. Desde seu surgimento entre 1927 e 1929 esse teorema
revelou-se rico em conseq
uencias fundamentais, algumas das quais discutiremos no contexto de espacos
normados e de Banach. Como veremos, o Teorema de Hahn-Banach garante condicoes suficientes
para a existencia de extensoes de funcionais lineares e tem uma versao para espacos vetoriais reais e
uma generalizacao para espacos vetoriais complexos. Essa segunda data de 1938 e e devida a H. F.
Bohnenblust e A. Sobczyk.
Exist
encia de extens
oes majoradas por funcionais convexos
5
6

Hans Hahn (1879-1934).


Stefan Banach (1892-1945).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1128/1304

O seguinte lema, que desempenhara um papel decisivo na demonstracao do Teorema de HahnBanach, ensina-nos que todo funcional linear definido em um sub-espaco de um espaco vetorial real
e que e majorado por um funcional convexo globalmente definido, possui pelo menos uma extensao
global que tambem e um funcional linear e tambem e majorado pelo mesmo funcional convexo.
Lema 26.1 Seja V um espaco vetorial real e seja f1 : V1 um funcional linear definido em V1 , um
sub-espaco pr
oprio de V . Suponha que exista um funcional convexo p : V
tal que f 1 (y) p(y)
para todo y V1 . Ent
ao, para cada z 6 V1 , n
ao-nulo, existe um funcional linear f2 : V2 , definido
no sub-espaco V2 , gerado por V1 e por z, tal que f2 e uma extens
ao de f1 (ou seja, f2 (y) = f1 (y) para
todo y V1 ) e satisfaz f2 (w) p(w) para todo w V2 .
2


Prova do Lema 26.1. Vamos tomar um vetor nao-nulo z 6 V1 , doravante fixo, e denotar por V2 o
sub-espaco gerado pelos vetores de V1 e z. Definamos f2 : V2 por


f2 (z + y) := F + f1 (y)

(26.8)

e todo y V1 , onde F e uma constante arbitraria a ser especificada mais abaixo.


para todo
Notemos que devido a` linearidade de f1


f2 ((z + y) + (0 z + y 0 )) = f2 (( + 0 )z + (y + y 0 ))

(26.8)

( + 0 )F + f1 (y + y 0 )

= (F + f1 (y)) + (0 F + f1 (y 0 )) = f2 ((z + y)) + f2 ((0 z + y 0 )) ,


tambem claro (tomando = 0) que f2 (y) = f1 (y) para y V1 , o que
o que mostra que f2 e linear. E
significa que f2 estende f1 a V2 . Sobre a constante F notemos, tomando y = 0, que F = f2 (z), ou seja,
fixar F fixa f2 em z.
Fixaremos F impondo a condicao que f2 (w) p(w) para todo w V2 . Assim, para todo e
todo y V1 desejamos que
F + f1 (y) p(z + y) .
(26.9)


Para = 0 a relacao f1 (y) p(y) seria satisfeita por hipotese. Para > 0 e y V1 arbitrarios, (26.9)
implicaria
1
1
F p(z + y) f1 (y)

7
e para < 0 e y V1 arbitrarios ,
F

1
1
p(z + y) f1 (y) .

Reciprocamente, se ambas essas condicoes sao satisfeitas, valera tambem (26.9) para todo
y V1 .
claro que existira um F satisfazendo ambas as condicoes se e somente se valer
E

1
1
1
1
p(z + y)
f1 (y) 0 p(0 z + y 0 ) 0 f1 (y 0 )

A desigualdade se inverte devido ao sinal de .

e todo

(26.10)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1129/1304

para todos , 0 > 0 e todos y, y 0 V1 . Mas essa desigualdade e verdadeira, pois



 

+ 0
1
1
0

0
0
f1 (y) + 0 f1 (y )
=
y+
y
f1

0
+ 0
+ 0

 

+ 0
0

0
0
=
f1
(y z) +
(y + z)
0
+ 0
+ 0
 


hip
otese
0

+ 0
0
0
p

(y z) +
(y + z)
0
+ 0
+ 0



convexidade
+ 0
0

0
0

p(y z) +
p(y + z)
0
+ 0
+ 0
=

1
1
p(y z) + 0 p(y 0 + 0 z) ,

o que implica (26.10). Assim, F pode ser escolhido de modo que






1
1
1
1
0
0
0
sup
p(z + y) + f1 (y) F 0 inf0
p( z + y ) 0 f1 (y ) ,
>0, y V1 0

>0, yV1

(26.11)

e (26.9) valera, ou seja, teremos f2 (w) p(w) para todo w V2 .


Note o leitor que (26.11) nao-necessariamente implica em uma escolha u
nica para F , mas isso
nao importa, pois o Lema 26.1 nao fala em unicidade, nem a mesma e esperada sob as hipoteses
consideradas.
O Lema 26.1 tem a seguinte interpretacao geometrica em 3 . Seja uma linha reta f1 em 3 .
Suponha que exista um volume convexo e nao-compacto r em 3 , delimitado por uma superfcie
bidimensional p, e que nao intercepte a reta f1 . Entao existe um (nao-necessariamente u
nico) plano f2
que contem f1 e que tambem nao intercepta a superfcie p em 3 .


E. 26.9 Exerccio. Justifique as afirmacoes do u


ltimo paragrafo com base no Lema 26.1 e/ou procure
convencer-se de sua veracidade com um pouco de ginastica geometrica mental. Convenca-se que o plano
f2 nem sempre e unicamente determinado.
6
O Teorema de Hahn-Banach para espa
cos vetoriais reais
O que fizemos com o Lema 26.1 foi estender f1 a um funcional linear f2 definido em um sub-espaco
V2 que adiciona a V1 uma dimensao extra gerada por um vetor z 6 V1 e de modo a preservar a majoracao
pelo funcional convexo p. Vamos agora mostrar como esse fato implica a existencia de um funcional
linear definido em todo V , estendendo f1 e tambem majorado por p. Esse e o conte
udo do celebre
Teorema de Hahn-Banach.
O Teorema de Hahn-Banach ensina uma condicao suficiente para que um funcional linear definido
em um sub-espaco tenha uma extensao ao espaco todo. A condicao e a existencia de um funcional
convexo que o majore. Na pratica da Analise Funcional e muito importante conhecer condicoes sob

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1130/1304

as quais a existencia de extensoes globais de funcionais lineares possa ser garantida, da a importancia
de teoremas de extensao, como o de Hahn-Banach. Como veremos, o mesmo conduz a resultados
nao-triviais, por exemplo na teoria de espacos de Banach.
Teorema 26.3 (Teorema de Hahn-Banach para espa
cos vetoriais reais) Seja V um espaco vetorial real e seja f1 : V1
um funcional linear definido em um sub-espaco V1 de V . Suponha que
exista um funcional convexo p : V
tal que f1 (y) p(y) para todo y V1 . Ent
ao, existe um
funcional linear f : V
que e uma extens
ao de f1 (ou seja, f (y) = f1 (y) para todo y V1 ) e
satisfaz f (x) p(x) para todo x V .
2


Prova do Teorema 26.3. Se V1 = V nao ha o que demonstrar, pois podemos tomar f = f1 . Consideremos,
entao, que V1 e um sub-espaco proprio de V .
Seja F1 a colecao de todos os funcionais lineares ` definidos em sub-espacos de V e que sejam

extensoes de f1 e satisfacam `(w) p(w) para todo w pertencente a seu sub-espaco de definicao. E
claro que f1 F1 e, alem disso, o Lema 26.1 ensina-nos que se V1 e um sub-espaco proprio de V , entao
F1 contem elementos outros que nao o proprio f1 .
Consideremos em F1 a relacao de ordem `2  `1 se `2 for uma extensao de `1 . Seja {` , }
um conjunto linearmente ordenado (pela relacao de ordem acima) de elementos de F1 e denotemos V

o sub-espaco de
[V onde cada ` esta definido. E claro que V V se `  ` , ja que ` estende ` .
Assim, W :=
V sera um sub-espaco de V e podemos definir em W um funcional `W da seguinte

elementar constatar que `W e linear e e evidente pela construcao


forma: `W (x) = ` (x) se x V . E
que `W  ` para todo . Resumindo, provamos que todo um conjunto linearmente ordenado de
elementos de F1 possui um majorante.

Pelo Lema de Zorn (pagina 36), isso implica que F1 possui um elemento maximal f , definido em
algum sub-espaco V 0 de V . Mas, em verdade, V 0 tem que ser igual a V , pois se assim nao fosse
poderamos, como afirma o Lema 26.1, tomar um z 6 V 0 nao-nulo e construir uma extensao linear de
f que seria tambem majorada por p, ou seja, seria um elemento de F1 , contrariando o fato de f ser
maximal.
Assim, f e um funcional linear definido em todo V que estende f1 e e majorado por p, pois f e um
elemento de F1 . Isso completa a demonstracao.
Vamos agora apresentar a generalizacao do Teorema de Hahn-Banach para espacos vetoriais complexos.
O Teorema de Hahn-Banach para espa
cos vetoriais complexos
Teorema 26.4 (Teorema de Hahn-Banach para espa
cos vetoriais complexos) Seja V um esum funcional linear definido em um sub-espaco V1 de V .
paco vetorial complexo e seja f1 : V1
Suponha que exista um funcional real p : V satisfazendo p(x + y) ||p(x) + ||p(y) para todos
x, y V e todos , tais que || + || = 1 e de forma que |f1 (y)| p(y) para todo y V1 . Ent
ao,
existe um funcional linear complexo f : V que e uma extens
ao de f 1 (ou seja, f (y) = f1 (y) para
todo y V1 ) e satisfaz |f (x)| p(x) para todo x V .
2


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1131/1304

Prova. A prova faz uso do Teorema 26.3, como esperado. Comecamos separando f 1 em suas partes
real e imaginaria. Definamos g1 (y) := Re (f1 (y)), y V1 . Teremos g1 (iy) = Re (f1 (iy)) = Re (if1 (y)) =
Im (f1 (y)), de modo que podemos escrever
f1 (y) = g1 (y) ig1 (iy) .

(26.12)

Observemos que para , 0 reais e y, y 0 V1 arbitrarios, tem-se g1 (y + 0 y 0 ) = Re (f1 ((y + 0 y 0 )) =


Re (f1 (y)+0 f1 (y 0 )) = Re (f1 (y))+0 Re (f1 (y 0 )), provando que g1 : V1 e um funcional real linear.
Fora isso, g1 (y) := Re (f1 (y)) |Re (f1 (y))| |f1 (y)| p(y). Estamos, portanto, sob as hipoteses do
Teorema 26.3 e podemos afirmar que existe um funcional linear real g : V que estende g 1 e satisfaz


g(x) p(x)

(26.13)

para todo x V . Isto posto, definamos, inspirados em (26.12),


f (x) := g(x) ig(ix) .
Como g e real, e evidente que
Re f (x)

= g(x)

Im f (x)

= g(ix) .

(26.14)

Vamos provar tres fatos sobre f : 1) f e uma extensao de f1 ; 2) f e um funcional linear complexo;
3) |f (x)| p(x) para todo x V .
(26.12)

1) Para y V1 tem-se f (y) = g(y) ig(iy) = g1 (y) ig1 (iy) = f1 (y), provando que f estende f1 .
2) Para provar que f e linear, provemos os seguintes passos:
a. f e aditivo, ou seja, f (x + x0 ) = f (x) + f (x0 ) para todos x, x0 V . De fato, g e linear
real e, portanto, aditivo, ou seja, g(x + x0 ) = g(x) + g(x0 ) para todos x, x0 V . Assim,
f (x + x0 ) = g(x + x0 ) ig(i(x + x0 )) = g(x) + g(x0 ) ig(ix) ig(ix0 ) = f (x) + f (x0 ),
estabelecendo que f e tambem aditivo.
b. f (x) = f (x) para todo
e todo x V . De fato, se
ig(ix) = g(x) ig(ix) = f (x), devido a g ser linear real.


, vale f (x) = g(x)

c. f (ix) = if (x) para todo x V . De fato, g e linear real e, portanto, g(x) = g(x). Assim,
f (ix) = g(ix) ig(x) = g(ix) + ig(x) = i(g(x) ig(ix)) = if (x).

d. Para todo e todo x V vale f (x) = f (x). De fato, se , 0 , f (( + i0 )x) =


passo b
passo c
aditividade
f (x + i0 x)
=
f (x) + f (i0 x) = f (x) + 0 f (ix) = f (x) + 0 if (x) = ( +
i0 )f (x).


e. f e linear complexa. De fato, para , 0 e x, x0 V temos, juntando os fatos provados


passo d
aditividade
nas linhas anteriores, f (x + 0 x0 ) = f (x) + f ( 0 x0 ) = f (x) + 0 f (x0 ).
3) Uma vez estabelecido que f e um funcional linear complexo em V , resta-nos demonstrar que
|f (x)| p(x) para todo x V .

Observemos primeiramente que do fato de p(x + y) ||p(x) + ||p(y) para todos x, y V e


todos , tais que || + || = 1, segue, que p(x) = p(x) para todo satisfazendo || = 1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1132/1304

e todo x V . De fato, tomando = 0, tem-se que da desigualdade acima que p(x) p(x)
para todo x V e todo com || = 1. Definindo y = x e notando que | 1 | = 1, segue
igualmente que p(x) = p(1 y) p(y) = p(x), provando que p(x) = p(x).
Escrevendo f (x)

na forma polar f (x) = |f (x)|ei , com |ei | = 1, tem-se





|f (x)| = Re |f (x)| = Re ei f (x)

linearidade



Re f (ei x)
(26.14)

g(ei x)

(26.13)

p(ei x) = p(x) .

Isso completa a demonstracao do Teorema 26.4.


Talvez as conseq
uencias mais importantes do Teorema de Hahn-Banach dao-se no contexto de
espacos vetoriais normados, como espacos de Banach, nosso proximo assunto.
Conseq
u
encias do Teorema de Hahn-Banach para espa
cos vetoriais normados
A primeira conseq
uencia do Teorema 26.4 e que se V e um espaco vetorial normado, entao todo
funcional linear definido em um sub-espaco de V e que seja contnuo em relacao a` norma de V pode
ser estendido isometricamente como funcional linear para todo V .
Teorema 26.5 (Teorema de Hahn-Banach para espa
cos vetoriais normados) Seja V um espaco vetorial complexo dotado de uma norma k k. Seja f1 : V1
um funcional linear definido
em um sub-espaco V1 de V e suponhamos que f1 seja limitado em V1 , ou seja, |f1 (y)| kf1 k kyk para
|f1 (y)|
todo y V1 , onde kf1 k := sup
. Ent
ao, existe um funcional linear complexo f : V que e
kyk
yV1
y6=0

uma extens
ao de f1 (ou seja, f (y) = f1 (y) para todo y V1 ) e que e igualmente limitado, satisfazendo
kf k = kf1 k.
2

Prova. Se V e um espaco vetorial complexo dotado de uma norma k k, entao para todos , e
todos x, y V vale kx + yk || kxk + || kyk. Assim, p(x) = kf1 kkxk satisfaz as hipoteses do
Teorema 26.4 e, pela definicao de p, vale |f1 (y)| p(y) para todo y V1 . Pelo Teorema 26.4, existe
|f (x)|
kf1 k.
um funcional linear f que estende f1 e satisfaz |f (x)| kf1 kkxk. Assim, kf k = sup
kxk
xV
x6=0

|f (x)|
|f (y)|
|f1 (y)|
Porem, como f estende f1 , vale kf k = sup
sup
= sup
= kf1 k, o que prova que
kxk
kyk
kyk
xV
yV1
yV1
x6=0

y6=0

y6=0

kf k = kf1 k.

Do Teorema 26.5 obtemos o seguinte resultado, que por sua vez possui um corolario de grande
importancia.
Proposi
c
ao 26.4 Seja V um espaco vetorial complexo dotado de uma norma k k. Ent
ao para cada
x0 V existe um funcional linear limitado e n
ao-nulo `x0 satisfazendo k`x0 k = 1 e tal que `x0 (x0 ) =
kx0 k.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1133/1304

Prova. Se x0 = 0, tomamos `x0 igual a qualquer funcional limitado com norma 1 e as afirmacoes da
proposicao seguem.
Seja x0 V nao-nulo fixo e seja V1 = {x0 , }, um sub-espaco linear de V . Defina-se em
V1 o funcional linear f1 (x0 ) := kx0 k. Pelo Teorema 26.5 existe um funcional linear `x0 definido
em todo V e que estende f1 , satisfazendo k`x0 k = kf1 k. Como `x0 estende f1 e x0 V1 , tem-se
`x0 (x0 ) = f1 (x0 ) = kx0 k. Note-se, porem, que
kf1 k = sup
yV1
y6=0

|f1 (x0 )|
|kx0 k|
|f1 (y)|
= sup
= sup
= 1.
kyk
kx0 k
kx0 k

6=0

6=0

Assim, k`x0 k = 1.
Essa proposicao sera usada quando estudarmos o adjunto de operadores atuando entre espacos de
Banach, pagina 1150 e seguintes. Vide Proposicao 26.10, pagina 1151. Uma das suas conseq
uencias
mais importantes, porem, e o seguinte corolario, o qual tera implicacoes em desenvolvimentos que se
seguirao no presente captulo, especialmente quando estudarmos propriedades do operador resolvente
e do espectro de operadores.
Corol
ario 26.1 Seja V um espaco vetorial complexo dotado de uma norma k k e denotemos por V
o conjunto de todos os funcionais lineares limitados agindo em V . Se x V e tal que `(x) = 0 para
todo ` V , ent
ao x = 0.
2
Prova. Se `(x) = 0 para todo ` V , entao, em particular, `x (x) = 0, onde `x e o funcional cuja
existencia e garantida pela Proposicao 26.4. Porem, `x (x) = kxk, o que prova que x = 0.

26.1.4

O Teorema de Banach-Steinhaus ou Princpio de Limita


c
ao Uniforme

O seguinte teorema, devido a Banach8 e Steinhaus9 e apresentado em 192710 e um dos teoremas


centrais da teoria de operadores em espacos de Banach. O mesmo e por vezes referido como princpio
de limitaca
o uniforme, e e uma conseq
uencia gentil do Teorema da Categoria de Baire, Teorema 24.2,
pagina 1079.
Teorema 26.6 (Teorema de Banach-Steinhaus ou Princpio de Limita
c
ao Uniforme) Seja A
um espaco de Banach e seja V um espaco vetorial normado. Seja S um conjunto (n
ao-vazio) de operadores lineares limitados de A em V. Suponha que para cada x A exista M x > 0, finito, tal que
kSxkV Mx para todo S S. Ent
ao existe M 0, finito, tal que kSk M para todo S S.
2
8

Stefan Banach (1892-1945).


Hugo Dyonizy Steinhaus (1887-1972).
10
S. Banach and H. Steinhaus. Sur le principe de la condensation des singularites. Fund. Math. 9, 50-61 (1927).
9

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1134/1304

Prova. Pela hipotese, tem-se para cada x A que o conjunto de n


umeros reais nao-negativos
{kSxkV , S S} e um subconjunto do intervalo [0, Mx ]. Como cada Mx e finito, cada um dos
evidente, portanto,
intervalos [0, Mx ], esta contido em algum intervalo [0, n] com n , n 1. E

[
que A =
An , onde


n=1

An :=


o

x A kSxkV n para todo S S ,

pois cada x A esta contido em pelo menos um An . Assim, pelo Teorema da Categoria de Baire
0
6 .
(Teorema 24.2, pagina 1079), existe m tal que Am tem interior nao-vazio: Am =


Agora, e facil ver que cada An e um conjunto fechado em A. De fato, pela definicao, vale

o
\n

An :=
x A kSxkV n .
(26.15)
SS

Agora, para S S,


o

x A kSxkV n = FS1 ([0, n]) ,

onde FS : A e dada por FS (x) = kSxkV . Todavia, FS e contnua por ser a composicao das funcoes
contnuas S e k kV . Logo, como [0, n] e fechado em , o conjunto FS1 ([0, n]) e fechado em A e, por
(26.15), An e fechado, por ser interseccao de fechados.


Conclumos disso que Am tem interior nao-vazio: A0m 6= .

Seja x0 A0m . Como A0m e aberto, existe  > 0 tal que todo x A com kx x0 kA <  e um
elemento de A0m . Dessa forma, se x0 A for tal que kx0 kA < , tem-se k(x0 + x0 ) x0 kA = kx0 kA < ,
o que implica que x0 + x0 e um elemento de A0m e, portanto, de Am . Como x0 e x0 + x0 sao elementos
de Am , valem
kSx0 kV m e kS(x0 + x0 )kV m
(26.16)
para todo S S. Assim, para S S e para cada x0 A com kx0 kA < , tem-se
kSx0 kV = kS(x0 + x0 ) Sx0 kV kS(x0 + x0 )kV + kSx0 kV

(26.16)

2m ,


x e teremos kx0 kA = 2 < , de onde segue
Portanto, para x A nao-nulo, podemos tomar x0 = 2kxk
A





que S 2kxk
x 2m, ou seja
A
V
4m
kxkA ,
kSxkV

desigualdade essa que tambem vale para x = 0. Assim, provamos que kSk M com M := 4m
, que

nao depende de S S. Isso demonstra o teorema.

26.1.5

O Teorema da Aplica
c
ao Aberta e o Teorema do Gr
afico Fechado

A Soma Direta de Dois Espa


cos de Banach

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1135/1304

Sejam V e W dois espacos vetoriais normados, cujas normas sao denotadas por k k V e k kW ,
respectivamente. O produto cartesiano V W pode ser feito um espaco vetorial com as operacoes de
soma e multiplicacao por escalares (n
umeros complexos), expressa em
(x, y) + (x0 , y 0 ) = (x + x0 , y + y 0 )
onde x, x0 V, y, y 0 W e , sao arbitrarios.
possvel introduzir em V W uma norma e, portanto, uma topologia, usando para tal as normas
E
k kV e k kW . Uma possvel escolha e
k(x, y)kVW = kxkV + kykW ,
(x, y) V W.
E. 26.10 Exerccio. Verifique que essa expressao define de fato uma norma em V W.

E. 26.11 Exerccio. Uma outra possvel escolha de norma em V W seria a seguinte. Sejam A > 0 e
B > 0 fixos. Defina para todo (x, y) V W
B
k(x, y)kA,
VW = AkxkV + BkykW .
B
Mostre que k kA,
e uma norma em V W. Mostre que
VW
B
min(A, B)k(x, y)kVW k(x, y)kA,
VW max(A, B)k(x, y)kVW ,
B
e, portanto, k kA,
ao normas equivalentes no sentido da definicao de equivalencia de normas
VW e k kVW s
da pagina 122. Note que duas normas equivalentes geram as mesmas topologias (por que?).
6

O conjunto V W e assim um espaco vetorial normado. Um fato relevante e que se V e W forem


espacos de Banach V W tambem o sera.

Para ver isso, consideremos uma seq


uencia (xn , yn ), n , em V W que seja uma seq
uencia de
Cauchy na norma k kVW . Isso significa que para todo  > 0 existe N () tal que se m, n N () entao


k(xm , ym ) (xn , yn )kVW = k(xm xn , ym yn )kVW .


Mas isso significa que
o que implica que temos

kxm xn kV + kym yn kV ,

kxm xn kV 
kym yn kW ,

ou seja, xn e yn , n , sao duas seq


uencias de Cauchy em seus respectivos espacos. Como V e W sao
espacos de Banach, ambas as seq
uencias convergem a x V e y W, respectivamente. Agora e trivial
ver que, por isso, (xn , yn ) converge a (x, y) em V W, pois


k(xn , yn ) (x, y)kVW = kxn xkV + kyn ykW

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1136/1304

que por hipotese vai a zero quando n . Isso mostra que V W e tambem um espaco de Banach.

Esse espaco de Banach obtido pelo produto cartesiano de dois espacos de Banach V e W e denominado soma direta (topol
ogica) de V e W e e freq
uentemente denotado por V W.
Freq
uentemente usaremos V W para nos referirmos a V W visto como espaco topologico com a
topologia gerada pela norma k kVW .

O Gr
afico de um Operador
Sejam V e W dois espacos vetoriais e T : V W um operador linear. O gr
afico de T , denominado
por (T ) e o subconjunto de V W definido por
(T ) = {(x, T x), x Dom (T )}.
Nota 1. Essa definicao e, na verdade, redundante. Se lembrarmos a definicao de funcao a` pagina
23 (e estamos adotando a definicao de operador como sendo uma funcao naquele sentido), vemos que
o conceito de grafico de um operador coincide com o proprio conceito de operador, ou seja, como
sendo uma certa sub-colecao de V W. Assim, pelas nossas definicoes, (T ) = T !. No entanto e
muito comum entender-se num sentido intuitivo que um operador representa uma transformaca
o entre
d
espacos. Informalmente entendemos, por exemplo, que o operador de derivacao T = dx transforma
uma funcao em sua derivada. Ainda que essa conceituacao nao possa ser feita precisa, essa e a nocao
que mais comummente se tem de operador, da introduzirmos essa nova definicao. Note-se tambem
que essa definicao corresponde precisamente a` nocao de grafico de uma funcao de em , tao familiar
dos cursos de calculo.


Nota 2. Para evitar confusoes futuras, notamos aos leitores que na nossa definicao de grafico acima
seguimos a convencao que V seja o domnio de definicao de T , Dom (T ) = V, e nao Dom (T ) V.

Se T e um operador linear agindo entre dois espacos de Banach V e W, o conjunto (T ) e um subconjunto do espaco topologico VW e, como tal, e legtimo perguntarmos por propriedades topologicas
de (T ), tais como, se (T ) e um conjunto fechado (ou aberto), sobre propriedades dos fecho (T ) de
(T ) etc. Como veremos, tais perguntas sao de grande importancia e operadores podem mesmo ser
classificados de acordo com as respostas que se da a`s mesmas. Um importante resultado nesse sentido
e o chamado Teorema do Gr
afico Fechado, que demonstraremos nas proximas paginas.
O Teorema da Aplica
c
ao Aberta
Sejam X e Y dois espacos vetoriais e seja T : X Y . Se C X denotaremos aqui por T (C) a
imagem de C por T , ou seja, T (C) = {y Y | y = T (x) para algum x X}.

Neste topico demonstraremos outro importante teorema sobre operadores contnuos entre espacos
de Banach, o chamado Teorema da Aplicaca
o Aberta. Esse teorema faz uso de um teorema sobre
espacos metricos completos, conhecido como Teorema da Categoria de Baire, tratado a` pagina 1079.

Como bem sabemos, funcoes contnuas entre espacos topologicos tem (por definicao) a propriedade
que as imagens inversas de conjuntos abertos sao tambem abertos. O que o Teorema da Aplicacao
Aberta nos diz e que, para operadores lineares contnuos e sobrejetores agindo entre espacos de Banach,
vale tambem a recproca: a imagens de abertos sao tambem abertos. Como e de se esperar esse fato

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1137/1304

tambem nos diz algo sobre a inversa desses operadores, a saber, na forma do Teorema da Aplicacao
Inversa, tratado a` pagina 1140.
A conseq
uencia talvez mais importante do Teorema da Aplicacao Aberta e o Teorema do Grafico
Fechado, que discutiremos a` pagina 1140, que nos mostra (pela primeira vez) a existencia de uma
relacao ntima entre propriedades de um operador e propriedades topologicas de seu grafico.
Passemos ao enunciado e demonstracao do Teorema da Aplicacao Aberta.
Teorema 26.7 (Teorema da Aplica
c
ao Aberta) Sejam X e Y dois espacos de Banach e seja T :
X Y um operador linear contnuo e sobrejetor. Ent
ao, se A X e um aberto, T (A) e um aberto
em Y .
2
Prova. Comecemos fixando notacoes. Por B X (r, x) denotamos a bola aberta em X centrada em x X
de raio r > 0. Analogamente por B Y (r, y) denotamos a bola aberta em Y centrada em y Y de
raio r > 0. Adotaremos tambem as notacoes simplificadoras: B X (r) = B X (r, 0) e B Y (r) = B Y (r, 0).
Fora isso, se C e um subconjunto de X e > 0, denotamos por C o conjunto C = {x0 X| x0 =
x para algum x C}. O mesmo se C for um subconjunto de Y .
Isto posto, vamos a` demonstracao.

Em primeiro lugar, e claro que X pode ser escrito como a uniao contavel de todas as bolas de raio
1, 2, 3 . . .:

[
B X (n).
X =
n=1

Como T e, por hipotese, sobrejetora, temos que


Y =

T (B X (n)).

n=1

Pelo Teorema da Categoria de Baire (pagina 1079) isso implica a existencia de pelo menos um m tal

0
que T (B X (m)) 6= , ou seja, T (B X (m)) tem interior nao-vazio.
claro que, para todo r > 0 e n
E

valem

T (B X (r)) =

r
T (B X (n))
n

T (B X (r)) =

r
T (B X (n)).
n

Portanto, conclumos que todos conjuntos T (B X (r)) para todos r > 0 tem interior nao-vazio.
Com isso em maos, vamos enunciar e demonstrar o seguinte lema:

0
Lema 26.2 O conjunto aberto T (B X (1)) contem o vetor nulo entre seus elementos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1138/1304

Prova do Lema 26.2. Como ja sabemos, T (B X (1)) possui um interior nao-vazio. Afirmamos que
0

0

X
X
0 T (B (1)) . Para mostrar isso, tomemos y T (B (1)) . Como y e um elemento do fecho de

0
0

T (B X (1)) (pois T (B X (1)) T (B X (1))), e como T (B X (1)) e um aberto que contem y, segue
0

que T (B X (1)) T (B X (1)) 6= , pela Proposicao 18.5, pagina 936.

0
Seja entao z T (B X (1)) T (B X (1)). Entao z = T x para algum x X com kxkX < 1 e, como
0

X
T (B (1)) e aberto, existe pela definicao de conjunto aberto em espacos metricos um r > 0 tal que

0
Y
X
B (r, z) T (B (1)) , ou seja,
B Y (r) + T x

0
T (B X (1)) .

(26.17)

Se escolhermos R grande o suficiente (por exemplo R > 1 + kxkX ) teremos que B X (1) B X (R, x)
(por que?). Isso implica T (B X (1)) T (B X (R, x)). Logo, T (B X (1)) T (B X (R, x)) e, portanto,
0 

0
T (B X (1)) T (B X (R, x)) .
Logo, retornando a` (26.17), temos que
B Y (r) + T x
ou seja,

T (B X (R, x))

B Y (r)
Isso, porem, diz que

0

T (B X (R))

0

+ T x,

0

T (B X (R)) .

B Y (r/R)

0
T (B X (1)) ,

0

provando que 0 T (B X (1)) , completando a prova do lema.

Vamos mostrar na proxima proposicao uma condicao que, uma vez demonstrada, implica o Teorema
da Aplicacao Aberta.
Proposi
c
ao 26.5 Se provarmos que T (B X (1)) T (B X (2)) ent
ao o Teorema da Aplicaca
o Aberta
estar
a demonstrado.
2

0
Prova da Proposicao 26.5. Pelo lema acima, o aberto T (B X (1)) contem o vetor nulo. Entao (pela
definicao de conjunto aberto em espaco metrico, vide pagina 845), existe uma bola aberta de raio s > 0

0
(suficientemente pequeno) e centrada em 0 que esta inteiramente contida em T (B X (1)) e, portanto,
em T (B X (1)):

B Y (s) T (B X (1)).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1139/1304

Se tivermos provado que T (B X (1)) T (B X (2)), como a proposicao sugere, entao concluiramos que
B Y (s) T (B X (2)),
ou seja, que T (B X (2)) tem interior nao-vazio. Como T (B X (r)) = (r/2)T (B X (2)), segue tambem que
B Y (rs/2) T (B X (r)),
mostrando que T (B X (r)) tem tambem interior nao-vazio para qualquer r > 0.
Isso mostra que T (B X (r, x)) = T (B X (r)) + T x tambem tem interior nao-nulo para todo r > 0 e
todo x X.

Seja entao A X um aberto em X e T (A) sua imagem por T em Y . Seja um ponto generico
y T (A) e seja x A tal que y = T x. Como A e aberto, existe r suficientemente pequeno tal que
B X (r, x) A. Logo T (B X (r, x)) T (A) e T (B X (r, x)) 3 y. Mas, pelo dito acima, T (B X (r, x)) =
T (B X (r)) + y e T (B X (r)) contem a bola B Y (rs/2). Assim, y + B Y (rs/2) T (A). Como y e um
elemento generico de T (A) isso mostra que para cada y T (A) existe r 0 > 0 (a saber r 0 = rs/2) tal
que a bola B Y (r 0 , y) esta inteiramente contida em T (A). Ora, isso e a afirmativa que T (A) e aberto,
completando assim a demonstracao da proposicao.
Essa proposicao nos ensina que, para completarmos a demonstracao do Teorema da Aplicacao
Aberta resta-nos apenas mostrar que T (B X (1)) T (B X (2)), que e o que faremos agora.

Mostrar que T (B X (1)) T (B X (2)) significa mostrar que para cada y T (B X (1)) existe um x X
com kxkX < 2 tal que y = T x. O que faremos entao e fixar um tal y e construir um x X com as
propriedades requeridas.
Pela caracterizacao de fecho de um conjunto dada na Proposicao 18.5, pagina 936, se
y T (B X (1))

(26.18)

entao para todo n


umero r > 0, B Y (r, y) T (B X (1)) 6= . Isso diz que existe x1 com kx1 kX < 1 tal que
ky T x1 kY < r. Essa u
ltima afirmativa significa que y T x1 B Y (r). Como r e arbitrario, podemos
escolhe-lo suficientemente pequeno de modo a termos
B Y (r) T (B X (1/2)).

(26.19)

Isso e sempre possvel pois vimos acima que todo conjunto T (B X (a)) tem interior nao-vazio para todo
a > 0. Como, porem, T (B X (1/2)) T (B X (1/2)), conclumos que, pela nossa escolha,
y T x1 T (B X (1/2)).

(26.20)

Comparando-se (26.20) a (26.18) vemos que podemos repetir o argumento e, para o mesmo r de
(26.19), B Y (r/2, y T x1 ) T (B X (1/2)) 6= . Isso diz que existe x2 com kx2 kX < 1/2 e tal que
k(y T x1 ) T x2 kY = ky T (x1 + x2 )kY < r/2, ou seja, y T (x1 + x2 ) B Y (r/2). Por (26.19),
B Y (r/2) T (B X (1/4)). Como, porem, T (B X (1/4)) T (B X (1/4)), conclumos que, pela nossa
escolha,
y T (x1 + x2 ) T (B X (1/4)).
(26.21)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1140/1304

Prosseguindo indutivamente conclumos que existem x1 , . . . , xn X tais que kxi kX < 1/2i1 e
ky T (x1 + + xn )kY <

2n+1

(26.22)

um exerccio simples mostrar que, pela propriedade kxi kX < 1/2i1 , a seq
E
uencia x1 + + xn e
uma seq
uencia de Cauchy. Como supomos que X e completo, isso diz que existe x X tal que
x = lim (x1 + + xn ).
n

Fora isso, pela continuidade da norma, pela continuidade de T e pela propriedade (26.22), segue que




0 = lim ky T (x1 + + xn )kY = y lim T (x1 + + xn )
n





= y T ( lim (x1 + + xn ))
n

= ky T xkY ,

provando que y = T x. Agora, pela continuidade da norma,






1
1


kxkX = lim (x1 + + xn ) = lim kx1 + + xn kX lim 1 + + + n1 = 2
n
n
n
2
2
X

Mostrando que x B X (2) e que y T (B X (2)). Isso completa a demonstracao do Teorema da Aplicacao
Aberta.
O Teorema da Aplica
c
ao Inversa
Se T : X Y e uma funcao bijetora entre dois conjuntos, existe uma funcao inversa T 1 : Y X.
Se X e Y sao espacos vetoriais e T e linear, e facil ver que T 1 e tambem linear (Exerccio.). O Teorema
da Aplicacao Aberta tem um corolario que garante que tambem a propriedade de continuidade pode
ser estendida a T 1 , caso T seja contnua e X e Y dois espacos de Banach.
Teorema 26.8 (Teorema da Aplica
c
ao Inversa) Sejam X e Y dois espacos de Banach e T : X
Y um operador linear que seja contnuo e bijetor. Ent
ao sua inversa T 1 : Y X e tambem contnua.
2
Prova. Se T e bijetora e, em particular, sobrejetora e portanto vale o Teorema Aplicacao Aberta. Pela
definicao de funcao contnua, tudo que devemos fazer e mostrar que conjuntos abertos na imagem de
T 1 (que vem a ser X) sao a imagem por T 1 de conjuntos abertos do domnio de T 1 (que vem a ser
Y ). Mas e precisamente isso que nos diz o Teorema Aplicacao Aberta, pois (T 1 )1 = T .
O Teorema do Gr
afico Fechado
Chagamos agora a um teorema importante pois mostra que propriedades de um operador se manifestam em propriedades topologicas de seu grafico.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1141/1304

Teorema 26.9 (Teorema do Gr


afico Fechado) Sejam X e Y dois espacos de Banach e T : X Y
um operador linear. Ent
ao T e contnuo se e somente se seu gr
afico (T ) for fechado como subconjunto
do espaco topol
ogico X Y .
2
Prova. 1. Vamos supor que T seja contnuo e mostrar que seu grafico e fechado.
Seja (xn , T xn ), n , uma seq
uencia de elementos de (T ) e que seja convergente em X Y .
Queremos mostrar que essa seq
uencia converge a um elemento (x, y) X Y que tambem e elemento
de (T ). Para isso devemos provar que y = T x. Se (xn , T xn ) (x, y) entao x = lim xn em X e
n


y = lim T xn . Porem, como T e, por hipotese, contnuo, vale y = lim T xn = T lim xn = T x, que
n
n
n
e o que queramos provar.


2. Vamos agora, reciprocamente, supor que (T ) e fechado e mostrar que T e contnuo.


(T ) e sempre um sub-espaco de X Y , pois
(x, T x) + (y, T y) = (x + y, T x + T y) = (x + y, T (x + y)) (T ).
O fato de (T ) ser fechado significa, porem, que (T ) e um espaco de Banach pois, pela Proposicao
18.7, pagina 937, todo subconjunto fechado de um espaco metrico completo e tambem completo.
Sejam entao as funcoes S1 : (T ) X e S2 : (T ) Y definidas por
S1 ((x, T x)) = x.
e
S2 ((x, T x)) = T x.
um exerccio banal mostrar que S1 e S2 sao lineares (faca). Fora isso, ambas sao limitadas (e,
E
portanto, contnuas), pois
kS1 (x, T x)kX = kxkX kxkX + kT xkY = k(x, T x)kXY
e
kS2 (x, T x)kX = kT xkY kxkX + kT xkY = k(x, T x)kXY ,
Mostrando que kS1 k 1 e kS2 k 1.

Fora isso vale tambem que S1 e bijetora. De fato e evidente que ImS1 = X (por que?) e, fora isso,
S1 (x, T x) = S1 (y, T y) significa x = y e, portanto (x, T x) = (y, T y), o que mostra que S1 e um-a-um.
Se S1 e uma bijecao entao tem uma inversa (S1 )1 : X (T ) que e tal que
(S1 )1 x = (x, T x).
Note-se assim que
S2 (S1 )1 x

ou seja, T = S2 (S1 )1 .

= S2 (x, T x) = T x,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1142/1304

Mostramos acima que S1 e uma funcao linear, contnua e bijetora entre dois espacos de Banach.
Ora, essas sao as hipoteses do Teorema da Aplicacao Inversa que, assim, nos afirma que (S 1 )1 e
contnua. S2 e tambem contnua e, portanto, T = S2 (S1 )1 e tambem contnua por ser a composicao
de duas funcoes contnuas, completando a prova.

O Teorema de Hellinger-Toeplitz
O Teorema do Grafico Fechado tem por corolario um teorema do qual uma importante licao pode
ser extrada.
Teorema 26.10 (Teorema de Hellinger-Toeplitz)
operador linear tal que Dom (A) = H e tal que

11

Seja H um espaco de Hilbert e seja A um

hx, Ayi = hAx, yi

(26.23)

para todos x, y H. Ent


ao A e limitado.

Prova. A prova e feita mostrando que (A) e fechado e evocando o Teorema do Grafico Fechado.
Suponha que (xn , Axn ) converge a (x, y) em H H. Queremos mostrar que y = Ax. Seja z um
vetor qualquer de H. Evocando sucessivas vezes a continuidade do produto escalar e a hipotese (26.23),
temos
hz, yi =

z, lim Axn
n

= lim hz, Axn i = lim hAz, xn i


n

Az, lim xn
n

= hAz, xi = hz, Axi .

Assim, para todo z H vale hz, (y Ax)i = 0, o que so e possvel se y = Ax.


A licao que extramos desse teorema e que se A nao e um operador contnuo, uma relacao como
(26.23) nao pode ser satisfeita para todos x, y H. Isso nos forca a termos cautela quando definirmos
o conceitos como o de operador auto-adjunto para operadores nao-limitados.

26.2

Operadores Limitados em Espa


cos de Hilbert

Considera
co
es gerais sobre operadores em espa
cos de Hilbert
Vamos agora particularizar nossa discussao para o contexto de espacos de Hilbert. Seja H um
espaco de Hilbert. Um operador linear A agindo em H e uma funcao linear definida em um domnio
Dom (A) que e um sub-espaco de H. Freq
uentemente denotaremos esse domnio por D(A) ou ainda
11

Ernst David Hellinger (1883-1950). Otto Toeplitz (1881-1940).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1143/1304

por DA . A imagem de A, Im(A), sera freq


uentemente denotada por R(A) ou por RA , a letra R sendo
proveniente da palavra inglesa range.
Na teoria de operadores em espacos de Hilbert e absolutamente fundamental lembrar que cada
operador e definido em um domnio especfico, pois propriedades do mesmo podem mudar se o domnio
for alterado.
d
Considere-se o exemplo do espaco de Hilbert L2 ([0, 1], dx), e os operadores A1 = i dx
, definido no
d
domnio D(A1 ) das funcoes contnuas e continuamente diferenciaveis do intervalo [0, 1] e A2 = i dx
,
definido no domnio D(A2 ) das funcoes contnuas e continuamente diferenciaveis do intervalo [0, 1] que
se anulam em x = 0 e em x = 1. O operador A2 e simetrico no seu domnio, ou seja, para todos ,
no seu domnio vale h, A2 i = hA2 , i, mas o operador A1 nao tem essa propriedade.

E. 26.12 Exerccio.
partes.

Verifique as afirmativas feitas no u


ltimo paragrafo usando para tal integracao por
6

No caso de operadores limitados (contnuos), a situacao se simplifica muito pois, como iremos
argumentar, um operador limitado sempre pode ser definido em todo o espaco de Hilbert.
De fato, seja A um operador linear limitado definido em um sub-espaco D(A) de um espaco de
Hilbert H. Se D(A) for fechado, podemos estender A ao complemento ortogonal D(A) , definindoo como zero em D(A) . Mais precisamente fazemos o seguinte: pelo Teorema da Decomposicao
Ortogonal, Teorema 25.2, pagina 1093, todo x H pode ser escrito como x = y + z com y D(A) e
z D(A) . Definimos entao A00 , extensao de A, com domnio igual a todo H por
A00 x = A00 (y + z) = Ay.
facil verificar que kA00 k = kAk.
E

Caso D(A) nao seja fechado, definimos uma extensao A0 de A a seu fecho D(A) da seguinte forma.
Seja y D(A) e yn , n , uma seq
uencia em D(A) que converge a y. Definimos


A0 y = lim Ayn .
n

E. 26.13 Exerccio. Usando a continuidade mostre que o limite do lado direito sempre existe e que nao
depende da particular sequencia yn em D(A) que converge a y.
6
E. 26.14 Exerccio. Mostre que kA0 k = kAk.
Como o domnio de A0 e fechado, podemos proceder como antes e estender A0 a todo H.

Daqui por diante sempre consideraremos que operadores limitados tem por domnio todo o espaco
de Hilbert em que agem. Para operadores nao-contnuos isso nao pode ser feito e questoes relativas ao
domnio de definicao tem sempre um caracter essencial.

JCABarata. Curso de Fsica-Matem


atica

26.2.1

Vers
ao de 29 de setembro de 2005.

Captulo 26

1144/1304

O Adjunto de um Operador em um Espa


co de Hilbert

Seja A um operador linear limitado definido em um espaco de Hilbert H. Seja y um vetor de H e


ly : H o funcional linear em H dado por
ly (x) = hy, Axi.
Pela desigualdade de Cauchy-Schwarz
|ly (x)| kyk kAxk kyk kAk kxk
o que mostra que ly e um funcional linear limitado. Aplica-se entao o Teorema da Representacao de
Riesz (pagina 1110) e podemos dizer que existe um vetor z H tal que
ly (x) = hy, Axi = hz, xi.
O vetor z deve depender de y. Definimos uma nova funcao A : H H, denominada adjunto de A,
como sendo a funcao que associa y a z: A (y) = z, de modo que podemos escrever
hy, Axi = hA (y), xi
para todos x, y H. Note-se que, pela propria construcao, o domnio de definicao de A e todo H,
pois y e arbitrario. Esse fato nao e verdadeiro para o caso em que A nao e limitado. Vamos no que
segue demonstrar uma serie de propriedades de A , a mais basica sendo a linearidade. As propriedades
que desejamos provar estao listadas na forma do seguinte teorema:
Teorema 26.11 O operador adjunto A de um operador limitado A agindo em um espaco de Hilbert
H e tambem um operador linear, limitado e satisfaz
1. (A ) = A
2. kA k = kAk
3. kA Ak = kAk2 , (propriedade C ) .
4. Se A e B s
ao operadores limitados agindo em H e , , vale
(A + B) = A + B ,
ou seja, e anti-linear.
5. Se A e B s
ao operadores limitados agindo em H, ent
ao (AB) = B A .
6. O operador identidade satisfaz

= .

7. Se A tem uma inversa contnua, ent


ao A tambem o tem e (A1 ) = (A )1 .
2

JCABarata. Curso de Fsica-Matem


atica

Prova. Linearidade. Para todo ,

Vers
ao de 29 de setembro de 2005.

Captulo 26

1145/1304

e todos y, y 0 H, temos pela definicao

hA (y + y 0 ), xi = hy + y 0 , Axi
= hy, Axi + hy 0 , Axi
= hA (y), xi + hA (y 0 ), xi
= hA (y) + A (y 0 ), xi,

(26.24)

ou seja,
h [A (y + y 0 ) (A (y) + A (y 0 ))] , xi = 0,

para todo x H. Isso so e possvel se A (y + y 0 ) (A (y) + A (y 0 )) = 0, provando a linearidade.


Continuidade.

Para todo x H tem-se


kA xk2 = hA x, A xi = hx, AA xi kxk kAA xk kxk kAk kA xk.
Para x tal que A x 6= 0, essa desigualdade diz (cancelando um fator kA xk de cada lado) que
kA xk kAk kxk.
Esta u
ltima desigualdade e, porem trivialmente verdadeira caso A x = 0. Portanto, a mesma vale para
todo x, mostrando que A e limitada e, assim, contnua. A mesma desigualdade mostra que
kA k = sup
x6=0

kA xk
kAk,
kxk

o que mostra que


kA k kAk.

(26.25)

Prova de (A ) = A.
Para todo x, y H tem-se
h(A ) x, yi = hx, A yi = hA y, xi = hy, Axi = hAx, yi.
Assim,
h[A (A ) ]x, yi = 0

para todo x, y H, o que so e possvel se (A ) = A, como queramos provar.


Prova de kA k = kAk.

A relacao (26.25) provou que para todo A limitado vale kA k kAk. Como A e tambem limitado,
vale tambem (substituindo A A ) que k(A ) k kA k, que significa que kAk kA k. Isso, junto
com (26.25) implica kA k = kAk, como queramos.
Prova de kA Ak = kAk2 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1146/1304

Para todo x H vale


kA Axk kA k kAxk kA k kAk kxk = kAk2 kxk.
Assim,
kA Ak = sup
x6=0

kA Axk
kAk2 .
kxk

(26.26)

Por outro lado, para todo x H,


kAxk2 = hAx, Axi = hA Ax, xi kA Axk kxk kA Ak kxk2 .
Assim,
2

kAk =

kAxk
sup
x6=0 kxk

2

= sup
x6=0

kAxk2
kA Ak,
kxk2

provando que kAk2 kA Ak. Com (26.26) isso mostra que kA Ak = kAk2 , como queramos.

A prova que (A + B) = A + B , assim como a prova que (AB) = B A sao deixadas como
exerccio.
Que

e elementar. Se A tem uma inversa contnua, entao


=

= (A1 A) = A (A1 )

= (AA1 ) = (A1 ) A ,

e
mostrando que (A1 ) = (A )1 .
A existencia do operador adjunto A de um operador limitado A foi obtida acima com uso do
Teorema da Representacao de Riesz e nesse caso obtemos um operador igualmente limitado e definido
em todo H. No caso em que A nao e contnuo o argumento a ser seguido e um pouco diferente e so
pode fornecer o adjunto em um domnio menor que H. Ha mesmo casos em que o domnio de A e
formado apenas pelo vetor nulo!
Outro advertencia importante diz respeito a` propriedade (A ) = A, demonstrada acima para
operadores limitados. A mesma nao e tambem, em geral, satisfeita para operadores nao-limitados.
Esse fato e mais uma causa de transtorno tecnico na teoria dos operadores nao-limitados.
Por fim, mencionamos que a propriedade kAk2 = kA Ak abre caminho para a importante teoria
das chamadas algebras C , sobre as quais falaremos adiante.
Operadores Auto-adjuntos, Operadores Unit
arios e Operadores Normais
Um operador limitado A que satisfaca A = A e dito ser auto-adjunto.
Se A e um operador limitado auto-adjunto vale
hx, Ayi = hAx, yi

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1147/1304

para todos x, y H. Se A nao e limitado, vimos pelo Teorema de Hellinger-Toeplitz (pagina 1142)
que uma relacao dessas nao pode ser satisfeita para todos x, y H. Em funcao disso sera necessario
criar uma distincao entre operadores simetricos e operadores auto-adjuntos no contexto de operadores
nao-limitados. Essa distincao e importante e ha varios fenomenos fsicos associados a ela.
Qualquer operador limitado pode ser escrito como soma de dois operadores auto-adjuntos, a saber
A = Re(A) + iIm(A),
onde
Re(A) =

1
(A + A )
2

Im(A) =

1
(A A ).
2i

trivial verificar que Re(A) e Im(A) sao auto-adjuntos.


E
trivial verificar que um
Um operador limitado A que satisfaca AA = A A e dito ser normal. E
operador A e normal se e somente se Re(A) e Im(A) comutarem entre si.
Um operador limitado A que satisfaca AA = A A = e dito ser unit
ario. Todo operador unitario
e normal.
possvel mostrar que qualquer operador limitado pode ser escrito como soma de ate quatro
E
operadores unitarios.
Autovalores e autovetores de operadores limitados. Multiplicidade de um autovalor
Um n
umero e dito ser um autovalor de um operador limitado B agindo em um espaco de
Hilbert H se existir pelo menos um vetor nao-nulo H tal que B = . Um tal vetor e dito ser
um autovetor de B com autovalor .
Em espacos de Hilbert dimensao finita, como n , todo operador, ou seja, toda matriz, possui
autovalores, pois o conjunto de autovalores coincide com o conjunto de razes do polinomio caracterstico
da matriz. Esses fatos foram estudados com detalhe no Captulo 3, pagina 142, ao qual remetemos os
importante notar, porem, que em espacos de Hilbert de dimensao infinita
estudantes interessados. E
pode ocorrer de haver operadores limitados que nao possuem autovalores, um exemplo, dentre muitos,
sendo o operador de Volterra W , tratado no Exemplo 26.6 a` pagina 1214.
Um fato elementar sobre essas nocoes e o seguinte: se 1 e 2 sao dois autovalores de operador
limitado B com o mesmo autovalor , entao para quaisquer 1 , 2 o vetor 1 1 +2 2 e igualmente
autovetor de B com autovalor . De fato, B(1 1 + 2 2 ) = 1 B1 + 2 B2 = (1 1 + 2 2 ). Assim,
reconhecemos que a colecao de todos os autovetores de B com autovalor gera um sub-espaco, que
denotaremos por M , do espaco de Hilbert H em questao. Mais que isso, M e um sub-espaco fechado
de H. Isso pode ser provado com a observacao que se n , n , e uma seq
uencia de vetores de M que
converge a H, entao a continuidade de B diz-nos que B = B lim n = lim Bn = lim n =
n
n
n
, provando que M . Para futura referencia reunimos essas observacoes na seguinte proposicao:


Proposi
c
ao 26.6 Se B e um operador limitado agindo em um espaco de Hilbert H, e e um
autovalor de B, ent
ao a coleca
o de todos os autovetores de B com autovalor e um sub-espaco linear
fechado de H.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1148/1304

Se M , o sub-espaco gerado pelos autovetores de B com autovalor , tiver dimensao finita, dizemos
que tem degenerescencia finita. Nesse caso, define-se a multiplicidade (geometrica) de como sendo
a dimensao de M .
Autovalores e autovetores de operadores auto-adjuntos
Se A e um operador limitado e auto-adjunto agindo em espacos de Hilbert H (de dimensao finita
ou nao) podem ser estabelecidas certas propriedades basicas sobre seus autovalores e autovetores (caso
existam), os quais estao resumidos na proxima proposicao.
Proposi
c
ao 26.7 Se A e um operador limitado e auto-adjunto agindo em um espaco de Hilbert H,
ent
ao seus autovalores (se existirem) s
ao n
umeros reais. Fora isso, os autovetores associados a autovalores distintos de A s
ao ortogonais entre si.
2
Prova. Se e um autovalor de A e v 6= 0 um autovetor de A com autovalor entao, como A e
auto-adjunto, tem-se hv, AviH = hAv, viH . Como v e um autovetor, o lado esquerdo vale hv, viH
e o lado direito vale hv, viH . Dessa forma, ( )hv, viH = 0. Como v 6= 0 isso implica = ,
ou seja, e real. Sejam agora 1 e 2 dois autovalores de A, que suporemos distintos. Seja v1
autovetor de A com autovalor 1 e v2 autovetor de A com autovalor 2 . Temos, por A ser autoadjunto, hv1 , Av2 iH = hAv1 , v2 iH . O lado esquerdo vale 2 hv1 , v2 iH e o lado direito 1 hv1 , v2 iH
(lembrar que 1 e real). Assim, (2 1 )hv1 , v2 iH = 0. Como 2 6= 1 , segue que hv1 , v2 iH = 0, que e
o que se queria provar.

Autovalores e autovetores de operadores unit


arios
Para operadores unitarios valem afirmacoes analogas.
Proposi
c
ao 26.8 Se U e um operador unit
ario agindo em um espaco de Hilbert H, ent
ao seus autovalores (se existirem) s
ao n
umeros complexos de m
odulo 1. Fora isso, os autovetores associados a
autovalores distintos de U s
ao ortogonais entre si.
2
Prova. Seja U unitario, um autovalor de U e v 6= 0 um autovetor de U com autovalor . Como
U e unitario tem-se hU v, U viH = hv, U U viH = hv, viH . Como v e um autovetor, o lado esquerdo
vale hv, viH . Assim, (||2 1)hv, viH = 0. Como v 6= 0 isso implica || = 1. Sejam agora 1 e 2
dois autovalores distintos de U e sejam v1 autovetor de U com autovalor 1 e v2 autovetor de U com
autovalor 2 . Temos, por U ser unitario, hU v1 , U v2 iH = hv1 , U U v2 iH = hv1 , v2 iH . O lado esquerdo
vale 1 2 hv1 , v2 iH = 21 (lembre-se que 1 e um n
umero complexo de modulo 1 e, portanto 1 = 1
1 ).


Assim, 21 1 hv1 , v2 iH = 0. Como 2 6= 1 , segue que hv1 , v2 iH = 0, que e o que se queria provar.
Sub-espa
cos invariantes

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1149/1304

Seja H um espaco de Hilbert e seja M um sub-espaco de H. Se A e um operador limitado agindo


em H, dizemos que M e invariante pela aca
o de A se A M para todo M. Com essa definicao
vale a seguinte proposicao importante.
Proposi
c
ao 26.9 Se um sub-espaco M e invariante pela aca
o de um operador A B(H), ent
ao M
e invariante pela aca
o de A .
2
Prova. Se e sao dois vetores arbitrarios tais que M e M entao hA , i = h, Ai = 0,
pois A M, por hipotese. Logo, A e ortogonal a todo vetor M, o que equivale a dizer que
A M . Como e um vetor arbitrario de M , segue que M e invariante por A .
O seguinte corolario evidente sera repetidamente empregado.
Corol
ario 26.2 Se um sub-espaco M de um espaco de Hilbert H e invariante pela aca
o de um operador
auto-adjunto A B(H), ent
ao M e igualmente invariante pela aca
o de A.
2
Projetores e Projetores Ortogonais
Um operador linear P agindo em um espaco de Hilbert H e dito ser um projetor se P 2 = P e e dito
ser um projetor ortogonal se for um projetor e se for auto-adjunto: P = P .
Um exemplo importante de projetor ortogonal e representado por projetores sobre sub-espacos unidimensionais
gerados por vetores. Seja v um vetor cuja norma assumiremos ser 1, ou seja, kvk =
p
hv, vi = 1. Definimos o projetor Pv sobre o sub-espaco gerado por v por
Pv u := hv, ui v,

para todo vetor u H. Que Pv e um projetor ortogonal foi demonstrado no caso de espacos vetoriais
de dimensao finita a` pagina 184 e seguintes e como a demonstracao geral e identica (e elementar), nao
iremos repet-la aqui. Um fato crucial sobre projetores como Pv e o seguinte. Se u e v sao dois vetores
ortogonais, ou seja, se hu, vi = 0 entao Pu Pv = Pv Pu = 0. Novamente a prova (elementar) encontra-se
a` pagina 184 e seguintes.
A definicao do projetor ortogonal Pv , acima, pode ser generalizada. Seja M um sub-espaco fechado
de um espaco de Hilbert H. Pelo Teorema da Decomposicao Ortogonal, Teorema 25.2, pagina 1093,
todo vetor H pode ser escrito na forma = M + M , com M M e M M . Definimos,
elementar provar que PM , assim
entao, o projetor PM sobre sub-espaco fechado M por PM := M . E
tambem facil provar
definido, satisfaz (PM )2 = PM e (PM ) = PM , ou seja, e um projetor ortogonal. E
que todo projetor ortogonal em um espaco de Hilbert H e da forma PM para algum sub-espaco fechado
M de H. Para ver isso, basta provar que a imagem de qualquer projetor ortogonal e um sub-espaco
fechado de H.
ltimo paragrafo.
E. 26.15 Exerccio. Demonstre as afirmacoes do u
O Adjunto em Espa
cos de Banach

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1150/1304

Faremos aqui uma breve mencao ao fato que o conceito de adjunto de operadores possui uma
generalizacao para operadores contnuos agindo em espacos de Banach, em geral.
Seja X um espaco de Banach e X = B(X,

) seu dual topologico que, como ja observamos na


|l(x)|
, l X .
secao 26.1.2, e um espaco de Banach com norma klkX = sup
xX, x6=0 kxkX

Sejam X e Y espacos de Banach e T : X Y um operador limitado agindo entre X e Y . Definimos


seu dual T 0 como sendo o operador T 0 : Y X definido da seguinte forma: para l Y , T l0 e o
funcional linear contnuo definido de tal forma que a cada x X associa o n
umero complexo l(T x):
(T 0 l)(x) = l(T x).
Que T 0 e limitado segue da desigualdade |(T 0 l)(x)| = |l(T x)| klkY kT xkY klkY kT kkxkX , que
implica
|(T 0 l)(x)|
0
kT k klkY .
kT lkX = sup
kxkX
xX, x6=0
Em particular, isso diz-nos que

kT 0 k =

kT 0 lkX
kT k .
lY , l6=0 klkY
sup

(26.27)

A linearidade de T 0 e tambem facil de constatar, pois, para quaisquer l, l 0 Y , , ,


(T 0 (l +l0 ))(x) = (l +l0 )(T x) = l(T x)+l0 (T x) = (T 0 l)(x)+(T 0 l0 )(x) = (T 0 l +T 0 l0 )(x),
mostrando que T 0 (l + l0 ) = T 0 l + T 0 l0 .
O assim definido operador linear limitado T 0 B(Y , X ) e denominado adjunto de T .

Com uso do Teorema de Hahn-Banach e possvel mostrar que kT 0 k = kT k. De fato, pela Proposicao
26.4, pagina 1132, sabemos que existe para cada x0 X um lT x0 Y com klT x0 kY = 1 e tal que
lT x0 (T x0 ) = kT x0 kY . Assim,
kT 0 lT x0 kX
= kT 0 lT x0 kX =
klT x0 kY
Isso implica que
kT 0 k =
para cada x0 X. Logo,

|(T 0 lT x0 )(x)|
|(T 0 lT x0 )(x0 )|
|lT x0 (T x0 )|
kT x0 kY
sup

=
=
,
kxkX
kx0 kX
kx0 kX
kx0 kX
xX, x6=0
(26.28)
kT 0 lkX
kT 0 lT x0 kX

klT x0 kY
lY , l6=0 klkY
sup

kT 0 k

(26.28)

kT x0 kY
kx0 kX

kT x0 kY
=: kT k .
x0 X, x0 6=0 kx0 kX

Junto com (26.27), isso implica kT 0 k = kT k.

sup

Para futura referencia coletamos os fatos provados acima na seguinte proposicao:

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1151/1304

Proposi
c
ao 26.10 Sejam X e Y dois espacos de Banach e T : X Y um operador linear e limitado:
T B(X, Y ). Ent
ao, T 0 : Y X , o chamado adjunto de T , definido por
(T 0 l)(x) = l(T x)
para l Y e x X, e igualmente um operador linear e limitado, ou seja, T 0 B(Y , X ) e satisfaz
kT 0 k = kT k.
2
No caso em que X = Y = H, onde H e um Hilbert, ha uma distincao sutil entre T 0 e T . O primeiro
e uma aplicacao de H em H enquanto que o segundo e uma aplicacao de H em H. A relacao entre
ambos e estabelecida pela aplicacao R : H H, definida em (26.5), pagina 1124. Tem-se, a saber,
T 0 = R1 T R.
E. 26.16 Exerccio. Mostre isso.

A aplicacao T T 0 e sempre linear enquanto que, no caso de espacos de Hilbert, a aplicacao


T T e anti-linear. Isso esta de acordo com T 0 = R1 T R, pois R1 e tambem anti-linear.
A Norma de Operadores Auto-Adjuntos Limitados
Ha um fato especial sobre a norma de operadores auto-adjuntos limitados agindo em um espaco de
Hilbert do qual faremos uso repetido no que seguira.
Teorema 26.12 Se T e um operador auto-adjunto limitado em um espaco de Hilbert H ent
ao
kT k =

|h, T i|
=
kk2
H, 6=0
sup

sup
H, kk=1

|h, T i|.

(26.29)
2

Prova. Se x, y H, tem-se hx, T yi = hT x, yi = hy, T xi. Logo,


h(x + y), T (x + y)i = hx, T xi + hx, T yi + hy, T xi + hy, T yi = hx, T xi + 2Re(hx, T yi) + hy, T yi,
e
h(x y), T (x y)i = hx, T xi hx, T yi hy, T xi + hy, T yi = hx, T xi 2Re(hx, T yi) + hy, T yi.
Dessas duas expressoes conclui-se que
4Re(hx, T yi) = h(x + y), T (x + y)i h(x y), T (x y)i.
Definindo-se
T =

|h, T i|
kk2
H, 6=0
sup

(26.30)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1152/1304

e claro que
|h, T i| Tkk2

para todo H. Retornando a` (26.30), tem-se

4|Re(hx, T yi)| |h(x+y), T (x+y)i|+|h(xy), T (xy)i| T(kx+yk2 +kxyk2 ) = 2T(kxk2 +kyk2 ).


Na u
ltima igualdade usamos a identidade do paralelogramo (2.20), pagina 125.
Substituindo y por y, com

e || = 1, a u
ltima desigualdade fica

|Re(hx, T yi)|

1
T(kxk2 + kyk2 ).
2

Podemos escolher de modo que hx, T yi = |hx, T yi| (por que?). Assim, ficamos com
|hx, T yi|

1
T(kxk2 + kyk2 ).
2

Vamos provisoriamente supor que kT yk 6= 0. Escolhendo x =


kT yk kyk

kyk
T y, a u
ltima desigualdade fica
kT yk

1
T(kyk2 + kyk2 ) = Tkyk2 ,
2

ou seja,
kT yk Tkyk.

Como essa desigualdade vale trivialmente caso kT yk = 0, a mesma deve valer para todo y H.
Claramente isso diz que
kT k T.
(26.31)
Por outro lado, tem-se pela desigualdade de Cauchy-Schwarz que, para todo H,
|h, T i| kk kT k kT k kk2.
Logo,
T =

|h, T i|
kT k.
kk2
H, 6=0
sup

Comparando essa desigualdade a (26.31), conclumos que kT k = T, que e o que queramos provar.

26.3

Algebras
de Banach e Algebras
C

26.3.1

Algebras
de Banach

Algebras
Associativas
Uma algebra sobre o corpo dos complexos e um espaco vetorial A sobre o corpo dotado de uma
operacao de produto binaria dita produto da algebra, de modo que as seguintes propriedades sao
satisfeitas

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1153/1304

1. O produto da algebra e distributivo em relacao a soma vetorial: para todos a, b e c A valem


a (b + c) = a b + a c e (a + b) c = a c + b c.
2. O produto por escalares comuta com o produto da algebra e e distributivo em relacao a ele: para
todos a, b V e vale
(a b) = (a) b = a (b).
Uma algebra A e dita ser uma a
lgebra comutativa se para todos a, b A tivermos
a b = b a.
Uma algebra e dita ser uma a
lgebra associativa se para todos a, b e c A tivermos
a (b c) = (a b) c.
Se A e uma algebra associativa, podemos sem ambig
uidade denotar o produto de dois de seus
elementos a, b A simplesmente por por ab.

Algebras
com Involu
c
ao
Uma algebra associativa sobre o corpo dos complexos A e dita ter uma involuca
o se existir uma
operacao unaria : A A, que para todo a A associa um elemento denotado por a A, com as
seguintes propriedades:
1. (a ) = a para todo a A.
2. (ab) = b a para todos a, b A.
3. (a + b) = a + b para todos ,
4. Se a algebra possuir uma unidade

e todos a, b A.

= .

Algebras
que possuem uma involucao sao ditas ser involutivas ou algebras A .
A operacao de adjuncao para operadores limitados em espacos de Hilbert e a inspiracao da definicao
de involucao. Vamos a outros exemplos. Seja A = C( , ) a algebra das funcoes contnuas
facil ver que f 7 f dada por f (x) = f (x) define uma
com o produto usual: (f g)(x) = f (x)g(x). E
involucao. A aplicacao f 7 f dada por f (x) = f (x) tambem define uma involucao.


Seja A = C( ,


) C( ,


) com o produto (f (x), g(x)) (l(x), m(x)) = (f (x)l(x), g(x)m(x)).

A aplicacao (f, g) 7 (f, g) = (f , g) e uma involucao. A aplicacao (f, g) 7 (f, g) = (g, f )


e tambem uma involucao. A aplicacao (f (x), g(x)) 7 (f (x), g(x)) = (g(x), f (x)) e igualmente
uma involucao.
E. 26.17 Exerccio. Verifique!

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1154/1304

Seja A = B(H), a algebra dos operadores limitados agindo em um espaco de Hilbert H e seja
d B(H) tal que d2 = e d = d , onde d e a adjunta usual de d. Entao A 3 a 7 a := d a d define
uma involucao em A.
E. 26.18 Exerccio. Verifique!

Algebras
de Banach
Uma algebra de Banach B e um espaco de Banach, portanto um espaco vetorial normado e completo
em relacao a essa norma, dotado de um produto associativo para o qual valha kxyk kxkkyk para
todos x, y B. Fora isso, se a algebra possuir uma unidade , requeremos tambem que k k = 1.

Algebras
de Banach-
Uma algebra de Banach B com involucao e dita ser uma a
lgebra de Banach-, ou uma algebra B ,
se a involucao e a norma satisfizerem kak = ka k para todo a B.
Note-se que se A e uma algebra B vale ka ak ka k kak = kak2

Algebras
C
Uma algebra C e dita ser uma algebra C se for uma algebra de Banach- com a propriedade
adicional que ka ak = kak2 para todo a C. Essa propriedade e denominada propriedade C .

Exemplo. Em funcao do Teorema 26.11, pagina 1144, toda algebra B(H) e uma algebra C com
unidade.

Exemplo. Mostraremos no Corolario 26.13, pagina 1207, que o conjunto dos operadores compactos
agindo em um espaco de Hilbert H e tambem uma algebra C , sem unidade caso H nao tenha dimensao
finita.
O estudo de propriedades de algebras C e de grande importancia para a compreensao da algebra
de operadores limitados em espacos de Hilbert. Adiante teremos a oportunidade de explicitar isso.
Tambem na Fsica Quantica algebras C desempenham um papel fundamental. Vide [51] ou a discussao
que segue o Teorema Espectral.
Continuidade de opera
co
es alg
ebricas em
algebras de Banach
Se B e uma algebra de Banach e wn e uma seq
uencia em B que converge em norma a w B,
entao e elementar provar que para todo v B tem-se lim (v + wn ) = v + lim wn . Isso estabelece
n
n
igualmente
que a soma e uma operacao contnua em B na topologia induzida pela norma de B. E
facil provar que a multiplicacao por escalares e uma operacao contnua em B na topologia induzida
pela norma de B. Provemos tambem que o produto (`a esquerda ou a` direita) e contnuo, ou seja,
que lim (vwn ) = v lim wn . Para tal, observemos que vwn = v(wn w) + vw para todo n. Assim,
n

lim (vwn ) vw = lim v(wn w). Agora, kv(wn w)k kvk kwn wk 0 para n . Logo,
n
n


lim v(wn w) = 0 e, portanto, lim (vw) = vw = v lim wn .
n

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1155/1304

Se B e uma algebra de Banach-, entao tambem a involucao e contnua na topologia induzida pela
norma de B, como e elementar de se provar, pois se wn e uma seq
uencia em B que
 converge
 em norma
a w B, entao kwn w k = k(wn w) k = kwn wk 0 para n . Assim, lim wn = lim wn ,
n
n
o que estabelece a continuidade da involucao.
Para futura referencia, reunimos as observacoes acima na seguinte proposicao.
Proposi
c
ao 26.11 Se B e uma a
lgebra de Banach com norma kk ent
ao as operaco
es de soma, produto
por escalares e produto (`
a esquerda ou a
` direita) s
ao contnuas na topologia induzida pela norma. Se
B e uma a
lgebra de Banach- ent
ao tambem a involuca
o e contnua na topologia induzida pela norma.
2
O leitor nao deve aborrecer-se com a aparente trivialidade das assercoes acima, pois ha topologias
em algebras de Banach nas quais o produto e a involucao nao sao contnuas! Para tais topologias todo
o cuidado e necessario.

26.3.2

A Inversa de Operadores Limitados

No intuito de preparar a futura discussao sobre o nocao de espectro de operadores em espacos de Banach,
facamos aqui alguns comentarios relativos a` nocao de inversa de operadores em espacos vetoriais e, em
particular, em espacos de Banach.
Recordando alguns fatos gerais e um pouco de nota
c
ao
Se V e W sao espacos vetoriais e A : V W e uma aplicacao linear, definimos
Ker (A) := {v V| Av = 0} ,
Ran (A) := {w W| w = Av para algum v V} .
Ker (A) e denominado n
ucleo de A e Ran (A) e denominado a imagem ou alcance (= range) de A.
Dizemos que A possui um n
ucleo trivial se Ker (A) = {0}. Nao custa lembrar tambem que se V e W sao
espacos vetoriais e A : V W e uma aplicacao linear entao A e injetora se e somente se Ker (A) = {0}
e A e sobrejetora se e somente se Ran (A) = W. Logo, A e bijetora se e somente se Ker (A) = {0} e
Ran (A) = W. Caso A seja bijetora denotaremos, como sempre, por A1 : W V a aplicacao inversa
elementar mostrar que A1 e tambem linear.
de A. E
A seguinte proposicao elementar e importante e sera implicitamente empregada no que segue.
Proposi
c
ao 26.12 Seja V um espaco vetorial e seja A : V V uma aplicaca
o linear. Ent
ao A e
bijetora se e somente se existir uma aplicaca
o linear B : V V tal que AB = e BA = . Se uma
tal B existir, ser
au
nica.
Prova. Se A e bijetora a aplicacao inversa A1 faz o servico desejado. Suponhamos agora que exista
B como acima. Se A nao e injetora, entao existem x, y V distintos com Ax = Ay. Aplicando B a`
esquerda e usando BA = , conclumos que x = y, uma contradicao. Se A nao e sobrejetora, existe

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1156/1304

x V tal que Ay x 6= 0 para todo y V. Se assim e, tomemos y = Bx. Concluiramos de AB =


que 0 6= ABx x = x x, um absurdo. A unicidade de B segue da observacao que se B 0 : V V
for tambem tal que AB 0 = e B 0 A = , entao aplicando B a` esquerda na primeira relacao e usando a
associatividade teremos B = B(AB 0 ) = (BA)B 0 = B 0 = B 0 .
Um comentario pertinente a` Proposicao 26.12 e o seguinte. No espaco vetorial de dimensao finita
V = n , a relacao AB = implica BA = (A e B sendo aqui elementos de Mat ( , n)). Em espacos
de dimensao infinita, porem, isso nao e sempre verdade e e preciso requerer tanto AB = quanto
BA = da inversa de A. Como exemplo, considere-se o espaco vetorial S( ) de todas as seq
uencias de
n
umeros complexos (vide Secao 16.4.1, pagina 852). Defina-se A : S( ) S( ) e B : S( ) S( )
por
A(a1 , a2 , a3 , a4 , a5 , . . .) = (0, a1 , a2 , a3 , a4 , . . .) ,
B(a1 , a2 , a3 , a4 , a5 , . . .) = (a2 , a3 , a4 , a5 , a6 , . . .) .
Entao,
BA(a1 , a2 , a3 , a4 , a5 , . . .) = (a1 , a2 , a3 , a4 , a5 , . . .) ,
AB(a1 , a2 , a3 , a4 , a5 , . . .) = (0, a2 , a3 , a4 , a5 , . . .) ,
provando que BA =

mas AB 6= .

Fatos gerais sobre a inversa de operadores em B(X)


Vamos analisar as varias situacoes que podem ocorrem com operadores limitados agindo em um
espaco de Banach X no que concerne a sua invertibilidade ou nao-invertibilidade. Naturalmente, um
operador limitado V B(X) agindo em um espaco de Banach X pode ser bijetor ou nao e, se nao o
for, varios sub-casos sao possveis. Temos o seguinte quadro:
1. V e bijetor.
Se V B(X) e um operador limitado e e bijetor entao, pelo Teorema da Aplicacao Inversa,
Teorema 26.8, pagina 1140, V 1 e igualmente um elemento de B(X).
2. V nao e bijetor.
Se V B(X) nao e bijetor, entao ou V nao e injetor ou nao e sobrejetor (ou ambos).
(a) V n
ao e injetor.
Se V nao e injetor, entao Ker (V ), possui pelo menos um vetor nao-nulo e V 1 nao existe
enquanto operador agindo Ran (V ).
(b) V n
ao e sobrejetor mas e injetor.
Se V nao e sobrejetor, podem ocorrer duas coisas: ou Ran (V ) e denso em X ou nao e.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1157/1304

i. Ran (V ) e denso em X.
Se Ran (V ) e denso em X e V e injetor, entao V : X Ran (V ) e bijetor e, portanto,
possui uma inversa V 1 : Ran (V ) X. Essa inversa, porem, nao pode ser limitada,
como mostra o seguinte argumento. Se o fosse, V 1 poderia ser estendido (pelo Teorema
BLT, Teorema 26.1, pagina 1119) ao fecho de Ran (V ), que e X, por hipotese. Denotemos
por W essa extensao. Como a imagem dessa extensao e a de V 1 sao todo X, essa
extensao nao pode ser injetora e, portanto, nao e a inversa de um operador. Ocorre,
porem, que pela definicao de W dada pelo Teorema BLT, vale para todo x X que
V 1 y. Assim, como V e contnuo,
W x = lim
yx
yRan(V )

V Wx = V

lim
yx

V 1 y =

yRan(V )

V V 1 y =
lim
yx
yRan(V )

lim

yx
yRan(V )

y = x.

Alem disso, como W estende V 1 , a qual e definida em Ran (V ), tem-se igualmente


W V x = V 1 V x = x para todo x X. Isso diz-nos que V e a inversa de W em todo X,
uma contradicao.
Assim, se Ran (V ) e denso em X e V e injetor entao V 1 : Ran (V ) X existe mas nao
e limitada.
ii. Ran (V ) n
ao e denso em X.
Resta ainda o caso em que Ran (V ) nao e denso em X. Aqui, podemos ter V injetora
ou nao. Se V nao for injetora, entao V possui n
ucleo nao-trivial e V 1 nao pode ser
definida em Ran (V ). Se V for injetora, entao V nao possui um autovetor nao-nulo com
autovalor 0 e V 1 pode ser definida em Ran (V ).
(c) V n
ao e sobrejetor nem injetor.
Aqui estamos de volta ao caso 2a e V 1 nao existe em Ran (V ).
Resumindo, temos as seguintes conclusoes:
Teorema 26.13 Se V B(X) e um operador limitado agindo em um espaco de Banach X, tem-se as
seguintes situaco
es mutuamente excludentes:
1. V e bijetor e V 1 existe em todo X e e limitado.
2. V n
ao e bijetor, e tem-se os seguintes sub-casos:
(a) V n
ao e injetor, Ker (V ) e n
ao-trivial e V 1 n
ao pode ser definida em Ran (V ).
(b) V e injetor e n
ao e sobrejetor, Ran (V ) e denso em X e Ker (V ) = {0}, sendo que V 1 :
Ran (V ) X existe mas n
ao e limitada.

(c) V e injetor e n
ao e sobrejetor, Ran (V ) n
ao e denso em X e Ker (V ) = {0}, sendo que
V 1 : Ran (V ) X existe, podendo ser limitada ou n
ao.
2
A proposicao seguinte e tambem relevante e sera empregada quando da discussao sobre o espectro
de operadores auto-adjuntos em espacos de Hilbert.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1158/1304

Proposi
c
ao 26.13 Se V B(X) e um operador limitado agindo em um espaco de Banach X tal que
V 1 : Ran (V ) X existe e e limitada, ent
ao Ran (V ) e um sub-espaco fechado de X.
2
Prova. Seja yn = V xn , n uma seq
uencia em Ran (V ) que converge a y X. Temos que xn = V 1 yn .
Assim, kxn xm k kV 1 k kyn ym k. Como yn e uma seq
uencia convergente, e de Cauchy e, pela u
ltima
desigualdade, xn tambem o e. Seja x X o limite da seq
uencia xn . Temos que yV x = yyn +V xn V x
para todo n e, portanto, ky V xk ky yn k+kV k kxn xk. Agora, tomando n e lembrando
que yn y e xn x, conclumos que ky V xk = 0, ou seja, y = V x, o que prova que y Ran (V ).
Isso demonstra que Ran (V ) e fechado.


A Proposicao 26.13 diz-nos que no item 2c do Teorema 26.13, Ran (V ) sera um sub-espaco fechado
proprio de X caso V 1 seja limitada.
A inversa em
algebras de Banach
Varios resultados gerais sobre a inversa de operadores podem ser estabelecidos no contexto geral
de algebras de Banach com unidade, para entao particularizarem-se para algebras como como B(X) ou
B(H), que sao de algebras Banach de operadores, com unidade, agindo em espacos de Banach ou de
Hilbert. Nas paginas que seguem trataremos dessa analise geral para depois estudarmos aqueles casos
particulares.
Seja doravante B uma algebra de Banach com unidade. Um elemento w B e dito ser invertvel se
existir v B tal que vw = wv = . Se um tal v existe ele e u
nico, como mostra o seguinte argumento
0
0
0
elementar: se v tambem satisfaz = v w = wv , entao, multiplicando-se a` direita por v e usando-se
a associatividade, teremos v = (v 0 w)v = v 0 (wv) = v 0 = v 0 . Se v satisfaz vw = wv = , e dito ser a
inversa ou elemento inverso de w e e denotado por w 1 .
Se B uma algebra de Banach com unidade e w B e invertvel entao, w 1 w = ww 1 = implica,

tomando-se o adjunto, w (w 1 ) = (w 1 ) w = , o que significa que w e tambem invertvel e vale



(26.32)
(w )1 = w 1 .
Pela Proposicao 26.12, acima, no caso da algebra de Banach- B(X), dos operadores lineares
contnuos agindo em um espaco de Banach X, a nocao de invertibilidade acima coincide coma usual.

Vamos designar por Inv (B) o conjunto dos elementos invertveis de uma algebra de Banach com
bastante evidente que Inv (B) e um grupo com relacao a operacao de produto em B. Em
unidade B. E
verdade, trata-se de um grupo contnuo como mostraremos mais adiante.
Na teoria de operadores e muito importante conhecer condicoes suficientes que garantam a invertibilidade de operadores. No contexto de algebras de Banach com unidade a seguinte proposicao e
fundamental.
Proposi
c
ao 26.14 Seja B uma a
lgebra de Banach com unidade. Ent
ao, para todo w B com kwk < 1
existe ( w)1 , a saber, dado por
( w)

:=

X
k=1

wk ,

(26.33)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1159/1304

sendo que a serie ao lado direito converge na norma de B. A serie em (26.33) e denominada serie de
Neumann12 .
2
n

+ w k , entao, para

Prova. Provemos primeiramente que a serie de Neumann converge. Se sn :=


m < n vale sn sm =
ksn sm k

n
X

w . Logo,

k=m+1

k=m+1

k=1

kw k

n
X

k=m+1

kwk = kwk

A serie numerica kwkk converge a


k=0

1
1kwk

m+1

nm1
X
k=0

kwk kwk

m+1

X
k=0

kwkk =

kwkm+1
.
1 kwk

pois kwk < 1. Por essa mesma razao, e claro que kwkm+1

pode ser feito menor que qualquer  > 0 prescrito, desde que m seja grande o suficiente. Isso provou
e uma seq
uencia de Cauchy na norma de B e, portanto, converge. Seja, v B o seu
que sn , n
limite. Teremos


wv = w + w

lim

n
X

k=1

= w + lim

n
X
k=1

k+1

= w + lim

n
X

w +w

n+1

k=1

= lim w

n+1

+ lim

w
n
X
k=1

wk = v

onde acima usamos a continuidade do produto em B (Proposicao 26.11, pagina 1155) e o fato que
lim w n+1 = 0, pois kw n+1 k kwkn+1 0 para n , pois kwk < 1. Logo, ( w)v = v(v ) = .
n
Analogamente,

vw = w +

lim

n
X
k=1

wk

w = w + lim

n
X
k=1

w k+1 = w + lim

n
X
k=1

= lim w
n

w k + w n+1 w
n+1

+ lim

n
X
k=1

wk = v

e conclumos que v( w) = v (v ) = . Isso completa a demonstracao.


O seguintes fato sera utilizado adiante.
Proposi
c
ao 26.15 Se B e a
lgebra de Banach com unidade e u, v B, ent
ao
somente se vu Inv (B).
12

Carl Neumann (1832-1925).

uv Inv (B) se e
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1160/1304

Prova. Se uv Inv (B) e w = ( uv)1 , e elementar constatar que ( vu)( + vwu) =


( + vwu)( vu), pois
( vu)( + vwu) =

vu + vwu vuvwu =

vu + v ( uv)w u =
| {z }

vu + vu =

vu + vu =

( + vwu)( vu) =

vu + vwu vwuvu =

vu + v w( uv) u =
| {z }
=

o que mostra que

vu Inv (B) com ( vu)1 = ( + vwu). A recproca e evidente.

Propriedades topol
ogicas do grupo dos operadores invertveis
A Proposicao 26.14 tem um corolario que usaremos oportunamente, o qual afirma que elementos de
uma algebra de Banach que estejam suficientemente proximos de um elemento invertvel sao tambem
invertveis.
Corol
ario 26.3 Seja B uma a
lgebra de Banach com unidade e seja w um elemento invertvel de B.
Suponhamos que v B seja tal que k vw 1 k < 1, o que ocorre, por exemplo, se kv wk < kw 1 k1 .
Ent
ao v e invertvel e
!

X

k
+
vw 1
v 1 = w 1
,
k=1

sendo a serie do lado direito convergente na norma de B.

Prova. Tem-se v = v w +w = ( (w v)w 1 )w. Pela Proposicao 26.14, (w v)w 1 sera invertvel
se k(w v)w 1 k < 1. Como k(w v)w 1 k kw vk kw 1 k, isso sera satisfeito se kv wk < kw 1 k1 .
Teremos entao, novamente pela Proposicao 26.14,
!
!

X
X

k
.
+
[(w v)w 1 ]k = w 1
+
vw 1
v 1 = w 1 ( (w v)w 1 )1 = w 1
k=1

k=1

Disso e imediato o seguinte fato:


Corol
ario 26.4 Seja B uma a
lgebra de Banach com unidade. Ent
ao o grupo Inv (B) dos elementos
invertveis de B e um subconjunto aberto de B.
2
Para estabelecermos que Inv (B) e tambem um grupo contnuo usaremos o fato descrito na proposicao seguinte.
Proposi
c
ao 26.16 Seja B uma a
lgebra de Banach com unidade. Ent
ao, a aplicaca
o que a cada w
Inv (B) associa sua inversa w 1 e contnua na topologia da norma de B.
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1161/1304

Prova. Seja v Inv (B) fixado e tomemos u Inv (B) tal que ku vk <  com  > 0 escolhido pequeno
claro que
o suficiente de modo que kv 1 k < 1. Que tal e possvel garante-nos o Corolario 26.4. E
1 1
1
1
1
u = v + (u v) = v( + v (u v)), de maneira que u = [ + v (u v)] v . Logo,
n
o
1
1
1
1
u v
=
+ v (u v)

v 1 .
Assim, como pela escolha de  temos kv 1 (u v)k kv 1 k < 1, podemos por (26.33) escrever
"
#
X


m
u1 v 1 =
(1)m v 1 (u v)
v 1 .
m=1

Tem-se, entao,
ku1 v 1 k

"

m=1

kv 1 km ku vkm kv 1 k

"

m=1

kv 1 k

m

kv 1 k =

kv 1 k2
.
1 kv 1 k

Portanto, ku1 v 1 k 0 quando ku vk 0, provando a continuidade da operacao de inversao.


Das Proposicoes 26.16 e 26.11 conclumos:
Proposi
c
ao 26.17 Se B e a
lgebra de Banach com unidade ent
ao Inv (B) e um grupo contnuo na
topologia induzida em Inv (B) pela norma de B.
2

26.3.3

O Espectro de Operadores em Algebras


de Banach

Na presente secao apresentaremos a nocao de espectro de operadores em algebras de Banach. Todos


os desenvolvimentos que seguem terao importancia para as secoes posteriores. Facamos notar o leitor
que alguns dos resultados que apresentaremos sao gerais, sendo validos em quaisquer algebras de
Banach, outros sao especficos de algebras C . A presente secao e introdutoria ao estudo do espectro
de operadores agindo em espacos de Banach e de Hilbert que empreenderemos na Secao 26.5, pagina
1193.
A no
c
ao de espectro de operadores em
algebras de Banach
Se B e algebra de Banach com unidade e u B, denotamos por (u) o chamado conjunto resolvente
de u, definido por (u) := { | u Inv (B)}. O chamado espectro de u, denotado por (u), e
definido por
(u) := { | u 6 Inv (B)} ,
ou seja, (u) =

\ (u).

Fatos b
asicos sobre o espectro de operadores em
algebras de Banach e Banach-
Uma conseq
uencia imediata da Proposicao 26.15 e o seguinte:

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1162/1304

Proposi
c
ao 26.18 Se B e uma a
lgebra de Banach com unidade e u, v B, ent
ao (uv) \ {0} =
(vu) \ {0}, ou seja, o espectro de uv pode diferir do de vu apenas no conjunto {0}.
2
Prova. Se 6= 0, entao ( uv) = ( 1 uv), que pela Proposicao 26.15, pagina 1159, e invertvel
se e somente se ( 1 vu) o for.
Uma conseq
uencia imediata e o seguinte corolario, o qual revela uma propriedade de invariancia do
espectro.
Corol
ario 26.5 Se B e uma a
lgebra de Banach com unidade e u, v B com u Inv (B), ent
ao
1
(uvu ) = (v).
2
Prova. Pela Proposicao 26.18, e imediato que (uvu1 ) \ {0} = (v) \ {0}. Agora, 0 6 (v) se e
somente se v 6 Inv (B). Assim, 0 (v) se e somente se v Inv (B). Mas, v Inv (B) se e somente se
uvu1 Inv (B) o que, por sua vez ocorre se e somente se 0 (uvu1 ). Logo, 0 (v) se e somente
se 0 (uvu1 ).
As duas proposicoes que seguem serao repetidamente empregadas.
Proposi
c
ao 26.19 Seja B uma a
lgebra de Banach com unidade e u Inv (B) um elemento invertvel
de B. Ent
ao,

u1 = { | 1 (u)} .

tambem claro que


Prova da Proposicao 26.19. Se u e invertvel, entao 0 (u), ou seja, 0 6 (u). E
1
1
para 6= 0 ( u) = u (
u ), o que claramente mostra que (u) se e somente se
1
1
(u ).
Denotaremos (u)1 := { | 1 (u)}. O que a proposicao acima afirma e que se u Inv (B),
entao (u1 ) = (u)1 .
Proposi
c
ao 26.20 Seja B uma a
lgebra de Banach- com unidade e u Inv (B) um elemento invertvel
de B. Ent
ao,
(u ) = { | (u)} .
2

Prova da Proposicao 26.20. ( u) = u . Logo, por (26.32), (u) se e somente se
(u ).
Denotaremos (u)cc := { | (u)}. O que a proposicao acima afirma e que (u ) = (u)cc .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1163/1304

Seja B uma algebra de Banach com unidade e seja um polinomio p(z) = a0 + a1 z + . . . + an z n


definido para z . Para u B definimos p(u) := a0 + a1 u + . . . + an un B. Para polinomios de
operadores, vale a seguinte propriedade importante, conhecida como Teorema da Aplicacao Espectral:
Teorema 26.14 (Teorema da Aplica
c
ao Espectral) Sejam B uma a
lgebra de Banach com unidade e u B. Ent
ao para todo polin
omio p vale
(p(u)) = p((u)) := {p(), (u)} .
2
Prova. Vamos supor que p(z) = a0 + a1 z + . . . + an z n seja de grau n 1, pois no caso de um polinomio
constante a afirmativa e trivial. Tomemos (p(u)), que e nao-vazio, como sabemos, e sejam
1 , . . . , n as n razes do polinomio p(z) em . Entao p(z) = an (z 1 ) (z n ), o que
implica p(u) = an (u1 ) (un ). Se nenhum dos i pertencesse a (u) entao cada (uj )
seria invertvel, assim como o produto an (u 1 ) (u n ), contrariando o fato de (p(u)).
Logo, algum dos i pertence a (u). Como p(i ) = , isso diz que (p(u)) {p(), (u)}.
Provemos agora a recproca. Ja sabemos que (u) e nao-vazio. Para (u) tem-se evidentemente
que o polinomio p(z) p() tem como raiz. Logo, p(z) p() = (z )q(z), onde q e um polinomio
de grau n 1. Portanto, p(u) p() = (u )q(u) e como (u ) nao e invertvel, p(u) p()
tambem nao o pode ser, o que diz-nos que p() (p(u)). Isso significa que {p(), (u)} (p(u)),
estabelecendo (p(u)) = {p(), (u)}.
Veremos quando tratarmos do homomorfismo de Gelfand e do Calculo Funcional Contnuo que
para operadores limitados e auto-adjuntos definidos em em espacos de Hilbert o Teorema da Aplicacao
Espectral pode ser bastante generalizado. Vide Teorema 26.32, pagina 1223.
O operador resolvente e propriedades topol
ogicas do espectro
Se um n
umero complexo pertence ao conjunto resolvente de u B, define-se o operador resolvente
de u calculado em , denotado por R (u), por
R (u) := ( u)1 .
Pelas hipoteses R (u) e um elemento de B.
Muitas propriedades de (u) (e, portanto de (u)) podem ser derivadas de propriedades de seus
operadores resolventes. Por exemplo, mostraremos mais adiante que (u) e sempre um conjunto aberto
de (e, portanto, (u) e sempre um conjunto fechado de ) e mostraremos tambem que (u) nunca
e igual a todo (e, portanto, (u) nunca e vazio).
Proposi
c
ao 26.21 (Primeira identidade do resolvente) Sejam B uma a
lgebra de Banach com
unidade e u B. Se e pertencem ao conjunto resolvente (u) de u, ent
ao
R (u) R (u) = ( )R (u)R (u) .

(26.34)
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1164/1304

Prova. A prova segue do seguinte computo que dispensa comentarios:




R (u) = R (u) ( u)R (u) = R (u) ( ) + ( u) R (u)
|
{z
}
=

= ( )R (u)R (u) + R (u)( u) R (u) = ( )R (u)R (u) + R (u) .


{z
}
|
=

Iremos agora estabelecer uma serie de resultados sobre propriedades do operador resolvente que
culminarao com a Proposicao 26.24.
Lema 26.3 Sejam B uma a
lgebra de Banach com unidade e u B. Se e pertencem ao conjunto
resolvente (u) de u e | | < kR (u)k1 ent
ao
#
"
#
"

X
X
(26.35)
R (u) = R (u)
+
( )n (R (u))n =
+
( )n (R (u))n R (u) .
n=1

n=1

Prova. Que as series acima sao convergentes para | | < kR (u)k1 e elementar. Portanto, ambas
definem operadores de B. A segunda igualdade em (26.35) e tambem evidente. Resta-nos provar que
as expressoes do lado direito sao de fato iguais a` inversa de u. Agora,


( u)R (u) = ( ) + ( u) R (u) = ( )R (u) + .

Assim,

( u)R (u)

"

X
n=1

( )n (R (u))n

= ( )R (u)

"

X
n=1

e analogo.

"

X
n=1

( ) (R (u))

=
Provar que

X
n=1

"

( )n (R (u))n +

X
n=1

"

( ) (R (u))

X
n=1

( )n (R (u))n

( )n (R (u))n R (u)( u) =

A expressao (26.35) nao e adivinhada, mas sugerida por


"
n #


X
1
1
1
1
1

 =
=
1+
( )n
,
t
t 1
t

t
n=1
t

JCABarata. Curso de Fsica-Matem


atica

valida para , , t

Vers
ao de 29 de setembro de 2005.

Captulo 26

1165/1304

com | | < | t|, 6= t e 6= t.

Proposi
c
ao 26.22 Sejam B uma a
lgebra de Banach com unidade e u B. Ent
ao (u) e um subconjunto aberto de , o que implica que (u) e um subconjunto fechado de .
2
Prova. O Lema 26.3 afirma que se (u), entao todo que dista de menos que kR (u)k1 e
tambem um elemento de (u). Ora, isso esta precisamente dizendo que (u) e um subconjunto aberto
de e, portanto, (u) e um subconjunto fechado de , por ser o complemento de (u).
A proposicao seguinte, que sera usada logo adiante, ilustra a importancia da teoria das funcoes
analticas no estudo de propriedades de operadores em algebras de Banach.
Proposi
c
ao 26.23 Sejam B uma a
lgebra de Banach e u B. Ent
ao, para cada ` B , funcional
linear contnuo em B, a funca
o de vari
avel complexa f` : (u)
dada por f` () := `(R (u)) e
holom
orfica (i.e. analtica) em cada componente conexa de (u).
2
Prova. Sejam (u) e tal que | | < kR (u)k1 . Tem-se por (26.35) que (u) e
f` () := `(R (u))

(26.35)

` R (u) +

X
n=1

( )n (R (u))
continuidade

n+1

`(R (u)) +

X
n=1

Como


( )n ` (R (u))n+1 . (26.36)



` (R (u))n+1 k`k k (R (u))n+1 k k`k kR (u)kn+1 ,

segue de | | < kR (u)k1 que a u


ltima serie em (26.36) e absolutamente convergente e, portanto,
define uma funcao holomorfica na bola aberta de raio kR (u)k1 centrada em , a qual pode, pelos
procedimentos usuais, ser estendida analiticamente a` componente conexa de (u) que contem .
A proposicao seguinte, devida a Gelfand13 , e importante pois finalmente estabelece que o espectro
de um operador contnuo em um espaco de Banach nunca e vazio.
Proposi
c
ao 26.24 Sejam B uma a
lgebra de Banach com unidade e u B. Ent
ao, (u) e um conjunto
n
ao-vazio e est
a contido na bola fechada de raio kuk centrada em 0: {z | |z| kuk}.
2
Prova. Vamos supor que (u) = . Entao, pela Proposicao 26.23, para todo ` funcional linear contnuo
em B a funcao f` () := `(R (u)) seria inteira, isto e, analtica em toda parte. Agora, para || > kuk
"
#

X
R (u) = ( u)1 = 1 ( 1 u)1 = 1
+
n un
(26.37)
n=1

13

Israil Moiseevic Gelfand (1913-).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1166/1304

de acordo com (26.33) da Proposicao 26.14, pagina 1158, pois pela hipotese k 1 uk < 1. Assim,
"
n #

X
1
kuk
1
.
kR (u)k
1+
=
||
||
|| kuk
n=1
Isso mostra que lim kR (u)k = 0. Logo, como |f` ()| = |`(R (u))| k`k kR (u)k, segue que
||

lim |f` ()| = 0. Com isso, conclumos que f` () e uma funcao inteira, limitada e converge a zero

||

no infinito. Pelo bem-conhecido Teorema de Liouville14 da Analise Complexa, isso implica que f` () e
identicamente nula para todo . Se, porem, `(R (u)) for nulo para cada funcional linear contnuo
` entao, pelo Corolario 26.1, pagina 1133, teramos R (u) = 0, um absurdo, pois R (u) e a inversa de
um operador. Assim conclumos que (u) nao pode ser igual a todo e, portanto, (u) 6= .
Pela Proposicao 26.14, pagina 1158, a expressao (26.37) mostra que R (u) esta definida para todo
|| > kuk. Assim, {z | |z| > kuk} (u). Logo, (u) {z | |z| kuk}.

O raio espectral
Pela Proposicao 26.24, pagina 1165, sabemos que o espectro de um elemento u de uma uma algebra
de Banach com unidade B esta contido na bola fechada de raio kuk centrada em 0. Em muitas aplicacoes
e importante ter-se uma nocao mais precisa sobre qual a maior distancia a` origem 0 em que se pode
encontrar um ponto do espectro de u. Os Teoremas 26.15 e 26.16, a seguir, fornecem-nos informacoes
mais precisas sobre essa distancia.
Sejam B uma algebra de Banach com unidade e u B. Definimos o raio espectral de u por
r(u) := sup || ,
(u)

onde, como antes, (u) = { | ( u) nao e invertvel}. Pela Proposicao 26.24, pagina 1165, esta
claro que r(u) kuk. O seguinte teorema, devido a Beurling15 , e um dos resultados fundamentais da
analise espectral de operadores e sera empregado varias vezes no que segue.
Teorema 26.15 (Teorema do Raio Espectral) Sejam B uma a
lgebra de Banach com unidade e
u B. Ent
ao,
r(u) = inf kun k1/n = lim kun k1/n .
(26.38)
n1

2
claro pela definicao que { | || > r(u)} e uma componente conexa
Prova do Teorema 26.15.16 E
do conjunto resolvente de u. Assim, pela Proposicao 26.23, pagina 1165, as funcoes f ` () := `(R (u))
com ` B , funcional linear contnuo em B, sao analticas na regiao { | || > r(u)}. De acordo
14

Joseph Liouville (1809-1882).


Arne Carl-August Beurling (1905-1986).
16
Seguiremos aqui a apresentaca
o de [96], mas com alguns esclarecimentos extra. Basicamente, a vantagem dessa
demonstraca
o e o uso do Princpio de Limitaca
o Uniforme, o que a torna mais curta e elementar, em contraste com
outras exposico
es, como as de [15] ou de [103].
15

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1167/1304

com fatos bem conhecidos da teoria das funcoes de variavel complexa, isso implica que naquela regiao
f` () possui uma representacao em termos de uma serie de Laurent17 :
f` () =

an n ,

|| > r(u) .

n=0

| || > r(u)}, vale k1 uk < 1 e podemos escrever, usando

Na regiao { | || > kuk} {


a serie de Neumann (26.33),

f` () := `(R (u)) = ` ( u)1


1

= `

n n

n=0

= 1 `

continuidade de

1 u

1 

` (un ) n1

n=0

Conclumos disso que a0 = 0 e an = ` (un1 ), n 1 e, portanto, a serie

` (un ) n1

n=0

converge para todo com || > r(u) e nao apenas para || > kuk. Como essa serie e convergente,
conclumos que para todo com || > r(u) devemos ter limn |` (un ) n1 | = 0, o que implica que
a seq
uencia ` (un ) n1 e limitada. Assim, provamos que para cada ` B existe uma constante
M` > 0 tal que |` (un ) n1 | M` . Sob essas condicoes, o Princpio de Limitacao Uniforme (ou
Teorema de Banach-Steinhaus, Teorema 26.6, pagina 1133) garante-nos que existe M 0, finito, tal que
kn1 un k M para todo n 1. Conseq
uentemente, kun k1/n M 1/n ||1+1/n para todo n 1. Disso
extramos que lim sup kun k1/n ||. Como essa desigualdade vale para todo { | || > r(u)},

conclumos que

lim sup kun k1/n


n

inf

{ | ||>r(u)}


|| = r(u) .

Vamos agora demonstrar que r(u) lim inf kun k1/n .


n

Pelo Teorema da Aplicacao Espectral, Teorema 26.14, pagina 1163, sabemos que se (u) entao
n (un ) para todo n . Logo, pela Proposicao 26.24, pagina 1165, vale |n | kun k. Isso
trivialmente diz que || kun k1/n para todo (u) e todo n 1. Portanto,


r(u) := sup || inf kun k1/n lim inf kun k1/n .


(u)

n1

Logo, estabelecemos lim sup kun k1/n r(u) inf kun k1/n lim inf kun k1/n , o que implica (26.38).
n

n1

O seguinte corolario importante sera empregado adiante, por exemplo, quando discutirmos o homomorfismo de Gelfand e o Teorema Espectral.
17

Pierre Alphonse Laurent (1813-1854).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1168/1304

Teorema 26.16 Se A e uma a


lgebra C com unidade e a A e um operador auto-adjunto (ou seja,

tal que a = a ) ou normal (ou seja, tal que aa = a a), ent


ao
r(a) = kak .

(26.39)

Note que se H e um espaco de Hilbert, B(H) e uma a


lgebra C com unidade e, portanto, a afirmaca
o
acima aplica-se a operadores limitados auto-adjuntos ou normais agindo em um espaco de Hilbert H.
2
Prova do Teorema 26.16. Em uma algebra C todo operador b satisfaz a propriedade C : kb bk = kbk2 .
Assim, para um operador auto-adjunto a, vale ka2 k = kak2 . Substituindo a nessa expressao pelo
n1
operador auto-adjunto a2
e utilizando-a n vezes, teremos
n

ka2 k = ka2

n1

k2 = ka2

n2

k2 = = kak2 .

(26.40)

Portanto,
r(a)

(26.38)

lim kam k1/m = lim ka2 k1/2

= lim kak = kak .


n

(26.41)
n

Tratemos agora do caso de operadores normais. Se b A, vale pela propriedade C kb2 k2 =


n
n
n
n
n
n
n
k(b2 ) b2 k. Para um operador normal a, tem-se (a2 ) a2 = (a a)2 . Logo, ka2 k2 = k(a a)2 k. Como
n
n
a a e auto-adjunto, segue de (26.40) (substituindo la a por a a) que k(a a)2 k = ka ak2 . Novamente
n+1
pela propriedade C , a u
ltima expressao vale kak2 . Provamos, entao, que para a normal tem-se
n
n
ka2 k = kak2 . Assim, aplica-se novamente (26.41), completando a prova.
O leitor deve, porem, ser advertido que ha situacoes em que r(u) < kuk. Tal e o caso, por exemplo,
do operador de Volterra W , tratado
R x no Exemplo 26.6 a` pagina 1214, o qual e definido no espaco de
Banach C([0, 1]) por (W f )(x) := 0 f (y)dy, e para o qual tem-se r(W ) = 0 mas kW k = 1.
Uma das conseq
uencias mais profundas do Teorema 26.16 sao a proposicao e o corolario seguintes.

Proposi
c
ao 26.25 Se A e uma a
lgebra C com unidade, ent
ao
p
kak =
r(a a)

para todo a A.

Prova. Pela propriedade C vale kak2 = ka ak para todo a A. Agora, a a e auto-adjunto e, pelo
Teorema 26.16, r(a a) = ka ak.
Corol
ario 26.6 Se B e uma a
lgebra- que e uma a
lgebra C em relaca
o a uma norma k k1 e tambem
em relaca
o a uma norma k k2 ent
ao essas normas s
ao iguais.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1169/1304

Prova. Seja a B. Usando a propriedade C para as normas k k1 e k k2 e o Teorema 26.16 para o


operador auto-adjunto a a, tem-se kak21 = ka ak1 = r(a a) = ka ak2 = kak22 .
A razao e de a Proposicao 26.25 ser importante e a seguinte. O espectro de um operador a e definido
em termos puramente algebricos (existencia
p ou nao da inversa de a) e, portanto, o raio espectral
r(a) tambem o e. A igualdade kak = r(a a) revela que em algebras C a norma operatorial, um
objeto de natureza topologica, e determinado por um objeto de natureza algebrica, o raio espectral.
Assim, uma algebra C e uma algebra que vem, por assim, dizer, imbuda de sua propria topologia. O
Teorema 26.16 tem varias outras implicacoes estruturais sobre algebras C . Vide a discussao de [15]
ou [96].
O espectro de operadores unit
arios e de operadores auto-adjuntos em
algebras C
Um elemento u de uma algebra- com unidade e dito ser unit
ario se u1 = u , ou seja, se u u =
uu = .
As duas proposicoes que seguem sao importantes por permitirem localizar com mais precisao o
espectro de operadores unitarios ou auto-adjuntos.
Proposi
c
ao 26.26 Seja A uma a
lgebra C com unidade seja u A, unit
ario. Ent
ao (u) S 1 :=
{ | || = 1}.
2
Prova. Se u e unitario, pela propriedade C , kuk2 = ku uk = k k = 1, ou seja, kuk = 1. Alem disso,
por ser unitario, u e normal (pois u u = uu = ). Assim, pelo Teorema 26.16, r(u) = kuk = 1. Isso
mostra que (u) e um subconjunto fechado do disco unitario centrado em 0: D1 := { | || 1}.
cc
cc
Pelas Proposicoes 26.19 e 26.20, tem-se (u) = (u )cc = (u1 ) = ((u)1 ) . Agora, os u
nicos
1
subconjuntos de D1 invariantes por inversao e conjugacao complexa sao subconjuntos de S .
Proposi
c
ao 26.27 Seja A uma a
lgebra C com unidade seja a A, auto-adjunto. Ent
ao, (a) .
Mais precisamente, (a) e um subconjunto compacto de [kak, kak].
2


Ha diversas demonstracoes dessa importante proposicao. A que apresentamos abaixo e inspirada na


da referencia [15] (mas nao identica a` mesma) e faz uso de poucos recursos da teoria. A demonstracao de
[96], por exemplo, merece ser comparada. Mais adiante, Teorema 26.25, pagina 1198, apresentaremos
uma outra demonstracao para operadores limitados auto-adjuntos agindo em espacos de Hilbert.
Prova da Proposicao 26.27. Se a = 0 nao ha o que demonstrar. Seja entao a 6= 0 e sejam p > 0 e ,
sendo que a parte imaginaria de e nao-nula. Se || > kak entao ja sabemos que 6 (a), de modo
que e suficiente considerarmos || kak. Se escolhermos p < kak1 , a norma dos operadores ipa sera
pkak < 1 e pela Proposicao 26.14, pagina 1158, os operadores ipa sao invertveis. Alem disso, com

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1170/1304

essas escolhas p < kak1 < ||1 , de modo que 1 ip 6= 0. Temos, assim,




2ip
2ip
a
a =

2ip
2ip

!

!
(1 + ip) (1 ip)
ip (1 ip) + (1 + ip)
=

a
2ip
2ip



i
1 h
=
(1 + ip)( ipa) (1 ip) ( + ipa)
2ip

 


1 ip
1 + ip
=
( ipa) ( + ipa)
2ip
1 ip


 

1 ip
1 + ip
1
( ipa) .
=
( + ipa)( ipa)
2ip
1 ip

(26.42)

De (26.42) conclumos que a tera inversa se




1 + ip
v :=
( + ipa)( ipa)1
1 ip

for invertvel. Mostraremos que tal e o caso provando que u := ( + ipa)( ipa) 1 e unitario e que
1+ip
e um n
umero complexo de modulo diferente de 1. Para provar que u e unitario, fazemos o seguinte
1ip
desenvolvimento:
u

:=
=
=
=
a=a

(26.32)

( + ipa)( ipa)1


2 ( ipa) ( ipa)1 = 2( ipa)1



( ipa)1 2 ( ipa) = ( ipa)1 ( + ipa)


( + ipa) ( ipa)



1

( ipa)

( ipa)

1

( + ipa)

!1

( + ipa)

!1

( + ipa)( ipa)

!1

(u )1 ,

que demonstrou que u1 = u , provando que u e unitario. Escrevendo = x + iy com x, y


teremos


2
2
1 + ip 2

= (1 py) + (px) 6= 1 se y 6= 0 .
1 ip
(1 + py)2 + (px)2


JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1171/1304

Como u e unitario e seu espectro e formado por n


umeros complexos de modulo 1 (Proposicao 26.26),
conclumos que v e invertvel e, por (26.42), a tambem o e com


2ip
1
( a)
=
( ipa)1 v 1 .
1 ip
A invertibilidade de

ipa foi garantida com a escolha 0 < p < kak1 .

Assim, provamos que a tem inversa para todo com parte imaginaria nao-nula. Portanto,
todo n
umero complexo com parte imaginaria nao-nula esta no conjunto resolvente de a, (a). Logo,
(a) . Como r(a) = kak, conclumos que (a) [kak, kak]. Que (a) e fechado foi provado na
Proposicao 26.22, pagina 1165.


*
A nocao de espectro sera estudada mais detalhadamente adiante no contexto de operadores limitados
agindo em espacos de Banach e, especialmente, de Hilbert. Em tais casos uma classificacao mais
detalhada dos tipos de espectro e possvel. Vide Secao 26.5, pagina 1193.

26.3.4

O Homomorfismo de Gelfand em Algebras


C

Esta secao e dedicada a` demonstracao de um fato central da teoria das algebras C , o qual reflete-se
tambem na teoria dos operadores limitados agindo em espacos de Hilbert. A afirmacao e que se a e um
elemento auto-adjunto de uma algebra C com unidade A, entao existe um homomorfismo a entre a
algebra C((a)) das funcoes contnuas definidas no espectro de a e a algebra A. Esse homomorfismo e
denominado homomorfismo de Gelfand18 .
A existencia do homomorfismo de Gelfand e suas propriedades sao conseq
uencia, basicamente de
duas coisas: do Teorema de Weierstrass, que garante a possibilidade de aproximar uniformemente
funcoes contnuas definidas em um conjunto compacto da reta real (como o espectro de um operador
auto-adjunto de uma algebras C com unidade) por polinomios, e da proposicao que segue, a qual
garante que para todo polinomio p e todo elemento auto-adjunto a de uma algebra C com unidade A,
a aplicacao p : (a) A e isometrica.
Proposi
c
ao 26.28 Seja A uma a
lgebra C com unidade e seja a A um elemento auto-adjunto de A
n

(isto e, a = a). Seja tambem p(x) = bk xk um polin


omio em x
k=0

. Ent
ao, o espectro de p(a) e a

imagem por p do espectro de a, ou seja,

(p(a)) = {p(), (a)} =: p((a)) .


Fora isso, kp(a)k = sup |p()| =: kpk .
(a)

18

Israil Moiseevic Gelfand (1913-).

(26.43)
2

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1172/1304

Prova. O fato que (p(a)) = {p(), (a)} foi estabelecido no Teorema 26.14, pagina 1163. Para
determinar kp(a)k lembremos que pela propriedade C vale kp(a)k2 = kp(a)p(a) k. Agora,
!
!
!
! n
n
n
n
n
X
X
X
X
X

a=a
bl a l
=
bl a l =
p(a)p(a) =
bk a k
bk a k
bk bl ak+l = (pp)(a) ,
l=1

k=0

k=0

onde pp e o polinomio de grau 2n definido para x

k, l=0

l=0

por

(pp)(x) := p(x)p(x) =

n
X

bk bl xk+l .

k, l=0

Como p(a)p(a) = (pp)(a) e auto-adjunto, aplica-se o Teorema 26.16, pagina 1168, e tem-se
kp(a)p(a) k = k(pp)(a)k

(26.39)

r((pp)(a))

defini
ca
o

sup
(pp)(a)

 ||

(26.105)

(pp)(), (a)





= sup |(pp)()| = sup p()p() = sup |p()|2 =
(a)

(a)

sup

(a)

||

sup |p()|

(a)

!2

estabelecendo o que queramos.

Seja agora o espaco de Banach C((a)) da funcoes complexas contnuas definidas no espectro
de a dotado da norma kf k := sup(a) |f ()| e seja P ((a)) o sub-espaco de C((a)) formado por
polinomios. Sabemos pelo Teorema de Weierstrass que P ((a)) e denso em C((a)). Vimos tambem na
Proposicao 26.28 que a aplicacao a : P ((a)) A dada por (p) = p(a) satisfaz k(p)k = kpk .
Ora, isso diz-nos que e limitada e, pelo Teorema BLT, Teorema 26.1, pagina 1119, pode ser estendida
unicamente e isometricamente ao fecho de P ((a)) que e C((a)). Essa extensao tambem sera denotada
por . Assim, para toda f C((a)) podemos definir (f ) como limite em norma de operadores (p),
com p sendo polinomios que convergem a f na norma k k .
Denotaremos tambem sugestivamente (f ), para f C((a)), por f (a). Tem-se os seguintes fatos
sobre (f ).

Teorema 26.17 (O Homomorfismo de Gelfand em Algebras


C ) Seja A uma a
lgebra C com
unidade, seja a A auto-adjunto e seja a : C((a)) A definida acima. Para todo polin
omio p
vale (p) = p(a). Como vimos, pelo Teorema BLT, Teorema 26.1, p
agina 1119, tem-se k(f )k = kf k
para toda f C((a)). Fora isso, valem as seguintes afirmaco
es:
1. A aplicaca
o e um -homomorfismo algebrico, ou seja,
(f + g) = (f ) + (g) ,

para todas f, g C((a)) e todos ,


(g)(f ) para todas f, g C((a)).
2. Se f 0 tem-se ((f )) [0, ).

(f ) = (f ) ,

(1) = ,
(26.44)
. Como f g = gf , segue de (26.44) que (f )(g) =

(f g) = (f )(g) ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1173/1304

3. Se fn C((a)), n e uma seq


uencia de converge na norma k k a uma funca
o f C((a))
ent
ao (fn ) converge a (f ) na norma de A. Reciprocamente, se (fn ) converge na norma de A,
ent
ao existe f C((a)) tal que limn (fn ) = (f ). Isso diz-nos que {(f ), f C((a))} e
fechada na norma de A. Com a propriedade do item 1, isso significa que {(f ), f C((A))}
e uma sub-
algebra C Abeliana com unidade de A.


4. ((f )) = {f (), (a)} =: f ((a)) para toda f C((a)).

O -homomorfismo : C((a)) A e por vezes denominado homomorfismo de Gelfand.


Prova do Teorema 26.17.
Prova do item 1. A aplicacao : C((a)) A e limitada e, portanto, contnua. As propriedades
(26.44), que caracterizam como um -homomorfismo algebrico, sao triviais de se verificar no subespaco
denso P ((a)) e da se estendem facilmente a todo C((a)) por continuidade.
Prova do item 2. Se f 0 entao f = g 2 para alguma g real e contnua. Logo, pela propriedade de
homomorfismo em (26.44) vale (f ) = (g 2 ) = (g)2 . Tambem por (26.44), (g) e auto-adjunto e,
portanto, pelo Teorema 26.14, pagina 1163, o espectro de (g)2 e um subconjunto de [0, ).

Prova do item 3. Tem-se k(fn ) (f )k = k(f fn )k = kf fn k . Logo, se kf fn k 0,


segue k(fn ) (f )k 0. Reciprocamente, se (fn ) converge na norma de A, segue que (fn ) e uma
seq
uencia de Cauchy em A. Assim, como k(fn ) (fm )k = kfn fm k , a seq
uencia fn e de Cauchy
em C((a)) com a norma kk . Como C((a)) e completo em relacao a essa norma, existe f C((a))
a` qual fn converge e, portanto, limn (fn ) = (f ).
1
Prova do item 4. Se nao pertence a` imagem de (a) por f entao r := (f )
e contnua e, portanto,
(r) esta bem definida e vale (r)(f ) = (f )(r) = , pelas propriedades de homomorfismo,
provando que (f ) e invertvel e que, portanto, ((f )), o conjunto resolvente de (f ).
Isso estabeleceu que o complemento da imagem de f , \ {f (), (a)}, e um subconjunto de
((f )). Logo, ((f )) {f (), (a)}. Vamos agora demonstrar a inclusao oposta. Seja
{f (), (a)}, ou seja, = f (0 ) para algum 0 (a) e vamos supor que ((f )), ou
seja, que F := (f ) f (0 ) e invertvel. Seja agora P := (p) p(0 ) para algum polinomio p tal
que kf pk < . Teremos, F P = (f p) (f (0 ) p(0 )) e, assim,

kF P k k(f p)k + |f (0 ) p(0 )| k k = kf pk + |f (0 ) p(0 )| 2kf pk < 2 .


Agora, pelo Corolario 26.3, pagina 1160, se escolhermos esse  pequeno o suficiente tal que kF P k <
kF 1 k1 , entao P sera invertvel em A, o que implica p(0 ) 6 ((p)) com 0 (a). Isso contraria
(26.43). Logo, devemos ter 6 ((f )), ou seja, ((f )), o que prova {f (), (a)} ((f )),
estabelecendo a igualdade desses dois conjuntos. Isso completa a prova do Teorema 26.17
Comentamos que a identificacao ((f )) = {f (), (a)} nao contraria o fato de ((f )) ser
fechado, pois a imagem de um conjunto compacto (no caso, (a)) por uma funcao contnua (no caso,
f ) e sempre um conjunto compacto (ou seja, fechado e limitado).

JCABarata. Curso de Fsica-Matem


atica

26.3.5

Vers
ao de 29 de setembro de 2005.

Captulo 26

1174/1304

Razes Quadradas de Operadores em Algebras


de Banach

Na teoria dos operadores e muito importante definir condicoes sob as quais se possa associar uma
raiz quadrada a certos tipos de operadores. Esta secao e dedicada ao assunto e apresentaremos inicialmente alguns resultados gerais, para o contexto de algebras de Banach ou de Banach-, e ao final
nos especializaremo-nos a operadores auto-adjuntos em algebras C ou agindo em espacos de Hilbert.
Algumas das demonstracoes abaixo sao um tanto tecnicas e sua leitura pode ser dispensada em uma
primeira visita. Comecamos com o seguinte resultado.
Teorema 26.18 Seja B uma a
lgebra de Banach com unidade e w B tal que kwk 1. Ent
ao existe
y B tal que y 2 = w. Esse y e dado por
y :=

cn w n := lim

n=0

N
X

cn w n ,

(26.45)

n=0

sendo que o limite em (26.45) converge na norma de B e onde


c0 = 1,

1
c1 = ,
2

cn =

(2n 3)!!
(2n 3)!!
=
, n1,
n
2 n!
(2n)!!

s
ao os coeficientes da expans
ao em serie de Taylor em torno de z 0 = 0 da funca
o f (z) =

X
analtica no disco unit
ario aberto D1 = {z | |z| < 1}: f (z) =
cn z n .
n=0

(26.46)

1 z,
2

Destacamos o fato que o enunciado acima fala de kwk 1 e nao apenas kwk < 1. Isso sera
importante mais adiante. Por ser um tanto tecnica, a demonstracao do Teorema 26.18 e apresentada
no Apendice 26.A, pagina 1253. Nossa demonstracao e inspirada na (mas nao identica a`) de [103]. 19
Corol
ario 26.7 Seja B uma a
lgebra de Banach- com unidade. Se x B e tal que kxk 1 ent
ao

2
existe y B auto-adjunto (y = y) tal que x x = y y = y .
2
Prova. Seja w = x x. Tem-se kwk = kx xk kx k kxk = kxk2 1. Podemos, portanto, aplicar o
N
X
Teorema 26.18, acima. Fora isso, nesse caso sn =
cn (x x)n sao todos auto-adjuntos pois (x x) =
n=0

x x e os cn s sao reais. Assim, y = lim sN e tambem auto-adjunto (por que?). Logo, pelo que vimos
yy = y2 =

x x, o que queramos provar.

Corol
ario 26.8 Seja B uma a
lgebra de Banach com unidade. Seja w B tal que k wk 1. Ent
ao
existe y B tal que y 2 = w. Se B for tambem uma a
lgebra de Banach- e w for auto-adjunto, ent
ao
existe y auto-adjunto com a mencionada propriedade.
2
19

E instrutivo compar
a-la a
` de [15] (Teorema 2.2.10) para a
lgebras C .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1175/1304

Prova. O operador w satisfaz as condicoes do Teorema 26.18, pagina 1174. Logo, existe y B tal
que y 2 = ( w) = w.




v

Corol
ario 26.9 Seja B uma a
lgebra de Banach com unidade. Seja v B, v 6= 0, tal que


kvk
1. Ent
ao existe y B tal que y 2 = v. Se B for tambem uma a
lgebra de Banach- e v for auto-adjunto,
ent
ao existe y auto-adjunto com a mencionada propriedade.
2
v
Prova. O operador
satisfaz as condicoes do corolario anterior. Logo, existe y0 B tal que
 kvk

v
v
y02 =

=
. Portanto y = kvk1/2 y0 e tal que y 2 = v.
kvk
kvk
O Corolario 26.9 tem uma conseq
uencia para algebras C : todo elemento de uma algebra C que
tenha espectro positivo tem uma raiz quadrada. Isso sera demonstrado no que segue.

26.3.6

Elementos Positivos de Algebras


C

Um elemento auto-adjunto v de uma algebra C A e dito ser positivo se satisfazer (v) [0, ), ou
seja, (v) [0, kvk]. A proposicao seguinte estabelece um fato basico sobre elementos positivos em
algebras C o qual sera repetidamente empregado no que segue.
Proposi
c
ao 26.29 Se a e b s
ao elementos auto-adjuntos e positivos de uma a
lgebra C com unidade
e tais que a + b = 0 ent
ao a = 0 e b = 0.
2
Prova. Se (a) [0, ) entao, pelo Teorema da Aplicacao Espectral, Teorema 26.14, pagina 1163,
vale que (a) (, 0]. Logo, se b = a tem-se (b) (, 0]. Se b e positivo (ou seja, se
(b) [0, ), isso implica que (b) = {0}. Logo r(b) = 0 e pelo Teorema 26.16, conclumos que
kbk = 0. Assim, a = b = 0.
O leitor deve ser advertido que as afirmacoes da u
ltima proposicao nao sao necessariamente validas

em algebras de Banach que nao sejam algebras C . A seguinte proposicao estabelece algumas condicoes
equivalentes a` positividade.
Proposi
c
ao 26.30 Se v e um elemento auto-adjunto n
ao-nulo de uma a
lgebra C com unidade A, s
ao
equivalentes as seguintes afirmaco
es:
1. (v) [0, kvk].



v
2. kvk
1.

3. Existe y A auto-adjunto tal que y 2 = v e kyk = kvk1/2 .

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1176/1304

O operador y do item 3 n
ao e u
nico pois y, por exemplo, tem a mesma propriedade. Porem, existe
um u
nico yp auto-adjunto com espectro positivo, tal que yp2 = v.
2
Mais adiante (Teorema 26.20) provaremos o importante fato que em algebras C , elementos da
forma x x sao positivos.
Prova da Proposicao 26.30.
1 2 Pelo Teorema da Aplica
cao Espectral,
oaginan 1163, e pelas hipoteses
o sobre o

n Teorema 26.14, p

espectro de v, tem-se
kvk = 1 kvk , (v) 1 kvk , [0, kvk] = [0, 1].





v
v
Assim, pelo Teorema 26.16, pagina 1168, kvk
kvk
1.
=r

2 3 A existencia de y segue do Corolario 26.9. Como y e auto-adjunto vale, pela propriedade C ,


kyk2 = ky 2 k = kvk.
3 1 Isso segue do Teorema da Aplicacao Espectral, Teorema 26.14, pagina 1163.
Podemos encontrar um yp auto-adjunto com espectro positivo e tal que yp2 = v usando o Homomorfismo de Gelfand v (Teorema 26.17, pagina 1172) da seguinte forma. Como (v) [0,
kvk], a funcao
por f () = , (v),
f C((v)) dada
e2 contnua e positiva, assim como f . Assim, pelo
2
Teorema 26.17, yp := v ( f ) satisfaz yp = v ( f ) = v (f ) = v. Pelo item 2 daquele Teorema, vemos
que (yp ) [0, ).


Para provar a unicidade do elemento positivo yp usaremos o seguinte lema, ademais de interesse por
si so.

Lema 26.4 Se a e b s
ao dois elementos auto-adjuntos positivos de uma a
lgebra C com unidade A tais
que ab = ba ent
ao ab e tambem auto-adjunto positivo.
2
Prova. Se a e b sao positivos, o homomorfismo de Gelfand fornece dois operadores auto-adjuntos
positivos cp e dp tais que c2p = a e d2p = b. Pela construcao do homomorfismo de Gelfand, cp e o limite
em norma de polinomios em a e dp e o limite em norma de polinomios em b. Como a e b comutam, esses
aproximantes polinomiais tambem comutam e, portanto cp dp = dp cp . Assim, ab = (cp )2 (dp )2 = (cp dp )2 ,
que e auto-adjunto positivo, pelo Teorema da Aplicacao Espectral, Teorema 26.14, pagina 1163.
Para demonstrar a unicidade de yp , comecemos lembrando que yp e obtido pelo homomorfismo de
Gelfand e, portanto, e um limite em norma de polinomios em v. Assim, se b e um operador qualquer
que comuta com v, entao b comuta com yp . Vamos supor que b seja tambem positivo e tal que b2 = v.
Como b3 = b(b2 ) = (b2 )b segue que bv = vb. Assim, b e yp tambem comutam. Teremos assim,
0 = (v v)(yp b) = (yp2 b2 )(yp b)

byp =yp b

(yp b)(yp + b)(yp b)

= (yp b)yp (yp b) + (yp b)b(yp b)

byp =yp b

(yp b)2 yp + (yp b)2 b .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1177/1304

Pelo Lema 26.4, ambos (yp b)2 yp e (yp b)2 b sao positivos e, portanto, pela Proposicao 26.29,
conclumos que (yp b)2 yp = 0 e (yp b)2 b = 0. Subtraindo um do outro, obtemos (yp b)3 = 0, o que
trivialmente implica (yp b)4 = 0. Agora, como yp b e auto-adjunto obtemos, aplicando duas vezes
a propriedade C da norma: kyp bk4 = k(yp b)2 k2 = k(yp b)4 k = 0, provando que yp = b. Isso
estabeleceu a unicidade desejada e completou a prova da Proposicao 26.30.
Vemos que um elemento auto-adjunto v de uma algebra C com unidade A e positivo se satisfizer
quaisquer das condicoes equivalentes da Proposicao 26.30, acima. Mais adiante provaremos o importante fato que em algebras C , elementos da forma x x sao positivos. O primeiro passo nessa direcao
e o seguinte teorema de decomposicao.
Proposi
c
ao 26.31 Todo elemento auto-adjunto a de A, uma a
lgebra C com unidade, pode ser escrito
na forma a = a+ a , onde a s
ao auto-adjuntos e positivos, comutam com a e satisfazem a+ a =
a a+ = 0.
2
Prova. Sejam as funcoes reais f+ () := 21 (|| + ) e f () := 21 (|| ). Ambas sao contnuas,
positivas, satisfazem f+ f = 0 e = f+ () f (). Usando o homomorfismo de Gelfand a , definimos
a+ := a (f+ ) e a := a (f ). Pelo Teorema 26.17, esses operadores tem as propriedades desejadas.
Vamos denotar por A+ o conjunto de todos os elementos auto-adjuntos positivos de uma algebra C
com unidade A. O seguinte teorema resume as propriedades geometricas e topologicas mais importantes
de A+ .
Teorema 26.19 O conjunto A+ , formado por todos os elementos auto-adjuntos positivos de uma
a
lgebra C com unidade A, e um cone convexo e fechado (na topologia da norma de A) e tem a
propriedade A+ (A+ ) = {0}.
2
Prova. A afirmacao que A+ (A+ ) = {0} e um mero refraseamento da Proposicao 26.29. Se a e
positivo e auto-adjunto entao, pelo Teorema da Aplicacao Espectral, Teorema 26.14, pagina 1163, a
tambem o e para todo 0. Isso provou que A+ e um cone. Provemos agora que A+ e convexo.

Provemos primeiramente que se a A+ , entao para todo p kak vale k p1 ak 1. De fato,


o Teorema da Aplicacao Espectral,
Teorema
26.14, diz-nos que ( p1 a) = {1 /p, (a)}
h
i
{1 /p, [0, kak]} = 1 kak
, 1 [0, 1]. Isso provou que r( p1 a) 1 e, pelo Teorema
p
26.16, pagina 1168, segue que k p1 ak 1.

Sejam agora a, b A+ e considere-se a combinacao linear convexa a + (1 )b com [0, 1].


Para provar que a + (1 )b A+ , tomemos P > max{kak, kbk} e escrevamos





P 1 (a + (1 )b) = P 1 a + (1 ) P 1 b




P 1 a + (1 ) P 1 b
+ (1 ) = 1 ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1178/1304

au
ltima desigualdade sendo conseq
uencia do comentario do paragrafo acima pois, pela escolha, P > kak
e P > kbk. Isso implica que o espectro de P 1 (a + (1 )b) esta em [1, 1] e, portanto, o espectro
de P 1 (a + (1 )b) esta em [0, 2]. Assim, (a + (1 )b) [0, 2P ], provando que a + (1 )b
e positivo.
Resta-nos provar que A+ e fechado. Seja an A+ uma seq
uencia de elementos de A+ que converge
em norma a a A. Desejamos provar que a A+ . Tomemos a 6= 0, pois se a = 0 nao ha o que provar,
pois 0 A+ . Sem perda de generalidade, podemos assumir que
Como cada
todos os an sao nao-nulos.


an


an e positivo, vale pelo item 2 da Proposicao 26.30 kan k 1, ou seja, kan k an kan k. Pela
continuidade da norma, an a implica kan k kak. Logo,








kak a = lim kan k an lim kan k = kak .
n



Isso provou que


a
1 e, portanto, a A+ .
kak

Corol
ario 26.10 Seja A uma a
lgebra C com unidade. Se a, b A+ ent
ao a + b A+ .

Prova. a + b = 2( a+b
). Agora, a+b
A+ pois e uma combinacao linear convexa de elementos de A+ ,
2
2
a+b
que e convexo. Logo, 2( 2 ) A+ , pois A+ e um cone.
Corol
ario 26.11 Seja A uma a
lgebra C com unidade. Se para algum z A valer z z A+ , ent
ao
z = 0.
2
Prova. Pela Proposicao 26.18, pagina 1162, (z z) \ {0} = (zz ) \ {0}. Assim, se z z e auto-adjunto
e positivo, zz tambem o e. Logo, pelo Corolario 26.10, z z zz e auto-adjunto e positivo.
Definamos x := (z + z )/2 e y := (z z )/(2i). Tem-se que

A+ 3 (z z zz ) = 2x2 + 2y 2 .
Como x e y sao auto-adjuntos 2x2 e 2y 2 sao positivos e, pelo Corolario 26.10, 2x2 + 2y 2 tambem o
e. Assim, provamos que 2x2 + 2y 2 A+ (A+ ). Pelo Teorema 26.19, isso implica 2x2 + 2y 2 = 0
e, pela Proposicao 26.29, segue que x2 = 0 e y 2 = 0. Pela propriedade C da norma, segue que
kxk2 = kx2 k = 0, provando que x = 0. Analogamente prova-se que y = 0. Como z = x + iy, segue que
z = 0.
Chegamos agora ao resultado mais importante a respeito de elementos auto-adjuntos positivos em
algebras C .
Teorema 26.20 Em uma uma a
lgebra C com unidade A todo elemento da forma x x e positivo. Pelo
item 3 da Proposica
o 26.30, conclumos que uma condica
o necess
aria e suficiente para que um elemento
auto-adjunto v A seja positivo e que exista x A tal que v = x x.
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1179/1304

Prova. Seja a = x x, que obviamente e auto-adjunto. Pela Proposicao 26.31, podemos escrever a =
a+ a onde a sao auto-adjuntos e positivos, comutam com a e satisfazem a+ a = a a+ = 0.
Tudo o que queremos e provar que a = 0. Seja w = xa . Temos que w w = a x xa =
a (a+ a )a = (a )3 . Como a e positivo, (a )3 tambem o e (pelo Teorema 26.14, pagina 1163).
Logo, w w e positivo. Pelo Corolario 26.11, isso implica w = 0, ou seja, xa = 0. Multiplicando a`
esquerda por x , teremos 0 = x xa = (a+ a )a = (a )2 . Como a e auto-adjunto, a propriedade
C da norma implica ka k2 = k(a )2 k = 0. Assim, x x = a+ , que e positivo por construcao.

26.3.7

O Lema da Raiz Quadrada em espa


cos de Hilbert. A Decomposi
c
ao
Polar

Os resultados acima estabeleceram algumas condicoes suficientes para que um elemento de uma algebra
de Banach possua uma raiz quadrada. Vamos agora particularizar essa analise para operadores autoadjuntos agindo em espacos de Hilbert. O resultado que obtemos e o Lema da Raiz Quadrada, a
seguir. Devemos informar o leitor que esse Lema pode ser tambem demonstrado por outros meios, a
saber, atraves do Teorema Espectral para operadores auto-adjuntos agindo em espacos de Hilbert (vide
Secao 26.6.1, pagina 1215). A analise abaixo tem, porem, certas vantagens, por exemplo, por permitir
demonstrar de modo relativamente simples que a raiz quadrada de um operador compacto e positivo e
tambem um operador compacto.
Um operador limitado e auto-adjunto A agindo em um espaco de Hilbert H e dito ser positivo
se h, Ai 0 para todo H. Anteriormente, havamos dito que um operador auto-adjunto era
positivo se seu espectro o fosse. O importante lema abaixo diz-nos, incidentalmente, que essas duas
nocoes de positividade sao equivalentes.
Teorema 26.21 (Lema da Raiz Quadrada.) Seja H um espaco de Hilbert complexo e seja A
B(H), auto-adjunto e positivo, ou seja, tal que h, Ai 0 para todo H. Ent
ao existe um u
nico
B B(H) igualmente auto-adjunto e positivo tal que B 2 = A.
2



A

1. Usando o Teorema 26.12, pagina
Prova. Pelo Corolario 26.9 e suficiente mostrar que
kAk
1151, tem-se que






 






h,
Ai
A
A

=
1
sup 1
sup ,

=


kAk
kAk
kAk
H, kk=1
H, kk=1
pois

h, Ai
1
kAk

(26.47)

para kk = 1. Pelo Corolario 26.9 e pela prova do Teorema 26.18, tem-se que existe B satisfazendo
B 2 = A, a saber,
!

X
1/2
0 n
(26.48)
B = kAk
+
cn ( A ) ,
n=1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1180/1304

A
. Essa expressao mostra que B e auto-adjunto (pois e o limite em norma de uma
kAk
seq
uencia de operadores auto-adjuntos). Como a soma e convergente em norma, tem-se pela continuidade do produto escalar que
!

X
1/2
0 n
h, Bi = kAk
1+
cn h, ( A ) i ,
(26.49)

com A0 :=

n=1

para H com kk = 1.

Vamos mostrar agora que 0 h, ( A0 )n i 1. De fato, se n e par, n = 2m, temos


h, ( A0 )n i = h( A0 )m , ( A0 )m i = k( A0 )m k2 0.

Se n e mpar, n = 2m + 1, temos
0 n

h, ( A ) i = h, ( A )i =

, A0
kk
kk



kk2 0,

por (26.47), onde = ( A0 )m . Assim,


0 h, ( A0 )n i k( A0 )n k = k( A0 )kn 1.
Retornando a` (26.49) e lembrando que cn 0 para n 1, tem-se
!

1/2
1+
cn = kAk1/2 1 1 = 0.
h, Bi kAk
n=1

Isso mostra que B e positivo.


Vamos agora provar20 a unicidade de B. Comecemos notando que se T e um operador que comuta
com A, entao T comuta com B, devido ao fato de o lado direito de (26.48) ser convergente em norma.
E. 26.19 Exerccio. Justifique!

Seja entao B 0 auto-adjunto e positivo tal que (B 0 )2 = A. Entao (B 0 )3 = B 0 A = AB 0 , mostrando


que B 0 e A comutam. Assim B e B 0 tambem comutam (por (26.48)). Usando essa comutatividade,
0 = (A A)(B B 0 ) = (B 2 (B 0 )2 )(B B 0 ) = (B B 0 )(B + B 0 )(B B 0 ) = B1 + B2 ,
onde B1 = (B B 0 )B(B B 0 ) e B2 = (B B 0 )B 0 (B B 0 ).
Sucede, porem, que para todo H,

h, B1 i = h(B B 0 ), B(B B 0 )i 0
pela positividade de B e, analogamente,
h, B2 i = h(B B 0 ), B 0 (B B 0 )i 0
20

Seguiremos basicamente [103].

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1181/1304

pela suposta positividade de B 0 . Como B1 + B2 = 0, segue que B1 = B2 = 0.


Assim,
0 = B1 B2 = (B B 0 )B(B B 0 ) (B B 0 )B 0 (B B 0 )
= (B B 0 )(B(B B 0 ) B 0 (B B 0 )) = (B B 0 )3 .
Logo, usando duas vezes a propriedade C da norma, tem-se
0 = k(B B 0 )4 k = k((B B 0 )2 ) (B B 0 )2 k = k(B B 0 )2 k2 = k(B B 0 ) (B B 0 )k2 = kB B 0 k4 ,
o que prova que kB B 0 k = 0, ou seja, B = B 0 .
A raiz quadrada de um operador positivo e a unidade
Vimos acima em (26.48) que se A e um operador limitado nao-nulo, auto-adjunto e positivo agindo
em um espaco de Hilbert H entao
"

n #

A
A := kAk1/2
+
cn

,
(26.50)
kAk
n=1

e igualmente auto-adjunto e satisfaz ( A)2 = A. Claramente,

A := lim kAk1/2
N

"

N
X

cn

n=1

kAk

"

:= lim kAk1/2 1 +
N

Como c0 = 1, temos 1 +
N
X
n=0

cn = lim

t1

PN

N
X
n=0

n=1 cn

cn t

N
X

n #
cn

n=1

PN

n=0 cn .

= lim

t1

+ lim kAk1/2
N

 
p
n
X
A
p n
cn
(1)
p
kAk
n=1
p=1

N
X

Tem-se para qualquer N 1 que

1 t lim

"

t1

cn t

n=N +1

= lim

t1

c n tn .

n=N +1

Note-se agora que,



Ppor (26.A.1), a serie n=0 cn converge absolutamente e, portanto, temos
P para qualn

quer

>
0
que
|c
|


para
todo
N
grande
o
suficiente.
Assim,
para
|t|
<
1,
c
t

n
n
n=N +1
n=N +1
P
|c
|

,
para
todo
N
grande
o
suficiente.
Logo,
n=N +1 n





N

X



X
X






cn tn .
cn tn = lim
cn = lim

t1


t1


n=0

n=N +1

n=N +1

JCABarata. Curso de Fsica-Matem


atica

Tomando  0, conclumos que lim

N
X

Captulo 26

1182/1304

cn = 0 e da segue que

n=0

A = lim kAk1/2
N

ou seja,

Vers
ao de 29 de setembro de 2005.

"

 
p #
A
n
(1)p
.
cn
p
kAk
p=1
n=1

N
X

n
X

A = lim PN (A) ,

(26.51)

(26.52)

onde PN (A) e o polinomio em A dado por


PN (A) :=

N
X
p=1

pN, p A ,

onde

pN, p

 
n
pN, p (kAk) :=
(1) cn
kAk1/2p . (26.53)
p
n=p
N
X

O interessante nas expressoes (26.51)-(26.53) e que cada PN (A) nao contem nenhum termo da forma
const. , ou seja, proporcional a` unidade (note o leitor que a soma em p em (26.53) comeca em p = 1).
Esse fato sera relevante quando discutirmos a raiz quadrada de operadores compactos e positivos.
A Decomposi
c
ao Polar de Operadores Limitados em Espa
cos de Hilbert
um fato elementar que todo n
E
umero complexo z pode ser representado na forma polar z = e i
p
com = |z| = x2 + y 2 , x e y sendo as partes real e imaginaria de z, respectivamente. No caso de
operadores limitados agindo em espacos de Hilbert ha uma relacao semelhante que discutiremos agora.

Se A e um operador limitado agindo em um espaco de Hilbert H, e claro que A A e um operador


auto-adjunto e positivo, pois h, A AiH = hA, AiH = kAk2 0 para todo H. Portanto,
pelo Teorema 26.21, pagina 1179, A A possui uma raiz quadrada, a qual e igualmente um operador
autoadjunto e positivo (e unicamente definida por essas propriedades). Vamos denota-la por |A| := A A,
a qual sera denominada o m
odulo de A. Vale entao o seguinte.
Teorema 26.22 (A Decomposi
c
ao Polar de Operadores Limitados em Espa
cos de Hilbert)
Seja A B(H) um operador limitado agindo
em um espaco de Hilbert H. Ent
ao A pode ser es
crito na forma A = U |A|, onde |A| := A A e U B(H) e uma isometria parcial a qual satisfaz
o Ker (U ) = Ker (A).
2
Ran (U ) = Ran (A) e e unicamente determinada pela condica
Prova. Comecemos observando que



|A| = A ,

H ,

(26.54)

pois



|A| 2 = h|A|, |A|i = h, |A|2 i = h, A Ai = h, A Ai = hA, Ai = A 2 .
H
H
H
H
H

O fato que k|A|k = kAk implica, obviamente, que |A| = 0 se e somente se A = 0, ou seja,
Ker (|A|) = Ker (A). Podemos entao definir uma funcao bijetora U : Ran (|A|) Ran (A) por
U (|A|) := A ,

H .

(26.55)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1183/1304

O proximo passo e mostrar que U e linear. De fato, para , e , H, arbitrarios, tem-se





 (26.55)
(26.55)
U |A|+|A| = U |A|(+)
= A(+) = A+A = U (|A|)+U (|A|) ,

o que prova a linearidade de U . Passamos assim a escrever (26.55) como U |A| := A, o que incidentalmente mostra que A = U |A|, pois H e arbitrario. A relacao (26.54) diz-nos que kU |A|k = kAk
e, portanto, a norma de U , restrito a Ran (|A|) e igual a 1.

Sabemos que o completamento de Ran (A) e o seu fecho Ran (A) e podemos considerar U como
uma aplicacao de Ran (|A|) em Ran (A). Pelo Teorema BLT (Teorema 26.1, pagina 1119), U possui
uma extensao u
nica ao completamento Ran (|A|), que e Ran (|A|), sendo que essa extensao tambem
tem norma 1. Para evitar sobrecarregar a notacao denotamos essa extensao tambem por U , valendo
U : Ran (|A|) Ran (A). Como kU k = 1, U e uma isometria.


Notemos agora que Ran (|A|)
= Ran (|A|) (vide Proposicao 25.2, pagina 1094). Agora,

Ran (|A|) se e somente se h, |A|iH = 0 para todo H. Como |A| e auto-adjunto, isso implica
que Ran (|A|) se e somente se h|A|, iH = 0 para todo H. Logo, Ran (|A|) se e
somente se |A| = 0 e, por (26.54), se e somente se A = 0. Assim, conclumos que



Ran (|A|)
= Ran (|A|) = Ker (|A|)

(26.54)

Ker (A) .

(26.56)

Vamos agora estender U para todo H. Uma possvel extensao e a seguinte. Lembremos pelo
Teorema da Decomposicao Ortogonal (Teorema 25.2, pagina 1093) que todo H pode ser escrito na


forma = + com Ran (|A|) e Ran (|A|) . Assim, definimos U := U , o que equivale


a impor que U age como o operador nulo em Ran (|A|) . Novamente, denotamos essa extensao


tambem por U e, como Ran (|A|) = Ker (A) (vide (26.56)), continua valendo A = U |A|. Como U


e uma isometria quando restrito a Ran (|A|) , tem-se Ker (U ) = Ker (A).
Provemos agora a unicidade. Seja V uma isometria parcial tal que A = V |A| e Ker (V ) = Ker (A).
evidente que para todo H vale 0 = A A = V |A| U |A|, o que prova que V = U em
E
Ran (|A|) e, conseq
uentemente, em Ran (|A|), pois U e V sao limitados. Como V e U sao nulos em


Ran (|A|) = Ker (A), conclumos que V = U em toda parte.

26.4

Um Pouco sobre Estados e Representa


co
es de Algebras
C

Conforme a definicao que apresentamos em paginas anteriores, uma algebra normada C e dita ser uma
algebra C se for uma algebra de Banach- com relacao a uma certa norma k k e com a propriedade

adicional que ka ak = kak2 para todo a C. Algebras


C tem, como teremos a oportunidade de ver,
uma relacao ntima com a teoria de operadores em espacos de Hilbert, ate mesmo por que a algebra

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1184/1304

B(H) dos operadores limitados agindo em um espaco de Hilbert H e um exemplo basico de algebra C .
Por abstrarem e generalizarem varias das propriedades de algebras de operadores agindo em espacos
de Hilbert, algebras C desempenham tambem um papel importante na Fsica Quantica. Vamos nesta
secao discutir algumas das suas propriedades mais basicas.

Funcionais Lineares em Algebras


C
Se C e uma algebra C , uma aplicacao : C e dita ser um funcional linear se (a + b) =
(a) + (b) para todos , e todos a, b C. Como toda algebra C e um espaco de Banach
vale tambem a afirmacao que um funcional linear e contnuo se e somente se for limitado, ou seja, se
existir M 0 tal que k(a)k M kak para todo a C. Se um funcional linear e limitado sua norma
e definida por kk = supaC, a6=0 |(a)|
. Claramente vale tambem aqui a afirmacao que o conjunto dos
kak
funcionais lineares limitados e um espaco de Banach em relacao a` essa norma.
Um funcional linear e dito ser positivo se (a a) 0 para todo a C. Funcionais lineares
positivos desempenham um importante papel na teoria das algebras C .
Se e um funcional linear positivo de uma algebra C , C, podemos definir em C uma forma
sesquilinear positiva (para a definicao, vide pagina 113) dada por
ha, bi = (a b),

a, b C.

E. 26.20 Exerccio. Verifique que isso e de fato uma forma sesquilinear positiva em C.

Pelo Teorema 2.6, pagina 114, valem para qualquer funcional linear positivo as seguintes propriedades:
(a b) = (b a)
(26.57)
e
|(a b)|2 (a a)(b b),

(26.58)

denominada desigualdade de Cauchy-Schwarz. De (26.57) e possvel provar que para qualquer funcional
linear positivo vale (a ) = (a) para todo a C. A prova e trivial no caso de a algebra ter uma
identidade (tome-se b = em (26.57)). Para a prova no caso geral, veja as referencias [15], [30] ou [8].
Um importante resultado sobre funcionais lineares positivos e o seguinte.
Teorema 26.23 Todo funcional linear positivo em uma a
lgebra C e limitado e, portanto, contnuo.
Fora isso, se a a
lgebra tiver unidade e e um funcional positivo vale kk = ( ).
2
Prova. Apresentaremos apenas a demonstracao para algebras que possuem uma unidade. A demonstracao completa pode ser encontrada, por exemplo, nas referencias [15], [30] ou [8].
Notemos primeiramente que se e um funcional linear positivo em uma algebra com unidade entao
( ) 0, pois ( ) = ( ) 0, ja que e positivo.

Seja x C com a propriedade que kxk 1. Entao o Corolario 26.7, pagina 1174, diz-nos que existe
um elemento y C tal que x x = y y. Se e um funcional linear positivo, tem-se entao que
( x x) = (y y) 0, ou seja,
0 (x x) ( ).
(26.59)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1185/1304

Por outro lado, vale que


|(x)|2 = |( x)|2 (

)(x x) = ( )(x x) ( )2 ,

onde usamos a desigualdade de Cauchy-Schwarz (26.58) na primeira desigualdade e (26.59) na u


ltima
a
desigualdade. Se a e um elemento nao-nulo arbitrario de C entao x =
e tal que kxk = 1 e, por
kak
isso, vale pela relacao que acabamos de provar:

 2


a

( )2

kak
o que implica |(a)| ( )kak, para todo a 6= 0. Como essa relacao vale trivialmente para a = 0, vale
para todo a C, provando que e limitado.

Mostremos agora que kk = ( ) para qualquer funcional linear positivo . Notemos primeiramente
que ( ) kk k k, ou seja,
( ) kk.
(26.60)

Agora, pela desigualdade de Cauchy-Schwarz (26.58) temos

|(a)|2 = |( a)|2 ( ) (a a) ( )kk ka ak = ( ) kk kak2,


o que implica
kk2 = sup
a6=0

que diz-nos que

|(a)|2
( )kk,
kak2

kk ( ).

Junto com (26.60), isso implica kk = ( ), como queramos.

Estados em Algebras
C
Um funcional linear positivo de uma algebra C e dito ser um estado se for normalizado de forma
que kk = 1. Se a algebra tiver uma unidade isso equivale a dizer que ( ) = 1.

Estados desempenham um papel da maior importancia na teoria das algebras C e suas aplicacoes
em Fsica pois, como teremos a oportunidade de discutir, estados de algebras C estao intimamente
ligados a estados fsicos de sistemas quanticos (da a escolha do nome estado).
Por ora, e ja no intuito de preparar essa discussao, mostremos uma construcao importante que pode
ser feita com estados de uma algebra C , a chamada construcao GNS, que consiste em um procedimento
canonico de obtencao de representacoes de algebras C em espacos de Hilbert, algo de suma relevancia
para as aplicacoes de algebras C na fsica quantica.
Vetores Cclicos
Seja H um espaco de Hilbert e S um conjunto de operadores limitados agindo em H. Um vetor
H e dito ser um vetor cclico para o conjunto S se o conjunto de vetores {A, A S} for um
conjunto denso em H.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1186/1304

A Constru
c
ao GNS
possvel com esses
Teorema 26.24 Seja um estado de uma a
lgebra C que denotaremos por C. E
ingredientes construir um espaco de Hilbert H e uma representaca
o da a
lgebra C por operadores
limitados agindo em H tal que (a ) = (a) para todo a C (uma representaca
o com essa propriedade e dita ser uma representaca
o-). Fora isso, se a a
lgebra C possuir uma unidade ent
ao existe em
H um vetor com a propriedade que (a) = h, (a)iH . Esse vetor e um vetor cclico para a
representaca
o , ou seja, { (a), a C} e um conjunto denso em H .
2
A construcao do espaco de Hilbert H e da representacao e denominada construca
o GNS em
21
22
23
honra a Gelfand , Naimark e Segal que a desenvolveram nos anos 1940.
Prova. A ideia da demonstracao e usar o fato que C e um espaco vetorial e tentar transformar C em
um espaco de Hilbert, definindo primeiramente em C um produto escalar.
Podemos, usando o estado , definir em C uma forma sesquilinear positiva por ha, bi := (a b) com
a, b C. Sucede, porem, que pode haver elementos nao-nulos n da algebra para os quais (n n) = 0.
Para esses elementos teramos hn, ni = 0 com n 6= 0. Isso diz-nos que a forma sesquilinear positiva
acima nao e, em geral, um produto escalar e, portanto, essa tentativa ingenua de fazer de C um espaco
de Hilbert em geral falha. Ha, no entanto, um procedimento que permite contornar esse problema,
o qual passaremos a descrever. Esse procedimento ja foi, alias, discutido no topico sobre Formas
Sesquilineares Positivas e Produtos Escalares, pagina 118.
Vamos olhar mais de perto o conjunto dos elementos n da algebra com a propriedade acima. Denominemos
N = {n C| (n n) = 0}.
(26.61)
Vamos mostrar os seguintes tres fatos sobre N:
1. Tem-se que
N = {n C| (b n) = 0 para todo b C}.
2. N e um sub-espaco linear fechado de C.
3. N e um ideal a` esquerda de C, ou seja, para cada n N vale que an N para todo a C.
Prova de 1. Seja N1 = {n C| (b n) = 0 para todo b C}. Pela desigualdade de CauchySchwarz tem-se que
|(b n)|2 (b b)(n n).

Assim, se n N vale que (b n) = 0 para todo b C. Logo N N1 . Agora, se n0 N1 entao


(b n0 ) = 0 para todo b, em particular para b = n0 , ou seja, ((n0 ) n0 ) = 0, ou seja, n0 N, provando
que N1 N. Logo, N = N1 .
21

Israil Moiseevic Gelfand (1913-).


Mark Aronovich Naimark (1909-1978).
23
I. E. Segal ().

22

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1187/1304

Prova de 2. Sejam m, n N e , . Entao para qualquer b C valem (b m) = (b n) = 0.


Logo,
(b (m + n)) = (b m) + (b n) = 0,
mostrando que m + n N.

Seja ni , i , uma seq


uencia em N que converge a um elemento n C. Pela continuidade de
(lembre-se que e um funcional linear positivo e, portanto, contnuo), vale para todo b C


(b n) = lim (b ni ) = lim 0 = 0,
i

provando que N e fechado.


Prova de 3. Sejam n N, a, b C. Temos que
(b (an)) = ((a b) n) = 0 (por que?).
Assim, para todo b C vimos que (b (an)) = 0, o que prova que an N para todo a C e todo
n N, ou seja, N e um ideal a` esquerda de C.
Uma vez provadas essas tres propriedades de N, vamos retomar a construcao do espaco de Hilbert
H . Como N e um sub-espaco de C, podemos construir o sub-espaco quociente C/N pela construcao
delineada na secao 2.1.1, pagina 94. O espaco C/N e formado pelas classes de equivalencia [a] =
{a + n, n N}, a C e tem por vetor nulo [0] = {n, n N} = N.
Seguindo a ideia anterior, definimos em C/N a forma sesquilinear positiva dada por
h[a], [b]i = (a b).
Notemos que essa expressao e bem-definida, no sentido que o lado direito nao depende do representante
tomado nas classes. Assim, se substitussemos a por a + n com n N, o lado direito ficaria
((a + n) b) = (a b) + (n b) = (a b)
pois (n b) = (b n) = 0. Analogamente (a (b + n)) = (a b). Notemos tambem que h[a], [b]i e
agora um produto escalar, pois h[a], [a]i = (a a) que e zero se e somente se a N, em cujo caso
teramos [a] = [0] (por que?).
O espaco C/N e assim um espaco vetorial dotado de um produto escalar. Normalmente C/N
nao e completo em relacao a` norma induzida por esse produto escalar, mas podemos considerar seu
g (vide pagina 841) que e completo e, portanto, e um espaco de Hilbert.
completamento canonico C/N
g
Esse e o espaco de Hilbert H do enunciado do teorema: H = C/N.

Passemos agora a` construcao da representacao da algebra C. Pela construcao do completamento


g Para a C, definamos
canonico podemos considerar C/N como um subconjunto denso de H = C/N.
(a) em C/N da seguinte forma:
(a)[z] = [az],
(26.62)
z C.

Ha uma serie de coisas a se provar sobre essa definicao. Primeiro notemos que a expressao (26.62)
e bem definida no sentido que independe do elemento z tomado na classe. Isso se deve ao fato de

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1188/1304

N ser um ideal a` esquerda da algebra C. Assim, se trocassemos z por z + n com n N teramos


a(z + n) = az + an e como an N, segue que [a(z + n)] = [az].
tambem evidente pela definicao (26.62) que em C/N tem-se para todo [z] C/N que
E
(a + b)[z] = (a)[z] + (b)[z]

(26.63)

(a) (b)[z] = (ab)[z],

(26.64)

e
para todos , e todos a, b C. Notemos que (26.63) e (26.64) dizem que e uma representacao
de C em C/N. Mais abaixo vamos mostrar que essas relacoes sao validas nao apenas no conjunto denso
C/N, mas em todo H .
Vamos agora mostrar que para cada a C, (a) e um operador limitado agindo em C/N.

Temos que para [z] C/N, [z] 6= [0]

k (a)[z]k2 = k[az]k2 = h[az], [az]i = ((az) (az)) = (z (a a)z)


=
Tem-se, porem, que
(a) :=

(z (a a)z)
(z (a a)z)

(z
z)
=
k[z]k2 . (26.65)
(z z)
(z z)
(z az)
(z z)

(26.66)

e um estado em C. De fato e positivo, pois


(c c) =

((cz) (cz))
(z (c c)z)
=
0
(z z)
(z z)

pois e positivo. Fora isso ( ) = 1, como facilmente se ve. Assim, tem-se kk = 1 e, portanto,
|(c)| kk kck kck para todo c C.
Retornando a` (26.65), tem-se

k (a)[z]k2 = (a a) k[z]k2 kk ka ak k[z]k2 = ka ak k[z]k2 = kak2 k[z]k2 ,


donde conclumos que em C/N vale
k (a)k kak.
Isso provou que (a) e um operador limitado agindo no sub-espaco denso C/N. Podemos entao
evocar o Teorema BLT (pagina 1119) e dizer que (a) tem uma extensao u
nica para todo H , que
tambem denotaremos por (a), com a mesma norma operatorial. Portanto, vale tambem para essa
extensao que k (a)k kak.
Pela continuidade de (a) e facil ver que as relacoes (26.63) e (26.64) valem para todo H , ou seja,
(a + b) = (a) + (b)

(26.67)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1189/1304

e
(a) (b) = (ab),

(26.68)

provando que e uma representacao da algebra por operadores limitados em H .


Falta-nos mostrar ainda que (a ) = (a) para todo a C. Notemos que para [x], [y] C/N
vale
h[x], (a )[y]i = h[x], [a y]i = (x a y) = ((ax) y)
= h[ax], [y]i = h (a)[x], [y]i = h[x], (a) [y]i, (26.69)
provando que em C/N vale (a ) = (a) . Por continuidade essa relacao pode ser estendida para
todo H , mostrando que e uma representacao- de C.
Se C tem uma unidade, seja = [ ] e calculemos h, (a)i:
h, (a)i = h[ ], (a)[ ]i = h[ ], [a ]i = h[ ], [a]i = ( a) = (a).
Assim, vemos que o vetor , em um certo sentido representa o estado em H , pois (a) =
h, (a)i para todo a C.
Que a um vetor cclico para a representacao e elementar pois, { (a), a C} = {[a], a
g
C} = C/N e C/N e obviamente denso em H = C/N.
Isso completa a demonstracao do teorema.

A Constru
c
ao GNS. Um exemplo
Vamos agora mostrar a construcao GNS em um caso mais ou menos explcito.
O Teorema 26.11, pagina 1144 diz-nos que para um espaco de Hilbert H o conjunto B(H) dos
operadores lineares agindo em H e uma algebra C . Para o caso em que H e o espaco de dimensao
finita n , B(H) coincide com a algebra Mat(n, ) das matrizes n n com entradas complexas.
Se M e uma matriz cujos elementos sao Mij , i, j {1, . . . , n}, define-se o traco de M por
tr (M ) =

n
X

Mii .

i=1

bem sabido que para duas matrizes quaisquer M e N vale a chamada propriedade cclica do traco:
E
tr (M N ) = tr (N M ). Fora isso, tem-se que
tr (M M ) =

n
X
i=1

(M M )ii =

n X
n
X

(M )ik Mki =

i=1 k=1

n X
n
X
i=1 k=1

Mki Mki =

n X
n
X
i=1 k=1

|Mki |2 ,

o que diz-nos que


para qualquer matriz M .

tr (M M ) 0

(26.70)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1190/1304

Note-se tambem que se M e tal que tr (M M ) = 0 entao


n X
n
X
i=1 k=1

|Mki |2 = 0,

o que so e possvel se Mij = 0 para todos i e j, ou seja,


tr (M M ) = 0 M = 0.

(26.71)

Seja uma matriz n n com as seguintes propriedades: e auto-adjunta, seus autovalores r i


satisfazem ri 0. Como e bem sabido, se e auto-adjunta, pode ser diagonalizada por uma
transformacao unitaria, ou seja, existe uma matriz V Mat(n, ) unitaria (V V = V V = ) tal que
V V e a matriz diagonal

r1

..
V V = D =
.
.
rn
Dada uma matriz como acima, podemos definir uma matriz 1/2 da seguinte forma:
1/2 := V D1/2 V ,
onde
D1/2
facil ver que
E


r1

..
=
.

rn

1/2 1/2 = (V D1/2 V )(V D1/2 V ) = V (D1/2 )2 V = V D V = .


Para futuros propositos vamos definir tambem P , o projetor ortogonal sobre o sub-espaco fechado
Im(1/2 ): se n 3 u = v + w, com v Im(1/2 ) e w (Im(1/2 )) entao
P u = v.

(26.72)

facil mostrar que P e auto-adjunto e satisfaz (P )2 = P (mostre!). Fora isso, e obvio pela definicao
E
que P 1/2 = 1/2 . Como 1/2 e auto-adjunto, conclumos que
1/2 = (1/2 ) = (P 1/2 ) = 1/2 P,
o que mostra que
P 1/2 = 1/2 P = 1/2 .
Isso tem por conseq
uencia que
P P = (P 1/2 )1/2 P = 1/2 1/2 = .
Usaremos isso adiante.

(26.73)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1191/1304

Vamos supor que tambem satisfaca tr () = 1. Entao, e facil constatar que


) 3 A 7 (A) = tr (A)

Mat(n,
e um estado em Mat(n,

). De fato, e um funcional linear e tambem positivo, pois

(A A) = tr (A A) = tr (1/2 1/2 A A) = tr (1/2 A A1/2 ) = tr ((A1/2 ) A1/2 ) 0, (26.74)


pela propriedade (26.70). Fora isso, e claro que ( ) = tr ( ) = tr () = 1.
possvel mostrar (nao o faremos aqui) que todo estado de Mat(n, ) e da forma , para algum
E
com as propriedades acima.
Uma primeira tentativa
Como Mat(n,
dado por

) e tambem um espaco vetorial. Vamos definir em Mat(n,

) um produto escalar

hA, Bi = tr (A B).

(26.75)

Por (26.70) e (26.71) segue que h, i e de fato um produto escalar.


E. 26.21 Exerccio. Mostre que Mat(n,
6

) e um espaco de Hilbert com o produto escalar de (26.75).

O exerccio acima diz-nos que o espaco vetorial Mat(n, ) e um espaco de Hilbert com o produto
escalar h, i de (26.75). Como tal, denominaremos o espaco vetorial Mat(n, ) por H.
Definimos uma representacao de Mat(n,

) em H da seguinte forma:

(A)B = AB,
para matrizes A e B Mat(n,
algebra Mat(n, ) em H.

trivial verificar que assim definida e uma representacao da


). E

Definindo-se
:= 1/2 H,
tem-se
h , (A) i = h1/2 , (A)1/2 i = h1/2 , A1/2 i = tr ((1/2 ) A1/2 )
= tr (1/2 A1/2 ) = tr (1/2 1/2 A) = tr (A) = (A).

(26.76)

Vemos assim que o vetor = 1/2 representa o estado em H.


Um problema com essa construcao e o seguinte. Pelas hipoteses assumidas nao e sempre verdade
que e 1/2 sao invertveis. Conseq
uentemente nao podemos garantir que e um vetor cclico
1/2
para a representacao , pois se
nao for invertvel nem toda a matriz pode ser escrita da forma
(A)1/2 = A1/2 , para algum A Mat(n, ) (por que?). Assim, caso nao possua inversa, a
construcao apresentada acima nao coincide com a construcao GNS.
A Constru
c
ao GNS

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

A alternativa correta e comecar definindo em Mat(n,

1192/1304

) uma forma sesquilinear positiva dada agora

por
hA, Bi = (A B) = tr (A B).

(26.77)

Que h, i e uma forma sesquilinear e claro. Que e positiva segue de (26.74).

Como hA, Ai = tr ((A1/2 ) A1/2 ), o conjunto N de (26.61) vem a ser agora


N = {N Mat(n,

)| N 1/2 = 0}.

Se 1/2 nao for invertvel, N pode ter outros elementos alem da matriz nula. Note que N = {N
Mat(n, )| Ker (N ) Im(1/2 ) = 0} e que se 1/2 nao e invertvel, nao e sobrejetora, ou seja, Im(1/2 )
e um conjunto menor que n .
Sejam as classes de equivalencia [A] = {A+N, N N}, A Mat(n, ). Afirmamos que AP [A],
onde P e o projetor sobre Im(1/2 ), definido em (26.72). De fato, como P 1/2 = 1/2 (por que?), segue
facilmente que
(AP A)1/2 = A1/2 A1/2 = 0,

provando que AP A N. Podemos assim identificar Mat(n,


formado pelas matrizes da forma AP com A Mat(n, ):
Mat(n,

)/N com o subconjunto de Mat(n,

)/N {AP, A Mat(n,

Como no caso da construcao geral, definimos em Mat(n,

)}.

)/N um produto escalar por

hAP, BP i = ((AP ) BP ) = (P A BP ) = (P A BP )
= tr (P A BP ) = tr ((P P )A B) = tr (A B) = (A B).
Acima usamos (26.73).
um exerccio simples (faca!) mostrar que Mat(n,
E
escalar.
Definimos uma representacao de Mat(n,

(26.78)

)/N e um espaco de Hilbert com esse produto

) agindo em Mat(n,

)/N por

(A)BP = (AB)P,
A, B Mat(n,

).

Note-se tambem que Mat(n,

evidente que
)/N 3 P = P . E

{ (A)P, A Mat(n,
mostrando que P Mat(n,

)} = {AP, A Mat(n,

)} = Mat(n,

)/N,

)/N e um vetor cclico para a representacao .

Definindo-se

teremos

:= P Mat(n,

)/N,

h , (A) i = hP, AP i = (P AP ) = tr (P AP )
= tr ((P P )A) = tr (A) = (A),
onde usamos novamente (26.73). Vemos assim que o vetor representa o estado em Mat(n,

(26.79)
)/N.

JCABarata. Curso de Fsica-Matem


atica

26.5

Vers
ao de 29 de setembro de 2005.

Captulo 26

1193/1304

O Espectro de Operadores em Espa


cos de Banach

A nocao de espectro e de grande importancia tanto no estudo de propriedades estruturais de operadores


quanto em aplicacoes. Na Fsica Quantica sua relevancia manifesta-se ja nos seus fundamentos, pois e
um postulado basico que os valores obtidos em mensuracoes individuais de um observavel sao elementos
do espectro do operador auto-adjunto a ele associado. Nessa secao trataremos de definir o conceito de
espectro de modo preciso e geral. O estudo do espectro de operadores tem uma de suas culminacoes
no teorema espectral, do qual trataremos com detalhe mais adiante em diversos casos de interesse.
Comecemos com uma advertencia. Muitos estudantes, especialmente de Fsica, tem a nocao preconcebida (oriunda de maus cursos e/ou de imprecisoes matematicas de alguns (muitos) livros-texto
introdutorios de Mecanica Quantica) que o espectro de um operador coincide com o conjunto de seus
autovalores. Essa nocao e incorreta. Como discutiremos, o espectro de um operador e, em geral, maior
que o conjunto de seus autovalores. Ha, de fato, certos tipos de operadores cujo espectro coincide
com o conjunto de autovalores (tal e o caso de matrizes agindo em espacos de dimensao finita, ou de
operadores compactos auto-adjuntos), mas tais situacoes sao especiais. Ha mesmo operadores (veremos exemplos) que nao possuem autovalores, mas tem um espectro nao-trivial. Lamentavelmente, tal
nocao incorreta e a fonte de muitos mal-entendidos (nem sempre inconseq
uentes!) entre a comunidade
de fsicos e a de matematicos e isso e mais uma razao para sugerirmos um estudo cuidadoso da nocao
de espectro.
O conjunto resolvente e o espectro de um operador
Seja X um espaco de Banach e seja T B(X) um operador limitado agindo em X. Dizemos que um
n
umero complexo e um elemento do conjunto resolvente de T se o operador T for bijetor
como aplicacao de X em X. Estamos no caso 1 do Teorema 26.13 e, pelo Teorema da Aplicacao Inversa,
Teorema 26.8, pagina 1140, isso implica que ( T )1 um operador limitado de X em X, ou seja, um
elemento de B(X).
Assim, definimos o conjunto resolvente de T B(X), denotado por (T ), por
n
o
(T ) := | T e bijetor .
Dizemos que um n
umero complexo e um elemento do espectro de T se n
ao for um elemento
do conjunto resolvente de T , ou seja, se T n
ao for bijetor como aplicacao de X em X.
Assim, definimos o espectro de T B(X), denotado por (T ), por
(T ) :=
ou seja,
(T ) :=

\ (T ) ,

o
| T nao e bijetor .

A razao da nomenclatura conjunto resolvente e a seguinte: em muitas aplicacoes (como


Nota.
no caso de equacoes integrais) interessa-nos resolver equacoes do tipo ( T ) = para todo
elemento de um espaco de Banach X. Isso so e possvel se T for bijetor, em cujo caso a solucao e
= ( T )1 .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1194/1304

Tipos de espectro. O espectros pontual, contnuo e residual


Um ponto de central importancia na analise de propriedades de operadores e classificar seu espectro
de acordo com certas categorias. Ha varias classificacoes que correspondem a varios tipos de espectro
(nao-necessariamente disjuntos, como conjuntos): o espectro pontual, o espectro residual, o espectro
contnuo, o espectro absolutamente contnuo, o espectro singular contnuo, o espectro essencial, o
espectro transiente, o espectro recorrente e possivelmente outros. Trataremos de alguns desses tipos de
espectro nestas Notas, comecando aqui pela classificacao do espectro de operadores agindo em espacos
de Banach em espectro pontual, contnuo e residual.
Se T B(X) e um operador limitado agindo em um espaco de Banach X e e um elemento de
(T ), entao T nao e bijetor. Estamos no caso 2 do Teorema 26.13, pagina 1157, o qual quebra-se
em tres casos mutuamente exclusivos:
Caso a. O operador T nao e injetor, e ( T )1 nao pode ser definida na imagem de T ,
pois Ker ( T ) e nao-trivial, ou seja, existe v 6= 0 com T v = v. Isso nos diz e autovalor de
T . Isso conduz a` seguinte definicao:
Denotamos por p (T ) o conjunto de todos os autovalores de T :
p (T ) := { | x X, x 6= 0, tal que T x = x} .
p (T ) e denominado espectro pontual de T , ou espectro discreto de T ou ainda espectro de auto importante frisar que esses dois conjuntos podem
valores de T . Claro esta que p (T ) (T ). E
nao ser coincidentes e que se pode ter p (T ) = . Veremos exemplos mais abaixo.
Caso b. O operador T e injetor, Ker ( T ) e composto apenas pelo vetor nulo (e, portanto,
n
ao e autovalor de T ). Fora isso Ran ( T ) e denso e ( T )1 existe agindo em Ran ( T )
mas nao e limitada. Isso conduz a` seguinte definicao:
Denotamos por c (T ) o conjunto de todos os tais nao e um autovalor de T , Ran ( T )
e denso e ( T )1 existe agindo em Ran ( T ) mas nao e limitada. c (T ) e denominado
espectro contnuo de T 24 .
Por fim, temos o
Caso c. O operador T e injetor, Ker ( T ) e composto apenas pelo vetor nulo (e, portanto,
n
ao e autovalor de T ). Porem, Ran ( T ) nao e denso e ( T )1 existe agindo em
Ran ( T ), podendo ser limitada ou nao. Isso conduz a` seguinte definicao:

Denotamos por r (T ) o conjunto de todos os tais nao e um autovalor de T , Ran ( T )


nao e denso e ( T )1 existe agindo em Ran ( T ), podendo ser limitada ou nao. r (T ) e
denominado espectro residual de T .

Esta claro pelas definicoes acima que


(T ) = p (T ) c (T ) r (T )
24

(26.80)

Vale aqui advertir o estudante que alguns textos, como [103], [108] e [70], adotam uma definica
o diferente de espectro
contnuo. Nossa definica
o e encontrada em textos como [138], [77] e outros.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1195/1304

sendo a uniao disjunta. Os varios tipos de espectro descritos acima serao ilustrados em exemplos
apresentados mais abaixo (pagina 1199), aos quais o leitor podera passar agora, se o desejar, mas
para a uma melhor compreensao dos mesmos precisamos antes de alguns resultados gerais da teoria
espectral.
O operador resolvente e propriedades topol
ogicas do espectro
Se um n
umero complexo pertence ao conjunto resolvente de T B(X), define-se o operador
resolvente de T calculado em , denotado por R (T ), por
R (T ) := ( T )1 .
Pelas hipoteses R (T ) e bijetor para todo (T ) e e um elemento de B(X) (pelo Teorema da
Aplicacao Inversa, Teorema 26.8, pagina 1140).
Muitas propriedades de (T ) (e, portanto de (T )) podem ser derivadas de propriedades de seus
operadores resolventes. Por exemplo, mostraremos mais adiante que (T ) e sempre um conjunto aberto
de (e, portanto, (T ) e sempre um conjunto fechado de ) e mostraremos tambem que (T ) nunca
e igual a todo (e, portanto, (T ) nunca e vazio).
Proposi
c
ao 26.32 (Primeira identidade do resolvente) Seja X um espaco de Banach e T
B(X). Se e pertencem ao conjunto resolvente (T ) de T , ent
ao
R (T ) R (T ) = ( )R (T )R (T ) .

(26.81)
2

A demonstracao e identica a`quela da Proposicao 26.21, pagina 1163. Iremos agora estabelecer uma
serie de resultados sobre propriedades do operador resolvente que culminarao com a Proposicao 26.35.
Todos sao essencialmente casos particulares de resultados demonstrados acima no caso geral de algebras
de Banach com unidade.
Lema 26.5 Seja X um espaco de Banach e T B(X). Se e pertencem ao conjunto resolvente
(T ) de T e | | < kR (T )k1 ent
ao
#
"
#
"

X
X
n
n
=
(26.82)
+
( )n (R (T ))
+
( )n (R (T )) R (T ) .
R (T ) = R (T )
n=1

n=1

2
O lema acima e um caso particular do Lema 26.3, pagina 1164, para algebras de Banach com
unidade gerais, e por isso sua demonstracao e dispensada.
Proposi
c
ao 26.33 Seja X um espaco de Banach e T B(X). Ent
ao (T ) e um subconjunto aberto
de , o que implica que (T ) e um subconjunto fechado de .
2

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1196/1304

Novamente, a proposicao acima e um caso particular da Proposicao 26.22, pagina 1165, para algebras
de Banach com unidade gerais, e por isso sua demonstracao e dispensada. A Proposicao que segue e o
analogo da Proposicao 26.23, pagina 1165, mas sua demonstracao difere por um ligeiro detalhe.
Proposi
c
ao 26.34 Seja X um espaco de Banach e T B(X). Ent
ao, para cada x X e para cada

` X , funcional linear contnuo em X, a funca


o de vari
avel complexa f x, ` : (T )
dada por
fx, ` () := `(R (T )x) e holom
orfica (i.e. analtica) em cada componente conexa de (T ).
2
Prova. Seja (T ) e tal que | | < kR (T )k1 . Tem-se por (26.82) que (T ) e
fx, ` () := `(R (T )x)

(26.82)

R (T ) +

X
n=1

continuidade

 !
( )n (R (T ))n+1 x
`(R (T )x) +

X
n=1

Como


( )n ` (R (T ))n+1 x . (26.83)



` (R (T ))n+1 x k`k k (R (T ))n+1 xk k`k kR (T )kn+1 kxk

segue de | | < kR (T )k1 que a u


ltima serie em (26.83) e absolutamente convergente e, portanto,
define uma funcao holomorfica na bola aberta de raio kR (T )k1 centrada em , a qual pode, pelos
procedimentos usuais, ser estendida analiticamente a` componente conexa de (T ) que contem .
A proposicao seguinte e importante, pois finalmente estabelece que o espectro de um operador
contnuo em um espaco de Banach nunca e vazio. Trata-se essencialmente de um caso particular da
Proposicao 26.24 da pagina 1165, com a ligeira diferenca que na demonstracao substitumos as funcoes
f` pelas funcoes fx, ` definidas acima.
Proposi
c
ao 26.35 Seja X um espaco de Banach e T B(X). Ent
ao, (T ) e um conjunto n
ao-vazio
e est
a contido na bola fechada de raio kT k centrada em 0: {z | |z| kT k}.
2
Prova. Vamos supor que (T ) = . Entao, pela Proposicao 26.34, para todo x X e para todo `
funcional linear contnuo em X a funcao fx, ` () := `(R (T )x) seria inteira, isto e, analtica em toda
parte. Agora, para || > kT k
"
#

X
R (T ) = ( T )1 = 1 ( 1 T )1 = 1
+
n T n
(26.84)
n=1

de acordo com (26.33) da Proposicao 26.14, pagina 1158, pois pela hipotese k 1 T k < 1. Assim,
"
n #

X
1
kT k
1
kR (T )k
1+
=
.
||
||
||

kT
k
n=1

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1197/1304

Isso mostra que lim kR (T )k = 0. Logo, como |fx, ` ()| = |`(R (T )x)| k`k kR (T )k kxk, segue
||

que lim |fx, ` ()| = 0. Com isso, conclumos que fx, ` () e uma funcao inteira, limitada e converge
||

a zero no infinito. Pelo bem-conhecido Teorema de Liouville25 da Analise Complexa, isso implica que
fx, ` () e identicamente nula para todo . Se, porem, `(R (T )x) for nulo para cada funcional linear
contnuo ` entao, pelo Corolario 26.1, pagina 1133, teramos R (T )x = 0 para todo x X, um absurdo,
pois R (T ) e a inversa de um operador. Assim conclumos que (T ) nao pode ser igual a todo e,
portanto, (T ) 6= .

Pela Proposicao 26.14, pagina 1158, a expressao (26.84) mostra que R (T ) esta definida para todo
|| > kT k. Assim, {z | |z| > kT k} (T ). Logo, (T ) {z | |z| kT k}.

O espectro de operadores limitados em espa


cos de Hilbert
Vamos a partir de agora especializar nossa discussao para operadores agindo em espacos de Hilbert. Para apresentarmos nossos proximos resultados, vamos introduzir a seguinte notacao: se S
denotamos por S cc o conjunto dos elementos complexo-conjugados de S: S cc := {z | z S}.

Se T e um operador limitado agindo em um espaco de Hilbert H, entao pelo item 7 do Teorema


26.11, pagina 1144 temos que se (T ), vale (( T ) )1 = (( T )1 ) , o que significa que
(T ) e R (T ) = R (T ). Provamos entao o seguinte:

Proposi
c
ao 26.36 Se T e um operador limitado agindo em um espaco de Hilbert H, ent
ao R (T ) =

cc

cc
R (T ) para todo (T ), o que implica (T ) = (T ) e (T ) = (T ) .
2
O espectro residual e o pontual em um espa
co de Hilbert
A proxima proposicao detalha um pouco mais a relacao estabelecida na Proposicao 26.36 entre (T )
e (T ). Dela extrairemos a informacao importante que operadores auto-adjuntos agindo em espacos
de Hilbert nao tem espectro residual.
Proposi
c
ao 26.37 Se T e um operador limitado agindo em um espaco de Hilbert H, ent
ao
1. r (T ) p (T )cc .
2. p (T ) p (T )cc r (T )cc .

Prova. Se r (T ) entao Ran ( T ) nao e denso em H. Entao existe Ran ( T ) nao-nulo.


Portanto, h, ( T )i = 0 para todo H. Isso diz que h( T ), i = 0 para todo H, o
que implica ( T ) = 0 e, portanto, e um autovetor de T com autovalor . Assim, p (T ).
Isso provou o item 1.
Se p (T ), entao existe um sub-espaco nao-trivial L de H formado pelos autovetores de T com
autovalor tal que ( T ) = 0 para todo L. Isso naturalmente implica que h( T ), i =
25

Joseph Liouville (1809-1882).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1198/1304

h, ( T )i = 0 para todo H e todo L. Portanto, Ran ( T ) e um subconjunto de L .


Caso nao for um auto-valor de T , entao isso diz-nos que r (T ) (vide a definicao de espectro
residual a` pagina 1194). Assim, ou p (T ) ou r (T ) e, portanto, p (T ) r (T ). Isso
provou o item 2.
A proposicao acima pode ser generalizada para espacos de Banach, mas nao trataremos disso aqui.
Ainda no contexto de espacos de Hilbert temos o seguinte corolario importante que afirma que o
espectro de um operador auto-adjunto e apenas a uniao do espectro pontual com o contnuo.
Corol
ario 26.12 Se A e um operador limitado e auto-adjunto agindo em um espaco de Hilbert H,
ent
ao seu espectro residual e vazio.
2
Prova. Pela Proposicao 26.37, pagina 1197, temos r (A) p (A), pois A = A e pois p (A)cc = p (A),
ja que na Proposicao 26.7, pagina 1148, provamos que o espectro pontual de um operador auto-adjunto
agindo em um espaco de Hilbert e real. Agora, pela definicao, os espectros residual e pontual sao
disjuntos. Logo, r (A) = .
O espectro de operadores auto-adjuntos em espa
cos de Hilbert
e real
Devido a sua importancia no contexto da Fsica Quantica, existe um particular interesse nas propriedades espectrais de operadores auto-adjuntos (limitados ou nao) agindo em espacos de Hilbert. Na
Proposicao 26.7, pagina 1148, ja provamos que o espectro pontual de tais operadores e um subconjunto
da reta real. O mesmo vale para o espectro completo, como vemos no proximo teorema.
Teorema 26.25 Se A e um operador limitado e auto-adjunto agindo em um espaco de Hilbert H,
ent
ao seu espectro e um sub-conjunto da reta real, mais precisamente, e um sub-conjunto fechado de
[kAk, kAk].
2
Prova. Esse teorema e um caso particular da Proposicao 26.27, pagina 1169. Apresentamos uma
segunda demonstracao que usa a estrutura do espaco de Hilbert.
Seja z escrito na forma z = x + iy, com x, y . Se considerarmos o operador Az := z A,
e facil verificar que
kAz k2 = |y|2 kk2 + k(x A)k2 .
(26.85)


De fato,
kAz k2 = hiy + (x A), iy + (x A)i
= |y|2 kk2 + k(x A)k2 iyh, (x A)i + iyh(x A), i .
{z
}
|
=0

De (26.85), conclumos que

kAz k |y| kk

pois

(x A)

e auto-adjunto

(26.86)

JCABarata. Curso de Fsica-Matem


atica

e que (trocando y y)

Vers
ao de 29 de setembro de 2005.

kAz k |y| kk

Captulo 26

1199/1304

(26.87)

para todo H. Assim, vemos que se y 6= 0, entao Az e nulo se e somente se = 0, ou seja, Az


e injetora como aplicacao de H em Ran (Az ). Assim, existe A1
: Ran (Az ) H. Mostremos que
z
essa aplicacao e limitada. Seja Ran (Az ) e escrevamos = Az para algum H. Teremos por
1
1
(26.86) que kk |y| kA1
mos que kA1
e limitada.
z k, de onde conclu
z k |y| , o que prova que Az
Com isso, podemos evocar a Proposicao 26.13, pagina 1158, e afirmar que Ran (A z ) e um sub-espaco
fechado de H (caso y 6= 0).
Vamos agora supor que o sub-espaco fechado Ran (Az ) seja diferente de H. Entao, para cada
Ran (Az ) nao-nulo teremos h, Az i = 0 para todo H. Como Az = Az , segue que
hAz , i = 0 para todo H, o que implica Az = 0. Ora, isso contraria (26.87), que vale para todo
H, pois supomos nao-nulo.

Logo, conclumos que Ran (Az ) = H e como Az e injetora, conclumos que A1


z : H H existe,
1
1
1

sendo limitada pelo que vimos acima com kAz k |y| . E claro que Az = Rz (A), o operador
resolvente de A. Assim, estabelecemos que se y 6= 0 entao z = x + iy (A) para todo x ,
provando que (A) . Que (A) e fechado e que (A) [kAk, kAk] segue das Proposicoes 26.33
e 26.35.


Alguns exemplos e contra-exemplos


Exemplo 26.1 No caso em que X e o espaco vetorial de dimensao finita n , temos B(X) = Mat ( , n),
o conjunto das matrizes complexas n n. Nesse caso, se M e uma matriz complexa n n, (M ) e
o conjunto de todos os n
umeros complexos tais que a matriz M nao tem inversa. Ora, e bem
sabido que uma matriz e nao-invertvel se e somente se seu determinante for nulo. Logo, (M ) = {
| det( M ) = 0}, ou seja, (M ) coincide com o conjunto das razes do polinomio caracterstico

de M : pM (x) = det(x M ), o qual, pelo Teorema Fundamental da Algebra,


possui n razes nao
necessariamente distintas no plano complexo. Assim, (M ) nao e vazio (o que veremos ser verdade
tambem para qualquer operador em um espaco de Banach). Se uma matriz K Mat ( , n) nao
possui inversa, sabe-se por um argumento geral que existe pelo menos um vetor nao-nulo v n tal
que Kv = 0 (vide Corolario 3.1 a` pagina 150). Disso conclumos que se (M ) para uma matriz
M Mat ( , n) entao existe v n nao-nulo tal que ( M )v = 0, ou seja, M v = v. Isso significa
que e um autovalor de M (e v um autovetor de M com autovalor ). Portanto, em Mat ( , n) o
espectro coincide com o conjunto de autovalores.

No caso de espacos de Banach gerais, o fato de um operador K nao ser bijetor n


ao necessariamente
implica que exista um vetor nao-nulo v tal que Kv = 0. Da, no caso de espacos de Banach gerais, o
espectro de um operador n
ao necessariamente coincide com o conjunto de seus autovalores, ainda que
a recproca seja verdadeira: todo autovalor de um operador T e um elemento de seus espectro, ja que
( T ) nao e bijetora, pois tanto o vetor nulo 0 quanto um autovetor v nao-nulo de T com autovalor
sao mapeados no vetor nulo 0. Veremos varios exemplos adiante mas, por ora, ilustremos isso com
o seguinte.

Exemplo 26.2 Seja X = C([a, b]) o conjunto de todas as funcoes complexas contnuas definidas no
intervalo [a, b] e seja T : C([a, b]) C([a, b]) o operador (T f )(x) := xf (x), definido para toda funcao

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1200/1304

contnua f . Se T possusse um autovetor nao-nulo g com autovalor , valeria (T g)(x) = xg(x) = g(x)
e teramos (x )g(x) = 0 para todo x  [a, b]. Ora, isso e impossvel se g e nao-nulo. Logo T nao
tem autovalores. No entanto, ( T )f (x) = (x )f (x) e disso vemos que T e bijetora se e
1
g(x) e um elemento de C([a, b]) para qualquer
somente se 6 [a, b], pois uma funcao da forma x
g C([a, b]) se e somente se 6 [a, b]. Conclumos disso que (T ) = \ [a, b] e que (T ) = [a, b].
Esse operador T tem, portanto, um espectro nao-trivial mas nao tem autovalores.

Exemplo 26.3 Seja H = `2 , o espaco de Hilbert das seq


uencias de quadrado somavel e considere-se o
2
seguinte operador definido em ` :
S(a1 , a2 , a3 , a4 , a5 , . . .) := (0, a1 , a2 , a3 , a4 , . . .) .

um exerccio elementar constatar


S e denominado operador de shift, ou operador de deslocamento. E

que sua adjunta S e dada por


S (a1 , a2 , a3 , a4 , a5 , . . .) := (a2 , a3 , a4 , a5 , a6 , . . .) .
tambem elementar provar que kSk = kS k = 1. Assim, pela Proposicao 26.35, pagina 1196, (S) e
E
(S ) estao contidos na bola fechada de raio 1 centrada em 0.
S nao tem autovalores. De fato, suponhamos que exista (a1 , a2 , a3 , a4 , a5 , . . .) `2 e
que S(a1 , a2 , a3 , a4 , a5 , . . .) = (a1 , a2 , a3 , a4 , a5 , . . .). Isso significa que

tais

(a1 , a2 , a3 , a4 , a5 , . . .) = (0, a1 , a2 , a3 , a4 , . . .) .
Se = 0, isso implica que todos os aj s sao nulos. Se 6= 0, temos a1 = 0, a2 = a1 , a3 = a2 etc.,
Mas a primeira relacao implica a1 = 0, o que faz com que a segunda relacao implique a2 = 0 etc., e
novamente temos que os aj s sao todos nulos. Assim, S so possui autovetores nulos, ou seja, nao possui
autovalores: p (S) = . Pelo item 1 da Proposicao 26.37, pagina 1197, isso implica r (S ) = .
Procuremos agora saber se S possui autovalores. Seja (a1 , a2 , a3 , a4 , a5 , . . .) `2 e
que S (a1 , a2 , a3 , a4 , a5 , . . .) = (a1 , a2 , a3 , a4 , a5 , . . .). Isso significa que

tais

(a1 , a2 , a3 , a4 , a5 , . . .) = (a2 , a3 , a4 , a5 , a6 , . . .) ,
o que implica a2 = a1 , a3 = a2 , a4 = a3 , ou seja, an = n1 a1 . Assim, os autovetores serao da
forma
a1 (1, , 2 , 3 , 4 , . . .) .
Uma tal seq
uencia e um elemento de `2 se e somente se || < 1. Conclumos que o espectro pontual de

S e nao-vazio e e igual ao disco aberto de raio 1 em centrado em 0: p (S ) = { | || < 1}.

Vamos agora mostrar que espectro residual de S e nao-vazio. Para com || < 1, seja v o
autovetor de S com autovalor dado por v = (1, , 2 , 3 , 4 , . . .). Temos S v = v . Para todo
x `2 teremos


hv , ( S)xi`2 = ( S )v , x `2 = 0 .

Disso conclumos que para todo x `2 o vetor ( S)x pertence ao sub-espaco ortogonal ao vetor
v . Assim, Ran ( S) nao e denso em `2 para nenhum || < 1 e, conseq
uentemente { | || <
1} r (S). Agora, pelo item 1 da Proposicao 26.37, pagina 1197, tem-se tambem r (S) p (S )cc =
{ | || < 1}. Logo, r (S) = { | || < 1}.

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1201/1304

Conclumos ate agora que p (S) = , r (S) = { | || < 1}, p (S ) = { | || < 1} e


r (S ) = . Como (S) e fechado, contido em { | || 1} e contem r (S) = { | || < 1},
conclumos que (S) = { | || 1}. Analogamente, (S ) = { | || 1}. Como a uniao
(26.80) e disjunta, conclumos que c (S) = c (S ) = { | || = 1}. Temos finalmente o seguinte
quadro:
(S) = {

| || 1}, p (S) = ,

c (S) = { | || = 1}, r (S) = { | || < 1},

(S ) = {

| || 1}, p (S ) = { | || < 1}, c (S ) = { | || = 1}, r (S ) = .

Exemplo 26.4 (Extrado de [103]). Seja X = ` , o espaco de Banach das seq


uencias limitadas e

considere-se o seguinte operador definido em ` :


T 0 (a1 , a2 , a3 , a4 , a5 , . . .) := (0, a1 , a2 , a3 , a4 , . . .) .

T 0 e denominado operador de shift (mas note-se que difere de S, definido acima, pois aquele era definido
apenas em `2 ). De maneira analoga ao que fizemos acima para o operador S, mostra-se que T 0 nao
possui autovalores: p (T 0 ) = .

com || = 1 pertence ao espectro residual de T 0 . Sejam


Vamos mostrar agora que todo
a = {an } e b = {bn } duas seq
uencias de ` tais que a = ( T 0 )b. Isso significa que
(a1 , a2 , a3 , a4 , a5 , . . .) = (b1 , b2 b1 , b3 b2 , b4 b3 , b5 b4 , . . .) .

Assim, teremos a1 = b1 , a2 = b2 b1 , a3 = b3 b2 , a4 = b4 b3 etc. Como || = 1, tem-se 1 =


e essas relacoes implicam
n
n+1 X
m a m ,
(26.88)
bn =
m=1

como facilmente se constata. Se c ` , tem-se para qualquer n

que

kc ak = sup |cm am | |cn an | = |n (cn an )| = |n cn n an |


m

|Re(n cn n an )| Re(n cn n an ) = Re(n cn ) Re(n an ) ,

onde, acima, usamos que |n | = 1 pois || = 1 e que |z| |Re(z)| Re(z) para qualquer z .
Conclumos disso que
Re(n an ) Re(n cn ) kc ak .
(26.89)
n
Vamos agora tomar cn da forma cn = e seja a ` contido na bola aberta de raio 1/2 centrada
em c, ou seja, kc ak < 1/2. Por (26.89), teremos que Re(n an ) 1 1/2 =P
1/2. Dessa forma,
vemos que se b e tal que a = ( T 0 )b entao, por (26.88), teremos n+1 bn = nm=1 m am , o que
implica





|bn | = n+1 bn Re n+1 bn Re n+1 bn
(26.88)

Re

n
X

m=1

am

n
X

n
X
1
n
=
.
=
Re ( am )
2
2
m=1
m=1
m

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1202/1304

Agora, a relacao |bn | n/2 nao pode ser satisfeita se b e uma seq
uencia limitada (ou seja, um elemento
n
de ` ). Conclumos que a bola aberta de raio 1/2 centrada no elemento c ` dado por cn =
nao pode estar na imagem de T 0 e, portanto, a imagem de ` por esse operador nao e densa em
possvel provar (vide
` . Conclumos, assim, que r (T 0 ) contem o crculo unitario { | || = 1}. E
0
[103]) que r (T ) = { | || 1}.

Exemplo 26.5 Um outro exemplo que estudamos explicitamente e o operador de integracao de Volterra W , discutido no Exemplo 26.6 a` pagina 1214 e seguintes. La determinamos explicitamente o
operador resolvente de W e seu espectro.

26.6

Operadores Compactos em Espa


cos de Banach e de Hilbert

Nesta secao introduziremos a importante nocao de operador compacto. Essa nocao e importante por
diversas razoes. Em um sentido a ser precisado, operadores compactos agindo entre espacos de Banach
de dimensao infinita sao aqueles cujas caractersticas mais se aproximam das de matrizes. Para eles
vale tambem a forma mais simples do Teorema Espectral, que apresentamos no contexto de matrizes
na Secao 3.4, pagina 162. Historicamente o estudo de propriedades de operadores compactos deu inicio
a` Analise Funcional, atraves do estudo empreendido entre 1904 e 1910 por Hilbert e colaboradores
(notadamente Schmidt26 ) da chamada equacao integral de Fredholm, a qual surge no tratamento do
problema de Sturm-Liouville (vide Captulo 12, pagina 606, em particular a Secao 12.5, pagina 627).
Esses trabalhos levaram a` introducao do propria nocao de espaco de Hilbert e a` primeira versao do
Teorema Espectral para operadores (compactos) agindo em espacos de Hilbert.
Operadores de posto finito
Sejam A e B dois espacos de Banach e seja M : A B um operador linear limitado. Dizemos
que M e um operador de posto finito se a imagem de A por M estiver contida em um sub-espaco
de dimensao finita de B. Assim, se M e de posto finito, existe um conjunto de, digamos, N vetores
linearmente independentes b1 , . . . , bN em B tais que M x = 1 (x)b1 + + N (x)bN para todo x A,
onde 1 (x), . . . , N (x) dependem de x. Como M e linear, e claro que cada k e um funcional
linear em A. Como M e contnuo, vale
N
X
k=1

lim

kxykA 0

o que implica

lim

k (x y)bk =

kxykA 0

limitado) de A em

kxykA 0

N
X
k=1

k (x y)bk =

lim

kxykA 0

M (x y) = 0 ,

k (x y) = 0, ou seja, cada k e um funcional linear contnuo (e, portanto,

. Assim, existe B > 0 tal que |k (x)| BkxkA para todo k = 1, . . . , N .

Dessa forma, vemos que se xn , n


26

lim

Erhard Schmidt (1876-1959).

, e uma seq
uencia limitada de vetores em A (ou seja, existe

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1203/1304

X > 0 tal que kxn kA X para todo n ) entao |k (xn )| BX para todo n e todo k. Assim,


N
N
N

X
X
X


|k (xn )| kbk kB BX
kbk kB .
k (xn )bk
kM xn kB =




k=1

k=1

k=1

Isso diz-nos que todos os vetores da seq


uencia M xn estao contidos na bola fechada centrada em 0 e
de raio BX(kb1 kB + + kb1 kB ) do sub-espaco de dimensao finita gerado por b1 , . . . , bN . Assim,
pelo bem conhecido Teorema de Bolzano27 -Weierstrass28 , a seq
uencia M xn , possui pelo menos uma
sub-seq
uencia convergente.

Essa propriedade, valida para operadores de posto finito, inspira a definicao de operadores compactos.
Operadores Compactos
Um operador linear limitado C agindo entre dois espacos de Banach A e B e dito ser um operador
compacto se para toda seq
uencia limitada xn A, n , a seq
uencia Cxn em B possui pelo menos
uma seq
uencia convergente.


A denominacao operador compacto provem da seguinte propriedade equivalente: um operador


C agindo entre dois espacos de Banach A e B e compacto (seguindo a definicao acima) se e somente
se o fecho em B da imagem por C de qualquer conjunto limitado em A e compacto (na topologia de
B). Essa equivalencia e uma conseq
uencia de propriedades bem-conhecidas de conjuntos compactos em
espacos metricos e a prova e deixada como exerccio. Essa propriedade pode ser tomada como definicao
alternativa da nocao de operador compacto e assim e feito em alguns textos.
Como vimos, operadores de posto finito sao compactos, mas a recproca nao e verdadeira em
dimensao infinita. Porem, a seguinte proposicao e imediata das observacoes acima.
Proposi
c
ao 26.38 Todo operador linear agindo entre dois espacos de Banach de dimens
ao finita A e
B e compacto.
2
Dentre os exemplos mais importantes de operadores compactos estao os operadores de Fredholm
e de Volterra, discutidos a`s paginas 1211 e 1212, respectivamente, os quais surgem na teoria das
equacoes diferenciais e integrais (em particular, no chamado problema de Sturm-Liouville, introduzido
no Captulo 12, pagina 606) e suas aplicacoes. Para estuda-los, no entanto, precisamos desenvolver um
pouco a teoria geral.
Operadores compactos e seq
u
encias fracamente convergentes
Com o uso do Princpio de Limitacao Uniforme, Teorema 26.6, pagina 1133, podemos estabelecer
o seguinte resultado fundamental sobre operadores compactos.
Teorema 26.26 Seja C : A B um operador compacto agindo entre dois espacos de Banach A e B.
Seja xn A, n
uma seq
uencia de vetores de A e suponha que exista x A tal que `(x n ) ,


27
28

Bernard Placidus Johann Nepomuk Bolzano (1781-1848).


Karl Theodor Wilhelm Weierstrass (1815-1897).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1204/1304

n , seja uma seq


uencia convergente a `(x) para todo funcional linear contnuo ` : A
e fracamente convergente a x). Ent
ao Cxn A, n converge em norma a Cx em B.


(i.e., x n
2

Prova. Denotemos por A o dual topologico de A (i.e., A e o conjunto de todos os funcionais lineares
contnuos de A). O Teorema 26.2, pagina 1122, diz-nos que A e igualmente um espaco de Banach com
a norma definida em (26.3), pagina 1123.
Para z A definamos a aplicacao z : A
dada por z(`) = `(z). Como |
z (`)| = |`(z)|
k`kA kzkA (pois ` e um funcional linear contnuo), segue que z e um funcional linear contnuo em A .
Por (26.4), vale k
z k = kzkA .

Pelas hipoteses, para cada ` A a seq


uencia numerica `(xn ) converge a `(x)
limitada, ou seja, existe M` > 0 tal que |`(xn )| M` para todo n .

. Da, |`(xn )| e

Para a seq
uencia xn A, n
de vetores de A do enunciado, podemos considerar o conjunto

de operadores A
lineares e limitados por S : {c
xn , n }. Agora, para cada ` A vale
que |c
xn (`)| M` para todo x
cn S. Estamos, portanto, sob as condicoes do Princpio de Limitacao
Uniforme, Teorema 26.6, pagina 1133, e podemos afirmar que existe M > 0 tal que kc
x n k M para
todo n , ou seja, kxn kA M para todo n .


e o vetor y := Cx. Para cada ` A


Sejam agora definidos em B a seq
uencia yn := Cxn , n
vale
`(yn ) `(y) = `(yn y) = `(C(xn x)) = ` C(xn x) .


Todavia, ` C e um elemento de A pois e linear e contnuo (sendo a composicao de duas aplicacoes


contnuas). Logo, pelas hipoteses, ` C(xn ) converge a ` C(x), o que implica que `(yn ) converge a
`(y).
Desejamos provar que yn converge a y na norma de B. Vamos supor, por absurdo, que isso nao
ocorra. Entao, existe algum  > 0 tal que
kynj ykB > 

(26.90)

para todos ynj de uma sub-seq


uencia de yn . Agora, ynj = Cxnj e como kxnj kA M para todo j e
C e compacto, {ynj }j possui uma sub-seq
uencia convergente em norma em B. Vamos denotar essa
0
0
certo por (26.90) que y 0 6= y. Agora, Como
sub-seq
uencia por yk , k e seja y B o seu limite. E
0
0
kyk y kB converge a 0, segue que


|`(yk0 ) `(y 0 )| k`kkyk0 y 0 kB 0 .


Vimos acima, porem, `(yn ) converge a `(y). Como yk0 e uma sub-seq
uencia de yn , entao `(yk0 ) deve
0
tambem convergir a `(y). Assim provamos que `(y y) = 0 para todo ` A , o que implica y 0 = y,
uma contradicao.

Propriedades alg
ebricas de operadores compactos
As seguintes proposicoes revelam propriedades algebricas importantes dos operadores compactos.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1205/1304

Proposi
c
ao 26.39 Sejam X e Y dois espacos de Banach e sejam A, B : X Y dois operadores
compactos. Ent
ao para todos , o operador A + B e igualmente compacto.
2
Prova. Seja xn uma seq
uencia limitada de vetores em X. Entao existe uma sub-seq
uencia xnj de xn tal

que a seq
uencia Axnj converge em norma em Y, pois A e compacto. E elementar constatar que isso
implica que Axnj tambem converge em norma em Y. Como a seq
uencia xnj e (obviamente) limitada,
ela possui uma sub-seq
uencia xnjk tal que Bxnjk converge em norma em Y. Da, e elementar constatar
que (A + B)xnjk converge em norma em Y, completando a prova.
A proposicao acima mostra que o conjunto de operadores compactos agindo entre dois espacos de
Banach X e Y e um espaco linear. Tem-se tambem o seguinte.
Proposi
c
ao 26.40 Sejam X e Y e Z tres espacos de Banach e sejam A : Y Z e B : X Y dois
operadores limitados. Ent
ao se A ou B for compacto (ou ambos o forem) o produto AB : X Z e
compacto.
2
Prova. Seja xn uma seq
uencia limitada em X, ou seja, existe M > 0 tal que kxn kX M para todo
uencia limitada em Y (pois B e limitado e kBxn kY kBk kxn kX
n . Entao Bxn e uma seq
kBkM ). Logo, se A for compacto, ABxn possui uma sub-seq
uencia convergente na norma de Z e,
portanto, o produto AB e compacto. Se por outro lado B for compacto, entao Bx n possui uma subseq
uencia Bxnj convergente. Por ser convergente, Bxnj e uma seq
uencia de Cauchy em Y, ou seja,
para todo  > 0 podemos encontrar k e l grandes o suficiente tais que kB(xnk xnl )kY . Logo,
uencia de Cauchy
kAB(xnk xnl )kZ kAkkB(xnk xnl )kY kAk, provando que ABxnj e uma seq
em Z e, portanto, converge, o que novamente estabelece que o produto AB e compacto.


O seguinte corolario e imediato.


Proposi
c
ao 26.41 Se X e um espaco de Banach o conjunto dos operadores compactos de X em X
forma uma a
lgebra, que denotaremos por K(X). A a
lgebra K(X) e uma sub-
algebra da a
lgebra de todos
os operadores limitados agindo em X, B(X), e um ideal a
` esquerda e a
` direita de B(X).
2
A seguinte proposicao e igualmente relevante no contexto de espacos de Hilbert.
Proposi
c
ao 26.42 Se H e um espaco de Hilbert e A : H H e compacto ent
ao A e igualmente
compacto.
2
Prova. Seja xm uma seq
uencia limitada de vetores em H, ou seja, existe M > 0 tal que kxn kH M
para todo n . Tem-se que


kA (xn xm )k2H = hA (xn xm ), A (xn xm )iH = h(xn xm ), AA (xn xm )iH


Cauchy-Schwarz

kxn xm kH kAA (xn xm )kH 2M kAA (xn xm )kH ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1206/1304

pois k(xn xm )kH kxn kH + kxm kH 2M . Como A e compacto, AA tambem o e (Proposicao


26.40, acima). Logo AA xn possui uma sub-seq
uencia AA xnj convergente em norma, que, portanto,
e de Cauchy. Assim, para qualquer  > 0 podemos encontrar k e l grandes o suficiente tais que
kAA (xnk xnl )kH . Logo, kA (xnk xnl )k2H 2M , provando que A xnj e uma seq
uencia de
Cauchy e, portanto, converge.

Limite em norma de operadores compactos


A seguinte proposicao revela uma propriedade topologica importante dos operadores compactos.
Proposi
c
ao 26.43 Sejam X e Y dois espacos de Banach e seja Cn : X Y, n uma seq
uencia de
operadores compactos. Vamos supor que Cn converge na norma de B(X, Y) a um operador limitado
C B(X, Y), ou seja, kC Cn kB(X, Y) 0 quando n . Ent
ao C e compacto. Isso revela que o
conjunto dos operadores compactos e fechado na topologia uniforme de B(X, Y).
2


Prova. Seja x0n X uma seq


uencia limitada de vetores qualquer. Que x0n X e limitada significa que
0
existe M > 0 tal que kxn kX M para todo n . Entao,


kC(x0n x0m )kY = k(C Ck )(x0n x0m ) + Ck (x0n x0m )kY


k(C Ck )(x0n x0m )kY + kCk (x0n x0m )kY
kC Ck k kx0n x0m kX + kCk (x0n x0m )kY . (26.91)
uencia de n
umeros positivos que converge a zero e tal que b < a se b > a
Seja n , n , uma seq
(sem perda de generalidade, podemos tomar n = 1/n, n 1). Como por hipotese kC Cn kB(X, Y) 0
quando n podemos escolher k1 grande o suficiente de forma que kC Ck1 k < 1 . Fixemos um tal
k1 . Como kx0n kX M para todo n , vale tambem que kx0n x0m kX kx0n kX + kx0m kX 2M . Logo,
por (26.91),
kC(x0n x0m )kY 2M 1 + kCk1 (x0n x0m )kY .


Como Ck e compacto, existe uma sub-seq


uencia x1j = x0nj , j , da seq
uencia x0n tal que Ck1 x1j converge
em norma para j e, portanto, e uma seq
uencia de Cauchy em Y, Assim, existe N1 N (1 )
tal que, se l N1 e m N1 , entao kCk1 (x1l x1m )kY 1 . Disso conclumos que


kC(x1l x1m )kY (2M + 1)1 ,


para todos l N1 e m N1 .

Notemos que a seq


uencia x1n e fixada por 1 . Podemos, porem, proceder indutivamente construindo
uencia x1n e assim sucessivamente da seguinte forma. Para o elemento a
uma sub-seq
uencia x2n da seq
da seq
uencia dos s, tomamos ka tal que Cka satisfaz kC Cka k < a . Por uma aplicacao da mesma
desigualdade que conduziu a (26.91), conclumos que
a1
kC(xna1 xm
)kY 2M a + kCka (xna1 xa1
m )kY .

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1207/1304

Como Cka e compacto, existe uma sub-seq


uencia xaj = xna1
, j , da seq
uencia xna1 tal que Cka xaj
j
converge em norma para j e, portanto, e uma seq
uencia de Cauchy em Y, Assim, existe N a
a
N (a ) tal que, se l Na e m Na , entao kCka (xl xam )kY a . Disso conclumos que


kC(xal xam )kY (2M + 1)a ,

(26.92)

para todos l Na e m Na .

Daqui por diante escolheremos a seq


uencia de inteiros Na , a
como sendo uma seq
uencia
crescente, ou seja, tomamos Nb > Na caso b > a (ou seja b < a ). Uma tal escolha e sempre possvel
(por que?).


Para cada a 1 a sub-seq


uencia xan , n , e uma sub-seq
uencia de xna1 , n , e todas sao
0
sub-seq
uencias de xn , n . Definamos agora a seq
uencia ua := xaNa , a , tambem sub-seq
uencia
0
b
a
de xn , n . Tomemos b > a. Como xn , n , e uma sub-seq
uencia de xn , n , teremos que
ub = xbNb = xal para algum l Nb > Na (justifique por que l Nb lembrando que xbn , n , e uma
sub-seq
uencia de xan , n ). Assim, com o uso de (26.92), obtemos


kC(ub ua )kY = kC(xal xaNa )kY (2M + 1)a ,


pois l > Na . Agora, como a 0 para a , existe para cada  > 0 um a tal que (2M + 1)a < .
Para tal a valera kC(ub ua )kY <  para qualquer b > a. Isso esta nos dizendo que a seq
uencia
Cun , n , e e uma seq
uencia de Cauchy em Y e, portanto, converge em norma, pois Y e um espaco
de Banach. Como un , n , e uma sub-seq
uencia de uma seq
uencia limitada arbitraria x0n , n ,
isso provou que C e compacto.


Um importante corolario imediato e o seguinte:


Corol
ario 26.13 O conjunto de todos os operadores compactos agindo em um espaco de Hilbert H
forma uma a
lgebra C (sem unidade, se H n
ao for de dimens
ao finita!) em relaca
o a
` norma de B(H),
a involuca
o sendo dada pela adjunca
o A A .
2
Prova. Que o conjunto de todos os operadores compactos agindo em um espaco de Hilbert H forma
uma algebra com involucao dada pela adjuncao A A foi provado nas Proposicoes 26.39-26.42,
acima. A Proposicao 26.43 estabeleceu que o conjunto de todos os operadores compactos agindo em
um espaco de Hilbert H e um sub-espaco linear fechado de B(H) e portanto, e completo. As demais
propriedades, como a propriedade C , sao conseq
uencia do Teorema 26.11, pagina 1144, ja que os
operadores compactos agindo em H sao elementos de B(H). O operador unidade nao e compacto,
pois nem toda seq
uencia limitada tem uma sub-seq
uencia convergente em norma, exceto se H possuir
dimensao finita.
No caso de espacos de Hilbert separaveis e possvel provar um resultado mais especfico.
Operadores Compactos em Espa
cos de Hilbert Separ
aveis
Vamos agora nos especializar em operadores compactos agindo em espacos de Hilbert separaveis.
Veremos que o Teorema 26.26, pagina 1204 tem uma importante conseq
uencia nesse caso que aponta

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1208/1304

na direcao de uma generalizacao do Teorema Espectral para operadores compactos (agindo em espacos
de Hilbert separaveis).
Teorema 26.27 Seja H um espaco de Hilbert separ
avel e seja C : H H compacto. Seja { n , n
} uma base ortonormal completa em H. Ent
ao,


C = lim CN ,
N

o limite se dando na topologia uniforme de B(H) (a da norma operatorial), onde, para N


definimos os operadores
N
X
CN :=
hk , iH Ck


, N 1,

k=1

para todo H.

Prova. Defina-se, para n




, n 1,
n :=

sup
Pn , kkH =1

kCkH ,

onde Pn := [1 , . . . , n ] e o sub-espaco de dimensao finita gerado pelos vetores 1 , . . . , n . E


evidente pela definicao que n e monotonamente decrescente. Como n 0 para todo n, a seq
uencia
nao-crescente n deve convergir a um 0.

Vamos provar que, em verdade, = 0. Comecemos observando que em cada conjunto n := {


kkH = 1} sempre podemos encontrar pelo menos um vetor tal kCk /2. Se assim nao fosse,
teramos kCk < /2 para todo n , o que e absurdo, pois isso implica que n < /2 mas n e uma
seq
uencia decrescente convergindo a .
Pn ,

Escolhamos entao para cada n um vetor n com kCn k /2. Como kn kH = 1 e n Pn e como
{n , n } e uma base ortonormal completa em H, segue facilmente que


lim hy, n iH = 0

para todo y H (justifique!). Pelo Teorema da Representacao de Riesz, Teorema 25.8, pagina 1110, isso
esta dizendo-nos que limn `(n ) = 0 para todo funcional linear contnuo ` de H. Agora, pelo Teorema
26.26, pagina 1204, isso implica que Cn converge a zero em norma. Assim, como /2 kCn kH para
todo n, segue que = 0, como queramos mostrar.
A implicacao importante desse fato e a seguinte. Para qualquer H teremos
!
!
M
N
X
X
hn , iH n = CP
C CN = C
hn , iH n = C lim
n ,
n=1

e o projetor ortogonal sobre Pn . Logo,


onde P
n

CP =
kC CN k =
sup
n
H
H, kkH =1

n=N +1

sup
Pn , kkH =1

kCkH = n ,

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1209/1304

de onde conclumos que


lim kC CN k = lim n = = 0 .

Isso completa a demonstracao.


No teorema acima e interessante observar que os operadores CN sao de posto finito e, portanto,
compactos. Conclumos, assim, que todo operador compacto agindo em um espaco de Hilbert separavel
H pode ser aproximado na norma de B(H) por operadores de posto finito. Comentamos, porem, que
a restricao a espacos de Hilbert separaveis pode ser eliminada. Isso sera provado no Teorema 26.31,
pagina 1221. Uma questao que permaneceu em aberto por muito tempo foi saber se essa propriedade
se estenderia a operadores compactos agindo em espacos de Banach. Essa questao foi respondida
negativamente por P. Enflo29 em 197330 , o qual exibiu um exemplo de um operador compacto em um
espaco de Banach que nao se deixa aproximar em norma por operadores de posto finito.
Um exemplo de operador compacto a se ter em mente
Seja n , n , uma seq
uencia de n
umeros complexos que converge a zero, ou seja, lim n |n | = 0.
Sejam tambem n , n , e n , n , dois conjuntos ortonormais de vetores em um espaco de
Hilbert H, que suporemos ser de dimensao infinita, mas nao necessariamente separavel. Temos, entao,
hn , m iH = n, m e hn , m iH = n, m para todos m e n .


Pretendemos provar que a seq


uencia de operadores de posto finito definidos para cada N
QN :=

N
X
n=1

29
30

n hn , iH n ,

por

H,

Per Enflo (1944-).


P. Enflo, A counterexample to the approximation property in Banach spaces, Acta Math. 130, 309-317 (1973).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1210/1304

e uma seq
uencia de Cauchy na norma de B(H). De fato, se H, tem-se, para M < N ,
k(QN QM )k2

N
2
X



n hn , iH n


n=M +1

N
X

n=M +1

N
X

n hn , iH n ,
N
X

n0 =M +1 n=M +1
N
X

n=M +1

des. de Bessel

(25.16) 

N
X

n=M +1

n hn , iH n

n0 n hn0 , iH hn , iH hn0 , n iH
| {z }
= n, n0

|n |2 |hn , iH |2

max

m{M +1, ..., N }

max

m{M +1, ..., N }

|m |

|m |

 X
N

n=M +1

|hn , iH |2

kk2 .

Logo,
kQN QM k2

max

m{M +1, ..., N }

Agora, como por hipotese, |n | 0 para n , segue que

|m |2 .
max

m{M +1, ..., N }

|m |2 pode ser feito menor que

qualquer  > 0 dado, desde que M (e, portanto, N , pois M < N ) seja grande o suficiente. Isso provou
uencia de Cauchy na norma operatorial de B(H). Como B(H) e um espaco
que QN , N , e uma seq
de Banach, conclumos que QN converge quando N para um operador Q B(H). Como Q e
o limite em norma de uma seq
uencia de operadores compactos (os operadores Q N sao compactos por
serem de posto finito), conclumos pela Proposicao 26.43, pagina 1206, que Q e igualmente compacto.
Escrevemos,

X
n hn , iH n .
(26.93)
Q :=


n=1

Antes de mudarmos de assunto, facamos um breve comentario sobre a expressao (26.93) que elucidara um ponto que vira mais adiante. Como todo numero complexo, os n tem a forma polar
n = |n |ein , onde n . Na expressao (26.93) as fases ein podem ser absorvidas nos vetores
n , sem que os mesmos deixem de formar um conjunto ortonormal. Assim, genericamente, operadores
compactos como (26.93) podem ser escritos como


Q =

X
n=1

n hn , iH n .

(26.94)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1211/1304

onde n , n , e uma seq


uencia de n
umeros reais n
ao-negativos que converge a zero e n , n
n , n , sao conjuntos ortonormais de vetores do espaco de Hilbert H.


,e

Veremos mais adiante que esse exemplo nao e gratuito: em verdade, todo operador compacto agindo
em um espaco de Hilbert H pode ser representado na forma (26.94) para alguma uma seq
uencia n ,
umeros reais n
ao-negativos que converge a zero, e para certos n , n , e n , n ,
n , de n
conjuntos ortonormais de vetores de H. Vide Teorema 26.31, pagina 1221.


O leitor deve cuidadosamente comparar as afirmacoes feitas acima com as do Teorema 26.27.
A raiz quadrada de um operador compacto, auto-adjunto e positivo
Se C e um operador nao-nulo, compacto e positivo agindo em um espaco de Hilbert H, vimos em
(26.51)-(26.53), pagina 1182, que
!
 
N
N
X
X

n
(26.95)
kCk1/2p C p ,
C = lim
(1)p cn
N
p
p=1
n=p

sendo os cn s definidos em (26.46). O lado direito e o limite em norma de um polinomio em C com


coeficientes reais e que nao contem nenhum termo proporcional a` unidade . Como C e compacto e
um tal
polinomio em C e igualmente compacto (Proposicao 26.41), conclumos pela Proposicao 26.43,
que
C e tambem compacto. Como discutido no Lema da Raiz Quadrada, Lema 26.21, pagina 1179,

C e tambem auto-adjunto e positivo.

Se A e um operador compacto (nao necessariamente auto-adjunto), entao A A e compacto (pela

Proposicao 26.40, pagina 1205), auto-adjunto (pois (A A)


= A A) e positivo (pois hx, A Axi =
hAx, Axi = kAxk 0 para todo x H). Logo, |A| := A A e compacto, auto-adjunto e positivo.
Para futura referencia, coletamos os resultados discutidos acima na seguinte proposicao.
Proposi
c
ao 26.44
Se C e um operador compacto, auto-adjunto e positivo agindo em um espaco de
C e igualmente compacto e auto-adjunto e positivo. Se A e compacto, ent
ao |A| :=
Hilbert
H,
ent
a
o

A A e compacto, auto-adjunto e positivo.


2
O operador integral de Fredholm
Seja o intervalo compacto [a, b] e seja k : [a, b] [a, b] uma funcao fixada contnua de
duas variaveis. Para f C([a, b]), uma funcao contnua (real ou complexa) definida em [a, b], seja
Z b
(Kf )(x) :=
k(x, y)f (y) dy .


bastante claro que K e um operador linear mapeando funcoes contnuas em [a, b] em funcoes
E
contnuas em [a, b], ou seja, K : C([a, b]) C([a, b]). Isso pois k foi suposta ser contnua nas
duas variaveis. O espaco vetorial C([a, b]) e um e um espaco de Banach com a norma no supremo:
kf k := supx[a, b] |f (x)|. Nao e difcil de se ver que K e limitado nessa norma, pois |(Kf )(x)|
Z b

Z b

0
|k(x, y)|dy sup ||f (y )| =
|k(x, y)|dy kf k e, portanto kKf k M kf k , onde M =
a

y 0 [a, b]

(b a) supx, y[a, b] |k(x, y)| < , devido a` continuidade de k.

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1212/1304

O operador K e denominado operador integral de Fredholm31 , ou simplesmente operador de Fredholm


e surge no problema de Sturm-Liouville, como discutido no Captulo 12, pagina 606. Um fato muito
relevante para o problema de Sturm-Liouville e que K e um operador compacto, enquanto operador
agindo em C([a, b]). As conseq
uencias desse para o problema de Sturm-Liouville foram discutidas no
Captulo 12 e seguem de outros resultados gerais sobre operadores compactos que discutiremos nas
proximas secoes.
Mostraremos que K e compacto usando dois tipos de argumento, ambos instrutivos, o primeiro
sendo mais elementar.
n

I. Se pn (x, y) := pn, k, l xk y l e um polinomio de grau n nas variaveis x e y, entao Pn : C([a, b])


k, l=0

C([a, b]) definido por

(Pn f )(x) :=

pn (x, y) f (y) dy =
a

n
n
X
X
k=0

l=0

pn, k, l

y l f (y) dy
a

xk

e claramente um operador de posto finito (os monomios xk sao elementos de C([a, b])) e, portanto,
e compacto. Se k(x, y) e contnua no retangulo compacto [a, b] [a, b] entao, pelo Teorema de
facil ver da (exerccio!)
Weierstrass, k pode ser uniformemente aproximada por polinomios em x e y. E
que isso implica que K e aproximada na norma de B(C([a, b])) por operadores de posto finito como P n
acima. Assim, pela Proposicao 26.43, pagina 1206, K e compacto como operador agindo em C([a, b]).
II. Para um certo N > 0, seja BN C([a, b]) a bola de raio N centrada em 0: BN := {f
C([a, b]), kf k < N}. Se f e uma funcao qualquer de BN , teremos que (Kf )(x) (Kf )(x0 ) =
Rb
Rb
0
0
|k(x, y) k(x0 , y)|dy N(b
(k(x,
y)

k(x
,
y))f
(y)dy.
Logo,
|(Kf
)(x)

(Kf
)(x
)|

kf
k

a
a
0
a) supy[a, b] |k(x, y) k(x , y)|. Como k e contnua, podemos para todo 0 > 0 encontrar 0 > 0 tal
que |k(x, y) k(x0 , y)| < 0 sempre que |x x0 | < 0 . Esse 0 (0 ) depende apenas de 0 , pois pode ser
escolhido independente de x, x0 e y, ja que k e contnua em um compacto.
Assim, conclumos que para


todo  > 0 podemos encontrar () > 0, a saber, () = 0 (ba)N
tal que |(Kf )(x) (Kf )(x0 )| < 
sempre que |x x0 | < (). O fato de nao depender de x nem de x0 nem de f significa que o
conjunto de funcoes {Kf, f BN } e o que se denomina ser um conjunto eq
uicontnuo de funco
es.
Por um teorema classico de Analise conhecido como Teorema de Ascoli (ou de Ascoli-Arzela), sabese que toda seq
uencia de funcoes eq
uicontnuas possui pelo menos uma sub-seq
uencia convergente na
norma do supremo. Assim, se fn e uma seq
uencia de funcoes em BN , a seq
uencia Kfn tem pelo menos
sub-seq
uencia convergente na norma do supremo. Ora, isso precisamente afirma que K e compacto.
O operador integral de Volterra
Um outro operador importante em equacoes diferenciais e integrais e o chamado operador integral
de Volterra32 , ou simplesmente operador de Volterra:
Z x
k(x, y)f (y) dy ,
(V f )(x) :=
a

definido para f contnua no intervalo [a, b] onde, como no caso do operador de Fredholm, k e uma
facil ver que V e um operador linear mapeando
funcao fixa contnua no retangulo [a, b] [a, b]. E
31
32

Erik Ivar Fredholm (1866-1927).


Vito Volterra (1860-1940).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1213/1304

C([a, b]) em si mesmo. Podemos escrever


(V f )(x) =
com v(x, y) = k(x, y)[a, x] (y), onde
[a, x] (y) :=

v(x, y)f (y) dy ,


a

1,
0,

se y [a, x]
.
se y
6 [a, x]

Como v e limitada no retangulo [a, b] [a, b], e facil mostrar, repetindo o que fizemos para o operador
de Fredholm, que V e um operador limitado agindo em C([a, b]). Porem, como v nao e contnua (pois
[a, x] nao o e), nao podemos repetir os argumentos que conduziram-nos a` conclusao que o operador de
Fredholm e compacto. No entanto, os operadores de Volterra sao compactos, como mostra o seguinte
argumento.
Para n

, consideremos o operador de Fredholm definido por


Z b
vn (x, y)f (y) dy ,
onde
vn (x, y) := k(x, y) en(|xy|(xy)) .
(Vn f )(x) =


Vemos que se a y x entao vn (x, y) = k(x, y) = v(x, y). Se, porem, x < y b, teremos
limn vn (x, y) = 0, que e quanto vale v na mesma regiao. Assim, vemos ao menos intuitivamente
que Vn V quando n . Vamos provar que essa convergencia se da na norma de B(C([a, b])).
Como os Vn sao compactos (por serem de Fredholm), isso implica que V e compacto pela Proposicao
26.43, pagina 1206. Observemos, entao, que para f C([a, b]), vale
(V f )(x) (Vn f )(x) =

b
a

=
Logo,

(v(x, y) vn (x, y)) f (y) dy


Z

b
x

(v(x, y) vn (x, y)) f (y) dy =

|((V Vn )f )(x)|

sup |k(x, y)|

x, y[a, b]

kf k

k(x, y)en(|xy|(xy)) f (y) dy .


x

en(|xy|(xy)) dy .
x

Agora,
Z

n(|xy|(xy))

Dessa forma,

dy

y 0 =yx

bx

n(|y 0 |+y 0 )

dy =

k(V Vn )f k

sup |k(x, y)|

x, y[a, b]

e2ny dy 0 =
0

1 e2n(bx)
.
2n

1 e2n(ba)
kf k ,
2n

1 e2n(ba)
,
2n

sup |k(x, y)|

x, y[a, b]

bx

e, portanto,
kV Vn k

provando que lim kV Vn k = 0. Isso demonstrou que os operadores de Volterra sao compactos.
n

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1214/1304

Exemplo 26.6 Um caso interessanteR e aquele em que k(x, y) 1. Denotemos por W o correspondente
x
operador de Volterra: (W f )(x) = a f (y) dy. Vamos provar que esse operador de Volterra nao tem
autovalores.
Suponhamos que exista e uma funcao g C([a, b]) nao-nula tais que W g = g, ou
Rx
seja, a g(y) dy = g(x). Essa igualdade indica que g e diferenciavel e tem-se g(x) = g 0 (x) para todo
x [a, b]. Para = 0 sairia disso que g(x) = 0 para todo x [a, b], situacao que ja descartamos,
1
Se 6= 0 aRequacao diferencial g 0 (x) = 1 g(x) tem como solucao g(x) = g(a)e (xa) . Porem, de
x
g(x) = 1 a g(y) dy vemos que g(a) = 0 e novamente teramos g(x) = 0 para todo x [a, b].
Rx
Assim, o operador (W f )(x) = a f (y) dy agindo em C([a, b]) e um exemplo de operador compacto
que nao possui autovalores. Como todo operador agindo em um espaco de Banach, W tem um espectro
nao-vazio mas, como vimos, seu espectro pontual e vazio. Vamos agora provar que (W ) = {0}. Para
6= 0, seja
R x f diferenciavel e seja g Ran ( W )) tal que ( W )f = g, ou seja, g(x) =
f (x) a f (y)dy, o que implica g(a) = f (a). Como f e diferenciavel, g tambem o e e tem-se
g 0 = f f . A solucao dessa equacao diferencial para f com a condicao f (a) = g(a)/ e
Z
1 x x y
1
e g(y) dy ,
(26.96)
f (x) = g(x) + 2 e

a
como facilmente se mostra. Definindo o operador de multiplicacao E : C([a, b]) C([a, b]) por
x
(E h)(x) := e h(x) a expressao (26.96) esta dizendo-nos que para 6= 0, o operador ( W ) 1 ,
restrito ao espaco C 1 ([a, b]) das funcoes contnuas e diferenciaveis (como a funcao g acima), e dado
por
1
1
( W )1 C 1 ([a, b]) =
+ 2 E1 W E .

1
O operador a` direita e limitado e C ([a, b]) e denso em C([a, b]). Logo, ( W )1 existe em toda
parte, valendo, portanto, para o operador resolvente R (W ) a expressao
1
1
+ 2 E1 W E ,
6= 0 ,

provando que se 6= 0 entao e um elemento do conjunto resolvente de W : (W ). Isso estabeleceu


que (W ) = \ {0} e que (W ) = {0}.
R (W ) =

No caso = 0 a imagem de W = W e o conjunto C 1 ([a, b]), que e denso em C([a, b]).


Logo, {0} pertence ao espectro contnuo c (W ) e nao ao espectro residual r (W ), que deve ser vazio.
Resumindo,
(W ) = {0},

p (W ) = ,

c (W ) = {0}

r (W ) = .

(26.97)

Notemos, por fim que |(W f )(x)| kf k (x a) e, portanto kW k b a. Para a funcao constante
igual a 1, vale (W 1)(x) = x a. Logo kW 1k = b a e como k1k = 1, segue que kW k b a,
provando que kW k = b a. Conclumos que W tem um raio espectral nulo (por (26.97)), mas uma
norma nao-nula.

Notemos, por fim, que tanto os operadores de Fredholm quando os de Volterra sao limitados e
definidos em C([a, b]), que e um conjunto denso em espacos de Hilbert do tipo L2 ([a, b], r(x)dx) com
r positiva e contnua. Assim, pelo Teorema BLT, Teorema 26.1, pagina 1119, esses operadores podem
ser estendidos a operadores compactos agindo nesses espacos de Hilbert.

JCABarata. Curso de Fsica-Matem


atica

26.6.1

Vers
ao de 29 de setembro de 2005.

Captulo 26

1215/1304

O Teorema Espectral para Operadores Compactos Auto-adjuntos

Vamos na presente secao demonstrar a versao do Teorema Espectral para operadores compactos autoadjuntos, generalizando em parte o teorema espectral provado para matrizes na Secao 3.4, pagina
162.
Faremos implicitamente uso, em tudo o que segue, da Proposicao 26.7, pagina 1148, que estabelece
que os autovalores de um operador auto-adjunto sao reais e que para tais operadores os autovetores de
autovalores distintos sao ortogonais entre si.
Autovalores de Operadores Compactos Auto-adjuntos
O teorema a seguir tem um papel central a desempenhar na demonstracao do teorema espectral
para operadores compactos auto-adjuntos, por garantir que os mesmos sempre possuem pelo menos
um autovalor.
Teorema 26.28 Seja C e um operador compacto e auto-adjunto agindo em um espaco de Hilbert H e
denotemos por p (C) o conjunto de todos os autovalores de C.
I. Ent
ao, p (C) 6= pois ou kCk p (C) ou kCk p (C) (ou ambos), ou seja, ou kCk ou kCk
(ou ambos) s
ao autovalores de C.
II. Alem disso, tem-se,
h
i
1. p (C) kCk, kCk .

2. Cada autovalor de C, exceto eventualmente um autovalor nulo (se houver), tem degenerescencia finita.

3. p (C) e um conjunto infinito, exceto se C for de posto finito.


4. Se C n
ao for de posto finito, 0 ser
aou
nico ponto de acumulaca
o de p (C).
5. Se C n
ao for de posto finito, p (C) e enumer
avel.

Enfatizamos que o espaco de Hilbert H, no enunciado acima, nao e necessariamente separavel. Um


outro comentario concerne o caso de operadores compactos nao-auto-adjuntos. Se C e um operador
compacto nao-auto-adjunto, pode-se provar que o conjunto de seus autovalores nao-nulos e tambem
enumeravel e se acumula no maximo em zero, mas pode ser vazio, o que nao ocorre no caso de operadores
compactos auto-adjuntos (parte I do enunciado acima). Um exemplo e operador de Volterra W , tratado
tratado no Exemplo 26.6 a` pagina 1214.
Prova do Teorema 26.28. Suporemos C 6= 0, de outra forma nao ha o que demonstrar. Provaremos
separadamente as partes I e II.
Prova da parte I. Como C e auto-adjunto, vale kCk =
Logo, existe uma seq
uencia n , n

sup
H, kk=1

|h, Ci| (Teorema 26.12, pagina 1151).

, de vetores em H com kn k = 1 tal que kCk = lim |hn , Cn i|


n

(justifique!). Como C = C , hn , Cn i e um n
umero real. Dessa forma, como o modulo de hn , Cn i

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1216/1304

converge a kCk, hn , Cn i deve ter uma sub-seq


uencia que converge a kCk ou uma sub-seq
uencia
que converge a kCk (ou ambas). Para evitar sobrecarregar a notacao, tambem denotaremos essa
sub-seq
uencia por hn , Cn i, a qual convergira para c = kCk, conforme o caso. Agora, usando o
fato que c e real, que c2 = kCk2 e que C = C , teremos
kCn cn k2 = hCn cn , Cn cn i = kCn k2 + c2 kn k2 2chn , Cn i
| {z }
=1

kCk2 kn k2 +c2 2chn , Cn i = 2c (c hn , Cn i) .


| {z } | {z }
=c2

=1

Como lim hn , Cn i = c, conclumos que


n

lim (Cn cn ) = 0 .

(26.98)

Como n e uma seq


uencia limitada e C e compacto, a seq
uencia Cn possui uma sub-seq
uencia Cnj
convergente, ou seja, existe H tal que lim Cnj = . A expressao (26.98) esta entao dizendo-nos
n
que
= lim Cnj = c lim nj .
(26.99)
n

Assim,
C

(26.99)



C c lim nj
n

e linear

cC

lim nj

e contnuo

c lim Cnj

(26.99)

c .

Assim, se 6= 0, e um autovetor de C com autovalor c = +kCk ou c = kCk. Agora, ver que 6= 0


e facil, pois, por (26.99)




kk = c lim nj = |c| lim knj k = |c| = kCk 6= 0 .
n | {z }
n
=1

Isso completa a prova da parte I.


Prova da parte II.

II.1. Se e um autovalor de C existe um autovetor (nao-nulo) H de C: C = . Podemos


escolher de modo que kk = 1. Isso implicah || = kk i= kCk kCk kk = kCk. Logo, como
(pois C e auto-adjunto), segue que kCk, kCk .


II.2. Vamos supor que seja um autovalor de C e que seja infinitamente degenerado33 . Isso significa
que o sub-espaco M gerado pelos autovetores de C com autovalor tem dimensao infinita. Podemos
escolher em M um conjunto ortonormal de vetores n , n . Como hn , m i = n, m , segue que para
m 6= n, kn m k2 = h(n m ), (n m )i = 2. Logo, tambem para m 6= n,


kCn Cm k2 = kn m k2 = ||2 kn m k2 = 2||2 .


33

Aqui supomos implicitamente que H n


ao tem dimens
ao finita, sen
ao n
ao haveria o que demonstrar

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1217/1304

Assim, se 6= 0, vemos que Cn , n


nao e uma seq
uencia de Cauchy, assim como nenhuma de
suas sub-seq
uencias. Isso contraria a hipotese que C e compacto. Essa contradicao leva-nos a excluir
a possibilidade de ser infinitamente degenerado, exceto se = 0.


II.3. Vamos supor que p (C) seja um conjunto finito. Pelo item II.2 o sub-espaco gerado por todos os
autovetores de C com autovalor nao-nulo e de dimensao finita e, portanto, e fechado. Vamos denota-lo
bastante claro que M e um sub-espaco invariante por C (justifique!). Assim, pelo Corolario
por M. E
26.2, pagina 1149, M e igualmente um sub-espaco fechado que e invariante por C.
Vamos denotar por P o projetor ortogonal sobre M e por P =
M . Tem-se para todo H

CP =

P o projetor ortogonal sobre

CP = (P + P )CP = P CP + P CP = P CP ,

pois P CP = 0, ja que CP M , pois P M e M e invariante por C. Isso significa que


P CP = CP .

(26.100)

Como C e P sao auto-adjuntos, tambem obtem-se da u


ltima igualdade que
P C = (CP ) = (P CP ) = P CP = CP ,
mas nao usaremos isso.
Observemos agora que P CP e compacto (pela Proposicao 26.40, pagina 1205) e auto-adjunto.
Assim, pela parte I, existe H, 6= 0, tal que P CP = kP CP k. Essa igualdade diz-nos
que M , pois P (CP ) M , devido ao fator P a` esquerda. Se assim e, entao P = e,
portanto, P CP = P C = C, a u
ltima igualdade seguindo do fato que C mantem M invariante.

Estabelecemos, assim, que C = kP CP k.

Agora, se kP CP k 6= 0, entao seria um autovetor de C com autovalor nao-nulo, o que significa


que M, pela definicao de M. Ora, se 6= 0, isso nao e possvel, pois o u
nico vetor que M e M

tem em comum e o vetor nulo. Conclumos da que kP CP k = 0, ou seja, P CP = 0. Logo, por


(26.100), CP = 0. Isso, por sua vez, diz-nos que para todo M vale C = CP = 0.

Assim, conclumos que C aniquila todo o sub-espaco M , ou seja, que M e constitudo por autovetores de C com autovalor zero. Pelo Teorema da Decomposicao Ortogonal, Teorema 25.2, pagina
1093, todo vetor H pode ser escrito na forma = M + M , com M M e M M . Logo,
C = CM M, pois M e invariante por C. Como M e de dimensao finita, o fato que C M para
todo H esta precisamente dizendo-nos que C e de posto finito.
tambem facil de se ver que se C e de posto finito entao C tem um conjunto finito de autovalores.
E
Isso completa o que queramos provar.
II.4. Se C nao e de posto finito, vimos no item II.3 que p (C) nao e um conjunto finito. Como, pelo
h
i
item II.1, p (C) esta contido no intervalo fechado e limitado (ou seja, compacto) kCk, kCk , p (C)
deve possuir pelo menos um ponto de acumulacao (Teorema de Bolzano-Weierstrass). Seja x 0 um
desses pontos de acumulacao de p (C) e vamos supor que x0 6= 0. Como x0 e um ponto de acumulacao
de p (C), temos em cada intervalo aberto (x0 , x0 + ), com  > 0, infinitos autovalores de C.
Tomemos  pequeno o suficiente de modo que 0 6 (x0 , x0 + ), ou seja, tomemos  > 0 mas tal que

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1218/1304

|x0 | > . Tomemos tambem uma colecao contavel n , n , de autovalores distintos de C contidos no
claro que |n | > |x0 |  para todo n. Seja, para cada n , um autovetor
intervalo (x0 , x0 + ). E
n de C com autovalor n e com kn k = 1. Como os autovalores sao distintos, vale hn , m i = n, m .
Assim, para n 6= m,


kCn Cm k2 = kn n m m k2 = h(n n m m ), (n n m m )i = |n |2 +|m |2 > 2(|x0 |)2 .


Como 2(|x0 | )2 nao depende de m e n, isso esta dizendo-nos que Cn , n , nao e uma seq
uencia
de Cauchy, assim como nenhuma de suas sub-seq
uencias. Isso contraria o fato de C ser compacto.
Logo, x0 6= 0 nao pode ser ponto de acumulacao de autovalores de C. Como pelo menos um ponto de
acumulacao deve existir, esse deve ser o ponto x0 = 0.
h
i
II.5. Tomemos em kCk, kCk um intervalo fechado [a, b] que nao contem 0. Se [a, b] contivesse
infinitos autovalores de C, entao haveria em [a, b] um ponto de acumulacao de tais autovalores, o
h Assimi[a, b] p (C) e um conjunto finito. Portanto, conjuntos como
hque ja vimos iser impossvel.


p (C) e
kCk, kCk
n

kCk
,
n

kCk p (C) sao finitos para todo n 1, n

. Como

 


[
kCk
kCk

, kCk p (C) ,
p (C) \ {0} =
kCk,
n
n
n=1

conclumos que o lado direito e uma uniao contavel de conjuntos contaveis (finitos). Logo, p (C) \ {0}
e contavel e, portanto, p (C) e contavel.
Isso completa a prova da parte II.
Estamos agora prontos para abordar o Teorema Espectral para operadores compactos e autoadjuntos.
O Teorema Espectral para operadores compactos auto-adjuntos
Para o enunciar o Teorema Espectral para operadores compactos auto-adjuntos e para simplificar
sua demonstracao precisamos acertar algumas convencoes.
Se C e um operador compacto e auto-adjunto agindo em um espaco de Hilbert H, vimos no Teorema
26.28 que o conjunto de seus autovalores e contavel (e ate mesmo finito, caso C seja de posto finito)
e cada autovalor nao-nulo e finitamente degenerado. Vamos denotar por n , n , o conjunto dos
autovalores nao-nulos, convencionando que se um autovalor tem multiplicidade k ent
ao ele aparece
k, vezes seguidas na contagem, de forma que tenhamos, digamos, m = = m+k1 = . Com
isso, a seq
uencia n , n , contem cada autovalor repetido o n
umero de vezes correspondente a`
sua multiplicidade. Podemos convencionar tambem que os autovalores sao ordenados de tal forma
que |k | |l | para todo k l, ou seja, de forma que a seq
uencia |n |, n
seja nao-crescente.
Sabemos que autovetores correspondentes a autovalores distintos sao ortogonais entre si. O sub-espaco
M gerado pelos autovetores de autovalor tem dimensao k, a multiplicidade de . Com isso, podemos
encontrar em M um conjunto ortonormal de k autovetores m , . . . , m+k1 . Constitumos dessa forma
um conjunto ortonormal n , n , de autovetores de C, cada qual com autovalor n : Cn = n n ,
para todo n . Vamos denotar por Pn o projetor ortogonal relativo a cada autovetor n : para todo
H vale Pn := hn , i n .


JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

Caso C seja de posto finito, entao as seq


uencias n , n
seq
uencias finitas.


, n , n


e Pn , n


1219/1304

sao, em verdade,

Lembramos tambem que caso C nao seja de posto finito, entao 0 e o u


nico ponto de acumulacao da
seq
uencia n , n (novamente pelo Teorema 26.28), o que implica limn n = 0, fato que usaremos
adiante.


Com essas convencoes e com essa notacao, temos o seguinte:


Teorema 26.29 (Teorema Espectral para Operadores Compactos Auto-adjuntos) Seja C um
operador compacto e auto-adjunto agindo em um espaco de Hilbert H. Ent
ao, a seq
uencia de operaN
X
dores de posto finito
n Pn , N , converge a C na norma de B(H). Assim, para todo H


tem-se

n=1

C =

n P n =

n=1

X
n=1

n hn , i n .

(26.101)
2

Enfatizamos que o espaco de Hilbert H, no enunciado acima, nao e necessariamente separavel.


Como Cn = n n , a expressao (26.101) significa tambem que para todo H,
C =

X
n=1

hn , i Cn .

Compare-se isso a`s afirmacoes do Teorema 26.27, pagina 1208.


Prova do Teorema 26.29. Seja Pn := [1 , . . . , n ] o sub-espaco de H gerado pelos vetores 1 , . . . , n .
Por ser de dimensao finita, Pn e um sub-espaco fechado de H. Para cada N , N 1, defina-se


KN := C

N
X

n P n .

n=1

P
Caso kKM k = 0 para algum M , entao C = M
a completa. Caso kKN k 6= 0
n=1 n Pn e a prova est
para todo N , procedemos da seguinte forma.


Como os vetores n formam um conjunto ortonormal, vale Pi j = hi , j iH i = i, j i . Logo, se


1 l N , tem-se
N
X
KN l = Cl
n P n l = l l l l = 0
n=1

o que significa dizer que KN aniquila o sub-espaco PN .

Os Pj s sao auto-adjuntos e compactos (por serem de posto finito) e, portanto, cada KN e tambem
compacto e auto-adjunto. O Teorema 26.28, pagina 1215, garante, entao, que K N possui um autovalor
igual a kKN k ou a kKN k. Seja um autovetor nao-nulo correspondente. Teremos KN = cN onde
cN = kKN k ou cN = kKN k. Como KN aniquila o sub-espaco PN , essa igualdade e a hipotese que
cN 6= 0 implicam que (PN ) .

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1220/1304

Para ver isso, lembremos que pelo Teorema da Decomposicao Ortogonal, Teorema 25.2, pagina
1093, podemos escrever = + , onde PN e (PN ) . Como KN e auto-adjunto e aniquila
todo vetor de PN , vale h, KN iH = hKN , iH = 0. Como, KN = cN , isso diz-nos que
0 = cN h, iH = cN h, iH = cN kk2 , provando que = 0 e que = (PN ) .

Agora, o fato que (PN ) implica Pn = 0 para todo 1 n N . Logo, KN = C e a


igualdade KN = cN significa C = cN , ou seja, kKN k ou kKN k e um autovalor de C.

Quando definimos a seq


uencia n , n , convencionamos colocar consecutivamente autovalores
de multiplicidade repetida e ordena-los de modo que |n |, n
seja uma seq
uencia nao-crescente.
Isso implica que se cN = kKN k e um autovalor de C cujo autovetor nao pertence a Pn , entao temos
|cN | |N |, ou seja, kKN k |N |. Agora, tambem pelo Teorema 26.28, limN |N | = 0, o que
implica limN kKN k = 0. Isso e precisamente o que queramos provar.


Base ortonormal completa de autovetores de um operador compacto auto-adjunto


Seja C um operador compacto e auto-adjunto agindo em um espaco de Hilbert (nao necessariamente
separavel) H. Seja B1 = {n | n }, como acima, um conjunto ortonormal contavel de autovetores
facil
de C com autovalores nao-nulos. Seja T o fecho do sub-espaco gerado pelos vetores n , n . E

de ver que se T , entao Ker (C). De fato, para todo T vale hn , iH = 0 para todo
n e, por (26.101), isso implica C = 0. Vemos, portanto, que H e uma soma direta dos sub-espacos
fechados T e Ker (C). Como Ker (C) e fechado, e um espaco de Hilbert e, portanto, possui uma base
ortonormal completa (nao necessariamente contavel) B0 . Todos os vetores dessa base sao autovetores
de C com autovalor nulo. O conjunto B0 B1 sera, portanto, uma base ortogonal completa em H,
formada por autovalores (nulos ou nao) de C. Conclumos entao a prova do seguinte teorema:


Teorema 26.30 Seja C um operador compacto e auto-adjunto agindo em um espaco de Hilbert (n


ao
necessariamente separ
avel) H. Ent
ao H possui uma base ortonormal completa formada por autovetores
(com autovalores nulos ou n
ao) de C.
2
Esse teorema pode tambem ser demonstrado sem evocar-se o Teorema espectral. Para tal, considerese o sub-espaco fechado A de H formado pela soma direta de T e Ker (C). Ou seja, A e o sub-espaco
fechado gerado por todos os autovetores de C (com autovalores nulos ou nao). Como A e mantido
invariante por C, entao A tambem o e (Corolario 26.2, pagina 1149). Se P e o projetor ortogonal
sobre A , entao o fato de A ser invariante por C significa CP = P CP . Agora, P CP e
obviamente compacto e auto-adjunto (Proposicao 26.40, pagina 1205). Vamos supor que kP CP k 6=
0. Pelo Teorema 26.28, existira H, 6= 0, tal que P CP = c, onde c = kP CP k. Essa
expressao implica A (devido ao fator P do lado esquerdo). Assim, ela afirma que C = c. Mas
isso diz-nos que e autovalor de C, o que so e possvel se A. Logo kP CP k = 0, mas isso, por
sua vez, implica CP = 0, pois CP = P CP . Logo, para todo A teremos C = CP = 0,
o que implica Ker (C). Agora, Ker (C) A e o u
nico vetor que A e A tem em comum e o vetor

nulo. Provamos entao que se A entao = 0, ou seja A = H. Pela definicao, isso diz precisamente
que o conjunto ortonormal B0 B1 , que gera A, e uma base ortonormal completa em H, encerrando
novamente a prova.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1221/1304

Os Teoremas 26.28 e 26.30 foram demonstrados por Hilbert34 , Schmidt35 , Riesz36 e Schauder37 . O
Teorema Espectral para operadores compactos auto-adjuntos foi provado por Hilbert em 1906, sendo o
restante da teoria (re)elaborado pelos demais autores por volta de 1908. Esses trabalhos sao os marcos
iniciais da Analise Funcional. Para mais detalhes historicos desses importantes desenvolvimentos, vide
[32].
O caso de operadores compactos n
ao-auto-adjuntos
O Teorema Espectral demonstrado acima para operadores compactos e auto-adjuntos pode ser,
como veremos, estendido para operadores compactos nao-auto-adjuntos. Ja observamos, porem, que
nem todo operador compacto em espacos de dimensao infinita possui autovalores. Assim, esperamos
alguma diferenca em relacao ao caso auto-adjunto, pois na decomposicao espectral
(26.101) sao os
autovalores n de C que comparecem. A observacao crucial vem do fato que |C| := C C e compacto
e auto-adjunto (Proposicao 26.44, pagina 1211) e, pelo Teorema 26.28, pagina 1215, possui autovalores,
valendo inclusive o Teorema 26.29.
Seja C um operador compacto mas nao necessariamente auto-adjunto e seja C = U |C| sua decomposicao polar (Teorema 26.22, pagina 1182). Pela Proposicao 26.44, pagina 1211, sabemos que |C| e
compacto, auto-adjunto e positivo. Podemos, pelo Teorema Espectral para operadores compactos e
auto-adjuntos, Teorema 26.29, pagina 1219, escrever
|C| =

X
n=1

n hn , i n ,

onde n sao os autovalores positivos de |C| (os quais sao positivos pois |C| e um operador positivo) e
n os correspondentes autovetores normalizados. Usando a decomposicao polar C = U |C|, temos entao
C =

X
n=1

n hn , i U n .

Lembremos que, pelo Teorema da Decomposicao Polar (Teorema 26.22, pagina 1182), Ker (U ) =
Ker (|C|) = Ker (C), de modo que U n 6= 0 se n > 0.
Em resumo, o que conclumos desses comentarios e o seguinte:

Teorema 26.31 (Decomposi


c
ao Espectral para Operadores Compactos) Seja C um operador
compacto agindo em um espaco de Hilbert H. Ent
ao existem n
umeros positivos n , n e conjuntos
ortonormais n , n , e n , n , em H tais que


C =

X
n=1

n hn , i n ,

(26.102)

a convergencia da serie de operadores do lado esquerdo se dando na norma de B(H). Se C for de posto
34

David Hilbert (1862-1943).


Erhard Schmidt (1876-1959).
36
Frigyes Riesz (1880-1956).
37
Juliusz Pawel Schauder (1899-1943). Schauder foi tragicamente assassinado pela Gestapo.
35

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1222/1304

finito, a soma acima ser


a finita. Assim, para todo H podemos escrever
C =

X
n=1

n hn , i n ,

(26.103)

A express
ao (26.102) est
a tambem dizendo-nos que todo operador compacto C pode ser aproximado
em norma por operadores de posto finito. Isso generaliza o Teorema 26.27, p
agina 1208, pois aqui n
ao
precisamos supor que H seja separ
avel.
2
Valores singulares de um operador compacto
Os n
umeros n que comparecem em (26.102) e (26.103) sao denominados valores singulares do
operador compacto C. Vemos que trata-se dos autovalores de |C|. O operador C nao necessariamente
tem autovalores mas sempre tem valores singulares e, por isso, ha que se fazer a distincao entre ambos
os conceitos.
Operadores Nucleares
Ja comentamos a` pagina 1209 que nem todo operador compacto agindo em espacos de Banach pode
ser aproximado por operadores de posto finito. Para espacos de Hilbert, no entanto, isso e verdade,
como atesta a expressao (26.103). No entanto, essa mesma expressao motiva uma importante definicao
que apresentaremos e discutiremos brevemente aqui: a de operadores nucleares, nocao introduzida por
Grothendieck38 .
Sejam X e Y dois espacos de Banach. Um operador P
limitado N : X Y e dito ser um operador
nuos
nuclear se existirem constantes n > 0, n , com
n=1 n < , funcionais lineares cont

ln : X com kln kX = 1 para todo n e vetores yn Y com kyn kY = 1 para todo n , tais que


Nx =

n ln (x) yn ,

(26.104)

n=1

para todo x X.
P
A condicao
e includa por ser suficiente para garantir convergencia do lado direito
n=1 n < ,
da expressao (26.104). Pela expressao (26.103), vemos que um operador compacto em um espaco de
Hilbert e nuclear se e somente se a seq
uencia de seus valores singulares for somavel.
E. 26.22 Exerccio-exemplo. Seja n , n , um conjunto ortonormal de vetores em um espaco de
Hilbert H e seja Pn o projetor ortogonal sobre n . O operador


X
1
Pn
C =
n
n=1

e compacto (vide o exemplo da equacao (26.93)) mas nao e nuclear. Mostre isso.
38

Alexander Grothendieck (1928-).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1223/1304

Como exerccio, deixamos ao leitor demonstrar as seguintes afirmacoes, validas no contexto geral de
espacos de Banach: 1. todo operador de posto finito e nuclear (isso e evidente, alias); 2. todo operador
nuclear e compacto; 3. toda combinacao linear de dois operadores nucleares e novamente um operador
nuclear; 4. o produto (`a direita ou a` esquerda) de um operador nuclear por um operador contnuo e
novamente um operador nuclear. Vide [138].

26.7

O Teorema Espectral para Operadores Limitados Autoadjuntos em Espa


cos de Hilbert

Na presente secao trataremos do Teorema Espectral para operadores limitados auto-adjuntos agindo
em espacos de Hilbert em suas diversas formas. Seguiremos proximamente [103], mas completaremos
varias lacunas daquela exposicao.

26.7.1

O C
alculo Funcional Contnuo e o Homomorfismo de Gelfand

P
, e
Comecamos com uma definicao elementar. Se p(x) = a0 + nk=1 ak xk e um polinomio em
Px
n
k
T B(H), H sendo um espaco de Hilbert, define-se p(T ) B(H)
por
p(T
)
:=
a
+
0
k=1 ak T .
P
Convencionando que T 0 = , podemos escrever tambem p(T ) = nk=0 ak T k .
O seguinte lema resume alguns fatos fundamentais a respeito de polinomios de operadores autoadjuntos em espacos de Hilbert e e um caso particular da Proposicao 26.28, pagina 1171, dispensando
demonstracao.
Lema 26.6 Seja H um espaco de Hilbert e A B(H) um operador limitado e auto-adjunto. Seja
n

tambem p(x) = ak xk um polin


omio em x
k=0

. Ent
ao, o espectro de p(A) e a imagem por p do

espectro de A, ou seja,

(p(A)) = {p(), (A)} =: p((A)) .

Fora isso, kp(A)k = sup |p()|.


(A)

(26.105)
2

Seja agora o espaco de Banach C((A)) da funcoes complexas contnuas definidas no espectro
de A dotado da norma kf k := sup(A) |f ()| e seja P ((A)) o sub-espaco de C((A)) formado
por polinomios. Sabemos pelo Teorema de Weierstrass que P ((A)) e denso em C((A)). Vimos
tambem no Lema 26.6 que a aplicacao A : P ((A)) B(H) dada por (p) = p(A) satisfaz
k(p)kH = kpk . Ora, isso diz-nos que e limitada e, pelo Teorema BLT, Teorema 26.1, pagina 1119,
pode ser estendida unicamente e isometricamente ao fecho de P ((A)) que e C((A)). Essa extensao
tambem sera denotada por . Assim, para toda f C((A)) podemos definir (f ) como limite em
norma de operadores (p), com p sendo polinomios que convergem a f na norma k k .
Denotaremos tambem sugestivamente (f ), para f C((A)), por f (A). Tem-se os seguintes fatos
sobre (f ) (vide [103]).

Teorema 26.32 (C
alculo Funcional Contnuo) Seja H um espaco de Hilbert, seja A B(H)
auto-adjunto e seja A : C((A)) B(H) definida acima. Para todo polin
omio p vale (p) =

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1224/1304

p(A). Como vimos, pelo Teorema BLT, Teorema 26.1, p


agina 1119, tem-se k(f )k H = kf k para toda
f C((A)). Fora isso, valem as seguintes afirmaco
es:
1. A aplicaca
o e um -homomorfismo algebrico, ou seja,
(f + g) = (f ) + (g) ,

(f g) = (f )(g) ,

(f ) = (f ) ,

(1) = ,
(26.106)
para todas f, g C((A)) e todos , . Como f g = gf , segue de (26.106) que (f )(g) =
(g)(f ) para todas f, g C((A)).
2. Se f 0 tem-se tambem (f ) 0.
3. Se fn C((A)), n
e uma seq
uencia de converge na norma k k a uma funca
o f
C((A)) ent
ao (fn ) converge a (f ) na norma de B(H). Reciprocamente, se (fn ) converge
na norma de B(H), ent
ao existe f C((A)) tal que limn (fn ) = (f ). Isso diz-nos que
{(f ), f C((A))} e fechada na norma de B(H). Com a propriedade do item 1, isso significa
que {(f ), f C((A))} e uma a
lgebra C Abeliana com unidade.


4. Se H e um autovetor de A com autovalor 0 , ent


ao (f ) = f (0 ). Mais genericamente,
vale ((f )) = {f (), (A)}.
2
O -homomorfismo : C((A)) B(H) e por vezes denominado homomorfismo de Gelfand 39 .
Prova do Teorema 26.32. A demonstracao desse teorema segue muito proximamente a demonstracao do
Teorema 26.17, pagina 1172 e, de fato, quase todas as assercoes acima sao casos particulares daquele
teorema pois B(H) e uma algebra C com unidade. Para facilitar a leitor e destacar algumas poucas
especificidades, apresentamos a demonstracao com detalhe.
Prova do item 1. A aplicacao e limitada e, portanto, contnua. As propriedades (26.106), que caracterizam como um -homomorfismo algebrico, sao triviais de se verificar no subespaco denso P ((A))
e da se estendem facilmente a todo C((A)) por continuidade.
Prova do item 2. Se f 0 entao f = g 2 para alguma g real e contnua. Logo, pela propriedade de
homomorfismo (f ) = (g 2 ) = (g)(g) = (g) (g), que e um operador positivo.
Prova do item 3. Tem-se k(fn ) (f )k = k(f fn )k = kf fn k . Logo, se kf fn k 0, segue
k(fn ) (f )k 0. Reciprocamente, se (fn ) converge na norma de B(H), segue que (fn ) e uma
seq
uencia de Cauchy em B(H). Assim, como k(fn ) (fm )k = kfn fm k , a seq
uencia fn e de
Cauchy em C((A)) com a norma k k . Como C((A)) e completo em relacao a essa norma, existe
f C((A)) a` qual fn converge e, portanto, limn (fn ) = (f ).

Prova do item 4. Para provar que (f ) = f (0 ) caso A = 0 , notemos em primeiro lugar que para
qualquer polinomio p vale, claramente, (p) = p(0 ). Se tomarmos uma seq
uencia de polinomios p
que converge a f na norma k k teremos o resultado desejado por continuidade.

1
Se nao pertence a` imagem de (A) por f entao r := (f )
e contnua e, portanto, (r) esta
bem definida e vale (r)(f ) = (f )(r) = , pelas propriedades de homomorfismo, provando
39

Israil Moiseevic Gelfand (1913-).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1225/1304

que (f ) e bijetora com inversa limitada e que, portanto, ((f )), o conjunto resolvente de
(f ). Isso estabeleceu que o complemento da imagem de f , \ {f (), (A)}, e um subconjunto
de ((f )). Logo, ((f )) {f (), (A)}. Vamos agora demonstrar a inclusao oposta. Seja
{f (), (A)}, ou seja, = f (0 ) para algum 0 (A) e vamos supor que ((f )), ou
seja, que F := (f ) f (0 ) e bijetora. Seja agora P := (p) p(0 ) para algum polinomio p tal que
kf pk < . Teremos, F P = (f p) (f (0 ) p(0 )) e, assim,
kF P k k(f p)k + |f (0 ) p(0 )| k k = kf pk + |f (0 ) p(0 )| 2kf pk < 2 .
Agora, pelo Corolario 26.3, pagina 1160, se escolhermos esse  pequeno o suficiente tal que kF P k <
kF 1 k1 , entao P sera invertvel em B(H), o que implica p(0 ) 6 ((p)) com 0 (A). Isso
contraria (26.105). Logo, devemos ter 6 ((f )), ou seja, ((f )), o que prova {f (),
(A)} ((f )), estabelecendo a igualdade desses dois conjuntos. Isso completa a prova do Teorema
26.32
Comentamos que a identificacao ((f )) = {f (), (A)} nao contraria o fato de ((f )) ser
fechado, pois a imagem de um conjunto compacto (no caso, (A)) por uma funcao contnua (no caso,
f ) e sempre um conjunto compacto (ou seja, fechado e limitado).

26.7.2

Generalizando o C
alculo Funcional Contnuo. As Medidas Espectrais

Seja daqui por diante A um operador auto-adjunto limitado fixo, definido em um espaco de Hilbert H.
O Teorema 26.32 e muito importante por permitir definir objetos como f (A) para uma funcao
contnua f definida no espectro de um operador auto-adjunto A agindo em um espaco de Hilbert.
Sucede, porem, que e possvel fazer ainda mais e definir f (A) mesmo para certas funcoes f que nao
sejam contnuas. A necessidade de um tal resultado nao e meramente um capricho matematico, mas e
importante para alcancarmos um resultado mais profundo, a saber, a versao por projetores espectrais
do teorema espectral da qual falaremos mais abaixo.
Nosso ponto de partida e a seguinte observacao. Seja H e seja f C((A)). Entao, a aplicacao
f 7 h, f (A)iH = h, (f )iH e claramente um funcional linear definido em C((A)). Fora isso,
para todo f C((A)) vale
|h, (f )iH |

Cauchy-Schwarz

k(f )k kk2 = kf k kk2 ,

provando que a aplicacao C((A)) 3 f 7 h, (f )iH e limitada e, portanto, contnua. Alem disso, se
f 0, vimos pelo Teorema 26.32 que (f ) e um operador positivo. Isso significa que h, (f )iH 0
para todo H. Por fim, se f 1, segue que (f ) = e h, (f )iH = kk2 < .

Em resumo, provamos que para H com a aplicacao C((A)) 3 f 7 h, (f )iH e um funcional linear contnuo, positivo. Esses fatos aparentemente inocentes tem uma conseq
uencia profunda e
altamente nao-trivial. Um classico teorema de Analise conhecido como Teorema da Representacao de
Riesz40 afirma que
40

Frigyes Riesz (1880-1956).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1226/1304

Teorema 26.33 (Teorema da Representa


c
ao de Riesz ou Teorema de Riesz-Markov) Seja X
um espaco topol
ogico localmente compacto e Hausdorff e seja C c (X) o espaco das funco
es contnuas
definidas em X que tenham suporte compacto. Ent
ao, se l : Cc (X) e um funcional linear positivo
em Cc (X), existe uma (
unica) medida positiva sobre uma -
algebra M que contem a -
algebra de
Borel de X tal que
Z
l(f ) =
f d .
X

para toda f Cc (X). A medida e a -


algebra M satisfaz (K) < para todo compacto K X e e
regular, ou seja
(E) = inf{(V ), E V, V aberto}
(26.107)
para todo E M e

(E) = sup{(K), K E, K compacto}

(26.108)

para todo E M com (E) < . Por fim, o espaco de medida produzido por M e e completo, ou
seja, se E M e tal que (E) = 0 ent
ao todo subconjunto de E pertence a M.
2
O enunciado do teorema acima foi extrado de [110], onde sua demonstracao pode tambem ser encontrada41 . Alguns autores (por ex. [109]) referem-se a esse Teorema como Teorema de Riesz-Markov 42 .
Em nosso caso, X = (A) nao e apenas localmente compacto, mas compacto e, portanto, C c (X) =
C((A)). Podemos, entao, escrever
Z
h , f (A)i =
f d, A
(26.109)
(A)

para toda f C((A)), onde denotamos a medida em (A), cuja existencia e garantida pelo Teorema
26.33, por , A para lembrar sua dependencia em e A.
A medida , A e denominada medida espectral do operador A associada ao vetor H.

No que se segue, estudaremos varias propriedades dessa medida. Por exemplo, provaremos no item
4 do Teorema 26.35, abaixo, que se H, com kk = 1, e um autovetor de A com autovalor 0 , entao
a medida , A e a medida de Dirac centrada em 0 .
E. 26.23 Exerccio. Mostre que , A = ||2 , A para todo .

A importancia da relacao (26.109) para nossa tarefa de estender o calculo funcional para funcoes
nao-contnuas e a seguinte. Apesar de a funcao f em (26.109) ser contnua, o lado esquerdo esta bem
Rdefinido para qualquer funcao Boreliana limitada, ou seja, se g : (A) e Boreliana e limitada entao
g d, A esta bem definida. A questao e: existe um operador g(A) B(H) tal que h , g(A)i =
R(A)
g d, A ? Mostraremos que, de fato, um tal operador pode ser definido por essa relacao. A ideia e
(A)
41

Teorema 2.14 da edica


o [110].
Andrei Andreyevich Markov (1903-1979). O pai desse Markov, que tinha o mesmo nome que o filho e viveu entre 1856
e 1922, foi tambem um matem
atico celebre e foi o inventor das cadeias de Markov da teoria dos processos estoc
asticos,
entre outras coisas. O trabalho do segundo Markov contendo o teorema que citamos sobre funcionais lineares e: A.
Markov, On mean values and exterior densities, Mat. Sbornik N.S. 4 (46) (1938) 165-191. Para mais referencias
hist
oricas, vide [109].
42

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1227/1304

explorar identidade de polarizacao para definir o que seria o equivalente aos produtos escalares gerais
h , g(A)i e mostrar que esse equivalente e uma forma sesquilinear e bicontnua (em e H), o
que, como veremos, permite definir o operador limitado g(A).
Este e o momento oportuno para introduzirmos a nocao geral de forma sesquilinear bicontnua em
espacos de Hilbert e estabelecermos um resultado geral sobre essa nocao.
Formas sesquilineares bicontnuas
Uma forma sesquilinear43 S : H H e dita ser bicontnua se existir M > 0 tal que |S(u, v)|
M kuk kvk para todos u, v H. O seguinte resultado e fundamental para o que segue.
Proposi
c
ao 26.45 Se S : H H e uma forma sesquilinear bicontnua em um espaco de Hilbert
H ent
ao existe um operador limitado S, u
nico, tal que
S(u, v) = hSu, vi
para todos u, v H.

Prova. Para cada u fixo, a aplicacao v 7 S(u, v) e um funcional linear contnuo. Assim, pelo Teorema
de Representacao de Riesz para espacos de Hilbert, Teorema 25.8, pagina 1110, existe para cada u H
um vetor u tal que S(u, v) = hu , vi. Seja S : H H a funcao (que nao pressupomos ser linear) que
associa u a u : S(u) = u . Escrevemos, portanto, S(u, v) = hS(u), vi para todos u, v H.

Como S e sesquilinear, tem-se S(1 u1 +2 u2 , v) = 1 S(u1 , v)+2 S(u2 , v), para todos u1 , u2 , v H
e 1 , 2 . Assim,
hS(1 u1 + 2 u2 ), vi = 1 hS(u1 ), vi + 2 hS(u2 ), vi
= h1 S(u1 ), vi + h2 S(u2 ), vi = h(1 S(u1 ) + 2 S(u2 )), vi ,

para todos u1 , u2 , v H e 1 , 2 , o que implica S(1 u1 + 2 u2 ) = 1 S(u1 ) + 2 S(u2 ), ou seja, S


e linear. Pela hipotese de S ser bicontnua, tem-se |hSv, ui| M kuk kvk para todos u, v H. Assim,
kSvk2 = |hSv, Svi| M kSvk kvk. Isso implica kSvk M kvk para todo v H, provando que S e um
operador linear limitado. A unicidade de S e elementar.
A constru
c
ao do operador g(A)
No que segue, Bl ((A)) designara o conjunto de todas as funcoes complexas Borelianas e limitadas
definidas em (A).
Proposi
c
ao 26.46 Para cada g Bl ((A)), Boreliana e limitada, a aplicaca
o Sg : H H
definida por
Z
3
1 X n
Sg (u, v) :=
i
g dn , A
(26.110)
4 n=0
(A)
43

A definica
o de forma sesquilinear encontra-se a
` p
agina 113.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1228/1304

onde n := u + in v, e uma aplicaca


o sesqui-linear e bicontnua em H, sendo que |S g (u, v)|
kgk kuk kvk para todos u, v H. Assim, pela Proposica
o 26.45, existe um operador limitado, que
denotaremos por g(A), tal que
Sg (u, v) = hu, g(A)vi

claro tambem que


para todos u, v H. E

kg(A)k kgk .

(26.111)
2

Prova. Para cada funcao f contnua tem-se pela identidade de polarizacao (2.23), pagina 126, e por
(26.109), que
3

1 X n
i
Sf (u, v) =
4 n=0

f dn , A
(A)

1 X n
=
i hn , f (A)n i
4 n=0
3

1 X n
i h(u + in v), f (A)(u + in v)i = hu, f (A)vi ,
=
4 n=0
Isso mostra que Sf e sesquilinear e e bicontnua pois, por Cauchy-Schwarz, vale |hu, f (A)vi|
kf (A)k kuk kvk. Queremos agora provar que essas propriedades estendem-se a`s formas S g , com g
Bl ((A)), e a ideia e explorar o fato que tais funcoes podem ser aproximadas por funcoes contnuas.
Mais especificamente, usaremos o seguinte resultado:
Teorema 26.34 (Teorema de Lusin) 44 Seja X um espaco localmente compacto e Hausdorff e seja
uma medida positiva sobre uma -
algebra M de X que contem a -
algebra de Borel de X tal que: 1)
(K) < para todo compacto K X; 2) e regular, ou seja (E) = inf{(V ), E V, V aberto}
para todo E M e (E) = sup{(K), K E, K compacto} para todo E M com (E) < ; 3) o
espaco de medida produzido por M e e completo, ou seja, se E M e tal que (E) = 0 ent
ao todo
subconjunto de E pertence a M.
Suponha que g e uma funca
o complexa e mensur
avel em X com a propriedade que g(x) = 0 se
x 6 B, sendo B X tal que (B) < . Ent
ao para todo  > 0 existe f C c (X) tal que

{x X| g(x) 6= f (x)}  .
Alem disso, f pode ser escolhida de forma que

sup |f (x)| sup |g(x)| .

xX

xX

2
44

Nikolai Nikolaevich Lusin (ou Luzin) (1883-1950).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1229/1304

O enunciado do teorema acima foi extrado de [110], onde sua demonstracao pode tambem ser encontrada45 . O Teorema 26.34 tem o seguinte corolario elementar, que usaremos adiante.
Corol
ario 26.14 Seja X e um espaco localmente compacto e Hausdorff e j , j = 1, . . . , n, uma
coleca
o finita de medidas satisfazendo as condico
es do Teorema 26.34. Seja g e uma funca
o complexa
e Boreliana em X com a propriedade que g(x) = 0 se x 6 B, sendo B X tal que j (B) < ,
j = 1, . . . , n. Ent
ao para todo  > 0 existe f Cc (X) tal que

j {x X| g(x) 6= f (x)} 
para todo j = 1, . . . , n. Alem disso, f pode ser escolhida de forma que
sup |f (x)| sup |g(x)| .

xX

xX

2
Prova. Seja D := {x X| g(x) 6= f (x)}. Pelas hipoteses, as medidas j tem em comum a algebra de Borel em X, onde podemos definir a medida := 1 + + n , a qual tamb
 em satisfaz
todasas condicoes do Teorema 26.34. Logo, existe
f

C
(X)
com
(
+

)
D
, ou seja,
c
1
n

1 D + + n D , o que implica j D  para todo j = 1, . . . , n, pois as medidas sao
positivas.
Note-se que as condicoes 1, 2 e 3 do enunciado do Teorema 26.34 sao aquelas garantidas pelo Teorema
26.33 e, portanto, valem para as medidas , A definidas em X = (A). A nos nos interessa o seguinte.
Pelo Teorema de Lusin, Teorema 26.34, se g Bl ((A)) e Boreliana e limitada entao para todo > 0

existe f C((A)) tal que (E) , onde E (A) e o conjunto E := {x (A)| g(x) 6= f (x)} . E
claro disso que
Z

Z
Z




(f g) d, A
|f g| d, A =
|f g| d, A kf gk (E) 2kgk  ,

(A)

(A)

(26.112)
onde usamos o fato que, novamente pelo Teorema de Lusin, kf k kgk, o que implica kf gk
kf k + kgk 2kgk . Para u, v H fixos e  > 0 podemos, pelo Corolario 26.14, escolher
f C((A)) de forma que
Z
(A)

|f g| dn, A 2kgk 

(26.113)

para todos os quatro vetores n = u + in v, n = 0, . . . , 3. Assim, com u, v H fixos e para uma tal f
teremos


Z
3 Z
3

1 X
X


n
|g f |dn , A 8kgk  .
i
(g f )dn , A
|Sg (u, v) Sf (u, v)| =

4
(A)
n=0 (A)
n=0
(26.114)
45

Teorema 2.24 da edica


o [110].

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1230/1304

Com isso podemos provar que Sg e sesquilinear explorando o fato que Sf o e para toda f contnua. De
fato, para todos u, v1 , v2 H e 1 , 2 , temos Sf (u, 1 v1 + 2 v2 ) 1 Sf (u, v1 ) 2 Sf (u, v2 ) = 0
se f for contnua e da segue que




Sg (u, 1 v1 + 2 v2 ) 1 Sg (u, v1 ) 2 Sg (u, v2 )


 



= Sg (u, 1 v1 +2 v2 )1 Sg (u, v1 )2 Sg (u, v2 ) Sf (u, 1 v1 +2 v2 )1 Sf (u, v1 )2 Sf (u, v2 )
|Sg (u, 1 v1 + 2 v2 ) Sf (u, 1 v1 + 2 v2 )|

+ |1 | |Sg (u, v1 ) Sf (u, v1 )| + |2 | |Sg (u, v2 ) Sf (u, v2 )| .


Por (26.114), os tres u
ltimos termos podem ser escolhidos tao pequenos quanto se queira pela escolha de
uma f C((A)) apropriada (evocando o Corolario 26.14), o que nos leva a concluir que S g (u, 1 v1 +
2 v2 ) = 1 Sg (u, v1 ) + 2 Sg (u, v2 ), estabelecendo a linearidade de Sg em relacao ao segundo argumento.
A anti-linearidade em relacao ao primeiro argumento e provada da mesma forma. Resta-nos mostrar
que Sg e bicontnua. Escolhendo novamente f C((A)) de forma que |Sg (u, v) Sf (u, v)| , para
algum  > 0 qualquer (vide (26.114)), e usando que |Sf (u, v)| kf (A)k kuk kvk, teremos
|Sg (u, v)| = |Sg (u, v)Sf (u, v)+Sf (u, v)| |Sg (u, v)Sf (u, v)|+|Sf (u, v)| +kf (A)k kuk kvk .
(26.115)
Lembremos que kf (A)k = kf k e que, pelo Teorema de Lusin, Teorema 26.34, podemos escolher f
de modo que kf k kgk . Assim, |Sg (u, v)|  + kgkkuk kvk. Como isso vale para todo  > 0,
conclumos que |Sg (u, v)| kgk kuk kvk, provando que Sg e bicontnua. Isso completa a prova da
Proposicao 26.46.
A Proposicao 26.46 estabelece uma associacao entre funcoes Borelianas limitadas g definidas em
(A) e operadores limitados g(A) agindo em H. Denotemos essa aplicacao por : Bl ((A)) B(H),
A associacao f 7 f (A), para f contnua, e, como vimos no curso da demonstracao
ou seja, g(A) (g)
da Proposicao 26.46, um caso particular, de modo que : Bl ((A)) B(H) e uma extensao da
aplicacao : C((A)) B(H) do Calculo Funcional Contnuo, Teorema 26.32. Sobre a aplicacao
temos o seguinte teorema.
Teorema 26.35 (C
alculo Funcional Boreliano) Seja H um espaco de Hilbert, seja A B(H)
auto-adjunto e seja A : Bl ((A)) B(H) definida acima. e uma extens
ao de : C((A))
) = (f ) = f (A). Em particular, para
B(H) do Teorema 26.32 e, portanto, para f C((A)) vale (f
= p(A). Por (26.111), k(g)k

todo polin
omio p vale (p)
H kgk para toda g Bl ((A)). Fora isso,
valem as seguintes afirmaco
es:
1. A aplicaca
o e um -homomorfismo algebrico, ou seja,

+ (h)

(g
+ h) = (g)
,

(h)

(gh)
= (g)
,

= (g)

(g)
,

(1)
= ,
(26.116)
(h)

para todas g, h Bl ((A)) e todos , . Como gh = hg, segue de (26.116) que (g)
=

(h)(g) para todas g, h Bl ((A)).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1231/1304

2. Se g 0 tem-se tambem (g)


0.
3. Sejam g Bl ((A)) e gn Bl ((A)), n

, tais que lim gn (x) = g(x) para todo x (A) mas


n

tais que existe M > 0 para o qual kgn k < M para todo n . Ent
ao, gn (A) converge a g(A)
na topologia forte, ou seja, para todo H a seq
uencia gn (A) converge a g(A).


4. Se H e um autovetor de A com autovalor 0 , ent


ao , A e a medida de Dirac centrada em

0 e (g) = g() para toda g Bl ((A)). Em geral tem-se ((g))


{g(), (A)}. 2
Comentamos que no Teorema 26.32, pagina 1223, estabelecemos que ((f )) = {f (), (A)}
para f contnua. Tal propriedade nao pode valer, em geral, para funcoes Borelianas limitadas, ja pelo
fato de que a imagem de um conjunto compacto por uma funcao Boreliana limitada nao e necessariamente um conjunto compacto.
Prova do Teorema 26.35.
Prova do item 1. Como Sg (u, y) dada em (26.110) e claramente linear em g, conclumos que tambem

+ (h)

o e: (g
+ h) = (g)
para todas g, h Bl ((A)) e todas , .

(h)

Para provar que (gh)


= (g)
e suficiente provar que hu, (gh)(A)vi = hu, g(A)h(A)vi para
cada u, v H. Fixemos esse par de vetores e, evocando o Corolario 26.14, escolhamos f 1 C((A))
tal que
n , A ({x (A) : g(x) 6= f1 (x)}) 

para todos os quatro vetores n = u + in h(A)v, n = 0, . . . , 3 e para os quatro vetores n = u + in v,


n = 0, . . . , 3. Fixada f1 , e evocando o Corolario 26.14, escolhamos f2 C((A)) tal que
n , A ({x (A) : h(x) 6= f2 (x)}) 
para todos os quatro vetores n = f1 (A) u + in v, n = 0, . . . , 3 e para os quatro vetores n = u + in v,
n = 0, . . . , 3.
Com essas escolhas valem, como em (26.112)
Z
|f1 g| dn , A 2kgk 
(A)

para todos os quatro vetores n = u + in h(A)v, n = 0, . . . , 3 e, portanto, como em (26.114),


|Sg (u, h(A)v) Sf1 (u, h(A)v)| 8kgk  .
Analogamente,

(A)

(26.117)

|f2 h| dn , A 2khk 

para todos os quatro vetores n = f1 (A) u + in v, n = 0, . . . , 3. e, portanto, como em (26.114),


|Sh (f1 (A) u, v) Sf2 (f1 (A) u, v)| 8khk  .

(26.118)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1232/1304

Como
n
o n
o[n
o
x (A) : g(x)h(x) 6= f1 (x)f2 (x) x (A) : g(x) 6= f1 (x)
x (A) : h(x) 6= f2 (x)

(justifique!), segue tambem que

n , A



x (A) : g(x)h(x) 6= f1 (x)f2 (x)


n , A



x (A) : g(x) 6= f1 (x)

+ n , A



x (A) : h(x) 6= f2 (x)

para todos os quatro vetores n = u + in v, n = 0, . . . , 3. Isso implica, como em (26.112),


Z
|f1 f2 gh| dn , A 4kghk 

2

(A)

para todos os quatro vetores n = u + in v, n = 0, . . . , 3 e, portanto, como em (26.114),


|Sgh (u, v) Sf1 f2 (u, v)| 16kgk  .

(26.119)

Teremos, fazendo uso de (26.117), (26.118) e (26.119),


|hu, (gh)(A)vi hu, g(A)h(A)vi|

|Sgh (u, v) Sg (u, h(A)v)|

|Sgh (u, v) Sf1 (u, h(A)v) Sg (u, h(A)v) + Sf1 (u, h(A)v)|

|Sgh (u, v) Sf1 (u, h(A)v)| + |Sg (u, h(A)v) Sf1 (u, h(A)v)|

(26.117)

|Sgh (u, v) Sf1 (u, h(A)v)| + 8kgk 

|Sgh (u, v) hu, f1 (A)h(A)vi| + 8kgk

|Sgh (u, v) hf1 (A) u, h(A)vi| + 8kgk 

|Sgh (u, v) Sh (f1 (A) u, v)| + 8kgk 

|Sgh (u, v) Sf2 (f1 (A) u, v)


Sh (f1 (A) u, v) + Sf2 (f1 (A) u, v)| + 8kgk

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1233/1304

|Sgh (u, v) Sf2 (f1 (A) u, v)|


+ |Sh (f1 (A) u, v) Sf2 (f1 (A) u, v)| + 8kgk 

(26.118)

|Sgh (u, v) Sf2 (f1 (A) u, v)| + 8(khk + kgk )

|Sgh (u, v) hf1 (A) u, f2 (A)vi| + 8(khk + kgk )

|Sgh (u, v) hu, f1 (A)f2 (A)vi| + 8(khk + kgk)

|Sgh (u, v) hu, (f1 f2 )(A)vi| + 8(khk + kgk )

|Sgh (u, v) Sf1 f2 (u, v)| + 8(khk + kgk )

(26.119)

16kghk  + 8(khk + kgk)

8(2kghk + khk + kgk) .

Como  e arbitrario, conclumos que hu, (gh)(A)vi = hu, g(A)h(A)vi para todos u, v H, o que im
(h),

plica (gh)(A) = g(A)h(A), ou seja, (gh)


= (g)
estabelecendo a propriedade de homomorfismo.
= (g)

segue das seguintes linhas auto-explicativas:


Provar que (g)
3

1X n
i
hv, g(A) ui = hu, g(A)vi = Sg (u, v) =
4 n=0

gdn , A
(A)

1X n
=
i h(u + in v), g(A)(u + in v)i = hv, g(A)ui ,
4 n=0
sendo que a u
ltima igualdade e demonstrada explicitamente, expandindo-se o produto escalar na soma.
= (g).

Isso estabeleceu que g(A) = g(A), ou seja, (g)

Prova do item 2. Se g e Boreliana limitada e positiva entao g tambem o e (vide Proposicao 23.13,

g g) = (
g)(
g), que e um operador positivo, pois (
g) =
pagina 1053). Com isso, (g)
= (


g) , ja que g e real.
g = (
Prova do item 3. Sejam g Bl ((A)) e gn Bl ((A)), n

tais que lim gn (x) = g(x) para todo


n

x (A) mas tais que existe M > 0 para o qual kgn k < M para todo n


. Fixemos H.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1234/1304

Tem-se que
k(gn (A) g(A))k2 = h, (gn (A) g(A)) (gn (A) g(A))i
Z
=
|gn g|2 d, A
(A)

kgn gk

(M + kgk )

(A)

|gn g| d, A

(A)

|gn g| d, A .

Neste ponto evocamos


Z o Teorema da Convergencia Dominada, Teorema 23.6 da pagina 1037, o qual
garante46 que lim
|gn g| d, A = 0. Assim, lim k(gn (A) g(A))k = 0 para cada H, o
n

(A)

que significa que gn (A) g(A) na topologia forte.

Prova do item 4. Seja H e um autovetor


de A com autovalor 0 . Adotemos kk = 1 e consideremos
R
a medida , A tal que h, f (A)i = (A) f d, A para f contnua (vide (26.109)). Pelo Teorema 26.32,
f (A) = f (0 ). Logo, por (26.112),
Z
f d, A = f (0 )
(26.120)
(A)

para toda funcao f C((A)).

Vamos provar que , A ({0 }) e nao-nula. Seja G um aberto contendo o conjunto fechado {0 }.
Entao, F = (A) \ G e fechado. Pelo Lema de Urysohn47 existe uma funcao fu C((A)) satisfazendo
0 fu (x) 1 para todo x (A) e tal que fu (0 ) = 1 e fu (x) = 0 para todo x F . Assim, fu pode
R
(26.120)
ser nao-nula apenas no aberto G. Logo, como (A) fu d, A = fu (0 ) = 1, vale
Z
Z
0fu 1
1 =
fu d, A =
fu d, A , A (G) .
(26.121)
(A)

Pela regularidade da medida , A (propriedade (26.107), pagina 1226), vale


, A ({0 }) = inf{, A (G), {0 } G, G aberto}

(26.121)

1.

(26.122)

Evocando o Teorema de Lusin, Teorema 26.34, existe para todo  > 0 uma funcao f  C((A)) tal
que
vimos (vide (26.112)), isso implica
R , A ({x (A) : g(x) 6= f (x)}) R e kf k kgk Como





(A) (g f ) d, A < 2kgk , ou seja, (A) g d, A f (0 ) < 2kgk  e, portanto,
Z
g d, A = lim f (0 ) .
(A)

46

0

Cada gn e dominada pela funca


o constante M , a qual claramente pertence a L1 ((A), d, A ).
Pavel Samuilovich Urysohn (1898-1924). Urysohn morreu tragicamente, afogado na costa da Bretanha. A demonstraca
o do Lema de Urysohn pode ser encontrada em qualquer bom livro de topologia.
47

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1235/1304

Vamos mostrar que lim0 f (0 ) = g(0 ). Se assim nao fosse, teramos f (0 ) 6= g(0 ) para
todo  pequeno o suficiente, ou seja, para tais s valeria 0 {x (A) : g(x) 6= f (x)}. Logo,
, A ({0 }) , A ({x (A) : g(x) 6= f (x)}) < , o que implica , A ({0 }) = 0, contrariando
(26.122)48 . Com isso, estabelecemos que
Z
g d, A = g(0 )
(26.123)
(A)

para toda funcao Boreliana limitada g. Em particular,


se B (A) e um conjunto Boreliano e B
R
e sua funcao caracterstica, entao , A (B) = (A) B d, A = B (0 ). Isso esta dizendo-nos que
, A = {0 } , a medida de Dirac centrada em 0 (vide pagina 942).
Para completar a prova que g(A) = g(0 ) para toda g Bl ((A)), notamos que
k(g(A) g(0 ) )k2 = h, (g(A) g(0 ) ) (g(A) g(0 ) ) i
=

(A)

|g g(0 )|2 d, A

(26.123)

|g(0 ) g(0 )|2 = 0 ,

provando que g(A) = g(0 ).


1
Se nao pertence ao fecho da imagem de (A) por g entao r := (g)
e Boreliana e limitada

(g
) = (g
)(r)

e, portanto, (r)
esta bem definida e vale (r)
= , pelas propriedades

de homomorfismo, provando que (g) e bijetora com inversa limitada e que, portanto,

((g)),
o conjunto resolvente de (g).
Isso estabeleceu que o complemento do fecho da imagem de g,

\ {g(), (A)}, e um subconjunto de ((g)).


Logo, ((g))
{g(), (A)}.

Com isso a demonstracao do Teorema 26.35 esta completa.

Uma das conseq


uencias mais importantes da extensao de a reside no fato que agora podemos
B ) = B (A), onde B e a funcao caracterstica de um conjunto Boreliano
definir operadores como (
B de (A). Como veremos, podemos com o uso de tais operadores generalizar o Teorema Espectral
para operadores auto-adjuntos limitados, um fato de importancia fundamental, inclusive para a Fsica
Quantica. Para tratar disso devemos primeiro discutir a nocao geral de medidas com valores em
projecoes ortogonais (mvpos).

26.7.3

Medidas com Valores em Proje


co
es Ortogonais

Defini
c
ao. Seja K um conjunto compacto (i.e., fechado e limitado) de , doravante fixo. Vamos
denotar por B(K) a colecao de todos os conjuntos Borelianos de K. Uma associacao E K E :
B(K) B(H) que a cada conjunto Boreliano B B(K) associa um operador limitado EB e dita ser
uma medida com valores em projeco
es ortogonais (mvpo) se as seguintes condicoes forem satisfeitas.


1. Cada EB e um projetor ortogonal, ou seja, EB2 = EB e EB = EB .


48

Esse argumento casualmente prova que f (0 ) = g(0 ) para todo  pequeno o suficiente, um resultado intuitivamente
esperado, j
a que , A ({0 }) 6= 0

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1236/1304

2. E = 0 e EK = .
3. EB1 EB2 = EB1 B2 para todos B1 , B2 B(K).
4. Para toda colecao contavel Bn , n
k 6= l, tem-se

, de Borelianos em K satisfazendo Bk Bl = sempre que




Bn

= slim
N

N
X

EBn ,

n=1

onde slim e o limite na topologia forte, ou seja, para todo H vale


E

Bn

= lim

N
X

EBn .

n=1

A relevancia dessa definicao ficara clara com o Teorema 26.37, adiante. Notemos por ora que para cada
H com 6= 0 podemos definir, para todo B B(K),
, E (B) := h, EB i .

(26.124)

O ndice E servira para lembrar a dependencia de da medida com valores em projecoes ortogonais
{EB B(H), B K, B Boreliano}.

Teremos, , E () = h, E i = 0 e , E (B) 0 para todo B, pois h, EB i = h, EB EB i =


kEB k2 . Alem disso, O item 4 da definicao acima tem a seguinte conseq
uencia: se Bn , n , e uma
colecao contavel de Borelianos em K satisfazendo Bk Bl = sempre que k 6= l, entao


, E

Bn


= , E

Bn

, slim
N

N
X

EBn

n=1

= lim

N
X
n=1

h, EBn i = lim

N
X

, E (Bn ) .

n=1

Essas propriedades estao dizendo-nos que , E e uma medida positiva sobre a -algebra de Borel de
K. Se kk = 1, tem-se que , E (K) = h, EK i = kk2 = 1, e vemos nesse caso , E e uma medida
de probabilidade em K.
Se assim e, podemos construir uma integral (de Lebesgue) sobre a medida Boreliana R, E , tal como
desenvolvido no Captulo 23, pagina 997, e com a mesma teremos definidas as integrais gd, E para
toda g Boreliana e limitada. Como mostraremos, seguindo passos semelhantes, mas nao identicos, a`

construcao dos operadores (A)


g(A) feita acima (passos esses iniciados com aRProposicao 26.46 e
que culminaram com o Teorema 26.35), podemos construir
a partir das integrais gd, E operadores
R
limitados, que denotaremos por E (g) gE , tais que gd, E = h, gE i para todo H.

Construindo os operadores E (g) gE

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1237/1304

Nossa construcao dos operadores E (g) gE assemelha-se a`quela


R dos operadores (A) g(A) mas,
ao contrario daquele caso, nao podemos partir do pressuposto que f d, E = h, fE i para f C(K)
contnua, pois os operadores fE nao foram ainda definidos. Nossa estrategia sera inicialmente definir
tais operadores para as funcoes Borelianas simples de K e, a partir delas, definir os operadores g E para
g Boreliana e limitada.
Seja X um conjunto e Y X. Define-se a funca
o caracterstica de Y , denotada Y : X

1, se x Y
Y (x) =
.
0, se x 6 Y


por

P
Seja, s = m
cao simples Boreliana limitada definida em K, onde Bk B(K) e
k=1 k Bk uma fun
k , para todo k = 1, . . . , m. O conjunto de todas as fun
Pcoes simples Borelianas limitadas definida em

K sera denotado por Sl (K). Definimos E (s) sE := m


k=1 k EBk . E elementar constatar que
E (r + s) = E (r) + E (s) ,

E (rs) = E (r)E (s) ,


E (s) = E (s) ,

E (1) = E (K ) =

, (26.125)

para todas r, s Sl (K) e todos , . Como rs = sr, segue de que E (r)E (s) = E (r)E (s) para
todas r, s Sl (K). Assim, P
E : Sl (K) B(H) e um -homomorfismo. Observe-se que se s Sl (K) e
representado na forma s = m
ao o espectro de s e {1 , . . . , m }
k=1 k Bk (com os Bk s disjuntos) ent
e ksk coincide com max{|1 |, . . . , |m |} = supxK |s(x)| ksk .
Temos o seguinte analogo a` Proposicao 26.46, da pagina 1227:

Proposi
c
ao 26.47 Para cada g Bl (K), Boreliana e limitada, a aplicaca
o Sg : H H
por
Z
3
1 X n
Sg (u, v) :=
i
g dn , E
4 n=0
K

definida
(26.126)

onde n := u + in v, e uma aplicaca


o sesqui-linear e bicontnua em H, sendo que |S g (u, v)|
kgk kuk kvk para todos u, v H. Assim, pela Proposica
o 26.45, existe um operador limitado, que
denotaremos por E (g) gE , tal que
Sg (u, v) = hu, gE vi
para todos u, v H. Vale igualmente que
kgE k kgk .

(26.127)
2

Prova. Para cada funcao s Sl (K) da forma s =

Pm

k=1

k Bk tem-se pela identidade de polarizacao

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1238/1304

(2.23), pagina 126, que


3

Ss (u, v)

(26.124)

1 X n
i
4 n=0

sdn , E
K

m
X

1 X n
i
=
k
4
n=0
k=1

Bk dn , E
K

m
X

1 X n
i n , E (Bk )
k
4 n=0
k=1

m
X

k=1

1 X n
1 X n
i hn , EBk n i =
i hn , sE n i
4 n=0
4 n=0

1 X n
i h(u + in v), sE (u + in v)i
4 n=0

hu, sE vi ,

Isso mostra que Ss , com s Sl (K), e sesquilinear e e bicontnua pois, por Cauchy-Schwarz, vale
|hu, sE vi| ksE k kuk kvk ksk kuk kvk. Queremos agora provar que essas propriedades estendem-se
a`s formas Sg , com g Bl (K), e a ideia e explorar o fato que tais funcoes podem ser aproximadas por
funcoes simples. Mais especificamente, usaremos os seguintes fatos: pelo Lema 23.3, pagina 1022, e
pelo Corolario 23.2, se g Bl (K), existe uma seq
uencia sn Sl (K) tal que limn sn (x) = g(x) para
todo x K. Podemos escolhe-la de forma que supxK |sn (x)| supxK |g(x)| para todo n. Agora,
pelo Teorema da Converg
R encia Dominada, Teorema 23.6, pagina 1037, segue do fato de a propria g ser
integravel que limn K |sn g|d = 0. Se e uma
R soma finita de medidas, = 1 + + l , segue
disso que para todo  > 0 existe s Sl (K) tal que K |s g|dk <  para todo k = 1, . . . , l e de modo
que supxK |s(x)| supxK |g(x)|.

Disso extramos essencialmente a mesma conseq


uencia que em (26.114): para cada u, v H,
g Bl (K) e  > 0 podemos encontrar s Sl (K) tal que |Sg (u, v) Ss (u, v)| . Como em (26.115),
isso implica, |Sg (u, v)| = |Sg (u, v) Ss (u, v) + Ss (u, v)| |Sg (u, v) Ss (u, v)| + |Ss (u, v)|
 + ksE k kuk kvk e como ksE k ksk kgk temos tambem |Sg (u, v)| kgkkuk kvk para todo
u, v H.

Tendo provado que Sg e sesquilinear e bicontnua, conclumos novamente pela Proposicao 26.45,
que existe um operador limitado E (g) gE , tal que Sg (u, v) = hu, gE vi para todos u, v H com
kgE k kgk.
Sobre E (g) : Bl (K) B(H) vale o seguinte:

Teorema 26.36 (C
alculo Funcional Boreliano (vers
ao para mvpos)) Seja H um espaco de Hilbert, K compacto e E : B(K) B(H) uma medida com valores em projeco
es ortogonais e seja
E : Bl (K) B(H) definida acima. Ent
ao, kE (g)kH kgk para toda g Bl (K). Fora isso, valem
as seguintes afirmaco
es:


JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1239/1304

1. A aplicaca
o E e um -homomorfismo algebrico, ou seja,
E (g + h) = E (g) + E (h) ,

E (gh) = E (g)E(h) ,
E (g) = E (g) ,

E (1) =

, (26.128)

para todas g, h Bl (K) e todos , . Como gh = hg, segue de (26.128) que E (g)E(h) =
E (h)E (g) para todas g, h Bl (K).
2. Se g 0 tem-se tambem E (g) 0.
3. Sejam g Bl (K) e gn Bl (K), n

, tais que lim gn (x) = g(x) para todo x K mas tais


n

ao, E (gn ) converge a E (g) na


que existe M > 0 para o qual kgn k < M para todo n . Ent
topologia forte, ou seja, para todo H a seq
uencia E (gn ) converge a E (g).
2


Prova. As demonstracoes dos itens 1 e 2 repetem os mesmos passos das demonstracoes respectivas
do Teorema 26.35, apenas com a diferenca que as funcoes Borelianas nao sao aqui aproximadas por
funcoes contnuas, mas por funcoes simples.
Integra
c
ao sobre uma medida com valores em proje
co
es ortogonais
Por analogia a` definicao de integral sobre medidas, vamos escrever
Z
Z
E (g) gE
g() dE
g() dE ,
K

R
para denotar o operador obtido na Proposicao 26.47 tal que h, gE i = gd, E para todo H
com kk = 1. Com essa notacao, podemos tambem formalmente escrever
Z
Z
h, gE i
g() h, dE i
g() dh, E i
e entender dh, E i como uma nova notacao para d, E .
O fato de E ser um -homomorfismo entre as algebras Bl (K) e B(H) (Teorema 26.36, pagina 1238)
expressa-se na nova notacao da seguinte forma, que nada mais e que a (26.128):
Z 
Z
Z

g() + h() dE =
g() dE +
h() dE ,
(26.129)
K

(gh)() dE =
K

Z

g() dE
K

K () dE

Z

g() dE
K

 Z

h() dE
K

g() dE ,

(26.130)

(26.131)

1 dE

dE =
K

(26.132)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1240/1304

validas para todas g, h Bl (K) e todos , .

De particular importancia e o operador obtido do monomio f () = . Vamos denota-lo por A E :


Z
AE :=
dE .

Mostraremos que a cada operador A limitado auto-adjunto existe uma u


nica medida E com valores
em projecoes ortogonais com a propriedade que AE = A.

26.7.4

Os Projetores Espectrais e o Teorema Espectral

Seja B (A) um conjunto Boreliano. Entao B Bl ((A)). A introducao dos operadores (g)
=

g(A) para g Boreliana e limitada permite-nos definir os operadores limitados PB := (B(A) )


B (A), denominados projetores espectrais do operador auto-adjunto A. Suas propriedades basicas estao
coletadas no seguinte teorema:
Teorema 26.37 Seja A um operador auto-adjunto agindo em um espaco de Hilbert H. Ent
ao a
associaca
o P : B((A)) B(H) que a cada Boreliano de (A) associa um operador limitado dada por
B ) B (A) B(H) e uma medida com valores em projeco
B((A)) 3 B 7 PB := (
es ortogonais,
mais especificamente, tem-se
1. Cada PB e um projetor ortogonal, ou seja, PB2 = PB e PB = PB .
2. P = 0 e P(A) = .
3. PB1 PB2 = PB1 B2 para todos B1 , B2 (A) Borelianos.
4. Se Bn , n , e uma coleca
o cont
avel de Borelianos em (A) satisfazendo B k Bl = sempre
que k 6= l, ent
ao
N
X
S
PB n ,
P Bn = slim


n=1

onde slim e o limite na topologia forte, ou seja, para todo H vale


P

5. Se H, vale

Bn

= lim

N
X

PB n .

n=1

, A (B) = h, PB i ,

(26.133)

para todo B B((A)).


Os projetores PB com B B((A)) s
ao denominados projetores espectrais do operador A.

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1241/1304

Prova do Teorema 26.37.


Prova do item 1. Como 2B = B e B = B , o item 1 segue do item 1 do Teorema 26.35.
) = 0. Fora isso, (A) coincide em (A) com o polinomio
Prova do item 2. = 0 e, da, P = (
(A) ) = (1)
= .
constante igual a 1. Logo, pelo enunciado Teorema 26.35, tem-se P(A) = (
item 1 do Teorema
Prova do item 3. B1 B2 = B1 B2 . Logo, pela propriedade de homomorfismo de ,

26.35, vale PB1 PB2 = (B1 )(B2 ) = (B1 B2 ) = PB1 B2 .


P
Prova do item 4. A seq
uencia de funcoes Borelianas gN = N
n=1 Bn satisfaz kgN k = 1 para todo N ,

pois os Bn sao disjuntos e, portanto, cada ponto x (A) pode estar no maximo em um dos Bn s. E
tambem claro que para cada x (A)

Bn (x)

= lim

N
X

Bn (x) = lim gN (x) .


N

n=1

Portanto, pelo item 3 do Teorema 26.35, segue que




Bn

= slim
N

N
X

B n

n=1

= slim
N

N
X

(Bn ) ,

n=1

ou seja,
P

Bn

= slim
N

Prova do item 5. A prova e elementar, pois , A (B) =

N
X

PB n .

n=1

(A)

B d, A = h, B (A)i h, PB i.

evidente agora que , P = , A , pelo menos quando essas medidas estao restritas a` -algebra de
E
Borel de (A). Com o uso da notacao introduzida acima, teremos
Z
g(A) =
g() dP
(26.134)
(A)

para toda g Bl ((A)) e, em particular, podemos escrever o proprio operador auto-adjunto A na


forma
Z
A =
dP .
(26.135)
(A)

JCABarata. Curso de Fsica-Matem


atica

As relacoes (26.129)-(26.132) ficam


Z
Z


g() + h() dP =
(A)

(gh)() dP =
(A)

Z
Z

g() dP
(A)

(A)

(A) () dP

Captulo 26

Vers
ao de 29 de setembro de 2005.

Z
Z

g() dP +
(A)

g() dP
(A)

 Z

1242/1304

h() dP ,

(26.136)

(A)

h() dP
(A)

(26.137)

g() dP ,

(26.138)

(A)

(A)

1 dP

dP =

(26.139)

(A)

validas para todas g, h Bl ((A)) e todos , .


Unicidade dos projetores espectrais
Se tivermos uma outra medida E com valores em projecoes ortogonais tal que A E = A, sera essa
medida
identica
R fato, se A =
R a` medida dos projetores espectrais P definida acima? A Rresposta e sim! De
R
dP = (A) dE vale para todo polinomio p a relacao p(A) = (A) p() dP = (A) p() dE
(A)
(para isso, use (26.129)-(26.130) e (26.136)-(26.137)). Assim, para todo H e todo polinomio p,
vale
 Z
 
 Z
 
Z
Z
,
p() dP = ,
p() dE , ou seja,
p() d, A =
p() d, E .
(A)

(A)

(A)

(A)

Pelo Teorema de Weierstrass, conclumos disso que (A) f d, A = (A) f d, E para toda funcao
contnua f C((A)).
Usando novamente
o Teorema de Lusin, Teorema 26.34, e o Corolario 26.14,
R
R
obtem-se da que (A) g d, A = (A) g d, E para toda funcao Boreliana limitada g Bl ((A)). Em
R
R
particular, para um conjunto Boreliano B (A), arbitrario, tem-se (A) B d, A = (A) B d, E ,
ou seja, , A (B) = , E (B). Isso, por sua vez afirma, por (26.124) e por (26.133), que h, PB i =
h, EB i para todo H, o que, pela identidade de polarizacao (expressao (2.23), pagina 126) implica
PB = EB . Como B e arbitrario, isso significa que as medidas com valores em projetores ortogonais P
e E coincidem, caso A = AE .
O Teorema Espectral para operadores auto-adjuntos limitados
Chegamos assim ao seguinte:
Teorema 26.38 (Teorema Espectral) Seja H um espaco de Hilbert e seja A B(H) auto-adjunto.
Ent
ao existe uma u
nica medida com valores em projeco
es ortogonais P : B((A)) B(H), a saber,
B ) B (A) B(H), tal que,
aquela estabelecida no Teorema 26.37, com B((A)) 3 B 7 PB := (
com a notaca
o acima,
Z
A =

dP .

(A)

(26.140)

JCABarata. Curso de Fsica-Matem


atica

Tem-se, tambem de modo u


nico,
g(A) =

Vers
ao de 29 de setembro de 2005.

Captulo 26

1243/1304

g() dP .
(A)

para toda g Bl ((A)) e de sorte que as relaco


es (26.136)-(26.139) s
ao v
alidas para todas g, h
Bl ((A)) e todos , .
2
A expressao (26.140) e denominada representaca
o espectral, ou decomposica
o espectral do operador
auto-adjunto limitado A. O Teorema Espectral e de importancia fundamental para a Fsica Quantica,
mas antes de discutirmos isso na Secao 26.7.5, facamos alguns comentarios de natureza notacional.
A nota
c
ao de Dirac
Na Fsica Quantica, encontra-se para as expressoes (26.134)-(26.135) a notacao, dita notaca
o de
Dirac49 ,
Z
Z
A =
d|ih| ,
g(A) =
g() d|ih| ,
(A)

(A)

ou seja, nela identificamos dP d|ih|. Assim, na notacao de Dirac (26.136)-(26.139) ficam


Z
Z
Z


g() + h() d|ih| =
g() d|ih| +
h() d|ih| ,
(A)

(A)

(gh)() d|ih| =
(A)

Z
Z

g() d|ih|
(A)

(A)

(A) () d|ih|

Z

(A)

g() d|ih|
(A)

 Z

h() d|ih|
(A)

g() d|ih| ,
(A)

(A)

1 d|ih|

d|ih| =

(A)

validas para todas g, h Bl ((A)) e todos , .

Advertimos o leitor que, ao contrario do que e lamentavelmente sugerido em muitos livros-texto de


Mecanica Quantica, nao e sempre legtimo interpretar o smbolo |ih| como um projetor sobre um
autovetor |i, pois nem todo (A) e um autovalor de A e |i nao necessariamente designa um
legtimo vetor de H. A notacao de Dirac e apenas isso: uma notacao. Mais especificamente, e uma
notacao para representar os fatos descritos no Teorema Espectral, Teorema 26.38.
Ha uma pequena literatura matematica que pretende atender ao interesse de alguns fsicos no sentido
de atribuir um status extra-notacional a`s manipulacoes formais envolvendo os smbolos bra h| e ket
|i, atraves dos chamados rigged Hilbert spaces50 . Citemos aqui [103]: We must emphasize that
49

Paul Adrien Maurice Dirac (1902-1984).


Vide, e.g., os trabalhos de John Roberts The Dirac Bra and Ket Formalism, J. Math. Phys. 7, 1097-1104 (1966)
e Rigged Hilbert Spaces in Quantum Mechanics, Commun. Math. Phys. 3, 98-119 (1966). O pr
oprio Roberts n
ao mais
valoriza esse tipo de abordagem.
50

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1244/1304

we regard the spectral theorem as sufficient for any argument where a nonrigorous approach might rely
on the Dirac notation; thus, we only recommend the abstract rigged space approach to readers with a
strong emotional attachment to the Dirac formalism.

26.7.5

A Relev
ancia do Teorema Espectral para a Fsica Qu
antica (um
pouco de Fsica, finalmente)

O Teorema Espectral e distribui


co
es de probabilidade no espectro
Se H e um vetor nao-nulo do espaco de Hilbert H e g : Bl ((A)) e uma funcao Boreliana
limitada definida no espectro de um operador auto-adjunto e limitado A, sabemos pelas consideracoes
acima que
Z
Z
h, g(A)i =

g d, A =

(A)

g() dh, P i .

(A)

A medida , A e uma medida positiva em (A) e se kk = 1 sabemos tambem que


Z
Z
d, A =
dh, P i = 1 .
(A)

(A)

Esses dois fatos estao dizendo-nos que , A e uma medida de probabilidade em (A). Esse simples fato
matematico tem uma conseq
uencia significativa no contexto da Fsica Quantica, o qual esta na raiz da
axiomatizacao e formalizacao da mesma em termos de espacos de Hilbert e de operadores agindo em
espacos de Hilbert. Para melhor compreendermos esse fato, facamos algumas consideracoes gerais.
Algumas considera
co
es gerais sobre teorias fsicas
A Fsica compoe-se de varias teorias, relacionadas entre si de diversas formas e que em maior ou
menor grau de aproximacao descrevem o mundo observavel. Podemos listar a Mecanica Classica, a
Termodinamica, a Mecanica Quantica, a Teoria Quantica de Campos Relativista, a Teoria da Relatividade Geral e a Mecanica Estatstica. Essas diversas teorias possuem, porem, uma serie de ingredientes
em comum. Qualquer teoria fsica deve saber especificar:
As grandezas fsicas observaveis e sua descricao matematica, a relacoes entre esses observaveis,
tais como relacoes de compatibilidade, relacoes algebricas etc.
O conjunto de valores que podem surgir de medidas individuais de observaveis.
A associacao entre sistemas fsicos, os observaveis e as distribuicoes de probabilidade que descrevem medidas desses observaveis nos estados.
O conjunto dos estados puros.
A dinamica dos observaveis e dos estados.
As simetrias dos sistemas fsicos descritos e suas implementacoes em estados e observaveis.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1245/1304

Vamos tentar discutir melhor alguns dos pontos acima.


Observ
aveis e Distribui
co
es de Probabilidade
Cada teoria fsica possui seu proprio conjunto de grandezas observaveis e um de seus objetivos principais e descrever o resultado de medidas desses observaveis em sistemas fsicos. Seja A uma grandeza
fsica observavel e C(A) o conjunto de valores possveis resultantes de medicoes de A (em qualquer
um fato experimental que medidas repetidas de um observavel A, mantidas as mesmas
estado). E
condicoes, ou seja, no mesmo estado fsico E do sistema estudado, nao fornecem necessariamente o
mesmo valor em C(A), tendo um carater aleatorio.
um fato observacional que uma sucessao idealmente infinita de medidas experimentais de A, todas
E
sob as mesmas condico
es fsicas do sistema em quest
ao, devera produzir uma distribuicao estatstica
em C(A) definida por uma medida de probabilidade. Denominemos genericamente essas condicoes
fsicas por E (que pode concretamente representar um conjunto de parametros fsicos do sistema) e
por E, A a medida de probabilidade em questao. Essa medida de probabilidade E, A e uma funcao
tanto do conjunto de condicoes E que especifica o sistema quanto do observavel A considerado. Essa
medida de probabilidade E, A e denominada estado (ou estado fsico) do sistema em questao em relacao
ao observavel A. Como toda informacao sobre as propriedades do sistema fsico no que concerne ao
observavel A deve ser resultante da analise estatstica das medicoes experimentais de A no sistema,
conclumos que a medida de probabilidade E, A , ou seja, o estado fsico do sistema, contem em si toda
informacao disponvel sobre essas propriedades.
Aqui encontra-se embutido um princpio fsico (filosofico, se quiserem) que apenas a realidade objetiva proveniente da experimentacao permite inferencias sobre um sistema fsico, e essa realidade
manifesta-se na forma distribuicoes estatsticas nos conjuntos C(A) para os varios observaveis A com
os quais estudamos o sistema. Em outras palavras, a realidade de um sistema fsico s
o e alcancada com
base em experimentaca
o e as inferencias sobre o mesmo devem ser inferencias estatsticas com base nos
somente com base nessas inferencias que se pode determinar padroes gerais (se
dados experimentais. E
houver) que conduzam a` elaboracao de leis fsicas e teorias para explica-las com base em princpios mais
simples (postulados fsicos) e inferencia matematica. Permitam-nos um comentario historico-filosofico.
uma crenca geral dos fsicos, expressa pela primeira vez por Galilei5152 no seculos XVI-XVII, mas
E
com razes mais profundas, que a formulacao de teorias fsicas com base em ideias matematicas, uma
construcao da mente humana, seja possvel. Que tal tenha seja verdade, o que e corroborado pela
historia da Fsica ate agora, e talvez o maior enigma de toda a Ciencia.
Ha tres possveis origens para a aleatoriedade, que mencionamos acima, observada na medicao de
um observavel em um sistema fsico, origens essas que podem ocorrer concomitantemente: ela pode ser
51
Galileo Galilei (1564-1642). O livro da natureza n
ao pode ser lido ate aprendermos sua linguagem e nos tornarmos
familiares com os smbolos no qual est
a escrito. E ele est
a escrito em linguagem matem
atica, e suas letras s
ao tri
angulos,
crculos e outras figuras geometricas, sem as quais e humanamente impossvel compreender uma u
nica palavra e h
a
apenas um vagar perdido em um labirinto escuro. Il Saggiatore, 1623. Aos tri
angulos e crculos acrescentaramos
modernamente equaco
es diferenciais, medidas de probabilidade, operadores em espacos de Hilbert e a
lgebras C .
52
O original de Galilei e La filosofia `e scritta in questo grandissimo libro che continuamente ci sta aperto innanzi a
gli occhi (io dico luniverso), ma non si pu`
o intendere se prima non simpara a intender la lingua, e conoscer i caratteri,
ne quali `e scritto. Egli `e scritto in lingua matematica, e i caratteri sono triangoli, cerchi, ed altre figure geometriche,
senza i quali mezi `e impossibile a intenderne umanamente parola; senza questi `e un aggirarsi vanamente per unoscuro
laberinto.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1246/1304

proveniente de erros experimentais de medicao, pode ser proveniente de um conhecimento incompleto


do sistema estudado, ou pode ser intrnseca do sistema descrito, fato identificado pela primeira vez na
Fsica Atomica.
Normalmente, na elaboracao de teorias fsicas, considera-se a situacao ideal na qual imprecisoes
experimentais sao negligenciadas. Ainda assim restam as duas outras fontes de aleatoriedade, as quais
entao devem ser devidamente consideradas no arcabouco teorico. Mais adiante lembraremos como isso
e feito em alguns casos.
O fato que queremos enfatizar e que teorias fsicas devem ser capazes de associar a cada estado
fsico de um sistema e a cada observavel uma distribuica
o de probabilidades que descreve uma sucessao
de medicoes daquele observavel naquele estado. Note-se que isso nao exclui teorias deterministas, como
a Mecanica Classica, pois situacoes determinsticas tambem podem ser descritas por distribuicoes de
probabilidade, tais como distribuicoes delta de Dirac.
Vari
ancias e estados puros
No processo de analise estatstica dos resultados de medicoes de um observavel A de um sistema
fsico em um determinado estado varias grandezas desempenham um papel. Uma delas e o chamado
valor medio das medidas de A nessa distribuicao, ou seja, sua esperanca ou valor esperado, que sera
um
denotado aqui por por hAiE . Outras grandezas relevantes sao os momenta hAn iE , n . E
fato matematico bem conhecido (conseq
uencia do Teorema de Weierstrass, alias) que se C(A) for um
conjunto compacto, entao a medida de probabilidade E, A pode ser recuperada a partir do conjunto
de momenta hAn iE , n . 53


Outra grandeza estocastica importante e a chamada vari


ancia, dada por Var E (A) := hA2 iE hAi2E =
h(A hAiE )2 iE 0, que fornece uma indicacao qualitativa do quanto os valores das medicoes de A
afastam-se de seu valor medio. Na Teoria de Probabilidades, o valor esperado (ou esperanca) de
uma funcao mensuravel (variavel aleatoria) A definida em um espaco amostral e sua variancia em
relacao a uma medida de probabilidade em sao dadas por
Z
Z
A d ,
Var (A) :=
(A hAi )2 d ,
(A) hAi :=

respectivamente.
Apesar de nao ser a u
nica grandeza estocastica que fornece esse tipo de informacao qualitativa, a
variancia e uma grandeza u
til. Na Mecanica Quantica, por exemplo, o celebre princpio de incerteza
54
de Heisenberg e uma afirmacao sobre a variancia de dois observaveis (momento e posicao em uma
mesma direcao cartesiana): Var(px ) Var(x) ~2 /4.

Na teoria de probabilidades, uma medida de probabilidades em um espaco amostral e dita ser pura
se nao puder ser escrita como combinacao linear convexa de duas outras medidas de probabilidades
do mesmo espaco amostral, ou seja, se nao puder ser escrita na forma = 1 + (1 )2 onde 1
53

Da a import
ancia de considerarmos observ
aveis A que sejam limitados, ou seja, para os quais C(A) seja compacto.
Como discutiremos, na Fsica Qu
antica C(A) e identificado com (A), o espectro de um operador auto-adjunto A. (A)
e compacto (fechado e limitado) se A for um operador auto-adjunto e limitado. Na chamada formulaca
o algebrica das
Teorias Qu
anticas de Campos, todo o tratamento e feito considerando-se observ
aveis que sejam operadores auto-adjuntos
e limitados, em espacos de Hilbert ou de a
lgebras C . Vide [51] ou [3].
54
Werner Karl Heisenberg (1901-1976).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1247/1304

um exerccio facil mostrar que se


e 1 e 2 sao tambem medidas de probabilidade e 0 < < 1. E
= 1 + (1 )2 , entao
hAi = hAi1 + (1 )hAi2
e

Var (A) = Var1 (A) + (1 )Var2 (A) + (1 ) hAi1 hAi2


Disso conclumos que

i2

Var (A) Var1 (A) + (1 )Var2 (A) min{Var1 (A) , Var2 (A)}.
Assim, a variancia Var (A) na medida nao-pura e sempre maior ou igual a` menor das duas variancias
Var1 (A) ou Var2 (A). Entendemos, dessa forma, que se restringirmos as medidas a um certo conjunto
de medidas M sobre o espaco amostral, entao os menores valores possveis das variancias Var (A) de
uma funcao A fixa sao alcancadas quando encontra-se no sub-conjunto das medidas de probabilidades
puras de M. Nesse sentido, as medidas de probabilidade puras representam aquelas com o menor desvio
possvel da grandeza representada por A do seu valor medio.
Dizemos que um sistema fsico esta em um estado puro para um determinado observavel A se E, A for
pura. Os estados puros de um sistema fsico representam, assim, aqueles com menores flutuacoes da
grandeza observavel A. Compreendemos, assim, que determinar quais os estados puros de um sistema
fsico e quais as variancias de observaveis nesses estados puros fornece uma importante informacao
sobre as menores flutuacoes possveis que podem ser observadas nesse sistema. Essa e uma importante
informacao sobre o grau de aleatoriedade intrnseca (ou seja, nao proveniente de erros experimentais
ou de conhecimento incompleto) da teoria fsica subjacente que descreve o sistema em questao.
Como discutiremos a` pagina 1252, uma outra razao da importancia dos estados puros reside no fato
que tanto na Mecanica Classica quanto na Mecanica Quantica vale a afirmacao que o conhecimento dos
valores esperados de um observavel em todos os estados puros de um sistema determina univocamente
esse observavel.
O modelo da Mec
anica Cl
assica
Na Mecanica Classica todos os processos experimentais basicos de medida envolvem medidas de
posicao e velocidade, as quais podem ser efetuadas simultanea e independentemente, de modo que, em
princpio, quaisquer funcoes envolvendo as coordenadas e os momenta de um sistema sao grandezas
possvel constituir novos observaveis procedendo operacoes algebricas simples com
fsicas observaveis. E
portanto, conveniente considerar
outros observaveis, tais como combinacoes lineares, produtos etc. E,
a algebra de todas as funcoes definidas no espaco de fase do sistema considerado como constituindo
a colecao de todas as grandezas fsicas observaveis desse sistema. Como o resultado de uma medida
fsica e sempre um n
umero real as grandezas fsicas observaveis devem ser funcoes do espaco de fase
em n
umeros reais . Por razoes tecnicas e conveniente tomar apenas a algebra das funcoes definidas
no espaco de fase que sejam mensur
aveis em relacao a` medida de Liouville 55 dqdp, evitando assim
patologias matematicas.


Uma caracterstica importante de sistemas classicos e a possibilidade de medicao simultanea e independente de quaisquer observaveis distintos. Tal caracterstica e denominada compatibilidade de
55

Joseph Liouville (1809-1882).

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1248/1304

observaveis. Uma conseq


uencia da compatibilidade dos observaveis classicos, a qual acabou implicitamente embutida nas observacoes acima, e que os mesmos formam uma algebra comutativa.
Dado um observavel assim abstratamente definido como sendo uma funcao f (q, p) podemos nos
perguntar que valores obteremos ao fazer uma medida desse observavel em um certo instante de tempo?
A resposta e um tanto decepcionantemente obvia: se as coordenadas do sistema considerado forem
naquele instante de tempo q0 e seus momenta p0 , entao o valor medido de f sera f (q0 , p0 ). A colecao
C(f ) de todos os possveis de resultados de medidas de f e, portanto, a imagem de f como funcao de
em .


Na Mecanica Classica os estados fsicos sao descritos por distribuicoes de probabilidade no espaco
de fase, de modo que valores medios de um observavel f sao dados por
Z
f (q, p) (q, p) dqdp ,
(26.141)
hf i =
R
com (q, p) 0 e (q, p) dqdp = 1. Nesse sentido podemos identificar a funcao (ou medida) com
o proprio estado do sistema, pois dela obtem-se univocamente as distribuicoes de probabilidade nos
conjuntos C(f ), que identificamos com a imagem das funcoes f : .


Distribuicoes tipo medida delta de Dirac q0 , p0 (q, p) = (q q0 )(p p0 ) com


Z
hf iq0 , p0 =
f (q, p)q0 , p0 (q, p) dqdp = f (q0 , p0 )

representam estados puros do sistema tratado e podem ser interpretadas como estados com informacao
maximal. Para estados como q0 , p0 (q, p) = (q q0 )(p p0 ) tem-se certeza quanto a posicoes e
momenta dos constituintes do sistema e a variancia da distribuicao de f e nula, assim como as demais
flutuacoes, pois
Varq0 , p0 (f ) = hf 2 iq0 , p0 hf i2q0 , p0 = f (q0 , p0 )2 f (q0 , p0 )2 = 0 .
Em tais estados, medidas do observavel f fornecem um e somente um valor, a saber, f (q 0 , p0 ). Nenhuma
aleatoriedade ocorre, portanto, na medicao de quaisquer observaveis quando o sistema encontra-se em
um estado puro classico. A crenca de que e sempre possvel fixar todos os parametros de um sistema
de modo a fixar completamente seu estado e de modo a eliminar toda aleatoriedade em medicoes
de observaveis e por vezes denominada realismo. A Mecanica Classica, assim como toda a Fsica
Classica, e nesse sentido realista. Essa caracterstica nao e encontrada na Fsica Quantica, onde os
estados puros podem produzir variancias nao-nulas.
Na Mecanica Classica nao apenas estados puros tem interesse. Na Mecanica Estatstica Classica,
por exemplo, considera-se tambem estados com distribuicoes do tipo
1
(q, p) =
(H(q, p) E)
(26.142)
V (E)
no chamado ensemble micro-can
onico com
R energia E, onde H(q, p) e o Hamiltoniano do sistema e V (E)
e a constante de normalizacao V (E) = (H(q, p) E) dqdp (suposta finita). No chamado ensemble
can
onico adota-se o chamado estado de Gibbs56
1
(q, p) =
eH(q, p) ,
(26.143)
Z()
56

Josiah Willard Gibbs (1839-1903).

JCABarata. Curso de Fsica-Matem


atica

com a constante de normalizacao Z() =


ratura.

Vers
ao de 29 de setembro de 2005.

Captulo 26

1249/1304

eH(q, p) dqdp suposta finita, sendo o inverso da tempe-

A dinamica dos observaveis de um sistema mecanico classico e definida pelo fluxo Hamiltoniano no
espaco de fase, o qual e caracterizado pelas equacoes de Hamilton57 ,
q = p H(q, p) ,

p = q H(q, p) ,

onde o Hamiltoniano H e uma funcao diferenciavel definida no espaco de fase e satisfazendo condicoes
adequadas para garantir unicidade e existencia de solucoes (de preferencia globais) para as equacoes
acima a partir de condicoes iniciais q(0) e p(0). Se qt e pt sao solucoes das equacoes de Hamilton, a
evolucao de um observavel f e expressa por ft (q, p) := f (qt , pt ). Assim, por (26.141),
Z
Z
f (qt , pt ) (q, p) dqdp =
f (q, p) (qt , pt ) dqt dpt .
hf it := hft i =
Como a medida de Liouville
dqdp e invariante por um fluxo Hamiltoniano (Teorema de Liouville),
R
conclumos que hf it =
f (q, p) t (q, p) dqdp, onde t (q, p) := (qt , pt ) representa a evolucao
temporal do estado descrito por . Essa relacao ensina-nos como a evolucao dos observaveis na Mecanica
Classica reflete-se na evolucao dos estados.
Por (26.142) e (26.143), e evidente que as medidas dos ensemble micro-canonico e canonico sao
invariantes pela evolucao temporal (um requisito para que as mesmas descrevam estados de equilbrio),
pois H(qt , pt ) = H(q, p) para todo t.
O quadro da Fsica Qu
antica
Na Fsica Quantica nao mais e verdade que os processos experimentais de medida envolvem medidas
de posicao e velocidade, pois estas nao podem ser feitas de modo independente e simultaneo. Perde-se,
portanto, a propriedade de compatibilidade de alguns observaveis. Como e bem sabido o desenvolvimento historico da Mecanica Quantica levou a` proposicao que os observaveis devem ser representados
por operadores auto-adjuntos agindo em um espaco de Hilbert. Um dos postulados adotados afirma
que medidas individuais de um observavel representado por um operador A devem ser elementos do
espectro desse operador.
Segundo os postulados da Mecanica Quantica, os estados fsicos do sistema quantico com um n
umero
finito de graus de liberdade (ou seja, descrevendo um n
umero finito de partculas) sao descritos por
58
matrizes densidade atuando em um espaco de Hilbert H, ou seja, operadores auto-adjuntos positivos
com Tr () = 1 de modo que o valor medio de um conjunto idealmente infinito de medidas do
observavel A no estado descrito por sao dadas por hAi = Tr (A).

A escolha de operadores auto-adjuntos para o papel de observaveis e motivada por duas propriedades: 1o o espectro de um operador auto-adjunto e um sub-conjunto da reta real, fato condizente com
o postulado que afirma que medidas individuais de um observavel devem ser elementos do espectro do
operador associado; 2o o teorema espectral
Pafirma que operadores auto-adjuntos podem ser representados por somas (ou integrais) do tipo A = (A) P . Aqui, P designa formalmente o projetor sobre
57

Sir William Rowan Hamilton (1805-1865).


Cabe mencionar que boa parte da interpretaca
o matem
atica da Fsica Qu
antica que apresentaremos de modo resumido no que segue origina-se das contribuico
es de von Neumann. J
anos von Neumann (1903-1957). Von Neumann
tambem adotou os nomes de Johann von Neumann e John von Neumann.
58

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1250/1304

o sub-espaco de auto-vetores de A com auto-valor . Por (A) denota-se o espectro de A. O smbolo


de soma empregado
acima tem um sentido apenas formal, devendo ser substitudo por um smbolo de
R
integral A = (A) dP , no sentido descrito no Teorema Espectral, Teorema 26.38, pagina 1242.

A importancia do Teorema Espectral na formalizacao de teorias quanticas e enorme, pois e atraves


dele que podemos obter as distribuicoes probabilsticas associadas a medidas de um observavel A em
um dado estado. De fato, pela prescricao acima e pelo Teorema Espectral, tem-se
X
p ,
(26.144)
hAi = Tr (A) =
(A)

onde p = Tr (P ). Agora, e claro que p 0 e

X
X
p = Tr
P = Tr () = 1 .
(A)

(A)

Esses dois fatos conjuntamente com (26.144) conduzem a` interpretacao que p representa a medida de
probabilidade em (A) que descreve distribuicoes de medidas dos valores do observavel A no estado
descrito por . Nesse sentido podemos identificar com o proprio estado do sistema, pois dele obtem-se
univocamente as distribuicoes de probabilidade nos conjuntos C(A), que identificamos com os espectros
(A) dos operadores auto-adjuntos A.
As observacoes acima mostram que a interpretacao de observaveis da Fsica Quantica usual em
termos de operadores auto-adjuntos agindo em espacos de Hilbert e coerente com o proposito basico de
descrever medidas experimentais de observaveis e suas distribuicoes de probabilidade. Comentamos de
passagem que o esquema acima pode ser ainda generalizado e abstrado no seguinte sentido. As algebras
de observaveis de sistemas quanticos podem ser tomadas como algebras C abstratas e os estados fsicos
correspondem a estados sobre essas algebras, ou seja, funcionais lineares positivos e normalizados. Nesse
contexto e igualmente possvel recuperar a descricao probabilista que esquematizamos acima. A grande
vantagem dessa descricao manifesta-se no tratamento de sistemas quanticos com um n
umero infinito de
graus de liberdade, como na Mecanica Estatstica Quantica e na Teoria Quantica de Campos. Por ser
uma descricao independente de espacos de Hilbert, a descricao de observaveis em termos de algebras C
permite descrever fenomenos tpicos de sistemas n
umero infinito de graus de liberdade, como regras de
super-selecao e transicoes de fase. Para aplicacoes em Fsica das algebras C remetemos a`s referencias
[51], [3] e [16].
A evolucao temporal de observaveis em um sistema com um n
umero finito de graus de liberdade e
caracterizada por uma representacao unitaria fortemente contnua do grupo aditivo (representando a
simetria de evolucao temporal, para sistemas independentes do tempo): 3 t 7 U (t), onde U (0) = ,
U (t)U (t0 ) = U (t + t0 ) e U (t)1 = U (t) para todos t, t0 . Se A e um observavel, sua evolucao sera
dada por At := U (t)AU (t) . Assim, hAit := hAt i = Tr (At ) = Tr (U (t)AU (t) ) e pela propriedade
cclica do traco, obtemos hAit = Tr (t A) onde t := U (t) U (t). Essa expressao mostra como a
evolucao dos observaveis reflete-se na evolucao dos estados. O fato de a evolucao U (t) ser fortemente
contnua garante, pelo Teorema de Stone59 (vide [103]) que existe um operador auto-adjunto (nao
necessariamente limitado) H tal que U (t) = eiHt/~ para todo t . Com isso podemos (a menos


59

Marshall Harvey Stone (1903-1989).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1251/1304

de tecnicalidades relativas a domnios) transformar por diferenciacao a relacao A t := U (t)AU (t) na


equaca
o de Heisenberg i~t At = [H, At ]. Para os estados teremos, analogamente, i~t t = [H, t ].

Na Fsica Quantica a questao da compatibilidade de dois observaveis esta diretamente ligada a`


comutatividade dos operadores associados: dois observaveis so podem ser medidos simultaneamente
se os operadores correspondentes comutarem entre si. Essa questao e particularmente importante em
teorias quanticas de campos relativsticas, onde o chamado princpio de localidade de Einstein deve
ser respeitado. Esse princpio, um dos mais centrais em toda a Fsica, afirma que eventos separados
por intervalos tipo espaco nao podem se relacionar causalmente. Esse princpio deve ser traduzido
nas teorias quanticas de campos relativsticas pela imposicao que observaveis associados a pontos ou
regioes separadas por intervalo tipo espaco devem comutar entre si. As conseq
uencias dessa imposicao
a` estrutura das teorias quanticas de campos relativsticas sao enormes, mas nao nos cabe discut-las
aqui (vide, por exemplo, [51] e [3]).

Retornando a (26.144), estados puros de sistemas quanticos descritos em um espaco de Hilbert H


correspondem a` situacao na qual e um projetor sobre um sub-espaco unidimensional de H: = P ,
ou seja, na notacao de Dirac = |ih|, onde H e um vetor normalizado kk = 1. Assim, para
um estado puro com = P e kk = 1 teremos hAi = h, Ai.
O equivalente ao estado de Gibbs (26.143) a` temperatura inversa para um sistema quantico com
um n
umero finito de partculas e = eH /Tr(eH ), caso o operador Hamiltoniano seja tal que
Tr(eH ) (o que e tipicamente o caso se o sistema e restrito a um volume espacial finito). Tais
operadores comutam com H e sao, portanto, invariantes pela evolucao temporal, como desejado
para estados de equilbrio.
Um fato importante e que os estados puros podem apresentar variancia nao-nula para valores medios
de medidas de certos observaveis, o que nao ocorre na Mecanica Classica:

hA2 i hAi2 = , A2 (, A)2 6= 0,

a menos que seja auto-vetor de A. De fato, para A auto-adjunto,


2


1
1


2
2
2
, A (, A) =
, (A A) = (A A) .
2
2
2
2
Portanto, se hA i hAi = 0 tem-se (A A) = 0, ou seja, A = A, o que,
pela definicao de produto tensorial, implica60 A = para algum n
umero .
Assim, a interpretacao usual da Mecanica Quantica admite que o carater aleatorio de medidas de
observaveis em estados puros de sistemas quanticos seja uma propriedade intrnseca desses sistemas,
nao sendo devido a um conhecimento incompleto dos mesmos nem a erros de experimentacao. Mais
ainda, o conhecimento do estado de um sistema em um dado instante de tempo nao permitiria prever
o resultados de medidas individuais de observaveis nesse estado em instantes futuros.
A Fsica Quantica contraria nesse sentido a crenca do determinismo classico, ou seja, a crenca
que a evolucao de medidas experimentais de observaveis um sistema e completamente determinada
por condicoes iniciais. Vale, porem, uma outra forma de determinismo: a evolucao dos estados de
um sistema, ou seja, de suas medidas de probabilidade, e determinada por condicoes iniciais desses
estados (por exemplo, atraves da equacao de Schrodinger61 na Mecanica Quantica nao-relativista). A
60

Para o estudante: aplicando-se a ambos os lados da igualdade A


 =  A o operador (|ih|) , onde |ih|
e o projetor sobre , tem-se (, A)( ) = A, ou seja, (, A) = A, o que implica A = (, A).
61
Erwin Rudolf Josef Alexander Schr
odinger (1887-1961).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 26

1252/1304

determinacao precisa de como se da essa evolucao em sistemas fsicos concretos (na pratica, de qual
e o operador Hamiltoniano que gera a evolucao temporal) e uma das tarefas centrais da Fsica. No
caso da Fsica das Partculas Elementares, por exemplo, grandes progressos foram feitos nessa direcao,
especialmente apos os anos 70 do seculo XX, com o surgimento do chamado modelo padr
ao, mas a
tarefa ainda esta longe de ser considerada concluda.
A recupera
c
ao de um observ
avel a partir dos seus valores esperados em estados puros
Facamos aqui um comentario sobre o papel especial desempenhado pelos estados puros tanto na
Mecanica Classica quanto na Mecanica Quantica.
Como mencionamos, estados puros na Mecanica Classica sao caracterizados
por medidas de Dirac no
R
espaco de fase q0 , p0 (q, p) = (q q0 )(pp0 ). Como hf iq0 , p0 = f (q, p)q0 , p0 (q, p) dqdp = f (q0 , p0 ),
vemos que o conhecimento de todos os valores esperados de uma grandeza observavel f em todos os
estados puros permite recuperar a funcao f (q, p) em todos os pontos do espaco de fase.
Teorias quanticas formuladas em espacos de Hilbert H tem a mesma caracterstica, a despeito do
fato de haver estados puros com variancia nao-nula. O conhecimento de todos os valores esperados em
estados puros hAi = h, Ai com kk = 1 permite, por meio da identidade de polarizacao (expressao
(2.23), pagina 126), identificar univocamente o operador auto-adjunto limitado A. De fato, dados dois
vetores u, v H, temos a identidade
hu, Avi =

3
X
n=0

ku + i vk hn , An i =

3
X
n=0

in kn k2 hAin ,

(26.145)

u + in v
. Assim, se para cada par de vetores u, v H calcularmos ku + in vk2 e
ku + in vk
prepararmos o estado puro determinado pelos quatro vetores n (normalizados a 1) e medirmos os
quatro valores esperados de A nesses estados, hAin , teremos os produtos escalares hu, Avi por (26.145).
Em princpio tais operacoes sao possveis, pois em princpio pode-se preparar um sistema em quaisquer
dos seus estados puros. Notemos que a determinacao de todos os produtos escalares hu, Avi para todos
u, v H fixa o operador A, pois se um outro operador B e tal que hu, Avi = hu, Bvi para todos
u, v H, entao A = B (assumindo ambos limitados).
onde n :=

Comentemos tambem que uma vez fixado o operador auto-adjunto A, o Teorema Espectral, Teorema
26.38, pagina 1242, garante a existencia e unicidade
dos projetores espectrais P B , B Boreliano em
R
(A), e da sua representacao espectral A = (A) dP . O conhecimento dos PB s permite recuperar
R
as medidas espectrais , A (B) = h, PB i e com elas determinar as integrais (A) n dh, P i,
para todo n , que identificamos, tambem pelo Teorema Espectral, com os momenta da grandeza
observavel A: hAn i . Assim, o conhecimento de todos os primeiros momenta hAi para todo H
com kk = 1 permite determinar as medidas espectrais , A e todos os demais momenta hAn i , n .
Do ponto de vista da Teoria de Probabilidades essa e uma situacao especial, pois nem sempre e possvel
recuperar os momenta de uma variavel aleatoria em uma famlia de medidas de probabilidade a partir
apenas do conhecimento dos primeiros momenta dessa variavel aleatoria nessa famlia.


JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1253/1304

Ap
endice
26.A

Prova do Teorema 26.18

A funcao complexa f (z) = 1 z e analtica no disco unitario aberto D1 = {z


nesse domnio uma serie de Taylor absolutamente convergente dada por

f (z) =

| |z| < 1} e tem

cn z n

n=0

onde
c0 = 1,

1
c1 = ,
2

cn =

(2n 3)!!
, n1.
(2n)!!

bastante claro que |cn | 1 para todo n (mostre isso).


E

Em verdade, a serie de Taylor de f (z) converge absolutamente no disco unitario fechado D 1 = {z


| |z| 1}. Para ver isso notemos que os coeficientes cn sao todos negativos, exceto quando n = 0.
Assim, tem-se para todo N 0,
N
X
(|cn | + cn ) = 2c0 = 2,
n=0

ou seja,

N
X
n=0

Logo,
N
X
n=0

|cn | = 2

N
X
n=0

|cn | = 2

cn = 2 lim

t1

N
X
n=0

N
X

cn .

n=0

cn tn 2 lim

t1

1t = 2.

(26.A.1)

Acima, limt1 e o limite quando t aproxima-se de 1 pelos reais com valores menores que 1 (lembre-se
que a serie de Taylor de f (z) nao converge se |z|
da terceira linha deve-se ao
PN> 1). nA desigualdade
fato de que, para t [0, 1), a serie de Taylor n=0 cn t converge a 1 t e e decrescente, pois os

P
n
coeficientes cn sao todos negativos para n 1, o que implica N
1 t. O sinal inverte
n=0 cn t
o sentido da desigualdade para .
Com isso, para |z| 1,

N
X
n=0

para todo N , provando


62

62

|cn | |z|n

N
X
n=0

|cn | 2

que a serie de Taylor de f (z) converge absolutamente para |z| 1.

Os argumentos acima foram extrados de [103].

(26.A.2)

JCABarata. Curso de Fsica-Matem


atica

Note-se tambem que, como f (z)2 = 1 z, vale

1z =

cn z n

n=0

!2

cn cm z m+n =

n=0 m=0

= (c0 )2 + 2c0 c1 z +

X
p=2

Captulo 26

Vers
ao de 29 de setembro de 2005.

X
p=0

1254/1304

zp
cn cm
m+n=p
m, n0

cn cm = 1 z +
zp
m+n=p
m, n0

X
p=2

o que nos leva a concluir, pela unicidade da serie de Taylor, que


X
cn cm = 0,
para todo p 2.

cn cm , (26.A.3)
zp
m+n=p
m, n0

(26.A.4)

m+n=p
m, n0

Usaremos essa identidade abaixo.


E. 26.24 Exerccio. Justifique todas as passagens acima a partir do fato que a serie de Taylor de f
converge absolutamente para |z| 1.
6
Seja w um elemento da algebra B tal que kwk 1. Defina-se para N
sN =

N
X

cn w n ,

n=0

com a convencao que w 0 = . Vamos mostrar dois fatos sobre sN : primeiro que os sN formam uma
seq
uencia da Cauchy e segundo que essa seq
uencia converge a um elemento y tal que y 2 = w.
sM

Mostremos que {sN , N


M
X
sN =
cn w n . Logo,

} e uma seq
uencia de Cauchy na algebra B. Seja N < M . Temos

n=N +1

ksM sN k

M
X

n=N +1

|cn | kw k

M
X

n=N +1

|cn | kwk

M
X

n=N +1

|cn |

PN
Por (26.A.2), as somas parciais kN =
ao limitadas superiormente e, por formarem uma
n=0 |cn | s
seq
uencia de Cauchy. Assim |k M kN | =
PMuencia crescente, convergem, sendo portanto uma seq
|c
|
pode
ser
feito
arbitrariamente
pequeno
para
M e N grandes o suficiente. Isso prova
n=N +1 n
uencia de Cauchy na algebra B. Como B e uma espaco de Banach,
que sN , N , e tambem uma seq
a completeza assegura que sN converge a um elemento y da algebra.


Mostremos agora que y 2 =


Agora
2

(sN ) =

N
X
n=0

w. Isso e equivalente a mostrar que lim (sN )2 =

cn w

!2

N X
N
X

n=0 m=0

cn cm w

n+m

2N
X
p=0

w (por que?).

.
wp
c
c
n
m

n+m=p
0nN
0mN

JCABarata. Curso de Fsica-Matem


atica

Para N > 2 podemos escrever

2N
X
p=0

Captulo 26

Vers
ao de 29 de setembro de 2005.

1255/1304

N
2N
X
X
X
X

p
2

.
w
w
wp
cn cm = (c0 ) + 2c0 c1 w +
cn cm +
c
c
n
m

p=2

n+m=p
0nN
0mN

Como (c0 )2 + 2c0 c1 w =

w, segue que

(sN ) ( w) =

N
X
p=2

n+m=p
0nN
0mN

n+m=p
0nN
0mN

p=N +1

2N
X
X

.
w
cn cm +
wp
c
c
n
m

n+m=p
0nN
0mN

p=N +1

n+m=p
0nN
0mN

Resta-nos provar que essas duas somas convergem a zero quando N . Na verdade, a primeira
soma e igual a zero, pois

N
N
X X
X X

=
c
c
wp
cn cm
wp
n
m

p=2

p=2

n+m=p
0nN
0mN

e, para p 2 vimos em (26.A.4) que

n+m=p
m, n0

cn cm = 0.

n+m=p
m, n0

Com isso, temos apenas que

(sN ) ( w) =

2N
X

p=N +1

Agora, para p 2,
X

cn cm =

n+m=p
0nN
0mN

ja que

N
X
n=0

cn cpn =

N
X

cn cpn =

n=0

n=pN

N
X

X
.
c
c
wp
n
m

n+m=p
0nN
0mN

cn cpn

pN 1

X
n=0

cn cpn =

pN 1

cn cpn ,

n=0

cn cp = 0. Portanto,

m+n=p







2N
X
X


k(sN )2 ( w)k
cn cm
kwkp

n+m=p
p=N +1

0nN
0mN



1
2N pN

X

X
cn cpn


p=N +1

n=0

2N
X

p=N +1

pN 1

X
n=0

|cn | |cpn|.
(26.A.5)

JCABarata. Curso de Fsica-Matem


atica

Captulo 26

Vers
ao de 29 de setembro de 2005.

1256/1304

Agora,
2N
X

p=N +1

pN 1

X
n=0

q=pN 1

|cn | |cpn|

q
N
1 X
X
q=0 n=0

N
1
X
n=0

r=qn+N +1

N
1
X
n=0

(26.A.2)

N
1
X
n=0

|cn |

|cn |

|cn |

2N
X

r=N +1

|cn | |cqn+N +1| =


N
1
X
q=n

|cqn+N +1 |

2N
n
X

r=N +1
2N
X

r=N +1

|cr |

|cr |

N
1 N
1
X
X
n=0 q=n

N
1
X
n=0

|cn | |cqn+N +1 |

|cn |

2N
X

r=N +1

|cr |

|cr |.

!
(26.A.6)

E. 26.25 Exerccio. Justifique todas as passagens acima.

Assim,
k(sN )2 ( w)k 2
Ja vimos, porem, que

2N
X

r=N +1

2N
X

r=N +1

|cr |.

|cr | 0 quando N , pois as somas parciais kN =

(26.A.7)
N
X
r=0

|cr | formam

um seq
uencia de Cauchy. Portanto, o lado direito de (26.A.7) converge a zero quando N ,
provando que y 2 = w.

Captulo 27
Noco
es de Estruturas Alg
ebricas
Conte
udo

27.1 Algebras
Universais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1258

27.2 A
ca
o de Uma Algebra
Universal sobre uma Outra Algebra
Universal (*) 1265

o aprofundar seu estudo de Matematica o estudante freq


uentemente depara com conceitos
como o de grupo, semi-grupo, algebra, anel, corpo, modulo etc. Nosso objetivo nessa secao
e apresentar definicoes basicas de tais conceitos acompanhadas, quando possvel, de alguns
exemplos relevantes. Nossa intencao nao e de forma alguma a de cobrir esses assuntos e seus
resultados mais importantes, mas apenas a de introduzir ao leitor, de maneira mais ou menos unificada,
nocoes dessas estruturas algebricas, de modo que o mesmo possa encontrar aqui referencias rapidas a`s
mesmas quando delas necessitar. O estudante ja familiar com alguns desses conceitos (os conceitos
de grupo e algebra sao populares entre estudantes de Fsica) encontrara nessa exposicao uma visao
unificada dos mesmos, a unificacao se dando em torno de conceitos como o de algebra universal, que
introduziremos a seguir.
Esta secao deve ser compreendida como uma continuacao do Captulo 1 e dispensa a leitura das
demais, exceto daquela. O leitor pode achar ser esta secao uma longa seq
uencia contendo apenas
definicoes e exemplos, com poucos resultados, o que e correto. Seu objetivo, porem, e apresentar varias
ideias comuns a varias areas de um ponto de vista unificado. Incluir resultados importantes sobre
assuntos como algebras ou teoria de grupos levaria estas notas muito alem de seu objetivo e tornaria
suas dimensoes grandes demais. Uma certa familiaridade previa com alguns dos conceitos discutidos
ajudara a tornar a leitura mais facil, motivante e menos abstrata.
Opera
co
es e Rela
co
es
Sejam C e I dois conjuntos e consideremos o produto cartesiano C I (o conceito de produto cartesiano
de conjuntos foi definido na secao 1). Uma funcao f : C I C e por vezes dita ser uma operaca
o sobre
C. Se I e um conjunto finito, f e dita ser uma operacao finit
aria sobre C.

Um conjunto R C I dito
ser uma relacao em C. Se I e um conjunto finito, R e dito ser uma
relacao finit
aria em C.
Fun
co
es Finit
arias
Sejam C e I dois conjuntos e consideremos funcoes f : C I C. Se I e um conjunto finito
f : C I C e dita ser uma funcao finit
aria sobre C ou operacao finit
aria sobre C. Sem perda de
n
generalidade consideraremos aqui funcoes finitarias do tipo f : C C para algum n . Se f e uma
funcao finitaria para um dado n, f e dita ser uma funcao n-aria sobre C. Um exemplo de uma funcao
nao finitaria seria uma funcao do tipo f : C C que a cada seq
uencia em C associa um elemento de
C.


1257

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1258/1304

Funcoes 2-arias serao chamadas aqui de funcoes bin


arias e funcoes 1-arias sao chamadas de funcoes
un
arias.
Por vezes iremos falar tambem de funcoes 0-arias sobre C, que consistem em funcoes f : {} C.
Uma tal funcao tem por imagem simplesmente umelemento fixo de C. Exemplos de funcoes 0-arias
sobre
seriam f () = 1 ou f () = 0 ou f () = 2. Freq
uentemente denotamos tais funcoes pelo
elemento
de
C
por
ela
associado.
Nos
tr
e
s
exemplos
acima,
poder
amos denotar as funcoes por 1, 0 ou

2, respectivamente.


Rela
co
es Finit
arias
Ha uma nomenclatura analoga para o caso de relacoes. Sejam C e I dois conjuntos e consideremos
relacoes R C I . Se I e um conjunto finito R e dita ser uma relacao finit
aria sobre C. Sem perda
de generalidade consideraremos aqui relacoes finitarias do tipo R C n para algum n . Se R e
uma relacao finitaria para um dado n, R e dita ser uma relacao n-aria sobre C. Para o caso n = 1 as
relacoes sao tambem chamadas de unarias e para o caso n = 2 sao ditas binarias. Relacoes binarias
foram estudadas a` pagina 23.


Estruturas
Seja C um conjunto, F uma colecao de operacoes (nao necessariamente finitarias) sobre C e seja
R uma colecao de relacoes (nao necessariamente finitarias) em C. A tripla hC, F, Ri e dita ser uma
estrutura sobre C. Note-se que tanto F quanto R podem ser vazias.
Dado que operacoes sobre um conjunto C tambem sao relacoes sobre C, a definicao de estru porem conveniente mante-la como esta, pois opcoes sao de
tura acima poderia ser simplificada. E
importancia especial.
Uma estrutura hC, Fi e dita ser uma estrutura algebrica e uma estrutura hC, Ri e dita ser uma
estrutura relacional. Deste segundo tipo de estrutura nao trataremos aqui. Aqui estudaremos apenas
um tipo especial de estrutura algebrica, as chamadas algebras universais, das quais veremos varios
exemplos importantes a` toda a Matematica e a` Fsica.

27.1

Algebras
Universais

Uma Algebra
Universal e constituida por um conjunto C e uma colecao F de funcoes finitarias sobre
C. A colecao F nao precisa ser finita. Freq
uentemente denotaremos uma algebra universal por hC, Fi.

O estudo sistematico das algebras universais foi iniciado por Withehead1 e Birkhoff2 , tendo Boole,
Hamilton, DeMorgan e Sylvester como precursores. Vamos a alguns exemplos.
1. Seja C =
e F = {s, m}, onde s e m sao duas funcoes binarias dadas por s :
s(x, y) = x + y e m : 2 , s(x, y) = x y.


1
2

Alfred North Withehead (1861-1947).


George David Birkhoff (1884-1944).

2


JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1259/1304

2. Seja C = Mat(n) (o conjunto das matrizes complexas n n para um certo n ) e F = {s, m},
onde s e m sao duas funcoes binarias dadas por s : C 2 C, s(A, B) = A + B e m : C 2 C,
s(A, B) = A B.


3. Seja C o conjunto de todas as matrizes complexas n m (para n e m ) e seja F = {c, s, t}


onde c : C C e a funcao unaria dada por c(A) = A (a matriz complexo-conjugada de A),
s : C 2 C e a funcao binaria dada por s(A, B) = A + B e t : C 3 C e a funcao 3-aria dada
por t(A, B, C) = AB T C, onde B T e a transposta da matriz B.


Varios outros exemplos serao vistos abaixo. Algumas algebras universais com propriedades especiais
recebem denominacoes proprias e sao chamadas de grupos, semi-grupos, aneis, corpos, algebras etc.
Vamos introduz-las adiante.
Tipos de Opera
co
es e de Rela
co
es
Ainda um comentario sobre a nomenclatura.
Sejam C e I conjuntos e seja : C I C uma operacao sobre o conjunto C. A cardinalidade de I
e dita ser o tipo da operacao . Assim, uma funcao n-aria e tambem dita ser de tipo n. Analogamente,
se R C I e uma relacao em C a cardinalidade de I e dita ser o tipo da relacao R.
Coment
ario Sobre a Nota
c
ao
Antes de prosseguirmos, facamos uma observacao sobre a notacao que e costumeiramente adotada,
especialmente quando se trata de funcoes binarias.
Dado um conjunto C e uma funcao binaria denotada por um smbolo , a imagem de um par
muito pratico, por vezes, usar uma outra notacao
(a, b) C 2 e comummente denotada por (a, b). E
e denotar (a, b) por a b. Essa notacao e denominada mesofixa. Um exemplo claro desse uso esta
na funcao soma, denotada pelo smbolo + : 2 de dois n
umeros complexos. Denotamos +(z, w)
por z + w. Outro exemplo esta na funcao produto : 2 de dois n
umeros complexos. Denotamos
(z, w) por z w.
Essa notacao sera usada adiante para outras funcoes binarias alem das funcoes soma e produto de
n
umeros ou matrizes.

Funcoes unarias tambem tem por vezes uma notacao especial, freq
uentemente do tipo exponencial.
Tal e o caso da operacao que associa a cada elemento de um grupo a` sua inversa, g 7 g 1 , ou o
caso da operacao que associa a cada conjunto o seu complementar A 7 A c . Ou ainda o caso da
transposicao de matrizes M 7 M T , da conjugacao de n
umeros complexos z 7 z para o que usa-se
tambem sabidamente a notacao z 7 z.
Comutatividade e Associatividade
Uma funcao binaria : C 2 C e dita ser comutativa se para quaisquer a e b C valer
(a, b) = (b, a),
ou seja, na nova notacao, se
ab = ba.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1260/1304

Funcoes binarias comutativas sao freq


uentemente chamadas de Abelianas 3 .
Uma funcao binaria : C 2 C e dita ser associativa se para quaisquer a, b e c C valer
(a, (b, c)) = ((a, b), c),
ou seja, na nova notacao, se
a(bc) = (ab)c.
Vamos agora apresentar em seq
uencia varios exemplos de algebras universais de importancia em
Matematica. Em todos eles as funcoes de F sao 0-arias, unarias ou binarias.
Reticulados
Um reticulado4 sobre um conjunto C e uma algebra universal hC, Fi onde F e um conjunto de duas
funcoes binarias denotadas por e (le-se e e ou, respectivamente), F = {, }, as quais sao
supostas satisfazer as seguintes relacoes, validas para todos a, b e c C (usaremos a nova notacao):
1. Idempotencia:
a a = a,

a a = a.

2. Comutatividade:
a b = b a,

a b = b a.

3. Associatividade:
a (b c) = (a b) c,
a (b c) = (a b) c.
4. Absorvencia5 :
a (a b) = a,
a (a b) = a.
Vamos a exemplos.
1. Seja C = (B), para algum conjunto B e sejam as funcoes e definidas para todos a, b B,
por a b = a b, a b = a b.
E. 27.1 Exerccio. Mostre que isso e um reticulado no sentido da definicao acima.
2. Seja C =
e sejam as funcoes e definidas para todos a, b
a b = min{a, b}.


, por a b = max{a, b},

E. 27.2 Exerccio. Mostre que isso e um reticulado no sentido da definicao acima.


3

Niels Henrik Abel (1802-1829).


Denominado lattice em ingles e Verband em alem
ao.
5
Tambem denominada Amalgamento.
4

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1261/1304

3. Uma generalizacao do caso acima. Seja C um conjunto linearmente ordenado (a definicao esta a`
pagina 31) e sejam as funcoes e definidas para todos a, b C, por

a, se a b
,
a b :=
b, de outra forma

a, se a b
a b :=
.
b, de outra forma
E. 27.3 Exerccio. Mostre que isso e um reticulado no sentido da definicao acima.

Reticulados Distributivos
Um reticulado e dito ser distributivo se tambem forem satisfeitas as propriedades
1.
a (b c) = (a b) (a c).
2.
a (b c) = (a b) (a c).
E. 27.4 Exerccio. Nos exemplos acima quais reticulados sao distributivos?

Algebras
Booleanas
Uma a
lgebra Booleana6 e uma algebra universal formada por um conjunto B e por uma famlia
F de cinco funcoes finitarias: duas binarias, denotadas por e , uma funcao unaria, denotada por
C e denominada negacao ou complemento e duas funcoes 0-arias, denotadas genericamente por 0
e 1 (denominadas, obviamente, zero e um), as quais representam elementos fixos distintos de B.
As funcoes acima sao supostas satisfazer aos seguintes requisitos: 1) B, e formam um reticulado
distributivo. 2) Para todo a B vale que 0 a = a e que 1 a = a. 3) Para todo a B vale que
a C(a) = 1 e que a C(a) = 0.

Exemplo B
asico. Seja A um conjunto e tomemos B = (A). Para a, b (A) definamos ab = ab,
a b = a b, C(a) = A \ a, 0 = , 1 = A. Como exerccio mostre que o sistema assim definido e uma
algebra Booleana.
Semi-grupos

Um semi-grupo e uma algebra universal formada simplesmente por um conjunto S e por uma
operacao binaria associativa denotada por e denominada produto ou multiplicacao.
6

George Boole (1815-1864).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1262/1304

Exemplos. dotado da operacao de multiplicacao usual e um semi-grupo (mas nao um grupo. Vide
abaixo.). O mesmo pode ser dito de Mat(n), o conjunto das matrizes complexas n n com o produto
usual de matrizes.


Outro exemplo importante e o seguinte. Seja C um conjunto e tomemos S = C C , o conjunto de


todas as funcoes de C em C. Entao S e um semi-grupo com o produto formado pela composicao de
funcoes: .
Mon
oides
Um monoide e um semi-grupo, formado por um conjunto C e uma funcao binaria associativa
denotada por (produto), com a propriedade de existir em C um elemento e, denominado elemento
neutro, o qual e suposto satisfazer as seguintes duas propriedades:
ae=a

e a = a,

(27.1)

para todo a C.

Note-se que um monoide pode ser tambem entendido como sendo uma algebra universal hC, Fi,
onde C e um conjunto e F = {, e} e formado por uma funcao binaria associativa (produto) e uma
funcao 0-aria e (com e C) com a propriedade de elemento neutro (27.1) em relacao ao produto .

Exemplo.
n
umero 1.
Exemplo.

dotado da operacao de multiplicacao usual e um monoide onde o elemento neutro e o

dotado da operacao de soma usual e um monoide onde o elemento neutro e o n


umero

0.
Exemplo. Seja C um conjunto e tomemos S = C C , o conjunto de todas as funcoes de C em C.
Entao S e um semi-grupo com o produto formado pela composicao de funcoes: . S e tambem um
monoide, onde o elemento neutro e a funcao identidade id(s) = s, s C.
Contra-exemplo. O conjunto + = {x
operacao de soma, mas nao e um monoide.


, x > 0} e um semi-grupo (Abeliano) em relacao a`

Grupos
Esta e uma das estruturas matematicas mais importantes e o alcance de suas aplicacoes dispensa
comentarios.
Um grupo e uma algebra universal hC, Fi, onde C e um conjunto e F = {, I, e} e formada por
uma funcao binaria associativa denominada produto, por uma funcao 0-aria e (com e C) com a
propriedade de elemento neutro (27.1) em relacao ao produto e por uma funcao unaria I (chamada
de inversao), com a propriedade que
a I(a) = I(a) a = e
para todo a C. Freq
uentemente denotamos I(a) = a1 , que e chamado de inversa ou elemento
inverso de a. O elemento e e freq
uentemente denominado identidade do grupo.
Note-se que todo grupo e um semi-grupo e tambem um monoide.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1263/1304

Contra-exemplos. O conjunto C0 = {x , x > 1} e um semi-grupo em relacao ao produto


de multiplicacao usual mas nao e um monoide. O conjunto C1 = {x , x 1} e um monoide
(e portanto um semi-grupo) em relacao ao produto de multiplicacao usual mas nao e um grupo. O
conjunto C2 = {x , x > 0} e um grupo em relacao ao produto de multiplicacao usual.


Contra-exemplos. O conjunto C = Mat(n, ) de todas as matrizes n n, n , e um monoide


em relacao ao produto usual de matrizes, mas nao e um grupo, dado que nem todas as matrizes sao
invertveis. Ja o conjunto de todas as matrizes unitarias n n e um grupo em relacao ao produto usual
de matrizes (por que?).


Vamos nos abster de apresentar mais exemplos de grupos, dado que os mesmos sao bem conhecidos
e que nenhuma lista de exemplos lhes faria jus.
Um semi-grupo, um monoide ou um grupo sao ditos ser Abelianos ou comutativos se sua operacao
de produto for comutativa. Neste caso o produto e por vezes denotado pelo smbolo +.
An
eis
Um anel e uma algebra universal constituda por um conjunto R (Ring em ingles e alemao) e
uma colecao F = {+, , 0} formada por duas funcoes binarias comutativas e associativas, + e e por
uma funcao 0-aria 0 R com as seguintes propriedades:
1. A algebra universal hR, {+, 0}i e um grupo comutativo.
2. A algebra universal hR, {}i e um semi-grupo.
3. Propriedade distributiva. Para quaisquer a, b, c R valem
a (b + c) = (a b) + (a c)

(b + c) a = (b a) + (c a).

E. 27.5 Exerccio importante. Mostre que em um anel sempre vale que a 0 = 0 para todo a R. 6
Exemplos. ,
e multiplicacao.


e Mat(n,

) sao exemplos de aneis com relacao a`s operacoes usuais de soma

Apresentaremos em seq
uencia uma serie de definicoes apos as quais discutiremos exemplos relevantes.
An
eis com Unidade
Um anel com unidade e um anel hR, {+, , 0}i com a propriedade de existir em R um elemento 1,
chamado de unidade, com 1 6= 0, tal que a 1 = 1 a = a para todo a R.

Outro modo de dizer isso e dizer que um anel com unidade e uma algebra universal hR, {+, , 0, 1}i
onde hR, {+, , 0}i e um anel e 1 e uma operacao 0-aria tal que a 1 = 1 a = a para todo a R.
An
eis sem Divisores de Zero
Dado um anel hR, {+, , 0}i um elemento nao-nulo a R e dito ser um divisor de zero se existir
pelo menos um b R com b 6= 0 tal que a b = 0 ou b a = 0.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1264/1304

Se em um anel tivermos que a b = 0 implica que ou a = 0 ou b = 0 ou ambos, entao esse anel e


dito ser um anel sem divisores de zero.
Exemplos.
e sao aneis sem divisores de zero (com os produtos e somas usuais), mas os aneis
Mat(n, ), n > 1, tem divisores de zero (com o produto e soma usual), pois tem-se, por exemplo,


 

1 0
0 0
0 0
=
.
0 0
0 1
0 0


Anel de Integridade
Um anel comutativo, com unidade e sem divisores de zero e dito ser um anel de integridade ou
tambem um domnio de integridade.
Para a relacao entre aneis de integridade e corpos, vide adiante.
An
eis de Divis
ao
Um anel de divis
ao e constitudo por um conjunto R e uma colecao F = {+, , I, 0, 1} formada
por duas funcoes binarias comutativas e associativas, + e , uma funcao unaria I (inversao) e por duas
funcoes 0-aria 0, 1 R, com 0 6= 1 e com as seguintes propriedades:
1. A algebra universal hR, {+, , 0}i e um anel.
2. Para todo a R vale a 1 = 1 a = a.
3. O domnio de I e R \ {0} e para todo a no domnio vale I(a) a = a I(a) = 1.
Freq
uentemente denota-se I(a) por a1 .
Pelo fato de a operacao I de inversao nao ser definida em todo R (temos que excluir o elemento 0)
um anel de divisao nao e uma algebra universal mas o que se chama de uma a
lgebra universal parcial.
Para uma classificacao mais detalhada desses sistemas vide, por exemplo, [49].
E. 27.6 Exerccio importante.
Mostre que um anel de divisao nao pode possuir divisores de zero.
Portanto, todo anel de divisao comutativo e tambem um anel de integridade.
6
Exemplos. Com as definicoes usuais , e sao aneis de divisao mas nao o e (falta a inversa).
Mat(n, ) com n > 1 tambem nao e um anel de divisao com as definicoes usuais pois nem toda a
matriz e invertvel.


Corpos
Um anel de divisao hR, {+, , I, 0, 1}i cujo produto e comutativo e denominado um corpo 7 .

Exemplos.

7
Em ingles a palavra empregada e field. A express
ao em portugues provavelmente provem do frances corp ou do
alem
ao K
orper.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1265/1304

Corpos N
ao-comutativos
Como a u
nica distincao entre as definicoes de corpos e de aneis de divisao e que para os primeiros a
comutatividade do produto e requerida, diz-se tambem por vezes que aneis de divisao nao-comutativos
sao corpos n
ao-comutativos.
Corpos e An
eis de Integridade
bem claro pelas definicoes que todo corpo e tambem um anel de integridade. A reciproca e
E
parcialmente valida:
Teorema 27.1 Todo anel de integridade finito e um corpo.

Prova. Se A e um anel de integridade, tudo que precisamos e mostrar que todo elemento nao-nulo
de A e invertvel. Seja a um elemento de A \ {0}. Definamos a aplicacao : A \ {0} A dada por
(y) = ay.
Note que, como A e um anel de integridade o lado direito e nao nulo pois nem a nem y o sao. Assim,
e em verdade uma aplicacao de A \ {0} em A \ {0} e, como tal, e injetora, pois se ay = az, segue
que a(y z) = 0, o que so e possvel se y = z, pois A e um anel de integridade e a 6= 0. Agora,
uma aplicacao injetora de um conjunto finito em si mesmo tem necessariamente que ser sobrejetora
(por que?). Assim, e uma bijecao de A \ {0} sobre si mesmo. Como 1 A \ {0}, segue que existe
y A \ {0} tal que ay = 1, ou seja, a tem uma inversa. Como a e um elemento arbitrario de A \ {0},
segue que todo elemento de A \ {0} tem inversa e, portanto, A e um corpo.
Aneis de integridade infinitos nao sao necessariamente corpos:

Anti-exemplo. Um exemplo de um anel de integridade que nao e um corpo e o conjunto de todos


os polinomios de em com o produto e soma usuais. Em verdade, os u
nicos polinomios que tem
inverso multiplicativo sao os polinomios constantes nao nulos.

27.2

A
c
ao de Uma Algebra
Universal sobre uma Outra Algebra
Universal (*)

Algumas estruturas freq


uentemente encontradas, como espacos vetoriais, algebras e modulos, nao se
enquadram no conceito de algebras universais mas podem ser encarados como constitudos por pares
de algebras universais dotadas de uma aca
o de uma das algebras universais sobre a outra. A nocao
abstrata de acao de uma algebra universal sobre uma outra algebra universal sera vista mais adiante.
Inicialmente trataremos de definir os conceitos de espacos vetoriais, algebras e modulos
Espa
cos Vetoriais
Assim como o conceito de grupo, o conceito de espaco vetorial e tambem um dos mais importantes
da Matematica e suas aplicacoes tambem dispensam comentarios. O conceito de espacos vetorial nao

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1266/1304

se enquadra plenamente no de algebra universal e envolve como ingredientes, um grupo Abeliano A e


um corpo K, conectados por um acao de K em A (definida abaixo).
Um espaco vetorial e formado por um grupo Abeliano A e por um corpo K e por uma aplicacao
K A A, que denotamos simbolicamente por ,
K A A 3 (, v) 7 v A,
com as seguintes propriedades:
1. Associatividade
( v) = () v,
para todos , K, v A.
2. 1 v = v para todo v A.
3. Distributividade em relacao a` soma no corpo: ( + ) v = ( v) + ( v), para todos , K,
v A.
4. Distributividade em relacao a` soma no grupo Abeliano: (v + w) = ( v) + ( w), para todos
K, v, w A.
Acima, no item 1, representa o produto de e em K etc.
O produto : K A A com as propriedades acima e um exemplo do que se chama de uma
aca
o de um corpo sobre um grupo Abeliano. O conceito mais geral de acao de uma algebra universal
sobre uma outra sera visto a` pagina 1268.
Quando necessario denotaremos um espaco vetorial como uma tripla hA, K, i.
E. 27.7 Exerccio. Mostre que das definicoes acima segue que, num espaco vetorial hA, K, i, sempre
vale que 0 v = 0 para todo v A.
6
Dado um espaco vetorial A formado por um anel A sobre o qual age um corpo K como definido
acima (usaremos tambem a notacao hA, Ki), denotaremos aqui o produto v, K, v A
simplesmente por v.

Algebras
A definicao de a
lgebra segue passos analogos aos da definicao de espaco vetorial.
Uma a
lgebra e formada por um anel A e por um corpo K e por uma aplicacao de K sobre A,
K A A, que denotamos simbolicamente por ,
K A A 3 (, v) 7 v A
com as seguintes propriedades:
1. Considerando apenas a estrutura de A como grupo Abeliano, o par hK, Ai e um espaco vetorial.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 27

1267/1304

2. Para todos K e todos a, b A vale que


(a b) = ( a) b = a ( b).

(27.2)

O leitor pode convencer-se que uma algebra pode ser tambem caracterizada como um espaco vetorial
V = hA, Ki (K corpo, A grupo Abeliano) dotado de um produto : A A A de forma que
1. Com o produto o conjunto A tem uma estrutura de anel.
2. A propriedade (27.2) acima e valida.
Daqui por diante denotaremos o produto v, K, v A simplesmente por v.

Algebras
Associativas e N
ao-Associativas
Se numa algebra o produto definido entre os vetores do espaco vetorial for associativo a algebra
e dita ser uma a
lgebra associativa, de outra forma ela e dita ser uma a
lgebra n
ao-associativa.
O estudante nao deve pensar que algebras nao-associativas sao raras e desinteressantes. Em verdade uma das primeiras algebras com a qual estudantes de Fsica ou Matematica se deparam e naoassociativa, a saber, a algebra do produto vetorial em 3 (denotado por ~a ~b ou por ~a ~b).


E. 27.8 Exerccio. Mostre que para os vetores de base canonicos ~i, ~j e ~k tem-se (~i ~i) ~j = ~0 ~j = ~0
mas ~i (~i ~j) = ~i ~k = ~j 6= ~0.
6

Algebras
de Lie
Aqui novamente estamos diante de um assunto vastssimo e vamos limitar-nos a`s definicoes.
Uma algebra de Lie e uma algebras A cujo produto e nao-comutativo e nao-associativo mas para o
qual, porem, as seguintes propriedades sao validas:

para todos a e b A e
para todos a, b e c A.

a b = b a

(27.3)

a (b c) + b (c a) + c (a b) = 0,

(27.4)

A propriedade (27.3) e denominada anti-comutatividade e a propriedade (27.4) e denominada identidade de Jacobi.


Para se compreender a importancia da identidade de Jacobi na estrutura das algebras de Lie,
notemos que, para um produto anti-comutativo (i.e. a b = b a) a condicao de associatividade
a (b c) = (a b) c fica
a (b c) + c (a b) = 0.
Compare-se esta relacao com (27.4).

Por razoes historicas o produto de dois elementos de um algebra de Lie e mais freq
uentemente
denotado pelo smbolo [a, b] ao inves de a b.

JCABarata. Curso de Fsica-Matem


atica

Captulo 27

Vers
ao de 29 de setembro de 2005.

1268/1304

Morfismos entre Algebras


Universais
Sejam hA, Ai e hB, Bi duas algebras universais. Uma funcao : A B e dita preservar o tipo
das operacoes de A se para todo A a operacao () B tiver o mesmo tipo que a operacao .
Assim, uma aplicacao que preserva o tipo leva aplicacoes unarias em unarias, aplicacoes binarias
em binarias etc.

Um morfismo da algebra universal hA, Ai na algebra universal hB, Bi e um par de aplicacoes


hD, i com D : A B e : A B, onde e uma aplicacao que preserva o tipo e de tal forma que
para todo A tenhamos
D = () D
como aplicacoes An B, onde n e o tipo de .
Isso significa que para todo A temos

D((a1 , . . . , an )) = ()(D(a1 ), . . . , D(an ))


para toda (a1 , . . . , an ) An , n sendo o tipo de .

Exemplo. Sejam as algebras universais h + , {, 1}i e h , {+, 0}i com as definicoes usuais e seja
o par h ln, Li, onde ln : + e o logaritmo neperiano e L : {, 1} {+, 0} dado por L() = +,
L(1) = 0. Entao h ln, Li e um morfismo de h + , {, 1}i em h , {+, 0}i, dado que para todo
a, b + vale
ln(a b) = ln(a) + ln(b).


A
co
es de uma Algebra
Universal sobre uma outra Algebra
Universal
Por razoes de completeza apresentaremos aqui a nocao geral de aca
o de uma algebra universal sobre
uma outra. A leitura desta secao pode ser omitida pois nao afetara o que segue.
B.

Vamos comecar com algumas definicoes. Sejam A e B dois conjuntos e seja uma funcao G : AB
Para todo n, m

definamos


G(n, 1) : An B B n
com ai A, b B.

Para todo m, m


tal que

(a1 , . . . , an , b) 7 (G(a1 , b), . . . , G(an , b))

tal que

(a, b1 , . . . , bm ) 7 (G(a, b1 ), . . . , G(a, bm ))

definamos

G(1, m) : A B m B m
com a A, bi B.

Para um conjunto C qualquer idC : C C denota a identidade em C: idC (c) = c, c C.


Fora isso, se : C C e uma aplicacao, denotaremos por (n) : An An a aplicacao tal que
(n) (c1 , . . . , cn ) = ((c1 ), . . . , (cn )).
Finalmente, para duas aplicacoes : An A e : B m B o par (, ) denota a aplicacao
An B m A B dada por (, )(a1 , . . . , an , b1 , . . . , bm ) = ((a1 , . . . , an ), (b1 , . . . , bm ))).

JCABarata. Curso de Fsica-Matem


atica

Captulo 27

Vers
ao de 29 de setembro de 2005.

1269/1304

Com isso podemos formular a definicao desejada de acao de uma algebra universal sobre uma outra.
Sejam hA, Ai e hB, Bi duas algebras universais. Uma aca
o de hA, Ai sobre hB, Bi e um par
hG, i onde
G:AB B
e
:AB
sao aplicacoes tais que preserva tipos e as seguintes condicoes sao validas: Para quaisquer A e
B (cujos tipos serao n e m, respectivamente) tem-se que
G (, ) = () G(n, 1) (idAn , ) = G(1, m) (, idB m )

(27.5)

como aplicacoes An B m B.
De (27.5) segue que

G (, idB ) = () G(n, 1) (idAn , idB )

(27.6)

G (idA , ) = G(1, m) (idA , idB m ).

(27.7)

E. 27.9 Exerccio. Mostre isso.

De (27.6) e (27.7) segue que


G(n, 1) (idAn , ) =
e
G(1, m) (, idB m ) =

onde j : An B m (A B m )n e dada por

G(1, m)

(n)

() G(n, 1)

(m)

(27.8)

k,

(27.9)

j(a1 , . . . , an , b1 , . . . , bm ) := (a1 , b1 , . . . , bm , a2 , b1 , . . . , bm , . . . , an , b1 , . . . , bm )
e k : An B m (An B)m e dada por
k(a1 , . . . , an , b1 , . . . , bm ) := (a1 , . . . , an , b1 , a1 , . . . , an , b2 , . . . , a1 , . . . , an , bm ).
E. 27.10 Exerccio. Mostre isso.

Das relacoes (27.8) e (27.9) segue que a condicao (27.5) pode ser escrita como
G (, ) = () G(1, m)

(n)

j = () G(n, 1)

(m)

k.

(27.10)

Observaca
o. Acima estamos considerando idA , idB , como elementos de A, respectivamente de B, o
que sempre pode ser feito sem perda de generalidade.

Captulo 28

O Limite Indutivo de Algebras


Conte
udo

amos neste captulo apresentar uma construcao do chamado limite indutivo de certas famlias
de algebras, em particular de algebras de Banach. Tal construcao e freq
uentemente empre
gada, por exemplo na teoria das algebras C onde e usada na construcao de uma classe
importante de algebras C , as chamadas algebras AF.
No caminho que seguiremos indicaremos primeiro como construir o chamado limite indutivo algebrico,
construcao essa que pode ser efetuada nao so em famlias de algebras, mas tambem em famlias de grupos, de aneis, de semi-grupos, de espacos vetoriais etc. A seguir trataremos do caso de espacos de
famlias de espacos de Banach e construiremos o chamado limite indutivo de Banach de (A, ).

O Limite Indutivo Alg


ebrico de uma Famlia de Algebras
Um conjunto I e dito ser um conjunto dirigido (directed set) se for dotado de uma relacao de
ordem parcial, que denotaremos por , e se for dotado da seguinte propriedade: para quaisquer dois
elementos a e b de I existe pelo menos um terceiro elemento c I tal que a  c e b  c.

Seja I um conjunto dirigido que trataremos aqui como um conjunto de ndices. Vamos estar aqui
supondo que associada a cada i I haja uma algebra Ai e que, para cada par i, j I com i  j haja
um morfismo de algebra ij : Ai Aj satisfazendo os seguintes requisitos:
1. Para todo i, j, k I com i  j  k, ik = jk ij
2. Para todo i I, ii = idAi .
A propriedade 1) acima e chamada de coerencia.
No que segue estaremos supondo que todas as algebras Ai sao algebras em relacao ao mesmo corpo
(por exemplo, ).
Uma colecao de algebras e morfismos de algebra com as propriedades acima e dito ser um sistema
indutivo de a
lgebras e denotaremos um tal sistema por (A, ).
A ttulo de ilustracao o leitor pode ter em mente o caso em que I =
e onde cada algebra A i e
uma sub-algebra de Ai+1 , i, i+1 sendo a inclusao de Ai em Ai+1 e ij := i, i+1 i+1, i+2 . . . j1, j ,
para todos i, j com i < j.
G
Seja A =
Ai a uniao disjunta das algebras Ai . Lembramos que a uniao disjunta de uma famlia


iI

Xi , i , de conjuntos foi definida (pagina 27) como

[ [

(x, i). Com o proposito de definir o

i xXi

conceito de limite indutivo associado ao sistema indutivo (A, ) vamos definir em A uma relacao de
1270

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1271/1304

equivalencia. Sejam x Ai e y Aj . Dizemos que x y se existir pelo menos um k I com1


(k  i) (k  j) tal que
ik (x) = jk (y).
Vamos mostrar em primeiro lugar que tal realmente define uma relacao de equivalencia.
1. x x, x Ai . Para tal tome-se k = i.

2. Se x y entao y x. Obvio,
pela definicao.
3. Se x y e y z entao x z. Sejam x Ai , y Aj e z Ak . Entao existem k 0 e k 00 tais que
(k 0  i) (k 0  j), (k 00  j) (k 00  k) com
ik0 (x) = jk0 (y)
e
jk00 (y) = kk00 (z).
Seja entao k 000 I com (k 000  k 0 ) (k 000  k 00 ). Teremos
ik000 (x) = k0 k000 ik0 (x) = k0 k000 jk0 (y) = jk000 (y) = k00 k000 jk00 (y) = k00 k000 kk00 (z) = kk000 (z).
Assim, ik000 (x) = kk000 (z) com (k 000  i) (k 000  k), provando que x z.
Isto posto, denotaremos por A a colecao das classes de equivalencia de A pela relacao : A :=
A/ . Notemos que A depende da colecao {Ai , i I} e dos morfismos ij usados.
Antes de prosseguirmos provemos o seguinte pequeno resultado, do qual faremos uso:

Lema 28.1 Para todo i I, todo a Ai e todos k, k 0 I com k  i, k 0  i, tem-se que ik (a)
ik0 (a).
2
Prova. Seja x ik (a) Ak , y ik0 (a) Ak0 e seja k 00 I com (k 00  k) (k 00  k 0 ). Temos que
kk00 (x) = kk00 ik (a) = ik00 (a)
e
k0 k00 (y) = k0 k00 ik0 (a) = ik00 (a).
Logo, kk00 (x) = k0 k00 (y), provando que x y.
Este lema diz que, para todo i I, todo a Ai e todos k, k 0 I com k  i, k 0  i, tem-se que
[ik (a)] = [ik0 (a)],
o que tambem diz que i I, todo a Ai e todo k I com k  i temos
[a] = [ik (a)].
1

Lembramos que os smbolos e representam os conectivos l


ogicos e e ou, respectivamente.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1272/1304

Podemos atribuir a A uma estrutura de algebra. Em primeiro lugar, se [x] e a classe de equivalencia
associada a um elemento x, definimos [x] := [x]. Aqui e um elemento qualquer do corpo de escalares
das algebras.
preciso demonstrar a independencia dessa definicao dos representantes tomados na classe, mas
E
isso e facil de se verificar, pois se x0 x com x0 Aj e x Ai , existe k I com (k  i) (k  j) com
ik (x) = jk (x0 ). Logo, ik (x) = jk (x0 ), provando que (x0 ) (x), ou seja, que [x0 ] = [x].
Sejam x Ai , y Aj e (k  i) (k  j). Definimos

[x] + [y] := [ik (x) + jk (y)].


preciso demonstrar a independencia dessa definicao dos representantes tomados, assim como do k
E
adotado.
A independencia de k e imediata, pois se (k 0  i) (k 0  j) entao tomemos k 00 I tal que
(k  k) (k 00  k 0 ). Denotando z1 = ik (x) + jk (y) e z2 = ik0 (x) + jk0 (y) teremos
00

kk00 (z1 ) = ik00 (x) + jk00 (y) = k0 k00 (ik0 (x) + jk0 (y)) = k0 k00 (z2 ),
mostrando que z1 z2 e que [ik (x) + jk (y)] = [ik0 (x) + jk0 (y)].

Vamos agora provar a independencia da definicao de [x] + [y] do representante tomado em [x]. A
independencia em relacao ao representante em [y] e analoga. Seja x0 Ai0 com x0 x e seja k 0 I
com (k 0  i) (k 0  i0 ) (k 0  j) e tal que ik0 (x) = i0 k0 (x0 ). Temos que
i0 k0 (x0 ) + jk0 (y) = ik0 (x) + jk0 (y).
Logo
[i0 k0 (x0 ) + jk0 (y)] = [ik0 (x) + jk0 (y)] = [ik (x) + jk (y)],
pela independencia em k, provando o que se desejava.
Notemos tambem que para todo y,
[0] + [y] = [ik (0) + jk (y)] = [jk (y)] = [y],
mostrando que [0] e o elemento neutro da adicao definida acima e que
[x] + (1)[x] = [x] + [x] = [ik (x) + ik (x)] = [ik (x) ik (x)] = [0].
As operacoes de multiplicacao por escalar e de soma em que foram definidas acima dao a A uma
estrutura de espaco vetorial. Vamos agora definir um produto em A . Definimos
[x][y] := [ik (x)jk (y)],
onde, novamente x Ai , y Aj e k e tal que (k  i) (k  j).
preciso demonstrar a independencia dessa definicao dos representantes tomados, assim como do k
E
adotado. Para vermos a independencia em relacao ao k adotado, seja (k 0  i) (k 0  j) entao tomemos
k 00 I tal que (k 00  k) (k 00  k 0 ). Denotando z1 ik (x)jk (y) e z2 ik0 (x)jk0 (y) teremos, usando
o fato que os s sao morfismos de algebra,
kk00 (z1 ) = ik00 (x)jk00 (y) = k0 k00 (ik0 (x)jk0 (y)) = k0 k00 (z2 ),

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1273/1304

mostrando que z1 z2 e que [ik (x)jk (y)] = [ik0 (x)jk0 (y)].

Vamos agora provar a independencia da definicao de [x][y] do representante tomado em [x]. A


independencia em relacao ao representante em [y] e analoga. Seja x0 Ai0 com x0 x e seja k 0 I
com (k 0  i) (k 0  i0 ) (k 0  j) e tal que ik0 (x) = i0 k0 (x0 ). Temos que
i0 k0 (x0 )jk0 (y) = ik0 (x)jk0 (y).
Logo
[i0 k0 (x0 )jk0 (y)] = [ik0 (x)jk0 (y)] = [ik (x)jk (y)],
pela independencia em k.
Notemos tambem, por fim, que para todo y,
[0][y] = [ik (0)jk (y)] = [0jk (y)] = [0].
O conjunto A , dotado da estrutura algebrica definida acima, e chamado de limite indutivo algebrico
do sistema indutivo (A, ).
Alguns Exemplos
Vamos ilustrar a construcao acima com exemplos. Seja I =
a algebra das matrizes complexas n n.

com a ordem usual e A n = Mat(n,

),

Ha tres possveis morfismos de algebra de Mat(2) em Mat(3), como indicado abaixo:



0 0 0
a b
12, 3
:= 0 a b .
c d
0 c d

a 0 b
a b
22, 3
:= 0 0 0 ,
c d
c 0 d



a b 0
a b
32, 3
:= c d 0 ,
c d
0 0 0




E. 28.1 Exerccio. Mostre que os tres s definidos acima sao homomorfismos de A 2 em A3 e que sao
os u
nicos homomorfismos desse tipo.
6
Ha entre An e An+1 exatamente n + 1 homomorfismos. O exemplo acima ilustra como os mesmos
sao obtidos: para uma matriz n n a, in, n+1 (a) e uma matriz (n + 1) (n + 1) obtida inserindo-se
em a uma coluna na i-esima posicao e uma linha na i-esima posicao, ambas apenas com zeros:

JCABarata. Curso de Fsica-Matem


atica

in, n+1

a1, 1 . . . a1, n
..
..
..
.
.
.
an, 1 . . . an, n

Vers
ao de 29 de setembro de 2005.

a1, 1
..

a
i1, 1

:= 0

ai, 1

..

.
an, 1

. . . a1, i1
..
..
.
.
. . . ai1, i1
...
0
. . . ai, i1
..
..
.
.
. . . an, i1

0
..
.

Captulo 28

1274/1304

a1, i
..
.

. . . a1, n
..
..
.
.
. . . ai1, n
...
0
. . . ai, n
..
..
.
.
. . . an, n

0 ai1, i
0
0
0 ai, i
..
..
.
.
0 an, i

Uma possvel colecao de morfismos coerentes e dada da seguinte forma. Seja a colecao {i a , a
onde, para a, o ndice ia assume valores em {1, . . . , a + 1}. Sejam An e Am , com n < m, e


m1
m1
in,n ,...,i
:= in,n n+1 . . . m1,
m.
m

Note-se porem que morfismos com ndices {in , . . . , im } distintos podem ainda assim ser identicos. O
que distingue os morfismos entre si e a localizacao das linhas e colunas nulas.
Cada colecao I = {ia , a


} caracteriza (nao univocamente) um limite indutivo algebrico AI .

Suponha que adotemos um sistema indutivo onde I =


com a ordem usual,
E. 28.2 Exerccio.
n+1,...,m
An = Mat(n, ) e onde os morfismos sao dados por n, m
, ou seja, com cada ia assumindo o valor
maximo possvel (ultima linha e coluna de zeros introduzida em cada etapa). Mostre que matrizes como



a b 0
a b
e c d 0
c d
0 0 0


sao equivalentes e que matrizes como

a b
c d

0 0 0
e 0 a b ,
0 c d

nao sao equivalentes.

Vamos considerar outro exemplo. Seja s fixo, s 6= 0, e I = {2n s, n } com a ordem usual.
Seja An = Mat(2n s, ) e seja n m definida da seguinte forma: para todo a Mat(2n s, C),


onde, para uma matriz N N , a,

n m (a) := a
| a {z. . . a},
2mn vezes
aa =

onde 0N e a matriz nula N N e

a 0N
0N a

a 0 N 0N
a a a = 0N a 0 N ,
0N 0N a

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1275/1304

etc. Mais genericamente, para q , q 2 e s , s 6= 0, podemos tomar I = {q n s, n


ordem usual, An = Mat(q n s, ) e n m definida da seguinte forma: para todo a Mat(q n s,


} com a
),

n m (a) := a
{z. . . a} .
| a
mn
q
vezes

O limite indutivo algebrico assim obtido sera caracterizado por q e s: A(q, s).
Vamos agora a mais um exemplo que, num caso especial, engloba o anterior. Seja {q i , qi
2, i } uma seq
uencia de n
umeros naturais positivos maiores ou iguais a 2 e s , s 6= 0. Seja
Q0 = s e Qn := sq1 qn , n 1. Tomemos I = {Qn , n } com a ordem usual, e An = Mat(Qn , )
e n m definida da seguinte forma. Sejam Tn Mat(qn , ), n , n 1, matrizes idempotentes (ou
seja, que satisfazem Tn2 = Tn ) nao nulas e definamos para todo a Mat(Qn , )


n, n+1 (a) = a Tn+1 .


E. 28.3 Exerccio. Verifique que isso define um morfismo de algebra entre Mat(Q n ,
Por que razao a condicao de idempotencia Tn2 = Tn e importante?

) e Mat(Qn+1 ,

).
6

Seja entao para todo m > n


n, m := n, n+1 m1, m .
Pela definicao e claro que os s assim definidos formam uma colecao coerente de morfismos. O limite
indutivo algebrico assim obtido sera aqui denotado por A({q}, s, {T }).
E. 28.4 Exerccio. Verifique que o exemplo anterior, A(q, s), corresponde a tomar-se q n = 2 e Tn = q ,
6
n .


Os exemplos acima serao discutidos com mais detalhe quando tratarmos das algebras AF. Passemos
agora a` seguinte discussao. Se as algebras Ai , i I forem todas algebras de Banach estamos muitas
preciso
vezes interessados em construir um limite indutivo que seja tambem uma algebra de Banach. E
para tal introduzir uma norma conveniente em A a partir das normas das algebras Ai e construir seu
completamento. Ha para tal uma serie de problemas dos quais passaremos a tratar.

O Limite Indutivo de Banach de uma Famlia de Algebras


de Banach
Vamos considerar agora a situacao na qual as algebras Ai sao algebras de Banach com norma k ki .
O sistema (A, ) e dito ser um sistema indutivo normado se todos os i j forem contnuos (ou seja,
limitados) e se tivermos
lim sup ki j kj < .
j

Pelo teorema de Banach-Steinhaus (A, ) e um sistema indutivo normado se e somente se tivermos


lim sup ki j (x)kj < .
j

para todo i e para todo x Ai .

(28.1)

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1276/1304

Podemos fazer de A uma algebra semi-normada definindo


|||[x]||| := lim sup kij (x)kj ,
ji

onde x Ai e um representante de [x].

Precisamos mostrar que a definicao acima independe do representante tomado na classe. Para tal
usaremos a propriedade que denominamos Invariancia por Reducao Inicial do Domnio a` pagina 982.
Sejam x Ai e x0 Ai0 com x x0 e k I tal que (k  i) (k  i0 ) e
ik (x) = i0 k (x0 ).
Definindo para n I

In := {m I| m  n},

tem-se que
k|[x]k| = lim sup kij (x)kj
jIi

e
k|[x0 ]k| = lim sup ki0 j (x)kj .
jIi0

Nota: e um exerccio simples mostrar que In sao tambem conjuntos dirigidos. A definicao de lim sup
pode ser encontrada na Secao 21.3, a` pagina 981.
Dado o conjunto Ii escrevamos Ii = I0 J onde J := Ik e I0 := Ii \ J. Vamos mostrar que os
conjuntos I0 e J satisfazem as condicoes requeridas para a propriedade que denominamos invariancia
por reducao inicial do domnio a` pagina 982:
1. Para todo i0 I0 existe pelo menos um j J tal que i0  j.
2. J e um conjunto dirigido pela mesma relacao de ordem .
3. Para todo j J vale que se l  j entao l J.
A propriedade 2 ja foi observada acima. Se j Ik e l  j entao l  k e portanto l Ik J,
provando 3. Para provar 1 notemos que se i0 Ii entao, como Ii e um conjunto dirigido deve existir
j Ii tal que (j  i0 ) (j  k). A condicao j  k diz que j Ik J, provando 1.
Pela propriedade de invariancia por reducao inicial do domnio tem-se entao que
k|[x]k| = lim sup kij (x)kj = lim sup kij (x)kj .
jIi

jIk

Mutatis mutantis temos tambem que


k|[x0 ]k| = lim sup ki0 j (x0 )kj = lim sup ki0 j (x0 )kj .
jIi0

Porem, para j Ik

jIk

ij (x) = kj ik (x) = kj i0 k (x0 ) = i0 k (x0 ),

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1277/1304

provando finalmente que


k|[x]k| = k|[x0 ]k|.
Uma vez estabelecido que k|[x]k| independe do representante tomado na classe [x] vamos agora
provar que |||[x]||| e de fato uma semi-norma.
Proposi
c
ao 28.1 Para todas as classes [x] e [y] valem:
1. |||[x]||| = || |||[x]|||;
2. |||[x] + [y]||| |||[x]||| + |||[y]|||;
3. |||[x][y]||| |||[x]||| |||[y]|||.
Prova. A prova de 1 e elementar. Para provar 2 notemos o seguinte. Sejam x e y representantes
de [x] e [y], respectivamente, em Ai e Aj , respectivamente. Entao, existe k com (k  i) (k  j) de
forma que
|||[x] + [y]||| = |||[ik (x) + jk (y)]|||
= lim sup kk j 00 (ik (x) + jk (y))k
j 00 k

lim sup ki j 00 (x)k + lim sup kj j 00 (y)k


j 00 k

j 00 k

lim sup ki j 00 (x)k + lim sup kj j 00 (y)k


j 00 i

j 00 j

= |||[x]||| + |||[y]|||.
A prova de 3 e analoga. Sejam x, y, i, j como acima. Entao existe k tal que
|||[x][y]||| = |||[ik (x)jk (y)]|||
= lim sup kk j 00 (ik (x)jk (y))k
j 00 k

lim sup ki j 00 (x)k kj j 00 (y)k


j 00 k

lim sup ki j 00 (x)k


j 00 i



lim sup kj j 00 (y)k


j 00 j

= |||[x]||| |||[y]|||.

O limite indutivo normado de (A, ) e entao definido tomando-se o cociente de A com os vetores
em A com semi-norma ||| ||| igual a zero. Nesse novo espaco ||| k|| induz uma norma que tambem
denotaremos por ||| |||.

JCABarata. Curso de Fsica-Matem


atica

Captulo 28

Vers
ao de 29 de setembro de 2005.

1278/1304

O limite indutivo de Banach, ou simplesmente limite indutivo e definido tomando-se o completa evidente pela
mento do limite indutivo normado de (A, ) na metrica definida pela norma ||| |||. E
construcao que a algebra assim obtida, que denotaremos por A , e uma algebra de Banach.

Seja Ai , i I, uma famlia de algebras C . Uma algebra C A e dita ser um limite indutivo das
algebras Ai se existirem morfismos de algebra C fi : Ai A para todo i I tais que iI Ai seja
denso em norma em A.
Vamos no proximo item mostrar uma situacao geral na qual o limite indutivo de uma famlia de
algebras pode ser construdo.

O Limite Indutivo de Algebras


C
Vamos considerar agora o caso em que as algebras Ai sejam todas algebras C e que os morfismos ij
sejam *-morfismos, ou seja, tais que para todo i, j , i  j, e todo a Ai tenhamos ij (a ) = ij (a) .
Naturalmente que
kij (a a)kj = kij (a )ij (a)kj = kij (a) ij (a)kj = kij (a)k2j
pela propriedade C das algebras Aj .
Em um tal caso diremos que o sistema indutivo (A, ) e um sistema indutivo C .
Definimos no limite indutivo algebrico das algebras Ai a operacao por [x] = [x ]. Vamos mostrar
que essa definicao nao depende do representante tomado na classe [x]. Seja para tal y [x] com x A i
e y Aj e seja k tal que (k  i) (k  j) e ik (x) = jk (y). Segue que ik (x ) = ik (x) =
jk (y) = jk (y ). Isso mostra que x e y sao equivalentes, que e o que se queria provar.
Desejamos agora provar a propriedade C da semi-norma ||| |||. Para tal notemos que, como x e
x pertencem a` mesma algebra (digamos, Ai ) temos [x][x ] = [x x ] (por que?) e assim

|||[x] [x]||| = |||[x x ]||| = lim sup kij (x x )kj =


ji

lim sup kij (x)k2j


ji

lim sup kij (x)kj


ji

2

= |||[x]|||2 .

Isso mostrou que a semi-norma ||| ||| tambem satisfaz a propriedade C e que o limite indutivo de
Banach de um sistema indutivo C e tambem uma algebra C , que denotaremos por A .

Vamos agora construir o sistema de morfismos fi de algebra C mencionado. Seja, para cada i ,
fi : Ai A , dado por Ai 3 x 7 [x] A . Vamos verificar que, para cada i , fi e de fato um
morfismo de algebra C . De fato, para todo x, y Ai temos fi (x+y) = [x+y] = [x]+[y] = fi (x)+fi (y)
(por que? Justifique a segunda igualdade) e fi (xy) = [xy] = [x][y] = fi (x)fi (y) (por que? Justifique
a segunda igualdade). Fora isso, como ja vimos, fi (x ) = [x ] = [x] = fi (x) . Notemos tambem que,
por construcao, i (Ai ) e denso em A e assim A e um limite indutivo C da famlia Ai , i .

Refer
encias Bibliogr
aficas
A lista bibliografica abaixo contem livros-texto onde parte do material contido nestas notas tambem
pode ser encontrado e outros textos cuja leitura e igualmente recomendada.
[1] R. P. Agarwal e V. Lakshmikantham. Uniqueness and Nonuniqueness Criteria for Ordinary Differential Equations. World Scientific (1993).
[2] L. H. Alves Monteiro. Sistemas Din
amicos, (2002). Ed. Livraria da Fsica.
[3] Huzihiro Araki. Mathematical Theory of Quantum Fields. Oxford Science Publications. (1999).
[4] G. Arfken. Mathematical Methods for Physicists. Academic Press Inc. (1970).
[5] V. I. Arnold. Equaco
es Diferenciais Ordin
arias. Editora Mir. (1985).
[6] V. I. Arnold. Mathematical Methods of Classical Mechanics. Second Edition. Springer Verlag. (1989).
Versao em portugues: Metodos Matem
aticos da Mec
anica Cl
assica. Ed. Mir, Moscou (1987).
[7] E. Artin. The Gamma Function. Ed. Holt, Rinehart and Winston, New York (1964).
[8] W. B. Arveson. An Invitation to C -Algebras.
[9] Heinz Bauer. Ma- und Integrationstheorie. Ed. Walter de Gruyter. Berlin, New York. (1992).
[10] F. Brauer and C. Castillo-Chavez. Mathematical Models in Population Biology and Epidemiology.
[11] G. Birkhoff and G. C. Rota. Differential Equations.
[12] R. P. Boas Jr.. Entire Functions. Academis Press. New Yourk. (1954).
[13] H. Bohr. Collected Mathematical Works. In Three Volumes. Dansk Matematisk Forening. Copenhagen. (1952).
[14] W. E. Boyce and R. C. DiPrima. Elementary Differential Equations and Boundary Value Problems.
John Wiley and Sons. New York. (1986).
[15] O. Bratteli and D. W. Robinson. Operator Algebras and Quantum Statistical Mechanics I. Springer
Verlag. (1979).
[16] O. Bratteli and D. W. Robinson. Operator Algebras and Quantum Statistical Mechanics II. Springer
Verlag. (1979).
1279

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1280/1304

[17] G. Cain. Introduction to General Topology.


[18] Mauro S. D. Cattani. Elementos de Mec
anica de Fluidos. Edgard Bl
ucher LTDA, (1989).
[19] J. Cigler und H. C. Reichel. Topologie, Eine Grundvorlesung.
[20] C. Chevalley. Theory of Lie Groups.
[21] R. V. Churchill. Vari
aveis Complexas e suas Aplicaco
es.
[22] E. A. Coddington. An Introduction to Ordinary Differential Equations. Dover Publications, Inc.
New York. (1989).
[23] E. A. Coddington and N. Levinson. Theory of Ordinary Differential Equations.
[24] C. Corduneanu. Almost Periodic Functions. Interscience Publishers - John Wiley & Sons (1968).
[25] R. Courant and F. John. Introduction to Calculus and Analysis. Vol. I Springer Verlag, Berlin,
(2000).
[26] R. Courant and F. John. Introduction to Calculus and Analysis. Vol. II Springer Verlag, Berlin,
(2000).
[27] R. Courant and D. Hilbert. Methods of Mathematical Physics. Vol. I John Wiley & Sons (1989).
[28] R. Courant and D. Hilbert. Methods of Mathematical Physics. Vol. II John Wiley & Sons (1989).
[29] Richard Courant e Herbert Robbins. O que e Matem
atica. Editora Ciencia Moderna.
[30] K. R. Davidson. C -Algebras by Example.
[31] Philip J. Davis. Interpolation & Approximation. Dover Publications Inc. (1975).
[32] J. Dieudonn`e. History of Functional Analysis. North Holland, (1981).
[33] D. G. de Figueiredo. An
alise de Fourier e equaco
es diferenciais parciais. Colecao Euclides. IMPA.
[34] H. M. Edwards Riemanns Zeta Function. Dover Publications Inc. (1974).
[35] J. P. Elliott and P. G. Dawber. Symmetry in Physics.
[36] L. C. Evans. Partial Differential Equations. American Mathematical Society. (1998).
[37] K. J. Falconer The Geometry of Fractal Sets. Cambridge Univ. Press. (1985).
[38] A. Fazzio e K. Watari. Introduca
o a
` Teoria de Grupos.
[39] D. G. de Figueiredo e A. F. Neves. Equaco
es Diferenciais Aplicadas. Colecao Matematica Universitaria. IMPA.
[40] G. Frey. Elementare Zahlenthorie.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1281/1304

[41] J. P. Fernandez. Medida e Integraca


o. Projeto Euclides. IMPA, CNPq. (1976). Livros Tecnicos e
Cientficos, Editora.
[42] A. Galindo e P. Pascual. Quantum Mechanics I. Springer Verlag. (1990).
[43] A. Galindo e P. Pascual. Quantum Mechanics II. Springer Verlag. (1990).
[44] L. Garding. Encontros com a Matem
atica. Ed. Universidade de Braslia. 2a. Edicao (1997).
[45] P. R. Garabedian. Partial Differential Equations. AMS Chelsea Publishing. (1998).
[46] I. M. Gelfand, R. A. Minlos and Z. Ya. Shapiro. Representations of the rotation and Lorentz groups
and their applications.
[47] R. Geroch. Mathematical Physics. The University of Chicago Press. (1985).
[48] J. Glimm and A. Jaffe. Quantum Physics. A Functional Integral Point of View. Second Edition.
Springer-Verlag. (1987).
[49] G. Gratzer. Universal Algebra.
[50] Ronald L. Graham, Donald E. Knuth and Oren Patashnik. Concrete Mathematics - A Foundation
for Computer Science. Addison-Wesley Publishing Company. (1994).
[51] R. Haag. Local Quantum Physics. Second edition. Berlin Heidelberg: Springer Verlag (1996).
[52] P. R. Halmos. Teoria Ingenua dos Conjuntos. Ed. Polgono. (1970).
[53] P. R. Halmos. Measure Theory. Springer Verlag. (2000).
[54] Paul R. Halmos. Espacos Vetoriais de Dimens
ao Finita.
[55] G. H. Hardy and E. M. Wright. An Introduction to the Theory of Numbers. Oxford Univ. Press.
[56] S. W. Hawking and G. F. R. Ellis. The Large Scale Structure of Space-Time. Cambridge Univ.
Press. (1973).
[57] S. Helgason. Geometric Analysis on Symmetric Spaces. Mathematical Surveys and Monographs,
vol. 39. American Mathematical Society. (1991).
[58] E. Henze. Einf
uhrung in die Matheorie.
[59] H. Heuser. Lehrbuch der Analysis. Teil 1. B. G. Teubner, Stuttgart (1993).
[60] H. Heuser. Lehrbuch der Analysis. Teil 2. B. G. Teubner, Stuttgart (1993).
[61] H. Heuser. Funktionalanalysis. B. G. Teubner, Stuttgart.
[62] H. Heuser. Gew
ohnliche Differentialgleichungen. B. G. Teubner, Stuttgart.
[63] J. Hilgert und K.-H. Neeb. Lie Gruppen und Lie Algebren.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1282/1304

[64] E. Hille. Ordinary Differential Equations in the Complex Domain. Dover Publications Inc. (1997).
[65] Morris W. Hirsch, Stephen Smale and Robert L. Devaney. Differential Equations, Dynamical
Systems & An Introduction to Chaos. Elsevier, Academic Press. (2004)
[66] Harry Hochstadt. The Functions of Mathematical Physics. Dover Publications Inc. (1971).
[67] Harry Hochstadt. Differential Equations. A Modern Approach. Dover Publications Inc. (1975).
[68] J. Hofbauer and K. Sigmung. The Theory of Evolution and Dynamical Systems. Cambridge University Press, 1988.
[69] N. Jacobson. Lie Algebras.
[70] T. Kato Perturbation Theory of Linear Operators. Springer Verlag, Berlin-Heidelberg-New York
(1976).
[71] Yitzhak Katznelson. An Introduction to Harmonic Analysis. Dover Publications. (1978).
[72] Louis H. Kauffman. Knots and Physics. World Scientific Pub. Co. 3rd edition (2001).
ements de la Theorie des Representations.
[73] A. Kirillov. El
[74] A. N. Kolmogorov and S. V. Fomin. Introductory Real Analysis.
[75] T. W. Korner Fourier Analysis. Cambridge University Press. (1996).
[76] S. G. Krantz e H. R. Parks The Implicit Function Theorem: History, Theory and Applications.
Birkhauser (2002).
[77] Erwin Kreyszig. Introductory Functional Analysis with Applications. John Wiley and Sons Inc,
(1989).
[78] L. D. Landau e E. Lifchitz Curso de Fsica. Mec
anica. Editora Mir, Moscou.
[79] L. D. Landau e E. Lifchitz. Curso de Fsica. Mec
anica Qu
antica. Editora Mir, Moscou.
[80] L. D. Landau e E. Lifchitz. Mecanique des Fluides. Editora Mir, Moscou (1971).
[81] S. Lang. Algebra.
[82] S. Lang. Complex Analysis. Graduate Texts in Mathematics. Springer-Verlag, New York (1999).
[83] N. N. Lebedev. Special Functions & their Applications. Dover Publications Inc. (1972).
[84] T. D. Lee. Particle Physics. An Introduction to Field theory.
[85] Elliot H. Lieb and Michael Loss. Analysis.
[86] Elon L. Lima. Espacos Metricos. Projeto Euclides. IMPA, CNPq. (1977). Livros Tecnicos e Cientficos, Editora.

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1283/1304

[87] Elon L. Lima. Curso de An


alise. Vol. 1. Projeto Euclides. IMPA, CNPq. (1976). Livros Tecnicos
e Cientficos, Editora.
[88] Elon L. Lima. Curso de An
alise. Vol. 2. Projeto Euclides. IMPA, CNPq. (1981). Livros Tecnicos
e Cientficos, Editora.
[89] R. S. MacKay and J. D. Meiss, editors. Hamiltonian Dynamical Systems. A reprint selection.
Adam Hilger, Bristol and Philadelphia. (1987).
[90] W. Magnus und F. Oberhettinger. Formel und S
atze f
ur die speziellen Funktionen der mathematischen Physik. Springer Verlag, (1948).
[91] G. Meinardus. Approximation von Funktionen und ihre numerische Behandlung. Springer-Verlag.
Berlin, Gottingen, Heidelberg, New York. (1964).
[92] Richard K. Miller. Non-linear Volterra Integral Equations. W. A. Benjamin, Inc. (1971).
[93] F. Miraglia. Teoria dos Conjuntos. Um Mnimo. Edusp 1991.
[94] D. S. Mitrinovic, J. E. Pecaric and A M Fink. Inequalities for functions and their integrals and
derivatives Kluver (1994)
[95] M. E. Munroe. Introduction to Measure and Integration. Addison-Wesley Publishing Company,
Inc. (1953).
[96] Gerard J. Murphy. C -Algebras and Operator Theory. Academis Press. (1990).
[97] M. Naimark et A. Stern. Theorie des Representations des Groups. Editions Mir. URSS. (1979).
[98] M. Nakahara. Geometry, Topology and Physics.
[99] H. M. Nussenzveig. Curso apresentado na 1a Escola de Verao Jorge Andre Swieca Partculas
e Campos. (1981). Editado pela Sociedade Brasileira de Fsica. Edts. G. da C. Marques e R. C.
Shellard.
[100] I. G. Petrovsky. Lectures on Partial Differential Equations. Dover Publications Inc. (1991).
[101] L. S. Pontriaguin. Continuous Groups.
[102] D. Porter and D. S. G. Stirling. Integral Equations. Cambridge U. P. (1990).
[103] M. Reed and B. Simon. Methods of Modern Mathematical Physics. Vol. 1: Functional Analysis.
Academic Press. New York. (1972-1979).
[104] M. Reed and B. Simon. Methods of Modern Mathematical Physics. Vol. 2: Fourier Analysis,
Self-Adjointness. Academic Press. New York. (1972-1979).
[105] M. Reed and B. Simon. Methods of Modern Mathematical Physics. Vol. 3: Scattering Theory
Academic Press. New York. (1972-1979).
[106] M. Reed and B. Simon. Methods of Modern Mathematical Physics. Vol. 4. Academic Press. New
York. (1972-1979).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1284/1304

[107] Reinhild Remmert Classical Topics in Complex Function Theory. Graduate Texts in Mathematics. Springer-Verlag, New York (1998).
[108] F. Riesz and B. Sz.-Nagy. Functional Analysis. Dover Inc, (1955).
[109] H. L. Royden. Real Analysis. Prentice Hall, Inc. (1988).
[110] W. Rudin. Real and Complex Analysis. McGraw-Hill Internatinal Editions. (1987).
[111] W. Rudin. Functional Analysis.
[112] H. Sagan. Boundary and Eigenvalue Problems in Mathematical Physics.
[113] J. J. Sakurai. Modern Quantum Mechanics Revised version. Addison-Wesley. (1994).
[114] J. J. Sakurai. Advanced Quantum Mechanics. Addison-Wesley. (1967).

[115] Luiz A. B. San Martin. Algebras


de Lie.
[116] G
unter Sharf. Quantum Gauge Theories. A True Ghost Story. John Wiley and Sons, Inc. (2001).
[117] A. Schonhage. Approximationstheorie. Walter de Gruyter & Co. Berlin. New York. (1971).
[118] W. R. Scott. Group Theory.
[119] B. Simon. Representations of Finite and Compact Groups. Graduate Studies in Mathematics, vol.
10. Americam Mathematical Society. (1996).
[120] G. F. Simmons. Topology and Modern Analysis.
[121] L. J. Slater. Confluent Hypergeometric Functions. Cambridge University Press. (1960).
[122] J. Sotomayor. Lico
es de equaco
es diferenciais ordin
arias. Projeto Euclides. (1979).
[123] M. Spivak. Calculus.
[124] P. Suppes. Axiomatic Set Theory. Dover Publications Inc.
[125] A. F. Timan. Theory of Approximation of Functions of a Real Variable. Dover Publications Inc.
(1994).
[126] E. C. Titchmarsh. Theory of Functions. Oxford University Press, London and New York. (1939).
[127] E. C. Titchmarsh. (Revised by D. R. Heath-Brown). The Theory of the Riemann Zeta-Function.
Claendon Press, Oxford. (1986).
[128] F. G. Tricomi. Integral Equations. Dover Publications Inc.
[129] N. Ya. Vilenkin. Representations of Lie Groups and Special Functions. Kluwer (1993).
[130] F. W. Warmer. Foundations of Differentiable Manifolds and Lie Groups. Springer Verlag. (1983).

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1285/1304

[131] G. N. Watson. A Treatise on the Theory of Bessel Functions. Second Edition. Cambridge University Press. (1966).
[132] Hermann Weyl. The Theory of Groups and Quantum Mechanics.
[133] B. Van der Waerden. Die gruppentheoretische Methode in der Quantenmechanik. Springer Verlag,
Berlin, (1932).
[134] S. Weinberg. The Quantum Theory of Fields. Vol. I. Foundations. Cambridge Univ. Press. (1995).
[135] S. Weinberg. The Quantum Theory of Fields. Vol. II. Modern Applications. Cambridge Univ.
Press. (1996).
[136] E. T. Whittaker and G. N. Watson. A Course of Modern Analysis.
[137] Eugene P. Wigner. Group Theory and Quantum Mechanics. (1931).
[138] K. Yosida. Functional Analysis Springer Verlag.
[139] N. Young. An Introduction to Hilbert Space.
[140] Y. Z. Zhang. Special Relativity and its Experimental Foundations. World Scientific (1997).
[141] D. Zwillinger Handbook of Differential Equations. Academic Press, Inc. (1989).

Indice Remissivo
B(V, W) e um espaco de Banach se W o for,
1121
A-modulo a` direita, 60
A-modulo a` esquerda, 59
Lp (M, d), p 1, sao espacos vetoriais complexos e normados, 1044
-algebra, 915
n-forma, 108
n-forma linear, 108
n-forma multilinear, 108
L 3222378+ e um Sub-grupo Normal de L, 738
L1 (M, d) e um espaco vetorial complexo, 1040
e um anel de divisao, 92
+ estendido, 50

Algebras, 56, 1266

Algebras
Associativas, 1152

Algebras Associativas e Nao-Associativas, 1267

Algebras
Booleanas, 1261

Algebras com Involucao, 1153

Algebras
de Banach, 1154

Algebras
de Banach-, 1154

Algebras de Divisao, 61

Algebras
de Lie, 57, 1267

Algebras
de Lie Nilpotentes, 796

Algebras de Lie Simples e Semi-Simples, 797

Algebras
de Lie Sol
uveis, 797

Algebras C , 1154
Indices de uma equacao diferencial em um ponto,
382
Indices e equacoes Fuchsianas, 383
Infimo e Supremo, 35

Orbita
de uma acao, 64
algebra Abeliana, 57
algebra associativa, 57
algebra comutativa, 57
algebra de Lie, 57
algebra de divisao , 61

algebra dos quaternions, 90


algebra quaternionica, 90
algebras de Lie, 57
algebras de Lie nilpotentes, 249
orbita, 64
ndices, 382
ndices de uma equacao diferencial, 382
nfimo, 35
chessboard transformation, 145

A -Algebra
Induzida, 931

A -Algebra Produto, 932


A -algebra de Borel, 924
A algebra das funcoes mensuraveis, 1052
A algebra das funcoes simples, 1021
A algebra de Heisenberg gh3 ( ), 678
A algebra de Heisenberg ghn ( ), n 3, 680
A Adjunta de uma Matriz, 180
A Aplicacao Diferencial Exponencial dexp, 245
A cardinalidade de C1/3 , 963
A Colecao de todos os Geradores de Sub-grupos
Uniparametricos, 784
A condicao (8.84) e a constante A, 423
A condicao de Lipschitz, 889
A construcao do operador g(A), 1227
A Construcao GNS, 1186
A Construcao GNS. Um exemplo, 1189
A Convencao que c = 1, 726
A decomposicao de vetores em bases ortogonais
completas, 1103
A Decomposicao Polar de Operadores Limitados
em Espacos de Hilbert, 1182
A Definicao de Medida, 941
A desigualdade de Bessel, 1100
A Desigualdade de Cauchy para Seq
uencias. Um
produto escalar para `2 , 861
A Desigualdade de Cauchy-Schwarz, 114

1286

JCABarata. Curso de Fsica-Matem


atica

A desigualdade de Cauchy-Schwarz. Um produto escalar em L2 (M, d), 1045


A Desigualdade de Holder. Demonstracao, 858
A Desigualdade de Minkowski, 116
A Desigualdade de Minkowski. Demonstracao,
860
A desigualdade de Young, 866
A Desigualdade Triangular, 124
A equacao de Airy e a equacao de Bessel, 439
A equacao de Bernoulli, 287
A equacao de Bessel esferica, 440
A equacao de difusao, 545
A equacao de Euler, 361
A Equacao de Helmholtz em duas dimensoes em
coordenadas polares, 547
A Equacao de Helmholtz em tres dimensoes em
coordenadas esfericas, 552
A equacao de Laguerre generalizada, 522
A Equacao de Laplace em duas dimensoes em
coordenadas polares, 546
A Equacao de Laplace em tres dimensoes em
coordenadas esfericas, 549
A equacao de onda, 544
A equacao de Riccati generalizada, 288
A equacao nao-homogenea, 338
A Estrutura Causal. Transformacoes que Preservam a Estrutura Causal, 723
A estrutura linear dos conjuntos `p , 855
A estrutura linear dos espacos Lp (M, d), 1042
A formula dos complementos, 465
A Forma Determinante, 112
A Forma Geral das Matrizes de SU(2), 699
A Forma Geral das Solucoes, 349
A forma geral das solucoes no caso de singularidades simples, 356
A funcao e o fatorial, 458
A funcao caracterstica de um conjunto, 1017
A funcao degrau, ou funcao de Heaviside, 330
A funcao geratriz das funcoes de Bessel, 527
A funcao geratriz dos polinomios de Legendre,
498
A funcao geratriz dos polinomios de Legendre
associados, 505
A funcao geratriz exponencial dos polinomios de
Hermite, 512

Vers
ao de 29 de setembro de 2005.

Captulo 28

1287/1304

A funcao geratriz exponencial dos polinomios de


Laguerre, 517
A funcao geratriz exponencial dos polinomios de
Laguerre associados, 521
A Identidade de Polarizacao, 125
A integracao de Lebesgue e conjuntos de medida
zero, 1026
A integral de Riemann impropria e sua relacao
com a de Lebesgue em , 1033
A inversa em algebras de Banach, 1158
A Multiplicidade Algebrica e a Multiplicidade
Geometrica, 151
A Multiplicidade Geometrica de um Autovalor,
151

A Nocao de -Algebra
Gerada, 923
A Nocao de Cardinalidade de Conjuntos, 37
A nocao de espectro de operadores em algebras
de Banach, 1161
A nocao de ponto singular simples para EDOs
de ordem m, 358
A Nocao de Produto Tensorial de Dois Espacos
Vetoriais, 78
A Nocao de Produto Tensorial de Dois Grupos,
77
A Nocao de Soma Direta de Dois Espacos Vetoriais, 77
A Nocao de Soma Direta de Dois Grupos, 77
A Nocao de Topologia Gerada, 920
A Nocao Usual de Continuidade na Reta Real,
991
A Norma Associada a um Produto Escalar, 123
A Norma de Operadores Auto-Adjuntos Limitados, 1151
A notacao de Dirac, 1243
A raiz quadrada de um operador compacto, autoadjunto e positivo, 1211
A raiz quadrada de um operador positivo e a
unidade, 1181
A recuperacao de um observavel a partir dos
seus valores esperados em estados puros,
1252
A regra de composicao para D(t, s), 319
A relacao entre D(t, s) e D(t), 319
A relacao entre Jn e J0 , n , 526
A relacao entre jn e j0 , n , 538


JCABarata. Curso de Fsica-Matem


atica

A Relacao entre V e V 0 , 103


A Relacao entre ad e Ad, 243
A Relevancia de L+ , L 3222378 e L+ 3222378
na Fsica, 737
A representacao normal, 1020
A representacao produto de Euler para , 464
A representacao produto de Gauss para , 460
A representacao produto de Weierstrass para ,
463
A Representacao Trivial, 808
A serie de Dyson no plano complexo, 334
A Soma Direta de Dois Espacos de Banach, 1135
A Soma Direta de dois Espacos Vetoriais, 81
A Soma Direta de dois Grupos Abelianos, 81
a soma direta dos espacos vetoriais U e V sobre
o corpo , 81
A Topologia e Separavel, 927
A Topologia de Sorgenfrey de , 922
A Topologia de Sorgenfrey nao e uma Topologia
Metrica, 928
A Topologia Fraca de uma Colecao de Funcoes,
1076
A Topologia Gerada por um Ordenamento Total, 929
A Topologia Induzida (ou Relativa), 930
A Topologia Produto de Espacos Topologicos,
932
A Uniao Disjunta de uma Famlia Arbitraria de
Conjuntos, 27
Acao a` direita de G sobre (G/H)r , 69
acao a` direita de G sobre M , 63
Acao a` esquerda de G sobre (G/H)l , 68
acao a` esquerda de G sobre M , 62
Acoes, 62
Acoes a` direita e a` esquerda sobre o coset por
um subgrupo normal, 70

Acoes de uma Algebra


Universal sobre uma ou
tra Algebra Universal, 1268
Abeliano, 47
Abertos densos, 1071
Abertos e Fechados, 918
Advertencia, 984
age transitivamente, 64
Ainda mais exemplos de conjuntos de Cantor
(com uma surpresa), 969


Vers
ao de 29 de setembro de 2005.

Captulo 28

1288/1304

algoritmo de Euclides, 49, 52


Alguma Notacao, 143
Algumas consideracoes gerais sobre teorias fsicas,
1244
Algumas Propriedades Basicas de Formas Lineares Alternantes, 110
Algumas Propriedades de Funcoes Analticas de
Matrizes, 233
Alguns esclarecimentos, 1024
Alguns Exemplos, 1273
Alguns exemplos e contra-exemplos, 1199
Alguns Fatos sobre Grupos Topologicos, 776
Aneis, 56, 1263
Aneis com Unidade, 60, 1263
Aneis de Divisao, 61, 1264
Aneis de Integridade, 61
Aneis sem Divisores de Zero, 60, 1263
Analisando alguns casos explcitos, 372, 378
Analiticidade da solucao, 338
anel, 56
anel com unidade, 60
anel de divisao , 61
Anel de Integridade, 1264
anel de integridade, 61
anel sem divisores de zero, 60
Anti-comutatividade, 57
anti-homomorfismo, 66, 67
anti-morfismo de espacos vetoriais, 67
Anti-simetria., 59
aplicacao diferencial exponencial, 246
Aplicacao para funcoes numericas, 1050
aplicacao quociente a` direita, 68
aplicacao quociente a` esquerda, 67
Aplicacoes diferenciaveis em espacos de Banach.
A derivada de Frechet, 1011
aplicacoes lineares, 66
Aplicacoes, Mapeamentos, Mapas, Funcionais,
Operadores, Operacoes, Produtos etc.,
23
As Aplicacoes Ad, 243
As Aplicacoes ad, 242
As desigualdades de Holder e Minkowski para
seq
uencias, 856
As equacoes de Helmholtz e de Laplace, 546
As Equacoes Integrais de Fredholm , 890

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

As Equacoes Integrais de Volterra, 892


As funcoes de Airy de primeiro e de segundo
tipo, 405
As funcoes de Green para as condicoes iniciais,
556, 559, 563, 566
As integrais de Riemann e Lebesgue em intervalos compactos, 1032
As Metricas dp em n , 862
As Matrizes de Pauli, 698
As relacoes de ortogonalidade das funcoes de
Bessel no intervalo [0, 1], 533
Associatividade., 46
automorfismo, 66, 74
automorfismo interno, 66
Automorfismos de SL( , 2), 746
Automorfismos descontnuos do grupo ( , +),
98
autovalores, 148
Autovalores de L2 , 816
Autovalores de Operadores Compactos Auto-adjuntos,
1215
Autovalores e autovetores de operadores autoadjuntos, 1148
Autovalores e autovetores de operadores limitados. Multiplicidade de um autovalor,
1147
Autovalores e autovetores de operadores unitarios,
1148
autovetor, 150
Autovetores, 150
axioma da escolha, 99


base algebrica, 96
base de Hamel, 97, 99
Base de uma Topologia, 924
base integral, 317
Base ortonormal completa de autovetores de um
operador compacto auto-adjunto, 1220
base topologica, 100
base topologica completa, 100
Bases Algebricas em Espacos Vetoriais, 96
bases de Hamel, 99
Bases ortonormais completas, 1101
Bases ortonormais completas e bases topologicas,
1106

Captulo 28

1289/1304

Bases Topologicas em Espacos Vetoriais, 100


bimodulo, 60
Bolas Abertas em Espacos Metricos, 846
C-compatveis, 30
C-incompatveis, 30
calculo funcional, 168
Calculando det( k), 657
Carateres de Grupos Finitos, 826
Carateres e Funcoes Centrais, 824
caracterstica , 54
Caracterstica de um Corpo, 54
cardinalidade, 37
Caso diagonalizavel, 321
Caso nao-diagonalizavel, 321
centralizador, 72
Centralizadores e Normalizadores, 72
centro do grupo, 71
Certas extensoes contnuas de funcoes, 1082
Ciclos, 668
Classe de Conjugacao, 825
classe de equivalencia, 29
Classificacao de equacoes lineares de segunda ordem, 586
Colchetes de Poisson, 59
colchetes de Poisson, 59
combinacao linear, 96
Combinacoes Lineares, 96
Comentario ao Teorema 17.6. Continuidade em
relacao a`s condicoes iniciais, 905
Comentario ao Teorema 17.6. Continuidade por
mudancas de parametros, 906
Comentario final sobre as series perturbativas,
330
Comentario sobre a equacao de Bessel no intervalo J = [0, ), 536
Comentario Sobre a Notacao, 46, 1259
Comentario sobre autovalores negativos, 625
Comentario sobre Matrizes Bijetoras, 149
Comentarios e Nomenclatura, 915
Comentarios sobre solucoes globais. O Exemplo
5.10, 283
Comentarios sobre solucoes globais. O Exemplo
5.13, 284
Complementos ortogonais, 1092

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Completeza, 838
Completeza de Espacos Metricos e sua Topologia, 847
Componentes conexas, 1074
Comutatividade e Associatividade, 1259
comutativo, 47
Condicao de Dirichlet, 595
Condicao de Neumann, 595
Condicao mista, 595
Condicao para os conjuntos C{f } (F ) terem medida de Lebesgue nao-nula, 971
Condicoes de contorno homogeneas caracterizam
um espaco vetorial, 610
Condicoes de contorno lineares e homogeneas,
607
Condicoes de contorno nao-homogeneas caracterizam um espaco convexo, 610
Condicoes de Dirichlet, 591, 593, 598, 602
Condicoes de Neumann, 591, 594, 598, 602
Condicoes mistas, 598, 603
conjunto das partes de X, 22
conjunto dirigido, 32
conjunto limitado inferiormente, 35
conjunto limitado superiormente, 35
conjunto parcialmente ordenado, 30
conjunto resolvente, 147
Conjuntos Abertos em Espacos Metricos, 845
Conjuntos Bem-Ordenados, 34
Conjuntos conexos, 1073
Conjuntos Contaveis, 38
Conjuntos contaveis da reta real tem medida de
Lebesgue nula, 959
Conjuntos convexos, 1090
Conjuntos de Cantor, 1075
conjuntos de Cantor, 40
Conjuntos densos, 1070
Conjuntos Densos em Espacos Metricos, 841
Conjuntos densos em parte alguma, 1070
Conjuntos densos em si mesmo, 1071
Conjuntos desconexos, 1072
Conjuntos Dirigidos, 32
Conjuntos fechados em espacos de Hilbert, 1089
Conjuntos Fechados em Espacos Metricos e Completeza, 937
Conjuntos Limitados, 35

Captulo 28

1290/1304

Conjuntos ortonormais, 1095


Conjuntos ortonormais e series convergentes, 1098
Conjuntos perfeitos, 1071
Conjuntos totalmente desconexos, 1075
Conseq
uencias do Teorema de Hahn-Banach para
espacos vetoriais normados, 1132
Consideracoes gerais sobre operadores em espacos
de Hilbert, 1142
constante de Euler-Mascheroni, 430
constante de Lipschitz, 282
constante de separacao, 588
Continuidade, 128
Continuidade da norma e do produto escalar,
1090
Continuidade de operacoes algebricas em algebras
de Banach, 1154
Continuidade e Convergencia em Espacos Metricos,
994
Continuidade e Convergencia em Espacos Topologicos Gerais, 995
Continuidade por partes, 992
Convergencia de seq
uencias de conjuntos, 44
Convergencia em espacos metricos, 834
Convexidade de e de ln , 457
corpo, 51
Corpos, 61, 1264
Corpos e Aneis de Integridade, 62, 1265
Corpos Nao-comutativos, 61, 1265
corpos nao-comutativos, 62
coset, 70
coset a` direita, 68
coset a` esquerda, 67
Cosets a` direita, ou right cosets, 68
Cosets a` esquerda, ou left cosets, 67
Cosets por subgrupos normais, 70
Criterio de Lebesgue para integrabilidade de Riemann, 1007
curva envoltoria, 302
De volta ao polinomio mnimo, 161
decomposicao KAN , 212
decomposicao de Iwasawa, 212
decomposicao espectral, 166
Deficiencias da integral de Riemann, 1008
Definicao do problema, 611

JCABarata. Curso de Fsica-Matem


atica

Definicao geral de EDOs, 261


Definindo a Exponenciacao de ad, 243
Definindo a funcao gama, 454
Dependencia Linear, 95
derivacao, 84
Derivada de uma exponencial em relacao a um
parametro, 255
derivada normal, 595
Derivadas parciais, 1015
Desigualdade de Cauchy-Schwarz, 114, 118
Desigualdade de Minkowski, 116
desigualdade triangular, 122, 124
Desigualdades envolvendo somas de potencias,
867
Detalhando a definicao de produto escalar, 117
determinante, 113
Determinante de Matrizes, 113
determinante Wronskiano, 292
Diagonalizacao de Matrizes, 163
Diagonalizabilidade de Projetores, 175
diferenca simetrica, 22
Diferenciacao e integracao de funcoes de uma
variavel real, 1012
Dilatacoes, 724
dimensao, 96
Dimensao Algebrica, 96
dimensao algebrica, 96
dimensao algebrica finita, 96
dimensao topologica, 100
divisor de zero, 60
Dois Resultados sobre o Grupo de Lorentz, 735
domnio de integridade, 61
dual algebrico, 105
dual topologico, 102
elemento maximal, 34
elemento minimal, 34
Elemento neutro., 47
Elementos de Matriz dos Geradores L1 , L2 e L3 ,
818
Elementos Maximais e Minimais, 34
endomorfismo, 66, 67
Enunciado e Demonstracao do Teorema da Decomposicao de Jordan, 198
epimorfismo, 66

Vers
ao de 29 de setembro de 2005.

Captulo 28

1291/1304

equacao a coeficientes constantes, 264


equacao analtica no infinito, 363
Equacao de Airy, 268
equacao de Airy, 404
equacao de Bernoulli, 288
Equacao de Bessel, 268
equacao de Bessel, 427
equacao de Bessel esferica, 440
Equacao de Chebyshev, 268
equacao de Chebyshev, 406
equacao de Clairaut, 301
equacao de DAlembert, 301
Equacao de Euler, 267
equacao de Euler, 361, 424
Equacao de Gauss, 268
equacao de Gau, 443
Equacao de Hermite, 268
equacao de Hermite, 401
Equacao de Hill, 267
Equacao de Kummer, 269
equacao de Kummer, 447
equacao de Lagrange, 301
Equacao de Laguerre, 268
equacao de Laguerre, 441
Equacao de Laguerre associada, 268
equacao de Laguerre associada, 452
equacao de Laguerre generalizada, 522
Equacao de Legendre, 268
equacao de Legendre, 398
equacao de Legendre associada, 268, 450
Equacao de Mathieu, 267
equacao de ondas livres, 603
equacao de Papperitz, 388
equacao de Riemann, 388
Equacao de Riemann-Papperitz, 387
equacao de Riemann-Papperitz, 388
equacao de van der Pol, 262
equacao diferencial exata, 300
equacao diferencial homogenea, 264
equacao diferencial implcita, 261
equacao diferencial nao-homogenea, 264
equacao diferencial ordinaria de ordem n, 261
equacao exata, 296
equacao Fuchsiana, 370
Equacao Hipergeometrica, 268

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

equacao hipergeometrica, 443


Equacao Hipergeometrica Confluente, 269
equacao hipergeometrica confluente, 447
equacao indicial, 416
Equacao linear de segunda ordem e homogenea,
267
Equacao linear de segunda ordem nao-homogenea,
267
equacao separavel, 290
Equacoes com apenas um ponto singular simples
finito em z = 0, 376
Equacoes com apenas um ponto singular simples
no infinito, 371, 376
equacoes com retardo, 266
equacoes de Riccati, 290
equacoes de Riccati generalizadas, 288
Equacoes Diferenciais de Segunda Ordem e as
Equacoes Integrais de Volterra, 893
Equacoes diferenciais ordinarias com retardo, 266
Equacoes diferenciais ordinarias lineares, 263
Equacoes diferenciais ordinarias lineares a coeficientes constantes, 264
Equacoes exatas de ordem n, 299
Equacoes exatas de primeira ordem, 296
Equacoes Fuchsianas, 370
equacoes Fuchsianas, 370
Equacoes Fuchsianas com tres singularidades,
385
Equacoes Fuchsianas de primeira ordem. Caso
geral, 371
Equacoes Fuchsianas de segunda ordem. Caso
geral, 376
Equacoes lineares homogeneas e nao-homogeneas,
264
Equacoes Matriciais, 315
Equacoes Matriciais Complexas, 339
Equacoes Numericas, 884
Equacoes sem pontos singulares, 371, 375
Equivalencia entre equacoes de ordem n e sistemas de EDOs, 272
Equivalencia entre Normas, 122
Equivalencia entre normas matriciais, 225
Equivalencia entre Semi-Normas, 123
escalares, 52, 56
esfera unitaria, 509

Captulo 28

1292/1304

espaco de Cantor, 43
espaco homogeneo, 64, 68, 69
espaco quociente, 95
Espacos de Banach, 850
Espacos de Hilbert, 851
Espacos de Hilbert sao reflexivos, 1124
Espacos de Hilbert separaveis, 1107
Espacos metricos e outros exemplos basicos, 832
Espacos Metricos. O Completamento Canonico,
841
Espacos Reflexivos, 1124
Espacos Topologicos Separaveis e Espacos Topologicos Segundo-Contaveis, 926
Espacos Vetoriais, 1265
espectro, 147

Estados em Algebras
C , 1185
estrelas binarias, 524
estrutura, 45
estrutura algebrica, 46
estrutura complexa, 133
estrutura relacional, 46
Estruturas, 45, 1258
Exemplo de Operador Nao-Limitado. O Funcional Delta de Dirac, 1117
Exemplos, 31, 75, 136, 814, 942
Exemplos basicos de -algebras, 917

Exemplos Basicos de Algebras


de Lie, 58
Exemplos basicos de topologias, 917
Exemplos de equacoes diferenciais parciais de interesse, 586
Exemplos de Formas Sesquilineares e Produtos
Escalares, 119
Exemplos de Funcionais Lineares, 102
Exemplos e contra-exemplos, 911
Exemplos Simples, 48
Exemplos. A integral de Lebesgue em , 1031
Exemplos. Integracao com a medida de contagem. Relacao com os espacos `p , 1031
Exemplos. Integracao com a medida delta de
Dirac, 1030
Existencia de extensoes majoradas por funcionais convexos, 1127
expansao binomial, 480
Expansao de multipolos, 551
expansoes do determinante em cofatores, 145


JCABarata. Curso de Fsica-Matem


atica

Exponenciacao e algebras de Lie matriciais. Um


contra-exemplo, 803
Exponenciais de Matrizes. Comutatividade, 231
Exponenciais e Logaritmos de Matrizes, 230
extensao, 27
Extensoes de Funcoes, 27
Extensoes de Operadores, 1119
Formula de adicao das funcoes de Bessel, 528
formula de adicao das funcoes de Bessel, 528
Formula de Baker-Campbell-Hausdorff, 222
formula de Baker-Campbell-Hausdorff, 244
Formula de Duhamel, 222, 254
formula de Duhamel, 255
formula de duplicacao da funcao Gama, 468
Formula de duplicacao de Legendre, 468
Formula de Lie-Trotter, 222
formula de Lie-Trotter, 239
formula de Rodrigues, 489
formula de Rodrigues dos polinomios de Hermite, 514
Formula de Rodrigues para os polinomios de
Hermite, 513
Formula de Rodrigues para os polinomios de Laguerre, 516
formula de Rodrigues para os polinomios de Laguerre, 516
Formula de Rodrigues para os polinomios de Legendre, 496
formula de Rodrigues para os polinomios de Legendre, 452, 497
Formula do comutador, 222
formula do comutador, 239
formula dos complementos, 457, 466
formulas de recorrencia para os polinomios de
Laguerre, 517
formulas de recorrencia para os polinomios de
Laguerre associados, 521
famlia de conjuntos, 25
Famlias de Conjuntos, 25
Famlias de Pseudo-Metricas, 850
fator integrante, 298
Fatos basicos sobre o espectro de operadores em
algebras de Banach e Banach-, 1161
Fatos gerais sobre a inversa de operadores em

Vers
ao de 29 de setembro de 2005.

Captulo 28

1293/1304

B(X), 1156
Fecho, 933
Fecho de Conjuntos em Espacos Metricos, 936
Fechos e complementos ortogonais, 1094
forma alternante, 109
forma anti-simetrica, 109
forma bilinear nao-degenerada, 109
forma bilinear nao-singular, 109
forma canonica da matriz nilpotente, 204
forma canonica de Jordan, 191
forma canonica de Jordan da matriz, 206
forma canonica de Liouville, 484
forma canonica de matrizes nilpotentes, 194
forma determinante, 112
forma sesquilinear, 113
forma sesquilinear Hermitiana, 114
forma sesquilinear nao-degenerada, 114
forma sesquilinear nao-singular, 114
forma sesquilinear positiva, 114
forma volume, 112
Formas Alternantes, 109
Formas Alternantes Maximais, 111
formas alternantes maximais, 111
Formas Bilineares, 108
formas bilineares, 108
Formas Bilineares em n , 130
Formas Bilineares em n , 130
Formas Bilineares Nao-Degeneradas, 109
Formas Bilineares Nao-Singulares, 109
Formas invariantes de spinores, 752
Formas sesquilineares bicontnuas, 1227
Formas Sesquilineares em n , 129
Formas Sesquilineares Hermitianas em n , 131
Formas sesquilineares nao-singulares, 114
Formas Sesquilineares Positivas e Produtos Escalares, 118
Formas Sesquilineares. Definicoes, 113
Formas Simpleticas, 110, 131
formas simpleticas, 110
Formas simpleticas reais e produtos escalares reais, 133
Fronteira ou Bordo, 935
funcao beta, 465
Funcao Beta. Propriedades elementares, 464
funcao de Bessel de primeiro tipo e ordem (q +


JCABarata. Curso de Fsica-Matem


atica

1/2), 436
funcao de Bessel de primeiro tipo e ordem 0, 429
funcao de Bessel de primeiro tipo e ordem , 428
funcao de Bessel de primeiro tipo e ordem p, 431
funcao de Bessel de primeiro tipo e ordem q +
1/2, 434
funcao de Bessel de segundo tipo e ordem 0, 430
funcao de Bessel de segundo tipo e ordem , 429
funcao de Bessel de segundo tipo e ordem p, 433
funcao de Heaviside, 330
funcao de Kummer, 448
funcao de Neumann, 429
funcao de Neumann de ordem 0, 430
funcao de Neumann de ordem p, 433
funcao degrau, 330
funcao finitaria, 45
funcao gama, 453
funcao gama de Euler, 453
funcao geratriz, 491
funcao geratriz de Dirichlet, 492
funcao geratriz dos polinomios de Legendre associados, 505
funcao geratriz exponencial, 491
funcao geratriz exponencial dos polinomios de
Laguerre, 518
funcao hipergeometrica, 445
funcao hipergeometrica confluente, 448
funcao zeta de Riemann, 492
Funcoes, 23
Funcoes Analticas de Matrizes, 228
funcoes binarias, 45
Funcoes com valores em espacos de Banach. Integrabilidade de Riemann, 1004
Funcoes complexas integraveis, 1028
Funcoes complexas mensuraveis, 1054
Funcoes contnuas sao integraveis por Riemann,
1003
funcoes de Airy, 406
funcoes de Bessel de ordem , 438
funcoes de Bessel de primeiro tipo e ordem ,
438
funcoes de Bessel de segundo tipo e ordem ,
438
funcoes de Bessel esfericas, 427, 440
funcoes de Neumann de ordem , 438

Vers
ao de 29 de setembro de 2005.

Captulo 28

1294/1304

funcoes de Neumann de ordem q + 1/2, 436


funcoes de Neumann esfericas, 440
Funcoes definidas por sups e infs, 1019
funcoes especiais, 397
Funcoes Finitarias, 45, 1257
Funcoes geratrizes, 491
Funcoes geratrizes de Dirichlet, 491
Funcoes geratrizes exponenciais, 491
Funcoes integraveis, 1027
Funcoes mensuraveis complexas, 1019
Funcoes mensuraveis e funcoes simples, 1022
Funcoes mensuraveis entre espacos topologicos,
1050
Funcoes mensuraveis. Definicao e comentarios,
1017
Funcoes simples, 1021
Funcoes Sobrejetoras, Injetoras e Bijetoras, 24
funcoes unarias, 45
Funcionais lineares, 1109
Funcionais lineares contnuos, 1109

Funcionais Lineares em Algebras


C , 1184
Funcionais lineares limitados, 1109
Funcionais sub-aditivos, sub-lineares e convexos,
1127
funcional linear, 101
GL(
GL(
GL(
GL(
GL(

,
,
,
,
,

n) e Grupo de Lie, 781


n) e um Grupo Topologico, 779
n) e uma Variedade Analtica, 780
n) e denso em Mat( , n), 779
n) e um Conjunto Aberto de Mat( , n),
778
grandes ondas de gravitacao, 580
Grandes ondas de gravitacao e a propagacao de
ondas em tanques rasos, 578
grupo, 47
grupo Abeliano livremente gerado por X, modulo
as relacoes R, 80
Grupo Abeliano Livremente Gerado por um Conjunto, 79
grupo Abeliano livremente gerado por um conjunto X, 79
grupo afim, 76
Grupo de Borel, 190
grupo de Grothendieck, 86

JCABarata. Curso de Fsica-Matem


atica

grupo de Heisenberg, 249


grupo de homotopia, 88
grupo quociente de G por N , 71
Grupos, 47, 1262
Grupos de Lie, 775
Grupos de Lie Nilpotentes, 799
Grupos de Permutacoes de n Elementos, 667
grupos Euclidianos, 76
Grupos Topologicos, 774
Grupos Topologicos Conexos e Desconexos, 775
Harmonicos Esfericos, 509
harmonicos esfericos, 452
homomorfismo, 6567
Homomorfismos Nao-Contnuos de ( , +), 785


Identidade de Jacobi, 57, 59


Identidade de Leibniz, 59
identidade de polarizacao, 125
identidade do paralelogramo, 125
Imagens e pre-imagens de funcoes, 24
Inexistencia de solucao, 277
Inexistencia de solucoes globais, 279
Integracao de funcoes mensuraveis. A integral
de Lebesgue, 1026
Integracao de funcoes simples, 1023
Integracao sobre uma medida com valores em
projecoes ortogonais, 1239
Integrabilidade de Riemann. Criterios alternativos, 1003
Integrais indefinidas de funcoes simples, 1024
Interior, 934
Intertwiners, 809
Intervalos, 19
Intervalos de Tipo Luz, de Tipo Tempo e de
Tipo Espaco, 722
Introducao e motivacao, 358
Invariancia de L por translacoes, 956
Invariancia de Normas Associadas a Produtos
Escalares, 124
Invariancia por Reducao Inicial do Domnio, 982
inversa, 47
inversa bilateral, 87
Inversa., 47
isomorfismo, 66
isomorfismo de algebras, 67

Vers
ao de 29 de setembro de 2005.

Captulo 28

1295/1304

isomorfismo de espacos vetoriais, 66


Iterando a formula de Duhamel, 256
left coset, 67
Lema de Schur, 812
Limitacoes da integral de Lebesgue, 1033
limitante inferior, 35
limitante superior, 35
limite, 44
limite do nfimo, 43
limite do supremo, 43
Limite do Supremo e Limite do Infimo de um
Conjunto, 983
Limite em norma de operadores compactos, 1206
Limites do Infimo e Limites do Supremo de Famlias
de Conjuntos, 43
linearidade do traco, 154
Linearidade., 59
linearmente dependente, 95
linearmente independente, 96
linearmente ordenado, 31
Lotka, 269
maximo, 33
maximo divisor comum, 53
Maximos e Mnimos, 33
metodo das caratersticas, 590
metodo de expansao em serie de potencias, 315
metodo de Frobenius, 315, 351, 412
metodo de serie de potencias, 396
Metodo de Series de Potencias, 340
metodo de separacao de variaveis, 587
metodo de substituicao de Pr
ufer, 293
metodo de variacao de constantes, 291
Metodo dos Fatores Integrantes, 297
metrica, 124
Metricas, 831
Metricas equivalentes. Metricas que geram a
mesma topologia, 847
Modulos, 59
mnimo, 33
maior elemento, 34
Mais Exemplos, 31
Mais exemplos de conjuntos de Cantor, 966
Mais Exemplos de Topologias: a Topologia Cocontavel e a Co-finita, 919

JCABarata. Curso de Fsica-Matem


atica

Mais propriedades da matriz de monodromia,


344
Mais Sobre a Topologia Usual de , 922
Mais Sobre O Limite do Supremo e Sobre o Limite do Infimo, 984
majorante, 35
Majorantes e Minorantes, 35
matriz de monodromia, 344
matriz de Vandermonde, 386
matriz diagonalizavel, 162
matriz dos cofatores, 144
matriz dos menores, 144
matriz fundamental, 317
matriz positiva, 187
matriz simples, 152
matriz triangular inferior, 190
matriz triangular superior, 190
matriz Wronskiana, 317
Matrizes Auto-adjuntas e Diagonalizabilidade,
184
matrizes de Pauli, 91, 391
Matrizes Diagonalizaveis, 162
Matrizes Diagonalizaveis e Matrizes Simples, 164
Matrizes Hermitianas, Normais e Unitarias, 181
Matrizes Normais e Diagonalizabilidade, 187
matrizes similares, 149
Matrizes Similares. Transformacoes de Similaridade, 149
Matrizes Simples, 152
Medidas Completas, 951
Medidas Completas e o Teorema de Caratheodory, 952
Medidas definidas pela integral de funcoes simples nao-negativas, 1025
menor elemento, 34
Menores de uma matriz, a matriz dos cofatores
e a regra de Laplace, 144
minorante, 35
modelo de competicao de Lotka-Volterra, 270
Monoides, 46, 1262
Monodromia, 342
Monodromia nao trivial. Um exemplo, 347
monodromia nao-trivial, 344
monomorfismo, 66
morfismo de algebras, 67


Vers
ao de 29 de setembro de 2005.

Captulo 28

1296/1304

morfismo de espacos vetoriais, 66


morfismo de grupos, 65

Morfismos em Algebras,
67
Morfismos em Espacos Vetoriais, 66
Morfismos em Grupos, 65

Morfismos entre Algebras


Universais, 1268
multiplicidade algebrica, 148
multiplicidade geometrica, 151
n
umero algebrico, 41
N
umeros Reais Algebricos e Transcendentes, 41
N
umeros Reais. A Construcao de Cantor. Completamento, 869
n
umeros transcendentes, 41
Nao-unicidade de solucoes, 278
norma, 121
norma algebrica, 93
Norma e Produto Escalar, 124
norma Euclidiana, 124
norma operatorial, 224
Norma Quaternionica, 93
normalizador, 72
Normas, 121
Normas de Matrizes. A Norma Operatorial, 223
Nota Historica, 289
Nota historica sobre o problema de Fredholm,
640
Nota sobre as funcoes de Bessel de ordem inteira
negativa, 438
notacao de Dirac, 117
Notacao Matricial. A Metrica de Minkowski,
726
Notacoes para produtos escalares, 117
O Limite Indutivo Algebrico de uma Famlia

de Algebras,
1270
O Limite Indutivo de Banach de uma Famlia

de Algebras
de Banach, 1275
O Adjunto em Espacos de Banach, 1150
O Axioma da Escolha, 28
O Bi-dual Algebrico de um Espaco Vetorial, 105
O Calculo Funcional para Matrizes Diagonalizaveis,
168
O caso + \ {0}, 419
O caso + , 417
O caso + 6 , 417

JCABarata. Curso de Fsica-Matem


atica

O
O
O
O
O

Vers
ao de 29 de setembro de 2005.

caso = + , 417
caso = 20 > 0, 325
caso = 0, 326
caso 6= 20 , 323
caso k = 0, = 0. Partcula submetida a
forca externa dependente do tempo, 326
O caso comutativo, 332
O caso de condicoes de contorno nao-homogeneas,
633
O caso de equacoes lineares nao-homogeneas,
265
O caso de operadores compactos nao-auto-adjuntos,
1221
O Centro de GL( , n), 72
O Centro de um Grupo, 71
O conjunto de Cantor ternario, 961
O conjunto de Cantor ternario e denso em si
mesmo e totalmente desconexo, 965
O conjunto resolvente e o espectro de um operador, 1193
O Determinante de Exponenciais de Matrizes,
234
O Dual Topologico de um Espaco Vetorial, 102
O espaco das funcoes almost-periodicas. Uma
digressao, 1096
O espaco vetorial B(V, W), 1118
O espectro de operadores auto-adjuntos em espacos
de Hilbert e real, 1198
O espectro de operadores limitados em espacos
de Hilbert, 1197
O espectro de operadores unitarios e de operadores auto-adjuntos em algebras C , 1169
O Espectro de uma Matriz, 147
O espectro residual e o pontual em um espaco
de Hilbert, 1197
O Exemplo de Vitali, 939
O Expoente de Lyapunov, 906
O fecho de um subespaco linear e tambem um
subespaco linear, 1089
O Grafico de um Operador, 1136
O grupo P3222378
em 1+1-dimensoes, 743
+
O Grupo de Galilei, 741
O grupo de Heisenberg GH3 ( ), 677
O grupo de Heisenberg GHn ( ), n 3, 679
O Grupo de Poincare, 730

Captulo 28

1297/1304

O Grupo de Trancas, 672


O Grupo Euclidiano, 716
O grupo O(1, 1) (O Grupo de Lorentz em 1+1
dimensoes), 688
O Grupo Quociente de G por N , 71
O grupo U(1), 688
O Lema de Fatou, 1036
O Lema de Zorn, 36

O Limite Indutivo de Algebras


C , 1278
O Metodo de Frobenius, 351
O metodo de Newton para zeros de funcoes, 885
O modelo da Mecanica Classica, 1247
O N
ucleo e a Imagem de um Operador Linear,
194
O n
umero e e um n
umero irracional, 836
O operador integral de Fredholm, 1211
O operador integral de Volterra, 1212
O operador resolvente e propriedades topologicas
do espectro, 1163, 1195
O Polinomio Caracterstico de uma Matriz, 147
O Polinomio Mnimo, 156
O princpio de sobreposicao para equacoes lineares homogeneas, 264
O problema de Sturm com condicoes de contorno nao-homogeneas, 616
O Produto Cartesiano de uma Famlia Arbitraria
de Conjuntos, 28
O Produto Direto de Grupos, 73
O Produto Semi-Direto de Grupos, 74
O Produto Tensorial de dois Espacos Vetoriais,
82
O Produto Tensorial de dois Grupos Abelianos,
81
O Produto Tensorial de dois Modulos sobre uma

Algebra
Associativa, 82
O quadro da Fsica Quantica, 1249
O raio espectral, 1166
O Sinal, ou Paridade, de uma Permutacao, 671
O sistema de Lotka-Volterra, 269
O Teorema BLT, 1119
O Teorema da Aplicacao Aberta, 1136
O Teorema da Aplicacao Inversa, 1140
O Teorema da Convergencia Dominada, 1037
O Teorema da Convergencia Monotona, 1035
O Teorema de Hahn-Banach para espacos veto-

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

riais complexos, 1130


O Teorema de Hahn-Banach para espacos vetoriais reais, 1129
O Teorema de Hamilton-Cayley e a Inversa de
Matrizes, 160
O Teorema de Hellinger-Toeplitz, 1142
O Teorema de Peter-Weyl. Relacoes de Ortogonalidade, 822
O Teorema de Pitagoras, 1097
O Teorema de Riesz-Fischer para seq
uencias. Completeza dos espacos ` e `p , p 1, 863
O Teorema de Weierstrass, 1080
O Teorema do Grafico Fechado, 1140
O Teorema do Valor Medio, 1014
O Teorema Espectral, 166
O Teorema Espectral e distribuicoes de probabilidade no espectro, 1244
O Teorema Espectral para matrizes. Uma segunda visita, 170
O Teorema Espectral para matrizes. Unicidade,
169
O Teorema Espectral para operadores auto-adjuntos
limitados, 1242
O Teorema Espectral para operadores compactos auto-adjuntos, 1218
O Traco de uma Matriz, 153
Observaveis e Distribuicoes de Probabilidade,
1245
Observacoes, 315
Obtendo os projetores espectrais, 169
Obtendo Produtos Escalares a Partir de Normas, 127
ondas de gravitacao, 575
Ondas de gravitacao e a propagacao de ondas
em tanques profundos, 572
operacao, 45
operacao de adjuncao de matrizes, 181
operacao finitaria, 45
Operacoes basicas com famlias de conjuntos, 25
Operacoes e Relacoes, 45, 1257
operador adjunto, 180
Operador de Casimir, 815
operador nilpotente, 193
Operadores Auto-adjuntos, Operadores Unitarios
e Operadores Normais, 1146

Captulo 28

1298/1304

Operadores Compactos, 1203


Operadores compactos e seq
uencias fracamente
convergentes, 1203
Operadores Compactos em Espacos de Hilbert
Separaveis, 1207
Operadores Contnuos, 1115
Operadores de posto finito, 1202
Operadores Limitados, 1116
Operadores Lineares, 1114
operadores lineares, 66
Operadores Nilpotentes, 193
Operadores Nucleares, 1222
Operadores Simetricos e Unitarios. Ortogonalidade de Autovetores, 183
ordem da equacao, 261
Ordem Lexicografica, 32
Origens, 523
Os Boosts de Lorentz, 732
Os Autovalores de Matrizes Hermitianas e de
Matrizes Unitarias, 182
Os conjuntos Lp (M, d), 1030

Os Corpos ( p), com p Primo, 52


Os Corpos p , com p Primo, 52
Os espacos L1 (M, d), 1041
Os espectro e a operacao de adjuncao, 181
Os geradores de SRot, 739
Os Geradores do Grupo de Poincare, 742
Os Geradores do Grupo Euclidiano E2 , 717
Os Geradores do Grupo Euclidiano E3 , 716
Os Geradores dos Boosts de Lorentz, 738
Os Grupos O(n) e SO(n), 684
Os Grupos O(p, m) e SO(p, m), 684
Os Grupos U (n) e SU (n), 685
Os Grupos U (p, m) e SU (p, m), 685
Os Grupos n , 49
Os grupos GL(n, ), SL(n, ) e SL(n, ), 674
Os Grupos Ortogonais Complexos, 686
Os Grupos SL( , 2)/{ , } e L+ 3222378 sao
Isomorfos, 750
Os Grupos SO(2) e O(2), 686
Os Harmonicos Esfericos, 509
Os n
umeros e e sao irracionais e transcendentes, 42
Os Polinomios de Chebyshev, 407
Os Polinomios de Hermite, 402

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Os Polinomios de Legendre, 400


Os Sub-grupos Rot e SRot, 731
Os Sub-grupos Proprio, Ortocrono e Restrito do
Grupo de Lorentz, 736
Outra Caracterizacao do Fecho de um Conjunto,
935
Outra representacao integral equivalente, 460
Outros Completamentos dos Racionais. N
umeros
p-adicos, 872
Outros Isomorfismos entre L+ 3222378 e SL( ,
2)/{ , }, 750
Outros problemas que nao de valor inicial, 276
Outros resultados analogos, 258
Outros Subgrupos de GL( , n) e de GL( , n),
675


Pares Ordenados, 22
Partes positiva e negativa de uma funcao, 1020
Particoes, 1000
polinomio caracterstico, 148
polinomio indicial, 382
polinomio mnimo, 156
polinomio monico, 156
polinomio matricial, 155
polinomio racional, 41
polinomios de Chebyshev, 408
polinomios de Hermite, 403
polinomios de Laguerre, 442
polinomios de Laguerre associados, 453
polinomios de Legendre, 401
polinomios de Legendre associados, 451, 501
Polinomios de Matrizes, 155
ponto singular regular, 352, 361
ponto singular simples, 352, 361
ponto singular simples da equacao de segunda
ordem, 361
ponto singular simples de equacoes diferenciais
lineares complexas homogeneas de ordem m, 358
posets, 30
primeira supra-diagonal, 204
primos entre si, 53
princpio de inducao transfinita, 34
princpio de sobreposicao, 264
Princpo do Bom-Ordenamento, 29

Captulo 28

1299/1304

problema bem-posto, 276


problema da quadratura do crculo, 42
problema de Riemann-Hilbert, 385
Problemas bem-postos, 276
problemas de Cauchy, 275
Problemas de valor inicial, 274
problemas de valor inicial, 275
Procyon, 524
produto, 46
produto de tempo ordenado, 332
produto direto, 73, 83
produto direto de A e B, 77
Produto Direto e Soma Direta de Colecoes Arbitrarias de Grupos, 83
produto escalar, 117, 118
produto interno, 117, 118
produto quaternionico, 89
produto semi-direto de G por H pelo automorfismo : G H H, 74
produto tensorial, 79, 81
produto tensorial de dois grupos, 76
Produto Tensorial dos Grupos Abelianos, 78
Produtos Cartesianos e Contabilidade, 42
Produtos escalares complexos sobre estruturas
complexas, 135
Produtos escalares e formas simpleticas reais,
119
Produtos Escalares em n , 131
Produtos Internos ou Produtos Escalares, 117
Produzindo Bases de Topologias, 924
projetor, 165
projetor ortogonal, 184
Projetores, 165
Projetores e Projetores Ortogonais, 1149
projetores espectrais, 166, 171
Projetores Ortogonais, 184
projetores ortogonais, 165
Propagacao de ondas em um tanque profundo
de raio infinito, 575
propriedade cclica do traco, 154
Propriedades adicionais, 531
Propriedades algebricas de operadores compactos, 1204
Propriedades Basicas de Medidas, 944
Propriedades elementares da integracao, 1027

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Propriedades elementares da integracao de funcoes


complexas, 1029
Propriedades elementares da integracao de funcoes
simples, 1025
Propriedades elementares de funcoes, 26
Propriedades genericas, 1072
Propriedades topologicas do grupo dos operadores invertveis, 1160
Prova do Teorema de Caratheodory, 947
Prova do Teorema de Weierstrass, 1083
pseudo-metrica, 124
Quase em toda parte, 960

Quaternions e Algebras
de Matrizes 2 2, 90
Quocientes, 94
raz quadrada da matriz, 189
Recordando alguns fatos gerais e um pouco de
notacao, 1155
rede, 33
Redes e Seq
uencias, 33
Reescrevendo a equacao diferencial na forma de
Liouville, 610
Reescrevendo a serie de Dyson., 331
regra de composicao, 319
regra de Laplace, 145
Regularidade de L , 957
relacao de compatibilidade, 30
relacao de equivalencia, 29
relacao de ordem, 30
relacao de ordem lexicografica, 32
relacao de ordem parcial, 30
relacao de ordem total, 31
relacao finitaria, 45
Relacoes, 23
Relacoes de Compatibilidade, 30
Relacoes de Equivalencia, 29
Relacoes de inclusao entre os conjuntos Lp (M, d)
quando (M ) < , 1046
Relacoes de Ordem Total, 31
relacoes de ortogonalidade dos harmonicos esfericos,
510
relacoes de ortogonalidade dos polinomios de Hermite, 512
Relacoes de ortogonalidade para as funcoes de
Bessel esfericas no intervalo [0, 1], 539

Captulo 28

1300/1304

Relacoes de ortogonalidade para os polinomios


de Hermite, 511
Relacoes de ortogonalidade para os polinomios
de Laguerre, 515
relacoes de ortogonalidade para os polinomios de
Laguerre, 516
Relacoes de ortogonalidade para os polinomios
de Legendre, 495
relacoes de ortogonalidade para os polinomios de
Legendre, 496
Relacoes de ortogonalidade para os polinomios
de Legendre associados, 506
relacoes de recorrencia das funcoes de Bessel,
526
Relacoes de recorrencia para as funcoes de Bessel, 524
Relacoes de recorrencia para as funcoes de Bessel
esfericas, 538
Relacoes de recorrencia para os polinomios de
Hermite, 514
Relacoes de recorrencia para os polinomios de
Laguerre, 516
Relacoes de recorrencia para os polinomios de
Laguerre associados, 521
Relacoes de recorrencia para os polinomios de
Legendre, 497
Relacoes de recorrencia para os polinomios de
Legendre associados, 505
Relacoes e Grupos Gerados Modulo Relacoes, 80
Relacoes Finitarias, 45, 1258
Relacionando problemas com condicoes de contorno nao-homogeneas e homogeneas, 609
representacao canonica da matriz nilpotente, 204
representacao de Mittag-Leffler, 457
representacao em blocos diagonais, 193
representacao fiel, 65
representacao integral da funcao de Bessel, 530
representacao integral de Schlafli, 500
Representacao matricial de sistemas lineares, 272
representacao nao-degenerada, 65
representacao polar, 208
representacao produto de Euler para a funcao ,
464
representacao produto de Gauss para a funcao
, 460

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

representacao produto de Weierstrass para a funcao


, 463

Representacoes de Algebras,
65
Representacoes de Grupos, 64
Representacoes Equivalentes, 809
Representacoes integrais das funcoes de Bessel,
529
Representacoes integrais para os polinomios de
Legendre, 499
Representacoes integrais para os polinomios de
Legendre associados, 502
Representacoes Irredutveis, 810
Representacoes Irredutveis para Operadores, 812
reticulado, 33
Reticulados, 1260
Reticulados Distributivos, 1261
Revisitando a desigualdade de Holder, 1047
Revisitando a extensao de para Re(z) 0 ,
459
Revisitando o Teorema 13.8, 740
right coset, 68
serie de Duhamel, 222
serie de Dyson, 312
Serie de Lie, 222
serie de Lie, 244
series de Duhamel, 258
Series de Potencias de Matrizes, 228
smbolos de Pochhammer, 445
Smbolos de Riemann, 386
smbolos de Riemann, 387
segunda lei de Kepler, 523
Semi-grupos, 46, 1261
semi-norma, 122
Semi-Normas, 122
Semi-normas em `p , p 1, 862
seq
uencia, 33
seq
uencia de Fibonacci, 493
Seq
uencias, 833
Seq
uencias ` e `p , 853
Seq
uencias de Cauchy, 834
Seq
uencias de Cauchy de N
umeros Racionais,
869
setores, 342
singularidade no infinito, 363

Captulo 28

1301/1304

singularidade simples no infinito, 363


Singularidades tipo polo de S(z). Pontos Singulares Regulares, 351
Sirius, 524
sistema de caca-presa, 269
sistema fundamental, 317
sistema homogeneo, 307
sistema linear de equacoes diferenciais de primeira ordem, 307
sistema nao-homogeneo, 307
Sistemas de primeira ordem, 271
Sistemas lineares de primeira ordem, 272
SL( , 2) e o Espaco de Minkowski, 746
Solucao para condicao inicial em instante arbitrario, 320
solucao singular, 302
Solucoes da equacao de Clairaut. A solucao singular, 302
Solucoes da equacao de DAlembert-Lagrange,
303
Solucoes de equacoes com pontos singulares simples, 361
Solucoes nulas, 338
solucoes singulares, 302
soma direta, 81, 193
soma direta de A e B, 77
Soma Direta de Colecoes Arbitrarias de Espacos
Vetoriais, 83
soma direta de dois grupos, 76

Soma Direta e Soma Semi-Direta de Algebras


de
Lie, 798
Somas de Darboux, 1005
Somas de Riemann. Integrabilidade de Riemann,
1001
Somas Diretas de Sub-Espacos, 192
Spinores, 751
Sub-algebras Abelianas, 91
Sub-espacos, 94
Sub-espacos gerados por conjuntos ortonormais
finitos, 1099
Sub-Espacos Invariantes, 809
Sub-espacos Invariantes, 193
Sub-espacos invariantes, 1148
sub-grupo, 49
Sub-grupos, 49

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Sub-Grupos Normais, 69
Sub-grupos Uniparametricos de GL( , n) e a

Algebra
de Lie Associada a GL( , n),
784

Sub-Grupos Uniparametricos e Algebras


de Lie,
789
Sub-Grupos Uniparametricos em Sub-Grupos Fechados, 785
Sub-seq
uencias, 833
subconjunto proprio, 22
subgrupo normal, 69
suporte, 79
Suporte de uma funcao, 79
suporte finito, 79
supremo, 35
Teorema da Decomposicao de Iwasawa, 215
Teorema da Decomposicao de Schur, 210
Teorema da decomposicao ortogonal, 1093
Teorema da Funcao Implcita, 261
Teorema da Triangularizacao de Schur, 210
Teorema do melhor aproximante, 1091
tipo da operacao, 46
Tipos de equacoes lineares parciais, 586
Tipos de espectro. O espectros pontual, contnuo
e residual, 1194
Tipos de Operacoes e de Relacoes, 46, 1259
Topologia, 915
totalmente ordenado, 31
transformacao de similaridade, 149
Transformacoes Lineares e a Estrutura Causal,
727
Transitividade e Espacos Homogeneos, 64
Transposicoes, 669
Transposicoes Elementares, 670
Transposicoes Elementares e suas Relacoes, 671
Troca de Paridade e Reversao Temporal, 730
Um comentario, 356
Um comentario sobre a matriz de monodromia,
348
Um comentario sobre a ortonormalidade das funcoes
p, l, m , 571
Um Exemplo, 625
Um exemplo de operador compacto a se ter em
mente, 1209

Captulo 28

1302/1304

Um
Um
Um
Um
Um

exemplo. A seq
uencia de Fibonacci, 493
Limite Inferior para os Autovalores, 626
problema de teoria de perturbacoes, 328
resultado u
til, 146
subgrupo conexo nao-fechado de GL( , 2),
802
Um Teorema de Fuchs, 362
Um teorema sobre existencia e unicidade de solucoes,
608
Uma condicao para mensurabilidade de funcoes,
1049
Uma Condicao Suficiente para Diagonalizabilidade, 175
Uma conseq
uencia da identidade de polarizacao,
126
Uma conseq
uencia de (9.98) empregada no estudo do atomo de hidrogenio, 520
Uma ilustracao elementar do Teorema de Caratheodory, 950
Uma Metrica no Conjunto dos Racionais, 868
Uma notacao, 611
Uma observacao importante, 612
Uma propriedade da norma, 1089
Uma propriedade da solucao das equacoes homogeneas, 311
Uma pseudo-metrica em L1 (M, d), 1041
uniao disjunta, 22, 27
Unicidade de solucao de EDPs. Um contraexemplo, 596
Unicidade de solucao para a equacao de difusao
em regioes finitas, 597
Unicidade de solucao para a equacao de vibracoes
elasticas em regioes finitas, 602
Unicidade de solucao para as equacoes de Laplace e Poisson em regioes finitas, 595
Unicidade de solucoes para a equacao de difusao
em um intervalo finito, 591
Unicidade de solucoes para a equacao de ondas
em um intervalo finito, 593
Unicidade dos projetores espectrais, 1242
unidade, 51, 60
Uns poucos exemplos, 1075
Valores singulares de um operador compacto,
1222

JCABarata. Curso de Fsica-Matem


atica

Variancias e estados puros, 1246


Variedades Diferenciaveis, 773
Varredura Linear, 96
varredura linear , 96
vetor nulo, 55
vetores, 55
Vetores Cclicos, 1185
Volterra, 269
Wronskiano, 318
zero, 51
Zeros das funcoes de Bessel, 532
Zeros de solucoes, 294

Vers
ao de 29 de setembro de 2005.

Captulo 28

1303/1304

JCABarata. Curso de Fsica-Matem


atica

Vers
ao de 29 de setembro de 2005.

Captulo 28

1304/1304

Sao Paulo, 29 de setembro de 2005

Joao Carlos Alves Barata


Depto. de Fsica Matematica
Instituto de Fsica
Universidade de Sao Paulo
Caixa Postal 66 318
05315 970 Sao Paulo. SP. Brasil
Email: jbarata@if.usp.br
Tel.: (011) 3091 7002
Fax.: (011) 3091 6833

Você também pode gostar