Você está na página 1de 285

Análise em espaços métricos e vetoriais:

notas de aula

Roberto Imbuzeiro Oliveira1

15 de junho de 2023

1IMPA, Rio de Janeiro, RJ, Brazil, 22430-040.


2
Conteúdo

I Os objetos fundamentais 9
1 Prólogo 11
1.1 Fatos sobre R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Limites e convergência de sequências . . . . . . . . . . . . . . . . . . 12
1.1.3 Limites superior e inferior . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.4 Limites e convergência de séries . . . . . . . . . . . . . . . . . . . . . 13
1.1.5 Limites de funções, continuidade, máximos e mínimos . . . . . . . . 15
1.1.6 Derivadas e integrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Algumas funções especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 A função exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2.2 A função logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.3 As funções seno e cosseno . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 A desigualdade das médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24

2 Espaços vetoriais e normas 27


2.1 Um caso concreto: o espaço Rd . . . . . . . . . . . . . . . . . . . . . . . . . . 27
2.1.1 Operações em Rd e suas propriedades . . . . . . . . . . . . . . . . . . 27
2.1.2 Produto interno e a norma euclideana em Rd . . . . . . . . . . . . . . 28
2.2 Definições gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2.1 O que é um espaço vetorial? . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2.2 Subespaços de espaços vetoriais . . . . . . . . . . . . . . . . . . . . . 33
2.2.3 Normas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.3 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

3 Espaços métricos, convergência e completude 45


3.1 Espaços métricos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.1.1 A reta real como espaço métrico . . . . . . . . . . . . . . . . . . . . . 46
3.1.2 Os números complexos como espaço métrico . . . . . . . . . . . . . . 46
3.1.3 A métrica discreta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.1.4 Espaços vetoriais: normas nos dão métricas . . . . . . . . . . . . . . 47
3.1.5 Métricas induzidas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3.2 Sequências, limites e completude . . . . . . . . . . . . . . . . . . . . . . . . . 48

3
3.2.1 Subsequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.2 Convergência em Rd com as normas ℓp . . . . . . . . . . . . . . . . . . 51
3.2.3 Convergência sob a métrica discreta . . . . . . . . . . . . . . . . . . . 53
3.2.4 Convergência em C(I, R) . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Equivalência de métricas e normas . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

4 Funções e continuidade 63
4.1 Funções contínuas de X em R . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2 Funções Lipschitz e distâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3 Funções contínuas sobre o espaço de funções contínuas . . . . . . . . . . . . 66
4.4 Funções contínuas de X em Rd . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.5 Transformações e funcionais lineares . . . . . . . . . . . . . . . . . . . . . . . 69
4.6 Transformações multilineares e tensores . . . . . . . . . . . . . . . . . . . . . 72
4.6.1 Tensores em dimensão finita . . . . . . . . . . . . . . . . . . . . . . . 75
4.6.2 Alguns exemplos em dimensão infinita . . . . . . . . . . . . . . . . . 76
4.7 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78

II Topologia e geometria em espaços métricos 83


5 Abertos, fechados e topologias 85
5.1 Os abertos formam uma topologia . . . . . . . . . . . . . . . . . . . . . . . . 88
5.2 Outros conceitos topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
5.3 Caracterizações métricas dos conceitos topológicos . . . . . . . . . . . . . . . 93
5.4 Continuidade, abertos e fechados . . . . . . . . . . . . . . . . . . . . . . . . . 94
5.5 Topologia relativa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 95
5.6 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97

6 Compactos: teoria geral 101


6.1 Compactos do ponto de vista de Topologia Geral . . . . . . . . . . . . . . . . 102
6.2 Espaços métricos compactos: o grande teorema de equivalência . . . . . . . 106
6.2.1 Roteiro da prova . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
6.2.2 Compactos são completos . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.2.3 Cobertura, empacotamento e limitação total . . . . . . . . . . . . . . 108
6.2.4 O critério das subsequências convergentes . . . . . . . . . . . . . . . 112
6.2.5 O fim da prova da grande equivalência . . . . . . . . . . . . . . . . . 114
6.3 Mais sobre compactos e funções contínuas . . . . . . . . . . . . . . . . . . . . 116
6.3.1 Funções sobre compactos com contradomínio completo . . . . . . . . 116
6.3.2 Funções sobre compactos com contradomínio Banach . . . . . . . . . 118
6.3.3 Continuidade uniforme . . . . . . . . . . . . . . . . . . . . . . . . . . 119
6.4 Compacidade de subconjuntos de um espaço métrico completo . . . . . . . 121
6.5 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

4
7 Compactos: casos particulares 125
7.1 Compactos de Rd : o Teorema de Heine-Borel . . . . . . . . . . . . . . . . . . 125
7.2 Aplicações do teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . 127
7.2.1 Todas as normas sobre Rd são equivalentes . . . . . . . . . . . . . . . 127
7.2.2 Funções contínuas e convergência uniforme sobre compactos . . . . 128
7.3 Compactos nos espaços de funções contínuas . . . . . . . . . . . . . . . . . . 135
7.3.1 Bolas fechadas não são compactas . . . . . . . . . . . . . . . . . . . . 135
7.3.2 O teorema de Arzelà-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . 135
7.4 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139

8 Caminhos e conexidade 143


8.1 Conexidade por caminhos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
8.1.1 Conectando pontos por curvas . . . . . . . . . . . . . . . . . . . . . . 143
8.1.2 Exemplos básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
8.2 Conexidade topológica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
8.2.1 Formas equivalentes do conceito . . . . . . . . . . . . . . . . . . . . . 147
8.2.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 150
8.2.3 Um pouco mais sobre conexidade e topologia induzida . . . . . . . . 152
8.3 Exemplos mais interessantes das definições . . . . . . . . . . . . . . . . . . . 152
8.3.1 Matrizes ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 153
8.3.2 Um conjunto conexo que não é conexo por caminhos . . . . . . . . . 157
8.3.3 Concordância para abertos de espaços vetoriais . . . . . . . . . . . . 159
8.4 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 159

III Cálculo diferencial em espaços vetoriais 163


9 Preâmbulo 165

10 Funções a um parâmetro: derivadas e integrais 167


10.1 Derivadas: definição e resultados preliminares . . . . . . . . . . . . . . . . . 167
10.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . . . . . 168
10.3 Integração de funções sobre intervalos . . . . . . . . . . . . . . . . . . . . . . 170
10.4 O teorema fundamental do Cálculo . . . . . . . . . . . . . . . . . . . . . . . . 173
10.5 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 174

11 A derivada como transformação linear 175


11.1 Definição de derivada de Fréchet . . . . . . . . . . . . . . . . . . . . . . . . . 175
11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais . . . . . . 176
11.2 Alguns casos simples da derivada de Fréchet . . . . . . . . . . . . . . . . . . 178
11.2.1 Quando o domínio está na reta . . . . . . . . . . . . . . . . . . . . . . 178
11.2.2 Derivadas envolvendo funções lineares . . . . . . . . . . . . . . . . . 179
11.2.3 A derivada quando V tem dimensão finita e W = R . . . . . . . . . . 179

5
11.2.4 O caso em que W tem dimensão finita . . . . . . . . . . . . . . . . . . 182
11.2.5 A derivada do determinante . . . . . . . . . . . . . . . . . . . . . . . 183
11.3 Boas propriedades da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . 186
11.3.1 A regra da cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
11.3.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . 187
11.4 Derivadas mais complicadas de se calcular . . . . . . . . . . . . . . . . . . . 189
11.4.1 Exemplos no espaço de operadores lineares . . . . . . . . . . . . . . . 189
11.4.2 Um exemplo sobre as funções contínuas . . . . . . . . . . . . . . . . . 193
11.5 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197

12 Derivadas de ordem superior 199


12.1 Já sabemos definir, mas... . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
12.2 Segunda derivada, transformações bilineares e simetria . . . . . . . . . . . . 200
12.2.1 Relação de L(V, L(V, W )) com transformações bilineares . . . . . . . 200
12.2.2 A segunda derivada é bilinear . . . . . . . . . . . . . . . . . . . . . . 203
12.2.3 Simetria da segunda derivada (quando contínua) . . . . . . . . . . . 206
12.2.4 Derivadas parciais de ordem 2 . . . . . . . . . . . . . . . . . . . . . . 208
12.3 Derivadas de ordem maior que dois . . . . . . . . . . . . . . . . . . . . . . . 209
12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos . . 209
12.3.2 A derivada de ordem k ≥ 3 . . . . . . . . . . . . . . . . . . . . . . . . 212
12.4 A fórmula de Taylor geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 214
12.5 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217

13 Pontos fixos, funções inversas e funções implícitas 219


13.1 O teorema do ponto fixo de Banach . . . . . . . . . . . . . . . . . . . . . . . . 219
13.2 O teorema da função inversa . . . . . . . . . . . . . . . . . . . . . . . . . . . . 223
13.3 O teorema da função implícita . . . . . . . . . . . . . . . . . . . . . . . . . . . 230
13.4 Aplicações às equações diferenciais ordinárias . . . . . . . . . . . . . . . . . 233
13.4.1 Existência, unicidade e dependência contínua: um teorema global . 233
13.4.2 Suavidade da solução . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
13.5 Mais exercicios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 238

14 Esboço da teoria de subvariedades de Rd 241


14.1 Os dois primeiros exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
14.1.1 Abertos de Rd . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
14.1.2 Gráficos de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
14.2 Parametrizações que viram difeomorfismos . . . . . . . . . . . . . . . . . . . 242
14.3 O espaço tangente e a dimensão . . . . . . . . . . . . . . . . . . . . . . . . . . 246
14.4 Subvariedades definidas implicitamente . . . . . . . . . . . . . . . . . . . . . 247
14.4.1 Exemplos de subvariedades definidas implicitamente . . . . . . . . . 249
14.4.2 Um resultado intermediário . . . . . . . . . . . . . . . . . . . . . . . . 250
14.4.3 Prova do Teorema 14.2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
14.5 Trocas de cartas, funções diferenciáveis e estrutura intrínseca . . . . . . . . . 253

6
14.5.1 Trocas de cartas são difeomorfismos . . . . . . . . . . . . . . . . . . . 253

IV EDOs: unicidade e dependência suave das condições iniciais 255


15 Existência e unicidade para certas EDOs 257
15.1 Existência e unicidade globais . . . . . . . . . . . . . . . . . . . . . . . . . . . 257
15.2 Existência e unicidade locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
15.3 Diferenciabilidade local - esboço . . . . . . . . . . . . . . . . . . . . . . . . . 261
15.4 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 261

V Mais sobre espaços de funções contínuas 263


16 Sequências e séries de funções 265
16.1 Séries de funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
16.1.1 Somando séries . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 265
16.1.2 Tomando derivadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
16.2 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
16.3 O método de Euler e a existência de soluções para EDOs . . . . . . . . . . . 269
16.3.1 Localização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 270
16.3.2 A aproximação de Euler . . . . . . . . . . . . . . . . . . . . . . . . . . 271
16.3.3 O problema em forma integral . . . . . . . . . . . . . . . . . . . . . . 272
16.3.4 Aproximações de Euler são pontos quase-fixos . . . . . . . . . . . . . 273
16.3.5 Fim da demonstração . . . . . . . . . . . . . . . . . . . . . . . . . . . 274

17 Subconjuntos densos de C(K, R): o teorema de Stone-Weierstrass 277


17.1 O teorema geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 278
17.1.1 Prova do teorema de Stone-Weierstrass . . . . . . . . . . . . . . . . . 279
17.1.2 Prova do Lema Fundamental . . . . . . . . . . . . . . . . . . . . . . . 283

7
8
Parte I

Os objetos fundamentais

9
Capítulo 1

Prólogo

Este capítulo pode ser ignorado. Ele só contem alguns fatos úteis.
O objetivo deste curso será começar um estudo de Análise em espaços vetoriais e (de
forma mais geral) em espaços métricos. Por um lado, estes dois conceitos generalizam
a reta real R. Por outro, fazer Análise nestes espaços requer contas e resultados vindos
do mundo unidimensional da reta real. Portanto, há dois pré-requisitos fundamentais
para nosso curso: um bom curso de Análise na Reta e um conhecimento operacional de
Álgebra Linear. É possível que alguns alunos sobrevivam sem um dos pré-requisitos, mas
será basicamente por conta própria: não poderemos parar por muito tempo para rever
estes dois assuntos.
Nesta seção recordaremos alguns fatos e resultados importantes para tudo que vem a
seguir.

1.1 Fatos sobre R


Toda a Análise que estudaremos neste curso é baseada no que você já sabe (ou deveria
saber) sobre a reta real. Nesta seção recordamos alguns fatos e resultados lá de Análise
na Reta.

1.1.1 Intervalos
Lembre-se que um intervalo I ⊂ R é um conjunto da forma [a, b), (a, b], (a, b) ou [a, b] com
a, b ∈ R ∪ {±∞}. Por convenção, o intervalo é vazio se a > b; além disso, permitimos
a, b = ±∞ quando a extremidade correspondente do intervalo for aberta. Chamamos I de
intervalo compacto se a, b ̸= ±∞ e as duas extremidades são fechadas. Usaremos a notação
R+ := [0, ∞). Usaremos muitas vezes o resultado a seguir.

Exercício 1.1 Um subconjunto S ⊂ R é um intervalo se e somente se satisfaz a seguinte proprie-


dade: ∀x, y ∈ S : (x, y) ⊂ S.

11
1.1.2 Limites e convergência de sequências
Uma sequência de números reais {xn }n∈N ⊂ R converge a x ∈ R – ou xn → x, ou
x = limn∈N xn – se, dado qualquer ε > 0, podemos encontrar um n0 ∈ N tal que, para
qualquer n ∈ N com n ≥ n0 , temos |x − xn | < ε. Simbolicamente, podemos escrever isto
da seguinte forma

“x = lim xn ” := “∀ε ∈ R+ ∃n0 ∈ N∀n ∈ N : n ≥ n0 ⇒ |x − xn | < ε.”


n∈N

É um exercício conhecido mostrar que a definição não se altera quando trocamos


|x − xn | < ε por |x − xn | ≤ ε acima. Um outro resultado conhecido (que não vamos provar
aqui) é que R é completo. Isto é, uma sequência em R é convergente se e somente se é
Cauchy, o que quer dizer:

∀ε ∈ R+ ∃n0 ∈ N∀n, m ∈ N : n, m ≥ n0 ⇒ |xm − xn | < ε.

Falaremos ocasionalmente de limites impróprios. Por exemplo, xn → +∞ se para todo


M > 0 existe um n0 ∈ N tal que para todo n ∈ N, se n ≥ n0 , então xn ≥ M . Pode-se definir
a convergência a −∞ de forma análoga.

Exercício 1.2 Prove que uma sequência {xn }n∈N ⊂ R converge a ±∞ se e somente se
xn
lim = ±1.
n∈N 1 + |xn |

Dado um subconjunto infinito N ⊂ N, N = {n1 < n2 < n3 < n4 < . . . }, a subsequência


{xn }n∈N é (por definição) igual à sequência {yk }k∈N dada por yk := xnk , k ∈ N. Podemos
então falar do limite limn∈N xn := limk∈N yk . Pode-se mostrar que

“x = lim xn ” := “∀ε ∈ R+ ∃n0 ∈ N ∀n ∈ N : n ≥ n0 ⇒ |x − xn | < ε.”


n∈N

Além disso, se uma sequência converge, toda subsequência sua converge ao mesmo li-
mite. Nada impede, aliás, de tomarmos subsequências de subsequências, como faremos
algumas vezes abaixo.
Uma propriedade importante dos intervalos compactos I ̸= ∅ é que toda sequência em
I possui uma subsequência convergindo a um ponto de I.

1.1.3 Limites superior e inferior


Podemos falar também dos limites superior e inferior de uma sequência {xn }n∈N ⊂ R.

lim sup xn := inf sup xn ∈ R ∪ {+∞}.


n∈N n∈N m∈N,m≥n

lim inf xn := sup inf xn ∈ R ∪ {−∞}.


n∈N n∈N m∈N,m≥n

temos lim inf xn ≤ lim sup xn , com igualdade se e somente se ∃ limn xn ∈ R ∪ {±∞}.

12
1.1.4 Limites e convergência de séries
DadosPnúmeros a1 , a2 , . . . , an , · · · ∈ R, dizemos que a se existe j=0 aj .
P Pn
série n a n converge limn→+∞
Caso n |an | convirja, dizemos que n an é absolutamente convergente. Pode-se provar que,
P
a convergência absoluta implica convergência usual. No entanto, a recíproca não vale.
As
P condições lim supn |an+1 |/|an | < 1 e lim supn |an | < 1 são suficientes para garantir
1/n

que n∈N an é absolutamente convergente. De fato, nos dois casos a prova da convergência
absoluta se baseia em progressões geométricas, ou seja, no fato que:
∞  1
X
n 1−ρ
, 0 ≤ ρ < 1;
∀ρ ∈ R+ , ρ =
n=0
+∞, ρ ≥ 1.

O critério de Leibniz diz que uma série do tipo


X
(−1)n xn , com cada xn ∈ R+ ,
n∈N

converge se e somente se xn → 0. De modo geral, o fato de que n an converge implica


P
que anP → 0, mas Pa recíproca não vale.
Se n∈N an e n∈N bn são absolutamente convergentes, o mesmo vale para n∈N (an +
P
bn ) e além disso: X X X
(an + bn ) = an + bn .
n∈N n∈N n∈N

Vamos utilizar algumas vezes o lema a seguir.


P P P Pn
m:serieprod Lema 1.1 Suponha que n∈N an e n∈N bn são absolutamente convergentes. Então n∈N ( i=0 ai bn−i )
também é absolutamente convergente e vale a identidade:
n
! ! !
X X X X
ai bn−i = an bn .
n∈N i=0 n∈N n∈N

Prova: Definimos para cada k ∈ N


! !
X X
Pk := ai bj ;
i≤k j≤k
k n
! k s
!
X X X X
Hk := ai bn−i = ai bs−i .
n=0 i=0 s=0 i=0

Por hipótese, sabemos que limk Pk = n∈N bn . Além disso, as duas séries
P   P
n∈N an
neste produto são convergentes. Podemos ainda observar que as duas somas se parecem,
no seguinte sentido:
2k
! 2k s
!
X X X X
Pk = ai b j = ai bs−i ξi,s,k ,
s=0 0≤i,j≤k : i+j=s s=0 i=0

13
onde
1 se i ≤ k e s − i ≤ k;

ξi,s,k =
0 em caso contrário.
Começamos a prova com um caso particular do teorema.
Passo 1: se os ai e bj são não-negativos, então vale o teorema.
Note que, neste caso, {Hk }k∈N é uma sequência de somas parciais
 P de uma  série com
termos não-negativos. Se provarmos que ela converge a n∈N bn , garantimos
P
n∈N an
automaticamente que a série limk Hk converge absolutamente.
Basta, portanto, provar que limk Hk = limk Pk . Para fazer isto, observe primeiramente
que todos os termos da soma que define H2k , que é
2k s
!
X X
H2k = ai bs−i
s=0 i=0

aparecem na soma Pk multiplicados por ξi,s,k ∈ {0, 1}. Ou seja, Pk é a soma de alguns termos
que aparecem em H2k . Como todos estes termos são não-negativos, concluímos que
Pk ≤ H2k . (Se o leitor preferir, pode fazer um argumento mais algébrico:
2k s
!
X X
H2k − Pk = ai bs−i (1 − ξi,s,k ) ≥ 0
s=0 i=0

porque todas as quantidades do lado direito são não-negativas.)


Por outro lado, se s ≤ k e i ≤ s, ξi,s,k = 1 sempre. Segue que a soma que define Pk
contem todos os termos com ai bs−i com 0 ≤ i ≤ s ≤ k, além de alguns outros que são
não-negativos. Concluímos que
k s
!
X X
Pk ≥ ai bs−i = Hk
s=0 i=0

e portanto Hk ≤ Pk ≤ H2k para todoPk ∈ N.  P


Note agora que Pk converge a n∈N bn . Além disso, como os ai e bj são

n∈N an
todos ≥ 0, {Hk }k∈N é crescente. Concluímos que Hk é limitada, portanto converge a um
limite. Como {H2k }k∈N é uma subsequência de {Hk }k∈N , ela converge ao mesmo limite
que a sequência inteira. Deduzimos:
! !
X X
lim Hk ≤ lim Pk = an bn ≤ lim H2k = lim Hk ,
k k k k
n∈N n∈N

ou seja, ! !
X X
lim Hk = an bn .
k
n∈N n∈N

Isto conclui o Passo 1.

14
Passo 2: estendendo a prova para ai e bj gerais.

Até agora trabalhamos supondo que ai , bj ≥ 0. Vamos agora ver o que acontece no
caso geral. Usando o Passo 1, vemos que
n
! ! !
X X X X
|ai | |bn−i | = |an | |bn | < +∞, (1.1) eq:positiva
n∈N i=0 n∈N n∈N

já que, por hipótese, as séries n an e n bn são absolutamente convergentes. Concluímos


P P
que também vale
! ! ! !
X X n X X n X X
ai bn−i ≤ |ai ||bn−i | = |an | |bn | < +∞.



n∈N i=0 n∈N i=0 n∈N n∈N

Portanto, {Hk }k converge absolutamente. Por outro lado, seguindo o raciocínio de


antes,
!
X 2k X s
|Pk − H2k | = ai bs−i (ξi,s,k − 1)

s=0
i=0
2k s
!
X X
≤ |ai | |bs−i ||ξi,s,k − 1|
s=0 i=0
2k s
!
X X
(|1 − ξi,s,k | ≤ 1 e vale 0 se s ≤ k) ≤ |ai | |bs−i |
s=k+1 i=0
∞ s
!
X X
≤ |ai | |bs−i |
s=k+1 i=0

O último termo acima é a cauda da série n ( si=0 |ai | |bs−i |), que aparece do lado esquerdo
P P
de (1.1). Como esta série converge, sua cauda vai a 0 e concluímos |Pk − H2k | → 0 quando
k → +∞. Portanto,
! !
X X
lim Hk = lim H2k = lim Pk = an bm .
k k k
n m

1.1.5 Limites de funções, continuidade, máximos e mínimos


Dado um intervalo I, uma função f : I → R e um ponto x ∈ R que é limite de pelo menos
uma sequência em I, dizemos que

lim f (y) = a
y→x

15
se para qualquer sequência {yn }n∈N ⊂ I\{x} com yn → x temos também f (yn ) → a.
Dizemos que f é contínua em x ∈ I se limy→x f (y) = f (x).
Se I é compacto, toda função contínua tem duas propriedades adicionais automatica-
mente. A primeira é que ela atinge seus supremo e ínfimo: isto é,

∃xmin , xmax ∈ I ∀x ∈ I : f (xmin ) ≤ f (x) ≤ f (xmax ).

Em particular, f é limitada.
A segunda propriedade que temos sobre intervalos compactos é que f é uniformemente
contínua. Isto quer dizer que, se definimos o módulo de continuidade de f :

mf (δ) := sup{|f (x) − f (y)| : x, y ∈ I, |x − y| ≤ δ} (δ ∈ R+ ),

então mf (δ) → 0 quando δ → 0.

Exercício 1.3 Dê exemplos de funções contínuas sobre I aberto que não são limitadas ou unifor-
memente contínuas.

1.1.6 Derivadas e integrais


Dados um intervalo I, pontos a, b ∈ I com a < b (e portanto [a, b] ⊂ I) e f : I → R,
dizemos que f é diferenciável em x ∈ I se

f (y) − f (x)
∃f ′ (x) := lim .
y→x y−x

O Teorema Fundamental do Cálculo nos diz que a derivada é a basicamente a operação


inversa da Integral definida:

x n−1  
x−aX i (x − a)
Z
I(f )(x) := f (t) dt = lim f a+ .
a n→+∞ n i=0 n

Ou seja, I(f ′ )(x) = f (x) − f (a) e I(g)′ (x) = g(x) para quaisquer f, g : [a, b] → R tais que f ′
e g são Riemann-integráveis.
Recordamos ainda que toda função diferenciável é contínua.

1.2 Algumas funções especiais


Neste capítulo recordamos alguns resultados fundamentais sobre quatro funções espe-
ciais: exponencial, logaritmo, seno e cosseno. A ideia é provar algumas propriedades
destas funções diretamente, sem recorrer à teoria de diferenciação de séries de potência.

16
1.2.1 A função exponencial
Definimos a função exponencial através da série de potência usual.
+∞ n
X t
exp(t) := , t ∈ R. (1.2)
n=0
n!

Note que a definição acima faz sentido porque a série converge absolutamente para
qualquer t ∈ R. Pode-se verificar isto a partir do teste da razão:

|t|n+1 /(n + 1)! |t|


n
= → 0 quando n → +∞.
|t| /n! n+1

Vemos ainda que exp(0) = 1.

Proposição 1.1 (Adição e produto) Dados quaisquer t, s ∈ R,

exp(t + s) = exp(t) exp(s).

Prova: Recorde a fórmula binomial:


n    
X n i n−i n n!
n
(t + s) = t s , onde = .
i=0
i i i! (n − i)!

Aplicando a fórmula termo a termo na série de exp(t + s), descobrimos que



+∞ n
!
X (t + s)n X X ti tn−i
exp(t + s) := = .
n=0
n! n=0 i=0
i! (n − i)!

Observe que isto tem a forma


∞ n
!
X X
ai bn−i ,
n=0 i=0

onde an = t /n! e bn = s /n! para cada n ∈ N. Como n tn /n! converge absolutamente a


n n
P
exp(t), e analogamente para exp(s), deduzimos do Lema 1.1 que:
! !
X X
exp(t + s) = an bn = exp(t) exp(s).
n n

Proposição 1.2 exp′ (t) = exp(t) para cada t ∈ R.

17
Prova: Queremos mostrar que

exp(t + h) − exp(t)
Queremos: → exp(t) quando h → 0.
h
Usando o fato que exp(t + h) = exp(t) exp(h), observamos que o que queremos equivale
a:
(exp(h) − 1) exp(t)
Queremos (equivalente): → exp(t) para todo t,
h
e para isto basta provar que
exp(h) − 1
Basta: → 1.
h
Para tal, observe que

X hn
exp(h) − 1 = = h + R(h)
n=1
n!
com
X hn
R(h) = .
n≥2
n!

Como n! ≥ 1 sempre, podemos comparar a série de R(h) termo a termo com a série
geométrica:
X |h|n X |h|2
∀|h| ≤ 1/2 : |R(h)| ≤ ≤ |h|n = .
n≥2
n! n≥2
1 − |h|

Em particular, isto quer dizer que



exp(h) − 1 |R(h)| |h|
∀|h| ≤ 1/2 − 1 = ≤ .
h |h| 1 − |h|

Como o lado direito desta desigualdade tende a 0 quando h → 0, deduzimos que |(exp(h)−
1)/h − 1| → 0, o que encerra a prova. 2

Proposição 1.3 exp(t) > 0 para todo t ∈ R.

Prova: Como exp é diferenciável, ela é contínua em todo R, em particular ao redor de


t = 0. Como exp(0) = 1, sabemos que existe um ε > 0 tal que exp(a) > 1/2 sempre
que |a| < ε. Por outro lado, dado t ∈ R qualquer, podemos encontrar um n ∈ N tal que
|t/n| < ε, de modo que exp(t/n) > 1/2. Desta forma, podemos aplicar a regra de “adição
vira produto" para deduzir que
    n
t t 1
exp(t) = exp n = exp > n > 0.
n n 2
2

18
Proposição 1.4 exp é estritamente crescente. Além disso, limt→+∞ exp(t) = +∞ e limt→+∞ exp(−t) =
0.

Prova: As duas proposições anteriores implicam que exp tem derivada estritamente posi-
tiva em todo ponto da reta. Portanto, exp é estritamente crescente. Em particular, isto quer
dizer que há um a > 0 com exp(a) = m > 1 = exp(0). Usando o raciocínio da proposição
anterior, vemos que

exp(na) ≥ mn → +∞ quando n → +∞, já que m > 1.

Em particular, dado M > 0 existe um t ∈ R como exp(t) > M . Como exp é crescente, isto
implica que exp(t) → +∞ quando t → +∞.
Por outro lado, a regra de que adição vira produto implica que

1
exp(−t) = → 0 quando t → +∞.
exp(t)
2

Proposição 1.5 exp(R) = R+ \{0} Além disso, exp é uma bijeção entre domínio e imagem.

Prova: Já vimos que exp(t) ∈ R+ \{0} para todo t. Resta mostrar que, dado x ∈ R+ \{0},
existe um único t com exp(t) = x. Veja que a unicidade segue do fato que exp é estrita-
mente crescente. Para provar existência, observe que, pela proposição anterior, certamente
existem t− , t+ com exp(t− ) ≤ x ≤ exp(t+ ) (e necessariamente t− ≤ t+ , posto que exp é
estritamente crescente). Como exp é diferenciável, ela é contínua e o Teorema do Valor
Intermediário nos diz que existe um t ∈ [t− , t+ ] com exp(t) = x. 2

1.2.2 A função logaritmo


Como exp : R → R+ \{0} é uma bijeção estritamente crescente, ela tem uma função inversa
log : R+ \{0} → R que também é uma bijeção estritamente crescente. Como a exponencial
transforma soma em produto, esta função, chamada de logaritmo, deve fazer o contrário.

Proposição 1.6 (Prova omitida) log(xy) = log x + log y para quaisquer x, y > 0.

Da mesma forma, como exp(t) → +∞ e exp(−t) → 0 quando t cresce, podemos provar


que:

Proposição 1.7 (Prova omitida) log(x) → −∞ se x → 0 e log(x) → +∞ se x → +∞.

Agora calcularemos a derivada do logaritmo, provando, em particular, que ela existe.

Proposição 1.8 log′ (x) = 1/x para qualquer x > 0.

19
Prova: Fixo x > 0, devemos provar que

log(x + h) − log x 1
Queremos: lim = .
h→0 h x
Para isso, vamos fixar uma sequência {hn }n∈N com hn → 0 e min{hn , x + hn } > 0 para todo
n. Nosso objetivo é provar que, não importando qual sequência deste tipo escolhemos,

log(x + hn ) − log x 1
Queremos (equivalente): lim = .
h→0 hn x

Tome então t com exp(t) = x e tn com exp(tn ) = x + hn para cada n ∈ N. Afirmamos


que, obrigatoriamente, tn → t. Note que isto quer dizer que:

log(x + hn ) − log x tn − t 1 1
lim = lim = .
n→+∞ hn n→+∞ exp(tn ) − exp(t) exp(t) x

Portanto, se provarmos a afirmação, teremos encerrado a prova.


Para provar a afirmação, recorde que exp(tn ) = x + hn → x = exp(t). Tome ε > 0 e
defina a+ := exp(t + ε), a− := exp(t − ε). Como exp é estritamente crescente, a− < exp(t) <
a+ , portanto exp(tn ) ∈ (a− , a+ ) para todo n suficientemente grande. Usando novamente
o fato que exp é estritamente crescente, deduzimos que t − ε < tn < t + ε para todo n
suficientemente grande. Como ε é arbitrário, isto implica tn → t. 2

Observação 1.1 A mesma prova acima mostra que, se f é contínua e estritamente crescente, então
sua inversa tem as mesmas propriedades.

1.2.3 As funções seno e cosseno


Definimos agora duas novas funções via séries de potência (para t ∈ R).
+∞
X t2n
cos(t) := (−1)n
n=0
(2n)!
+∞
X t2n+1
sin(t) := (−1)n+1 .
n=1
(2n + 1)!

Repare que os termos destas séries são termos da série da exponencial, agora multi-
plicados por sinais alternados. Podemos portanto usar uma comparação com a série da
exponencial para provar que as duas séries convergem.

Proposição 1.9 cos(t + s) = cos(t) cos(s) − sin(t) sin(s) e sin(t + s) = sin(t) cos(s) +
cos(t) sin(s) para todos t, s ∈ R.

20
Prova: Provaremos apenas a primeira identidade, já que a segunda é similar.
Usando um argumento parecido com a fórmula da exponencial:
+∞ +∞ 2n i
!
2n 2n−i
X (t + s) X X t s
cos(t + s) = (−1)n = (−1)n
n=0
(2n)! n=0 i=0
i! (2n − i)!

Em cada somatório interno podemos dividir os índices i entre os da forma 2j (com


0 ≤ j ≤ n) e os da forma 2k + 1 (com 0 ≤ k ≤ n − 1). Temos, então
2n i n
n
X t s2n−i X (−1)j t2j (−1)n−j s2(n−j)
(−1) =
i=0
i! (2n − i)! j=0
(2j)! (2(n − j))!
n−1
X (−1)k t2k+1 (−1)n−k s2(n−k)+1
+ .
k=0
(2k + 1)! (2n − 2k + 1)!

Deduzimos que cos(t + s) é igual a:


+∞ n n−1
!
X X (−1)j t2j (−1)n−j s2(n−j) X (−1)k t2k+1 (−1)n−k s2(n−k)+1
+ .
n=0 j=0
(2j)! (2(n − j))! k=0
(2k + 1)! (2n − 2k + 1)!

Usando o Lema 1.1, podemos reconhecer os seguintes termos acima:


∞ n
!
X X (−1)j t2j (−1)n−j s2(n−j)
= cos(t) cos(s)
n=0 j=0
(2j)! (2(n − j))!

e
∞ n−1
!
X X (−1)k t2k+1 (−1)n−k s2(n−k)−1
= − sin(s) sin(s),
n=0 k=0
(2k + 1)! (2n − 2k − 1)!
com convergência uniforme em ambos os casos. Como a soma destas séries para cos(t) cos(s)
e − sin(t) sin(s) é a série de cos(t + s), temos a identidade desejada. 2

Proposição 1.10 cos′ (t) = − sin(t) e sin′ (t) = cos(t).

Prova: Apenas esboçaremos a prova do primeiro fato acima, já que a segunda é similar.
Veja que, dado h ̸= 0, podemos utilizar a identidade das somas acima para escrever
 
cos(t + h) − cos(t) cos(h) − 1 sin h
= cos(t) − sin t.
h h h
Seguindo a conta que fizemos para a exponencial, podemos mostrar que sin h/h → 1 e
(cos h − 1)/h → 0: basta separar
sin h = h + resto da ordem |h|3 e cos h = 1 + resto da ordem |h|2 .
2

21
Proposição 1.11 sin2 (t) + cos2 (t) = 1 para todo t ∈ R.

Prova: Isto vale se t = 0 por inspeção. Além disso, sin2 (t) + cos2 (t) é constante:
(sin2 (t) + cos2 (t))′ = 2 sin(t) sin′ (t) + 2 cos(t) cos′ (t) = 0.
2

Proposição 1.12 Dados t, s ∈ R (cos t, sin t) = (cos s, sin s), implica cos(t−s) = 1, sin(t−s) =
0.

Prova: Pelas fórmulas para senos e cossenos de t + s


cos t = cos s ⇒ cos t = cos s cos(t − s) − sin(t − s) sin s.
sin t = sin s ⇒ sin t = sin s cos(t − s) + sin(t − s) cos s.
Escrevendo a := cos t = cos s, b := sin t = sin s, x = cos(t − s), y = sin(t − s), temos que

ax − by = a
bx + ay = b
Se a b ̸= 0, o sistema acima tem como única solução x = 1, y = 0. Se a = 0, então b ̸= 0 (já
que a2 + b2 = 1) e chegamos à mesma conclusão que x = 1, y = 0. O mesmo vale ainda se
b = 0 (e portanto a = 1). 2

Proposição 1.13 Existe um p > 0 tal que cos p = 0 e cos t > 0 para t ∈ [0, p). Temos também
sin t = p e 0 < sin t < 1 para t ∈ [0, p) (No que segue, π := 2p).

Prova: Por um lado, cos 0 = 1. Por outro lado, temos:


22 24 26 24n 24n+2
cos 2 = 1 − + − + ··· + − + ....
2! 4! 6! (4n)! (4n + 2)!
2 4n 4n+2
Como 1 − 22! = 0 e (4n)!
2 2
< (4n+2)! para n ≥ 1, temos que cos 2 < 0. Isto é, cos 0 > 0 > cos 2. O
cosseno é diferenciável e portanto contínuo; isto nos permite aplicar o Teorema do Valor
Intermediário para provar que existe um x ∈ (0, 2) com cos x = 0. Definimos então
p := inf{x ∈ (0, +∞) : cos x = 0}.
Note que p ≥ 0 está bem definido porque cos x = 0 para ao menos um x e o conjunto
de x considerados é limitado por baixo. Veja ainda que, como p = limn xn para alguma
sequência {xn }n com cos xn = 0, temos cos p = 0 e portanto p > 0. Mais ainda, não pode
ser verdade que cos t = 0 para 0 ≤ t < p e isto quer dizer que cos t não pode trocar de sinal
neste intervalo. Ou seja cos t > 0 para 0 ≤ t < p.
Para terminar, observe que para 0 ≤ t < p, sin t é crescente (já que sua derivada é cos t),
portanto 0 < sin t < 1. Em particular, como sin é contínuo, sin p ≥ 0. Como cos p = 0 e
portanto sin2 p = 1, concluímos que sin p = 1. 2

22
Proposição 1.14 cos(t + p) = − sin(t) e sin(t + p) = cos t para todo t ∈ R. Portanto, os únicos
pontos onde cos t = 0 ou sin t = 0 são os múltiplos de p.

Prova: A primeira afirmação segue das fórmulas para cos(t + s) e sin(t + s) aplicadas a
s := p.
Para a segunda, veja que podemos escrever qualquer t ∈ R na forma t = ±p n + a com
0 ≤ a < p e n ∈ N. Usando indução em n, podemos provar a partir da primeira parte que
cos(±np + a) ∈ {± cos a, ± sin a} para qualquer n ∈ N. Deduzimos que

cos t = 0 ⇔ cos a = 0 ou sin a = 0 ⇔ a ∈ {0, p} (pois a ∈ [0, p)) .

Portanto t = np ou t = (n + 1) p. O mesmo vale se sin t = 0. 2

Proposição 1.15 (cos t, sin t) = (cos s, sin s) se e somente se t − s é múltiplo inteiro de 2π.

Prova: A hipótese equivale a cos(t − s) = 1, sin(t − s) = 0. Pela proposição anterior, é


necessário que t − s = np seja múltiplo de p, com cos(np) = 1. No entanto, é fácil ver
usando a proposição anterior que

cos(0) = 1, cos(±p) = 0, cos(±2p) = −1, cos(±3p) = 0,


cos(±4p) = 1, cos(±5p) = 0, cos(±6p) = −1, cos(±7p) = 0,
cos(±8p) = 1, cos(±9p) = 0, cos(±10p) = −1, cos(±11p) = 0 . . .

Portanto, para qualquer n ∈ Z cos(np) = 1 se e somente se n é divisível por 4. 2

Proposição 1.16 A aplicação “t 7→ (cos t, sin t)" é uma bijeção entre [0, 2π) e o círculo unitário:

S1 := {(x, y) ∈ R2 : x2 + y 2 = 1}.

Prova: Como cos2 t + sin2 t = 1, todo t é levado em S1 . Além disso, a aplicação é injetiva
para t ∈ [0, 2π) pela proposição anterior.
Para provar a sobrejetividade, fixamos (x, y) ∈ S1 para mostrar que existem t0 ∈ [0, π/2]
e m ∈ {0, 1, 2, 3} tais que

Queremos: (x, y) = (cos(t0 + mπ/2), sin(t0 + mπ/2)).

Verificamos que, como cos 0 = 1, cos(π/2) = 0 e cos é contínuo, existe um tx ∈ [0, π/2]
com cos tx = |x| e portanto sin tx = |y| (já que y 2 = 1 − x2 = 1 − cos2 t e sin t ≥ 0 para
t ∈ [0, π/2]). Do mesmo modo, há um ty ∈ [0, π/2] com cos ty = |y| e sin ty = |x|. Portanto,
temos o seguinte:
1. Se x ≥ 0, y ≥ 0, (x, y) = (cos tx , sin tx ).

2. Se x < 0, y ≥ 0, observamos que

(x, y) = (− sin ty , cos ty ) = (cos(ty + π/2), sin(ty + π/2)).

23
3. Se x ≤ 0, y ≤ 0,
(x, y) = (cos(tx + π), sin(tx + π)).

4. Se x > 0, y ≤ 0, observamos que

(x, y) = (sin ty , − cos ty ) = (cos(ty + 3π/2), sin(ty + 3π/2)).

Portanto, provamos o que queríamos em todos os quatro casos. 2

1.3 A desigualdade das médias


Encerramos este capítulo provando a conhecida desigualdade entre as médias aritmética
e geométrica.

teo:MAMG Teorema 1.1 (Desigualdade das médias aritmética e geométrica) Sejam α1 , . . . , αk núme-
ros positivos com soma 1. Dados t1 , . . . , tk ∈ R+ , temos a desigualdade:
k
Y k
X
tαi i ≤ αi ti .
i=1 i=1

Além disso, vale igualdade se e somente se t1 = t2 = · · · = tk .

Prova: O passo fundamental neste resultado é estabelecer o resultado para k = 2 e depois


generalizá-lo por indução.
Fixemos então k = 2. Para facilitar um pouco a notação, definimos x := tα1 1 , y = tα2 2 ,
p = 1/α1 , q = 1/α2 . Veja que x, y ≥ 0, p, q > 1 e (1/p) + (1/q) = 1. Desejamos provar que

xp y q
Queremos: ∀x, y ≥ 0 : xy ≤ + , com igualdade se e somente se xp = y q .
p q

Isto é trivial quando x = 0, logo vamos supôr x > 0. O que queremos, então, é equivalente
a provar que:
Queremos (de forma equivalente): ∀x ∈ R+ \{0} :
yq xp
 
sup xy − = , atingido só quando y q = xp .
y∈R+ q p
Para provar esta propriedade, fixe x ∈ R+ \{0} e defina ϕx (y) := xy − y q /q, y ∈ R+ .
Recordando que q > 1, x > 0, vemos que ϕx é diferenciável e que
1

 > 0 se y < x q−1 ;

1
ϕ′x (y) = x − y q−1 = 0 se y = x q−1 ;
1
< 0 se y > x q−1 .

24
1
Segue que y∗ := x q−1 é o único máximo global da função ϕx . Note ainda que, como
(1/p) + (1/q) = 1, temos p = q/(q − 1) = 1 + 1/(q − 1), portanto y∗ é o único ponto com
y∗q = xp .
Vamos calcular agora ϕx (y∗ ). A conta abaixo usa novamente o fato que p = q/(q − 1) =
1 + 1/(q − 1):
q
1
1+ q−1 x q−1 xp xp
ϕx (y∗ ) = x − = xp − = .
q q p
O que deduzimos então é o seguinte:
1. Como y∗ é máximo global de ϕx , vale que, para qualquer y ∈ R+ ,
yq xp
ϕx (y) = xy − ≤ ϕx (y∗ ) = .
q p

2. Além disso, apenas y∗ , que satisfaz y∗q = xp , atinge este máximo global.
Isto era exatamente o que queríamos provar e encerra a demonstração para k = 2.
Vejamos agora a prova para k > 2. A ideia é fazer indução forte em k tomando k = 2
como base. Se k > 2, defina novos expoentes
αi
βi := i = 1, 2, . . . , k − 1.
1 − αk
Observe que
k
Y
tαi i = T 1−αk tαk k , (1.3) eq:AMGMaqui
i=1

onde (por hipótese de indução)


k−1 k−1 Pk−1
Y X αi ti
T := tβi i ≤ S := βi ti = i=1
,
i=1 i=1
1 − αk

com igualdade se e somente se t1 = · · · = tk−1 Aplicando o caso k = 2 a (1.3), temos


k
Y k
X
tαi i ≤ (1 − αk ) T + αk tk ≤ (1 − αk ) S + αk tk = αi ti .
i=1 i=1

Além disso, a igualdade só vale se T = S – e portanto T = t1 = t2 = · · · = tk−1 – e além


disso tk = T . Portanto, para que a igualdade valha, é necessário que t1 = · · · = tk . 2

Exercício 1.4 Sejam 1 < p, q < +∞ com (1/p)+(1/q) = 1. Mostre que para quaisquer x, y ∈ R,
|x|p |y|q
xy ≤ +
p q
com igualdade se e somente valem seguintes condições:

25
• |x|p = |y|q ;

• ou x = y = 0, ou x ̸= 0 ̸= y e os sinais de x e y coincidem.

ascomlambda Exercício 1.5 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R
e λ > 0,
|x|p λq |y|q
xy ≤ + .
p λp q
Além disso, se x, y ∈ R+ , existe uma escolha de λ tal que

|x|p λq |y|q
|xy| = + .
p λp q

26
Capítulo 2

Espaços vetoriais e normas

O principal objetivo deste curso é estender a Análise que aprendemos na reta a espaços
mais gerais: os chamados espaços métricos. Antes de defini-los, vamos começar com a
classe mais restrita, mas muito importante, de espaços vetoriais normados. Aqui já veremos
alguns dos desafios de levar a Análise a uma dimensão mais alta.

2.1 Um caso concreto: o espaço Rd


Começamos de forma ainda mais particular pelo espaço vetorial que todo mundo conhece
(ou deveria conhecer): o espaço euclideano real de d dimensões.
Dado d ∈ N\{0}, definimos Rd como um produto cartesiano:
Rd := |R × R ×
{z· · · × R} .
d vezes

Os elementos x ∈ Rd são d-tuplas de números reais, x = (x[i])di=1 . Os números x[1], . . . , x[d] ∈


R são chamados de coordenadas de x. Esta notação que usamos para as coordenadas é ins-
pirada pelo MatLab!
É bom especificar logo de cara d + 1 vetores especiais em Rd :
• O vetor nulo 0Rd cujas coordenadas são 0Rd [i] = 0, i = 1, . . . , d.
• Os vetores ej , 1 ≤ j ≤ d, da base canônica de Rd cujas coordenadas são

1, i = j;
ej [i] = 1 ≤ i, j ≤ d.
0, i ̸= j;

2.1.1 Operações em Rd e suas propriedades


Há duas operações fundamentais em Rd :
1. Soma (e diferença): dados x, y ∈ Rd , x ± y ∈ Rd é o vetor cujas coordenadas são
(x ± y)[i] = x[i] ± y[i], 1 ≤ i ≤ d.

27
2. Multiplicação por escalar: dados x ∈ Rd e λ ∈ R λ x ∈ Rd é o vetor cujas coordenadas
são (λ x)[i] = λ x[i], 1 ≤ i ≤ d.

Não é difícil verificar as seguintes propriedades:

• 0 é o elemento neutro da soma: para todos x, y ∈ Rd , x + y = x se e somente se y = 0.

• 0 x = 0 para todo x ∈ Rd .

• 1 é o elemento neutro da multiplicação por escalar: para todos x ∈ Rd , λ ∈ R, λ x = x


se e somente se x = 0 e/ou λ = 1.

• As operações são todas associativas. A soma é comutativa também.

• A multiplicação por escalar é distributiva das duas maneiras pssíveis: se λ, η ∈ R,


x, y ∈ Rd :
(λ + η) x = λ x + η x e λ (x + y) = λ x + λ y.

Exercício 2.1 Prove que:


d
X
d
∀x ∈ R : x = x[i] ei .
i=1

2.1.2 Produto interno e a norma euclideana em Rd


Grosso modo, uma norma em Rd é uma maneira de medir a distância desde 0 até os
demais pontos de Rd . Desta forma, os axiomas a seguir são naturais.

Definição 2.1 Uma norma sobre Rd é uma função ∥ · ∥ : Rd → R com as seguintes propriedades:

• A norma é positiva definida, isto é, para todo x ∈ Rd , ∥x∥ ≥ 0, e ∥x∥ = 0 se e somente se


x = 0.

• A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ Rd , ∥λ x∥ = |λ| ∥x∥.

• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ Rd , ∥x + y∥ ≤ ∥x∥ + ∥y∥.

Como podemos definir uma norma em Rd ? Quase todos já sabemos que a norma
euclideana serve: v
u d
uX
|x|2 := t (x[i])2 (x ∈ Rd ).
i=1

Essa é a noção de “tamanho de um vetor" que aprendemos desde cedo nos cursos de
Álgebra Linear ou Geometria Analítica. A pergunta, no entanto, é a seguinte: como
podemos provar que esta norma euclideana é mesmo uma norma?

28
Provar que a norma é positiva definida é simples. Primeiro, observamos que |x|2 é bem
definida porque |x|22 é uma soma de termos (x[i])2 não-negativos; logo, a raíz quadrada
desta quantidade é bem-definida e não-negativa. Além disso, |x|2 se anula se e somente
se esta soma de termos não negativos se anula, o que só pode ocorrer se cada termo é nulo:
x[i]2 = 0 para cada 1 ≤ i ≤ d, ou seja, x = 0Rd .
Agora argumentamos a homogeneidade positiva: tomando x ∈ Rd e λ ∈ R, queremos
demonstrar que |λx|2 = |λ| |x|2 . Para isso, para cada i = 1, 2, . . . , d, a i-ésima coordenada
de λx é λx[i]. Como o quadrado de um produto é o produto dos quadrados, temos:
d
X d
X
|λx|22 = 2
(λx[i]) = λ 2
x[i]2 = λ2 |x|22 .
i=1 i=1

Lembramos agora que a raíz quadrada de λ2 é |λ| (por definição). Como a raíz de um
produto é o produto das raízes, obtemos |λx|2 = |λ||x|2 , como queríamos demonstrar.
Como último passo, precisamos provar que a norma euclideana é subaditiva. Em geral
esta é a parte mais difícil de se provar que uma candidata a norma é mesmo norma. No
caso que estamos analisando, faremos isso a partir das propriedades do produto interno
que quase todos conhecem. Dados x, y ∈ Rd , definimos:
d
X
x · y := x[i] y[i] ∈ R.
i=1

A relação entre norma euclideana e produto interno é que |x|22 = x · x. Nossa prova da
subaditividade da norma será baseada nas propriedades do produto interno listadas a
seguir.

em:enormaRd Lema 2.1 (Propriedades básicas do produto interno) Dados x, x′ ∈ Rd :

1. Positividade: x · x ≥ 0, com igualdade se e somente se x = 0.


2. Simetria: x · x′ = x′ · x.
3. Linearidade: se λ ∈ R, a, b ∈ Rd e x = λa + b, então x′ · x = x · x′ = λ (a · x′ ) + (b · x′ ).

Prova: A primeira propriedade é exatamente a mesma coisa que dizer que a norma eucli-
deana é positiva definida, o que já provamos acima.
A propriedade 2 é consequência do fato que x[i] x′ [i] = x′ [i] x[i] para cada coordenada
i ∈ {1, . . . , d}, de modo que
d
X d
X

x·y = x[i] x [i] = y[i] x[i] = x′ · x.
i=1 i=1

A propriedade 3 vem do fato que, por definição das operações de Rd

x = λa + b ⇒ x[i] = λa[i] + b[i]

29
de modo que, pelas distributividade e associatividade de R,

d
X d
X
′ ′
x·x = x[i] x [i] = (λ a[i] + b[i]) x′ [i]
i=1 i=1
d
X Xd
= λ a[i] x′ [i] + b[i] x′ [i]
i=1 i=1
= λ (a · x′ ) + (b · x′ ).

2
A subaditividade vai precisar de um passo a mais, derivado do último lema: a desi-
gualdade de Cauchy-Schwartz.

Teorema 2.1 (Desigualdade de Cauchy Schwartz) Para quaisquer x, y ∈ Rd , vale |x · y|2 ≤


|x|2 |y|2 . A igualdade vale exatamente quando x = 0Rd ou y = 0Rr ou y/|y|2 = x/|x|2 .

Prova: O teorema é trivialmente verdadeiro se x = 0Rd ou y = 0Rd . Podemos então supôr


que nenhum dos dois vetores se anula. Neste caso, podemos considerar v := x/|x|2 e
w := y/|y|2 , notando que estes vetores têm norma 1. Pela linearidade do produto interno,

x · y ≤ |x|2 |y|2 ⇔ v · w ≤ 1.

Provaremos a seguir que v · w ≤ 1 com igualdade se e somente se v = w, o que claramente


implica o teorema.
Para provar que |v · w| ≤ 1, escrevemos:

d
X
v·w = v[i] w[i]
i=1
Xd
≤ |v[i] w[i]| (2.1)
i=1
d
X |v[i]|2 + |w[i]|2
(média geo. ≤ aritmética p/ cada termo) ≤ (2.2)
i=1
2
(|v|2 = |w|2 = 1) = 1.

Como podemos ter igualdade acima? Em primeiro lugar, (2.1) deve ser uma igualdade,
o que acontece se e somente se todos os termos da soma forem maiores ou iguais a zero.
Ou seja, queremos que v[i] e w[i] tenham o mesmo sinal para cada índice i. Em segundo
lugar, precisamos de igualdade na aplicação da desigualdade das médias em (2.2), o que
só ocorre quando |v[i]|2 = |w[i]|2 – ou seja, v[i] = ±w[i] – para cada i. Deduzimos que
v · w = 1 se e somente se v = w, o que ocorre se e somente se y = |y|2 x/|x|2 . 2

30
Terminamos a seção usando Cauchy-Schwartz para provar que a norma é sub-aditiva.
normalinear Teorema 2.2 Vale a identidade:

∀x ∈ Rd : |x|2 = max{x · z : z ∈ Rd , |z|2 = 1}

Em particular, a norma euclideana é subaditiva (e portanto é mesmo uma norma).


Prova: A igualdade vem de Cauchy-Schwartz. Temos x · z ≤ |x|2 para todo z de norma 1,
com igualdade se e somente se x = 0Rd ou z = x/|x|2 .
Para a subaditividade, tome x e y em Rd . Dado qualquer z ∈ Rd de norma 1,

z · (x + y) = z · x + z · y ≤ |x|2 + |y|2 (por Cauchy-Schwartz aplicada a z.x e z.y).

Portanto,
|x + y|2 = max{z · (x + y) : z ∈ Rd , |z|2 = 1} ≤ |x|2 + |y|2 .
2

Observação 2.1 Um caminho ainda mais simples para provar a subaditividade é observar que,
pela bilinearidade do produto interno e Cauchy-Schwartz

|x + y|22 = |x|22 + |y|22 + 2 x.y ≤ |x|22 + |y|22 + 2 |x|2 |y|2 = (|x|2 + |y|2 )2 .

Como a raíz quadrada é uma função monótona, obtemos |x + y|2 ≤ |x|2 + |y|2 . No entanto, a ideia
contida no Teorema 2.2 de expressar a norma como máximo se aplica de forma ainda mais geral;
veja os Exemplos 2.3 e 2.4 e o Exercício 2.16.

2.2 Definições gerais


2.2.1 O que é um espaço vetorial?
Acima vimos (ou recordamos a teoria básica do espaço Rd com sua norma mais básica
e suas operações. Veremos ao longo do curso muitos outros espaços com estrutura
semelhante.

Definição 2.2 (Espaço vetorial) Chamamos de espaço vetorial sobre R um conjunto V ̸= ∅


com operações de soma
(v, w) ∈ V 2 7→ v + w ∈ V
e multiplicação por escalar
(λ, v) ∈ R × V 7→ λ v ∈ V,
além de um elemento distinguido 0 ∈ V , definidos de modo a satisfazer os axiomas a seguir:
1. Comutatividade e associatividade da soma: v + w = w + v e (v + w) + z = v + (w + z)
para todos v, w, z ∈ V .

31
2. Associatividade do produto por escalar: para quaisquer λ, η ∈ R, v ∈ V , λ(ηv) =
(λη) v.

3. Distributividade: para todos v, w ∈ V , λ, ξ ∈ R, (λ + ξ) (v + w) = λv + λw + ξv + ξw.

4. Elemento neutro: 0 + v = v para todo v ∈ V .

5. Multiplicação por 1 e 0: 1.v = v e 0.v = 0 para todo v ∈ V .

O espaço Rd discutido acima é um espaço vetorial segundo esta definição. Note que
d = 1 é uma escolha válida, ou seja: com as operações usuais, R é um espaço vetorial sobre
R!
Veremos agora mais dois exemplos.

Exemplo 2.1 (Matrizes ℓ × d) Sejam agora ℓ, d ∈ N\{0}. Considere o conjunto Rℓ×d de todas
as matrizes com ℓ linhas, d colunas e entradas reais.

Um elemento A deste espaço tem a seguinte “cara”.


 

 A[1, 1] A[1, 2] . . . A[1, d]
 A[2, 1] A[2, 2] . . . A[2, d] 

ℓ linhas  . . .
 

  . . . . 

 A[ℓ, 1] A[ℓ, 2] . . . A[ℓ, d]
| {z }
d colunas

Ou seja, as entradas (ou “coordenadas") de uma matriz ℓ × d são chamadas de A[i, j],
com 1 ≤ i ≤ ℓ e 1 ≤ j ≤ d. Podemos definir a soma e subtração de matrizes, além do
produto de uma matriz por escalar, fazendo tudo entrada a entrada. Como no caso de
Rd , a estrutura resultante nos dá um espaço vetorial. Isso não chega a ser uma surpresa
porque, afinal, uma matriz ℓ×d pode ser reescrita como um vetor de ℓ d números reais. No
entanto, o fato que matrizes representam transformações lineares sugere maneiras diferentes
de se medir os elementos de Rℓ×d .
O exemplo a seguir é um tanto quanto diferente.

Exemplo 2.2 (Funções contínuas) Dado um subconjunto I ⊂ R, I ̸= ∅, considere o conjunto

C(I, R) := {f : I → R : f contínua}.

Este espaço tem uma estrutura natural de espaço vetorial. O elemento 0 é a função
que se anula em todo ponto. A soma é exatamente a soma usual de funções, o que
“funciona" porque a soma de funções contínuas é contínua. O produto por escalar consiste
em tomar a função f e o escalar λ e definir uma nova função λ f que leva t ∈ I em λ f (t). É
um exercício mostrar que estas operações realmente satisfazem todos axiomas de espaço
vetorial.

32
ssaofuncoes Observação 2.2 (Vetores são funções e vice-versa) O espaço de funções tem uma certa relação
de analogia o Rd . Numa direção, podemos conceber cada vetor x ∈ Rd como uma representação de
uma função de x : {1, . . . , d} → R associando cada 1 ≤ i ≤ d um valor x[i]. Na outra direção,
podemos pensar numa função f : I → R como um "vetor" cujas coordenadas f (t) são indexadas
pelos elementos t ∈ I. Isso nos mostra que pensar em C(I, R) como espaço vetorial, além de ser
formalmente correto, tem um significado intuitivo também. Manter isso em mente pode ajudar a
compreender várias provas abaixo.

2.2.2 Subespaços de espaços vetoriais


Ocasionalmente, será importante olharmos para subespaços de espaços vetoriais.

Definição 2.3 (Subespaço vetorial) Chamamos um subconjunto W ⊂ V , W ̸= ∅ de subes-


paço vetorial de V se ele é fechado pelas operações de soma e multiplicação por escalar. Ou
seja:
∀w, w′ ∈ W, ∀λ ∈ R : λ w + w′ ∈ W.

Por exemplo, dado qualquer a ∈ Rd , o conjunto

Ha := {x ∈ Rd : a · x = 0}

é um subespaço de Rd ; isto segue da linearidade do produto interno.

Exercício 2.2 O conjunto das matrizes d × d simétricas – isto é, as A ∈ Rd×d com A[i, j] = A[j, i]
para cada par 1 ≤ i, j ≤ d – é um subespaço de Rd×d

Exercício 2.3 Dado J ⊂ R, o conjunto C(I, J) de funções contínuas de I em J é um subconjunto


de C(I, R). Para que escolhas de J este conjunto é um subespaço vetorial de C(I, R)?

Exercício 2.4 Dados t ∈ I e ξ ∈ R, o conjunto W de funções contínuas de I em R com f (t) = ξ


é um subconjunto de C(I, R). Para que escolhas de ξ este conjunto é um subespaço vetorial de
C(I, R)?

2.2.3 Normas
sec:normas
Para fazermos Análise, vamos precisar medir distâncias em espaços vetoriais. Isto nos
leva à definição de norma, que é exatamente aquela que usamos em Rd .

Definição 2.4 Uma norma sobre um espaço vetorial real V é uma função ∥ · ∥ : V → R com as
seguintes propriedades:
• A norma é positiva definida, isto é, para todo x ∈ V , ∥x∥ ≥ 0, e ∥x∥ = 0 se e somente se
x = 0.

• A norma é homogênea positiva, isto é, para quaisquer λ ∈ R, x ∈ V , ∥λ x∥ = |λ| ∥x∥.

33
• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ V , ∥x + y∥ ≤ ∥x∥ + ∥y∥.

Em geral há alguma dificuldade de provar que uma candidata a norma é mesmo


norma, especialmente porque a subaditividade pode ser difícil de checar. Por exemplo,
foi assim no caso da norma euclideana em Rd , que abordamos acima. Veremos abaixo
alguns exemplos que requerem estratégias variadas.

Normas envolvendo máximos e supremos


Na nossa prova de que | · |2 é norma para Rd , usamos fortemente que |x|2 é o supremo
de x.z sobre vetores unitários z ∈ Rd . Outros casos de normas baseadas em supremos ou
máximos são apresentados abaixo.

ex:linfty Exemplo 2.3 Uma outra maneira de definir uma norma em Rd é tomando-se a norma do máximo,
ou ℓ∞ .
|x|∞ := max |x[i]| (x ∈ Rd ).
1≤i≤d

Vejamos que esta é mesmo uma norma. Em primeiro lugar, ela é bem definida porque
o máximo de um conjunto finito sempre é bem definido. Ela é positiva-definida porque é
sempre não-negativa (o módulo de cada x[i] é não-negativo) e vale 0 se e somente todas
as coordenadas de x se anulam (afinal, |x[i]| ≤ |x|∞ para cada i). Também não é difícil ver
que ela é homogênea positiva, usando que |λx[i]| = |λ| |x[i]| para cada i = 1, . . . , d.
A subaditividade também não é difícil de se mostrar neste caso. Tome x, x′ ∈ Rd . Para
cada coordenada i =, . . . , d, podemos usar a sub-aditividade do valor absoluto (sobre os
reais) e a definição de | · |∞ e deduzir:

|(x + x′ )[i]| ≤ |x[i]| + |x′ [i]|.

Como o valor absoluto de cada uma das coordenadas pode ser cotado por cima pelo
máximo dos valores absolutos, chegamos à seguinte desigualdade:

|x[i]| + |x′ [i]| ≤ max |x[j]| + max |x′ [j]| = |x|∞ + |x′ |∞ .
1≤j≤d 1≤j≤d

Concluímos todas as coordenadas satisfazem |(x + x′ )[i]| ≤ |x|∞ + |x′ |∞ . Tomando o


máximo sobre i, deduzimos que |x + x′ |∞ ≤ |x|∞ + |x′ |∞ , como queríamos demonstrar.
O exemplo a seguir é só um pouco diferente.

:normadosup Exemplo 2.4 Tome I ⊂ R compacto e escreva C := C(I, R). Para f ∈ C, definimos:

∥f ∥I,∞ = sup |f (t)|.


t∈R

Às vezes, quando o I estiver subentendido, ele será omitido da notação e escreveremos ∥f ∥∞ .

34
A razão pela qual ∥f ∥I,∞ é bem definida é que toda função contínua sobre um compacto
é limitada, como já sabemos de Análise na Reta.
Vejamos por que ∥ · ∥∞ é mesmo norma. As demonstrações de que a norma é positiva-
definida e homogênia positiva ficam como exercício. A prova da subaditividade não é
difícil. Sejam f, g ∈ C dadas. Observem que, pela subaditividade do módulo sobre a reta,

∀t ∈ I : |(f + g)(t)| = |f (t) + g(t)| ≤ |f (t)| + |g(t)|.

Sabemos ainda que |f (t)| ≤ sups∈I |f (s)| = ∥f ∥∞ e |g(t)| ≤ sups∈I |g(s)| = ∥g∥∞ , portanto
|f (t) + g(t)| ≤ ∥f ∥∞ + ∥g∥∞ para cada t ∈ I. Assim, ∥f ∥∞ + ∥g∥∞ é cota superior para os
valores de |f (t)| para t ∈ I. Como o supremo é a menor cota superior, deduzimos que:

∥f + g∥∞ ≤ ∥f ∥∞ + ∥g∥∞ ,

como queríamos demonstrar.

Observação 2.3 (Vetores são funções e vice-versa) Comparando os dois últimos exemplos,
vemos claramente como pode ser útil a analogia feita na Observação 2.2 entre vetores de Rd e
funções. As duas provas acima são essencialmente idênticas!

Normas ℓp : um argumento via convexidade


A estratégia de máximos nem sempre é fácil de se implementar, mas outros argumentos
podem funcionar. Vejamos um exemplo aqui.

exemplo:lp Exemplo 2.5 Fixe um expoente 1 ≤ p < +∞. A norma ℓp sobre Rd é definida por:

d
! p1
X
|x|p := |x[i]|p (x ∈ Rd ).
i=1

Há algumas razões pelas quais pode-se querer definir esta família geral de normas.
Uma delas é que normas codificam esparsidade aproximada. Isto é, um vetor de norma ℓp
pequena tem poucas coordenadas grandes e este efeito se acentua quando p é maior (veja
o exercício 2.13 abaixo).
Temos como missão provar que o Exemplo 2.5 de fato define uma norma. Para começar,
note que a candidata a norma é bem definida e que o caso p = 2 é precisamente o da
norma euclideana. A questão é se temos uma norma para um 1 ≤ p < +∞ arbitrário.
Para responder isso, precisamos checar que | · |p satisfaz os três axiomas de norma.
A prova de que | · |p é positiva-definida e homogênea positiva fica como um exercício
não muito difícil para o leitor. A subaditividade pode ser provada de duas maneiras.
No exercício 2.16 abaixo, mostramos que | · |p é um supremo de produtos internos, o que
nos permite usar a estratégia do caso p = 2. Aqui apresentamos uma outra estratégia de
prova, que se baseia na ideia de convexidade.

35
A função “x 7→ xp " é crescente. Além disso, ela é convexa, isto é:
∀λ ∈ [0, 1] ∀t, s ≥ 0 : (λ t + (1 − λ)s)p ≤ λ sp + (1 − λ) sp . (2.3) eq:convexid
(Isto é consequência do fato que a a função é contínua e sua derivada segunda é positiva
sobre o intervalo (0, +∞).)
Agora considere x, z ∈ Rd ; queremos provar que |x + z|p ≤ |x|p + |z|p . Se um dos dois
vetores se anula, esta desigualdade vale por inspeção. Portanto, suporemos a seguir que
tanto x quanto z não são nulos. Neste caso, podemos observar que, para cada coordenada
i,
|(x + z)[i]| |x[i] + z[i]| |x[i]| + |z[i]| |x[i]| |z[i]|
= ≤ =λ + (1 − λ) ,
|x|p + |z|p |x|p + |z|p |x|p + |z|p |x|p |z|p
onde
|x|p
λ := ∈ [0, 1].
|x|p + |z|p
Usando que “x 7→ xp " é crescente e convexa, deduzimos:
 p  p  p  p
|(x + z)[i]| |x[i]| |z[i]| |x[i]| |z[i]|
≤ λ + (1 − λ) ≤λ + (1 − λ) .
|x|p + |z|p |x|p |z|p |x|p |z|p
Isso vale para todo 1 ≤ i ≤ d. Somando sobre as coordenadas, obtemos:
d  p d  p d  p
X |(x + z)[i]| X |x[i]| X |z[i]|
≤λ + (1 − λ) .
i=1
|x|p + |z|p i=1
|x|p i=1
|z|p

Ou seja: p
|x|pp |z|pp

|x + z|p
≤λ + (1 − λ) = 1.
|x|p + |z|p |x|pp |z|pp
Como a função “t ≥ 0 7→ t1/p " também é crescente, deduzimos que
|x + z|p
≤ 1,
|x|p + |z|p
como queríamos demonstrar.

Exercício 2.5 (Condições de igualdade para a subaditividade) Quando p > 1, a convexi-


dade de “x ≥ 0 7→ xp " é estrita: a derivada segunda desta função é positiva para todo x > 0. Uma
consequência disso é que desigualdade (2.3) é estrita sempre que t ̸= s e 0 < λ < 1. Use este fato
para mostrar que:
x z
∀1 < p < +∞ ∀x, z ∈ Rd : |x + z|p = |x|p + |z|p ⇔ x = 0Rd , z = 0Rd ou = .
|x|p |z|p
Ou seja, a norma só é aditiva quando um dos vetores se anula ou os dois têm as mesmas direção e
sentido. Esta propriedade não vale para quando d > 1 e p = 1, já que (por exemplo) |e1 + e2 |1 =
|e1 |1 + |e2 |1 .

36
Normas baseadas em outras normas
O último exemplo que vemos de norma é fundamental para várias aplicações de Álgebra
Linear. Ela é uma norma “derivada" de outras “normas-base" e suas propriedades serão
deduzidas das normas base.
adeoperador Exemplo 2.6 (Norma de operador em Rℓ×d ) Recorde do seu curso de Álgebra Linear que há
uma relação direta entre matrizes A ∈ Rℓ×d e transformações lineares A : Rd → Rℓ (usamos A
duas vezes por abuso de notação). De fato, dado x ∈ Rd , Ax ∈ Rℓ é o vetor de coordenadas:
d
X
(Ax)[i] := A[i, j] x[j], 1 ≤ i ≤ ℓ.
j=1

A chamada norma de operador p2 → p1 sobre Rℓ×d é definida da seguinte forma. Fixe expoentes
p2 , p1 ∈ [1, +∞]. Definimos
|Av|p1
∥A∥p2 →p1 := sup .
v∈Rd \{0} |v|p2

Normas como esta são muito importantes em Álgebra Linear Numérica. Um problema
importante é saber como diversos problemas envolvendo a matriz A se portam quando
a matriz é ligeiramente perturbada. Na maioria dos casos, tanto a formulação quanto a
solução deste tipo de problema tem a ver com normas de matrizes. O Exercício 2.12 traz
um exemplo disso.
Como podemos provar que ∥A∥p2 →p1 é norma? Observe em primeiro lugar que, por
linearidade e homogeneidade positiva da norma,

|Av|p1 v
= A
|v|p2 |v|p2 p1
e v/|v|p2 tem norma 1. Portanto, podemos trocar o supremo na definição da norma de
operador por
∥A∥p2 →p1 = sup |Av|p1 . (2.4) eq:normaopc
v∈Rd : |v|p2 =1

Isso facilita um pouco a prova das propriedades de norma, que veremos a seguir.
Primeiramente, temos de mostrar que a norma é uma função bem-definida de Rℓ×d em
R. Como o supremo é sempre unicamente definido como elemento de R ∪ {+∞}, o que
nos resta fazer é mostrar que o supremo na definição da (candidata a) norma é finito. Para
isso, usaremos a segunda fórmula, apresentada em (2.4) e algumas estimativas bastante
“cruas", mas válidas.
Veja que, em primeiro lugar, se v ∈ Rd tem norma |v|p2 = 1, todas as suas coordenadas
estão limitadas por 1 em valor absoluto. Desta forma, quando calculamos Av, cada
coordenada do vetor satisfaz:
d d d
X X X
|(Av)[i]| = A[i, j]v[j] ≤ |A[i, j]| |v[j]| ≤ |A[i, j]| ≤ d M,


j=1 j=1 j=1

37
onde M := max1≤i≤ℓ,1≤j≤d |A[i, j]| < +∞ (note que utilizamos a subaditividade da função
módulo sobre R!). Portanto, quando |v|p2 = 1, as coordenadas de Av são uniformeme-
mente limitadas por dM , quantidade que não depende de v. Concluímos que:

∀v ∈ Rd : |v|p2 = 1 ⇒ |Av|pp11 ≤ d1+p1 M p1 < +∞,

ou seja, |Av|p1 é limitada sobre os vetores de norma 1. Isto quer dizer que o supremo em
(2.4) é finito, como queríamos demonstrar.
O próximo passo é mostrar que ∥ · ∥p2 →p1 é positiva-definida. Como a norma é um
supremo de números não-negativos, ela certamente é não-negativa. Claramente a matriz
0Rℓ×d tem norma zero. Por outro lado, se ∥A∥p2 →p1 = 0, isto quer dizer que, dado qualquer
v ∈ Rd , |Av|p1 ≤ 0. Como | · |p1 é positiva definida, isso quer dizer que Av = 0Rℓ para
qualquer v ∈ Rd . Em particular, se tomamos v = ei para cada um dos vetores da base
canônica (com 1 ≤ i ≤ ℓ), Aei é o vetor cujas coordenadas são A[i, j]; logo, estas são a
fortiori nulas. Concluímos: a hipótese de que ∥A∥p2 →p1 = 0 implica que A é a matriz nula.
A seguir, provamos que a norma é homogênea positiva. Para isso, usaremos o fato que
| · |p1 tem esta propriedade e que, dados A ∈ Rℓ×d e λ ∈ R,

∀v ∈ Rd : (λA)v = λ(Av).

De fato, isto é consequência da definição das operações envolvidas e nos permite concluir:

∀v ∈ Rd : |(λA)v|p1 = |λ(Av)|p1 = |λ| |Av|p1 .

Quando multiplicamos todos os elementos de um conjunto por |λ|, seu supremo é multi-
plicado pelo mesmo valor. Desta forma,

∥λA∥p2 →p1 = sup |(λA)v|p1


v∈Rd , |v|p2 =1

= sup |λ| |Av|p1


v∈Rd , |v|p2 =1

= |λ| sup |Av|p1


v∈Rd , |v|p2 =1

= |λ| ∥A∥p2 →p1 .

Por fim, provaremos que a norma sobre matrizes é subaditiva. Se tomamos A, B ∈ Rℓ×d
e v ∈ Rd , vemos que (A + B)v = Av + Bv por virtude das definições envolvidas. Portanto,
para qualquer vetor v ∈ Rd de norma 1,

|(A + B)v|p1 ≤ |Av|p1 + |Bv|p1 ≤ ∥A∥p2 →p1 + ∥B∥p2 →p1 .

Como a desigualdade vale para todo v de norma 1, o supremo do lado esquerdo é cotado
pelo lado direito, e obtemos:

∥A + B∥p2 →p1 ≤ ∥A∥p2 →p1 + ∥B∥p2 →p1 .

Esta é a propriedade de subaditividade que queríamos demonstrar.

38
2.3 Mais exercicios
Exercício 2.6 Dado I ⊂ R compacto, considere o conjunto de todas as funções polinomiais
de I a R. Prove que este é um subespaço vetorial de C(I, R).

x:limitadas Exercício 2.7 (Funções limitadas) Dado um conjunto qualquer I ̸= ∅, chame de B(I, R)
o conjunto de todas as funções limitadas de I a R. Prove que este conjunto tem uma
estrutura natural de espaço vetorial e que a expressão
∥f ∥∞ := sup |f (t)| (f ∈ B(I, R))
t∈I

define uma norma sobre B(I, R). Mostre ainda que, quando I ⊂ R é compacto, o espaço
C(I, R) definido acima é um subespaço de B(I, R).

Exercício 2.8 (Submultiplicatividade da norma ∥ · ∥∞ ) Seguindo com a notação do exer-


cício anterior, mostre que o produto f g de dois elementos B(I, R) é um outro elemento
de B(I, R) e que ∥f g∥∞ ≤ ∥f ∥∞ ∥g∥∞ . Observe que o mesmo resultado vale para C(I, R).

Exercício 2.9 (Submultiplicatividade da norma de operador) Considere matrizes A1 ∈


Rd1 ×d2 e A2 Rd2 ×d3 . Lembre-se que o produto de A1 e A2 é o elemento A1 A2 ∈ Rd1 ×d3 com
entradas
d2
X
(A1 A2 )[i, j] := A1 [i, k]A2 [k, j] (1 ≤ i ≤ d1 , 1 ≤ j ≤ d3 ).
k=1

Este produto é definido de modo que


∀v ∈ Rd1 : (A1 A2 ) v = A1 (A2 v).
Agora bote em cada Rdi uma norma ℓpi . Mostre que
∥A1 A2 ∥p1 →p3 ≤ ∥A1 ∥p2 →p3 ∥A2 ∥p1 →p2 .

:transposta Exercício 2.10 Dada uma matriz A ∈ Rℓ×d , sua transposta, denotada por AT , é a matriz em
Rd×ℓ cujas entradas são definidas da seguinte forma:
AT [i, j] := A[j, i] (1 ≤ i ≤ d, 1 ≤ j ≤ ℓ).

1. Prove que y.(Ax) = (AT y).x para quaisquer A ∈ Rℓ×d , x ∈ Rd e y ∈ Rℓ .


2. Mostre que ∥AT ∥2→2 = ∥A∥2→2 para qualquer A ∈ Rℓ×d .

Exercício 2.11 Como já observado, podemos associar de modo natural o espaço de matri-
zes Rℓ×d com o espaço euclideano Rℓ d . Isto nos permite definir uma norma correspondente
à norma | · |2 sobre Rℓ×d , que às vezes é chamada de norma de Frobenius:
v
u ℓ d
uX X
∥A∥F := t |A[i, j]|2 (A ∈ Rℓ×d ).
i=1 j=1

39
Outra norma natural é a versão da norma ℓ∞ em Rℓ×d : a magnitude da maior entrada.

∥A∥M := max |A[i, j]| (A ∈ Rℓ×d ).


1≤i≤ℓ
1≤j≤d

1. Mostre que ∥ · ∥M = ∥ · ∥1→∞ .

2. Prove que as duas normas acima “sanduícham" a norma de operador ∥ · ∥2→2 .

∀A ∈ Rℓ×d : ∥A∥M ≤ ∥A∥2→2 ≤ ∥A∥F .

matriznorma Exercício 2.12 Chamamos de Id×d a matriz idendidade d × d, que tem 1 na diagonal e
zeros em todas as outras entradas. Uma matriz A ∈ Rd×d é dita inversível se existe uma
outra matriz A−1 ∈ Rd×d tal que A A−1 = A−1 A = Id×d . Em cursos de Álgebra Linear,
aprendemos que a inversa existe e é única se e somente se o determinante de A não se
anula.
Fixos dois expoentes p1 , p2 ∈ [1, +∞], definimos:

σp−1 →p2 (A) := inf |Av|p2 /|v|p1 .


v∈Rd \{0Rd }

1. Mostre que, se A é inversível,

1
|A−1 |p2 →p1 = ; em particular, quando A é inversível, σp−1 →p2 (A) > 0.
σp−1 →p2 (A)

2. Também sabemos da Álgebra Linear que uma matriz quadrada é inversível se e


somente se o único vetor v com Av = 0Rd é o vetor v = 0Rd . Use este fato para provar
que uma A ∈ Rd×d é inversível se e somente se σp−1 →p2 (A) > 0.

3. Prove que qualquer matriz B ∈ Rd×d com |A − B|p1 →p2 < σp−1 →p2 (A) é inversível.

Observação: a quantidade
κ(A) := |A−1 |2→2 |A|2→2
é chamada de número de condicionamento da matriz A. Segue do primeiro item deste exercício
que ele é sempre ≥ 1. Quando o número de condicionamento é muito grande, isto significa que o
problema de se resolver um sistema “Ax = b" é instável: pequenas alterações em b ou na matriz A
podem levar a grandes mudanças na solução. Por outro lado, o terceiro item acima implica que o
número de condicionamento não muda muito sob pequenas perturbações de A. Mais informações
sobre o número de condicionamento estão disponíveis no artigo https://en.wikipedia.org/
wiki/Condition_number.

x:lppequeno Exercício 2.13 Definimos acima as normas ℓp para 1 ≤ p ≤ +∞. No entanto, a função que
leva x ∈ Rd em |x|p também está bem definida quando 0 < p < 1.

40
1. Prove que | · |p para 0 < p < 1 não é subaditiva e portanto não é norma (dica: isso tem
a ver com concavidade estrita da função “t ≥ 0 7→ tp ").
2. Prove que, para qualquer x ∈ Rd , |x|0 := limp→0+ |x|pp é o número de coordenadas
diferentes de 0 de x.
3. Prove ainda que, dados quaisquer x ∈ Rd , t > 0 e p > 0,
|x|pp
#{1 ≤ i ≤ d : |x[i]| ≥ t} ≤ p .
t
Deste modo ter “norma ℓp pequena” quer dizer que poucas coordenadas são grandes.

Exercício 2.14 Dados a ∈ Rd \{0} e ξ ∈ R, quando é verdade que o conjunto abaixo é um


subespaço de Rd ?
Ha,ξ := {x ∈ Rd : a · x = ξ}.

ex:lpcotas Exercício 2.15 Prove que, para qualquer x ∈ Rd e 1 ≤ p < +∞,

|x|∞ ≤ |x|p ≤ d1/p |x|∞ ≤ d1/p |x|2 .

Deduza que |x|∞ = limp→+∞ |x|p para todo x ∈ Rd .

ex:lp Exercício 2.16 Apresentamos aqui uma forma baseada em dualidade de provar que as normas ℓp
apresentadas no Exemplo 2.5 são de fato normas.
Definimos o expoente dual de p como q := p/(p − 1) quando 1 < p < +∞. Se p ∈ {1, +∞},
definimos q via um limite: portanto q = 1 se p = ∞ e q = ∞ se p = 1.
1. Nos próximos itens, mostraremos a relação de dualidade entre as normas ℓp e ℓq

Dualidade: ∀x ∈ Rd ∀p ∈ [1, +∞] : |x|p = sup{v · x : v ∈ Rd , |v|q = 1}.

Copiando nosso argumento para p = 2, explique porque esta relação implica que a norma ℓp
é de fato uma norma (ou seja, satisfaz os três axiomas da definição).
2. Prove dualidade diretamente para p ∈ {1, ∞}.
3. A partir daqui supomos p ∈ (1, +∞). Mostre que a desigualdade entre as médias aritmética
e geométrica implica que
|a|p |b|q
∀a, b ∈ R : ab ≤ + ,
p q
com igualdade se e somente se a, b têm o mesmo sinal e |a|p = |b|q .
4. Deduza do primeiro item que
x·y
∀x, y ∈ Rd \{0} : ≤1
|x|p |y|q
e obtenha a Desigualdade de Hölder x.y ≤ |x|p |y|q .

41
5. Cheque as condições de igualdade no item anterior para terminar a prova da dualidade.
Mostre ainda que, se x ̸= 0Rd , o supremo na fórmula de dualidade só é atingido por um único
vetor v.

Exercício 2.17 Retorne ao exercício 2.10 e use o resultado do exercício 2.16 para mostrar
que ∥AT ∥p1 →p2 = ∥A∥p2 →p1 para quaisquer 1 ≤ p1 , p2 ≤ +∞.

x:lpfuncoes Exercício 2.18 Considere o espaço C([a, b], R) com a < b reais. Dado 1 ≤ p < +∞, mostre
que a expressão:
Z b  p1
∥f ∥p := |f (t)|p dt (f ∈ C([a, b], R))
a

define uma norma sobre C([a, b], R), para qualquer 1 ≤ p < +∞ fixo. Prove ainda uma
versão da desigualdade de Hölder para estas normas:

∀f, g ∈ C([a, b], R) : ∥f g∥1 ≤ ∥f ∥p ∥g∥q

onde q é o expoente dual de p definido no Exercício 2.16. (Dica: este é mais um caso em que
a analogia contida na Observação 2.2 pode ser útil.)

Exercício 2.19 Neste exercício, apresentamos outras normas que “são subaditivas por motivos de
convexidade". Considere uma função Ψ : [0, +∞) → [0, +∞) com as seguintes propriedades:

• Ψ é crescente e convexa;

• Para todo x ∈ R+ , Ψ(x) ≥ 0, com igualdade se e somente se x = 0;

• limx→+∞ Ψ(x) = +∞ e limx→0 Ψ(x) = 0.


p
Por exemplo, as funções definidas por Ψ1 (x) := xp , Ψ2 (x) := ex − 1 (com p ≥ 1 nos dois casos) e
Ψ3 (x) = x (max{log x, 0} + 1) têm as propriedades acima.
Prove que, dado d ∈ N\{0}, a expressão:
( d   )
X |x[i]|
∥x∥Ψ := inf a>0 : Ψ ≤1 (x ∈ Rd )
i=1
a

define uma norma sobre Rd . Prove ainda que esta norma coincide com a norma ℓp usual no caso
em que Ψ1 (x) = xp .

iaisproduto Exercício 2.20 (Espaços vetoriais produto) Suponha que (Vi , ∥ · ∥Vi ), i = 1, 2, . . . , m, são
espaços vetoriais normados. Considere V := V1 × V2 × · · · × Vm e denote os elementos v ∈ V como
v = (v[i])m
i=1 , onde cada v[i] ∈ Vi .

42
1. Defina um elemento 0V ∈ V com 0V [i] = 0Vi para cada 1 ≤ i ≤ m. Defina ainda operações
de soma e multiplicação por escalar em V : dados v, v ′ ∈ V , λ ∈ R, λ v e v + v ′ são definidos
pelas receitas

(λ v)[i] = λ v[i] e (v + v ′ )[i] = v[i] + v ′ [i] para cada i ∈ {1, 2, . . . , m},

onde usamos as operações de produto por escalar e soma de cada espaço Vi . Mostre que V é
espaço vetorial com estas escolhas de operações e elemento neutro.

2. Fixe 1 ≤ p < +∞ e defina:

m
! p1
X
∥v∥V,p := ∥v[i]∥pVi (v ∈ V ).
i=1

Mostre que esta expressão define numa norma sobre V . Estenda a definição a p = +∞.

3. Suponha agora que cada Vi = Rdi com aPnorma ℓp . Explique porque (V, ∥ · ∥V,p ) é “essenci-
almente” Rd com a norma ℓp , onde d = mi=1 di .

43
44
Capítulo 3

Espaços métricos, convergência e


completude

No capítulo anterior vimos vários espaços vetoriais V com suas respectivas normas ∥ · ∥.
Isto nos permite medir tamanhos de vetores e distância entre pontos v e v ′ .
Medir distâncias é bom porque nos permite tomar limites e fazer Análise. No entanto,
é muito fácil encontrar espaços em que se deseja fazer Análise, mas que não possuem a
estrutura linear de um espaço vetorial: ou seja, espaços em que tomar somas, diferenças
ou produtos de elementos não faz sentido. Por exemplo, a esfera d-dimensional e o
conjunto de Cantor não têm nada de “linear”, ainda que estejam ambos contidos em
espaços vetoriais.
No fim das contas, será bastante conveniente tomarmos um ponto de vista mais geral,
baseado apenas na noção de distância. Por isso estudaremos a partir daqui o conceito
de espaço métrico. Esta é a estrutura mínima que nos permite estender a Análise a que
estamos acostumados, com ε e δ, limites e tudo o mais. Todo espaço vetorial normado
pode ser visto como espaço métrico, mas a recíproca não é verdadeira.
A classe de espaços métricos é a principal categoria de objetos que trataremos neste
curso. Ela é geral o suficiente para quase todos os nossos propósitos, mas ainda assim
é tratável. Neste capítulo veremos como ela é definida e como ela nos permite falar de
convergência em conjuntos muito gerais.

3.1 Espaços métricos


O que é, afinal, um espaço métrico? Eis a definição, devida a Fréchet.

Definição 3.1 Um espaço métrico é um conjunto X ̸= ∅ munido de uma função d : X × X →


[0, +∞), chamada de métrica sobre X, com as seguintes propriedades.

1. d é não-negativa e separa pontos distintos: para quaisquer a, b ∈ X, d(a, b) = 0 se e


somente se a = b;

45
2. d é simétrica: para qualquer par (a, b) ∈ X × X, d(a, b) = d(b, a);
3. d satisfaz a desigualdade triangular: para quaisquer a, b, c ∈ X, d(a, b) ≤ d(a, c) +
d(c, b).
Todas as propriedades de métrica acima têm uma interpretação intuitiva se pensamos
em d como uma noção de distância. A propriedade 1 diz que a distância de um lugar
a ele mesmo é nula, mas que qualquer outro lugar está a distância positiva. A segunda
propriedade afirma que ir de a a b não é mais fácil ou difícil que ir de b a a. A terceira
propriedade afirma que ir de a para c e depois para b não pode resultar em um caminho
mais curto que a rota direta de a para b. Apesar da clareza do que significam estas
condições, veremos abaixo que nem todo espaço métrico é fácil de se entender.
Veremos abaixo os principais exemplos de espaços métricos que serão recorrentes no
curso. Ocasionalmente usaremos a convenção de denotar por dX a métrica de X; isto será
útil quando tratarmos muitos espaços métricos de uma única vez.

3.1.1 A reta real como espaço métrico


Como primeiro exemplo, tomamos X = R com dR (a, b) := |a − b| ((a, b) ∈ R2 ). As duas
primeiras propriedades da definição de métrica são triviais. A terceira é consequência de
“|x + y| ≤ |x| + |y|"aplicada a x = a − c e y = c − b. Em todas estas notas tomaremos esta
métrica como a métrica padrão sobre R, a não ser quando o contrário for dito.

3.1.2 Os números complexos como espaço métrico



O conjunto C é usualmente definido como o conjunto dos números da forma z := a+b √−1,
onde a = ℜ(z) ∈ R é chamada de parte real de z, b = ℑ(z)
√ ∈ 2R é a parte imaginária, e −1
– a unidade imaginária – é um número satisfazendo ( −1) = −1. Livros especializados
em Análise Complexa têm definições mais formais deste corpo. O ponto de mencioná-los
aqui é que C é basicamente R2 com uma estrutura de produto. Observamos ainda que a
norma |z| é multiplicativa: |zw| = |z| |w|.

3.1.3 A métrica discreta


Uma métrica relativamente trivial e “boba"pode ser definida sobre qualquer conjunto
X ̸= ∅: a chamada métrica discreta.

1, x ̸= y;
ddisc (x, y) :=
0, x = y.
Esta métrica é interessante por alguns (poucos) motivos. No momento só um deles nos
interessa: qualquer resultado que provarmos para todos os espaços métricos deverá valer
para as métricas discretas! Ou seja: se você quer entender um teorema, ou simplesmente
testar se um enunciado pode ser verdadeiro para todos os espaços métricos, estudá-lo no
caso da métrica discreta é um bom primeiro passo.

46
3.1.4 Espaços vetoriais: normas nos dão métricas
A maneira canônica de se definir uma métrica sobre um espaço normado é através da
norma.

Proposição 3.1 Se (V, ∥ · ∥V ) é um espaço normado, então a expressão

dV (a, b) := ∥a − b∥V (a, b ∈ V )

define uma métrica sobre V .

Prova: Sejam a, b, c ∈ Rd quaisquer. Nosso objetivo é provar que


• ∥a − b∥V ≥ 0, com igualdade se e somente se a = b;

• ∥a − b∥V = ∥b − a∥V ;

• ∥a − c∥V ≤ ∥a − b∥V + ∥b − c∥V .


Vamos escrever isto de outra forma. Defina x := a − b, y := b − c. Os itens acima são
equivalentes a:
• ∥x∥V ≥ 0, com igualdade se e somente se x = 0 (que vale porque a norma é positiva
definida).

• ∥x∥V = ∥ − x∥V (que segue da homogeneidade positiva da norma);

• ∥x + y∥V ≤ ∥x∥V + ∥y∥V (que vem da sub-aditividade).


2
Portanto, as normas que pusemos em Rd , C(I, R), etc todas induzem métricas. Como
veremos na seção seguinte, elas também induzem métricas sobre subconjuntos destes
espaços que não são necessariamente espaços vetoriais. Por exemplo, a norma euclideana
em Rd induz uma métrica na esfera unitária:

Sd−1 := {x ∈ Rd : |x|2 = 1}.

3.1.5 Métricas induzidas


Se temos um espaço métrico (X, dX ), qualquer subconjunto Y ⊂ X, Y ̸= ∅ herda a métrica:

dY (y, y ′ ) := dX (y, y ′ ) ((y, y ′ ) ∈ Y 2 ).

Ou seja, dY = dX |Y ×Y é obtida restringindo a função dX : X × X → [0, +∞) ao conjunto


Y × Y . Chamamos esta métrica de induzida. Por exemplo, a esfera unitária Sd−1 ⊂ Rd e
o conjunto Qd ⊂ Rd dos vetores com coordenadas racionais têm métricas induzidas pelas
métricas naturais sobre os espaços ambientes.

47
3.2 Sequências, limites e completude
O leitor deve lembrar que uma sequência de elementos em X, escrita {xn }n∈N ⊂ X, é tão
somente uma maneira de escrever uma função f : N → X, de modo que xn = f (n) para
cada n ∈ N.
Tomamos como dado que o leitor já sabe o que é convergência de uma sequência em
R, mas lembramos a definição mesmo assim. Dados {xn }n∈N ⊂ R e x ∈ R, dizemos que
xn → x, ou limn∈N xn = x, ou ainda que xn converge a x, se

∀ε > 0 ∃n0 (ε) ∈ N ∀n ∈ N : n ≥ n0 (ε) ⇒ |xn − x| < ε.

A noção de convergência em um espaço métrico é derivada desta.

Definição 3.2 Fixo um espaço métrico (X, dX ), dizemos que uma sequência {xn }n∈N ⊂ X con-
verge a x ∈ X (segundo a métrica dX ) se a sequência {dX (xn , x)}n∈N ⊂ R converge a 0, no sentido
do parágrafo anterior. Dito de outro modo: xn → x se

∀ε > 0 ∃ n0 (ε) ∈ N ∀n ∈ N : n ≥ n0 (ε) ⇒ |dX (xn , x) − 0| = dX (xn , x) < ε.

Esta segunda forma de definir as coisas mostra que as duas noções de convergência
coincidem no caso de X = R com a métrica usual. Podemos mostrar facilmente que, como
no caso de números, trocar < ε por ≤ ε na segunda definição não muda nada. Além disso:

Proposição 3.2 (Unicidade do limite) Dados x, x′ ∈ X e uma sequência {xn }n∈N ⊂ X, se


xn → x e xn → x′ , então x = x′ .

Prova: Pelos axiomas de métrica, para provarmos que x = x′ , basta mostrarmos que
dX (x, x′ ) = 0. Pela desigualdade triangular, temos a seguinte desigualdade para cada
n ∈ N:
0 ≤ dX (x, x′ ) ≤ dX (x, xn ) + dX (xn , x′ ).
Por hipótese, dX (x, xn ) → 0 e dX (x′ , xn ) → 0 no sentido usual de R. Como “o limite da
soma é a soma dos limites", temos:

lim(dX (x, xn ) + dX (xn , x′ )) = lim dX (x, xn ) + lim dX (xn , x′ ) = 0.


n∈N n∈N n∈N

Portanto, a distância dX (x, x′ ) está “sanduichada" entre a sequência constante 0 e uma


outra sequência que vai a 0. Deduzimos que dX (x, x′ ) = 0, como queríamos demonstrar.
2
Um ponto importante é que, como veremos abaixo, a convergência ou não de uma
sequência depende da métrica escolhida. Ainda assim, na maior parte dos casos nós
falaremos de convergência deixando a métrica implícita (o que em geral não vai causar
confusão).

48
convnormado Exercício 3.1 Considere um espaço vetorial normado (V, ∥ · ∥V ) com a métrica induzida pela
norma. Se {vn }n∈N ⊂ V e v ∈ V são dados, mostre que

vn → v ⇔ vn − v → 0V .

Vamos agora definir o que é uma sequência de Cauchy em um espaço métrico e o que
é um espaço métrico completo.

Definição 3.3 Fixo um espaço métrico (X, dX ), dizemos que uma sequência {xn }n∈N ⊂ X é de
Cauchy se
lim dX (xn , xm ) = 0,
m,n→+∞

isto é,
∀ε > 0 ∃ n0 (ε) ∈ N ∀m, n ∈ N : m, n ≥ n0 (ε) ⇒ dX (xn , xm ) < ε.
(X, dX ) é dito completo se toda sequência de Cauchy {xn }n∈N ⊂ X converge a algum x ∈ X.

A mesma prova conhecida de R de que toda sequência convergente é Cauchy vale para
espaços métricos gerais. Observe, no entanto, que nem todo espaço métrico é de Cauchy.
Por exemplo, (R, dR ) é completo, mas Q com a métrica induzida não é completo. Veremos
a seguir vários exemplos naturais de espaços métricos que são completos e (com menos
destaque) alguns outros que não são. Antes, uma definição fundamental.

Definição 3.4 Um espaço vetorial normado (V, ∥ · ∥V ) que é completo com a distância induzida
pela norma ∥ · ∥V é dito espaço de Banach.

3.2.1 Subsequências
bsequencias
Em vários momentos do texto, seremos forçados a falar de subsequências, definidas abaixo.

Definição 3.5 Considere um subconjunto infinito N ⊂ N. Dada uma sequência {xn }n∈N num
espaço métrico (X, dX ), chamamos de subsequência {xn }n∈N (com índices em N ) a sequência
{yj }j∈N definida da seguinte maneira: se n1 < n2 < . . . é a única enumeração crescente dos
elementos de N , então yj := xnj para cada j ∈ N. Normalmente escreveremos xnj ao invés de yj .
Chamamos de limn∈N xn ou limj∈N xnj o limite de yj (caso exista).

Ainda não teremos muito motivo para olhar subsequências nesta altura do texto, mas
em breve isto ocorrerá. Em geral a motivação para se definir uma subsequência é a
seguinte.
• Precisamos achar um elemento x com certa propriedade “boa” num espaço métrico.
Muitas vezes, a melhor (ou única) forma de se fazer isso é definir uma “sequência
boa” {xn }n∈N e torcer para que ela convirja.

• O problema é que nem sempre a “sequência boa” converge. Por sorte, em muitos
casos basta que uma subsequência convirja para conseguirmos terminar a prova.

49
O melhor de tudo é que a convergência da subsequência pode ser quase automática.
Por exemplo, a Proposição 3.5 garante que qualquer sequência limitada em Rd tem uma
subsequência convergente.
Antes de seguirmos, vejamos algumas propriedades básicas de subsequências.
Exercício 3.2 Mostre que uma subsequência {xn }n∈N como a definida acima converge a x ∈ X se
e somente se:
∀ε > 0 ∃n0 (ε) ∈ N ∀n ∈ N : n ≥ n0 (ε) ⇒ dX (xn , x) ≤ ε.
É conveniente enunciarmos de uma vez duas proposições muito úteis. A primeira diz
que, ao passarmos para uma subsequência, não "estragamos"uma eventual convergência
da sequência original.
qnaoestraga Proposição 3.3 Considere uma sequência {xn }n∈N num espaço métrico (X, dX ). Se xn converge
a um limite x ∈ X, então qualquer subsequência converge ao mesmo x.
Prova: Tome {xn }n∈N e x ∈ X como acima. O fato que xn → x quer dizer que:
(⋆) ∀ε > 0 ∃n0 (ε) ∈ N ∀n ∈ N : n ≥ n0 (ε) ⇒ dX (xn , x) ≤ ε.
Agora considere N ⊂ N infinito. Queremos mostrar que limn∈N xn = x. Considerando xnj
como na definição de subsequência, precisamos provar que, dado um ε > 0,
queremos : ∃j0 (ε) ∈ N ∀j ∈ N : j ≥ j0 (ε) ⇒ dX (xnj , x) ≤ ε.
Mas isso é simples. Como N := {n1 < n2 < n3 < . . . } é conjunto infinito, podemos
escolher j0 (ε) com nj0 (ε) ≥ n0 (ε) (ver (⋆)). Deste modo, garantimos que nj ≥ n0 (ε) para
todo j ≥ j0 (ε), de modo a garantir dX (xnj , x) ≤ ε. 2
No próximo problema, veremos como podemos usar subsequências para garantir a
convergência de uma sequência inteira.
Proposição 3.4 Considere uma sequência de Cauchy {xn }n∈N num espaço métrico (X, dX ) que
tem uma subsequência convergente. Então {xn }n∈N também converge e seu limite é igual ao da
subsequência.
Prova: Sejam x ∈ X o limite da subsequência e N ⊂ N o seu conjunto (infinito) de índices.
Como {xn }n∈N é Cauchy, dado ε > 0, podemos encontrar n0 (ε) ∈ N tal que dX (xn , xm ) ≤ ε
para n, m ≥ n0 (ε). Ao mesmo tempo, como N é infinito, sabemos que existem infinitos
índices k ∈≥ n0 (ε) com k ∈ N . Tomando um destes índices, vemos que:
∀n ≥ n0 (ε) : dX (xn , x) ≤ dX (xn , xk ) + dX (xk , x) ≤ ε + dX (xk , x).
Se agora mandamos k → +∞ com k ∈ N , temos dX (xk , x) → 0 e portanto:
∀n ≥ n0 (ε) : dX (xn , x) ≤ ε.
Ou seja, o mesmo n0 (ε) que vem da "Cauchyaniedade" da sequência {xn }n se adequa à
definição de limite. 2

50
3.2.2 Convergência em Rd com as normas ℓp
sec:convlp
Recorde o Exercício 2.15 acima, onde apresentamos as normas ℓp , 1 ≤ p ≤ ∞, sobre Rd .
Observe que, para qualquer uma destas normas,

∀p ∈ [1, +∞), ∀x ∈ Rd : |x|∞ ≤ |x|p ≤ d1/p |x|∞ .

Usamos este fato a seguir para obter o seguinte resultado.

Teorema 3.1 Dada uma sequência arbitrária {xn }n∈N ⊂ Rd :

1. se x ∈ Rd , xn → x de acordo com uma das normas ℓp acima se e somente se xn [i] → x[i]


para cada uma das coordenadas i = 1, 2, . . . , d;

2. {xn }n∈N é Cauchy de acordo com uma das normas ℓp acima se e somente se cada uma das
sequências de coordenadas {xn [i]}n∈N ⊂ R, com i = 1, 2 . . . , d, é Cauchy.

Segue que (Rd , | · |p ) é Banach: toda sequência em Rd que é Cauchy de acordo com a norma ℓp
converge a um limite em Rd .

Prova: Começamos com o primeiro item. Tome uma sequência {xn }n∈N ⊂ Rd e um
x ∈ Rd . Lembre-se do Exercício 3.1 e veja que xn →ℓp x se e somente se xn − x →ℓp 0Rd .
Pela observação antes da prova relacionando as normas ℓp , deduzimos que:

xn →ℓp x ⇔ |x − xn |p → 0 ⇔ |x − xn |∞ → 0 ⇔ max |x[i] − xn [i]| = 0,


1≤i≤d

onde a última implicação é a definição da norma | · |∞ .


Agora observe que, para cada j ∈ {1, . . . , d}, {|x[j] − xn [j]|}n∈N é uma sequência de
números reais maiores ou iguais a 0. Portanto,

0 ≤ |x[j] − xn [j]| ≤ max |x[i] − xn [i]|.


1≤i≤d

Por um argumento de sanduíche, vemos que, se max1≤i≤d |x[i] − xn [i]| → 0, então |x[j] −
xn [j]| → 0, e portanto xn [j] → x[j], para cada j ∈ {1, . . . , d}. Por outro lado, se cada uma
das sequências {xn [j]}n∈N converge a x[j], temos que {|x[j] − xn [j]|}n∈N converge a 0 para
cada j e o máximo dessas sequências converge a 0 (um resultado de Análise na Reta!).
Concluímos:

max |x[i] − xn [i]| = 0 ⇔ ∀j ∈ {1, 2, . . . , d} : xn [j] → x[j].


1≤i≤d

Combinando isso com as implicações anteiores, cumprimos com o item 1.


Para o segundo item, seguimos raciocínio parecido por isso, vamos mais rápido. No-
vamente Vemos que:
n,m→+∞ n,m→+∞ n,m→+∞
|xn − xm |p −→ 0 ⇔ |xn − xm |∞ −→ 0 ⇔ max |xn [j] − xm [j]| −→ 0.
1≤j≤d

51
Do mesmo modo que acima, observamos que o máximo max1≤j≤d |xn [j] − xm [j]| converge
a 0 se e somente se |xn [j] − xm [j]| converge a 0 para cada coordenada j ∈ {1, 2, . . . , d}:
n,m→+∞ n,m→+∞
max |xn [j] − xm [j]| −→ 0 ⇔ ∀ 1 ≤ j ≤ d : |xn [j] − xm [j]| −→ 0.
1≤j≤d

Assim,
n,m→+∞ n,m→+∞
|xn − xm |p −→ 0 ⇔ ∀ 1 ≤ j ≤ d : |xn [j] − xm [j]| −→ 0,
o que é a tradução em símbolos matemáticos do item 2 do teorema.
Para terminar, provaremos que (Rd , | · |p ) é completo. Para isso, tomamos uma sequên-
cia de Cauchy {xn }n∈N ⊂ Rd arbitrária. Pelo item 2, cada sequência das coordenadas
{xn [i]}n∈N ⊂ R é Cauchy. Como R é completo, isto quer dizer que:
∀i ∈ {1, . . . , d} : ∃ lim xn [i].
n→+∞

Agora defina x ∈ Rd como o vetor de coordenadas x[i] := limn→+∞ xn [i] (1 ≤ i ≤ d). Com
esta definição, garantimos que as coordenadas de xn convergem para as coordenadas de
x e portanto xn →ℓp x. Desta forma, provamos que a sequência de Cauchy {xn }n∈N ⊂ Rd
(uma sequência de Cauchy arbitrária em Rd ) tem limite x ∈ Rd . 2
Fazemos uma pausa aqui para mostrar um fato importante, que será usado muitas
vezes no texto. Ele é um prelúdio para o assunto de compacidade, que será discutido mais
adiante no texto.
prop:HBRd Proposição 3.5 (Sequências limitadas em Rd têm subsequências convergentes) Suponha
que {xn }n∈N ⊂ Rd é uma sequência limitada, isto é, que supn∈N |xn |2 < +∞. Então existe uma
subsequência {xnj }j∈N convergente.
Prova: Vamos provar isso por indução na dimensão d ∈ N\{0}. O caso base é d = 1 é um
teorema conhecido de Análise na Reta.
Para o passo indutivo, suponha que o teorema é verdade para dimensão d − 1. Tome
agora {xn }n∈N ⊂ Rd limitada e chame de yn as projeções dos xn a Rd−1 .
yn ∈ Rd−1 é o vetor com yn [i] = xn [i] para i ∈ [d − 1] (n ∈ N).

Para cada n ∈ N, podemos usar o fato de que xn [d]2 ≥ 0 e · é função crescente para
observar que:
v v v
u d−1 u d−1 u d
uX uX uX
|yn |2 = t |yn [i]|2 = t |xn [i]|2 ≤ t |xn [i]|2 = |xn |2 .
i=1 i=1 i=1

Por esta razão, a sequência {yn }n∈N é limitada: supn∈N |yn |2 ≤ supn∈N |xn |2 < +∞. Por
hipótese de indução, podemos encontrar um subconjunto infinito Nd−1 ⊂ N tal que
limn∈Nd−1 yn = y ∈ Rd−1 . Como visto acima, isto quer dizer que
∀i ∈ [d − 1] : lim xn [i] = lim yn [i] = y[i].
n∈Nd−1 n∈Nd−1

52
Agora considere {xn [d]}n∈Nd−1 ⊂ R. Esta é uma sequência limitada de números reais, pois
afinal:
sup |xn [d]| ≤ sup |xn |2 < +∞.
n n

Por Análise na Reta, sabemos que existe um Nd ⊂ Nd−1 infinito tal que:

∃ lim xn [d] = z ∈ R.
n∈Nd

Pela Proposição 3.3, sabemos que essa passagem a uma subsequência não estraga a con-
vergência das outras coordenadas, que havia sido garantida antes. Isto é, agora sabemos
que:
∀i ∈ [d] : ∃ lim xn [i],
n∈Nd−1

o que, como visto acima, é a mesma coisa que dizer que {xn }n∈N converge. 2

3.2.3 Convergência sob a métrica discreta


Vamos deixar este caso como um exercício.

Exercício 3.3 Considere um espaço (X, dX ) com a métrica discreta. Dada {xn }n∈N ⊂ X, mostre
que xn → x ∈ X se e somente se existe um n0 ∈ N tal que xn = x para todo n ≥ n0 . Prove ainda
que {xn }n∈N é Cauchy se e somente se existe um n0 ∈ N tal que xn = xn0 para todo n ≥ n0 .

3.2.4 Convergência em C(I, R)


Aqui I = [a, b] ⊂ R é um intervalo, C(I, R) é o espaço de funções contínuas de I em R e a
norma usada é a norma ∞:
∥f ∥I,∞ := sup |f (t)|.
t∈I

Vamos primeiro tentar entender do que estamos falando aqui. Vamos considerar em
primeiro lugar o que quer dizer fn → f nesta métrica. Como ∥fn − f ∥I,∞ é um supremo,
e além disso este supremo é atingido, temos que

∥fn − f ∥I,∞ → 0 ⇔ ∀ε > 0 ∃n0 = n0 (ε) ∈ N ∀n ≥ n0 ∀t ∈ T : |fn (t) − f (t)| < ε.

Esta é a chamada convergência uniforme em t ∈ I, ou simplesmente uniforme. Esta


convergência implica a chamada convergência pontual, que ocorre quando fn (x) → f (x)
para cada x ∈ I. Isto equivale a pedir que:

∀ε > 0 ∀t ∈ I ∃n0 = n0 (ε, t) ∀n ≥ n0 : |fn (t) − f (t)| < ε.

Veja que a mudança dos quantificadores faz bastante diferença. Na convergência pontual,
o índice n0 a partir do qual a distância fica menor que ε pode depender tanto de ε quanto
do ponto t. Por outro lado, a convergência uniforme pede que seja achado, para cada

53
ε > 0, um n0 tal que |fn (t) − f (t)| < ε para todo e qualquer qualquer t ∈ I, sempre que
n ≥ n0 . Ou seja, a escolha de n0 deve ser uniforme em t.
Os exemplos abaixo nos mostram duas coisas. A primeira é que o limite pontual de
funções contínuas pode não ser uma função contínua.

Exemplo 3.1 Considere I = [0, 1] e fn (x) = xn , x ∈ I. O limite pontual das fn é f com f (1) = 1
e f (x) = 0 para 0 ≤ x < 1.

No próximo exemplo, veremos que a convergência pontual a um limite contínuo não


implica convergência uniforme.

xemplo:bola Exemplo 3.2 Considere C([0, 1], R) com a norma do sup. Existe uma sequência {fn }n∈N ⊂
C([0, 1], R) de funções com ∥fn ∥[0,1],∞ = 1, mas fn (x) → 0 para todo x ∈ [0, 1].

A sequência {fn }n∈N para n > 0 é feita de "tendas". A fn é uma "tenda"de altura
1 plantada no intervalo (1/(n + 1), 1/n). Mais precisamente, fn será igual a 0 fora do
intervalo (1/(n + 1), 1/n) e será um "V invertido"dentro do intervalo.
Apresentamos agora a fórmula. Considere a função contínua Ψ : R → R dada por:


 0, t ≤ 0;
2t, 0 ≤ t ≤ 21 ;

Ψ(t) := (t ∈ R).
1 − 2 t − 12 , 12 ≤ t ≤ 1;



0, t ≥ 1.

É um exercício provar que Ψ é de fato contínua, que 0 ≤ Ψ ≤ 1 e que Ψ(1/2) = 1. Agora


defina f0 ≡ 0 e, para n > 0:
  
1 1
fn (t) := Ψ t− (t ∈ [0, 1]),
an n+1

onde
1 1 1
an := − =
n n+1 n(n + 1)
é o comprimento do intervalo (1/(n + 1), 1/n).

Exercício 3.4 Prove que cada fn com n > 0 vale 0 fora do intervalo (1/(n + 1), 1/n) e vale 1 no
ponto médio deste intervalo. Deduza disso as propriedades enunciadas acima.

Por outro lado, nosso principal teorema nesta seção pode ser resumido dizendo-se que
o limite uniforme de funções contínuas é uma função contínua.

ompletoreta Teorema 3.2 C(I, R) é completo com a métrica induzida pela norma ∥ · ∥I,∞ . Ou seja, uma
sequência de funções contínuas sobre I = [a, b] que converge uniformemente tem como limite uma
função contínua.

54
Prova: Tomemos {fn }n∈N ⊂ C(I, R) que é de Cauchy, ou seja, tal que ∥fn − fm ∥I,∞ → 0
quando n, m → +∞. Desejamos mostrar que existe uma função f ∈ C(I, R) tal que
∥fn − f ∥I,∞ → 0. Antes de entrar na prova, fazemos alguns comentários que serão úteis
para entender o que veremos a seguir.

Ideias gerais da prova

A dificuldade desta prova é que não sabemos de antemão como encontrar uma f
candidata a limite uniforme da sequência. Se tivéssemos essa f , só teríamos que checar
que esta f é mesmo o limite. Como não temos, vamos primeiro construir a função f e
depois provar que ela é o limite que buscamos. Para isso, uma etapa fundamental será
mostrar que as {fn }n∈N convergem pontualmente a uma certa função f (passo 1). Para isso,
mostraremos que, dado qualquer ∀t ∈ I, {fn (t)}n∈N é uma sequência de Cauchy em R.
Como convergência uniforme implica convergência pontual, sabemos que, se as fn
convergem, o limite tem mesmo de ser f . Por isso, a etapa seguinte da prova será mostrar
que fn e f estão uniformemente próximas para f grande (passo 2). A dificuldade aqui é que
temos um "limite duplo" que tem de ser tomado com cuidado. Como último passo,
mostraremos que f ∈ C(I, R), ou seja, o limite uniforme de funções contínuas é função contínua
(passo 3). Assim concluiremos a prova.

Passo 1: existe uma f : I → R tal que fn (x) → f (x) para cada x ∈ I.

Este é o passo da prova em que mostramos que as as fn convergem pontualmente a uma


certa f , que será a nossa candidata a limite uniforme da sequência fn .
Para provar a convergência pontual, usaremos o fato de que R é completo, ou seja,
sequências de Cauchy em R convergem. Por conta disto, temos
(n,m→+∞)
∀x ∈ I : |fn (x) − fm (x)| ≤ sup |fn (t) − fm (t)| = ∥fn − fm ∥I,∞ → 0. (3.1) eq:cotaunif
t∈I

Ou seja,
∀x ∈ I : |fn (x) − fm (x)| → 0 quando n, m → +∞,
o que quer dizer que {fn (x)}n ⊂ R é Cauchy, como queríamos demonstrar. Isto quer dizer
que ∃f (x) := limn fn (x) para cada x ∈ I, o que define uma função f : I → R.

Passo 2: Proximidade entre fn e f .

O raciocínio por detrás de (3.1) nos diz que, para todo x ∈ I

|fn (x) − f (x)| = lim |fn (x) − fm (x)|


m→+∞
≤ lim sup ∥fn − fm ∥I,∞
m
≤ sup ∥fn − fm ∥I,∞ .
m≥n

55
Observe que o lado direito desta cadeia de desigualdades não depende de x e é uma cota
superior para todo x. Tomando o supremo, descobrimos que
∥fn − f ∥I,∞ = sup |fn (x) − f (x)| ≤ sup ∥fn − fm ∥I,∞ .
x∈I m≥n

Recordamos mais uma vez que {fn }n∈N ⊂ C(I, R) é Cauchy. Isto quer dizer que, dado
ε > 0, podemos encontrar n0 (ε) tal que, se n, m ≥ n0 (ε), então ∥fn − fm ∥I,∞ < ε. Tomando
o sup em m, vemos que
∃n0 (ε) ∈ N, ∀n ≥ n0 (ε) : 0 ≤ ∥fn − f ∥I,∞ = sup |fn (x) − f (x)| ≤ ε.
x∈I

Como isto vale para todo ε, deduzimos que ∥fn − f ∥I,∞ → 0, como queríamos demonstrar.
Passo 3: f é contínua e o fim da prova.
Falta apenas um detalhe, que é provar que f ∈ C(I, R), ou seja, que f é contínua (ou:
o limite uniforme de funções contínuas é uma função contínua). Isto vale se e somente se
para toda sequência convergente {xj }j∈N ⊂ I e todo x ∈ I, xj → x ⇒ f (xj ) → f (x). Para
fazer isto, basta provar que:
(Basta provar) ∀ε > 0 : lim sup |f (xj ) − f (x)| ≤ 0.
j

Para prova esta última desigualdade, observe que, pela desigualdade triangular:
|f (xj ) − f (x)| = |f (xj ) − fn (xj ) + fn (xj ) − fn (x) + fn (x) − f (x)|
≤ |f (xj ) − fn (xj )| + |fn (xj ) − fn (x)| + |fn (x) − f (x)|
O primeiro e o terceiro termo nesta última expressão são da forma |f (t) − fn (t)| com t ∈ I,
sendo, portanto cotados pelo supremo de |f (t) − fn (t)| sobre t ∈ I, que por sua vez é
exatamente ∥f − fn ∥I,∞ . Ou seja,
|f (xj ) − f (x)| ≤ |fn (xj ) − fn (x)| + 2 ∥fn − f ∥I,∞ .
Esta desigualdade vale para cada j e n. Em particular, podemos tomar j → +∞: a
continuidade de fn nos garante que |fn (xj ) − fn (x)| → 0 e portanto,
∀n ∈ N : lim sup |f (xj ) − f (x)| ≤ 2∥fn − f ∥I,∞ .
j∈N

Por fim, mandando n → +∞, vemos que ∥fn − f ∥I,∞ → 0 enquanto o lado esquerdo não
muda. Deduzimos:
lim sup |f (xj ) − f (x)| ≤ 0,
j∈N

o que significa |f (xj ) − f (x)| → 0, como queríamos demonstrar.


Feito isso, apenas verificamos que temos todos os ingredientes em nossas mãos. Par-
tindo de {fn }n∈N ⊂ C(I, R) Cauchy, construímos uma f ∈ C(I, R) tal que fn → f segundo
a norma que escolhemos para C(I, R). 2

56
3.3 Equivalência de métricas e normas
quivalencia
Na seção anterior nós vimos como descrever a convergência em alguns espaços onde isso
não é completamente óbvio à primeira vista. Um ponto importante de se enfatizar é que
em vários casos mostramos que definições diferentes de métrica ou norma conduziram a
uma única noção de convergência. Isto é um ponto importante, que merece uma definição.
Definição 3.6 Considere um conjunto X ̸= ∅ e duas métricas d1 , d2 definidas sobre ele. Dizemos
que as duas métricas são equivalentes se
∀{xn }n∈N ⊂ X, ∀x ∈ X : d1 (xn , x) → 0 ⇔ d2 (xn , x) → 0.
Quando X é um espaço vetorial e as duas distâncias são induzidas por normas ∥ · ∥1 , ∥ · ∥2 , dizemos
que as duas normas são equivalentes quando as métricas induzidas são equivalentes de acordo com
a definição acima.
Por exemplo, a Seção 3.2.2 mostra que as métricas induzidas pelas normas ℓp sobre Rd
são todas equivalentes. Agora apresentamos um caso de não-equivalência de normas (e
métricas).
Exemplo 3.3 Vamos mostrar que duas normas que vimos acima sobre C([0, 1], R) não são equi-
valentes. A primeira é a nossa “norma preferencial":
∥f ∥∞ := sup |f (t)|
t∈[0,1]

e a segunda também é natural (e foi definida no Exercício 2.18):


Z 1
∥f ∥1 := |f (t)| dt.
0

Como |f (t)| ≤ ∥f ∥∞ para cada t ∈ [0, 1], vemos facilmente que ∥f ∥1 ≤ ∥f ∥∞ para toda
f ∈ C([0, 1], R). Disto podemos facilmente deduzir que
∥fn − f ∥∞ → 0 ⇒ ∥fn − f ∥1 → 0.
A recíproca, no entanto, não é verdadeira. Considere por exemplo a sequência de funções
{fn }n∈N definidas da seguinte forma:
t ≤ 1 − n1

0,
fn (t) :=
nt − n + 1, 1 − n1 < t ≤ 1.
O leitor pode checar que fn ∈ C([0, 1], R) é não negativa e que
Z 1
1
∥fn ∥1 = fn (t) dt = .
0 2n
Portanto ∥fn − 0∥1 → 0. No entanto, para todo n
∥fn ∥∞ = fn (1) = 1 ̸→ 0,
o que nos diz que fn ̸→ 0 de acordo com a norma ∥ · ∥∞ .

57
Exercício 3.5 Estenda as considerações acima às demais normas ∥ · ∥p (com 1 ≤ p < +∞)
apresentadas no Exercício 2.18.

Em resumo, as normas ∥·∥1 e ∥·∥∞ sobre C não são equivalentes porque há vetores com
norma ∥ · ∥∞ “grande" (igual a 1) e norma ∥ · ∥1 “arbitrariamente pequena" (próxima de 0).
O teorema a seguir e a sua prova mostram que isto é geral: duas normas são equivalentes
se a razão delas (quando definida) nunca está nem muito perto de zero, nem de infinito.

quivalentes Teorema 3.3 Duas normas ∥ · ∥1 e ∥ · ∥2 sobre o mesmo espaço vetorial V são equivalentes se e
somente se existem constantes C, c > 0 tais que

∀v ∈ V : c ∥v∥1 ≤ ∥v∥2 ≤ C ∥v∥1 .

Prova: Deixamos como exercício provar que, se tais constantes existem, as métricas são
equivalentes. Vejamos agora que, se as normas são equivalentes, então existem constantes
C, c > 0 com as propriedades desejadas. Recorde que a equivalência das normas é a
mesma coisa que a equivalência das métricas induzidas pelas normas. Portanto, nossa
hipótese é que

Hip: ∀{vn }n∈N ⊂ V ∀v ∈ V : ∥vn − v∥1 → 0 ⇔ ∥vn − v∥2 → 0.

Em particular, vale o que escrevemos acima quando v = 0.

Hip’: ∀{vn }n∈N ⊂ V : ∥vn ∥1 → 0 ⇔ ∥vn ∥2 → 0.

Agora suporemos para chegar a uma contradição que não existe a constante C apontada
acima. Ou seja
(?) ∀C > 0 ∃vC ∈ V : ∥vC ∥2 > C ∥vC ∥1 .

Em particular, podemos encontrar um vetor vn ∈ V com ∥vn ∥2 > (n + 1) ∥vn ∥1 , para cada
n ∈ N. Note que tal vetor não pode ser 0 porque neste caso teríamos ∥vn ∥2 = (n + 1) ∥vn ∥1 .
Portanto, podemos (se necessário) substituir cada vetor vn por vn /(n + 1)∥vn ∥1 e deduzir
que

1
(?) ⇒ ∃{vn }n∈N ⊂ V ∀n ∈ N : ∥vn ∥1 = e ∥vn ∥2 > (n + 1) ∥vn ∥1 = 1.
n+1

No entanto, isto contradiz Hip’: afinal, ∥vn ∥1 → 0 e ∥vn ∥2 ̸→ 0. Isto quer dizer que (?)
nos levou a uma contradição, o que implica que existe, sim, a constante C que queríamos
encontrar. Uma prova semelhante mostra que a c > 0 desejada também existe. 2

58
3.4 Mais exercícios
ntelimitada Exercício 3.6 Seja (X, dX ) um espaço métrico. Considere:

d′X (x, x′ ) := min{dX (x, x′ ), 1}.

Prove que esta é outra métrica sobre X e que ela é equivalente à métrica original.

Exercício 3.7 Defina


t
ϕ(t) := (t ∈ R).
1 + |t|
1. Prove que ϕ é uma bijeção estritamente crescente e contínua entre R e (−1, 1). Obs:
por um resultado de Análise na Reta, que você pode usar abaixo, o item 1 implica que
ϕ−1 : (−1, 1) → R também é uma bijeção estritamente crescente e contínua.

2. Defina:
d(t, s) := |ϕ(t) − ϕ(s)| ((t, s) ∈ R2 ).
Mostre que d é uma métrica sobre R e que esta métrica é equivalente à usual.

3. Prove que a sequência {n}n∈N é Cauchy segundo d, mas não converge. Portanto,
(R, d) não é completo (isso mostra que duas métricas podem ser equivalentes e
ainda assim “discordar" no que diz respeito a completude).

ex:grafos Exercício 3.8 (Métricas em grafos) Um grafo é um par G = (V, ∼) onde V ̸= ∅ é um


conjunto de elementos chamados vértices e “∼" é uma relação simétrica sobre pares de
elementos de V : dados x, y ∈ V , x ∼ y se e somente se y ∼ x (pares xy com x ∼ y são
chamados de arestas do grafo).
Dado um grafo G como acima, definimos novas relações “↔k " entre vértices para cada
k ∈ N, da seguinte forma:

• Para k = 0, y ↔0 x se e somente se y = x;

• Dado k > 0, y ↔k x se existe um vértice z ∈ V com y ∼ z e z ↔k−1 x.

Suponha agora que G é conexo: isto é, dados x, y ∈ V , existe um k ∈ N com x ↔k y. Prove


que a expressão abaixo define uma métrica sobre V :

dG (x, y) := min{k ∈ N : x ↔k y} (x, y, ∈ V ).

Exercício 3.9 Considere Ψ : [0, +∞) → [0, +∞). Seja (X, dX ) um espaço métrico e defina

dX,ψ (x, x′ ) := Ψ(dX (x, x′ )).

Dê condições suficientes sobre Ψ para que dX,ψ seja uma nova métrica sobre X, para qualquer
(X, dX ).

59
Exercício 3.10 (Equivalência das normas em espaços vetoriais produto) Retorne ao exer-
cício 2.20 e mostre que as normas ∥ · ∥V,p (para cada 1 ≤ p ≤ +∞) são todas equivalentes. Prove
ainda que vn → v numa destas normas se e somente se vn [i] → v[i] para cada i ∈ {1, . . . , m}.

ex:produto Exercício 3.11 (Métricas produto) Suponha que (Xi , dXi ), i = 1, . . . , d, são espaços métricos.
Escreveremos os elementos de
X := X1 × X2 × · · · × Xd
como x = (x[1], . . . , x[d]), com cada coordenada x[i] ∈ Xi . Mostre que, para qualquer p ∈ [1, +∞),
a expressão v
u d
uX
p
p d (x, y) := t d (x[i], y[i])p (x, y ∈ X)
Xi
i=1

define uma métrica sobre X. Mostre ainda que

d∞ (x, y) := max dXi (x[i], y[i]) (x, y ∈ X)


1≤i≤k

também define uma métrica sobre X. Prove ainda que uma sequência {xn }n∈N ⊂ X converge a um
x ∈ X e acordo com a métrica dp (com 1 ≤ p ≤ +∞) se e somente se {xn [i]}n∈N ⊂ Xi converge
x[i] ∈ X para cada coordenada 1 ≤ i ≤ d. Prove um resultado semelhante para a propriedade de
Cauchy e deduza que (X, dp ) é completo se e somente se cada espaço (Xi , dXi ) é completo. Mostre
ainda que as métricas definidas acima são todas equivalentes umas às outras.

Exercício 3.12 Considere um espaço vetorial V . Já vimos que uma norma sobre V induz natu-
ralmente uma métrica sobre V . No entanto, nem toda métrica sobre V vem de uma norma. Dê
condições necessárias e suficientes que uma métrica dV deve satisfazer para que exista uma norma
∥ · ∥V tal que
∀v, w ∈ V : ∥v − w∥V = dV (v, w).

Exercício 3.13 Mostre que a métrica discreta e a métrica induzida por R são equivalentes sobre N
ou Z, mas não sobre Q.

Exercício 3.14 Suponha que (V, ∥ · ∥V ) é um espaço vetorial completo e ∥ · ∥′V é uma outra norma
sobre V . Se as duas normas são equivalentes, é necessariamente verdade que (V, ∥ · ∥′V ) é completo?

Exercício 3.15 Considere uma família enumerável de espaços métricos (Xi , di ), i ∈ N\{0}. Cha-
mamos de X o produto cartesiano infinito

X := X1 × X2 × X3 × X4 × . . .

e denotamos os elementos x ∈ X com x = (x[i])+∞


i=1 , com cada x[i] ∈ Xi . Mostre que a expressão

+∞
X
dX (x, y) := 2−i min{di (x[i], y[i]), 1} (x, y ∈ X)
i=1

60
define uma métrica sobre X e que

∀{xn }n∈N ⊂ X, ∀x ∈ X : dX (xn , x) → 0 ⇔ ∀i ∈ N\{0}, di (xn [i], x[i]) → 0.

Prove ainda que (X, dX ) é completo se e somente se cada (Xi , di ) é completo.

Exercício 3.16 Dado um espaço métrico (X, dX ), dizemos que D ⊂ X é denso em X se e somente
se todo elemento de X é o limite de alguma sequência de elementos de D. Dizemos que (X, dX ) é
separável se X tem um subconjunto denso e enumerável. Prove que Rd e C([0, 1], R) são separáveis
com suas métricas usuais.

Exercício 3.17 Defina ℓ∞ (N) como sendo o conjunto de todas as sequências limitadas {an }n∈N ⊂
R. Defina uma função sobre este espaço da seguinte forma:

∥{an }n∈N ∥∞ := sup |an | ({an }n∈N ∈ ℓ∞ (N)).


n∈N

Prove que podemos dar a ℓ∞ (N) uma estrutura de espaço vetorial segundo a qual (ℓ∞ (N), ∥ · ∥∞ )
é um espaço vetorial normado completo. Este espaço é separável?

Exercício 3.18 (Um teorema de Fréchet) A tese de doutorado de Maurice Fréchet introduziu os
conceitos gerais de espaço métrico e compacidade. Ele também demonstrou o seguinte resultado.

Teorema: todo espaço métrico (X, dX ) separável e de diâmetro finito pode ser
“posto dentro de ℓ∞ (N)" no seguinte sentido: se ∥ · ∥∞ é a norma do problema
anterior, então:

(⋆) ∃ϕ : X → ℓ∞ (N) ∀x, x′ ∈ X : ∥ϕ(x) − ϕ(x′ )∥∞ = dX (x, x′ ).

Ou seja, há uma bijeção que preserva distâncias entre X (com a métrica dX ) e um subconjunto
S = ϕ(X) ⊂ ℓ∞ (N) (com a métrica induzida por ℓ∞ (N)). Note que o diâmetro de (X, dX ) é
definido por diam(X, dX ) := supx,x′ ∈X dX (x, x′ ).
Para definir esta função ϕ, seja {xn }n∈N uma enumeração de um subconjunto denso de X. Dado
x ∈ X, definimos:

ϕ(x) := {an (x)}n∈N , onde an (x) := dX (x, xn ) (n ∈ N)

Ou seja, ϕ(x) “lista" a distância de x a cada um dos pontos da sequência {xn }n∈N . Prove que esta
função satisfaz (⋆).

61
62
Capítulo 4

Funções e continuidade

O capítulo anterior nos ensinou o que é convergência em espaços métricos. Isto nos
permite definir continuidade de maneira fácil.

Definição 4.1 Considere dois espaços métricos (X, dX ) e (Y, dY ) e D ⊂ X Dizemos que f : D →
Y é contínua em x ∈ D se

∀{xn }n∈N ⊂ D : xn → x ∈ D ⇒ f (xn ) → f (x).

Dito de outro modo, queremos que:

∀{xn }n∈N ⊂ D, ∀x ∈ D : dX (xn , x) → 0 ⇒ dY (f (xn ), f (x)) → 0.

Dizemos que f é (simplesmente) contínua se ela é contínua em todos os pontos do domínio D.

Esta definição é das mais importantes do curso e vamos gastar bastante tempo analisando-
a e testando-a em exemplos. Uma primeira observação (praticamente trivial) está contida
no exercício a seguir.

Exercício 4.1 Formalize e prove a seguinte afirmação: a composição de funções contínuas é uma
função contínua.

Outra observação às vezes útil é que:

Exercício 4.2 A noção de continuidade não é modificada se as métricas do domínio e do contrado-


mínio são trocadas por outras métricas equivalentes.

Veremos a seguir alguns exemplos de funções contínuas.

63
4.1 Funções contínuas de X em R
Aqui o melhor é proceder a partir de exemplos.
Em primeiro lugar, conhecemos as funções contínuas f : D → R com D ⊂ R. Tome
agora uma nova função:

fi : x ∈ Di := {z ∈ Rd : z[i] ∈ D} 7→ f (x[i]) ∈ R.

Por exemplo, se f (t) = log t, com domínio D = R+ , fi (x) := log x[i], com domínio Di :=
{z ∈ Rd : z[i] ∈ R+ }. Dizemos que este tipo de função só depende da i-ésima coordenada.
Afirmamos que esta função é contínua sempre que a f original é contínua. Para isto,
precisamos provar que, se {xn }n∈N ⊂ Di é uma sequência arbitrária com xn → x ∈ Di ,
então fi (xn ) → fi (x). Para demonstrar isso, recorde que nosso critério de convergência
para sequências em Rd nos diz que xn [i] → x[i] em R. Além disso, a definição de Di garante
que {xn [i]}n∈N ⊂ D, x ∈ D. Concluímos que f (xn [i]) → f (x[i]) porque f é contínua sobre
D. Ou seja, fi (xn ) → fi (x), como queríamos demonstrar.
Vejamos agora alguns exemplos mais interessantes.

Exercício 4.3 Sabemos que o limite de um produto ou soma de sequências convergentes é o produto
(ou soma) dos limites. Deduza disto que, se D ⊂ X e f, g : D → R são contínuas, o mesmo vale
para λ f + g e f g (com λ ∈ R fixo). Com a hipótese adicional de que g não se anula, prove que f /g
também é contínua.

Exercício 4.4 Chame uma função f : Rd → R de polinômio multivariado se existem um k ∈ N e


coeficientes reais α(p1 ,...pd ) com (p1 , . . . , pd ) ∈ [k]d com
X
f (x) = α(p1 ,...pd ) (x[1])p1 (x[2])p2 . . . (x[d])pd (x ∈ Rd ).
(p1 ,...,pd )∈[k]d

Prove que todo polinômio multivariado é função contínua.

Exercício 4.5 Mostre que as normas | · |p , 1 ≤ p ≤ +∞, são funções contínuas de Rd em R.

4.2 Funções Lipschitz e distâncias


Continuando na linha anterior, vamos definir e analisar a continuidade de algumas fun-
ções baseadas em distâncias. Para isso vai ser útil introduzir o conceito de função Lipschitz.

Definição 4.2 Considere dois espaços métricos (X, dX ) e (Y, dY ) e D ⊂ X Dada uma constante
L > 0, dizemos que f : D → Y é L-Lipschitz se

∀x, x′ ∈ D : dY (f (x), f (x′ )) ≤ L dX (x, x′ ).

64
Já é sabido de Análise na Reta que funções L-Lipschitz são contínuas. Verifiquemos isto
para espaços métricos arbitrários. Suponha f : D → Y é L-Lipschitz, {xn }n∈N ∪ {x} ⊂ D
e xn → x, isto é, dX (xn , x) → 0. Veja que

0 ≤ dY (f (xn ), f (x)) ≤ L dX (xn , x) → 0,

logo dY (f (xn ), f (x)) está entre duas sequências que vão a 0. Deduzimos que dY (f (xn ), f (x)) →
0, ou seja f (xn ) → f (x). Como isto vale para todos {xn }n∈N ∪{x} e f como acima, podemos
deduzir que funções Lipschitz são sempre contínuas.

s:Lipschitz Observação 4.1 Uma notação útil para a constante de Lipschitz de uma f : D → Y é a seguinte:

dY (f (x), f (x′ ))
∥f ∥Lip := sup .
x,x′ ∈D, x̸=x′ dX (x, x′ )

Este é um supremo de números não-negativos e, portanto, pertence a R ∪ {+∞}. Como veremos


num dos exercícios, f é L-Lipschitz para algum L > 0 se e somente se ∥f ∥Lip < +∞. Além disso,
quando ∥f ∥Lip < +∞, então ∥f ∥Lip < +∞ é a menor constante de Lipschitz possível para f .

Nos próximos exemplos, observamos que algumas funções f : X → R derivadas da


distância dX são 1-Lipschitz.

Exemplo 4.1 Fixo x0 ∈ X, a função x ∈ X 7→ dX (x, x0 ) ∈ R é 1-Lipschitz. De fato, para


quaisquer x, x′ ∈ X, a desigualdade triangular nos diz que

dX (x, x0 ) ≤ dX (x′ , x0 ) + dX (x, x′ )

e
dX (x′ , x0 ) ≤ dX (x, x0 ) + dX (x, x′ ),
portanto
dR (dX (x, x0 ), dX (x′ , x0 )) = |dX (x, x0 ) − dX (x′ , x0 )| ≤ dX (x, x′ ).

Exemplo 4.2 Fixe agora um conjunto S ⊂ X, a função

x ∈ X 7→ dX (x, S) := inf dX (x, s) ∈ R


s∈S

é bem definida, no sentido que os valores dX (x, s) são todos cotados inferiormente por 0 (afinal, a
métrica é positiva definida). Veja que, do mesmo jeito que provamos acima,

dX (x, S) = inf dX (x, s) ≤ inf (dX (x′ , s) + dX (x, x′ )) = dX (x′ , S) + dX (x, x′ ).


s∈S s∈S

Repetindo a conta trocando os papeis de x e x′ e reusando as ideias da prova anterior, deduzimos


que
dR (dX (x, S), dX (x′ , S)) = |dX (x, x0 ) − dX (x′ , x0 )| ≤ dX (x, x′ ).

65
naocompleto Exemplo 4.3 Como um último exemplo, tomamos uma sequência de Cauchy {xn }n∈N ⊂ X.
Afirmamos que a expressão
f (x) := lim dX (x, xn ) (x ∈ X)
n

define uma função 1-Lipschitz f : X → R.

Para provar isso, primeiro temos que mostrar que o valor de f (x) está bem definido para
todo x ∈ X. Ou seja, devemos provar que o limite acima existe. Para isso, basta reusar
um exemplo acima e observar que

quando m, n → +∞, |dX (x, xn ) − dX (x, xm )| ≤ dX (xn , xm ) → 0.

Deste modo, para cada x ∈ X fixo, a sequência de números reais {dX (x, xn )}n é Cauchy e
portanto convergente.
Para provar que f é 1-Lipschitz, tomamos x, x′ ∈ X arbitrários e, novamente usando
as ideias anteriores, observamos o seguinte:

|f (x) − f (x′ )| = lim |dX (x, xn ) − dX (x′ , xn )| ≤ dX (x, x′ ).


n∈N

A principal “graça" deste problema é que ele resulta no exercício a seguir, que será
importante quando estudarmos conjuntos compactos.

Exercício 4.6 Prove que, se (X, dX ) não é completo, então existe uma função f : X → (0, 1]
com f (x) > 0 para todo x ∈ X, mas inf x∈X f (x) = 0.

4.3 Funções contínuas sobre o espaço de funções contínuas


recontinuas
xConsideremos agora o espaço C := C(I, R), com I = [a, b] ⊂ R um intervalo fechado e
limitado munido da norma ∥ · ∥C := ∥ · ∥I,∞ . Os elementos de C são funções contínuas
f : I → R. Mas também podemos definir algumas funções contínuas sobre este espaço.
Eis alguns exemplos naturais.

Exemplo 4.4 Dado t ∈ I, defina a aplicação et : C → R que leva f ∈ C em f (t). Esta é uma
função de C em R.

Veja que, dadas f, g ∈ C

|et (f ) − et (g)| = |f (t) − g(t)| ≤ sup |f (s) − g(s)| = ∥f − g∥I,∞ .


s∈I

Portanto, et é uma aplicação 1-Lipschitz de C em R. Em particular, ela é uma aplicação


contínua.

Exemplo 4.5 Dados R ya ≤ x, y ≤ b, defina a aplicação Ix,y : C → R que leva f ∈ C na integral


definida Ix,y (f ) := x f (t) dt ∈ R. Esta também é uma função de C em R.

66
Dadas f, g ∈ C, as propriedades usuais da integral definida nos dizem que:
Z y

|Ix,y (f ) − Ix,y (g)| = (f (t) − g(t)) dt
x
≤ |x − y| sup |f (t) − g(t)|
t∈[x,y]

≤ |y − x| sup |f (t) − g(t)|


t∈I
≤ |y − x| ∥f − g∥I,∞ .
Ou seja, Ix,y é uma função L-Lipschitz de C em R, com L := |y − x|.
uncintegral Exemplo 4.6 Vamos agora considerar uma função de I : C → C que associa a cada f ∈ C uma
nova função I(f ) ∈ C. Para definir esta função I(f ) precisamos definir para cada t ∈ I um valor
I(f )(t). Faremos isso dizendo que
Z t
I(f )(t) := f (s) ds (t ∈ I).
a

Ou seja, I(f ) é a única função com as seguintes duas propriedades: a derivada de I(f ) é f e
I(f )(a) = 0. Obviamente I(f ) ∈ C, pois toda função diferenciável é contínua.
Provemos agora que I : C → C é (b − a)-Lipschitz. O que queremos é mostrar que,
dadas f, g ∈ C:
Z t

∥I(f ) − I(g)∥I,∞ = sup (f (s) − g(s)) ds ≤ (b − a) ∥f − g∥I,∞ .

t∈I a
Rt
Mas isto segue do fato que | a
(f (s) − g(s)) ds| ≤ (t − a) sups∈[a,t] |f (s) − g(s)| para cada
t ∈ I.
Exercício 4.7 Mostre que Ix,y = ey ◦ I − ex ◦ I.
ontofixoedo Exemplo 4.7 (EDOs e pontos fixos) Dados (t0 , x0 ) ∈ R × R e Ψ : R → R contínua, definimos
uma nova aplicação TΨ,t0 ,x0 : C → C da seguinte forma: dada f ∈ C, TΨ,t0 ,x0 (f ) ∈ C é a função
cujos valores em cada ponto t ∈ I são dados por
Z t
TΨ,t0 ,x0 (f )(t) := x0 + Ψ(f (s)) ds.
t0

Novamente é fácil ver que TΨ,t0 ,x0 é uma função dem-definida de C em C. A importância dela tem
a ver com a teoria de equações diferenciais ordinárias (ou EDOs). De fato, é um exercício mostrar
que uma função f : I → R resolve o problema de Cauchy autônomo no tempo
 ′
f (t) = Ψ(f (t)) (t ∈ I)
f (t0 ) = x0
se e somente se f é um ponto fixo de TΨ,t0 ,x0 , ou seja, f = TΨ,t0 ,x0 (f ). Mais adiante desenvolveremos
ferramentas para provar que certas funções contínuas têm um único ponto fixo, provando assim
que o problema de Cauchy acima tem uma única solução.

67
Queremos agora provar que T = TΨ,t0 ,x0 é contínua. Ou seja, dadas {fn }n∈N ∪ {f } ⊂ C,
precisamos mostrar que:
∥fn − f ∥∞ → 0 ⇒ ∥T (fn ) − T (f )∥∞ → 0.
Vamos proceder por partes. Note que
∥T (fn ) − T (f )∥∞ = ∥I(Ψ ◦ fn ) − I(Ψ ◦ f )∥∞ ≤ (b − a) ∥Ψ ◦ fn − Ψ ◦ f ∥∞ .
Portanto, o que precisamos é provar que Ψ ◦ fn converge a Ψ ◦ f uniformemente sobre
I. Ou seja, queremos mostrar que:
∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : ∥Ψ ◦ fn − Ψ ◦ f ∥∞ ≤ ε.
Antes de partir para prova, faremos algumas observações. A convergência pontual
está assegurada porque Ψ é contínua e fn → f pontualmente, de modo que:
∀t ∈ I : fn (t) → f (t) e portanto Ψ ◦ fn (t) = Ψ(fn (t)) → Ψ(f (t)) = Ψ ◦ f (t).
A convergência uniforme é um pouco mais sutil. O fato de que fn (t) converge unifor-
memente a f (t) não implica diretamente que Ψ ◦ fn (t) → Ψ ◦ f (t) de forma uniforme. Para
isso, teremos de usar o fato que Ψ é uniformemente contínua sobre intervalos compactos. Ou
seja, precisamos nos recordar que:
∀M > 0 ∀η > 0 ∃δ = δ(M, η) > 0 : ∀x, y ∈ [−M, M ], |x − y| ≤ δ ⇒ |Ψ(x) − Ψ(y)| ≤ η.
Note que, em nossa prova, queremos estudar os valores de |Ψ(x) − Ψ(y)| quando
x = fn (t) e y = f (t). Por isso, tomaremos M de modo que os valores de fn (t) e f (t) estejam
em [−M, M ] para todo n. De fato, veja que

0 ≤ |∥fn ∥∞ − ∥f ∥∞ | ≤ ∥fn − f ∥∞ → 0 ⇒ ∥fn ∥∞ → ∥f ∥∞ ⇒ M := sup ∥fn ∥∞ < +∞.


n∈N

Com essa escolha de M , temos que


∀n ∈ N, ∀t ∈ I : |fn (t)| ≤ ∥fn ∥∞ ≤ M , ou seja, fn (t) ∈ [−M, M ]
e o mesmo vale para os valores de f (t).
Fixo este M , e dado um ε > 0, podemos tomar δ = δ(M, ε). Sabemos que existe um
n0 = n0 (ε) tal que:
∀n ≥ n0 , ∀t ∈ I : fn (t), f (t) ∈ [−M, M ] e |fn (t) − f (t)| ≤ ∥fn − f ∥∞ ≤ δ.
Portanto, pela nossa escolha de δ,
∀n ≥ n0 ∀t ∈ I : |Ψ(fn (t)) − Ψ(f (t))| ≤ ε.
Ou seja:
∀n ≥ n0 : ∥Ψ ◦ fn − Ψ ◦ f ∥∞ ≤ ε.
Trocando em miúdos, dado ε > 0, fomos capazes de encontrar n0 tal que para todo n ≥ n0
vale que ∥Ψ ◦ fn − Ψ ◦ f ∥∞ ≤ ε.
Nosso último exemplo é de uma função que não é contínua.

68
naocontinua Exemplo 4.8 Suponha I = [0, 1] e seja D ⊂ C(I, R) o conjunto de todas as funções diferenciáveis
em t = 1/2. Defina D : D → R como D(f ) := f ′ (1/2), f ∈ D. Argumentamos que D não é
contínua.

De fato, basta observar que existem funções próximas de 0 na norma do sup que têm
derivada arbitrariamente grande em t = 1/2. Por exemplo, tomando
1
fk (x) := sin(2π k 2 (x − 1/2)), (x ∈ [0, 1])
k
temos que ∥fk ∥I,∞ = 1/k → 0, mas D(fk ) = fk′ (1/2) = k → +∞.

A observação inocente de que a derivada não é contínua tem consequências importan-


tes. Um problema que abordaremos mais tarde é o de diferenciar uma função f = limk fk .
Gostaríamos de dizer que f ′ (t) = limk→+∞ fk′ (t), mas, como vimos acima, isto nem sempre
é verdade. Deste modo, o problema de diferenciar um limite de funções não é trivial. Em
geral só conseguiremos tratar este problema trocando a derivada, que é mal comportada,
por um problema equivalente envolvendo integrais. Por exemplo, é por esta razão que
formulamos o problema de Cauchy em termos de integrais e não de derivadas.

4.4 Funções contínuas de X em Rd


ntinuasemRd
Aqui só temos uma observação a fazer. Se f : D ⊂ X → Rd e x ∈ D são dados, podemos
escrever o vetor f (x) ∈ Rd em coordenadas

f (x) = (f [1](x), f [2](x), . . . , f [d](x)).

Isto induz funções f [i] : X → R. Como a convergência de elementos de Rd é equivalente à


convergência de todas as coordenadas, vemos que f (xn ) → f (x) se e somente se f [i](xn ) →
f [i](x) para cada 1 ≤ i ≤ d. Usando isto, não é difícil provar o resultado a seguir.

Exercício 4.8 Prove que f : D ⊂ X → Rd é contínua em x ∈ D se e somente se cada uma das


funções-coordenada f [i] : D → X definidas acima é contínua.

4.5 Transformações e funcionais lineares


Uma classe especial de funções (possivelmente) contínuas merece uma consideração es-
pecial.

Definição 4.3 Se V, W são espaços vetoriais reais, uma função T : V → W é dita uma transfor-
mação linear se:
∀v, v ′ ∈ V, ∀λ ∈ R : T (λ v + v ′ ) = λT (v) + T (v ′ ).
Se W = R, dizemos que T é um funcional linear.

69
Se V = Rd e W = Rℓ , sabemos de Álgebra Linear que há uma correspondência entre
transformações lineares e matrizes. Isso será útil para o exemplo a seguir.

Exemplo 4.9 Qualquer transformação linear T : Rd → Rℓ é Lipschitz (e portanto contínua),


quando botamos a norma ℓp1 em Rd e a norma ℓp2 em Rℓ .

De fato, sabemos que existe um elemento AT ∈ Rℓ×d que representa T , no sentido que
AT v = T (v) para todo v ∈ Rd . Recordando a definição da norma de operador no Exemplo
2.6, deduzimos que:

|T (v) − T (v ′ )|p2
∥T ∥Lip := sup
v,v ′ ∈Rd , v̸=v ′ |v − v ′ |p1
|T (v − v ′ )|p2
(linearidade de T ) = sup
v,v ′ ∈Rd , v̸=v ′ |v − v ′ |p1
|T (h)|p2
(tome h = v − v ′ ) = sup
h∈Rd , h̸=0Rd |h|p1
|AT h|p2
(AT representa T + def. da norma de op.) = sup = ∥AT ∥p1 →p2 < +∞.
h∈Rd , h̸=0Rd |h|p1

Em geral, transformações lineares no espaço das funções contínuas (ou em subespaços


dele) podem não ser contínuas. No entanto, vimos acima dois exemplos importantes de
transformações que são, sim, contínuas; de fato, ambas são Lipschitz.

Exemplo 4.10 Usando a notação da Seção 4.3, as funções et , Ix,y : C → R são funcionais lineares
contínuos (posto que Lipschitz), I : C → C também é Lipschitz (logo contínua) e TΨ,t0 ,x0 em geral
não é linear. O operador D é um funcional linear descontínuo sobre o subconjunto D ⊂ C das
funções diferenciáveis em t = 1/2, que também é um espaço vetorial real.

O teorema abaixo nos diz que uma transformação linear é contínua se e somente se é
Lipschitz.

teo:contlim Teorema 4.1 Considere dois espaços vetoriais reais normados (V, ∥ · ∥V ), (W, ∥ · ∥W ). Dada uma
transformação linear T : V → W , são equivalentes:

1. T é limitada, ou seja:

∥T ∥V →W := sup ∥T (v)∥W < +∞.


v∈V,∥v∥V =1

2. T é L-Lipschitz para algum L > 0.

3. T é contínua no ponto 0V .

70
Prova: 1⇒2. Chame de L := ∥T ∥V →W . Afirmamos que para quaisquer v, v ′ ∈ V vale a
desigualdade ∥T (v) − T (v ′ )∥W ≤ L ∥v − v ′ ∥V . De fato, esta desigualdade é trivialmente
satisfeita se v = v ′ . Caso contrário, podemos olhar para o vetor z := (v − v ′ )/∥v − v ′ ∥V ;
ele tem norma ∥z∥V = 1 e portanto ∥T (z)∥W ≤ ∥T ∥V →W = L. Deduzimos por linearidade
que
T (v) − T (v ′ ) ∥T (v) − T (v ′ )∥W
T (z) = , portanto = ∥T (z)∥W ≤ L,
∥v − v ′ ∥V ∥v − v ′ ∥V
como queríamos demonstrar.

2⇒3 é direto.

3⇒1. A ideia da prova é muito semelhante à que usamos na prova do Teorema 3.3.
Supondo (para chegar a uma contradição) que T não é limitado, podemos encontrar, para
cada n ∈ N, um vetor vn ∈ V com ∥vn ∥V = 1 e ∥T (vn )∥W ≥ n + 1. Isto quer dizer que, por
um lado, vn /(n + 1) → 0V , mas, por outro lado (usando linearidade),
 
vn = ∥T (vn )∥W = 1 ̸→ 0.

T
n + 1 W n+1

Isto quer dizer que T não é contínuo, o que contradiz a hipótese 3. Deduzimos que T é,
sim, limitado, como queríamos demonstrar. 2

Exercício 4.9 Prove que, de fato,

∥T v∥W
∥T ∥V →W = sup = ∥T ∥Lip
v∈V \{0}V ∥v∥V

e que, portanto, ∥T v∥W ≤ ∥T ∥V →W ∥v∥V para todo v ∈ V .

ex:scriptL Exercício 4.10 Chame de L(V, W ) o espaço das transformações lineares limitadas entre V e W
(como no teorema acima), com a estrutura "natural" de soma e produto por escalar. Mostre que

(L(V, W ), ∥ · ∥V →W )

é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ∥ · ∥W ) é Banach.

[Dica: a ideia para provar que é espaço normado é mostrar logo de cara que ∥ · ∥V →W é
subaditiva. Para provar que é Banach, mostre que, se {Tn }n∈N ⊂ L(V, W ) é uma sequência
de Cauchy, então {Tn v}b∈N é Cauchy para qualquer v ∈ V ; deduza que há convergência
pontual e pode-se definir um limite T v = limn Tn v. Não é difícil provar que T é linear pela
convergência pontual. Como provar que T ∈ L(V, W ) e ∥Tn − T ∥V →W → 0?]

71
4.6 Transformações multilineares e tensores
Uma extensão importante das espaços vetoriais é a de transformações multilineares.

Definição 4.4 Considere espaços vetoriais reais V1 , V2 , . . . , Vk , W com suas respectivas normas.
Uma função:
Q : V1 × V2 × · · · × Vk → W
é dita transformação k-linear se é linear em cada argumento, isto é, se, dados um índice i ∈ [k] e
vetores vj ∈ Vj , j ∈ [k]\{i}, a função

Qi : ṽi ∈ Vi 7→ Q(v1 , . . . , vi−1 , ṽi , vi+1 , . . . , vk ) ∈ W

é uma transformação linear de Vi em W . Dizemos que Q é limitada se

∥Q(v1 , v2 , . . . , vk )∥W
∥Q∥V1 ×...Vk →W := sup Qk < +∞.
(v1 ,...,vk )∈(V1 \{0V1 })×···×(Vk \{0Vk }) i=1 ∥v i ∥ V i

Ou seja, Q é multilinear se é “linear em cada coordenada". Veremos mais adiante no


curso que as funções k-lineares aparecem como as derivadas de ordem k de funções entre
espaços vetoriais.
Logo de cara, provamos um teorema parecido com o Teorema 4.1 relacionando conti-
nuidade e limitação.

Teorema 4.2 No contexto da definição acima, dote o espaço produto V := V1 × V2 × · · · × Vk da


norma:
k
X
∥(v1 , . . . , vk )∥V := ∥vi ∥Vi ((v1 , . . . , vk ) ∈ V ).
i=1

Então Q : V → W é contínua se e somente se é limitada.

Veja que, neste caso, não garantimos que Q é Lipschitz. De fato, funções bilienares em
geral não são Lipschitz. O exemplo mais simples de função bilinear é a que leva (x, y) ∈ R2
em xy; não é difícil ver que esta função não é Lipschitz.
Prova: Vamos começar provando que “limitada⇒contínua".
Suponha que L := ∥Q∥V1 ×...Vk →W < +∞. Imagine que temos uma sequência {vn }n∈N ⊂
V e um ponto v ∈ V com vn → v. Nosso objetivo será mostrar que Q(vn ) → Q(v).
Escrevemos
vn = (vn,1 , vn,2 , . . . , vn,k ) ∈ V1 × V2 × · · · × Vk
e
v = (v1 , v2 , . . . , vk ) ∈ V1 × V2 × · · · × Vk .
A ideia principal da prova é a seguinte. A convergência vn → v implica que vn,i → vi ,
como veremos a seguir. Deste modo, esperamos que vn,i esteja próximo de vi para n grande.
Nossa ideia será usar essa proximidade “coordenada a coordenada" para comparar Q(vn )

72
e Q(v). Para isso, vamos tentar escrever Q(v) − Q(vn ) passando de v a vn de uma forma
que só muda uma coordenada de cada vez, porque aí poderemos usar a linearidade.
Para ilustrar isso, vamos considerar o caso em que k = 2 e Q é bilinear. Dados
v = (v1 , v2 ), u = (u1 , u2 ) ∈ V podemos escrever:
Q(v1 , v2 )−Q(u1 , u2 ) = Q(v1 , v2 )−Q(u1 , v2 )+Q(u1 , v2 )−Q(u1 , u2 ) = Q(v1 −u1 , v2 )+Q(u1 , v2 −u2 ).
Portanto,
∥Q(v1 , v2 ) − Q(u1 , u2 )∥ ≤ ∥Q∥V →W ∥v1 − u1 ∥V1 ∥v2 ∥V2 + ∥Q∥V →W ∥u1 ∥V1 ∥v2 − u2 ∥V2 .
Disso podemos deduzir que, se u1 → v1 e u2 → v2 , então Q(u1 , u2 ) → Q(v1 , v2 ). Daremos
mais detalhes abaixo na prova para Q geral.
Comecemos com a parte de convergência. Nossa hipótese diz que
k
X
∥v − vn ∥V = ∥vi − vn,i ∥Vi → 0.
i=1

Como os termos da soma acima são não-negativos, temos que


0 ≤ min ∥vi − vn,i ∥Vi ≤ max ∥vi − vn,i ∥Vi → 0.
1≤i≤k 1≤i≤k

Portanto,
∀1 ≤ i ≤ k : ∥vi − vn,i ∥Vi → 0.
Em particular, cada sequência ∥vi − vn,i ∥Vi é limitada, de modo que existe um C > 0 com
∀1 ≤ i ≤ k, ∀n ∈ N : ∥vi − vn,i ∥Vi ≤ C.
(j)
Consideramos agora termos “intermediários"wn entre vn e v, com j = 0, . . . , k, que
definimos da seguinte forma.
(j) (j) (j)
wn(j) = (wn,1 , wn,2 , . . . , wn,k ) ∈ V1 × V2 × · · · × Vk
onde 
(j) vn,i , i ≤ j;
wn,i = (i ∈ [k])
vi , i > j.
(0) (k) (j) (j−1)
Deste modo, wn = v, wn = vn e cada wn difere de wn apenas na j-ésima coordenada.
Usando uma soma telescópica, podemos escrever:
k
X
Q(v) − Q(vn ) = Q(wn(j) ) − Q(wn(j−1) ).
j=1

Portanto,
k
X
∥Q(v) − Q(vn )∥W ≤ ∥Q(wn(j) ) − Q(wn(j−1) )∥W .
j=1

73
(j) (j−1)
Recorde agora que cada wn difere de wn apenas na j-ésima coordenada. Esse é o tipo
de situação em que a multilinearidade de Q se aplica. Mais exatamente, vemos que

 vn,i , i < j;
(j) (j) (j)
Q(wn ) − Q(wn ) = Q(xn,1 , . . . , xn,k ) onde xn,k =
(j) (j−1)
vn,j − vj , i = j; (i ∈ [k]).
vi , i > j.

Portanto,
k
Y (j)
∥Q(wn(j) ) − Q(wn(j−1) )∥W ≤ ∥Q∥V1 ×···×Vk →W ∥xn,k ∥Vj ≤ L C k−1 ∥vn,j − vj ∥Vj .
j=1

Deduzimos que
k
X
∥Q(v) − Q(vn )∥W ≤ L C k−1 ∥vn,j − vj ∥W → 0,
j=1

como queríamos demonstrar.


Resta provar que “contínua⇒limitada". De fato, usaremos a forma contrapositiva
“não-limitada⇒não-contínua". Se Q não é limitada, então para qualquer n ∈ N existem
vn,1 ∈ V1 \{0V1 }, . . . , vn,k ∈ Vk \{0Vk } com
∥Q(vn,1 , vn,2 , . . . , vn,k )∥W
Qk ≥ n.
i=1 ∥vn,i ∥Vi
Se definimos un,i = vn,i / ln n∥vn,i ∥Vi e
un = (un,1 , . . . , un,k ) ∈ V,
vemos que
Q(vn,1 , vn,2 , . . . , vn,k )
Q(un,1 , un,2 , . . . , un,k ) = Qk
i=1 (ln n ∥vn,i ∥Vi )
e portanto ∥Q(un,1 , un,2 , . . . , un,k )∥W ≥ n/(ln n)k → +∞. Por outro lado,
k
X k
∥(un,1 , un,2 , . . . , un,k )∥V = ∥un,i ∥Vi = → 0.
i=1
ln n
Portanto, achamos uma sequência {un }n∈N ⊂ V que converge a 0V , sem que Q(un ) converja
a Q(0V ). 2

Exercício 4.11 Por que escolhemos a função ln n na hora de “renormalizar os vn,i " na prova acima?
Mostre que, de fato, poderíamos ter tomado a função n1/k−a , com qualquer 0 < a < 1/k, e a mesma
estratégia ainda funcionaria.
Exercício 4.12 Chame de Lk (V1 × · · · × Vk , W ) o espaço das transformações k-lineares limitadas
entre V1 , . . . , Vk e W (como no teorema acima), com a estrutura "natural" de soma e produto por
escalar. Mostre que
(Lk (V1 × · · · × Vk , W ), ∥ · ∥V1 ×···×Vk →W )
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ∥ · ∥W ) é Banach.

74
4.6.1 Tensores em dimensão finita
Como são as funções multilineares Q : Rd1 × Rd2 × . . . Rdk → R com k ≥ 2? Vamos chamar
(d ) dj
de {ei j }i=1 a base canônica de Rdj . Como todo xj ∈ Rdj é da forma

dj
(dj )
X
xj = xj [i] ei
i=1

temos que

d1
X dk
X k
Y
Q(x1 , . . . , xk ) = ··· A[i1 , . . . , ik ] xj [ij ] (x1 ∈ Rd1 , . . . , xk ∈ Rdk ). (4.1) eq:tensormu
i1 =1 ik =1 j=1

(d ) (d )
onde A[i1 , . . . , ik ] := Q(ei1 1 , . . . , eik k ) ∈ R.
Do mesmo modo, se chamados de tensor qualquer elemento do espaço

Rd1 ×d2 ×···×dk := {A = (A[i1 , . . . , ik ])i1 ∈[d1 ]....,ik ∈[dk ] : cada A[i1 , . . . , ik ] ∈ R},

vemos que cada tensor define uma transformação multilinear de Rd1 × . . . Rdk em R.
Portanto, há uma correspondência biunívoca entre tensores e tais transformações. Em
particular, no caso k = 2, os tensores são matrizes as funções bilineares correspondentes
são formas quadráticas.

Q(x, y) = x · Ay para alguma matriz A.

A extensão para o caso em que o contradomínio é (W, ∥ · ∥W ) é imediata.


Um ponto importante é que, no contexto em que estamos trabalhando, toda Q multili-
near é contínua.

Proposição 4.1 Toda transformação multilinear Q : Rd1 × Rd2 × . . . Rdk → R é contínua.

Prova: Como sabemos, basta provar que Q é limitada.


Considere o tensor A correspondente e chame de

L := max |A[i1 , . . . , ik ]|.


(i1 ,...,ik )∈[d1 ]×···×[dk ]

75
Veja que, dado (x1 , . . . , xk ) no domínio do tensor:
d dk

X1 X
|Q(x1 , . . . , xk )| = ··· A[i1 , . . . , ik ] x1 [i1 ] x2 [i2 ] . . . xk [ik ]


i1 =1 ik =1
d1
X dk
X
≤ ··· |A[i1 , . . . , ik ]| |x1 [i1 ]| |x2 [i2 ]| . . . |xk [ik ]|
i1 =1 ik =1
d1
X dk
X
≤ L ··· |x1 [i1 ]| |x2 [i2 ]| . . . |xk [ik ]|
i1 =1 ik =1
k
Y
= L ∥xi ∥1
i=1
k
k
Y
≤ Ld 2 ∥xi ∥2 .
i=1

Deduzimos que a norma de Q é no máximo L dk/2 . 2

4.6.2 Alguns exemplos em dimensão infinita


Agora tomamos C = C(I, R) com I = [a, b], a < b reais. Veremos dois exemplos de
transformação bilinear de C × C em C.

Exemplo 4.11 (Produto) Defina Prod : C × C → C via a fórmula

Prod(f, g) := f g.

Ou seja, a função Prod toma como entrada duas funções contínuas e retorna seu produto f g.

Como o produto de funções contínuas é uma função contínua, esta é uma aplicação
bem definida de C × C em C.
A bilinearidade de Prod fica como exercício. Para mostrar que esta aplicação é limitada,
e portanto contínua, basta observar que:

∥Prod(f, g)∥∞ ≤ ∥f ∥∞ ∥g∥∞

e portanto
∥Prod∥C×C→C ≤ 1.

Exemplo 4.12 (Convolução) Suponha para simplificar que [a, b] = [0, 1]. Defina Conv : C ×
C → C via a fórmula
Z t
Conv(f, g)(t) = f ∗ g(t) := f (s) g(t − s) ds (t ∈ I).
0

76
Para fixar, a expressão acima quer dizer o seguinte: dadas as funções f, g : I → R,
formamos uma nova função Conv(f, g) = f ∗ g. Essa função estará definida do momento
em que especificamos o valor de f ∗ g(t) para cada ponto t ∈ I. Nossa especificação é dada
pela integral acima.
Queremos provar que esta é uma operação bilinear limitada (contínua) Conv : C × C →
C. A bilinearidade é evidente e a limitação vem do fato de que
Z t

∀t ∈ [0, 1] :
f (s) g(t − s) ds ≤ sup |f (s)| |g(t − s)| ≤ ∥f ∥∞ ∥g∥∞ .
0 t,s∈I

Portanto,
∀f, g ∈ C : ∥Conv(f, g)∥∞ ≤ ∥f ∥∞ ∥g∥∞ .
A parte mais difícil do argumento é mostrar que f ∗g é uma função contínua para quaisquer
f, g ∈ C. Para fazer isso, fixamos primeiramente um t′ ∈ I e estimamos a diferença:

f ∗ g(t) − f ∗ g(t′ )

no caso em que |t − t′ | = δ. Para facilitar, supomos que t′ ≤ t, pois o outro caso é análogo.
Veja que
Z t Z t′

f ∗ g(t) − f ∗ g(t ) = f (s) g(t − s) ds − f (s) g(t′ − s) ds
0 0
Z t′ Z t

= f (s) (g(t − s) − g(t − s)) ds + f (s) g(t − s) ds
0 t′
=: (I) + (II).

O termo (II) acima é no máximo:


Z t
f (s) g(t − s) ds ≤ |t − t′ | sup |f (s)| |g(t − s)| ≤ δ ∥f ∥∞ ∥g∥∞ .

|(II)| =
t′ t,s∈I

Já o primeiro termo (I) é limitado por:


Z ′
t
|(I)| = f (s) (g(t − s) − g(t′ − s)) ds

0
≤ sup |f (s)||g(t − s) − g(t′ − s)|
t,t′ ,s∈I : |t−t′ |≤δ

≤ ∥f ∥∞ sup |g(a) − g(b)|.


a,b∈I, |a−b|≤δ

Portanto,

|t − t′ | = δ ⇒ 0 ≤ |f ∗ g(t) − f ∗ g(t′ )| ≤ δ ∥f ∥∞ ∥g∥∞ + ∥f ∥∞ sup |g(a) − g(b)|.


a,b∈I, |a−b|≤δ

77
Agora imagine que t′ → t, de modo que δ → 0. Veja que o primeiro termo do lado direito
vai a 0. O segundo também, porque g : I → R é contínua e portanto uniformemente
contínua. Deduzimos que:

0 ≤ lim

|f ∗ g(t) − f ∗ g(t′ )| ≤ lim sup(δ ∥f ∥∞ ∥g∥∞ + ∥f ∥∞ sup |g(a) − g(b)|) = 0.
t →t δ→0 a,b∈I, |a−b|≤δ

Ou seja, f ∗ g é contínua em t, para qualquer t ∈ I.

4.7 Mais exercícios


Exercício 4.13 Tome a norma 2 → 2 nos espaços de matrizes Rd1 ×d2 e Rd2 ×d3 . Prove que a
aplicação
Mult : Rd1 ×d2 × Rd2 ×d3 → Rd1 ×d3
que leva (A1 , A2 ) ∈ Rd1 ×d2 × Rd2 ×d3 em A1 A2 é bilinear e limitada, com norma

∥Mult∥Rd1 ×d2 ×Rd2 ×d3 →Rd1 ×d3 = 1.

Enuncie e esboce a prova de uma versão do resultado acima para o produto de k > 2 matrizes.

Exercício 4.14 Dado um espaço métrico (X, dX ), chamamos de BC = BC(X, Rd ) o espaço de


funções contínuas e limitadas de X a Rd . Isto é, uma f : X → Rd pertence a BC se é contínua e
∥f ∥∞ := supx∈X |f (x)|2 < +∞. Prove que (BC(X, Rd ), ∥ · ∥∞ ) é espaço de Banach (a estrutura
de espaço vetorial em BC(X, Rd ) é definida da maneira “natural").

Exercício 4.15 Veremos neste exercício e nos próximos algumas propriedades da notação ∥f ∥Lip
introduzida na observação 4.1 acima. Como lá, supomos que f : D → Y com D ⊂ X e (X, dX ),
(Y, dY ) espaços métricos. Prove que:

∀L ∈ R+ : f é L-Lipschitz ⇔ L ≥ ∥f ∥Lip .

Deduza que f é Lipschitz (com alguma constante) se e somente se ∥f ∥Lip < +∞.

:Lipschitz1 Exercício 4.16 Seguimos com a notação do exercício anterior, mas agora no caso específico em que
Y = R com a métrica usual.

1. Mostre que ∥ · ∥Lip é subaditiva e positiva-homogênea, mas ∥f ∥Lip = 0 não implica f = 0.

2. Dadas f, g : D → R, mostre que

∥ min{f, g}∥Lip , ∥ max{f, g}∥Lip ≤ max{∥f ∥Lip , ∥g∥Lip };

em particular, o mínimo e o máximo de funções Lipschitz também é Lipschitz.

78
3. Suponha que F é uma família de funções Lipschitz de D em R tal que

∀x ∈ D, inf f (x) ∈ R.
f ∈F

Mostre que a funcão f∗ : D → R que associa a cada x ∈ D o valor f∗ (x) = inf f ∈F f (x)
satisfaz:
∥f∗ ∥Lip ≤ sup ∥f ∥Lip .
f ∈F

4. Suponha agora que F é uma família de funções Lipschitz de D em R tal que

∀x ∈ D, sup f (x) ∈ R.
f ∈F

Mostre que a funcão f ∗ : D → R que associa a cada x ∈ D o valor f ∗ (x) = supf ∈F f (x)
satisfaz:
∥f ∗ ∥Lip ≤ sup ∥f ∥Lip .
f ∈F

(Juntos, este item e o anterior mostram que o ínfimo e supremo de funções Lipschitz com
constantes uniformemente limitadas também é Lipschitz.)

5. Finalmente, suponha que fn : D → R (n ∈ N) converge pontualmente a f : D → R. Prove


que
∥f ∥Lip ≤ lim inf ∥fn ∥Lip .
n∈N

Exercício 4.17 Complementando o exercício anterior, considere o espaço BL(X, R) de todas as


funções f : X → R satisfazendo ∥f ∥∞ := supx∈X |f (x)| < +∞ e ∥f ∥Lip < +∞ (este é o espaço
das funções “bounded Lipschitz", ou seja, Lipschitz e limitadas). Prove as seguintes propriedades.

1. BL(X, R) é espaço vetorial com as operações naturais de soma e multiplicação por escalar.
Além disso,
∥f ∥BL := ∥f ∥∞ + ∥f ∥Lip (f ∈ BL(X, R))
é norma sobre este espaço.

2. (BL(X, R), ∥ · ∥BL ) é Banach.

3. Dadas f, g ∈ BL(X, R), temos que f.g, min{f, g} e max{f, g} também pertencem a
BL(X, R), com

∥f.g∥BL ≤ ∥f ∥BL ∥g∥BL , ∥ max{f, g}∥BL ≤ max{∥f ∥BL , ∥g∥BL } e

∥ min{f, g}∥BL ≤ max{∥f ∥BL , ∥g∥BL }

79
oconvolucao Exercício 4.18 Este exercício mostra que toda função contínua e limitada de um espaço métrico
em R é o limite pontual de uma sequência crescente de funções Lipschitz. Nos últimos itens,
discutiremos se esta convergência pode ser tomada uniforme.
Tome um espaço métrico (X, dX ) e uma função limitada f : X → R. Dado M > 0, chame de
fM a seguinte aproximação de f , chamada de ínfimo-convolução:
fM (x) := inf (f (y) + M dX (x, y)).
y∈X

1. Mostre que fM (x) ≤ f (x) para todo x ∈ X.


2. Prove que fM é M -Lipschitz e que fM = f se ∥f ∥Lip ≤ M .
3. Demonstre que se x ∈ X e M < M ′ são dados, fM (x) ≤ fM ′ (x).
4. Prove que, quando M ↗ +∞, fM (x) ↗ f (x) para todo ponto x ∈ X onde f é contínua.
[Dica: observe que o inf na definição de fM pode ser tomado no conjunto de pontos
y ∈ X com dX (x, y) ≤ 2∥f ∥∞ /M .]
5. A convergência no item anterior pode ser sempre tomada uniforme em x ∈ X? Explique.
6. Recorde que f é uniformemente contínua
∀ε > 0 ∃δ > 0 ∀x, y ∈ X : d(x, y) ≤ δ ⇒ |f (x) − f (y)| ≤ ε.
Mostre que, se f é uniformemente contínua, então ∥fM − f ∥∞ → 0.
Mais adiante você poderá provar que ∥fM − f ∥∞ → 0 quando X é compacto.
Exercício 4.19 Recorde a definição de convolução de f, g : [0, 1] → R. Suponha que f, g : [0, 1] →
R são dadas, que g ∈ C([0, 1], R) e que f é contínua por partes: isto é, existem a0 = 0 < a1 <
· · · < ak = 1 e funções contínuas fi : [ai−1 , ai ] → R tais que f |(ai−1 ,ai ) = fi |(ai−1 ,ai ) . Suponha
ainda que f é limitada. Prove que f ∗ g é bem definida e contínua.
Exercício 4.20 Mostre que o operador de convolução iterada f1 ∗f2 ∗· · ·∗fk é um operador k-linear
e limitado sobre (C([0, 1], R))k .
Exercício 4.21 (A função que ordena as coordenadas de um vetor) Dado um vetor
x = (x[1], x[2], . . . , x[d]) ∈ Rd
com d ≥ 2, defina
x∗ [1] := min x[i] e i1 (x) := min{i ∈ [n] : x[i] = x∗ [1]};
i∈[n]

e recursivamente para j = 2, 3, . . . , d
x∗ [j] := min x[i] e ij (x) := min{i ∈ [n]\{i1 (x), . . . , ij−1 (x)} : x[i] = x∗ [1]}.
i∈[n]\{i1 (x),...,ij−1 (x)}

A função que queremos estudar, chamada de Ord : Rd → Rd , leva x em Ord(x) := x∗ . Prove que
esta função é 1-Lipschitz na norma ℓ∞ (e portanto contínua em qualquer norma). Se quiser, use os
itens abaixo para provar isso.

80
1. Dado x ∈ Rd , mostre que os índices i1 (x), . . . , in (x) são uma permutação de [n], que:

x∗ = Ord(x) = (x[ij (x)])dj=1

e que por esta razão:

∀j1 , j2 ∈ [d] : j1 ≤ j2 ⇒ x∗ [j1 ] ≤ x∗ [j2 ].

2. Com x ∈ Rd e x∗ = Ord(x) como acima, mostre que:

∀j ∈ [d] : x∗ [j] := inf{t ∈ R : #{i ∈ [d] : x[i] ≤ t} ≥ j}.

Use este fato para deduzir que |Ord(x) − Ord(x′ )|∞ ≤ |x − x′ |∞ para quaisquer x, x′ ∈ Rd .

Exercício 4.22 (O espectro de uma matriz simétrica) Recorde de Álgebra Linear que toda ma-
triz simétrica A ∈ Rd×dsim tem d autovalores reais (com possívels multiplicidades). Nestas notas,
usaremos a convenção de que estes autovalores são ordenados de forma decrescente: λ1 (A) ≥
λ2 (A) ≥ · · · ≥ λd (A). Desta forma, existe uma função

Λ : Rd×d
sim → R
d

associando cada A ao seu vetor de autovalores correspondente. Prove que esta função é 1-Lipschitz
quando usamos a norma ∥ · ∥2→2 nas matrizes e a norma | · |∞ nos vetores, isto é:

∀A, B ∈ Rd×d
sim : |Λ(A) − Λ(B)|∞ ≤ ∥A − B∥2→2 .

Uma dica é primeiro tentar provar que “A 7→ λj (A)” é 1-Lipschitz para cada j ∈ [d]. Para fazer
isso, pode ser útil usar a fórmula de Courant-Fisher (que você não precisa provar):
!
λj (A) := inf sup v · Av .
E subespaço de Rd , dim(E)=n−j+1 v∈E, |v|2 =1

Obs: este é um resultado importante de estabilidade para matrizes simétricas, que tem muita
importância em aplicações. No entanto, os autovetores podem ser muito menos estáveis!

81
82
Parte II

Topologia e geometria em espaços


métricos

83
Capítulo 5

Abertos, fechados e topologias

Neste capítulo, começaremos a discutir conceitos topológicos. Veremos o que são conjuntos
abertos e fechados em um espaço métrico; discutiremos porque os abertos formam o que se
chama de topologia; relacionaremos continuidade a estes dois conceitos; e ainda, trataremos
da topologia relativa que um conjunto pode herdar de outro maior. A linguagem e os
resultados desenvolvidos aqui serão importantes para tudo o que vem a seguir.
Ao longo deste capítulo, (X, dX ) será um espaço métrico dado. Dados x ∈ X e r ≥ 0,
denotamos por B(X,dX ) (x, r) BX (x, r) ou apenas B(x, r) a chamada bola aberta de raio r ao
redor de x:
B(x, r) := {y ∈ X : d(x, y) < r}.
Também definimos a bola fechada B(X,dX ) [x, r], BX [x, r] ou B[x, r] como

B[x, r] := {y ∈ X : d(x, y) ≤ r}.

Nos dois casos acima, chamamos x de centro da bola e r de raio da bola.

Exercício 5.1 Mostre que, dados 0 ≤ r′ < r,

B(x, 0) = ∅ ⊂ B[x, 0] = {x} ⊂ B[x, r′ ] ⊂ B(x, r) ⊂ B[x, r].

Mostre ainda que B[x, 0] = B[x, 1/2] = B(x, 1) = {x} se a métrica é discreta.

Agora podemos apresentar as principais definições de topologia de espaços métricos.

Definição 5.1 A ⊂ X é dito aberto (segundo a métrica dX ) se para todo x ∈ X existe um δ > 0
tal que BX (x, δ) ⊂ A. F ⊂ X é dito fechado (também segundo a métrica dX ) se X\F é aberto.

Frequentemente falaremos de abertos da seguinte maneira: um conjunto é aberto se


todo x ∈ A tem uma "bolha protetora"(BX (x, δ) com δ > 0) que o "protege do mundo
exterior" por estar toda contida em A.
Vejamos como se comportam os conceitos de "aberto" e "fechado" sob a métrica discreta.

85
Exemplo 5.1 Todos os subconjuntos são abertos e fechados se a métrica é discreta. Isto porque,
como visto acima, todo dado A ⊂ X, temos

∀x ∈ A : {x} = BX (x, 1) ⊂ A.

Do mesmo modo, Ac também é aberto.

Também observamos que toda bola aberta é aberta. A prova é simples, mas será
apresentada inteira para que possamos praticar o conceito.

Exemplo 5.2 Toda bola aberta é um conjunto aberto.

Para ver isso, tome uma bola B(x, r) com r > 0 e um elemento y ∈ B(x, r). Nosso
objetivo é mostrar que existe um raio positivo δ > 0 tal que B(y, δ) ⊂ B(x, r). Para isso, é
necessário provar que δ > 0 tem a seguinte propriedade: todo z ∈ B(y, δ) também está em
B(x, r). Usando as definições das bolas, isto significa que devemos mostrar o seguinte:

Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ ⇒ d(z, x) < r.

O que nos permite achar este δ é a desigualdade triangular. Afinal, sabemos que

∀δ > 0 ∀z ∈ X : d(z, y) < δ ⇒ d(x, z) ≤ d(z, y) + d(y, x) < δ + d(y, x).

Logo, precisamos escolher δ tal que δ + d(y, x) < r e δ > 0. Como d(x, y) < r (já que
y ∈ B(x, r)), podemos escolher δ := r − d(x, y) > 0 e terminar assim a prova.

Exemplo 5.3 De forma semelhante, toda bola fechada B[x, r] é um subconjunto fechado de X,
onde agora r ≥ 0.

De fato, isto equivale a mostrar que X\B[x, r] é aberto, ou seja, que para todo todo
y ∈ X\B[x, r] existe um δ > 0 tal que B(y, δ) ⊂ X\B[x, r]. A condição necessária sobre δ
desta vez é que

Queremos: ∃δ > 0 ∀z ∈ X : d(z, y) < δ ⇒ d(z, x) > r.

Novamente é a desigualdade triangular que usaremos para achar este δ. Afinal

d(z, y) < δ ⇒ d(x, z) ≥ −d(z, y) + d(y, x) > d(y, x) − δ.

Como y ̸∈ B[x, r], d(x, y) > r, podemos tomar δ = r − d(x, y) e garantir que d(z, y) < δ
implica d(z, x) > r.

Exercício 5.2 Prove que ∅ e X são ambos abertos e fechados.

Exercício 5.3 Prove que os intervalos abertos e fechados de R são mesmo abertos e fechados,
segundo a definição acima. (De fato, todo intervalo aberto ou fechado de comprimento finito é uma
bola aberta.)

86
Exercício 5.4 Dados (X, dX ), x ∈ X e r1 , r2 > 0, prove que BX (x, r1 )∪BX (x, r2 ) = BX (x, max{r1 , r2 })
e BX (x, r1 )∩BX (x, r2 ) = BX (x, min{r1 , r2 }). Prove um resultado semelhante para bolas fechadas.

Nas definições acima definimos fechado em função de aberto. O próximo resultado nos
permite definir o que é um conjunto fechado em termos de limites de sequências.

:fechadoseq Teorema 5.1 F ⊂ X é fechado se e somente se limn xn ∈ F para toda sequência convergente
{xn }n∈N ⊂ F .

Prova: [do Teorema 5.1] Fixe um conjunto F ⊂ X. Como a definição de fechado é em


função da de aberto, temos de recorrer a A := X\F . O que a proposição diz é:

A é aberto ⇔ toda seq. convergente {xn }n ⊂ X\A tem limite em X\A.

Vamos provar primeiro a direção “⇒". Supondo que A é aberto, seja {xn }n qualquer
sequência convergente contida em X\A e seja x = limn xn . Suponha (para chegar a uma
contradição) que x ̸∈ X\A, ou seja, x ∈ A. Como A é aberto, existe um r > 0 tal que
B(x, r) ⊂ A. Por outro lado, como xn ̸∈ A para todo n, temos:

∀n ∈ N : xn ̸∈ B(x, r), isto é, d(xn , x) ≥ r.

Segue que d(xn , x) não converge a 0, ou seja, x não é o limite da sequência. Como isto é
uma contradição, deduzimos que x ∈ X\A.
Agora mostraremos a direção “⇐" da equivalência via a afirmação contrapositiva. Isto
é, mostraremos que:

se A não é aberto, então ∃{xn } ⊂ X\A com limn xn ∈ A.

Vejamos: se A não é aberto, então existe um ponto x ∈ A tal que B(x, r) ̸⊂ A para
qualquer r > 0. Em particular, dado n ∈ N, podemos sempre encontrar um elemento
xn ∈ B(x, 1/(n + 1)) ∩ (X\A). Isto quer dizer que:

xn ∈ B(x, 1/(n + 1)) ⇒ dX (x, xn ) < 1/(n + 1); e



(intersecção)
xn ∈ B(x, 1/(n+1))∩(X\A) ⇒
xn ∈ X\A.

Deste modo, vemos que x ∈ A, dX (xn , x) → 0(ou seja, xn → x) e {xn }n∈N ⊂ X\A. Ou
seja, supondo que A não é aberto, provamos que há uma sequência contida em X\A com
limite em A. 2

ex:todabola Exercício 5.5 Demonstre o seguinte escólio da demonstração acima: um ponto x ∈ X é o limite
de uma sequência de pontos em S ⊂ X se e somente se B(x, r) ∩ S ̸= ∅ para todo r > 0.

87
5.1 Os abertos formam uma topologia
Nesta seção provaremos que os abertos de um espaço métrico formam uma topologia.
Primeiro temos de definir esta palavra.

Definição 5.2 Uma topologia sobre um conjunto X ̸= ∅ é uma coleção T de subconjuntos de


X, chamados de abertos da topologia T , ou ainda abertos de X segundo T , com as seguintes
propriedades.

Axioma 1: ∅, X ∈ T (o vazio e o espaço inteiro são abertos).

Axioma 2: Dada A ⊂ T , temos ∪A∈A A ∈ T (uniões de abertos são sempre abertas).

Axioma 3: Dados A, A′ ∈ T , temos A ∩ A′ ∈ T (interseções de pares de abertos são abertas).

Os conjuntos F ⊂ X com X\F ∈ T são chamados de fechados de T .

Exercício 5.6 Todo X possui duas topologias extremas: Tgrossa = {∅, X} e Tf ina = {todos os
subconjuntos de X}. Mostre que estas topologias são mesmo topologias.

Exercício 5.7 Mostre que a interseção de um número finito de conjuntos abertos é sempre um
conjunto aberto.

O principal resultado desta seção é que os abertos de um espaço métrico formam uma
topologia.

m:topologia Teorema 5.2 Considere um espaço métrico (X, dX ). Seja T(X,dX ) a coleção de todos os subcon-
juntos de X que são abertos na noção dada pela métrica dX . Então T(X,dX ) é uma topologia sobre
X.

Como veremos na prova, o conteúdo deste teorema é basicamente o seguinte.

Corolário 5.1 Qualquer união de abertos em (X, dX ) é também um conjunto aberto. Qualquer
interseção de dois conjuntos abertos em X é aberta (do mesmo modo, qualquer interseção finita é
aberta).

Note que interseções infinitas podem não ser abertas. Por exemplo, em R (com a
métrica usual), a coleção de conjuntos

A := {(−t, t) : t > 0}

tem interseção {0}, que não é aberto.


Prova: [Teorema 5.2] Veja que ∅, X são abertos de X: nenhum elemento está contido em
∅ (logo ele é aberto por vacuidade) e todas as bolas estão contidas em X (que é aberto,
portanto). Concluímos que ambos pertencem a TdX , ou seja, vale o primeiro axioma de uma
topologia.

88
Provaremos agora que vale o segundo axioma. Dada uma coleção qualquer de abertos
A ⊂ TdX , queremos provar que ∪A∈A A ∈ TdX . Recorde o que isto quer dizer: se tomarmos
um elemento qualquer x ∈ ∪A∈A A, deve existir um raio positivo r com BX (x, r) ⊂ ∪A∈A A.
Para achar o raio, lembramos que um dado x só pode pertencer à união se pertence a pelo
menos um dos conjuntos Ax ∈ A. Como todos os elementos de A são abertos, sabemos que
Ax é aberto e x ∈ Ax . Logo, existe um r > 0 tal que BX (x, r) ⊂ Ax . Também sabemos que
Ax ⊂ ∪A∈A A, pois a união dos conjuntos A ∈ A contem todos os conjuntos A ∈ A. Como
a relação “⊂" é transitiva, deduzimos que BX (x, r) ⊂ ∪A∈A A. Dito de outro modo: como
x está num conjunto da união, ele tem uma “bolha" ao seu redor dentro deste conjunto e,
portanto, tem uma bolha na união.
Consideremos agora o terceiro axioma, que fala da interseção de dois abertos A, A′ ⊂ X.
Para provar que A ∩ A′ é aberto, devemos mostrar que, dado um x ∈ A ∩ A′ , temos
B(x, r) ⊂ A ∩ A para algum r > 0. Para isto, partimos do fato de que A e A′ são ambos
abertos e que x pertence aos dois; afinal, só assim x pode estar na interseção. Deduzimos:
x ∈ A ⇒ ∃R > 0 : B(x, R) ⊂ A (porque A é aberto)

′ (intersecção)
x∈A∩A ⇒
x ∈ A′ ⇒ ∃R′ > 0 : B(x, R′ ) ⊂ A (porque A′ é aberto)
Tomemos então r = min{R, R′ }. Como R, R′ > 0, r > 0 também. Além disso, B(x, r) ⊂
B(x, R) ⊂ A e B(x, r) ⊂ B(x, R′ ) ⊂ A′ , de modo que B(x, r) ⊂ A ∩ A′ . Ou seja, mostramos
que a “menor das bolhas" que x tem dentro de A e A′ está inteiramente contida na
interseção. 2

Exercício 5.8 De modo geral, chamamos uma topologia T sobre X de metrizável se ela provem
de uma métrica, ou seja, se existe uma métrica sobre X tal que T = TdX . Mostre que existem
topologias não metrizáveis; por exemplo, a topologia grossa definida acima não é metrizável.

O estudo de espaços topológicos gerais é chamado de Topologia Geral. Esta área tem
relações profundas com a Lógica e a Teoria de Conjuntos. De fato, muitas propriedades
que já estudamos e ainda estudaremos são demonstradas com apelos simples às leis de
DeMorgan para operações com conjuntos. Por exemplo:
1. O complementar do complementar é o próprio conjunto. Fixo X, o complementar de
S⊂Xé
S c := {x ∈ X : x ̸∈ S} = X\S.
A operação complementar é idempotente: ou seja, (S c )c = S.
2. O complementar da união é a interseção dos complementares. Com X como acima, se A é
uma coleção de subconjuntos de X,
[ \
( A)c = Ac .
A∈A A∈A

Estas leis são uma ótima maneira de passarmos de propriedades de abertos para as de
fechados. Por exemplo, o exercício abaixo segue diretamente desse tipo de observação.

89
terfechados Exercício 5.9 Mostre que, em qualquer espaço topológico, qualquer interseção de conjuntos fecha-
dos é fechada. Prove ainda que a união de um número finito de conjuntos fechados resulta em outro
conjunto fechado. (Estes dois fatos seguem das leis sobre complementares de uniões e interseções
aplicadas às propriedades dos abertos.)
Exercício 5.10 (Vizinhanças abertas) Se (X, TX ) é espaço topológico e x ∈ X, uma vizinhança
aberta de x é um aberto Bx ∈ TX com x ∈ B. Mostre que A ⊂ X é aberto se e somente se podemos
encontrar, para cada x ∈ A, podemos encontrar uma vizinhança aberta Bx de x com Bx ⊂ A.

5.2 Outros conceitos topológicos


Vamos definir aqui algumas outras noções topológicas e fazer alguns comentários sobre
elas. Começamos supondo apenas que (X, T ) é um espaço topológico e abertos e fechados
são definidos a partir de T .
Definição 5.3 (Interior, fecho e fronteira) O interior de S ⊂ X, denotado por S o , é definido
por: [
S o := A.
A⊂S : A aberto
O fecho de S é: \
S := F.
F ⊃S : F fechado

A fronteira de S é ∂S := S ∩ S c , onde S c é definido como na seção anterior.


A primeira coisa para observar sobre estes conceitos é um resultado simples.
Proposição 5.1 Com as definições acima, S o é aberto, enquanto S e ∂S são sempre fechados.
Prova: S o é união de abertos, logo aberto. S é interseção de fechados, logo fechado. Por
fim, ∂S é a interseção de fechados, logo fechado. 2

ntardofecho Proposição 5.2 O complementar do fecho de S ⊂ X é o interior do complementar de S: (S)c =


(S c )o .
Prova: A principal observação na prova é que um conjunto F ⊂ X é um fechado com
F ⊃ S se e somente se A = F c é um aberto com A = F c ⊂ S c . Isto decorre do fato
que a operação de tomar o complementar troca a ordem de inclusões (o que vale em
geral para conjuntos) e também troca fechados por abertos (o que sempre vale em espaços
topológicos).
Dada a afirmação acima, e a regra para interseções e uniões de complementares,
deduzimos:
!c
\ [ [
(S)c = F = Fc = A = (S c )o .
F ⊃S fechado F ⊃S fechado A⊂S c aberto
2

90
Agora vamos tentar pensar no que os conceitos significam, partindo do princípio que
um conjunto aberto “protege" seus elementos do mundo exterior (como falamos das bolhas
acima).
Segue das regras da união que um ponto x ∈ X é elemento de S o se e somente se existe
um aberto A ⊂ X com x ∈ A; isto é, x ∈ S o se está “protegido do complementar de S".
Por esta razão, o resultado abaixo é natural.

Proposição 5.3 S é aberto se e somente se S = S o .

Prova: Se S = S o , S é aberto porque S o é aberto. Por outro lado, se S é aberto, o próprio


S é um daqueles conjuntos A ⊂ S abertos na definição do interior. Deduzimos:
[
S⊂ A = S o ⊂ S ⇒ S o = S.
A⊂S aberto

2
Para o fecho, temos um resultado análogo ao acima.

Exercício 5.11 S é fechado se e somente se S = S.

Veremos agora que um ponto x ∈ X está em S se “não há como protegê-lo de S".

esprotegido Proposição 5.4 Dado x ∈ X,

x ∈ S ⇔ “∀A ⊂ X aberto , x ∈ A ⇒ A ∩ S ̸= ∅.”

Prova: Provaremos a direção “⇐" em forma contrapositiva. Suponha que x ∈ X é dado


e existe um aberto A ⊂ X com x ∈ A e S ∩ A = ∅, ou melhor S c ⊃ A. Note que
F := X\A = Ac é um fechado e S ⊂ F (pois tomar complementares inverte a relação de
inclusão). Portanto, F é um daqueles fechados que aparecem na interseção que define o
fecho de S. Concluímos que S ⊂ F e, como x ∈ A = F c , temos x ̸∈ S. Ou seja, um ponto
x ∈ X “protegido" de S por um aberto A ∋ x com A ∩ S = ∅ não está no fecho de S.
Agora, provemos “⇒". Suponha que x ∈ X é tal que, para todo aberto A ⊂ X com
x ∈ A, temos A ∩ S ̸= ∅. Para mostrar que x ∈ S, é necessário e suficiente que x ∈ F para
qualquer fechado F ⊃ S. Tome então um tal F . Note que A = F c = X\F é aberto e não
intersecta S. Por hipótese, todo aberto contendo x intersecta S: portanto, x ̸∈ A. Como A
e F são complementares, deduzimos que x ∈ F , como queríamos demonstrar. 2

Exercício 5.12 Mostre que

∂S = {x ∈ X : ∀A ⊂ X aberto com x ∈ A, A ∩ S ̸= ∅ e A ∩ S c ̸= ∅}.

Por fim, apresentamos mais uma definição topológica relacionada à de fecho. Como
acabamos de ver, x ∈ S se e somente se não está protegido de S. Isso pode acontecer
simplesmente porque x ∈ S, mas essa é a forma “boba" de estar desprotegido. O mais
interessante é quando um ponto não está protegido de S\{x}.

91
Definição 5.4 Dado x ∈ X e S ⊂ X, dizemos que x é ponto de acumulação de S se e somente se
qualquer aberto A ⊂ X com x ∈ A satisfaz A ∩ (S\{x}) ̸= ∅ (dá no mesmo pedir que A ∩ S ̸= ∅
e A ∩ S ̸= {x}). Chamamos de S ′ o conjunto de pontos de acumulação de S, também chamado de
conjunto derivado de S.

Claramente, S = S ∪ S ′ sempre. Um fato interessante é que o conjunto derivado é


fechado sempre que a topologia em questão satisfaz uma propriedade simples.

Proposição 5.5 Suponha que a topologia T é tal que todo conjunto unitário é fechado. S ′ é fechado
para qualquer S ⊂ X.

Observação 5.1 Topologias com a propriedade de que todo conjunto unitário é fechado são cha-
madas de T1 . Sem esta propriedade, pode ser que S ′ não seja fechado (veja os exercícios 5.29, 5.30
e 5.31 no fim da seção). De qualquer modo, toda topologia que vem de uma métrica é T1 , porque
{x} = B[x, 0] é sempre fechado.

Prova: Devemos mostrar que X\S ′ é aberto. Para isso, vamos mostrar que X\S ′ é uma
união de abertos Ax que definiremos a seguir.
Tome x ∈ X\S ′ , ou seja, um x que não é ponto de acumulação. Tal x está contido em
um aberto Ax ∋ x tal que Ax ∩ S = ∅ ou {x}. Veja que A = ∪x∈X\S ′ Ax é aberto e que
A ⊃ X\S ′ , porque cada x em X\S ′ está no seu “próprio" conjunto Ax .
Para demonstrar que S ′ é fechado, é suficiente mostrar que o aberto A é igual a X\S ′ .
Como já sabemos A ⊃ X\S ′ , basta mostrar que A ⊂ X\S ′ . De fato, como A é a união
dos Ax para x ∈ X\S, basta provarmos que cada um destes conjuntos Ax está contido em
X\S ′ . Ou seja, queremos provar o seguinte:

Afirmação: Dado x ∈ X\S ′ , todo z ∈ Ax pertence a X\S ′ ; ou seja, cada z ∈ Ax não é


ponto de acumulação de S.

Se z = x isso já vale, então suporemos que z ̸= x. Para provar que z não é ponto de
acumulação, temos de achar um aberto Oz ∋ z com Oz ∩ S = ∅ ou {z}.
Ocorre que
Oz := Ax \{x} = Ax ∩ {x}c
funciona. Oz é aberto porque é a interseção dos abertos Ax e {x}c (o conjunto unitário é
fechado por hipótese!). Além disso, z ∈ Oz porque z ∈ Ax e z ∈ {x}c (afinal, z ̸= x). Por
fim, sabemos que Ax ∩ S = ∅ ou Ax ∩ S = {x}, portanto Oz ∩ S = ∅ obrigatoriamente. Ou
seja, provamos que z ∈ Oz aberto e Oz ∩ S = ∅, o que garante que z ̸∈ S ′ . 2

Exercício 5.13 Mostre que N′ = ∅ e Q′ = R (como subconjuntos de R, com a topologia dada pela
métrica usual).

92
5.3 Caracterizações métricas dos conceitos topológicos
A partir de agora, voltamos ao caso particular em que (X, dX ) é espaço métrico e usamos
sobre X a topologia T(X,dX ) que vem da métrica. Sabemos que, neste caso, os conjuntos
fechados podem ser identificados a partir de limites de sequências, ou seja, a partir da
métrica. Agora veremos como podemos fazer isso com os outros conceitos que estudamos.
Proposição 5.6 Dados S ⊂ X aberto, S o é o conjunto dos x ∈ S tais que existe um δ > 0 com
B(x, δ) ⊂ S.
Prova: Como vimos, acima x ∈ S o se e somente se x ∈ A ⊂ S para um aberto A. Por esta
razão, todo ponto x ∈ S que está contido numa bola aberta B(x, δ) ⊂ S com δ > 0 satisfaz
x ∈ S o ; afinal, bolas abertas são abertos. Por outro lado, se x ∈ A ⊂ S com A aberto,
sabemos que existe um δ > 0 com B(x, δ) ⊂ A, de modo que B(x, δ) ⊂ S também. Por
esta razão,
x ∈ B(x, δ) ⊂ S para algum δ > 0 ⇔ x ∈ A ⊂ S para algum A ⊂ S aberto.
Mas o lado direito desta equivalência vale se e somente se
[
x∈ A = S o.
A⊂S aberto

Portanto, qualquer x ∈ X tem uma “bolha protetora" dentro de S se e somente se x ∈ S o ,


o que conclui a prova. 2

olasabertas Exercício 5.14 Prove ainda que A ⊂ X é aberto se e somente se A = ∪B∈B B, onde B é uma
coleção de bolas abertas em X.
Proposição 5.7 Dado S ⊂ X, S é conjunto de pontos que são limites de sequências convergentes
contidas em S.
Prova: Suponha que {xn }n∈N ⊂ S é uma sequência que converge a x ∈ X. Veja que, para
qualquer fechado F ⊃ S,{xn }n∈N ⊂ F e portanto x = limn xn ∈ F . Portanto:
\
∀F ⊃ S fechado, x ∈ F , portanto x ∈ F = S.
F ⊃S fechado

Por outro lado, tome x ∈ S. Pela Proposição 5.4 acima, qualquer aberto contendo x
intersecta S. Em particular, para qualquer δ > 0 tem-se B(x, δ) ∩ S ̸= ∅. Concluímos pelo
exercício 5.5 que x é o limite de uma sequência de pontos em S. 2

Corolário 5.2 ∂S é precisamente o conjunto dos pontos que são limites tanto de sequências em S,
quanto de sequências em S c .
Exercício 5.15 Mostre que S ′ é o conjunto de pontos x ∈ X que são limites de sequências de
pontos em S\{x}.
Exercício 5.16 Se S ̸= ∅, S = {x ∈ X : d(x, S) = 0}.

93
5.4 Continuidade, abertos e fechados
Nosso objetivo nesta seção é apresentar a ideia de continuidade de forma topológica, ao
invés da forma métrica (via limites) que já mostramos acima. Na prova da equivalência a
seguir, veremos ainda uma outra definição métrica de continuidade.
Recorreremos a uma notação que será muito usada no que segue: dados f : X → Y e
S ⊂Y,
f −1 (S) := {x ∈ X : f (x) ∈ S}.

enos1comuta Exercício 5.17 Mostre que, dada uma família A de subconjuntos de Y ,

f −1 (∪A∈A A) = ∪A∈A f −1 (A) e f −1 (∩A∈A A) = ∩A∈A f −1 (A).

Ou seja, f −1 “comuta" com uniões e interseções de conjuntos. Prove ainda que

f −1 (Y \A) = X\f −1 (A).

Teorema 5.3 Sejam (X, dX ) e (Y, dY ) espaços métricos. Dada f : X → Y , as seguintes afirmações
são equivalentes.

1. f é contínua, isto é, se {xn }n ∪ {x} ⊂ X e xn → x (segundo a métrica dX ), então


f (xn ) → f (x) (segundo a métrica dY ).

2. Para qualquer F ⊂ Y fechado em Y , f −1 (F ) ⊂ X é fechado em X.

3. Para qualquer A ⊂ Y aberto, f −1 (A) ⊂ X é aberto.

4. Para todos x ∈ X e ε > 0, existe δ > 0 tal que:

∀x′ ∈ X : “dX (x, x′ ) < δ” ⇒ “dY (f (x), f (x′ )) < ε”.

Prova: Passo 1 ⇒ 2. Tome f contínua e F ⊂ Y fechado. Dada uma sequência conver-


gente {xn }n∈N ⊂ f −1 (F ) com limite x ∈ X, devemos provar que x ∈ f −1 (F ), ou seja, que
f (x) ∈ F . Mas isto é simples, já que f (xn ) → f (x) (por continuidade), {f (xn )}n∈N ⊂ F (já
que xn ∈ f −1 (F ) para cada n) e F é fechado (de modo que o limite de qualquer sequência
convergente em F também está em F ).

Passo 2 ⇒ 3. Vem do exercício anterior à prova juntamente com o fato de que A é aberto
se e somente se X\A é fechado.

Passo 3 ⇒ 4. Fixos ε > 0 e x ∈ X, vamos encontrar o δ desejado. Para fazer isto observe
que a bola BY (f (x), ε) ⊂ Y é um aberto de Y , de modo que (pelo item 3) f −1 (BY (f (x), ε))
é aberto. Como f (x) ∈ BY (f (x), ε), x é um elemento do aberto f −1 (BY (f (x), ε)); pela
definição de aberto, isto implica que ∃δ > 0 tal que BX (x, δ) ∈ f −1 (BY (f (y), ε)). Isto

94
quer dizer que, para todo x′ ∈ B(x, δ) – ou seja, todo x′ ∈ X com dX (x, x′ ) < δ – temos
f (x′ ) ∈ BY (f (x), ε) – ou seja, dY (f (x), f (x′ )) < ε. Em outras palavras, o δ que apresenta-
mos é precisamente o que tínhamos de encontrar.

Passo 4 ⇒ 1. Suponha que xn → x em X; nosso objetivo é provar que limn f (xn ) = f (x),
ou seja, que dado ε > 0 existe um n0 ∈ N tal que dY (f (xn ), f (x)) < ε se n ≥ n0 . Fixemos
então um ε > 0. Pelo item 4 podemos encontrar δ > 0 tal que dX (x′ , x) < δ implica
dY (f (x′ ), f (x)) < ε. Como xn → x, existe n0 ∈ N tal que dX (xn , x) < δ sempre que n ≥ n0 .
Mas então temos dY (f (xn ), f (x)) < ε sempre que n ≥ n0 . Ou seja, este n0 assegura a
propriedade desejada. 2
Uma observação crucial sobre o teorema acima é que os itens 2 e 3 só dizem respeito
às propriedades topológicas de X e Y . Deste modo, temos uma definição natural de
continuidade entre espaços topológicos.

Definição 5.5 Uma função f : X → Y entre espaços topológicos (X, TX ) e (Y, TY ) é dita contínua
se ela satisfaz alguma das propriedades (equivalentes) abaixo:

2’. Dado um aberto AY ⊂ Y do espaço Y , f −1 (AY ) é aberto de X;

3’. Dado um fechado FY ⊂ Y do espaço Y , f −1 (FY ) é fechado de X.

Embora este não seja nosso foco, usaremos esta definição em diversos pontos do texto.

Exercício 5.18 A definição acima fala da continuidade de f em todos os pontos do domínio X.


Neste exercício, mostraremos que a continuidade de f num ponto específico também tem uma ex-
pressão topológica. Mais especificamente, dados espaços métricos (X, dX ) e (Y, dY ), mostre que
f : X → Y é contínua em x0 ∈ X se e somente se vale a qualquer propriedade:

(P) Dada qualquer vizinhança aberta Bf′ (x) de f (x) em Y , existe uma vizinhança Bx de x em X
com f −1 (Bf′ (x) ) ⊃ Bx (ou f (Bx ) ⊂ f (Bf′ (x) )).

Deste modo, (P) pode ser tomada como a definição de continuidade num ponto para funções
entre espaços topológicos arbitrários.

5.5 Topologia relativa


O resultado acima sobre continuidade só serve para o caso em que o domínio D da função
f é todo o espaço X. Mas e se D ⊂ X é um subconjunto próprio e f : D → Y ? Não é difícil
ver o que acontece: se usamos sobre D a métrica induzida por X, então continuidade é
equivalente à seguinte condição:

∀A ⊂ Y aberto, f −1 (A) ⊂ D é aberto na métrica induzida.

95
Isso suscita a pergunta: como sabemos se um dado subconjunto U ⊂ D é aberto na
métrica induzida? Isto também não é difícil de deduzir. Veja que

U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BD (x, r) ⊂ U,

e ainda

BD (x, r) = {y ∈ D : dD (x, y) < r}


= {y ∈ X : y ∈ D e dX (x, y) < r}
= BX (x, r) ∩ D.

Ou seja
U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BX (x, r) ∩ D ⊂ U.
Isto nos leva naturalmente à definição de topologia induzida. Note que ela não tem
nada a ver com a de métrica, em princípio.

Definição 5.6 Considere um conjunto X ̸= ∅ munido de uma topologia TX . Dado D ⊂ X, a


topologia TD induzida por TX é definida como:

TD := {A ∩ D : A ∈ TX }.

Ou seja, U ∈ TD se existe um aberto A de X com U = A ∩ D.

Não é difícil provar que TD é mesmo uma topologia: a ideia é só mostrar que a união
e a interseção de conjuntos da forma A ∩ D é ela própria desta forma.

Teorema 5.4 Considere (X, dX ). Dote D ⊂ X da métrica dD induzida por X. Considere as


topologias TdX e TdD induzidas pelas métricas de X e D, respectivamente. Então TdD é a topologia
induzida por TdX sobre D.

Prova: O que temos que provar é que:

U ⊂ D é aberto de D ⇔ ∃A ⊂ X aberto de X com U = A ∩ D.

Começamos a prova pela direção “⇒". Como observamos acima, U é aberto de D quando
para cada x ∈ U existe um raio rx > 0 tal que B(x, rx ) ∩ D ⊂ U . Se definimos

A := ∪x∈U B(x, rx ),

vemos imediatamente que A é aberto, posto que é uma união de abertos. Afirmamos que
A ∩ D = U e provaremos isso mostrando A ∩ D ⊂ U e U ⊂ A ∩ D. De um lado, temos a
inclusão
A ∩ D = ∪x∈U (B(x, rx ) ∩ D) ⊂ U
por conta do fato que B(x, rx )∩D ⊂ U para cada x ∈ U . Por outro lado, cada x ∈ U pertence
a B(x, rx ) ∩ D: isto quer dizer que todo x ∈ U pertence à união ∪x∈U (B(x, rx ) ∩ D) = A ∩ D,

96
o que nos diz U ⊂ A ∩ D e termina a prova de que U = A ∩ D. Ou seja, dado U ⊂ D
aberto, encontramos A ⊂ X aberto de X com U = A ∩ D. Isto termina a prova da direção
“⇒".
Tratemos agora da direção “⇐". Suponha que U = A ∩ D com A ⊂ X aberto de X.
Dado x ∈ X, devemos encontrar rx > 0 tal que BD (x, rx ) = BX (x, rx ) ∩ D ⊂ U = A ∩ D.
Mas para isto é evidente que basta pedir BX (x, rx ) ⊂ A, o que é possível (com algum
rx > 0) exatamente porque A é aberto em X. 2
Observamos o seguinte corolário dos resultados acima.

Corolário 5.3 Se D ⊂ X é aberto de X, então A ⊂ D é aberto na topologia relativa se e somente


se é aberto na topologia de X. O mesmo vale se trocamos “aberto" por “fechado".

Prova: Faremos a prova apenas no caso de D aberto. Sabemos que, para que A ⊂ D seja
aberto de D, é necessário e suficiente que exista B ⊂ X aberto de X com A = B ∩ D.
Em particular, se D é aberto e tal B existe, o conjunto A é a interseção de dois abertos;
portanto, ele próprio é aberto.
Por outro lado, se A é aberto de X, podemos escrever A = A ∩ D; ou seja, A e a
interseção de um aberto de X com D, sendo portanto um aberto da topologia relativa. 2

Exercício 5.19 Dado um espaço métrico (X, dX ), um subconjunto S ⊂ X é dito separado se


inf s′ ∈S\{s} dX (s, s′ ) > 0 para qualquer s ∈ S. Mostre que S é separado se e somente se a topologia
induzida por T(X,dX ) em S é a topologia fina (aquela em que qualquer conjunto é aberto).

5.6 Mais exercícios


ex:fechado Exercício 5.20 Dado (X, dX ), mostre que F ⊂ X é fechado se e somente se existem um subconjunto
Γ ⊂ R que é fechado em R e uma função contínua f : X → R tal que F = f −1 (Γ). Deduza um
análogo deste resultado para conjuntos abertos A ⊂ X.

ex:LSC Exercício 5.21 Dado (X, dX ), uma função f : X → R é semicontínua por baixo se

∀{xn }n∈N ⊂ X : xn → x ∈ X ⇒ lim inf f (xn ) ≥ f (x).


n∈N

Ou seja, f é semicontínua por baixo se não pode ter uma “salto para cima no limite". Mostre que,
para qualquer f : X → R,

f é semicontínua por baixo ⇔ ∀t ∈ R, f −1 ((−∞, t]) é fechado de X.

eq:Zariski Exercício 5.22 (Topologia de Zariski) Neste exercício, apresentamos a “topologia de Zariski
afim" sobre Rd . Ela é prima da “topologia de Zariski projetiva", que é extremente importante em
Geometria Algébrica.
Dado um conjunto S de polinômios multivariados p : Rd → R, chamamos de variedade de S o
conjunto V(S) := {x ∈ Rd : ∀p ∈ S, p(x) = 0} (se S = ∅, tomamos V(S) = Rd por definição).

97
Um subconjunto A ⊂ Rd é (por definição) um aberto de Zariski se A = Rd \V(S) para algum S
como acima. Mostre que os abertos de Zariski formam uma topologia sobre Rd . Mostre ainda que
todo aberto de Zariski é aberto no sentido usual.

totopologia Exercício 5.23 Considere um espaço-produto X = X1 × · · · × Xd com uma das métricas-produto


dX definidas no Exercício 3.11 acima.

1. Para cada i = 1, . . . , d, tome um subconjunto aberto Ai ⊂ Xi . Prove que A1 × A2 × · · · × Ad


é aberto.

2. Mostre que um subconjunto A ⊂ X é aberto se e somente se ele pode ser escrito como a união
de conjuntos A1 × · · · × Ad , onde cada Ai é aberto do Xi correspondente.

Exercício 5.24 Fixe um espaço métrico (X, dX ). Tome alguma métrica produto sobre X × R.
Dada f : X → R, chamamos de gráfico de f o conjunto

gr(f ) := {(x, f (x)) : x ∈ X} ⊂ X × R

e de epígrafo de f o seguinte conjunto

epi(f ) := {(x, t) : (x, t) ∈ X × R, t ≥ f (x)}.

1. Prove que, se f é contínua, então gr(f ) é fechado. A recíproca vale?

2. Prove que, se f é semicontínua por baixo (como definimos no exercício 5.21), epi(f ) é fechado.
A recíproca vale?

letofechado Exercício 5.25 Suponha que (X, dX ) é completo e F ⊂ X. Mostre que F é fechado em X se e
somente se (F, dF ) é completo, onde dF é a métrica induzida por (X, dX ).

x:perfeito1 Exercício 5.26 Dê um exemplo de espaço métrico (X, dX ) onde X ′ = ∅.

chsubespaco Exercício 5.27 Considere um espaço de Banach (V, ∥ · ∥V ). Como já vimos, um subespaço de V
é um subconjunto W ⊂ V contendo 0V e fechado pelas operações de espaço vetorial (isto é, para
quaisquer w, w′ ∈ W e λ ∈ R, λ w + w′ ∈ W ).

1. Mostre que o fecho de um subespaço de V também é um subespaço de V .

2. Prove que todo subespaço de V = Rd é fechado.

3. Ache um subespaço de C([0, 1], R) que não é fechado (portanto, o item anterior não se estende
para qualquer V Banach).

4. Mostre que o interior de um subespaço W ̸= V é vazio.

5. Fixo 0 ≤ ρ < 1, prove que um subespaço fechado W ⊂ V satisfaz W = V se e somente se ele


tem a seguinte propriedade: dado qualquer v ∈ V , existe um w ∈ W com ∥v−w∥V ≤ ρ∥v∥V .

98
Exercício 5.28 Considere as duas definições abaixo de separabilidade.

• Um espaço métrico (X, dX ) é separável se possui um subconjunto enumerável denso; isto é,


se existe D ⊂ Rd enumerável tal que D = X.

• Um espaço topológico (X, TX ) é separável se existe um subconjunto enumerável B ⊂ TX


(chamado de base enumerável da topologia) tal que qualquer aberto A ∈ TX pode ser escrito
como uma união de elementos de B.

Prove que o espaço métrico (X, dX ) é separável (de acordo com a primeira definição) se e somente
se o espaço topológico correspondente (X, T(X,dX ) ) é separável (de acordo com a segunda definição).
Deduza que Rd e C(I, R) são espaços topológicos separáveis com suas topologias usuais.

ex:derivado Exercício 5.29 Suponha que X tem pelo menos dois elementos e usamos a topologia grossa sobre
ele. Mostre que {x}′ = X\{x} não é fechado para qualquer x ∈ X. Ou seja, há exemplos simples
de topologias em que conjuntos derivados não são necessariamente fechados.

x:derivado2 Exercício 5.30 A topologia grossa é um tanto quanto patológica. Uma propriedade simples adici-
onal que pode se pedir de uma topologia é que ela seja T0 :

Propriedade T0 : dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem


exatamente um destes pontos.

Esta propriedade é sutilmente diferente da T1 descrita acima, que é equivalente à propriedade abaixo:

Propriedade T1 : dados dois pontos distintos x, x′ ∈ X, há um aberto A ⊂ X que contem


x′ e não x (e vice-versa).

Prove que esta formulação da propriedade T1 é equivalente à que vimos acima (todo conjunto unitário
é fechado).

x:derivado3 Exercício 5.31 Neste exercício, apresentamos uma topologia T0 não-padrão (de acordo com a
definição do exercício anterior) no espaço X = [−1, 1] para a qual {0}′ não é fechado. Definimos:

TX := {A ⊂ X : ∃t > 0, A ⊃ (−t, t)} ∪ {∅}.

1. Mostre que TX é de fato uma topologia sobre X.

2. Mostre que TX tem a propriedade T0 , mas não tem a propriedade T1 (de fato, {0} não é
fechado).

3. Calcule {0}′ e mostre que ele não é fechado segundo TX .

deMinkowski Exercício 5.32 Dados um espaço de Banach (V, ∥ · ∥V ) e subconjuntos A, B ⊂ V , a soma de


Minkowski de A e B é definida por:

A + B := {a + b : (a, b) ∈ A × B}.

99
1. Prove que, A = BV [xA , rA ] e B = BV [xB , rB ] (com xA , xB ∈ V e rA , rB > 0), então
A + B = BV [xA + xB , rA + rB ];

2. Mostre que, se um dentre A e B é aberto, então A + B é aberto;

3. Dê um exemplo em que V = R2 , A e B são ambos fechados, mas A+B não é fechado.

:fechoetudo Exercício 5.33 Encontre os fechos, interiores e conjuntos de acumulação de cada um dos subcon-
juntos abaixo de C = C([0, 1], R) (com a métrica usual).

D := {f ∈ C : ∃f ′ };
Mk := {f ∈ C : ∀i = 1, 2, . . . , k, f (1/i) < 1/i} (onde k ∈ N\{0}).

x:perfeito2 Exercício 5.34 Um espaço métrico (X, dX ) é perfeito se X ′ = X.

1. Prove que Rd é perfeito.

2. Prove que qualquer espaço métrico perfeito e completo não pode ser enumerável. (Em parti-
cular, um subconjunto S ̸= ∅ fechado e perfeito de um (X, dX ) completo não é enumerável.)

100
Capítulo 6

Compactos: teoria geral


ap:compacto
Muitos problemas em Matemática Pura e Aplicada podem ser postos na forma de proble-
mas de minimização de funções sobre conjuntos.
Dado um conjunto S e uma função f : S → R, encontre s∗ ∈ S tal que f (s∗ ) ≤ f (s)
para todo s ∈ S.
São exemplos de problemas deste tipo: achar o mínimo de uma função f : U ⊂ Rd → R;
de achar a curva de menor comprimento ligando dois pontos em uma superfície; e achar
uma superfície de área mínima para um contorno dado. Note que nem todo problema
desta forma tem solução. Por exemplo, a função f (x) = −1/x não atinge um valor mínimo
no domínio S = (0, +∞).
Como veremos abaixo, espaços compactos têm a propriedade de que toda função contí-
nua atinge seu ínfimo e seu supremo. Nossa discussão deste conceito começa na Topologia
Geral, de maneira bem abstrata. Depois, veremos que, no caso métrico, essa definição tem
várias reformulações interessantes. No Teorema 6.2, veremos algumas versões equivalen-
tes para ele. De fato, veremos que cada uma das condições abaixo (em forma mais precisa) é
equivalente a pedir que (X, dX ) seja compacto:
1. toda função contínua de X em R atinge seu ínfimo e seu supremo;
2. toda função contínua de X em R é limitada;
3. o espaço não tem buracos e é bem aproximado por subconjuntos finitos, a menos de
um erro ε arbitrariamente pequeno;
4. toda sequência em X tem subsequência convergente.
Outros teoremas serão provados mostrando propriedades boas de compactos; por
exemplo, toda função contínua sobre um compacto é uniformemente contínua.
Um ponto interessante é que, na lista acima, condições 1 e 2 falam de funções contínuas
e as 3 e 4 são “geométricas". Entender a relação entre comportamento de funções e “geo-
metria" do espaço um problema fundamental. Como veremos, o estudo da conexidade é
outro exemplo nesta categoria.

101
6.1 Compactos do ponto de vista de Topologia Geral
A definição de um espaço compacto usando apenas Topologia é um tanto quanto abstrata.
Mesmo assim, veremos que ela serve para provar alguns resultados interessantes.
Definição 6.1 Um espaço topológico (X, T ) é dito compacto se, dada qualquer coleção de abertos
A ⊂ T com X = ∪A∈A A, então existe uma subcoleção B ⊂ A, com B finito, tal que X = ∪A∈B A.
Um subconjunto K ⊂ X é dito compacto se é compacto com a topologia induzida, isto é, dada
qualquer coleção de abertos A ⊂ T com K ⊂ ∪A∈A A, então existe uma subcoleção F ⊂ B, com B
finito, tal que X ⊂ ∪B∈B B.
É bom explicarmos brevemente o “isto é" acima. Lembre que os abertos de K são os
conjuntos da forma A e = A ∩ K com A ⊂ X aberto. Uma coleção de abertos Ae de K é,
portanto, uma coleção de conjuntos com a forma Ae := {A ∩ X : A ∈ A}, onde A é uma
coleção de abertos de X. Usando as regras de De Morgan, obtemos:
!
[ [ [
A
e= (A ∩ K) = A ∩ K.
e A
A∈ e A∈A A∈A

Portanto, [ [
K= e⇔K ⊂
A A.
e A
A∈ e A∈A

Do mesmo modo, uma subcoleção finita Be ⊂ Ae de abertos de K cobre K se e somente


se a subcoleção finita B ⊂ A correspondente de abertos de X satisfaz K ⊂ ∪A∈B A.
Normalmente a definição de compacto é resumida dizendo-se o seguinte: um conjunto
é compacto se qualquer cobertura dele por abertos tem uma subcobertura finita. Será útil
termos uma forma equivalente dessa definição que envolve conjuntos fechados.
Proposição 6.1 Um espaço topológico (X, T ) é compacto se e somente se ele tem a chamada
"propriedade da interseção fechada", que é a seguinte: dada qualquer coleção F de fechados de X,
∩F ∈F F = ∅ se e somente se existe uma subcoleção finita G ⊂ F com ∩F ∈G F = ∅.
Prova: Este é mais um daqueles argumentos em que usamos o fato de que os complemen-
tares de fechados são abertos e o complementar de uma união é uma interseção.
Vejamos. Dada uma coleção de fechados F, temos uma coleção de abertos A feita
pelos complementares dos elementos de F. Do mesmo modo, podemos passar de uma
coleção de abertos A para uma coleção de fechados F.
Agora observe que:
\ \ [
F =∅⇔( F )c = F c = ∅c = X.
F ∈F F ∈F F ∈F

Ou seja, \ [
F =∅⇔ A = X;
F ∈F A∈A

102
ou ainda, dizendo de outro modo, uma coleção de fechados tem interseção vazia se e
somente se a coleção de abertos correspondente cobre X.
Do mesmo modo, existe um G ⊂ F finito com ∩F ∈G F = ∅ se e somente se existe uma
subcoleção B ⊂ A, formada pelos complementares dos elementos de G, tal que
!c
[ [ \
A= Fc = F = ∅c = X.
A∈B F ∈G F ∈G

Ou seja, subfamílias finitas de F que têm interseção vazia correspondem exatamente às


subcoberturas finitas de X.
Com o que já fizemos, a prova da equivalência fica direta. 2
A propriedade da interseção finita nos dá um bom critério para determinarmos que
um espaço não é compacto. Eis alguns exemplos disso.

naocompacto Exemplo 6.1 (R não é compacto) A reta não é compacta com sua topologia usual. Para ver isso,
notem que os intervalos da forma (−∞, t], com t ∈ R são uma coleção de fechados com interseção
vazia. Ao mesmo tempo, dados t1 , . . . , tk ∈ R,
k
\
(−∞, ti ] = (−∞, min ti ] ̸= ∅.
1≤i≤k
i=1

Exercício 6.1 Prove que forma análoga que Rd e C([0, 1], R) não são compactos com suas topologias
usuais.

aocompactos Exemplo 6.2 (Intervalos abertos e semiabertos não são compactos) Considere agora um sub-
conjunto S da reta da forma S = (a, b] ou S = (a, b), com a < b reais. Use em S a topologia
induzida pela tradicional em R. Veja que a coleção:
F := {(a, t] : t ∈ (a, b)}
é uma coleção de fechados de S na topologia relativa ((a, t] = (−∞, t]∩S). Seguindo o raciocínio do
exercícios anterior, vê-se que ∩F ∈F F = ∅, mas qualquer subcoleção finita tem interseção não-vazia.

Uma tarefa mais difícil será provar que um espaço topológico é, sim, compacto. Não
trataremos disso nesta seara de espaços topológicos, com a exceção do exemplo abaixo.

Exercício 6.2 Considere a topologia discreta (ou "fina") sobre um X ̸= ∅ em que todos os subcon-
juntos são abertos. Mostre que X é compacto com esta topologia se e somente se ele é finito.

O principal resultado sobre conjuntos compactos nesta seção é o Teorema 6.1 abaixo,
que diz que funções reais contínuas sobre compactos sempre atingem seus ínfimos. Antes
dele, no entanto, há outras coisas interessantes para provar, que são um tanto quanto mais
fáceis. Vamos a elas.
O primeiro desses resultados mais diretos nos diz que "fechado em compacto também
é compacto".

103
Proposição 6.2 Um subconjunto fechado de um espaço topológico compacto é compacto.

Prova: De fato, seja (X, T ) compacto e considere F ⊂ X fechado.


Se F ⊂ ∪A∈A A, onde A é uma coleção de abertos de X, então à := A ∪ {F c } é uma
coleção de abertos que cobre todo X; afinal, todo ponto de X ou está em F , e é coberto
por A, ou não está em F , e é coberto por F c .
Como (X, T ) é compacto, Ã tem uma subcobertura finita B̃. Tomando B := B̃\{F c },
temos uma subcoleção de A que cobre F . 2
O próximo resultado fala que "a imagem de um compacto por uma função contínua é
sempre um compacto".

Proposição 6.3 Considere dois espaços topológicos (X, TX ) e (Z, TZ ). Se (X, TX ) é compacto e
f : X → Z é contínua, então a imagem de f , f (X) ⊂ Z, é compacta.

Prova: Suponha que X Z e f são como acima. Tome uma cobertura A qualquer de f (X)
por abertos de Z: isto é, f (X) ⊂ ∪A∈A A. Mostraremos que A tem uma subcobertura finita
usando a seguinte afirmação.

Afirmação: {f −1 (A) : A ∈ A} é cobertura de X por abertos.


De fato, como f é contínua, cada conjunto f −1 (A) com A ∈ A é abertos de X. Além
disso, para cada x ∈ X, f (x) ∈ f (Z) ⊂ ∪A∈A A e portanto existe um A ∈ A com f (x) ∈ A,
o que é o mesmo que dizer x ∈ f −1 (A). Deduzimos que cada f −1 (A) é aberto e cada
elemento de X pertence a pelo menos um dos conjuntos f −1 (A), o que prova a afirmação.
Por hipótese, X é compacto. Logo, existe uma subcoleção finita B ⊂ A com X =
∪A∈B f −1 (A). Mas note que f (X) ⊂ ∪A∈B A porque, dado z = f (x) ∈ f (X), existe um
A ∈ B com x ∈ f −1 (A) e z = f (x) ∈ A. Logo, B é uma subcobertura finita de Z. 2
Agora, sim, mostraremos que toda função contínua sobre um espaço topológico atinge
seu ínfimo.

continuatop Teorema 6.1 Se (X, T ) é um espaço métrico compacto, então, dada uma função contínua f :
X → R, existe um x⋆ ∈ X com f (x⋆ ) = inf x∈X f (x). Em particular, inf x∈X f (x) > −∞.

Exercício 6.3 Prove que o supremo de f também é atingido.

Prova: Na verdade, nossa prova mostra que toda função semicontínua por baixo atinge o
ínfimo. Por definição, uma f : X → R é semicontínua por baixo se, dado qualquer t ∈ R,
o conjunto
Ft := f −1 ((−∞, t])
é fechado (veja o exercício 5.21 acima para uma caracterização equivalente). Como (−∞, t]
é fechado de R, toda função contínua de X em R é semicontínua por baixo.
Em toda prova, faremos referência ao ínfimo de f : inf x∈X f (x). Isso pode parecer
suspeito, pois ainda não temos como garantir que os valores de f são mesmo limitados

104
por baixo. A verdade é que isso não importa. Admitimos que, em princípio, seria possível
que inf x∈X f (x) = −∞. Nada do que dizemos abaixo é afetado por essa possibilidade,
que será finalmente afastada no fim da prova.
Vamos, então, fazer uma afirmação envolvendo o ínfimo, que diz respeito aos conjuntos
Ft .
Ft ̸= ∅ para qualquer t > inf f (x). (6.1) eq:Ftnaovaz
x∈X

Afinal, se t > inf x∈X f (x), t não é cota inferior para os valores de f e há pelo menos um
xt ∈ X com f (xt ) ≤ t, o que quer dizer xt ∈ f −1 ((−∞, t]) = Ft .
Feita essaa afirmação, vem um passo crucial: a observação de que

\
(⋆) Ft = {x⋆ ∈ X : f (x⋆ ) = inf f (x)}.
x∈X
t>inf x∈X f (x)

Na verdade, vale igualdade acima. Aqui dizemos que, se a interseção do lado esquerdo não for
vazia, o ínfimo de f é atingido.
Para provar a igualdade (⋆), observe primeiro que, se há de fato um x⋆ atingindo o
ínfimo, ele está na interseção do lado esquerdo. Por outro lado, se x⋆ está na interseção,
sabemos que f (x⋆ ) ≥ inf x∈X f (x) (o ínfimo é cota inferior para todo mundo) e

∀t ∈ R : t > inf f (x) ⇒ x⋆ ∈ Ft ⇒ f (x⋆ ) ≤ t.


x∈X

Isto quer dizer:

∀t ∈ R : t > inf f (x) ⇒ inf f (x) ≤ f (x⋆ ) ≤ t, ou seja, f (x⋆ ) = inf f (x).
x∈X x∈X x∈X

Note que provamos (⋆) sem supôr a priori que inf x∈X f (x) > −∞!
ResultaTde (⋆) que a existência de um ponto x⋆ ∈ X atingindo o ínfimo de f é equi-
valente a t>inf x∈X f (x) Ft ̸= ∅. Para provar que a interseção não é vazia, usaremos a
propriedade da interseção finita. Em forma contrapositiva, essa propriedade nos diz que,
se todas as subcoleções finitas dos Ft com t > inf x∈X f (x) não têm interseção vazia, o
mesmo vale para a interseção de toda a coleção.
Tome, então, uma coleção finita dos Ft : Ft1 , . . . , Ftk , com cada ti > inf x∈X f (x). Que-
remos demonstrar que a interseção destes conjuntos não é vazia. Para isso, voltamos ao
Exemplo 6.1, sabemos que
k
\
(−∞, ti ] = (−∞, min ti ]
1≤i≤k
i=1

105
e portanto
k
\ k
\
Fti = f −1 ((−∞, ti ])
i=1 i=1
k
!
\
= f −1 (−∞, ti ]
 i=1 
−1
= f (−∞, min ti ]
1≤i≤k

= Fmin1≤i≤k ti .

Como cada ti > inf x∈X f (x), min1≤i≤k ti > inf x∈X f (x) também e (6.1) implica que Fmin1≤i≤k ti ̸=
∅, como queríamos demonstrar.
Terminamos recapitulando a prova de trás para frente. Acabamos de mostrar toda
subcoleção finita dos Ft com t > inf x∈X f (x) tem interseção não-vazia. TComo os Ft são
fechados e X é compacto, a propriedade da interseção finita implica que t>inf x∈X f (x) Ft ̸=
∅. Portanto, a identidade (⋆) garante que há pelo menos um ponto x⋆ em que f atinge o
ínfimo. 2

6.2 Espaços métricos compactos: o grande teorema de equi-


valência
A partir de agora, vamos nos restringir a espaços métricos, sempre usando a topologia
métrica. Nosso principal resultado será uma série de equivalências descritas no próximo
teorema.

uivcompacto Teorema 6.2 Dado um espaço métrico (K, dK ) com a topologia T(K,dK ) dada pela métrica, as
seguintes afirmações são equivalentes.

1. (K, T(K,dK ) ) é compacto;

2. para qualquer função contínua f : K → R, existem x− , x+ ∈ K com inf x∈K f (x) = f (x− )
e supx∈K f (x) = f (x+ );

3. toda função contínua f : K → R é limitada por cima e por baixo, isto é, −∞ < inf x∈K f (x) ≤
supx∈K f (x) < +∞;

4. (K, dK ) é um espaço métrico completo e totalmente limitado (isto quer dizer que, dado um
ε > 0 qualquer, K pode ser coberto por um número finito de bolas de raio ε);

5. (K, dK ) é sequencialmente compacto, isto é, toda sequência {xn }n∈N ⊂ K tem uma sub-
sequência convergente {xnk }k∈N com limite x ∈ K;

106
Note que aqui supomos que nosso interesse é saber se um espaço métrico "inteiro" é
compacto. Na próxima seção, especializamos esse teorema para o caso de subconjuntos
K ⊂ X e teremos de falar da topologia induzida.
A prova do Teorema 6.2 será trabalho pra várias subseções. No entanto, algumas
etapas são bastante simples e podemos apresentá-las aqui.

ca3compacto Proposição 6.4 Considere um espaço métrico (K, dK ) que tem a propriedade 2 do Teorema 6.2.
Então ele também tem a propriedade 3 do mesmo teorema.

Prova: Suponha que K satisfaz o item 2, tome f : K → R e defina m± = f (x± ) como no dito
item. Como f tem valores reais, m− , m+ ∈ R. Além disso, sabemos que m− = inf x∈K f (x)
e m+ = supx∈K f (x). Portanto, f (K) ⊂ [m− , m+ ] e f é limitada. 2
O próximo resultado normalmente é provado (num caso particular) em cursos de
Análise na Reta.

ca2compacto Proposição 6.5 Considere um espaço métrico (K, dK ) que tem a propriedade 5 do Teorema 6.2.
Então ele também tem a propriedade 2 do mesmo teorema.

Prova: Supondo a propriedade 5, mostraremos que vale a 2. Mais precisamente, mostra-


remos que existe um ponto em que f atinge seu ínfimo; a prova para o supremo é análoga
(ou então você pode achar o ponto em que −f atinge o ínfimo, o que é o mesmo que o
ponto em que f atinge o supremo).
Tome m− := inf x∈K f (x). Em princípio, pode ser que m− ∈ R ou m− = −∞. De um
modo ou de outro, é possível achar uma sequência de números reais {mn }n∈N ⊂ R, todos
estritamente maiores que m− , mas escolhidos de modo que mn → m− .
Para cada n, temos então que mn > m− = inf x∈X f (x): por esta razão, existe um xn ∈ K
com m− ≤ f (xn ) ≤ mn . Usando a propriedade 5, podemos escolher uma subsequência
{xnk }k∈N com xnk → x− ∈ K. Note que também temos mnk → m− já que {mnk }k∈N
é subsequência de uma sequência que converge a m− . Como f é contínua, temos que
f (xnk ) → f (x− ); mas então

m− ≤ f (x− ) = lim f (xnk ) ≤ lim mnk = m− .


k→+∞ k→+∞

Concluímos que f (x− ) = m− , isto é, x− atinge o ínfimo de f sobre K. 2


Cumpridos esses passos simples, partimos para a tarefa mais complicada que é provar
todos os demais itens do Teorema 6.2. Um roteiro para a prova é dado logo a seguir.

6.2.1 Roteiro da prova


uivcompacto
Fixe um espaço métrico (K, dK ). Acima provamos vimos acima que 1 ⇒ 2 (Teorema 6.1)
e 2 ⇒ 3 (Proposição 6.4). Vimos ainda que 5 ⇒ 2 (Proposição 6.5).

107
Como próximos passos, veremos que um espaço métrico onde toda função contínua
é limitada tem de ser completo (§6.2.2) e totalmente limitado (§6.2.3). Juntas, essas duas
provas mostram 3 ⇒ 4 no Teorema.
Depois, mostraremos no §6.2.4 que um espaço métrico completo e totalmente limitado
é sequencialmente compacto; isto é a implicação 4 ⇒ 5 no Teorema.
Neste ponto da prova, já saberemos que 1 ⇒ 2 e que 2 ⇒ 3 ⇒ 4 ⇒ 5 ⇒ 2. Portanto, 2
a 5 são equivalentes e uma forma de terminar a prova é mostrar que estas propriedades
juntas implicam 1. É isso que será feito no §6.2.5, onde a prova será encerrada.

6.2.2 Compactos são completos


ctocompleto
Começamos com o fato de que todo compacto é completo do ponto de vista métrico. Isto
é um pedaço da prova que 3 ⇒ 4 no Teorema 6.2.
ctocompleto Lema 6.1 Qualquer espaço métrico compacto (K, dK ) tal que funções contínuas de K em R são
limitadas é um espaço métrico completo.
Prova: Vamos provar que se K não é completo, então há uma função contínua de K em R sem
cota inferior.
Suponha que K não é completo: existe {xn }n∈N ⊂ K que é Cauchy, mas não converge
a qualquer elemento em K. O Exemplo 4.3 acima mostra que
g(x) := lim dK (x, xn ) (x ∈ K)
n∈N

é contínua. Veja que


g(xm ) = lim dK (xm , xn ) ≤ sup dK (xn , xm ) → 0 quando m → +∞
n∈N n≥m

porque {xn }n é Cauchy. Logo g(xm ) → 0 quando m cresce. Por outro lado, g(x) > 0 para
todo x porque, se não, dK (x, xn ) → 0 e x seria o limite de xn , que supomos não existir.
Portanto a imagem de g está contida em (0, +∞). Como a função x 7→ −1/x é contínua
sobre (0, +∞), deduzimos que
1 1
f (x) := − =−
limn dK (xn , x) g(x)
é contínua e f (xm ) → +∞ quando m → +∞, de modo que f não tem cota inferior. Segue
que K não é compacto. 2

6.2.3 Cobertura, empacotamento e limitação total


sub:totlim
Agora consideramos o conceito de "totalmente limitado" que apresentamos no item 4 do
Teorema 6.2. Antes disso, definimos os números de ε-cobertura e empacotamento de um
subconjunto de um espaço métrico. É conveniente enunciar essas definições no caso de
subconjuntos de um espaço métrico maior.

108
Definição 6.2 Fixe um espaço métrico (X, dX ). Dado um subconjunto K ⊂ X, dizemos que
um subconjunto R ⊂ K é uma ε-rede para K se para qualquer x ∈ K existe um x′ ∈ R com
dX (x, x′ ) ≤ ε. Chamamos de número de ε-cobertura de K, N (K, ε), o menor n ∈ N ∪ {+∞}
tal que K possui uma ε-rede com n elementos. K é dito totalmente limitado se N (K, ε) < +∞
para todo ε > 0.
Uma maneira de pensar na definição de "totalmente limitado" é a seguinte. Uma ε-rede
é uma "discretização"para K em que todo ponto é representado com "precisão"ε. Portanto,
K é totalmente limitado se e somente se, para qualquer precisão escolhida, ele tem uma
discretização finita com esta precisão.
Antes de seguir, notamos o seguinte fato.
Exercício 6.4 N (K, ε) ≤ n se e somente se existem x1 , . . . , xn ∈ K com K ⊂ ∪ni=1 BX [xi , ε]. (Se
K = X, então o contenimento se transforma em K = ∪ni=1 BK [xi , ε].)
Os números de empacotamento são uma espécie de "dual"dos números de cobertura.
Isso ficará claro quando apresentarmos a proposição a seguir.
Definição 6.3 Fixe um espaço métrico (X, dX ). Dado um subconjunto K ⊂ X, dizemos que um
Q ⊂ K é um δ-empacotamento em K (com δ > 0) se quaisquer x, x′ ∈ Q com x ̸= x′ satisfazem
dX (x, x′ ) > δ. Chamamos de número de δ-empacotamento de K, P (K, δ), o supremo sobre
todos os n ∈ N tais que K possui um δ-empacotamento com n elementos.
Proposição 6.6 Usando a notação acima, as desigualdades abaixo valem para quaisquer K ⊂ X
e ε > 0:
N (K, ε) ≤ P (K, ε) ≤ N (K, ε/2).
(Em particular, K é totalmente limitado se e somente se P (K, ε) < +∞ para todo ε > 0.)
Prova: Vamos começar mostrando que P (K, ε) ≤ N (K, ε/2).. Para isso, basta supor que
N (K, ε/2) = m ∈ N, pois o caso N (K, ε/2) = ∞ é trivial. Considere, então, uma ε/2-
rede x1 , . . . , xm em K. Isto quer dizer que K é coberto pelas m bolas BX [xi , ε/2]. Afirmo
que um ε-empacotamento em K não pode conter mais do que um elemento em cada
uma dessas bolas; afinal, quaisquer dois elementos q, q ′ ∈ BX [xi , ε/2], então dX (q, q ′ ) ≤
dX (q, xi ) + dX (q ′ , xi ) ≤ ε. Da afirmação conclui-se que qualquer ε-empacotamento em K
tem no máximo m elementos, o que demonstra P (K, ε) ≤ m.
Agora provamos que N (K, ε) ≤ P (K, ε). Se P (K, ε) = +∞, não há o que mostrar.
Em caso contrário, P (K, ε) = k ∈ N e pode-se tomar um empacotamento Q ⊂ K com
k elementos. Mostraremos que Q também é uma ε-rede para K, o que mostra que
N (K, ε) ≤ k.
Para mostrar que Q é uma ε-rede, tomamos um x ∈ K arbirtrário e mostramos que
existe um q ∈ Q com dX (x, q) ≤ ε. Isso é trivial se x ∈ Q, portanto suporemos x ̸∈ Q.
Neste caso, o conjunto Q ∪ {x} tem mais elementos que Q. A cardinalidade de Q é o
tamanho do maior ε-empacotamento em K. Sendo assim, Q ∪ {x} não é ε-empacotamento.
Portanto, há dois elementos distintos q1 , q2 ∈ Q∪{x} a distância no máximo ε um do outro.
Como Q é ε-empacotamento, não pode ser verdade que q1 , q2 ∈ Q: um dos dois tem de ser
x e o outro, um q ∈ Q. Logo, dX (x, q) ≤ ε para este q, como queríamos demonstrar. 2

109
Um último fato sobre conjuntos que não são totalmente limitados será importante a
seguir. Note que, se K não é totalmente limitado, então há δ-empacotamentos em K
com tamanho finito, mas arbitrariamente grande. Abaixo vemos que há, de fato, um
empacotamento infinito em qualquer conjunto que não é totalmente limitado.

totlimcover Proposição 6.7 Com a notação acima, se K ⊂ X não é totalmente limitado, então existe um
ε-empacotamento dentro de K com cardinalidade infinita, para algum ε > 0.

Prova: Se K não é totalmente limitado, então N (K, ε) = +∞ para algum ε > 0. Portanto,
qualquer subconjunto finito de K não é uma ε-rede. Com base nisso, podemos construir
uma sequência de pontos da seguinte forma.

1. Escolha x1 ∈ K arbitrariamente.

2. Dados x1 , . . . , xn ∈ K, escolha xn+1 ∈ K de modo que dX (xn+1 , xi ) > ε para todo


1 ≤ i ≤ n (esse ponto existe porque {x1 , . . . , xn } não é ε-rede).

É fácil verificar que o conjunto S := {xn : n ∈ N} ⊂ K é um ε-empacotamento infinito.


2
Agora podemos relacionar funções contínuas ao fato do espaço métrico ser ou não
totalmente limitado.

lem:totlim Lema 6.2 Considere um espaço métrico (K, dK ) tal que que funções contínuas de K em R são
sempre limitadas. Então (K, dK ) é totalmente limitado.

Prova: Vamos mostrar que um espaço métrico (X, dX ) que não é totalmente limitado tem uma
função contínua f : X → R com supx∈X f (x) = +∞. Para isto, usamos a Proposição 6.7: ela
garante que, para algum δ > 0, há um δ-empacotamento S ⊂ X de cardinalidade infinita:
d(s, s′ ) ≥ δ para quaisquer elementos distintos s, s′ ∈ S. Sem perda de generalidade,
suporemos que S é enumerável e escreveremos S = {sj : j ∈ N}. Nosso objetivo será
construir uma função contínua f : X → R com sup{f (x) : x ∈ S} = +∞.
A ideia da prova será construir uma função que atinge valor ≥ j + 1 em cada sj . Se
estivéssemos na reta, não seria difícil construir uma f assim por interpolação. Num espaço
métrico arbitrário, será um pouco mais conveniente construir g = 1/f . Mostraremos,
então, o seguinte resultado.

Afirmação 6.1 Existe uma função g : X → R tal que g(x) > 0 para todo x ∈ X, ∥g∥Lip ≤ 1 e
g(sj ) ≤ 1/(j + 1) para todo j ∈ N.

Esta g toma valores estritamente maiores que 0 em todo ponto, mas g(sj ) → 0 quando
j → +∞. Em particular, se definimos

1
f (x) := (x ∈ X),
g(x)

110
podemos observar que f é contínua (já que o denominador não se anula) e f (sj ) ≥ j + 1 →
+∞ quando j → +∞.
Para construir g, vamos fazer uma espécie de colagem de várias funções. Para cada
j ∈ N, definimos uma função gj : X → R da seguinte forma:
1
gj (x) := d(x, sj ) + (x ∈ X).
j+1
Claramente, ∥gj ∥Lip ≤ 1 e gj (x) ≥ 1/(j + 1) > 0 para todo x ∈ X. Agora defina g : X → R
pela receita:
g(x) := inf gj (x) (x ∈ X).
j∈N

Note que g(x) ∈ R está bem definida porque os valores de gj (x) são limitados por baixo
por 0 para qualquer x ∈ X, e portanto o ínfimo na definição sempre nos dá um número
real. Além disso, ∥g∥Lip ≤ supj∈N ∥gj ∥Lip ≤ 1 pelo Exercício 4.16. Note ainda que:
1
∀k ∈ N : g(sk ) = inf gj (x) ≤ gk (sk ) =
.
j∈N k+1
Para terminar a prova da Afirmação, precisamos mostrar que g(x) > 0 para todo x ∈ X.
Para isso, fixamos x ∈ X e observamos duas possibilidades.
• Se d(x, sj ) ≥ δ/2 para todos j ∈ N, deduzimos que
gj (x) ≥ d(x, sj ) ≥ δ/2 > 0
pra todo j ∈ N. Isto quer dizer que
δ
é cota inferior para {gj (x) : j ∈ N};
2
como o ínfimo é a maior cota inferior, deduzimos que
δ
g(x) = inf gj (x) ≥ > 0.
j∈N 2
• Agora suponha que d(x, sk ) < δ/2 para algum k ∈ N (o que em particular ocorre se
x = sk ). Observe que, isso só pode ocorrer para um único índice k: se ℓ ∈ N\{k}, o
fato de que {sj }j∈N é δ-empacotamento para deduzir que:
δ δ
δ < d(sk , sℓ ) ≤ d(sk , x) + d(x, sℓ ) < + d(x, sℓ ), ou d(sℓ , x) > .
2 2
Portanto, temos que
1 δ
gk (x) ≥ e gℓ (x) ≥ d(x, sℓ ) ≥ quando ℓ ̸= k.
k+1 2
Deduzimos que
 
δ 1

δ := min , é cota inferior para {gj (x) : j ∈ N}
2 k+1
e, como antes, obtemos g(x) ≥ δ ′ > 0.
2

111
6.2.4 O critério das subsequências convergentes
sub:subseq
Nesta subseção vamos mostrar que a compacidade de um espaço métrico pode ser avaliada
a partir de subsequências. Na verdade, o que faremos será mostrar que, num espaço mé-
trico completo e totalmente limitado, toda sequência tem uma subsequência que converge
a um limite dentro do espaço.
Primeiro, lembremos o que são subsequências.

Definição 6.4 Dados um conjunto infinito N ⊂ N e uma sequência {xn }n∈N , a subsequência
{xn }n∈N é definida da forma {x̃j }j∈N com x̃j := {xnj }, onde n1 < n2 < n3 < . . . é a única
enumeração crescente dos elementos de N . Também escrevemos {xnj }j∈N diretamente. Falamos
que limn∈N xn = x se xnj → x quando j → +∞.

Exercício 6.5 Mostre que xn → x implica xnj → x.

Agora provamos a implicação 4 ⇒ 5 do Teorema 6.2.

seqcompacto Proposição 6.8 Um espaço métrico completo e totalmente limitado é sequencialmente compacto,
isto é: toda sequência nesse espaço tem uma subsequência que converge nesse mesmo espaço.

Prova: Fixe um espaço métrico (K, dK ) que é completo e totalmente limitado. Dada
{xn }n∈N ⊂ K, nosso principal objetivo será provar que {xn }n∈N possui uma subsequência de
Cauchy. Como (K, dK ) é completo, isto basta para provar que sempre há uma subsequência
convergente.
Não é muito simples achar esta subsequência buscada. Começamos a busca por ela
com um resultado mais fraco que apenas garante o seguinte: sempre há uma subsequência
“apertada".

Afirmação 6.2 Dado qualquer r > 0 existe subsequência {xn }n∈N com dK (xm , xn ) < r para
todos m, n ∈ N .

De fato, como estamos supondo que K é totalmente limitado, a Proposição 6.7 nos diz que
podemos cobrir K por um número finito de bolas de raio r/2. Como o número de bolas é
finito, uma das bolas, que chamaremos de B(z, r/2), é tal que o conjunto

N := {n ∈ N : xn ∈ B(z, r/2)}

é infinito, e um argumento simples mostra que {xn }n∈N tem a propriedade desejada.
O que vem a seguir é uma espécie de “truque diagonal" que mostra como esta afirmação
pode ser usada para achar uma subsequência de Cauchy. A primeira ideia deste truque
diagonal é que, aplicando a afirmação infinitas vezes, podemos encontrar subsequências
encaixadas e cada vez mais apertadas. Mais precisamente:

1. A afirmação implica que existe N1 ⊂ N infinito tal que dK (xn , xm ) < 1/2 para todos
n, m ∈ N1 .

112
2. Suponha (recursivamente) que existem conjuntos infinitos N1 ⊃ N2 ⊃ · · · ⊃ Nk ,
todos contidos em N, tais que, para qualquer 1 ≤ i ≤ k e quaisquer n, m ∈ Ni , vale
a desigualdade dK (xn , xm ) < 2−i . Vamos mostrar como construir um conjunto Nk+1
de forma a estender por mais um passo esta construção. Para isto, aplicaremos a
afirmação à sequência
{xnj }j∈N onde {nj : j ∈ N} = Nk .
com r = 2−k−1 . Isto nos dá um conjunto N e podemos definir Nk+1 := {nj : j ∈ N },
de modo a termos as propriedades desejadas.
Nossa tarefa final é extrair destas subsequências encaixadas e cada vez mais apertadas
uma subsequência de Cauchy. Uma tentativa poderia ser definir {xn }n∈Ñ com Ñ := ∩k Nk ,
mas isto não pode funcionar em geral: afinal,

n, m ∈ Ñ ⇒ n, m ∈ Nk para todo k ⇒ ∀k ∈ N, dK (xn , xm ) ≤ 2−k ⇒ xn = xm .


Ou seja, para que nosso truque não falhe, é necessário que a sequência original tenha
infinitos termos iguais.
A segunda ideia do truque diagonal é uma maneira “diagonal" de selecionar um subcon-
junto infinito N∗ de modo que N∗ ⊂ Nk “quase vale", isto é, N∗ \Nk tem apenas um número
finito de termos. Vamos escrever
N∗ := {n1 < n2 < n3 < . . . }
onde os nk são definidos recursivamente.
1. Em primeiro lugar, definimos n1 = min N1 (isto é válido porque N1 ̸= ∅ é subconjunto
dos naturais).
2. Definidos n1 < · · · < nk , observamos que, como Nk+1 é infinito,
Nk+1 \[nk ] ̸= ∅.
Como ele também é subconjunto dos naturais, podemos definir
nk+1 := min(Nk+1 \[nk ])
e observamos que nk+1 ̸∈ [nk ], de modo que nk+1 > nk .
Pela construção temos n1 < n2 < . . . . Além disto, para k, r ∈ N com k < r, temos que
nk ∈ Nk , nr ∈ Nr ⊂ Nk
e como dK (xn , xm ) < 2−k para n, m ∈ Nk , isto implica
∀k, r ∈ N : k < r ⇒ dK (xnk , xnr ) < 2−k .

Exercício 6.6 Para terminar a prova, deduza disto que {xnk }k∈N é Cauchy, provando que, dado
ε > 0, existe um k0 ∈ N tal que dX (xnk , xnℓ ) ≤ ε para quaisquer índices k, ℓ ≥ k0 .
2

113
6.2.5 O fim da prova da grande equivalência
ovacompacto
Chegamos finalmente ao fim da prova do Teorema 6.2.
Prova: [do Teorema 6.2] Voltando ao roteiro descrito em §6.2.1 acima, observamos que
já sabemos que as propriedades de 2 a 5 no Teorema 6.2 são equivalentes. Além disso,
sabemos que 1 implica 2. O que nos falta é provarmos que 2 a 5 juntas implicam 1.
Na verdade, não são todas as propriedades de 2 a 5 que serão usadas. Ao invés disso,
provaremos o seguinte.

Queremos: Seja (K, dK ) um espaço métrico totalmente limitado (item 4 do


Teorema) com a propriedade de que toda f : X → R contínua atinge seu
ínfimo (item 2 to Teorema). Então toda cobertura de K por abertos possui uma
subcobertura finita (item 1 do Teorema).

Fixamos, então, um espaço métrico com as propriedades dos itens 2 e 4. Considere


uma cobertura A de K por abertos. Lembrando, A é uma coleção de abertos de K tais
que K = ∪A∈A A.
Observe que todo x ∈ K pertence a algum aberto A ∈ A. Portanto existe um δ =
δ(x) > 0 com B(x, δ) ⊂ A para algum A ∈ A. Reduzindo δ se necessário, podemos supôr
que δ(x) ≤ 1.
A principal ideia desta prova é mostrar o seguinte.

Ideia: podemos escolher um valor δ > 0 que funciona para todos os x ∈ K


simultaneamente.

Ou seja, existe um δ > 0 tal que, dado qualquer x ∈ K, B(x, δ) ⊂ A para algum A ∈ A.
Na verdade, esta "ideia" suscita duas perguntas:

1. Por que achar este δ > 0 é uma boa ideia? Como K é compacto, ele é totalmente limitado
e pode ser coberto por um número finito de bolas de raio δ > 0. Mas cada bola destas
pode ser coberta por um elemento da cobertura A. Deste modo, K pode ser coberto
por um número finito de elementos de A.

2. Como sabemos que este δ existe? Vamos exprimir δ em termos do ínfimo de uma função
contínua r : K → (0, 1] que associa a cada x o seu “maior δ particular". Como cada
x tem seu δ > 0, o ínfimo de r será positivo.

Para transformar esta ideia em prova, definimos r : K → (0, 1] da seguinte forma.


Primeiro observe, dado x ∈ K, o conjunto

I(x) := {δ ∈ (−∞, 1] : ∃A ∈ A, BK (x, δ) ⊂ A}

não é vazio e contem pelo menos um número positivo: se x ∈ K = ∪A∈A A, então x ∈ A


para algum aberto A ∈ A e existe um δ > 0 com BK (x, δ) ⊂ A. (Pode-se ver também que

114
I(x) ⊃ (−∞, 0] porque as bolas abertas de raio δ ≤ 0 são vazias! De fato, deixar que I(x)
contenha números negativos é só uma conveniência para a demonstração.).
Agora observamos que I(x) é um intervalo semi-infinito: se δ ∈ I(x), então para
qualquer δ ′ < δ temos

∃A ∈ A : BK (x, δ ′ ) ⊂ BK (x, δ) ⊂ A ⇒ δ ′ ∈ I(x).

Deduzimos que I(x) é intervalo semi-infinito e contem pelo men os um número posi-
tivo. Como I(x) também é limitado por 1, podemos definir r : K → R como

r(x) := sup I(x) (x ∈ K).

Como I(x) contem elementos positivos, vale que r(x) > 0 para todo x ∈ K. Além disso,
é fácil ver que (−∞, r(x)) ⊂ I(x). Intuitivamente, r(x) é basicamente o “maior" δ que
podemos escolher. Uma explicação para esta escolha é que, se queremos achar um único
δ que sirva para todos os x, é boa ideia partir do maior δ possível para cada x.
A afirmação a seguir é chave para a prova.

Afirmação 6.3 r é uma função contínua.

Prova: [da Afirmação] Vamos mostrar que r é 1-Lipschitz. Para isto basta
mostrar que:

Objetivo: ∀x, x′ ∈ K : r(x) − r(x′ ) ≤ dK (x, x′ ). (6.2)

De fato, se temos isto, podemos trocar os papeis de x, x′ e mostrar que também


vale r(x′ ) − r(x) ≤ dK (x, x′ ), de modo que |r(x′ ) − r(x)| ≤ dK (x, x′ ) para todos
x, x′ ∈ X.
Para provar nosso objetivo, tome qualquer r < r(x), de modo que r ∈ I(x).
Sabemos, então, que existe um aberto A ∈ A com B(x, r) ⊂ A. Note que
B(x′ , r − dX (x, x′ )) ⊂ BK (x, r); afinal,

∀y ∈ BK (x′ , r − dK (x, x′ )) : dK (y, x) ≤ dK (y, x′ ) + dK (x, x′ ) < r.

Portanto também temos BK (x′ , r − dK (x, x′ )) ⊂ A ∈ A. Como r < r(x) ≤ 1,


deduzimos que r − d(x, x′ ) ∈ I(x′ ) e portanto r(x′ ) ≥ r − dX (x, x′ ). Isso vale
para r < r(x) qualquer, o que nos permite deduzir que r(x′ ) ≥ r(x) − dK (x, x′ ),
como queríamos demonstrar. [Fim da prova da afirmação.] 2

Entre outras coisas, esta afirmação nos diz que inf x∈K r(x) = r(x∗ ) para algum x ∈ K;
afinal, K é sequencialmente compacto! Mas note então que r(x∗ ) > 0, porque r é positiva
em todos os pontos de K. Deduzimos que inf x∈K r(x) > 0, o que nos permite escolher um
δ ∈ (0, inf x∈K r(x)).

115
Este δ nos permite terminar a prova. Veja que, dado x ∈ K, r(x) > δ. Pela definição
de r(x), isto quer dizer que 0 < δ < sup I(x); como I(x) é intervalo, isto quer dizer que
δ ∈ I(x) e existe um A ∈ A com BK (x, δ) ⊂ A.
Lembre-se que K é totalmente limitado, portanto K = ∪ki=1 BK (xi , δ) para alguma
escolha de x1 , . . . , xk ∈ K. Mas então podemos escolher, para cada 1 ≤ i ≤ k, um aberto
Ai ∈ A com B(xi , δ) ⊂ Ai , e observamos que K ⊂ ∪ki=1 Ai . Deste modo, B := {Ai : 1 ≤
i ≤ k} é uma subcoleção finita de A que cobre K. 2

bs:Lebesgue Observação 6.1 Um dado importante que surgiu na prova acima é que, se K é compacto, então
toda cobertura A de K por abertos possui um número de Lebesgue, isto é, um δ > 0 tal que,
se x, x′ ∈ K e dK (x, x′ ) < δ, então x, x′ ∈ A para algum A ∈ A. Isto é, se dK (x, x′ ) < δ, x, x′
pertencem ao mesmo aberto da cobertura. Usaremos isto mais adiante.

6.3 Mais sobre compactos e funções contínuas


A esta altura já sabemos que o conceito de compacidade pode ser caracterizado por funções
contínuas. Há muitas outras relações entre estes dois conceitos: como veremos, elas se
estendem ao caso em que o contradomínio não é a reta.

6.3.1 Funções sobre compactos com contradomínio completo


brecompacto
Até este ponto, o principal espaço de funções contínuas que tratamos foi o C(I, R) com
I ⊂ R compacto. Agora, estamos em condições de estender o que sabemos para um caso
bem mais geral. De fato, tomaremos (K, dK ) e (Z, dZ ) espaços métricos, com K compacto
e Z completo, e falaremos de:

C = C(K, Z) := {f : K → Z : f continua }.

O próximo resultado mostra que é possível dar uma métrica a C e que o espaço métrico
resultante é completo.

mpletageral Teorema 6.3 Suponha que (Z, dZ ) é completo. Dadas f, g ∈ C, defina:

dC (f, g) := sup dZ (f (t), g(t)).


t∈K

Então dC é uma métrica sobre C e (C, dC ) é um espaço métrico completo.

Prova: Esta prova deve muito à prova de que C(I, R) é espaço métrico completo (Teorema
3.2). Faremos abaixo um esboço dos passos que são iguais e assinalaremos as principais
diferenças.

116
Primeiro vamos provar que o supremo na definição de dC é atingido por algum t∗ ∈ K;
em particular, dC (f, g) ∈ R está bem definida. Para ver que o sup é atingido, como K é
compacto, basta ver que a função

t ∈ K 7→ dZ (f (t), g(t)) ∈ R

é contínua. Isto é verdade porque, sempre que tn → t em K,

|dZ (f (t), g(t)) − dZ (f (tn ), g(tn ))| ≤ |dZ (f (t), g(t)) − dZ (f (tn ), g(t))|
+|dZ (f (tn ), g(t)) − dZ (f (tn ), g(tn ))|
(desig. triangular nos dois termos) ≤ dZ (f (tn ), f (t)) + dZ (g(tn ), g(t))
→ 0 quando n → +∞.

Portanto dZ (f (t), g(t)) = limn dZ (f (tn ), g(tn )).


Acabamos de ver que dC está bem definida. As propriedades de métrica são provadas
como no caso de C(I, R), observando que, para f, g, h ∈ C:

∀t ∈ K : dZ (f (t), g(t)) ≤ dZ (f (t), h(t)) + dZ (g(t), h(t)) ≤ dC (f, h) + dC (h, g),

e aí tomando o supremo em t ∈ K do lado esquerdo.


A completude também é provada como antes, nos mesmos três passos da prova do
Teorema 3.2. Dada {fn }n∈N ⊂ C Cauchy, temos o seguinte.

1. Para cada t ∈ K,
n,m→+∞
0 ≤ dZ (fn (t), fm (t)) ≤ dC (fn , fm ) → 0.

Logo {fn (t)}t∈N ⊂ Z é Cauchy e, como Z é completo, existe o limite pontual f (t) =
limn fn (t) para cada t ∈ K.

2. Para cada n ∈ N e t ∈ K, a existência do limite pontual diz que

dZ (fn (t), f (t)) = lim dZ (fn (t), fm (t))


m
≤ sup dZ (fn (t), fm (t))
m≥n
≤ sup dC (fn , fm ).
m≥n

Logo

0 ≤ sup dZ (fn (t), f (t)) ≤ sup dC (fn , fm ) → 0 porque {fn }n∈N é Cauchy.
t∈K m≥n

Deduzimos que fn → f uniformemente.

117
3. Por fim, dada uma sequência tk → t em K, para qualquer n ∈ N

dZ (f (tk ), f (t)) ≤ dZ (fn (tk ), fn (t))


+dZ (fn (tk ), f (tk )) + dZ (fn (t), f (t))
≤ dZ (fn (tk ), fn (t)) + 2dC (fn , f ).

(Aqui abusamos notação e usamos dC (fn , f ) apesar de ainda não sabemos que f ∈
C!). Como fn é contínua, fn (tk ) → fn (t) e

0 ≤ lim sup dZ (f (tk ), f (t)) ≤ 2dC (fn , f )


k

e mandar n → +∞ nos mostra que o lim sup é 0, logo f (tk ) → f (t). Como isto vale
para qualquer sequência como acima, f ∈ C é contínua.

6.3.2 Funções sobre compactos com contradomínio Banach


ontraBanach
Um caso particular do resultado acima é aquele em que Z = V é espaço de Banach (e dZ
vem da norma). O próximo resultado mostra que C(K, V ) também é Banach.
Começamos observando que, assim como no caso de C(I, R), que já estudamos, este
espaço tem uma estrutura natural de espaço vetorial. Seu elemento nulo 0C é a função
constante igual a 0V . Dadas funções f, g ∈ C e um escalar λ ∈ R, uma nova função λ f + g
é definida via:
(λ f + g)(t) = λ f (t) + g(t) (t ∈ K).
A única diferença para o caso em que V = R é que as operações de soma e produto do
lado direito são em V e não em R.
Há muitas boas razões para se considerar essa classe de funções. Por exemplo, se V =
R3 , podemos vizualizar cada elemento de C como uma trajetória no espaço tridimensional.
Se queremos modelar a evolução de posição e momento de N particulas clássicas em R3 ,
precisamos tomar V = R6N . Em outros contextos, pode ser interessante tomar V ainda
mais geral.
O próximo resultado define uma norma em C(K, V ).
tinuoBanach Teorema 6.4 Se (K, dK ) é compacto e (V, ∥ · ∥V ) é Banach, a expressão abaixo define uma norma
∥ · ∥V em C:
∥f ∥C := sup ∥f (t)∥V (f ∈ C).
t∈I

Com essa norma, (C, ∥ · ∥C ) é completo (Banach).


Prova: Primeiro devemos observar que o supremo é finito. Para isso, basta observar que
a função que associa a cada t ∈ K o valor ∥f (t)∥V ∈ R é contínua, já que

∀t, s ∈ K : |∥f (t)∥V − ∥f (s)∥V | ≤ ∥f (t) − f (s)∥V .

118
Agora vamos checar as propriedades de norma. Como ∥f (t)∥V ≥ 0 sempre, temos que
∥f ∥C ≥ 0. Portanto, ∥ · ∥C : C → [0, +∞) é uma função bem-definida. Para provar que
ela é uma norma, precisamos provar que ela é positiva definida, homogênea positiva e
subaditiva. Como a prova é bem semelhante à do caso em que V = R, demonstraremos
apenas a subaditividade.
De fato, dadas f, g ∈ C, podemos usar a subaditividade de ∥ · ∥V e a definição de ∥ · ∥C
para provar que:

∀t ∈ I : ∥f (t) + g(t)∥V ≤ ∥f (t)∥V + ∥g(t)∥V ≤ ∥f ∥C + ∥g∥C .

Portanto, ∥f ∥C + ∥g∥C é cota superior para os valores de ∥f (t) + g(t)∥V , donde deduzimos
que
∥f + g∥C = sup ∥f (t) + g(t)∥V ≤ ∥f ∥C + ∥g∥C
t∈I

para quaisquer f, g ∈ C. Ou seja, ∥ · ∥C é mesmo subaditiva.


Falta demonstrar que (C, ∥ · ∥C ) é completo, mas isto segue do Teorema 6.3. Afinal,
a norma ∥ · ∥C induz uma métrica que coincide com a que estudamos naquele teorema
quando V = Z. Como V é completo, o teorema se aplica e garante a completude de C
com a norma que acabamos de construir. 2

6.3.3 Continuidade uniforme


ontuniforme
Nosso próximo passo é falar de continuidade uniforme, uma versão mais forte do conceito
de continuidade.

Definição 6.5 Uma função f : K → Z entre espaços métricos (K, dK ) e (Z, dZ ) é dita uniforme-
mente contínua se seu módulo de continuidade, denotado por

mf (δ) := sup{dZ (f (x), f (x′ )) : dK (x, x′ ) ≤ δ} (δ > 0),

converge a 0 quando δ → 0+ .

Uma função uniformemente contínua é contínua (exercício!). Por outro lado, uma
função contínua pode não ser uniformemente contínua: por exemplo, “t 7→ t2 ", definida
na reta, tem mf (δ) = +∞ para todo δ > 0, já que:

lim [(t + δ)2 − t2 ] = +∞.


t→+∞

O resultado abaixo estende um teorema conhecido de Análise na Reta. Ele garante


que qualquer função contínua sobre domínio compacto é uniformemente contínua. Note
que, ao contrário da subseção anterior, aqui não precisamos supôr que o contradomínio Z é
completo com a métrica dZ .

eo:unifcont Teorema 6.5 Uma função contínua f : K → Z entre espaços métricos (K, dK ) e (Z, dZ ), com
(K, dK ) compacto, é necessariamente uniformemente contínua.

119
Prova: Apresentamos uma prova baseada na ideia de número de Lebesgue, contida na
observação 6.1 acima. O Exercício 6.7 apresenta um argumento mais clássico, baseado em
subsequências.
Tome f : K → Z contínua. Dado um ε > 0, mostraremos que existe um δ0 > 0 tal que
mf (δ) ≤ ε para todo 0 < δ < δ0 . Isto implica lim supδ→0+ mf (δ) ≤ ε, para qualquer ε > 0.
Note que, dado qualquer x′′ ∈ K, o conjunto

Ax′′ := {x ∈ K : dZ (f (x), f (x′′ )) < ε/2}

é aberto de K, já que Ax = f −1 (BZ (f (x), ε/2)). Note ainda que, se x, x′ ∈ Ax′′ para um
mesmo x′′ , naturalmente dZ (f (x′ ), f (x′′ )) < ε pela desigualdade triangular:

dZ (f (x), f (x′ )) ≤ dZ (f (x), f (x′′ )) + dY (f (x′′ ), f (x′ )) < ε.

Os abertos Ax′′ , com x′′ ∈ K, cobrem K; afinal, cada x′′ ∈ K pertence ao seu próprio Ax′′ .
Deduzimos que
A := {Ax′′ : x′′ ∈ K}
é uma cobertura de K por abertos. Pela Observação 6.1, existe um δ0 > 0 tal que, dados
quaisquer x, x′ ∈ K com dK (x, x′ ) < δ0 , existe um conjunto Ax′′ com x, x′ ∈ Ax′′ , o que,
como observado acima, garante que dZ (f (x), f (x′ )) < ε. Portanto,

∀x, x′ ∈ K : dK (x, x′ ) ≤ δ < δ0 ⇒ dY (f (x), f (x′ )) < ε,

e mf (δ) ≤ ε para todo 0 < δ < δ0 , como queríamos demonstrar. 2


Antes de prosseguirmos, observamos que há outras definições equivalentes para a
continuidade uniforme.

Proposição 6.9 Dada uma função f : K → Z entre espaços métricos (K, dK ) e (Z, dZ ), as
seguintes propriedades são equivalentes.

1. f é uniformemente contínua;

2. dado qualquer ε > 0, existe um δ > 0 tal que, se x, x′ ∈ K satisfazem dK (x, x′ ) ≤ δ, então
dZ (f (x), f (x′ )) ≤ ε;

3. se {xn }n∈N e {x′n }n∈N são sequências em K,

dK (xn , x′n ) → 0 ⇒ dZ (f (xn ), f (x′n )) → 0.

Prova: Uma primeira observação da prova é que a função mf (·) é monótona não-decrescente.
De fato, se 0 < δ < δ ′ , o conjunto de pares (x, x′ ) com dK (x, x′ ) ≤ δ está contido no conjunto
de pares com dK (x, x′ ) ≤ δ ′ ; portanto, o supremo que define mf (δ) é tomado sobre um
conjunto menor do que o supremo que define mf (δ ′ ).

120
Usamos a observação acima para provar que 1 e 2 são equivalentes. Sendo mf crescente,
sabemos que existe o limite de mf (δ) quando δ → 0+ e vemos que:

lim mf (δ) = 0 ⇔ ∀ε > 0 ∃δ > 0 : mf (δ) ≤ ε.


δ→0+

Do lado esquerdo da equivalência, temos a continuidade uniforme; do direito, temos a


propriedade 2 escrita de outra forma. Deste modo, temos a equivalência de 1 e 2.
Agora vejamos que 1 ⇒ 3. Sejam {xn }n∈N e {x′n }n∈N como no item 3. Note que, por
definição de mf ,
0 ≤ dZ (f (xn ), f (x′n )) ≤ mf (dK (xn , x′n ))
e que dK (xn , x′n ) → 0. Deduzimos que dY (f (xn ), f (x′n )) → 0.
Concluímos a prova mostrando que “não 1⇒não 3". Suponha que 1 não vale. Como
observamos acima, mf é monótona-não-decrescente: por esta razão, limδ→0+ mf (δ) existe,
podendo ser um número real não-negativo ou +∞. Se 1 não vale, existe um a > 0 com
limδ→0+ mf (δ) > a > 0 e portanto mf (δ) > a para todo δ > 0. Em particular, tomando
δ = 1/n e retornando à definição de mf , vemos que existe um par (xn , x′n ) ∈ K 2 com
dX (xn , x′n ) ≤ 1/n e dZ (f (xn ), f (x′n )) > a. Portanto, as sequências {xn }n∈N e {x′n }n∈N , ambas
contidas em K, satisfazem dX (xn , x′n ) → 0 e dZ (f (xn ), f (x′n )) ̸→ 0. Ou seja, se 1 não é
verdadeira, a propriedade 3 não vale. 2

fcontsubseq Exercício 6.7 Escreva uma prova do Teorema 6.5 baseada no item 3 da Proposição acima. Para isso,
siga os seguintes passos: tome uma sequência {δn }n decrescendo a 0 e observe que limδ→0+ mf (δ)
se e somente se mf (δnk ) → 0 ao longo de uma subsequência {δnk }k . Para cada n, tome xn , x′n ∈ K
com dK (xn , x′n ) ≤ δn e dY (f (xn ), f (x′n )) ≥ mf (δn ) − 1/n. Mostre agora que é possível encontrar
uma subsequência {nk }k tal que xnk , x′nk → x ∈ K e use a continuidade de f em x para terminar
a prova.

6.4 Compacidade de subconjuntos de um espaço métrico


completo
No próximo capítulo, e também pelo restante da vida, estaremos interessados no caso em
que K ⊂ X com (X, dX ) completo. Na maior parte do tempo, X será algum dos nossos
espaços usuais: métrica discreta, Rd ou C(I, R).
Primeiramente, observaremos como formular compacidade em termos da métrica e
da topologia de X.

1. A definição de compacidade via cobertutas de abertos (ou via propriedade da inter-


seção finita) é igual.

2. Quando (X, dX ) é completo (como é o caso aqui), pedir que K seja completo com a
métrica induzida é a mesma coisa que pedir que K seja fechado de X (cf. Exercício

121
5.25). Logo, ao invés de pedir que K seja completo, pediremos que ele seja fechado.
Portanto, se (X, dX ) é completo, um K ⊂ X é compacto se e somente se é fechado e
totalmente limitado.

Convém fazer alguns comentários sobre os números de cobertura de K. Lembre-se


que o número de ε-cobertura de (K, dK ) é dado por:

N (K, ε) := inf{k ∈ N : ∃x1 , . . . , xk ∈ K, K = ∪ki=1 BK [xi , ε]}.

Como dissemos acima, estamos interessados no caso em que K ⊂ X e dK é a distância


induzida por dX . Sabemos que, neste caso, temos BK [xi , ε] = K ∩ BX [xi , ε] para cada
1 ≤ i ≤ k e ε > 0. Segue disto que

N (K, ε) := inf{k ∈ N : ∃x1 , . . . , xk ∈ K, K ⊂ ∪ki=1 BX [xi , ε]}. (6.3) eq:numcober

No entanto, é possível uma outra definição:

N ′ (K, ε) := inf{k ∈ N : ∃x′1 , . . . , x′k ∈ X, K ⊂ ∪ki=1 BX [x′i , ε]}. (6.4) eq:numcober

A diferença para (6.3) é que, neste segundo caso, os centros das bolas podem estar dentro
ou fora de K. O exercício abaixo mostra que isso não faz muita diferença para o que nos
interessa.

Exercício 6.8 Prove que, para qualquer espaço métrico (X, dX ) e qualquer K ⊂ X,

N ′ (K, ε) ≤ N (K, ε) ≤ N ′ (K, ε/2).

Deduza que K é totalmente limitado (isto é, N (K, ε) < +∞ para todo ε > 0) se e somente se
N ′ (K, ε) < +∞ para todo ε > 0.

Curiosamente, essa pequena diferença entre os números de ε-cobertura N e N ′ não


tem análogo para os números de ε-empacotamento: neste caso, sempre pedimos que os
elementos do empacotamento estejam dentro de K.

6.5 Mais exercícios


Exercício 6.9 Considere espaços métricos (X, dX ) e (Y, dY ), com X compacto. Suponha que
f : X → Y é uma bijeção contínua. Mostre que a função inversa f −1 : Y → X também é
contínua; portanto, f é um homeomorfismo de espaços topológicos.

Exercício 6.10 Considere um espaço vetorial normado (V, ∥·∥V ) e subconjuntos não-vazios A, B ⊂
V . Defina a soma de Minkowski A + B como no Exercício 5.32:

A + B := {a + b : (a, b) ∈ A × B}.

122
1. Mostre que, se A é fechado e B é compacto, então A + B é fechado.

2. Suponha agora que tanto A quanto B são compactos e prove que A + B é compacto.

Exercício 6.11 (Espaços pseudocompactos) Um espaço topológico compacto (X, TX ) é dito


pseudocompacto se toda função contínua de X em R é limitada. Procure o verbete da Wikipedia a
respeito.

Exercício 6.12 Determine quais dos subconjuntos de C([0, 1], R) abaixo são compactos.
1. Todas as funções Lipschitz.

2. Todas as funções L-Lipschitz, para um L > 0 fixo.

3. Todos os polinômios com grau 3.

4. Todos os polinômios com grau 3 e coeficientes no intervalo [−1, 1].


(Obs: mais adiante provaremos um critério para compacidade neste espaço, o teorema de
Ascoli-Arzelà. Estes exemplos podem ser estudados sem se utilizar este teorema.)

Exercício 6.13 Considere um espaço métrico compacto (K, dK ). Chame p ∈ K de ponto isolado
se existe um δ > 0 tal que BK (p, δ) = {p} (ou seja, não há qualquer ponto de K, além do próprio p,
a distância < δ do p). Prove que o conjunto de pontos isolados de K é vazio, finito ou enumerável.

Exercício 6.14 Suponha que (X, dX ) é um espaço métrico e que {xn }n∈N ⊂ X é Cauchy. Mostre
que o conjunto S := {xn : n ∈ N} é totalmente limitado.

Exercício 6.15 Recorde que um espaço métrico é separável se possui um subconjunto denso e
enumerável. Mostre que todo espaço métrico compacto é separável.

tlimproduto Exercício 6.16 Sejam (Ti , di ) espaços métricos totalmente limitados, 1 ≤ i ≤ k. Mostre que

T := T1 × T2 × · · · × Tk

é espaço métrico totalmente limitado com qualquer uma das métricas-produto consideradas no
exercício 3.11, em particular

d∞ (x, y) := max di (x[i], y[i]) (x, y ∈ T ).


1≤i≤k

Faça isso provando uma cota explícita para o valor dos números de cobertura de T (com a métrica
d∞ ):
Yk
∀ε > 0 : N (T, ε) ≤ N (Ti , ε).
i=1

Mais exatamente, mostre que, se Ri ⊂ Ti é ε-rede para cada Ti (comQa métrica di ), então R :=
R1 × R2 × · · · × Rk é ε-rede para T . Conclua observando que |R| = i |Ri |.

123
Exercício 6.17 Seguindo a linha do exercício acima, mostre que T é compacto se e somente se cada
Ti é compacto.

ex:totlim Exercício 6.18 Sejam (X, dX ) um espaço métrico completo e S ⊂ X um subconjunto. Mostre
que S é totalmente limitado se e somente se S é compacto.

Exercício 6.19 Demonstre que a primeira das afirmações abaixo é verdadeira e a segunda é falsa.

1. Um espaço métrico (X, dX ) é compacto se e somente se toda função Lipschitz f : X → R


satisfazendo f (x) > 0 para todo x ∈ X tem ínfimo positivo.

2. Um espaço métrico (X, dX ) é compacto se e somente se toda função Lipschitz f : X → R é


limitada inferiormente.

Exercício 6.20 É verdade que um espaço métrico (X, dX ) é compacto se e somente se toda função
contínua f : X → R é uniformemente contínua? Mostre que a resposta é não considerando
qualquer conjunto X infinito com a métrica discreta. (Na verdade, há exemplos de mais complicados
de espaços que não são compactos, mas são perfeitos – X ′ = X – e tais que qualquer função contínua
é uniformemente contínua. Ou seja: a resposta “não" acima não tem nada a ver com métrica discreta
só ter pontos isolados.)

Exercício 6.21 Considere um espaço vetorial normado (V, ∥ · ∥V ). Dado um S ⊂ V , S ̸= ∅, uma


combinação convexa de elementos de S é um elemento v ∈ V da forma:
m
X
v= λi si ,
i=1

onde m ∈ N\{0}, s1 , . . . , sm ∈ S e os escalares λ1 , . . . , λm ≥ 0 têm soma m


P
i=1 λi = 1. Chamamos
de conv(S), ou fecho convexo de S, o conjunto cujos elementos são as combinações convexas dos
elementos de S. Prove que, se S é totalmente limitado, conv(S) também é.

124
Capítulo 7

Compactos: casos particulares

Agora que já sabemos quem são os espaços compactos e que propriedades importantes eles
têm, veremos como este conceito se aplica a subconjuntos de Rd e das funções contínuas.
No caso do Rd , provaremos o Teorema de Heine-Borel, que diz que um conjunto
K ⊂ Rd é compacto se e somente se ele é fechado e limitado. Logo depois, usaremos
este resultado para dois fins: mostrar que todas as normas sobre Rd são equivalentes e
construir uma métrica sobre as funções contínuas de A ⊂ Rd aberto em R.
O próximo passo será apresentar o Teorema de Arzelà-Ascoli, que descreve subcon-
juntos compactos de espaços de funções contínuas. As aplicações deste teorema são mais
complicadas e são deixadas para outros capítulos, onde discutirmos curvas de compri-
mento mínimo (a incluir) e existência de soluções para Equações Diferenciais Ordinárias.

7.1 Compactos de Rd: o Teorema de Heine-Borel


compactosRd
Quem são os compactos de X = Rd com a métrica usual? O resultado a seguir é um
clássico da Análise, que responde a essa pergunta.

Teorema 7.1 (Heine Borel) Um subconjunto K ⊂ Rd é compacto se e somente se é fechado e


limitado.

Prova: Apresentamos dois argumentos. No primeiro, usamos o fato de que K é compacto


se e somente se é fechado e totalmente limitado. Desta forma, para provar o teorema, basta
provar que qualquer um subconjunto K ⊂ Rd é limitado se e somente se é totalmente
limitado. Mas isto é simples:

• Se K é totalmente limitado, K ⊂ ∪m
i=1 BRd (xi , δ). Mas então a desigualdade triangular
mostra que dRd (0, x) ≤ max{dRd (0, xi )}1≤i≤n + δ para todo x ∈ K, ou seja, K é
limitado.

• Se K ⊂ Rd é limitado, temos que K ⊂ [−n, n]d para algum √ n ∈ N. Dividindod


cada intervalo [−n, n] em intervalos de comprimento < δ/ d, vemos que [−n, n]

125
é dividido em um número finito de cubos tais que |x − x′ | < δ para quaisquer
dois elementos no mesmo cubo. Tomando um ponto xi em cada cubo, vemos que
K ⊂ [−n, n]d ⊂ ∪mi=1 BRd (xi , δ) para uma certa coleção finita de pontos. Deste modo,
K é totalmente limitado.

Como segundo argumento, usaremos o critério das subsequências convergentes. Vol-


tamos ao §3.2.1 e lembramos que toda sequência limitada em Rd tem uma subsequência
convergente. Em particular, se K ⊂ Rd é fechado e limitado, toda sequência em K tem
subsequência com limite em K (que é fechado!).
Por outro lado, se K não é fechado ou não é limitado, há nele uma sequência que não
tem subsequência convergente em K (e portanto K não é compacto). Vejamos o porquê.

• Se K não é fechado, há uma sequência {xn }n∈N ⊂ K convergindo a x ̸∈ K. Qualquer


subsequência de {xn }n∈N também converge a x, logo não há subsequência conver-
gindo a elemento de K.

• Se K não é limitado, para todo n ∈ N há um xn ∈ K com |xn |2 ≥ n e é fácil ver que


{xn }n∈N não tem subsequência convergente.

Exercício 7.1 Use o Teorema de Heine-Borel para decidir quais dentre os seguintes subconjuntos
de Rd são compactos: Rd ; ∅; BRd (0, 1); BRd [0, 1];

Sd−1 := {x ∈ Rd : |x|2 ≤ 1};


Xd
d
∆d := {x ∈ R+ : x[i] = 1};
i=1
Od := {x ∈ Rd+ : x[1] ≤ x[2] ≤ x[3] ≤ · · · ≤ x[d]};

a “versão" do Od com “x[1] < x[2] < · · · < x[d]"(desigualdades estritas).

Exercício 7.2 Para cada um dos conjuntos S ⊂ Rd que não são compactos apresentados no exercício
anterior, encontre uma f : S → R com inf s∈S f (s) = −∞ e uma cobertura de S por abertos que
não tem subcobertura finita. (Você já sabe que uma tal f e uma tal subcobertura existem pela teoria
geral, claro.)

Exercício 7.3 Considere uma função contínua f : Rd → R satisfazendo lim|x|2 →+∞ f (x) = +∞.
Dado c ∈ R, mostre que seus conjuntos de “nível c"e “subnível c"

Fc := {x ∈ Rd : f (x) = c} e S≤c := {x ∈ Rd : f (x) ≤ c}

são compactos.

126
7.2 Aplicações do teorema de Heine-Borel
Poucos teoremas na Análise são tão usados quanto o de Heine-Borel. Nesta seção, não
fazemos mais do que apresentar duas situações em que ele é útil: para entender normas
em Rd e discutir o conceito de convergência sobre compactos para funções contínuas.

7.2.1 Todas as normas sobre Rd são equivalentes


Aqui provamos algo que prometemos há muito tempo: que todas as normas em Rd são
equivalentes. Em particular, os fatos a seguir todos seguem disso.
• Todas as normas sobre Rd definem a mesma topologia.
• Rd é completo com qualquer norma.
Abaixo, enunciamos “por extenso" o que significa dizer que uma norma é equivalente
à norma Euclideana. É boa ideia recordar o Teorema 3.3 antes de lê-lo.
Teorema 7.2 Considere uma norma ∥ · ∥ sobre Rd e seja | · |2 x a norma Euclideana. Então existem
C, c > 0 tais que
∀x ∈ Rd : c |x|2 ≤ ∥x∥ ≤ C |x|2 . (7.1) eq:normaseq
Em particular, a norma ∥ · ∥ e a norma Euclideana definem a mesma topologia sobre Rd .
Prova: Lembre-se de que e1 , . . . , ed são os vetores da base canônica de Rd : fixo 1 ≤ i ≤ d,
ei tem a i-ésima coordenada igual a 1 e as demais coordenadas iguais a 0. Recorde ainda
que
Xd
d
∀x ∈ R : x = x[i] ei .
i=1

Vamos provar agora a existência de C > 0 como acima. Veja que, dado x ∈ Rd qualquer
d
X
∥x∥ = ∥ x[i]ei ∥
i=1
d
X
(subaditividade) ≤ ∥x[i] ei ∥
i=1
d
X
(homogeneidade positiva) = |x[i]| ∥ei ∥
i=1
Xd
≤ |x[i]| max ∥ej ∥
1≤j≤d
i=1
= max ∥ej ∥ (|x|1 )
1≤j≤d
√ √
(| · |1 ≤ d | · |2 ) ≤ ( d max ∥ej ∥) |x|2 .
1≤j≤d

127

Logo a constante C := d max1≤j≤d ∥ej ∥ satisfaz o que queremos. Note que C > 0 porque
ei ̸= 0 para cada i e portanto ∥ei ∥ > 0 para cada i.
Provaremos agora que existe c > 0 como acima usando a primeira parte. Considere a
esfera unitária Sd−1 ⊂ Rd , dada por

Sd−1 = {x ∈ Rd : |x|2 = 1}.

Como f (x) = |x|2 = dRd (x, 0) (x ∈ Rd ) é contínua, Sd−1 = f −1 ({1}) é subconjunto fechado
de Rd . Além disso, Sd−1 é limitado. Deduzimos que a esfera Sd−1 é compacta. Além disso,
a função g(x) := ∥x∥ (com x ∈ S d−1 ) é C-Lipschitz, já que

∀x, x′ ∈ Sd−1 : |g(x) − g(x′ )| = |∥x∥ − ∥x′ ∥| ≤ ∥x − x′ ∥ ≤ C |x − x′ |2 .

Portanto, g é uma função contínua sobre um compacto e existe um x∗ ∈ Sd−1 com c :=


g(x∗ ) = inf x∈S d−1 ∥x∥. A fortiori, c > 0, já que x∗ ∈ Sd−1 ⇒ x∗ ̸= 0 e ∥ · ∥ é uma norma.
Basta checar agora que c “funciona" para nossos propósitos. Para isto, tome x ∈ Rd
qualquer. Se x = 0, claramente ∥x∥ = 0 ≥ c|x|2 = 0. Se x ̸= 0, então x/|x|2 ∈ Sd−1 , logo
∥x/|x|2 ∥ ≥ c e ∥x∥ ≥ c |x|2 pela homogeneidade positiva da norma. 2

Exercício 7.4 Mostre que quaisquer duas normas sobre um espaço de matrizes Rd×ℓ são equiva-
lentes.

7.2.2 Funções contínuas e convergência uniforme sobre compactos


asnumaberto
Nesta seção, A ⊂ Rd é um aberto com A ̸= ∅, (V, ∥ · ∥V ) é um espaço de Banach e
C := C(A, V ) é o espaço de funções contínuas de A em V . Como de costume, este
espaço tem uma estrutura de espaço vetorial, em que as somas e produtos por escalar são
definidos para cada t ∈ A.
Como podemos medir distâncias neste espaço? A definição das métricas de conver-
gência uniforme em espaços do tipo C(K, Z) que vimos nos §6.3.1 e 6.3.2 depende do
fato que K é compacto: só assim garantimos que os supremos naquelas definições fazem
sentido. Por outro lado, as métricas que pusemos sobre aqueles espaços pressupõem o
conceito de convergência uniforme, que não é o mais natutal sobre C(A, V ).

lo:unifcomp Exemplo 7.1 Considere o caso particular em que A = V = R (com as métricas/normas usuais).
A sequência de funções “fn : t ∈ R 7→ t2 /(n + 1)" converge a 0C pontualmente, mas não converge
uniformememnte já que fn (n) → +∞. No entanto, esta é uma sequência “bem comportada" em
Rb
vários sentidos: por exemplo, para quaisquer a < b reais, a fn (t) dt → 0.

A definição mais usada de convergência em C(A, V ) é a de convergência uniforme sobre


compactos. Usaremos abaixo a seguinte notação: dados K ⊂ A compacto e não vazio, e
dada f ∈ C,
∥f ∥K,∞ := sup ∥f (t)∥V .
t∈K

128
Note que este supremo é um número real porque a restrição de f a K é contínua e,
portanto, limitada. Além disso, pode-se verificar que ∥ · ∥K,∞ é homogênea positiva e
subaditiva:

∀f, g ∈ C∀λ ∈ R : ∥λ f ∥K,∞ = |λ| ∥f ∥K,∞ e ∥f + g∥K,∞ ≤ ∥f ∥K,∞ + ∥g∥K,∞ .

Note que ∥ · ∥K não é positiva-definida em geral: a função f (·) = dRd (·, K) se anula
em K, de modo que ∥f ∥K,∞ = 0, mas f > 0 em A\K. Uma função homogênea positiva e
subaditiva que não é necessariamente positiva-definida é dita uma seminorma.
A definição de convergência uniforme em compactos é dada abaixo.

Definição 7.1 Dados elementos {fn }n∈N ∪ {f } ⊂ C, dizemos que fn converge a f uniformemente
sobre compactos se limn∈N ∥fn − f ∥K,∞ = 0 para todo K ⊂ A compacto. Dizemos ainda que
{fn }n∈N é Cauchy uniformemente sobre compactos se limm,n∈N ∥fn − fm ∥K,∞ = 0 para todo
K ⊂ A compacto.

Exercício 7.5 Para esquentar, prove que a sequência de funções {fn }n∈N ⊂ C(R, R) no Exemplo
7.1 converge a 0C uniformemente sobre compactos.

O próximo teorema é o principal resultado desta subseção. Ele nos diz que a noção
de convergência uniforme sobre compactos corresponde a uma métrica bem-comportada
sobre C(A, V )

emcompactos Teorema 7.3 Existe uma métrica dC sobre C = C(A, V ) com as seguintes propriedades.

1. uma sequência em C é convergente (ou Cauchy) uniformemente sobre compactos se e somente


se ela é convergente (ou Cauchy) com a métrica dC ;

2. (C, dC ) é completo.

Trocando em miúdos: a noção de convergência uniforme sobre compactos corresponde


a uma métrica sobre C(A, V ) e o espaço métrico (C(A, V ), dC ) é completo.
Para provar este teorema, precisaremos de um resultado preliminar, que segue do
teorema de Heine-Borel.

orcompactos Lema 7.1 (Exaustão de A por número enumerável de compactos) Dado A ⊂ Rd aberto e
não-vazio, existe uma sequência de compactos {Kn }n∈N de Rd com

∅=
̸ K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A

tais que ∪n∈N Kn = A e com a propriedade que qualquer K ⊂ A compacto está contido num dos
Kn .

129
Prova: Se A = Rd , basta tomar Kn := BRd [0Rd , n] (n ∈ N) e observar que cada K ⊂ Rd é
limitado e portanto está contido numa destas bolas.
Considere agora o caso em que o aberto A ̸= Rd , de modo que F := Rd \A é fechado e
não é vazio. Isto quer dizer que a função:

“ψ : x ∈ Rd 7→ dRd (x, F ) := inf |x − y|2 ”


y∈F

é bem definida, não-negativa, 1-Lipschitz e ψ −1 (0) = F . Desta forma, A = {a ∈ Rd :


ψ(a) > 0}. Como A ̸= ∅, existe um a0 ∈ A. Desta forma, vale a seguinte propriedade:

ψ(a0 )
∀a ∈ Rd : a ∈ A ⇔ ∃n ∈ N : |a|2 ≤ n + |a0 |2 e ψ(a) ≥ . (7.2) eq:propried
n+1
A partir destas propriedade, definiremos os compactos que buscamos. De fato, veremos
que a definição a seguir funciona:
 
ψ(a0 )
Kn := a ∈ R : |a|2 ≤ n + |a0 |2 e ψ(a) ≥
d
(n ∈ N).
n+1

Para provar que de fato funciona, checamos primeiramente que os conjuntos Kn são todos
compactos de Rd . Percebe-se por inspeção que:
 
−1 ψ(a0 )
∀n ∈ N : Kn := BRd [0Rd , n + |a0 |2 ] ∩ ψ , +∞ .
n+1

Como ψ é contínua, os dois conjuntos da interseção são fechados de Rd , logo Kn também


é fechado de Rd . Além disso, Kn está contido na bola de raio n + |a0 |2 ao redor da origem
e é, portanto, limitado. Deduzimos do Teorema de Heine-Borel que cada Kn é compacto.
O próximo passo é mostrar que:

̸ K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A e ∪n∈N Kn = A.
∅=

De fato, K0 não é vazio porque vê-se que a0 ∈ K0 . O fato de que Kn ⊂ Kn+1 para cada
n ∈ N segue do fato que

ψ(a0 ) ψ(a0 )
∀a ∈ Rd : |a|2 ≤ n + |a0 | e ψ(a) ≥ ⇒ |a|2 ≤ n + 1 + |a0 | e ψ(a) ≥
n+1 n+2

(já que ψ(a0 ) > 0). Por fim, ∪n∈N Kn = A segue do fato de que, comparando (7.2) com a
definição de Kn , temos que um a ∈ Rd pertence a A se e somente se a ∈ Kn para algum
n ∈ N.
Falta apenas mostrar que todo K ⊂ A compacto está contido em algum Kn . Para isso,
fixe um tal K e observe que, como K ⊂ A, ψ(x) > 0 para todo x ∈ K. A continuidade
de ψ e a compacidade de K garantem que o ínfimo de ψ sobre K é atingido e portanto

130
inf x∈K ψ(x) > 0. Além disso, sabemos que K é limitado, logo supx∈K |x|2 < +∞. Se n ∈ N
é grande o suficiente, podemos garantir que

ψ(a0 )
inf ψ(x) ≥ e sup |x|2 ≤ n + |a0 |.
x∈K n + 1 x∈K

Deste modo, teremos:


ψ(a0 )
∀a ∈ K : |a|2 ≤ sup |x|2 ≤ n + |a0 | e ψ(a) ≥ ,
x∈K n+1
ou seja,
∀a ∈ K : a ∈ Kn .
Isto quer dizer que K ⊂ Kn se n é grande o suficiente. 2
O Lema 7.1 vai nos permitir definir a métrica que nos interessa. A ideia intuitiva seria
tomarmos uma soma das seminormas ∥ · ∥Kn ,∞ . No entanto, isso não é viável porque em
princípio seminormas podem tomar valores muito grandes. Por essa razão, a proposição
abaixo será útil.

emimetricas Proposição 7.1 Dado K ⊂ A compacto e não vazio, a função αK : C → [0, 1] definida por:

αK (f, g) := min{∥f − g∥K,∞ , 1} ((f, g) ∈ C 2 )

é simétrica, toma valores entre 0 e 1 e satisfaz a desigualdade triangular.

Prova: Omitimos a prova das duas primeiras propriedades. Resta mostrar a desigualdade
triangular. Queremos provar que, para f, g, h ∈ C:

Queremos : min{∥f − g∥K,∞ , 1} ≤ min{∥f − h∥K,∞ , 1} + min{∥h − g∥K,∞ , 1}.

Isso vem do fato que, se c, a, b são reais não-negativos,

c ≤ a + b ⇒ min{c, 1} ≤ min{a, 1} + min{b, 1},

que pode ser checado por inspeção. Aceitando isso, observamos que, pela subaditividade
da norma,
c := ∥f − g∥K,∞ ≤ a + b := ∥f − h∥K,∞ + ∥g − h∥K,∞
portanto a desigualdade acima se aplica. 2
Agora provaremos o teorema, mostrando que uma soma das “semimétricas" αKn (com
pesos adequados) nos dá a métrica que buscamos. Os exercícios abaixo serão necessários
na prova.

icamonotona Exercício 7.6 Dados K ⊂ F compactos contidos em A, mostre que αK (f, g) ≤ αF (f, g) para
todas as funções f, g ∈ C.

131
Prova: [do Teorema 7.3] Fixe uma sequência {Kn }n∈N de compactos com as propriedades
especificadas no Lema 7.1 e defina, para f, g ∈ C:
X αK (f, g)
n
dC (f, g) := ,
n∈N
2n

onde as αKn vêm da Proposição 7.1. Note que, como as funções αKn tomam valores entre
0 e 1, a série acima é cotada pela soma da progressão geométrica 1/2n . Portanto, a série é
absolutamente convergente para quaisquer f, g. Logo, dC (f, g) é bem-definida.
A próxima etapa da demonstração é mostrar o seguinte.

dC satisfaz os axiomas de uma métrica.

Em primeiro lugar, verificamos que dC é positiva-definida. De fato, dC (f, g) ≥ 0 porque


cada αKn (f, g) ≥ 0. Claramente, dC (f, g) = 0 se f = g. Por outro lado, como a série
definindo dC (f, g) é feita de termos não-negativos,

dC (f, g) = 0 ⇔ ∀n ∈ N : αKn (f, g) = 0 ⇔ ∀n ∈ N : ∥f − g∥Kn ,∞ = 0.

Em particular, se f (t) ̸= g(t) para algum t ∈ A, o Lema 7.1 garante que t ∈ Kn para algum
n ∈ N (afinal, A = ∪n Kn ) e vê-se que ∥f − g∥Kn ,∞ ≥ |f (t) − g(t)| > 0. Ou seja, f ̸= g
implica dC (f, g) > 0. Isto concui a prova de que dC é positiva-definida. (Repare que aqui
usamos o fato de que A = ∪n∈N Kn pela primeira vez. A outra propriedade garantida pelo
Lema só será usada mais para o final da prova abaixo.)
Ainda nos resta provar que dC é simétrica e satisfaz a desigualdade triangular. Para isso,
usamos novamente a Proposição 7.1: a simetria vem do fato de que cada αKn é simétrica
e a desigualdade triangular vem do fato que, dadas f, g, h ∈ C:

∀n ∈ N : αKn (f, g) ≤ αKn (f, h) + αKn (h, g)

e podemos aplicar isso termo a termo na definição de dC (usando o fato de que séries
absolutamente convergentes podem ser “somadas termo a termo"). Concluímos assim a
prova de que dC é de fato uma métrica.

Nosso próximo passo é relacionar a convergência e a propriedade de Cauchy segundo


dC aos conceitos de convergência e Cauchy uniformes sobre compactos. Para isso, a afir-
mação a seguir será fundamental: ela relaciona o comportamento de dC e das seminormas
∥ · ∥Kn ,∞ (ou melhor, com as semimétricas αKn definidas a partir destas normas).

ifcompactos Afirmação 7.1 Dado n0 ∈ N, valem as desigualdades:

αKn0 (f, g) 1
∀f, g ∈ C : ≤ dC (f, g) ≤ 2α Kn (f, g) + .
2n0 0
2n0
132
Prova: [da Afirmação 7.1] A cota inferior segue da definição de dC e do fato que todos os
termos da forma αKn (f, g)/2n aparecendo naquela definição são não-negativos.
Para a cota superior, usamos as seguintes estimativas:
αKn0 (f, g), se 0 ≤ n ≤ n0 (pelo Exercício 7.6);

αKn (f, g) ≤
1, se n > n0 (pela Proposição 7.1).
Deste modo,
+∞
X αKn (f, g)
dC (f, g) =
n=0
2n
n0
X αKn0 (f, g) X 1
≤ +
n=0
2n n>n
2n
0

1
= (2 − 2−n0 ) αKn0 (f, g) +
2n0
1
≤ 2αKn0 (f, g) + .
2n0
2
De posse da afirmação, vai ser relativamente fácil terminar a prova. Começamos
mostrando o seguinte.
Dadas {fj }j∈N ∪ {f } ⊂ C, dC (fj , f ) → 0 se e somente se fj → f uniformemente sobre
compactos.
Para ver isso, suponha primeiramente que dC (fj , f ) → 0. Dado K ⊂ A compacto e
não-vazio, queremos provar que ∥fj − f ∥K,∞ → 0, o que é o mesmo que αK (fj , f ) → 0.
O Lema 7.1 garante que K ⊂ Kn0 para algum n0 ∈ N e então o Exercício 7.6 garante que
αK (fj , f ) ≤ αKn (fj , f ). Usando a Afirmação, concluímos que
0 ≤ αK (fj , f ) ≤ αKn0 (fj , f ) ≤ 2n0 dC (fj , f ) → 0,
e um raciocínio de sanduíche implica αK (fj , f ) → 0.
Por outro lado, se fj → f uniformemente sobre compactos, temos que αK (fj , f ) → 0
para todo K ⊂ A compacto. Em particular, isso vale quando K = Kn0 para qualquer
n0 ∈ N. Segue da Afirmação que:
1 1
∀n0 ∈ N : lim sup dC (fj , f ) ≤ 2 lim sup αKn0 (fj , f ) + n
= n0 .
j∈N j∈N 2 0 2
Como isto vale para todo n0 ∈ N, podemos mandar n0 → +∞ e obter:
lim sup dC (fj , f ) ≤ 0,
j∈N

o que garante que dC (fj , f ) → 0.


Agora tratamos de propriedades tipo Cauchy.

133
Dada {fj }j∈N ⊂ C, dC (fj , fℓ ) → 0 se e somente se {fj }j∈N é uniformemente Cauchy
sobre compactos.
A prova é bastante parecida com a anterior e será apenas esboçada. Se {fj }j∈N é Cauchy
sobre compactos, então ∥fj −fℓ ∥Kn ,∞ → 0 (e portanto αKn (fj , fℓ ) → 0) para qualquer n ∈ N.
Fixando um n0 ∈ N\{0}, a Afirmação nos dá a estimativa:
1
dC (fj , fℓ ) ≤ 2αKn0 (fj , fℓ ) + .
2n0
Tomando j, ℓ → +∞, deduzimos:
1
∀n0 ∈ N : lim sup dC (fj , fℓ ) ≤
j,l→+∞ 2n0
e podemos concluir que dC (fj , fℓ ) → 0 como na prova anterior.
Suponha agora que {fj }j∈N é Cauchy de acordo com a métrica dC . Fixo um compacto
K ⊂ A, precisamos mostrar que ∥fj − fℓ ∥K,∞ → 0 quando j, ℓ → +∞. De fato, é fácil ver
que é equivalente mostrar que αK (fj , fℓ ) → 0. Para isso, seguimos o raciocínio anterior,
tomando n0 ∈ N com K ⊂ Kn0 e observando que
j,ℓ→+∞
0 ≤ αK (fj , fℓ ) ≤ 2n0 dC (fj , fℓ ) −→ 0,
donde segue o αK (fj , fℓ ) → 0.
Para terminar a prova, mostramos a afirmação final do teorema.
(C, dC ) é completo.
Tome uma sequência {fj }j∈N que é Cauchy segundo dC . Mostramos abaixo que existe
f ∈ C com dC (fj , f ) → 0.
Em primeiro lugar, sabemos (pelos itens acima) que {fj }j∈N é uniformemente Cauchy
sobre compactos. Em particular, para cada t ∈ A, {fj (t)}j∈N ⊂ V é Cauchy (já que {t} é
compacto) e existe o limite pontual:
f (t) := lim fj (t).
j→+∞

Além disso, podemos provar pelo raciocínio usual que ∥fj − f ∥K,∞ → 0 para qualquer
K ⊂ A compacto.
Dado t ∈ A arbitrário, precisamos mostrar que f é contínua em t. Para isso, usamos que
A é aberto e portanto existe um δ > 0 tal que a bola fechada BRd [t, δ] ⊂ A. Como esta bola
fechada é compacta (por Heine-Borel!), fj → f uniformemente sobre a bola. Mas sabemos
que o limite uniforme de funções contínuas sobre um compacto é uma função contínua.
Deduzimos que a restrição de f à bola BRd [t, δ] é contínua, o que implica (exercício!) a
continuidade de f em t.
Agora, sabemos que f é contínua em cada t ∈ A, logo f ∈ C. Como vimos acima,
∥fj − f ∥K,∞ → 0 para qualquer K ⊂ A compacto. Já sabemos que isso é equivalente a
dC (fj , f ) → 0. Ou seja: provamos (como queríamos) que {fj }j∈N converge em C. 2

134
7.3 Compactos nos espaços de funções contínuas
Acima mostramos que os subconjuntos compactos de Rd têm uma “cara" simples: são
simplesmente os fechados e limitados. Em particular, bolas fechadas são sempre compac-
tas. Abaixo, veremos que este resultado não se estende a espaços de funções contínuas.
No entanto, conseguiremos uma caracterização dos compactos via um teorema chamado
de Arzelà-Ascoli.

7.3.1 Bolas fechadas não são compactas


Considere C([0, 1], R) com a norma do sup usual. É um fato que existe uma sequência
{fn }n∈N ⊂ C([0, 1], R) de funções com ∥fn ∥[0,1],∞ = 1 e ∥fn − fm ∥[0,1],∞ = 1 para todos
m, n ∈ N. Portanto a bola unitária fechada ao redor de 0 não é totalmente limitada: ela
contem um 1/2-empacotamento infinito.

Exercício 7.7 Cheque que a sequência de "tendas" construída no Exemplo 3.2 tem as propriedades
requeridas acima acima.

Na verdade, o que ocorre é um fenômeno muito mais geral: C([0, 1], R) não tem bolas
compactas porque não é um espaço vetorial de dimensão finita.

Lema 7.2 (Lema de Riesz) Considere um espaço de Banach (V, ∥ · ∥V ). Então, as bolas fechadas
de V são compactas se e somente se V tem dimensão finita.

Não provaremos este resultado aqui, embora a prova não seja muito difícil. No entanto,
ele indica que um critério para achar quem são os compactos de C([0, 1], Rd ) tem de ser
mais complicado que o teorema de Heine-Borel. Veremos o critério adequado quando
estudarmos o teorema de Arzèla-Ascoli, no capítulo adequado.

7.3.2 O teorema de Arzelà-Ascoli


sub:AA
Agora passamos ao contexto geral em que (K, dK ) é compacto, (Z, dZ ) é completo e
C := C(K, Z) é espaço métrico com a norma do supremo:

dC (f, g) := sup dZ (f (t), g(t)).


t∈K

Como podemos caracterizar os compactos de C? Como C é completo, sabemos que F ⊂ C


é compacto se e somente se é fechado e totalmente limitado. O teorema a seguir – um
resultado fundamental de Análise – mostra quem são os subconjuntos uniformemente
limitados de C. Abaixo, recorde que mf (·) é o módulo de continuidade de f : K → Z,
definido como no §6.3.3:

mf (δ) := sup{dZ (f (x), f (x′ )) : x, x′ ∈ K, dX (x, x′ ) ≤ δ} (f : K → Z, δ > 0).

135
teo:AA Teorema 7.4 (Arzelà-Ascoli) Uma família de funções F ⊂ C(K, Z) (com (K, dK ) compacto e
(Z, dZ ) completo) é totalmente limitada se e somente se ela tem as duas propriedades abaixo.

1. F é pontualmente totalmente limitada: dado qualquer t ∈ K, o conjunto de valores

F(t) := {f (t) : f ∈ F}

é totalmente limitado.

2. F é equicontínua: limδ→0+ supf ∈F mf (δ) = 0.

Observação 7.1 Em particular, o teorema nos diz que, se F ⊂ C satisfaz 1 e 2, então toda
sequência em F tem uma subsequência convergente.

A prova do Teorema 7.4 está contida nos Lemas 7.3 e 7.4 abaixo. Antes de apresentar
os lemas, vamos tentar entender as duas condições no teorema. O ponto é que as duas
condições valem se F tem um número finito de funções: a propriedade 1 é trivial e a 2
vale porque cada f ∈ C é uniformemente contínua e portanto limδ→0+ mf (δ) = 0 para cada
f ∈ F. O que o teorema nos diz, para famílias gerais de funções, é que as propriedades 1
e 2 valem se e somente se F pode ser bem aproximada por uma família finita de funções;
isto é, se F tem ε-redes finitas para qualquer ε > 0.
O próximo resultado mostra uma direção do Teorema de Arzèla-Ascoli.

Anecessario Lema 7.3 (Necessidade das condições no teorema) Com a notação do Teorema 7.4, vale que,
se F é totalmente limitada, então valem as condições 1 e 2.

Prova: Suponha que F é totalmente limitada e fixe um ε > 0 qualquer. Iremos mostrar
que:

(i) Dado t ∈ K, podemos cobrir F(t) por um número finito de bolas fechadas de raio ε.

(ii) Temos que lim supδ→0+ supf ∈F mf (δ) ≤ 2ε.

De fato, se (i) vale para qualquer ε > 0, isto nos diz que cada conjunto F(t) pode
ser coberto por um número finito de bolas de raio ε; ou seja, cada F(t) é totalmente
limitado. Ao mesmo tempo, se (ii) vale para qualquer ε > 0, lim supδ→0+ supf ∈F mf (δ) ≤ 0
e (como mf (δ) ≥ 0 sempre) temos limδ→0+ supf ∈F mf (δ) = 0. Portanto, provar (i) e (ii) será
suficiente para concluir a prova deste lema.
Para demonstrar (i) e (ii), usaremos o fato de que F é totalmente limitado. Deste modo,
existe uma ε-rede finita R ⊂ F, que satisfaz:

∀f ∈ F∃gf ∈ R : dC (gf , f ) ≤ ε. (7.3) eq:redeAAvo

A existência desta rede finita nos permite provar a propriedade (i). De fato, veremos
que
R(t) := {g(t) : g ∈ R}

136
é ε-rede de F(t) (e é finita porque R é finito). Para mostrar isso, tome um a ∈ F(t)
qualquer. Pela definição de F(t), a = f (t) para alguma f ∈ F. Considere agora gf ∈ R
como em (7.3) e note que b := gf (t) ∈ R(t) satisfaz:

dZ (a, b) = d(f (t), gf (t)) ≤ sup dZ (f (s), gf (s)) = dC (f, gf ) ≤ ε.


s∈K

Portanto, dado a ∈ F(t), há um b ∈ R(t) com dZ (a, b) ≤ ε. Ou seja, R(t) é mesmo ε-rede.
Agora usaremos R para mostrar a propriedade (ii). Observe que, dados quaisquer
x, x′ ∈ K com dX (x, x′ ) ≤ δ e qualquer f ∈ F (com gf como em (7.3))

dZ (f (x), f (x′ )) ≤ dZ (gf (x), gf (x′ )) + dZ (gf (x), f (x)) + dZ (gf (x′ ), f (x′ ))
≤ sup dZ (gf (t), gf (s)) + 2 sup dZ (gf (x), gf (x′ ))
s,t∈K : dX (s,t)≤δ t∈K

(use defs. de mgf e dC ) ≤ mgf (δ) + 2dC (f, gf )


(use (7.3) e gf ∈ R) ≤ max mg (δ) + 2ε.
g∈R

Note que usamos maxg∈R (e não supg∈R ) na última linha porque R é finito. Note ainda
que este último termo é independente de f, x, x′ . Ou seja, a desigualdade

dZ (f (x), f (x′ )) ≤ max mg (δ) + 2ε


g∈R

vale para toda função f ∈ F e para todos os pares de pontos x, x′ ∈ K com dX (x, x′ ) ≤ δ.
Tomando supremos, deduzimos que:

sup mf (δ) ≤ max mg (δ) + 2ε.


f ∈F g∈R

Como já observamos antes da prova do teorema, o fato de que K é compacto implica


que cada g ∈ R é uniformemente contínua, de modo que limδ→0+ mg (δ) = 0. Usando
novamente a finitude de R, deduzimos que limδ→0+ maxg∈R mg (δ) = 0. Portanto,

lim sup sup mf (δ) ≤ 2ε,


δ→0+ f ∈F

o que prova (ii). 2


Finalmente, apresentamos o fim da prova do Teorema 7.4.

Asuficiente Lema 7.4 (Suficiência das condições no teorema) Com a notação do Teorema 7.4, se F satis-
faz as condições 1 e 2, então F é totalmente limitada.

Prova: Provaremos que, dado qualquer ε > 0, se F satisfaz 1 e 2, então F não contem um
ε-empacotamento infinito. Isso basta pela Proposição 6.7.
Como faremos isso? A prova será por contradição. Suporemos que F satisfaz as
propriedades 1 e 2 e ao mesmo tempo contem um ε-empacotamento infinito. Veremos

137
que isso implicaria a existência de um (ε/2)-empacotamento infinito em F(t1 ) × F(t2 ) ×
. . . F(tk ), para alguma escolha de pontos t1 , . . . , tk ∈ K. Veremos que isso contradiz o fato
de que cada F(ti ) é totalmente limitado (a propriedade 1 no teorema).
Uma questão crucial é como escolher os pontos ti . A ideia é que estes pontos sejam tais
que cada função f ∈ F seja “bem representada" pelos valores f (ti ) nos pontos t1 , . . . , tk .
Para isso, usaremos a propriedade 2: sabemos controlar uniformemente sobre f ∈ F a
variação de f (t) quando t muda: deste modo, bastará tomar uma δ-rede {t1 , . . . , tk } para
um δ bem escolhido para garantir que os valores de f (ti ) “determinam f a menos de um
erro pequeno". A afirmação abaixo apresenta este raciocínio de forma precisa.

Afirmação 7.2 Dado ε > 0, e supondo que F satisfaz 1 e 2, existem um k ∈ N\{0} e pontos
t1 , . . . , tk ∈ K tais que, se
ε
∀f1 , f2 ∈ F : max dZ (f1 (ti ), f2 (ti )) ≤ dC (f1 , f2 ) ≤ max dZ (f1 (ti ), f2 (ti )) + .
1≤i≤k 1≤i≤k 2

Prova: [da Afirmação] Como ε > 0, a propriedade 2 implica que existe um δ > 0 tal que
supf ∈F mf (δ) ≤ ε/4. Como K é compacto (e portanto totalmente limitado), existe uma
δ-rede finita {t1 , . . . , tk } ⊂ K. Pela definição de δ-rede, sabemos que, para cada x ∈ K,
existe um ti com dX (x, ti ) ≤ δ, de modo que dZ (f (ti ), f (x)) ≤ ε/4 para qualquer f ∈ F.
Mas então, dadas quaisquer f1 , f2 ∈ K e dado qualquer x ∈ K:
ε
∃1 ≤ i ≤ k : dZ (f1 (x), f2 (x)) ≤ dZ (f1 (ti ), f2 (ti )) + 2mf (δ) ≤ max dZ (f1 (ti ), f2 (ti )) + .
1≤i≤k 2

Em particular, tomando o sup em x, deduzimos:


ε
∀f1 , f2 ∈ F : dC (f1 , f2 ) ≤ max dZ (f1 (ti ), f2 (ti )) + .
1≤i≤k 2

Isso dá a cota inferior na desigualdade que consta do enunciado da Afirmação. A cota


inferior vem do fato que dZ (f1 (t), f2 (t)) ≤ dC (f1 , f2 ) para quaisquer f1 , f2 ∈ C e t ∈ K.
[Fim da prova da afirmação] 2
Para fazermos uso da afirmação, é conveniente criar um pouco de notação. Defina
Ti := F(ti ) ⊂ Z e di a restrição da métrica de Z a Ti . Consideraremos o espaço-produto:

T := T1 × T2 × · · · × Tk

munido da métrica-produto:

dT (x, y) := max dTi (x[i], y[i]) (x = (x[i])ki=1 , y = (y[i])ki=1 ∈ T ).


1≤i≤k

A propriedade 1 no Teorema garante que cada (Ti , di ) é totalmente limitado. O Exercício


6.16 implica que (T, dT ) também é totalmente limitado. Note que a função ϕ : F → T

138
associando a cada f ∈ F o vetor ϕ(f ) ∈ T com coordenadas ϕ(f )[i] := f (ti ) (1 ≤ i ≤ k) é
bem definida. A Afirmação garanate que:
ε
∀f1 , f2 ∈ F : dT (ϕ(f1 ), ϕ(f2 )) ≤ dC (f1 , f2 ) ≤ dT (ϕ(f1 ), ϕ(f2 )) + .
2
Agora usaremos a suposição (que fizemos para chegar a uma contradição) que há um
ε-empacotamento infinito P ⊂ F. Num ε-empacotamento, como sabemos, quaisquer dois
elementos distintos estão a distância estritamente maior do que ε um do outro. Disso
deduzimos que:
ε ε
∀f1 , f2 ∈ P : f1 ̸= f2 ⇒ dT (ϕ(f1 ), ϕ(f2 )) ≥ dC (f1 , f2 ) − > .
2 2
Dito de outro modo, a função ϕ é injetiva sobre P e a imagem deste conjunto,

ϕ(P ) := {ϕ(f ) : f ∈ P } ⊂ T,

é um (ε/2)-empacotamento infinito em (T, dT ). No entanto, a existência de ϕ(P ) contradiz


o fato de que (T, dT ) é totalmente limitado, que (como vimos) segue da propriedade 1 no
Teorema e do Exercício 6.16. Isto quer dizer que chegamos a uma contradição. Portanto,
qualquer família F satisfazendo as propriedades 1 e 2 do Teorema tem de ser totalmente
limitada. 2

Exercício 7.8 Ao invés de fazermos uma prova por contradição, poderíamos apresentar um ar-
gumento direto mostrando que P (F, ε) ≤ P (T, ε/2), para o T construído acima. Utilize esta
observação e o Exercício 6.16 para achar uma cota superior para P (F, ε) (e portanto para N (F, ε))
em termos de supt∈K N (F(t), ε) e N (K, δ).

7.4 Mais exercícios


Exercício 7.9 Fixo d ∈ N\{0}, consideramos o conjunto Pd de todos os polinômios em uma
variável real que têm grau d ou menor. Observe que, para cada polinômio p ∈ Pd , podemos
encontrar coeficientes a0 (p) . . . ad (p) tais que:

d
X
∀x ∈ R : p(x) = aj (p) xj .
j=0

Mostre que, dado qualquer conjunto S ⊂ R com mais de d + 1 pontos, existe uma constante Cd,S
dependendo apenas de d e S tal que:

∀p ∈ Pd : max |ai (p)| ≤ Cd,S sup |p(x)|.


0≤i≤d x∈S

139
Exercício 7.10 Deduza do Teorema de Heine-Borel o seguinte resultado: dados d, ℓ naturais
positivos, um subconjunto K ⊂ Rd×ℓ é compacto (com a topologia dada por qualquer norma) se
e somente se ele é fechado e limitado. Use este resultado para decidir se os conjuntos abaixo são
subconjuntos compactos de Rd×d .
1. O(d) := {A ∈ Rd×d : AT A = Id×d } (grupo das matrizes ortogonais d × d);
2. SL(d, R) := {A ∈ Rd×d : det(A) = 1} (grupo linear especial em d dimensões);
3. PSD1 (d, R) := {A ∈ Rd×d : A = AT , ∀v ∈ Rd , v.Av ≥ 0 e tr(A) = 1}.

Exercício 7.11 Tome d ∈ N\{0}. Lembre-se de Álgebra Linear que um autovalor de uma matriz
A ∈ Rd×d é um número λ ∈ R tal que Ax = λx para algum x ∈ Rd \{0Rd }. Dado um conjunto
S ⊂ Rd×d , defina:

Eig(S) := {λ ∈ R : λ é autovalor de alguma A ∈ S}.

1. Prove que Eig(S) é limitado sempre que S é limitado.


2. Prove que Eig(S) é compacto sempre que S é compacto.

Exercício 7.12 Prove que um espaço métrico (K, dK ) é compacto se e somente se, dada qualquer
função contínua f : K → R, a imagem f (K) ⊂ R é compacta.

Exercício 7.13 Considere K ⊂ Rd compacto e convexo (convexidade significa que, dados quais-
quer dois pontos x, x′ ∈ K, o segmento [x, x′ ] := {(1 − λ)x + λx′ : 0 ≤ λ ≤ 1} está todo contido
em K). Mostre que um subconjunto F ⊂ C(K, Rℓ ) é totalmente limitado se e somente se ele é
equicontínuo e existe um ponto t0 ∈ K tal que F(t0 ) := {f (t0 ) : f ∈ F} é limitado.

Exercício 7.14 Fixados α > 0 e espaços métricos (K, dK ), (Z, dZ ) como no início do §7.3.2,
dizemos que uma f : K → Z é α-Hölder com constante L > 0 se:

∀x, x′ ∈ K : dZ (f (x), f (x′ )) ≤ L dK (x, x′ )α .

Note que este conceito generaliza o conceito de função Lipschitz (o caso α = 1 da definição acima).
1. Mostre que toda f que é α-Hölder com alguma constante também é contínua.
2. No caso particular em que K ⊂ Rd é compacto e convexo (v. exercício anterior) e dK é a
métrica induzida por | · |2 , mostre que

f : K → Z α-Hölder com α > 1 ⇔ f constante.

3. Permita novamente que (K, dK ) seja um espaço métrico compacto arbitrário e agora considere
Z = Rd com a métrica usual. Fixos L, α > 0 e um par (t0 , z0 ) ∈ K × Rd , mostre que o
conjunto a seguir é um subconjunto compacto de (C(K, Z), dC ):

HL,α,t0 ,z0 = {f : K → Rd : f é α-Hölder com constante L e f (t0 ) = z0 }.

140
Exercício 7.15 (Arzèla-Ascoli para funções contínuas sobre um aberto) Dado A ⊂ Rd aberto,
considere o espaço C(A, V ) com a métrica dC apresentada no §7.2.2. Dada uma função f ∈
C(A, V ), podemos definir, para cada compacto K ⊂ A, a restrição de f a K, denotada por f |K .
Prove que uma família F ⊂ C(A, V ) é totalmente limitada de acordo com a métrica dC se e somente
se ele tem as seguintes propriedades:
1. F é pontualmente totalmente limitada, isto é, para todo t ∈ A,

F(t) := {f (t) : f ∈ F} é totalmente limitado;

2. F é equicontínua sobre compactos, isto é, para todo compacto não-vazio K ⊂ A:

lim sup mf |K (δ) = 0.


δ→0+ f ∈F

Deduza que toda sequência {fn }n∈N ⊂ C(A, V ) com as duas propriedades acima tem uma sub-
sequência {fnk }k∈N com fnk → f ∈ C(A, V ) uniformemente sobre compactos.

Exercício 7.16 (Teorema de Dini) Considere um espaço topológico compacto (X, T ) e funções
contínuas {f } ∪ {fn : n ∈ N} de X em R. Suponha que para todo x ∈ X a sequência {fn (x)}n∈N
é monótona crescente e converge a f . Prove que fn tem de convergir uniformemente a f , isto é
supx∈X |fn (x) − f (x)| → 0 quando n → +∞.

Exercício 7.17 Recorde o Exercício 4.18. Naquele problema, tomamos um espaço métrico (X, dX )
e uma f : X → R dada. Dado M > 0, definimos uma nova função fM : X → R,

fM (x) := inf (f (y) + M dX (x, y)) (x ∈ X).


y∈X

e mostramos que ∥fM ∥Lip ≤ M .


1. Mostre que, se (X, dX ) é compacto e f é contínua, então fM → f uniformemente. Deduza
que as funções Lipschitz são densas em C(X, R) com a métrica do sup.

2. Suponha agora que X = A é aberto de Rd e dX é a métrica induzida pela norma Euclideana


sobre A. Prove que fM → f uniformemente sobre compactos; portanto, as funções Lipschitz
também são densas em C(A, R) com a métrica da convergência uniforme sobre compactos.

Exercício 7.18 Considere um conjunto S ⊂ Rd não-vazio. Dizemos que uma curva (isto é, uma
função contínua) γ : [0, 1] → Rd cobre S se γ([0, 1]) ⊃ S. Suponha agora que o conjunto

CS := {γ : [0, 1] → Rd : γ cobre S e ∥γ∥Lip < +∞}

não é vazio. Mostre que existe um elemento γ⋆ ∈ CS com

∥γ⋆ ∥Lip = inf{∥γ∥Lip : γ ∈ CS }.

141
142
Capítulo 8

Caminhos e conexidade

Se neste momento faz 30o C no Rio de Janeiro e −10o C em São Petesburgo, podemos
garantir que qualquer temperatura entre −10o e 30o C ocorre em algum ponto da superfície
do planeta? Este é um exemplo de uma classe mais geral de perguntas.

Dada uma função real f : X → R, se ela atinge um par de valores a < b, é necessa-
riamente verdade que ela atinge todos os valores entre a e b? Ou seja, quando vale a
implicação:
“∀a, b ∈ f (X) : a < b ⇒ [a, b] ⊂ f (X)”?

Pelo Teorema do Valor Intermediário, a implicação acima vale quando X ⊂ R é um


intervalo e f é contínua.
O conceito de conexidade de um espaço topológico, apresentado neste capítulo, pode ser
definido da seguinte maneira: um espaço é conexo se e somente se toda função contínua
de X em R tem a “Propriedade do Valor Intermediário" descrita acima. Outra definição,
equivalente a esta, é que um espaço topológico (X, T ) é conexo se toda divisão de X
em duas partes não-triviais gera uma “quebra", ou melhor, uma “fronteira" onde as duas
partes se encostam. A equivalência dessas definições é parte do Teorema 8.1 abaixo.
Além de falarmos de conexidade, falaremos de uma outra definição relacionada: a
de conexidade por caminhos: um espaço é conexo por caminhos se quaisquer dois pontos
são conectados por uma curva contínua. Este segundo conceito é menos geral que a
conexidade topológica, mas é mais intuitivo que o primeiro e também é importante. Além
disso, há alguns casos importantes em que os dois conceitos coincidem. Começamos,
então, falando de conexidade por caminhos.

8.1 Conexidade por caminhos


8.1.1 Conectando pontos por curvas
Fixe um espaço métrico (X, dX ). Uma curva parametrizada é uma aplicação contínua
γ : [0, 1] → X. Dizemos que γ conecta x ∈ X a x′ ∈ X se γ(0) = x e γ(1) = x′ . Dizemos

143
ainda que γ conecta x a x′ em U ⊂ X se x, x′ ∈ U , γ conecta estes dois pontos e a imagem
U
Im(γ) ⊂ U . Simbolizaremos esta relação pelo símbolo x ↔ x′ .
U
Definição 8.1 Dizemos que U ⊂ X é conexo por caminhos se x ↔ x′ para todos x, x′ ∈ U .

Antes de compreender melhor esta definição, precisaremos de alguns fatos sobre a


U
relação “↔". O primeiro ponto é mostrar que esta é uma relação de equivalência sobre os
elementos de U .

em:caminhos Lema 8.1 Dados x, x′ , x′′ ∈ U , temos:


U
• Reflexividade: x ↔ x.
U U
• Simetria: x ↔ x′ se e somente se x′ ↔ x.
U U U
• Transitividade: x ↔ x′ e x′ ↔ x′′ implicam x ↔ x′′ .

Prova: Reflexividade segue do fato de que a curva γ(t) ≡ x, t ∈ [0, 1], conecta x a x.
Simetria vem do fato que γ conecta x a x′ se e somente se t 7→ γ(1 − t) conecta x′ a x, e
tanto γ quanto t 7→ 1 − t são contínuas.
U U U
Por fim, suponha x ↔ x′ ↔ x′′ . Queremos demonstrar que x ↔ x′′ , ou seja, que há
uma curva que conecta x a x′′ em U . Veja primeiramente que, por hipótese, existem curvas
γ0 , γ1 : [0, 1] → U com γ0 (0) = x, γ0 (1) = γ1 (0) = x′ e γ1 (1) = x′′ . Defina agora:

γ0 (2t), 0 ≤ t ≤ 1/2;
γ(t) :=
γ1 (2t − 1), 1/2 < t ≤ 1.
A ideia é que nós “colamos" a curva γ0 com a curva γ1 , o que resulta numa única curva
contínua porque γ0 termina onde γ1 começa. De fato, supondo por um instante que γ
é contínua, vemos que γ(t) ∈ U para todo t (afinal, γ(t) = γ0 (s) ou γ1 (s) para algum
U
s ∈ [0, 1]) e conecta x a x′′ , de modo que x ↔ x′′ .
Falta checar que γ é mesmo contínua. Há várias maneiras de fazer isso e aqui optamos
pela mais topológica.
Dado um conjunto F ⊂ U fechado em U , vamos mostrar que γ −1 (F ) ⊂ [0, 1] é fechado.
Veja que, dado um t ∈ [0, 1] qualquer,
t ∈ γ −1 (F ) ⇔ (t ≤ 1/2 e γ0 (2t) ∈ F ) ou (t ≥ 1/2 e γ1 (2t − 1) ∈ F ).
O ponto sutil acima é que as duas cláusulas do “ou" serão verdade simultaneamente no
caso em que t = 1/2. Isto vem do simples fato que γ0 (2t) = x′ = γ1 (2t − 1) se t = 1/2. Aqui
usamos o fato de que γ0 termina onde γ1 começa, que é fundamental para termos a continuidade.
Vamos agora terminar a prova observando o seguinte. Defina as funções contínuas
ϕ0 (t) := 2t, definida para t ∈ [0, 1/2], e ϕ1 (s) := 2s − 1, para s ∈ [1/2, 1]. A equivalência
acima nos mostra que
γ −1 (F ) = (γ0 ◦ ϕ0 )−1 (F ) ∪ (γ1 ◦ ϕ1 )−1 (F ).

144
Como γ0 , γ1 , ϕ0 e ϕ1 são contínuas, temos que (γ0 ◦ ϕ0 )−1 (F ) ⊂ [0, 1/2] é fechado em [0, 1/2]
e (γ1 ◦ ϕ1 )−1 (F ) ⊂ [1/2, 1] é fechado em [1/2, 1]. Como ambos os intervalos são fechados,
deduzimos que (γ0 ◦ ϕ0 )−1 (F ) e (γ1 ◦ ϕ1 )−1 (F ) são ambos fechados em [0, 1] e portanto
γ −1 (F ), que é a união dos outros dois, também é fechado em [0, 1], como queríamos
demonstrar. 2

8.1.2 Exemplos básicos


Vamos agora estudar alguns casos de conjuntos conexos por caminhos.

Exemplo 8.1 Os conjuntos conexos por caminhos em R são exatamente os intervalos.

Observe que um conjunto I ⊂ R é um intervalo se e somente se, dados x, x′ ∈ I com


x < x′ , temos que qualquer ponto z ∈ (x, x′ ) está em I. Desta forma, sempre que I é um
intervalo e x < x′ estão em I, temos que a curva γ(t) := (1 − t) x + t x′ (t ∈ [0, 1]) conecta
I
x a x′ em I, o que quer dizer que x ↔ x′ e vice-versa. Ou seja, se I é intervalo, então I é
conexo por caminhos.
Para ter a recíproca, suponha que I ⊂ R é conexo por caminhos. Queremos mostrar que
I é um intervalo, isto é, que, dados x, x′ ∈ I com x < x′ , então qualquer ponto z ∈ (x, x′ )
está também em I. Considere x < x′ como acima e tome uma curva contínua γ : [0, 1] → I
conectando x a x′ em I. Esta é uma aplicação contínua de [0, 1] em R, portanto o Teorema
do Valor Intermediário nos garante que, dado z ∈ (x, x′ ), há um t ∈ (0, 1) com γ(t) = z.
Em particular, como a imagem de γ está contida em I, isto quer dizer que z = γ(t) ∈ I.
Como z ∈ (x, x′ ) é arbitrário, isto encerra a prova.

plo:convexo Exemplo 8.2 Seja (V, ∥ · ∥V ) um espaço vetorial normado e C ⊂ V um conjunto convexo, isto
é tal que, dados quaisquer v, v ′ ∈ C e t ∈ [0, 1], (1 − t) v + tv ′ ∈ C. Geometricamente, isto quer
dizer que, dados dois pontos em C, todo o segmento de reta entre eles também está em C.

Veja que claramente C é conexo por caminhos: dados v, v ′ , a curva γ(t) = (1 − t) v + t v ′ ,


C
que é contínua (por quê?), demonstra que v ↔ v ′ . O mais interessante é mostrar que toda
bola em V é convexa. De fato, se R > 0 e v0 ∈ V , a bola B(v0 , R) é dada por:

B(v0 , R) = {v ∈ V : ∥v − v0 ∥V < R.}

Mas então, para quaisquer v, v ′ ∈ B(v0 , R) e t ∈ [0, 1], temos ∥v − v0 ∥V < R, ∥v ′ − v0 ∥V < R
e portanto

∥(1 − t)v + tv ′ − v0 ∥V = ∥(1 − t)(v − v0 ) + t(v ′ − v0 )∥V


≤ (1 − t)∥v − v0 ∥V + t∥v ′ − v0 ∥V
< (1 − t)R + tR = R,

ou seja, (1 − t)v + tv ′ ∈ B(v0 , R).

145
Exemplo 8.3 Suponha que U, V ⊂ X são conexos por caminhos e têm um ponto em comum.
Então U ∪ V é conexo por caminhos.
U
De fato, seja x0 ∈ U ∩ V . Então, para todo x ∈ U ∪ V , ou x ∈ U e x ↔ x0 (já que U é
V U ∪V
conexo por caminhos), ou x ↔ x0 (e vale o análogo para V ). Em ambos os casos, x ↔ x0
U ∪V
e a transitividade desta relação garante que x ↔ x′′ para quaisquer x, x′′ ∈ U ∪ V .

Exemplo 8.4 Seja U ⊂ X conexo por caminhos. Para qualquer função contínua f : U → Y , a
imagem f (U ) é conexa por caminhos. Em particular, se Y = R, f (U ) é um intervalo.

Para ver isso, observe que, dados x, x′ ∈ U e uma curva γ ligando estes dois pontos em
U , a composição f ◦ γ é contínua e conecta f (x) a f (x′ ) em f (U ). Deste modo, como todos
os pares de pontos em U são conectados por curvas em U , quaisquer dois pontos y = f (x),
y ′ = f (x′ ) em f (U ) são conectados por caminhos em f (U ). Ou seja, f (U ) é conexo por
caminhos.

sferaconexa Exemplo 8.5 Dado d ∈ N\{0, 1}, a esfera unitária Sd−1 ⊂ Rd é conexa por caminhos.

Para provar este resultado, a ideia geométrica é a seguinte: dados x, x′ ∈ Sd−1 , podemos
pensa na interseção da esfera com o plano que passa por x, x′ e a origem de Rd . Esta
interseção é um círculo que passa pelos dois pontos e podemos tomar o arco do círculo
entre x e x′ como a curva que conecta os dois pontos.
Formalizamos este raciocínio usando geometria analítica. Tome x, x′ ∈ Sd−1 . Como
ambos os vetores estão na esfera, eles têm norma 1 e podemos achar um vetor x⊥ tal que:
p
x′ = (x.x′ ) x + 1 − (x.x′ )2 x⊥ .

Como |x.x′ | ≤ 1 por Cauchy Schwartz, podemos também escrever x.x′ = cos θ para
algum √0 ≤ θ ≤ π; deste modo, sin θ ≥ 0 e a relação cos2 θ + sin2 θ = 1 nos diz que
sin θ = 1 − cos2 θ. Deduzimos que:

x′ = cos θ x + sin θ x⊥ .

Portanto, a curva
γ : t ∈ [0, θ] 7→ (cos t) x + (sin t) x⊥
é contínua, tem imagem na esfera (exercício) e vai de γ(0) = x e γ(1) = x′ . Como x e x′ são
arbitrários, Sd−1 é conexa por caminhos.

Exercício 8.1 Determine se os conjuntos contidos em Rd (d > 1) abaixo são convexos e/ou conexos
por caminhos.
1. O simplexo
( d
)
X
∆d := x ∈ Rd : x[j] = 1 e ∀i ∈ {1, . . . , d}, x[i] ≥ 0 .
j=1

146
2. A esfera unitária Sd−1 := {x ∈ Rd : |x|2 = 1.}

3. Rd \{0}.

Exercício 8.2 Tome a métrica discreta sobre X e prove que este espaço é conexo por caminhos se e
somente se X tem apenas um elemento.

8.2 Conexidade topológica


O conceito de conexidade topológica é menos intuitivo que o de conexidade por curvas,
mas é mais geral e de certo modo mais robusto e mais importante.
Primeiro tentaremos entender a intuição deste conceito. Imagine que tentamos separar
X em duas partes L e R = Lc com L, R ̸= ∅. Queremos dizer que, se X é conexo, qualquer
divisão deste tipo causará uma “quebra não-trivial". Para definir isso, sugerimos a seguinte
ideia: uma “quebra" é um conjunto de pontos u ∈ X que “vê de perto" tanto L quanto Lc .
Num espaço métrico, é natural escrever esta condição na seguinte forma:

u está na quebra se BX (u, r) ∩ L ̸= ∅ e BX (u, r) ∩ Lc ̸= ∅ para todo r > 0.

É fácil ver que u satisfaz as condições acima se e somente se u ∈ ∂L = L ∩ R. Ou seja,


quando dividimos X em L e R = Lc , a quebra é o conjunto ∂L. Dizer que há quebra é,
então, pedir que ∂L ̸= ∅. Esta é uma maneira de motivar a seguinte definição.

def:conexo Definição 8.2 Um espaço topológico (X, T ) é conexo se todo L ⊂ X com L ̸= ∅, X tem ∂L ̸= ∅.
Um subconjunto U ⊂ X é conexo se (U, TU ) é conexo, onde TU é a topologia induzida por T em U .

Para esquentar, vale a pena tentar fazer o exercício abaixo.

Exercício 8.3 Suponha que X tem pelo menos dois elementos. Ele é conexo com a topologia grossa?
E com a topologia fina?

8.2.1 Formas equivalentes do conceito


O conceito de conexidade acima faz sentido, mas as consequências dele ainda não são
totalmente claras. Nosso próximo objetivo será provar o seguinte resultado.

equivalente Teorema 8.1 Dado um espaço topológico (X, T ), as seguintes propriedades são equialentes.

1. (X, T ) é conexo;

2. os únicos subconjuntos de X que são simultaneamente abertos e fechados são ∅ e X;

3. toda função contínua η : X → {0, 1} é constante (usamos a topologia da métrica discreta em


{0, 1});

147
4. para toda toda função contínua f : X → R, f (X) := {f (x) : x ∈ X} é um intervalo.

Vejamos o que cada item diz. O primeiro é a nossa definição: X é conexo se qualquer
maneira de parti-lo em dois resulta numa “quebra". O segundo, como veremos, tem a ver
com a relação entre "∂S = ∅" e um subconjunto ser simultaneamente aberto e fechado. O
terceiro diz que não dá para pintar os pontos de X usando duas cores (aqui representadas
por 0 e 1) sem criar uma região onde se “pula" abruptamente de uma cor pra outra (o que
seria uma descontinuidade em η). O último item nos fala que a imagem de X por f não
pode "pular" um ponto da reta; ou seja, X é conexo se e somente se o Teorema do Valor
Intermediário se aplica a X!
Faremos esta prova por partes e de uma forma que não é “econômica em implicações".
Começamos com uma proposição que mostra “1 ⇔ 2".

tosfechados Proposição 8.1 Um espaço topológico (X, T ) é conexo se e somente se ∅ e X são os únicos
conjuntos simultaneamente abertos e fechados de X.

Prova: Olhando para a Definição 8.2, vemos que esta Proposição segue da seguinte afir-
mação.
Afirmação 8.1 Em qualquer espaço topológico (X, T ), um conjunto L ⊂ X satisfaz ∂L = ∅ se e
somente se L é ao mesmo tempo aberto e fechado.
Provemos, então, esta afirmação.
Começamos supondo que L ⊂ X é ao mesmo tempo aberto e fechado; nosso objetivo
será mostrar ∂L = ∅. Para isso, recorde que complementares de abertos/fechados são
fechados/abertos (respectivamente). Portanto, o complementar de L também é ao mesmo
tempo aberto e fechado. Sendo assim, L = L, Lc = Lc e

∂L = L ∩ Lc = L ∩ Lc = ∅, como queríamos demonstrar.

Agora provamos a implicação na direção contrária. Suponha que L ⊂ X tem fronteira


vazia; queremos provar que L é ao mesmo tempo aberto e fechado. Nossa hipótese diz
que
∂L = L ∩ Lc = ∅.
Para quaisquer dois subconjuntos de X, A ∩ B = ∅ implica A ⊂ B c . Deste modo,
deduzimos da igualdade acima que L ⊂ (Lc )c . Como a Proposição 5.2 nos diz que “o
complementar do fecho é o interior do complementar", obtemos L ⊂ Lo . Mas também
sabemos que Lo ⊂ L ⊂ L sempre. Portanto, obtemos L = L = Lo . Como L é fechado e Lo
é aberto, deduzimos que L é fechado e aberto ao mesmo tempo. Isto conclui a prova. 2
O próximo passo prova que “1 ⇔ 3" no Teorema 8.1.

Proposição 8.2 Um espaço topológico (X, T ) é conexo se e somente se toda função contínua
η : X → {0, 1} é constante (aqui tomamos a topologia discreta sobre {0, 1}, que é a mesma
topologia induzida pela métrica usual da reta real).

148
Prova: A prova se baseia caracterização de conexidade na Proposição 8.1 e na seguinte
observação:

há uma bijeção natural entre funções contínuas η : X → {0, 1} e conjuntos L ⊂ X que


são simultaneamente abertos e fechados.

Para ver isso, tome η : X → {0, 1} contínua. Como {0}, {1} são subconjuntos simulta-
neamente abertos e fechados de {0, 1},

Lη := η −1 ({0}) é aberto e fechado em X.

Na direção contrária, se L ⊂ X é simultaneamente aberto e fechado, é fácil ver que a


função: 
0, x ∈ L;
ηL : x ∈ X 7→
1, x ∈ Lc ;
é contínua. Note-se ainda que LηL = L e ηLη = η para quaisquer L, η como acima.
Provada a observação, podemos concluir a prova, notando que uma função contínua
η : X → {0, 1} é constante se e somente se Lη = ∅ ou Lη = X. 2
A próxima Proposição termina a prova do Teorema 8.1, mostrando que “3 ⇔ 4.

op:conexo01 Proposição 8.3 Um espaço topológico (X, T ) tem a propriedade de que toda função contínua
η : X → {0, 1} é constante se e somente se para qualquer f : X → R contínua, f (X) é intervalo.

Prova: Provaremos as duas implicações na forma contrapositiva.


Se existe uma η : X → {0, 1} contínua e não constante, queremos mostrar que há uma
f : X → R contínua tal que f (X) não é intervalo. A ideia é tomarmos f = η, já que o
fato de que η não é constante implica que η(X) = {0, 1} não é intervalo. No entanto, esse
argumento falha por tecnicalidades:
• f deve ter contradomínio R, enquanto η tem contradomínio {0, 1}: elas não podem
ser “a mesma função";

• mesmo que fossem a mesma função, não é completamente evidente que f seja
contínua (com contradomínio R e a topologia correspondente) só porque η é cotínua.
O primeiro ponto é resolvido observando que podemos definir f : X → R pela fórmula

∀x ∈ X : f (x) = η(x).

Na verdade, este truque é comum: sempre podemos “trocar o contradomínio" de uma


função η : S1 → S2 por um outro conjunto S3 ̸= S2 , contanto que S3 ⊃ η(S1 ). Isso será
feito de novo a seguir e será chamado de “abuso de notação". O segundo ponto acima
também é um pouco sutil. Resolvê-lo passa pelo fato que a topologia discreta sobre {0, 1}
é precisamente a topologia induzida pela métrica natural sobre a reta real. Deste modo,
se S ⊂ R é dado, observe que f −1 (S) = η −1 (S ∩ {0, 1}) e que S ∩ {0, 1} é sempre aberto

149
em {0, 1}. Como η é contínua, isto quer dizer que f −1 (S) é aberto de X para todo S ⊂ R, o
que é mais do que suficiente para garantir que f : X → R é contínua.
Agora suporemos que existe uma f : X → R contínua tal que não é intervalo e
mostraremos que existe η : X → R contínua e não constante. Dizer que f (X) não é
intervalo significa que existem números reais r < r′ < r′′ na reta com r, r′′ ∈ f (X) e
r′ ̸∈ f (X). Observe que isso quer dizer que f (X) ⊂ R\{r′ }. Em particular, podemos
“abusar notação" e dizer que o contradomínio de f é R\{r′ }.
Observe agora que a função ξ : R\{r′ } → {0, 1} que leva t ∈ R\{r′ } em 0 se t < r′ e
em 1 se t > r′ , é contínua. Isso quer dizer que η := ξ ◦ f : X → {0, 1} também é contínua.
Afirmamos que η não é constante. Para ver isso, basta lembrarmos que r < r′ < r′′ com
r, r′′ ∈ f (X), logo existem x, x′′ ∈ X com f (x) = r, f (x′′ ) = r′′ . Concluímos que

η(x) = ξ(r) = 0 e η(x′′ ) = ξ(r′′ ) = 1.

Portanto, η não é constante. 2

8.2.2 Exemplos
Nossa próxima tarefa é analisar alguns exemplos em que a definição de convexidade é
aplicada. Começamos descobrindo quem são os conjuntos conexos da reta real.

Exemplo 8.6 Os subconjuntos conexos da reta R são precisamente os intervalos.

Para ver isso, tome I ⊂ R intervalo. Dada η : I → {0, 1} contínua, veremos que ela tem
de ser constante. Suponha (para chegar a uma contradição) que η não é constante. Como
vimos na prova da Proposição 8.3, podemos “abusar notação" e pensar em η como uma
função contínua de I em R. Como ela não é constante, há pontos t0 , t1 ∈ I com η(t0 ) = 0 e
η(t1 ) = 1. O Teorema do Valor Intermediário implica que para cada x ∈ (0, 1) há um t ∈ I
com γ(t) = x. Mas isto contradiz o fato de que o contradomínio de η é {0, 1}. Portanto, se
I é intervalo, toda η : I → {0, 1} tem de ser constante.
Por outro lado, suponha que I não é intervalo. Mostraremos que I é desconexo usando
uma função análoga à ξ da prova da Proposição 8.3. Como I não é intervalo, existe um
ponto r ∈ R\I tal que inf I < r < sup I. A função

0, t < r
ξ(t) :=
1, t > r.

Esta função está definida para t ∈ R e é sabido que ela só é descontínua em t = x. Como
x ̸∈ I, sua restrição η = η0 |I é contínua. Além disso, vemos que, como x > inf I, existe
t0 ∈ (inf I, x) com t0 ∈ I e portanto η(t0 ) = 0. Do mesmo modo, como x < sup I, existe
t1 ∈ (x, sup I) com η(t1 ) = 1. Portanto, o fato de que I não é um intervalo implica que
existe η : I → {0, 1} contínua e não constante.

Exemplo 8.7 Todo conjunto conexo por caminhos é conexo. (A recíproca em geral é falsa.)

150
Um contraexemplo para a recíproca será discutido na próxima seção. Para ver que
conexidade por caminhos implica conexidade, imagine que U é conexo por caminhos e
que η : U → {0, 1} é contínua. Sem perda de generalidade, supomos que U ̸= ∅ e tomamos
x0 ∈ U . Nossa tarefa será mostrar que η(x) = η(x0 ) para todo x ∈ U . De fato, dado x ∈ U ,
U
sabemos que x ↔ x0 , portanto existe γ : [0, 1] → U contínua com γ(0) = x0 e γ(1) = x. A
composição η ◦ γ : [0, 1] → {0, 1} é contínua; como [0, 1] é conexo, η ◦ γ é constante. Logo
η(x) = η(γ(1)) = η(γ(0)) = η(x0 ), como queríamos demonstrar.

conexofecho Exemplo 8.8 Se U ⊂ X é conexo, qualquer conjunto V contendo U e contido em U é conexo.

É um bom exercício provar isso no caso em que a topologia de X é dada por uma
métrica. Abaixo, damos uma prova puramente topológica.
Considere η : V → {0, 1} contínua; nosso objetivo é provar que ela é constante. O
primeiro passo é observar que a restrição η |U também é contínua e, como U é conexo,
η |U é constante. Suporemos sem perda de generalidade que η(x) = 0 para todo x ∈ U . A
ideia agora é provar que η(y) = 0 para todo y ∈ V .
Para isso, é suficiente mostrar que, dado um ponto arbitrário y ∈ V , existe um x ∈ U
com η(x) = η(y). Fixe então um y ∈ V e tome b := η(y). Temos y ∈ η −1 ({b}). Como η
é contínua, η −1 ({b}) é aberto relativo de V , o que quer dizer que η −1 ({b}) = A ∩ V para
algum aberto A ⊂ X da topologia T . Então, y ∈ A com A aberto. Também sabemos que
y ∈ V ⊂ U e que todo aberto interceptando U também intercepta U ; logo, existe um ponto
x ∈ A ∩ U . Como U ⊂ V ,

x ∈ A ∩ U ⊂ A ∩ V = η −1 ({b}) ⇒ η(x) = b = η(y).

Ou seja, achamos o ponto x ∈ U com η(x) = η(y) de que precisávamos. Isso conclui a
prova de que V é conexo.

Exercício 8.4 Utilize argumentos relacionados com os que vimos acima para mostrar o seguinte
resultado: se U ⊂ X é dado (não necessariamente conexo) e U ⊂ V ⊂ U , então V é o fecho de U
na topologia relativa de V .

Exemplo 8.9 Se U ⊂ X é conexo e f : U → Y é contínua, a imagem f (U ) é conexa.

Tome U e f como acima. Considere η : f (U ) → {0, 1} contínua. Então η ◦f : U → {0, 1}


também é contínua. Como U é conexo, η ◦ f é constante. Precisamos mostrar que, de fato,
η é contínua. Para isso, tome a, a′ ∈ f (U ): como os dois estão na imagem de U , existem
u, u′ ∈ U com a = f (u) e a′ = f (u′ ). Mas então:

η(a) = η(f (u))η ◦ f (u) = η ◦ f (u′ ) = η(f (u′ )) = η(a′ ).

Ou seja, η(a) = η(a′ ) para quaisquer dois pontos a, a′ ∈ U . Isso quer dizer que é constante
sobre f (U ). Como η : f (U ) → {0, 1} é uma função contínua qualquer, deduzimos que
f (U ) é conexo.

151
Exemplo 8.10 Se F é uma coleção de subconjuntos conexos de X e F ∩ F ′ ̸= ∅ para quaisquer
F, F ′ ∈ F, então ∪F ∈F F é conexo.

Note que provamos que uma união de dois conjuntos conexos por caminhos com ponto
em comum é conexa por caminhos. Aqui, a união é conexa mesmo que a coleção F tenha
infinitos elementos.
Para provar que vale a propriedade acima, tomemos η : ∪F ∈F F → {0, 1} contínua
e dois pontos quaisquer x, x′ da união, para mostrar que η(x) = η(x′ ). Para isto, tome
F, F ′ ∈ F tais que x ∈ F e x′ ∈ F ′ (tais conjuntos têm de existir, porque x e x′ estão na
união). Por hipótese, podemos encontrar um elemento x0 ∈ F ∩ F ′ . Como F é conexo,
η é contínua, a restrição de η a F é constante; isto quer dizer que η(x) = η(x0 ) porque
x0 , x ∈ F . Do mesmo modo, a conexidade de F ′ implica η(x′ ) = η(x0 ). Deduzimos que
η(x) = η(x′ ), como queríamos demonstrar.

8.2.3 Um pouco mais sobre conexidade e topologia induzida


Consideramos agora em que (X, T ) é espaço topológico, D ⊂ X e TD é a topologia que T
induz sobre D.
Como podemos decidir se D é conexo? É mais fácil dizer quando D é desconexo: isso
ocorre se e somente se existe um subconjunto L ⊂ D, diferente tanto de D quanto de ∅,
que é relativamente aberto e fechado. Detalhemos estes pontos:

1. “L é relativamente aberto" é o mesmo que dizer que existe um aberto de X, A ⊂ X,


com A ∩ X = L.

2. “L é relativamente fechado" é o mesmo que dizer que o complementar de L em D é


relativamente aberto, ou seja, existe um aberto de X, B ⊂ X, com B ∩ D = D\L.

Destas observações, segue o seguinte fato.

Proposição 8.4 D é desconexo se e somente se existem abertos A, B ⊂ X de X tais que A∩B∩D =


∅ e A ∪ B ⊃ D.

Não provamos esta proposição, que fica como exercício, mas observamos (para ajudar)
que as duas condições sobre A e B querem dizer que B ∩ D é o complementar de A ∩ D
em D.

8.3 Exemplos mais interessantes das definições


Como vimos acima, as teorias de conexidade (topológica) e conexidade por caminhos são
análogas. De fato, no caso de subconjuntos da reta real R, há uma coincidência total entre
as duas definições: os intervalos são exatamente os subconjuntos conexos e também os
conexos por caminhos.

152
Nossos objetivos nesta seção são três. Em primeiro lugar, mostraremos a conexidade
ou não-conexidade do conjunto de matrizes ortogonais. Em segundo lugar, veremos que
os conceitos de conexidade e conexidade por caminhos, que são equivalentes em dimensão
1, não são equivalentes já em dimensão 2. Por último, mostraremos que as duas noções
de conexidade coincidem sempre que falamos de abertos em espaços vetoriais normados.

8.3.1 Matrizes ortogonais


Esta seção será revista.
Nesta seção, tomamos d ∈ N\{0, 1} e consideraremos alguns subconjuntos de Rd×d .
Obviamente, este espaço inteiro é um espaço vetorial, logo convexo e conexo por caminhos.
Precisaremos de algumas propriedades da função determinante:

det : Rd×d → R.

1. A matriz identitade d × d tem determinante det(Id×d ) = 1.


2. Dadas A, B ∈ Rd×d , det(AB) = det(A) det(B).
3. O determinante não muda se tomamos a transposta da matriz.
4. Uma matriz A ∈ Rd×d tem determinante não-nulo se e somente se é inversível.
5. Se a matriz A ∈ Rd×d tem a estrutura abaixo:
 
0
.. 
. 

A=
 Ã ;
 0 
0 ... 0 1

isto é, se A[i, d] = A[d, i] = 0 para 1 ≤ i < d − 1, A[d, d] = a ∈ R e à ∈ R(d−1)×(d−1)


tem entradas A[i, j] para 1 ≤ i, j ≤ d − 1, então det(A) = det(Ã).
O resultado abaixo é bastante útil para se estabelecer a conexidade por caminhos de
outros grupos de matrizes.

Teorema 8.2 Considere o conjunto de matrizes ortogonais

O(d) := {Q ∈ Rd×d : QT Q = Id×d }

e seus subconjuntos

SO(d) := {Q ∈ Rd×d : det(Q) = 1};


SO− (d) := {Q ∈ Rd×d : det(Q) = −1}.

Então O(d) = SO(d) ∪ SO− (d) (com união disjunta). O(d) é desconexo, mas SO(d) e SO− (d)
são conexos por caminhos.

153
Este resultado pode ser apreciado de duas maneiras. Uma é matemática: SO(d) e O(d)
são grupos de Lie – isto é, grupos que têm estruturas de variedade – e este resultado nos dá
informação sobre a topolgia do espaço.
Outra maneira é mais aplicada. Imagine que quero descolar um conjunto de pontos
S ⊂ R3 para um outro, QS ⊂ R3 com Q ∈ SO(3). Podemos imaginar por exemplo que S é
um pedaço de chapa metálica que está deitado e queremos botar em outra posição. O fato
de que SO(3) é conexo por caminhos significa que há uma maneira contínua de passar
de Q(0) = Id×d para Q(1) = Q; ou seja, há como mexer S sem saltos para passar de uma
posição a outra.
Esta prova dará um bocado de trabalho, mas a graça dela é termos a oportunidade de
trabalhar com o grupo SO(d) mais de perto. Vários passos serão deixados como exercícios
que não são difíceis para quem lembra bem de Álgebra Linear.
Prova: Começamos a prova com algumas observações de Álgebra Linear, que deixamos
como exercício.

Exercício 8.5 O(d) e SO(d) são grupos (fechados por produtos e inversas). Além disso, uma
matriz pertence a O(d) se e somente se suas colunas são ortonormais (têm norma 1 e são ortogonais
umas às outras).

Nosso primeiro passo será mostrar o seguinte resultado.

O(d) = SO(d) ∪ SO− (d) é desconexo.

Para continuar, vamos entender porque O(d) tem duas partes. Veja que:

∀Q ∈ O(d) : det(Q)2 = det(QT ) det(Q) = det(QT Q) = det(Id×d ) = 1.

Como det(Q) toma valores reais, deduzimos que det(Q) ∈ {−1, +1} para qualquer matriz
Q ∈ O(d), o que quer dizer que toda Q ∈ O(d) está ou em SO(d) ou em SO− (d). Além
disso, notamos que estes dois conjuntos não são vazios, já que a identidade está em SO(d)
e a matriz  
0
.. 
. 

R=
 Id−1  ∈ SO− (d)
 0 
0 ... 0 1
(em virtude da propriedade 5 do determinante). Concluímos que O(d) é a união disjunta
de SO(d) e SO− (d) e estes dois conjuntos não são vazios: em particular, a imagem da
função determinante sobre O(d) é det(O(d)) = {−1, 1}, que não é intervalo. Por isso, O(d)
não é conexo.
Agora que encontramos as duas “partes naturais" de O(d), mostraremos que as duas
são conexas por caminhos. De fato, o próximo argumento nos mostra que só precisamos
nos preocupar com uma delas.

Se SO(d) é conexo por caminhos, SO− (d) também é.

154
De fato, considere a matriz R definida acima. Usando a continuidade da multiplicação
de matrizes, vê-se facilmente (exercício) que

ψ : Q ∈ SO(d) 7→ RQ ∈ SO− (d)

é uma bijeção contínua com inversa contínua. Em particular, SO− (d) = ψ(SO(d)). Com-
pletamos este passo lembrando que a imagem de um espaço conexo por caminhos por
uma função contínua também é conexa por caminhos.
A partir daqui, usaremos indução em d ≥ 2 para provar que SO(d) é conexo por
caminhos.

SO(d) é conexo por caminhos – caso base (d = 2).

Este caso é resolvido pelo seguinte exercício.

Exercício 8.6 Mostre que


  
cos θ − sin θ
SO(2) = : θ∈R
sin θ cos θ

e deduza que SO(2) é conexo por caminhos. (A dica é usar o fato que as colunas de Q ∈ SO(2)
são ortonormais para observar que a primeira coluna é Q1 = (cosθ, sin θ)T para algum θ. A outra
coluna é um dos dois vetores unitários ortogonais a Q1 . A condição de determinante igual a 1 diz
qual vetor ortogonal escolher.)

SO(d) é conexo por caminhos – passo indutivo (d ≥ 3).

A ideia será encontrarmos dentro de SO(d) uma cópia (que na verdade é um subgrupo)
que é uma “cópia" de SO(d − 1) (e portanto é conexo por caminhos). Daí, encerraremos
a prova mostrando que toda Q ∈ SO(d) pode ser conectada por uma curva contínua a
alguma Q1 ∈ H(d).

Exercício 8.7 Mostre que as duas afirmações acima – H(d) conexo por caminhos e todo Q ∈ SO(d)
conectado por curva contínua a alguma Q1 ∈ H(d) – são suficientes para se deduzir que SO(d) é
conexo por caminhos.

Achando uma “cópia" de SO(d − 1) em SO(d). Para encontrarmos H(d), começamos de-
finindo uma função função Φd : R(d−1)×(d−1) → Rd×d da seguinte forma.
 
0
.. 
. 

Φd (Q̃) := 
 Q̃  (Q̃ ∈ R(d−1)×(d−1) ).
 0 
0 ... 0 1
Pode-se verificar diretamente que Φd é contínua entrada a entrada e portanto é contínua.
ALém disso, ela tem as seguintes propriedades

155
Exercício 8.8 Mostre que Φd (I(d−1)×(d−1) ) = Id×d e que, para quaisquer Q̃1 , Q̃2 ∈ R(d−1)×(d−1) ,

det(Φd (Q̃1 )) = det(Q̃1 ), Φd (Q̃1 )T = Φd (Q̃1 )T e Φd (Q̃1 ) Φd (Q̃2 ) = Φd (Q̃1 Q̃2 ).


Segue do exercício acima que, dada uma Q̃ ∈ R(d−1)×(d−1) qualquer
Πd (Q̃) ∈ SO(d) ⇔ Q̃ ∈ SO(d − 1). (8.1) eq:temdeser
Chamamos de H(d) := Φd (SO(d − 1)) e verificamos que H(d) ⊂ SO(d). Pela hipótese de
indução, SO(d − 1) é conexo por caminhos. Como Φd é contínua, H(d) também é.

Conectando elementos de SO(d) a H(d). Nosso próximo passo será mostrar a seguinte
afirmação.
SO(d)
Afirmação 8.2 Dada Q ∈ SO(d), existe uma Q1 ∈ H(d) com Q ↔ Q1 .
Para isso, precisamos primeiramente de uma informação adicional sobre H(d).

Observação 8.1 Um elemento Q ∈ SO(d) pertence a H(d) se e somente se sua


d-ésima coluna é ed .
Prova: Claramente, todo elemento de H(d) tem a última coluna igual a ed .
Por outro lado, tome Q ∈ SO(d) com a última coluna igual a ed . Queremos
mostrar que Q ∈ H(d), isto é, que existe uma Q̃ ∈ SO(d − 1) com Πd (Q̃) = Q
Note que, se a d-ésima coluna de Q é ed , todas as entradas Q[i, d] com 1 ≤
i < d são 0, enquanto Q[d, d] = 1. Além disso, as demais colunas Q1 , . . . , Qd−1
de Q satisfazem Qj [d] = Qj .ed = 0 (porque as colunas são ortonormais). Logo,
vê-se que Q[j, d] = 0 para todo 1 ≤ j < d. Vê-se, então, que Q necessariamente
tem a forma:
Q = Πd (Q̃) para alguma Q̃ ∈ R(d−1)×(d−1)
e a equação (8.1) garante que Q̃ ∈ SO(d − 1), como queríamos demonstrar. 2

Agora tomamos uma Q ∈ SO(d) arbitrária e construímos um caminho contínuo γ :


[0, θ] → SO(d) (para algum θ ∈ R+ ) ligando Q a uma Q1 ∈ H(d). Pela observação acima,
o que devemos fazer é garantir que a última coluna de Q1 é ed , enquando a matriz γ(t) é
ortogonal com determinante 1 em cada 0 ≤ t ≤ θ.
Considere a última coluna de Q, que chamamos de Qd ∈ Rd . Seguindo os passos do
Exemplo 8.5, podemos escrever ed na forma:

d com Qd ⊥ Qd .
ed = cos θ Qd + sin θ Q⊥ ⊥

Se seguíssemos aquele Exemplo, traçaríamos agora uma trajetória num círculo na esfera
unitária para conectar Qd a ed . É isto que faremos abaixo, mas construindo um caminho
γ0 no espaço de matrizes SO(d) tal que γ0 (θ)Qd = ed . Para isso, precisamos do seguinte
primeiro passo.

156
Exercício 8.9 Use o fato que d ≥ 3 para mostrar que existe uma transformação ortogonal V ∈
SO(d) levando Qd em ed e Q⊥d em ed−1 .

Agora considere
 
0
..
.
 
 I(d−2)×(d−2) 
γ0 (t) := V Z(t) V, onde Z(t) := 
T
 (0 ≤ t ≤ θ).
 
 0 
 cos t sin t 
0 ... 0
− sin t cos t

Note que γ0 (0) = Id×d (pois V T V = Id×d ) e que γ0 (t) ∈ SO(d) (porque é o produto de
V, V T , Z(t) ∈ SO(d), como se pode verificar diretamente) para cada 0 ≤ t ≤ θ. Portanto,
γ(·) := γ0 (·) Q é uma curva com valores em SO(d) e γ(0) = Q. Também não é difícil
verificar que γ é contínua.
Para terminarmos a prova, veremos que γ(θ) ∈ H(d). Por tudo que já vimos até agora,
isto se resume a mostrar que a d-ésima coluna de γ(θ) = γ0 (θ)Q é ed . Será útil usar o
seguinte exercício.

Exercício 8.10 Prove que, dadas quaisquer matrizes A, B ∈ Rd×d , se Bj é a j-ésima coluna de B,
ABj é a j-ésima coluna de AB; ou seja, as colunas de AB são as colunas de B multiplicadas por
A à esquerda.

Portanto:

• A última coluna de V Q é V Qd = ed ;

• A última coluna de Z(θ)V Q é Z(θ) ed = cos θed + sin θed−1 .

• Como V T é a inversa de V , a última coluna de γ(t) = V T Z(θ)V Q é

V −1 (cos θed + sin θed−1 ) = cos θQd + sin θ Q⊥


d = ed .

Isto encerra a prova. 2

8.3.2 Um conjunto conexo que não é conexo por caminhos


Vejamos primeiro um caso em que as duas definições discordam.

Teorema 8.3 Defina Γ0 ⊂ R2 da seguinte forma:

Γ0 := {(x, sin(1/x)) : x ∈ (0, 1]}

e Γ = Γ0 ∪ {(0, 1)}. Este Γ é conexo, mas não é conexo por caminhos.

157
Prova: A prova terá três partes.

Passo 1 Primeiro provaremos que Γ0 é conexo por caminhos e portanto conexo.

Passo 2 Provaremos a seguir que Γ não é conexo por caminhos.

Passo 3 Veremos que Γ0 ⊂ Γ ⊂ Γ0 , o que implica que Γ é conexo (pelo Exemplo 8.8).

Passo 1: Γ0 conexo por caminhos. A função f : (0, 1] → R2 que leva x ∈ (0, 1]


em f (x) := (x, sin(1/x)) ∈ R2 é contínua coordenada a coordenada e portanto contínua.
Como (0, 1] é conexo por caminhos, sua imagem também é. Esta imagem é precisamente
o conjunto Γ0 .
Passo 2: Γ não é conexo por caminhos. Provaremos que os pontos p = (0, 1) e
q = (1, sin(1)), ambos pertencentes a Γ, não podem ser conectados por uma curva contínua
em Γ. De fato, suponha (para chegar a uma contradição) que existe γ : [0, 1] → Γ contínua
com γ(0) = p e γ(1) = q. Considere as coordenadas γ1 (t), γ2 (t) de γ(t). Como γ é contínua,
γ1 e γ2 são contínuas. Temos ainda que γ1 (0) = 0 e γ1 (1) = 1.
Como γ1 : [0, 1] → R, o Teorema do Valor Intermediário nos garante que existe um
t0 ∈ (0, 1) com γ1 (t0 ) = 1/(π/2). Suponha indutivamente que definimos

t0 > t1 > t2 > · · · > tn > 0

de modo que, para cada 0 ≤ m ≤ n, γ1 (tm ) = 1/(mπ + π/2). Veja que novamente γ1 (0) <
1/((n + 1)π + π/2) < γ1 (tn ), logo existe um tn+1 ∈ (0, tn ) com γ1 (tn ) = 1/((n + 1)π + π/2).
Desta forma, provamos que existe uma sequência decrescente {tn }n∈N ⊂ (0, 1) com
 
1
∀n ∈ N : γ2 (tn ) = sin = ±1,
γ1 (tn )

dependendo se n é par ou ímpar.


Vemos que a sequência tn converge para um t ∈ [0, 1], posto que é decrescente. Isto
implica γ2 (tn ) → γ2 (t), o que contradiz o fato que a sequência γ2 (tn ) alterna entre ±1,
como vimos acima. A contradição implica que não podemos conectar p e q por uma curva
em Γ.

Passo 3: Γ0 ⊂ Γ ⊂ Γ0 . A primeira inclusão é trivial. Para checar a segunda, basta ver


que o ponto p = (0, 1), que é o que adicionamos para formar Γ, está no fecho de Γ0 . Mas
para isso basta ver que a sequência
 
1
pn = π , 1 (n ∈ N)
2
+ 2πn

está toda em Γ0 e converge a p. 2

Exercício 8.11 Mostre que Γ0 = Γ0 ∪ ({0} × [−1, 1]).

158
8.3.3 Concordância para abertos de espaços vetoriais
Nesta seção mostramos um caso muito importante em que os dois conceitos de conexidade
concordam.

Teorema 8.4 Considere um espaço vetorial normado (V, ∥ · ∥V ) e um subconjunto aberto A ⊂ V .


Então A é conexo se e somente se é conexo por caminhos.

Prova: Uma direção já está dada; além disso, o resultado é trivial se A = ∅. Só nos falta
provar que um A ⊂ V , A ̸= ∅ que é aberto e conexo também é conexo por caminhos. O
argumento que usaremos é típico de provas envolvendo conexidade.
Como A ̸= ∅, podemos encontrar x0 ∈ A. Considere o subconjunto L ⊂ A de todos
A
os x ∈ A com x0 ↔ x. Nosso objetivo é provar que L = A; para isso, suporemos (para
chegar a uma contradição) que L ̸= A, de modo que R = A\L ̸= ∅. A contradição estará
provada quando mostrarmos que L e R são relativamente abertos em A, o que quer dizer que
A é desconexo. Vejamos, portanto, a prova destes fatos.

1. Queremos mostrar que L é relativamente aberto em A. Como A é aberto, isto é o


mesmo que mostrar que L é aberto de V . Para isto, dado x ∈ L, devemos encontrar
δ > 0 tal que B(x, δ) ⊂ L. Mas isto é simples. Como A é aberto, existe um δ > 0
com B(x, δ) ⊂ A. A discussão logo após o Exemplo 8.2 acima nos diz que B(x, δ)
B(x,δ)
é convexa, logo qualquer x′ ∈ B(x, δ) satisfaz x ↔ x′ . Como B(x, δ) ⊂ A, isto
A
também nos diz que x ↔ x′ para todo x′ ∈ B(x, δ). Mas recorde que, pelo Lema 8.1,
A A
a relação “↔"é transitiva, logo o fato de que x ∈ L, e portanto x ↔ x0 , implica que
A
x′ ↔ x0 para todo x′ ∈ B(x, δ). Ou seja, B(x, δ) ⊂ L.

2. Do mesmo modo que acima, queremos provar que R ⊂ V é aberto. Para isto, dado
A
x ∈ R, tomamos δ > 0 com B(x, δ) ⊂ A. Novamente temos x′ ↔ x para todos
A
x′ ∈ B(x, δ). Deste modo, se algum x′ ∈ B(x, δ) satisfaz x′ ↔ x0 , também teremos
A
x ↔ x0 , o que contradiz o fato que x ̸∈ L. Deduzimos que x′ não está conectado em
A a x0 para qualquer x′ ∈ B(x, δ), ou seja, B(x, δ) ⊂ A\L = R.

8.4 Mais exercícios


Exercício 8.12 Considere dois conjuntos abertos e conexos U, V ⊂ R2 com U ∩ V ̸= ∅. É
necessariamente verdade que U ∩ V é conexo? E o conjunto U ∪ V ? E se supomos que U e V são
convexos?

159
Exercício 8.13 (Componentes conexas) Tome um espaço topológico (X, T ). Dado x ∈ X,
chamamos da componente conexa de x em X o conjunto:
[
C(x) := U.
U ⊂X conexo
x∈U

1. Prove que C(x) ̸= ∅ é conexa para cada x ∈ X. Além disso, mostre que C(x) é fechado de X.
2. Prove que quaisquer dois pontos x, x′ ∈ X ou têm a mesma componente conexa (C(x) ̸=
C(x′ )), ou têm componentes disjuntas (C(x) ∩ C(x′ ) = ∅).
3. Deduza que existe A ⊂ X tal que X = ∪x∈A C(x) com união disjunta (ou seja, todo espaço
topológico é uma união disjunta de componentes conexas) e que qualquer U ⊂ X conexo está
contido em C(x) para algum x ∈ A.

Exercício 8.14 (Componentes conexas da diferença) Tome um espaço topológico conexo (X, T )
e um subconjunto conexo Y ⊂ X. Considere qualquer uma das componentes conexas CY \X (x) de
Y \X e mostre que Y ∪ CY \X (x) tem de ser conexo.

Exercício 8.15 (Componentes conexas de abertos em espaços vetoriais) Consideramos agora


o caso particular da definição acima em que (V, ∥ · ∥V ) é espaço vetorial, X ⊂ V é subconjunto
aberto de V e T é a topologia sobre V definida a partir da norma ∥ · ∥V . Prove que C(x) é aberto
para cada x ∈ X. Mostre ainda que:
[
∀x ∈ X : C(x) = A.
A⊂X conexo por caminhos
x∈A

Exercício 8.16 Considere espaços métricos (Xi , di ), 1 ≤ i ≤ k, e construa o espaço-produto X


com uma das métricas-produto correspondente (cf. Exercício 3.11). Dados conjuntos conexos e não
vazios Ci ⊂ Xi para i = 1, 2, . . . , k, prove que

C1 × C2 × · · · × Ck é conexo ⇔ Ci é conexo para cada i = 1, 2, 3, . . . , k.

Exercício 8.17 Neste problema, seguimos a notação do Exercício 5.32 e consideramos a soma de
Minkowski A + B de dois subconjuntos não-vazios A, B ⊂ V de um espaço vetorial normado
(V, ∥ · ∥V ). Prove os seguintes fatos:
1. se A e B são conexos por caminhos, A + B também é;
2. se A e B são conexos, A + B também é.

Exercício 8.18 Considere um espaço vetorial normado (V, ∥ · ∥V ). Dizemos que um conjunto
A ⊂ V é conexo por caminhos poligonais se, dados x0 , x1 ∈ A, podemos encontrar um k ∈ N\{0}
e pontos y0 = x0 , y1 , . . . , yk = x1 ∈ A tais que, para cada i = 0, 1, . . . , k − 1, o s segmentos de
reta [yi , yi+1 ] estão contidos em A. Prove que, se A ⊂ V é aberto é conexo, então A é conexo por
caminhos poligonais.

160
Exercício 8.19 Um espaço métrico (X, dX ) é localmente conexo por caminhos se para cada x ∈ X,
existe um δ0 > 0 tal que, dado qualquer δ ∈ (0, δ0 ), BX (x, δ) é conexa por caminhos. Mostre que,
se (X, dX ) é localmente conexo por caminhos, então qualquer A ⊂ X aberto e conexo também é
conexo por caminhos.

Exercício 8.20 Mostre que um espaço métrico (X, dX ) é conexo se a imagem de qualquer função
contínua f : X → R é um intervalo. Prove ainda que (X, dX ) é conexo e compacto se e somente se
a imagem de qualquer função contínua f : X → R é um intervalo compacto.

Exercício 8.21 Considere um espaço métrico (X, dX ). Dizemos que uma coleção F de subconjun-
tos F ⊂ X é combinatorialmente conexa se dada qualquer partição F = F0 ∪ F1 com F0 , F1 ̸= ∅ e
F0 ∪ F1 = F, existem F0 ∈ F0 e F1 ∈ F1 com F0 ∩ F1 ̸= ∅. Prove que se F é combinatorialmente
conexa e cada F ∈ F é conexo, então a união ∪F ∈F F é um subconjunto conexo de X.

161
162
Parte III

Cálculo diferencial em espaços vetoriais

163
Capítulo 9

Preâmbulo

Até aqui, apresentamos as definições de espaços métricos e vetoriais e estudamos To-


pologia com foco nestes espaços. Aprendemos bastante, mas, para realmente fazermos
Análise, precisamos ir um passo além e aprender a diferenciar e integrar em espaços mais
gerais que a reta real.
Começamos esta tarefa no capítulo 10 com derivadas e integrais de funções de inter-
valos da reta a espaços vetoriais. Os conceitos de derivada e integral têm generalizações
diretas a estes espaços, que estudaremos em detalhes. No entanto, já aqui teremeos que
lidar com o fato de que funções em dimensão maior que 1 podem ter comportamente
um tanto quanto diferente do que na reta. O principal exemplo disso é o fato de que o
Teorema do Valor Médio tem de ser substituído pela Desigualdade do Valor Médio.
Considere agora o caso em que f : V → W , onde (V, ∥ · ∥V ) e (W, ∥ · ∥W ) são espaços
vetoriais normados. Se tentamos definir uma derivada via um quociente, como no caso
V = R, esbarramos em uma dificuldade importante: não sabemos “dividir" um elemento
de W por um elemento de V ! De fato, mesmo quando V = W = R3 (por exemplo) não há
uma maneira natural de definir o quociente que levaria à derivada no caso V = R.
A saída para este problema é recorrer a uma outra maneira de definir derivada. No
caso de f : I → R, o valor f ′ (t) da derivada em t ∈ I satisfaz o seguinte: α = f ′ (t) é o
único número real com a seguinte propriedade.
|f (t + h) − f (t) − α h|
lim = 0.
h→0 |h|
Da mesma forma, podíamos ter escrito que α = f ′ (t) se, quando escrevemos:
rt (h) := f (t + h) − f (t) − α h,
temos |rt (h)|/|h| → 0 quando h → 0.
Nesta definição alternativa dividimos não por h, mas sim por seu “tamanho". A
vantagem é que isso faz sentido em todo espaço vetorial normado, quando medimos o
tamanho de h ∈ V por sua norma ∥h∥V .
Para chegar à definição de derivada, precisamos ainda entender quem (ou o que) faz
o papel do termo α h. A chave neste caso será pensar em f (t + h) ≈ f (t) + α h como uma

165
aproximação de f por uma função afim, isto é, a soma de uma função linear com uma
constante. A analogia natural para outros espaços é escrever

f (x + h) ≈ f (x) + A h

onde A é uma transformação linear.


Em linhas gerais, o que discutimos acima é a definição de derivada devida a Fréchet,
que estudaremos abaixo. Também discutiremos derivadas parciais e direcionais, mas
ficará claro que a definição de Fréchet tem propriedades melhores. Por exemplo, ela é a
única destas definições que satisfaz a regra da cadeia. Além disso, uma vez que aceitamos a
derivada como transformação linear, fica mais limpa a passagem para derivadas superiores
e fica mais fácil derivar em espaços que não são o Rd . De qualquer forma, tudo isso fará
mais sentido depois da breve revisão de Álgebra Linear que teremos a seguir.

Observação 9.1 O leitor pode se perguntar porque não tentamos definir derivadas em espaços
ainda mais gerais, por exemplo, espaços métricos. Uma resposta possível é que a derivada é uma
tentativa de aproximar funções por somas de funções constantes e lineares, logo devemos trabalhar
num espaço em que isso faça sentido. Certamente há espaços métricos em que seria muito difícil
de se falar disso. No entanto, veremos neste curso que, ao menos em um caso particular – o das
subvariedades de Rd – será possível falar de derivadas por causa de uma estrutura linear local.

166
Capítulo 10

Funções a um parâmetro: derivadas e


integrais
:1parametro
Nosso objetivo neste capítulo é desenvolver rudimentos de um Cálculo para funções com
valores em V Banach que dependem de um único parâmetro real. Boa parte do que vamos
fazer é exatamente igual ao que se faz no caso de funções entre conjuntos da reta. Por esta
razão, muitos passos importantes serão tomados como exercícios.

Notação para este capítulo: Nos próximos resultados, I = [a, b] ⊂ R é um intervalo


fechado e limitado da reta (com a < b reais), (V, ∥ · ∥) é Banach, e f : I → V é dada.

10.1 Derivadas: definição e resultados preliminares


O primeiro passo será generalizar o conceito de derivada.

Definição 10.1 Dizemos que f é diferenciável em t ∈ I se existe o limite:

f (t + h) − f (t)
f ′ (t) := lim .
h→0 h
A definição é a mesma do caso real e podemos fazer algumas considerações gerais rela-
cionadas. Por exemplo, o fato abaixo decorre de que limites em Rd são sempre tomados
coordenada a coordenada.

Exercício 10.1 Mostre que, se V = Rd , então f ′ (t) existe se e somente se cada uma das funções
coordenadas f [i] é diferenciável em t. Neste caso,

f ′ (t) = (f ′ [i](t))di=1 .

Exercício 10.2 Se f, g : I → V são ambas diferenciáveis em t ∈ I e λ ∈ R e um escalar, então:

(λf + g)′ (t) = λf ′ (t) + g ′ (t).

167
Exercício 10.3 Fixe v ∈ V e uma função F : I → R diferenciável. Podemos definir uma nova
função f : I → W dada por:
f (t) := F (t) v (t ∈ I).
Supondo que F ′ (t) existe para um certo t ∈ I, mostre que f ′ (t) = F ′ (t) v.

Exercício 10.4 Prove que toda f diferenciável em t ∈ I também é contínua em t.

Exercício 10.5 (Regra de Leibniz geral) Suponha que V, W, Z são espaços vetoriais com res-
pectivas normas ∥ · ∥V , ∥ · ∥W e ∥ · ∥Z . Neste exercício, supomos que B : V × W → Z é bilinear e
contínua. Eis alguns exemplos abaixo.

1. V = Rd1 ×d2 , W = Rd2 ×d3 , Z = Rd1 ×d3 e B é o produto matricial.

2. V = W = Z = C([0, 1], R) e B é o produto de funções ou a operação de convolução.

3. V = R, W = Z e B leva um par (ξ, w) ∈ R × W no produto por escalar ξ.w.

Agora suponha que f : I → V e g : I → W são diferenciáveis em t ∈ I. Prove que B(f, g) : I → Z,


definida por:
B(f, g)(s) := B(f (s), g(s)) (s ∈ I)
tambem é diferenciável em t ∈ I e

B(f, g)′ (t) = B(f ′ (t), g(t)) + B(f (t), g ′ (t)).

10.2 A desigualdade do valor médio


Agora vamos assinalar uma diferença crucial entre a derivada na reta e casos mais gerais.
Um dos principais teoremas do caso V = R é o Teorema do Valor Médio, que diz que,
dados x, y ∈ I, se f é diferenciável no intervalo entre x e y, então existe um ponto θ nesse
intervalo tal que
f (x) − f (y) = f ′ (θ) (x − y).
Esse resultado não vale em geral quando V é um espaço vetorial qualquer. De fato, ele
falha já para V = R2 .

Exercício 10.6 Se f (t) = (t2 , t3 ), t ∈ [0, 1], vemos que f (1) − f (0) ̸= f ′ (θ) para qualquer
θ ∈ [0, 1].

O que podemos guardar do caso unidimensional é uma cota na magnitude de f (x)−f (y).
De fato, temos a Desigualdade do Valor Médio neste caso.

168
:DVMsimples Teorema 10.1 (Desigualdade do Valor Médio) Dados t, s ∈ I e f : I → V contínua em
I = [a, b] e diferenciável em (a, b), suponha que
M := sup ∥f ′ (x)∥V < +∞.
x∈(a,b)

Então temos a desigualdade


∀t, s ∈ [a, b] : ∥f (t) − f (s)∥V ≤ M |t − s|.
Prova: Note que basta provar a desigualdade acima para t, s ∈ (a, b). Afinal, como f é
contínua, o conjunto de pares (t, s) ∈ I × I com ∥f (t) − f (s)∥V ≤ M |t − s| é fechado. Se
este conjunto contem (a, b) × (a, b), também deve conter o fecho deste conjunto, que é I × I.
Feita essa observação, suporemos (sem perda de generalidade) que t < s, sabendo que
f é diferenciável no intervalo [t, s] ⊂ (a, b).
Dado um M > M ′ , definimos o conjunto:
IM ′ := {x ∈ [t, s] : ∥f (x) − f (t)∥V ≤ M ′ (x − t)}.
Ou seja, IM ′ é o conjunto de pontos x ∈ [t, s] que satisfazem a estimativa dada pela
desigualdade do valor médio, mas com M ′ substituindo M (esta “folga na constante" é
uma tecnicalidade importante na conta). Provaremos a seguir que:
Objetivo: ∀M ′ > M : s ∈ IM ′ , isto é, ∥f (s) − f (t)∥V ≤ M ′ (s − t).
Dado isso, a desigualdade desejada é deduzida tomando M ′ → M .
Para atingir nosso objetivo, note primeiramente que IM ′ não é vazio porque pelo menos
t está lá. Como além disso IM ′ é limitado, sM ′ := sup IM ′ está bem definido. Também é
verdade que IM ′ é fechado, por causa da continuidade de f : afinal, ela quer dizer que a
função g(t) := ∥f (x) − f (t)∥V − M ′ (x − t) (t ∈ I) é contínua, e IM ′ = g −1 ((−∞, 0]). Logo,
IM ′ é compacto. Em particular, sM ′ = supIM ′ ∈ IM ′ . Nosso objetivo será cumprido se
provarmos que sM ′ = s.
Suponha, então (para chegar a uma contradição) que sM ′ < s. Como t ∈ IM ′ , sabemos
que t ≤ sM ′ < s e que portanto sM ′ + h ∈ [t, s] para h > 0 suficientemente pequeno. Agora
observe que

f (sM ′ + h) − f (sM ′ )
lim = ∥f ′ (sM )∥V ≤ M < M ′ .
h→0,s+h∈I h
V
Portanto, se h > 0 é suficientemente pequeno, não só sM ′ + h ∈ [t, s], como também

f (s + h) − f (s)
≤ M ′,
h
V
o que quer dizer que
∥f (sM ′ + h) − f (s)∥V ≤ M ′ h.
Por subaditividade, deduzimos que
∥f (sM ′ + h) − f (t)∥V ≤ ∥f (sM ′ + h) − f (sM ′ )∥V + ∥f (sM ′ ) − f (t)∥V ≤ M ′ (h + sM ′ − t).
Ou seja, sM ′ + h ∈ IM ′ e sM ′ + h > sM ′ = sup IM ′ . Esta contradição ocorreu porque
supusemos que sM ′ < s; portanto, mostramos que sM ′ = s. 2

169
Exercício 10.7 Prove que, para qualquer função diferenciável f : I → V ,

∥f ∥Lip = sup ∥f ′ (t)∥V .


t∈(a,b)

(Aqui admitimos que o supremo pode ser infinito.)

Exercício 10.8 Suponha que γ : I → V é diferenciável e γ ′ : I → V é contínua. Dado


um subintervalo J = [c, d] ⊂ [a, b] com a < c < d < b, e dado um h ∈ R com tal que
|h| ≤ min{c − a, b − d}, definimos:
γ(t + h) + γ(t)
∆h γ : t ∈ J 7→ ∈ V.
h
Mostre que
lim sup ∥∆h γ − γ ′ ∥J,∞ = 0.
ε→0+ 0<|h|≤ε

10.3 Integração de funções sobre intervalos


Nosso próximo objetivo é estender a teoria de integração de funções contínuas sobre
intervalos a funções com valores em V (com V Banach). Nesta seção I := [a, b] ⊂ R com
−∞ < a ≤ b < +∞.
Recorde de Análise na Reta que uma partição pontilhada P de [a, b] é um objeto do tipo:

P := {(tP0 , sP0 ), (tP1 , sP1 ), . . . , (tPnP , sPnP )}

com
tP0 = a ≤ sP0 ≤ tP1 ≤ sP1 ≤ tP2 ≤ · · · ≤ tPnP ≤ sPnP ≤ tPnP +1 =: b.
Note a convenção de que tPnP +1 = b sempre. Informalmente, dividimos [a, b] em intervalos
[tPi , tPi+1 ] e escolhemos um ponto sPi em cada intervalo. O tamanho da partição P é definido
como |P | := max0≤i≤nP (tPi+1 − tPi ).

Definição 10.2 Dada uma função f : I → V e uma partição pontilhada P como acima, definimos
a soma de Riemann para f sobre a partição pontilhada P da seguinte maneira:
nP
X
s(f, P ) := (tPi+1 − tPi ) f (sPi ) ∈ V.
i=0

Dizemos que f é Riemann-integrável sobre [a, b] se existe um limite para as somas de Riemann
quando |P | → 0, ou seja, quando existe um elemento Iab (f ) ∈ V tal que, para qualquer sequência
{Pj }j de partições pontilhadas de [a, b],

|Pj | → 0 ⇒ s(f, P ) → Iab (f ).


Rb
Quando f é Riemann-integrável sobre [a, b], em geral escrevemos a
f (t) dt := Iab (f )

170
Exercício 10.9 (Linearidade da integral) Prove a partir da definição que, se f, g : I → V são
Riemann-integráveis e λ ∈ R, então λf + g também é Riemann-integrável e
Z b Z b Z b
(λf (t) + g(t)) dt = λ f (t) dt + g(t) dt.
a a a

Exercício 10.10 Mostre que, se f ≡ c ∈ V é constante, então f é Riemann-integrável e


Z b
f (t) dt = c (b − a).
a

Observação 10.1 No caso de V = R, é costumeiro falar das somas de Riemann superior e inferior.
Não é possível fazer o mesmo em nosso caso geral porque não há uma ordem total natural para os
elementos de V .

O restante da seção é dedicado à prova de um resultado fundamental.

Teorema 10.2 Toda f : I → V contínua é Riemann-integrável. Além disso, temos a estimativa:

b b
Z Z


f (t) dt ≤
∥f (t)∥V dt ≤ (b − a) sup ∥f (t)∥V .
a V a t∈I

Esta prova será baseada num lema preliminar. Este lema nos permite comparar as
somas de Riemann de duas partições de tamanho pequeno.

Lema 10.1 Considere duas partições pontilhadas P , Q. Então:

∥s(f, P ) − s(f, Q)∥V ≤ (b − a) (mf (|P |) + mf (|Q|)).

Prova: A prova é muito similar a do caso de funções a valores reais.


Em primeiro lugar, tome um conjunto

R := {r0 , r1 , . . . , rk+1 } ⊂ [a, b] com a = r0 ≤ r1 ≤ · · · ≤ rk+1 = b

de modo que:

• Existem índices j0P = 0 < j1P < · · · < jnPP +1 = k + 1 tais que tPi = rjiP para cada
i = 0, 1, 2, . . . , nP ;

• Existem índices j0Q = 0 < j1Q < · · · < jnPQ +1 = k + 1 tais que tPi = rj Q para cada
i
i = 0, 1, 2, . . . , nP .

171
Não provaremos que tal R existe porque isso é feito nos cursos de Análise na Reta.
Escreva:
Xk
S := f (rj ) (rj+1 − rj ).
j=0

A ideia do restante da prova é mostrar que

∥s(f, P ) − S∥V ≤ mf (|P |) (b − a) e ∥s(f, Q) − S∥V ≤ mf (|Q|) (b − a),

o que claramente implica nosso objetivo. Faremos a conta apenas para P porque o caso
de Q é análogo.
Com nossa notação, temos a seguinte fórmula para S:
P−1
nP ji+1
X X
S= f (rj ) (rj+1 − rj ).
i=0 j=jiP

De fato, tudo que fizemos foi quebrar a soma em j de acordo com o índice i tal que
jiP ≤ j < ji+1
P
(é fácil ver que este índice existe e é único para cada j).
Agora observe que, para cada índice 0 ≤ i ≤ nP ,
P −1
ji+1
X
tPi+1 − tPi = rji+1
P − rjiP = (rj+1 − rj ).
j=jiP

Além disso, para cada i e cada j = jiP , . . . , ji+1


P
− 1, temos

rj , sPi ∈ [tPi , tPi+1 ]

e portanto |rj − sPi | ≤ tPi+1 − tPi ≤ |P |. Portanto

∥f (rj ) − f (sPi )∥V ≤ mf (|P |)

Deduzimos que
P −1
P
ji+1 ji+1 −1
P X X
(ti+1 − tPi )f (sPi ) − (rj+1 − rj )f (rj ) =
P
(rj+1 − rj )(f (si ) − f (rj ))

j=j P
j=j P
i V i V
≤ mf (|P |)(tPi+1 − tPi ).

Portanto,
P −1

nP ji+1 nP
X P X X
P P
∥s(f, P ) − S∥V ≤ (ti+1 − ti )f (si ) −
(rj+1 − rj )f (rj ) ≤ mf (|P |)
(tPi+1 − tPi ).
i=0 j=j P
i=0
i V

A soma telescópica do lado direito vale b − a. 2

172
Prova: [Prova do Teorema]Note que o Lema anterior mostra que, dada qualquer sequência
{Pn }n∈N como acima, com δn := |Pn | → 0,

∀m, n ∈ N : ∥s(f, Pn ) − s(f, Pm )∥V ≤ (mf (δn ) + mf (δm )) (b − a) → 0

quando m, n → +∞. Deduzimos que {s(f, Pn )}n∈N é Cauchy e portanto converge.


Se {Qn }n∈N é outra sequência de partições pontilhadas com |Qn | → 0, podemos
intercalá-la numa só sequência com {Pn }n∈N para deduzir que s(f, Qn ) converge ao mesmo
Rb
limite. É este limite que chamamos de a f (s) ds. Veja que:
k
!
X
∥s(f, Pn )∥V ≤ (tiPn − tPi−1
n
) ∥f (ciPn )∥V ,
i=1
Rb
e a soma da direita é uma soma de Riemann para a ∥f (s)∥V ds. Portanto, tomando
limites, Z b Z b


f (s) ds ≤
∥f (s)∥V ds.
a V a
2

Exercício 10.11 Prove a partir das somas de Riemann que, se f ∈ C(I, V ) e P é uma partição
pontilhada,
Z b
∥s(f, P ) − f (t) dt∥V ≤ (b − a) mf (|P |).
a

Exercício 10.12 Prove a partir das somas de Riemann que, se f ∈ C(I, V ) e a ≤ x ≤ y ≤ z ≤ b,


Z z Z y Z z
f (t) dt = f (t) dt + f (t) dt.
x x y

10.4 O teorema fundamental do Cálculo


Ry
A partir de agora, definimos x f (s) ds para y =
̸ x da forma usual se x < y e como
Z y Z x
f (s) ds = − f (s) ds se x > y.
x y

Com esta notação, é fácil provar que


Z y

f (s) ds ≤ |y − x| sup ∥f (s)∥V .

x V s∈[x,y]

Como também é evidente que


Ry Ry
f (s) ds (f (s) − f (x)) ds
∀x, y ∈ I : x ̸= y ⇒ x − f (x) = x
.
y−x y−x

173
Ou seja,
R y
x f (s) ds
≤ sup ∥f (s) − f (x)∥V ≤ mf (|y − x|) → 0 quando y → x.


y−x − f (x)
V s∈[x,y]

Isto implica o seguinte resultado.


Teorema 10.3 (Teorema Fundamental do Cálculo) Dada f ∈ C(I, V ), defina:
Z t
I(f )(t) := f (s) ds (t ∈ I).
a

Então I : C(I, V ) → C(I, V ) é contínua e além disso:


I(f )′ = f.
Exercício 10.13 Dado um subintervalo J = [c, d] ⊂ [a, b] com a < c < d < b e uma f : I → V ,
mostre que:
I(f )(· + h) − I(f )(·)
lim sup − f = 0.
ε→0+ 0<|h|≤ε h
J,∞

10.5 Mais exercícios


Exercício 10.14 Suponha que V = Rd . Mostre a partir da definição apresentada no texto que a
integral de f ∈ C(I, Rd ) é dada por:
Z y Z y d
f (t) dt = f [i](t) dt (x, y ∈ I).
x x i=1

nuaintegral Exercício 10.15 Mostre que a operação I definida implicitamente no Teorema Fundamental do
Cálculo é uma aplicação linear contínua de C(I, V ) em C(I, V ).
Exercício 10.16 Considere espaços vetoriais (V, ∥ · ∥V ) e (W, ∥ · ∥W ) e T : V → W linear e
contínua. Mostre que, se f : [a, b] → V é diferenciável em t ∈ [a, b], então
(T f )′ (t) = T f ′ (t).
Exercício 10.17 (Série de Taylor) Suponha que f : I → V é k vezes diferenciável e que
f (k) (t0 ) existe num certo ponto t0 ∈ (a, b). Mostre que podemos escrever:
k
X f (j) (t0 )
∀h ∈ R com t0 ∈ h ∈ [a, b] : f (t0 + h) = f (t0 ) + hj + rk (h),
j=1
j!

com ∥rk (h)∥V /|h|k → 0 quando h → 0.


Exercício 10.18 (Série de Taylor com resto integral) Na mesma linha do exercício acima,
suponha que f : I → V é k vezes diferenciável com k-ésima derivada contínua em
todo intervalo. Encontre uma fórmula explícita para rk (h) em termos de uma integral
envolvendo a k-ésima derivada.

174
Capítulo 11

A derivada como transformação linear

No capítulo anterior, fizemos a parte fácil do trabalho de diferenciar funções com valores
vetoriais. O tema deste capítulo é considerar funções cujas entradas e valores podem ser
vetoriais. Apresentaremos os principais conceitos da teoria e veremos muitos exemplos
interessantes.

11.1 Definição de derivada de Fréchet


Fixamos dois espaços vetoriais normados (V, ∥ · ∥V ) e (W, ∥ · ∥W ). A definição geral de
derivada é a seguinte.

Definição 11.1 Dado um aberto U ⊂ V , dizemos que f : U → W é Fréchet-diferenciável em


x ∈ U se existe uma transformação linear contínua T ∈ L(V, W ) tal que para h ∈ V , h → 0V ,

f (x + h) = f (x) + T h + rx (h)

para uma “função-resto" rx com ∥rx (h)∥W /∥h∥V → 0. De forma equivalente, pedimos que
rx (h) := f (x + h) − f (x) − T h satisfaça o seguinte:

∀ε > 0 ∃δ > 0 : ∀h ∈ BV (x, δ) ⊂ U, ∥rx (h)∥W ≤ ε ∥h∥V .

Chamamos T de derivada de Fréchet (ou simplesmente derivada) de f em x e escrevemos T = Df (x).

Um ponto fundamental da definição acima é que Df (x) deve ser uma transformação
linear contínua, ou limitada:

∥Df (x) v∥W


∥Df (x)∥V →W := sup < +∞.
v∈V \{0V } ∥v∥V

Sabemos que toda transformação linear é contínua quando V = Rd , mas há transformações


lineares descontínuas em alguns outros casos. Portanto, quando V tem dimensão infinita,

175
parte do trabalho de provar que uma transformação linear T é a derivada de f em x é mostrar que
∥T ∥V →W < +∞.
Outra observação básica é sobre notação. Frequentemente usaremos o(h) para denotar
uma função de h ∈ V (com norma pequena) que satisfaz o(h)/∥h∥V → 0 quando ∥h∥V → 0.
Por isso, a propriedade do resto na definição de derivada será escrita como:
rx (h) = f (x + h) − f (x) − T h = o(h).
Usaremos esta notação abaixo sem muita preocupação.
Antes de prosseguirmos, notamos uma propriedade simples de uma função diferen-
ciável num ponto.

Exercício 11.1 Com V qualquer, note que, se f é diferenciável em x, então f também é contínua
em x.

A dica para provar isso é mostrar que uma função o(h) tende a 0W quando h → 0V
(isto é, “nem precisa" dividir por ∥h∥V ).

11.1.1 Unicidade da derivada de Fréchet e derivadas direcionais


Um outro ponto importante da definição é saber se T = Df (x) é unicamente definido.
Para isso, usamos a proposição abaixo.

rechetunica Proposição 11.1 No contexto da definição acima, Suponha que S ∈ L(V, W ) satisfaz:

∥Rx (h)∥W
f (x + h) = f (x) + S h + Rx (h), com → 0,
∥h∥V
assim como T . Então S = T . De fato, para cada v ∈ V , vale:
f (x + tv) − f (x)
Sv = T v = lim .
t→+∞ t
Prova: Veja que S 0V = T 0V = 0W por linearidade. Se v ̸= 0V , podemos tomar h := tv,
notando que este vetor vai a 0V quando t → 0 e ∥tv∥V = |t|∥v∥V . Deduzimos que

f (x + tv) − f (x) f (x + tv) − f (x) − T (tv)
= ∥rx (tv)∥ ∥v∥V → 0,

− T v =
t
W
t
W ∥t v∥V
ou seja,
f (x + tv) − f (x)
T v = lim .
t→0 t
Repetindo a prova com S, deduzimos:
f (x + tv) − f (x)
Sv = lim .
t→0 t
2

176
Esta prova pode deixar o leitor com a pulga atrás da orelha. Afinal, acabamos de
mostrar que:
f (x + h) − f (x)
Df (x) v = lim
h→0 h
e o limite do lado direito é bem mais palatável do que a derivada que acabamos de definir.
De fato, ele tem um nome.

Definição 11.2 O limite


f (x + tv) − f (x)
∂v f (x) := lim ,
t→0 t
quando existe, é chamado de derivada de Gâteaux (ou direcional) de f no ponto x e na direção v

Ao contrário da derivada de Fréchet, que às vezes é difícil de se calcular, a derivada


de Gâteaux se parece com as derivadas que já vimos antes. A prova da proposição 11.1
implica o seguinte resultado:

Proposição 11.2 (Prova omitida.) Quando a derivada de Fréchet Df (x) existe para um certo
x ∈ U , então as derivadas de Gâteaux também existem neste ponto e em todas as direções. Além
disso, Df (x).v = ∂v f (x) para todo v ∈ V .

A recíproca da proposição não é verdadeira: há casos em que ∂v f (x) existe para todo v, mas
f não é nem sequer contínua. Isso pode ocorrer mesmo quando V = R2 e W = R, como
mostra o exemplo abaixo.

:frechetnao Exemplo 11.1 Considere


(
(x[1])3 x[2]
(x[1])6 +(x[2])2
, x ̸= 0R2
f (x) =
0, x = 0R2 .

É fácil ver que as derivadas direcionais ∂v f (0R2 ) existem e são todas iguais a 0. No entanto, f não
é nem sequer contínua em 0R2 . Por exemplo, se fazemos a(t) := (t, t3 ) (t > 0), vemos que a é
contínua, mas f ◦ a(t) → 1/2 ̸= f ◦ a(0) quando t → 0.

Uma explicação para esta discrepância é que as derivadas direcionais ∂v f (x) só ligam
para o comportamento de f ao longo de retas a partir de x. Por isso, elas não “enxer-
gam" eventuais descontinuidades de f sobre curvas.
Concluindo, a derivada de Fréchet é mais exigente que a de Gâteaux. Por essa razão, ela
tem propriedades melhores. Por exemplo, a existência de Df (x) implica continuidade de
f em x, e as derivadas de Fréchet satisfazem a regra da cadeia (discutida mais adiante). As
derivadas de Gâteaux são mais fracas e não garantem muita coisa sobre o comportamento
de f numa vizinhança de x. No entanto, a derivada de Gâteaux é mais simples de calcular:
começar com ela pode ser uma boa maneira de “adivinhar" quem deve ser a derivada de
Fréchet. Além disso, há situações em que sabemos de antemão que a derivada de Fréchet
existe: nestes casos, sabemos que calcular ∂v f (x) para cada v vai nos dizer quem é Df (x).

177
11.2 Alguns casos simples da derivada de Fréchet
11.2.1 Quando o domínio está na reta
Um caso simples desta definição se dá quando V = R e U ⊂ R é aberto. Neste caso, parece
natural definir a derivada como o limite usual.
f (x + h) − f (x)
f ′ (x) := lim .
h→0 h
Nesta seção mostraremos que a derivada de Fréchet coincide com esta definição por limite
a menos de um isomorfismo. A proposição a seguir esclarece o que seria este isomorfismo.

Proposição 11.3 Os espaços L(R, W ) e W são isomorfos como espaços vetoriais normados. Isto
é, há uma bijeção linear entre estes dois espaços que preserva normas. De fato, esta bijeção leva
T ∈ L(R, W ) em vT := T 1 ∈ W .

Prova: Neste teorema, estamos pensando em R como espaço vetorial normado sobre o
corpo R. Por esta razão, podemos pensar num elemento x ∈ R como o produto x.1 do
escalar x com o elemento 1 deste espaço vetorial. Isto nos leva à constatação de que
vT := T (1) define inteiramente a transformação T , já que, dado qualquer x ∈ R,

T (x) = T (x.1) = (use linearidade) = x T (1) = x vT .

Agora argumentamos que a aplicação T 7→ vT nos dá uma bijeção linear de L(R, W ) com
W que preserva normas. Veja em primeiro lugar que, dados T, T ′ ∈ L(R, W ) e λ ∈ R,

vλT +T ′ = (λT + T ′ )(1) = λ T (1) + T ′ (1) = λ vT + vT ′ .

Além disso, vT = 0W implica que T (x) = 0W para todo x ∈ W , ou seja, T = 0L(R,W ) . Isto
implica que T 7→ vT é injetiva. Temos ainda:

∥T x∥W ∥xvT ∥W
∥T ∥R→W = sup = sup = ∥vT ∥W .
x∈R\{0}R |x| x∈R\{0}R |x|

Finalmente, T é sobrejetiva: dado qualquer v ∈ W , a transformação Tv que leva x ∈ R em


Tv (x) := x v tem vTv = v. Além disso, T é limitada pelo argumento acima. 2
Agora podemos enunciar o resultado que garante a coincidência entre as derivadas de
Fréchet e a “derivada como limite" a que estamos acostumados.

Lema 11.1 Dados U ⊂ R aberto, x ∈ U e f : U → W , são equivalentes:


1. f é diferenciável em x no sentido de Fréchet.

2. Existe o limite:
f (x + h) − f (x)
f ′ (x) := lim .
h→0 h

178
Além disso, quando f ′ (x) e Df (x) estão ambas definidas, temos f ′ (x) = Df (x)(1).

Prova: O ponto é que, dados T ∈ L(R, W ), h ∈ R com x + h ∈ U ,

f (x + h) − f (x) − T h = f (x + h) − f (x) − h vT

segundo o isomorfismo do exercício anterior, com vT = T 1. Deste modo,



∥f (x + h) − f (x) − T h∥W f (x + h) − f (x)
lim = lim − vT
.
h→0 |h| h→0 h
W

O lema segue trivialmente desta última identidade já que um dos limites existe e é zero
se e somente se o outro também é. Isto é, vT = f ′ (x) se e somente se T = Df (x). 2

11.2.2 Derivadas envolvendo funções lineares


ivadalinear
Uma observação simples, mas importante para o que segue, é que, se T : V → W já é
linear, então sua derivada é DT (x) h = T h, para quaisquer x, h ∈ V . A prova deste fato
fica como exercício. Um outro caso simples é descrito no exercício abaixo.

Exercício 11.2 Mostre que, quando f : U → W é diferenciável e T ∈ L(W, Z) para um outro


espaço vetorial normado Z. Neste caso, T ◦ f : U → Z tem derivada:

D(T ◦ f )(x) h = T Df (x) h

em todo ponto x ∈ U onde f é diferenciável.

O leitor é convidado a provar isto diretamente, mas observamos que esta é uma
consequência da regra da cadeia.

11.2.3 A derivada quando V tem dimensão finita e W = R


Nesta seção consideraremos o caso em que V tem dimensão finita e W = R. De fato,
nos contentaremos em entender bem o caso V = Rd e W = R; os mesmo resultados
se estendem aos outros espaços de dimensão finita porque todos os espaços de mesma
dimensão finita são isomorfos.
A tentação aqui é falar das derivadas parciais que já conhecemos do Cálculo. Cara
derivada parcial ∂f /∂xi é obtida fixando um x ∈ U , variando a i-ésima coordenada de x
e tomando o limite adequado. Não é difícil ver que isto é a mesma coisa que a derivada
direcional ∂ei f (x), que nós chamaremos de ∂i f (x) para deixar a notação mais leve.
Nossa pergunta aqui é: que condições sobre as derivadas parciais garantem que Df (x)
existe? Além disso, o que sabemos sobre Df (x) a partir das derivadas parciais?
O Exemplo 11.1 acima nos mostra a simples existência de derivadas parciais não
resolve garante que f é Fréchet-diferenciável em x. No entanto, pode-se dizer algumas

179
coisas sobre como é Df (x), caso ela exista. Observe que, como W = R, se f : U → R é
diferenciável, então Df (x) ∈ L(Rd , R) é um funcional linear contínuo entre V = Rd e R.
Em particular, dado v ∈ Rd :
d
X d
X d
X
Df (x) v := Df (x) v[i]ei = vi (Df (x) ei ) = vi ∂i f (x).
i=1 i=1 i=1

Portanto, se existe Df (x), então o vetor gradiente ∇f (x) = (∂i f (x))di=1 determina essa
derivada, no sentido que Df (x) · v = ∇f (x) · v para cada v ∈ Rd . Esta conclusão, no
entanto, não responde nossa pergunta anterior, que é se podemos saber que Df (x) existe
a partir das derivadas parciais.
O resultado a seguir nos diz que, se as derivadas parciais são contínuas numa vizinhança
de x, isso é suficiente para garantir que Df (x) existe.

iscontinuas Teorema 11.1 Suponha que U ⊂ Rd é aberto, f : U → R é dada e x ∈ U . Se as derivadas parciais


∂i f (1 ≤ i ≤ d) estão definidas em uma vizinhança aberta de x e são contínuas neste ponto, então
Df (x) existe (o que é o mesmo que dizer que f é diferenciável em x no sentido de Fréchet).

Prova: A ideia da prova é usar o Teorema do Valor Médio, que diz que, se g : I → R é
diferenciável num intervalo I e a, a + t ∈ I, então existe um ponto s com |s| ≤ |t|, a + s ∈ I
e g(a + t) − g(a) = g ′ (a + s) t.
Vamos aplicar este resultado às derivadas parciais que, no final das contas, são de-
rivadas em uma variável. Tome r > 0 tal √ que as derivadas
√ parciais de f existem em
BRd [x, r] ⊂ R . Veja que, se Ii := [x[i] − r/ d, x[i] + r/ d], então
d

Q := I1 × I2 × . . . Id ⊂ BRd [x, r].

Em particular, se x̃ ∈ Q e ti ∈ R é tal que x̃ + ti ei ∈ Q, existe um si = si (x̃, ti ) com |si | ≤ |ti |,


x̃ + si ei ∈ Q e
f (x̃ + ti ei ) − f (x̃) = ti ∂i f (x̃ + si ei ).
(Note que só podemos garantir x̃[i] + si ∈ Ii porque Q tem a estrutura de um produto car-
tesiano
√ de intervalos.)
√ Vamos aplicar isso ao caso em que as coordenadas de h estão entre
−r/ d e r/ d, o que garante x + h ∈ Q. Recordamos que h = di=1 h[i]ei . Observamos
P

que √para cada o vetor i=1 h[i] ei ∈ Q também tem coordenadas entre
Pj
√ j ∈ [d] ∪ {0} h j :=
−r/ d e r/ d. Portanto, x + hj ∈ Q para cada um destes j e podemos escrever uma soma
telescópica.
Xd
f (x + h) − f (x) = (f (x + hj ) − f (x + hj−1 )).
m=1

Como x + hj = x + hj−1 + h ej para cada j ∈ [d], podemos encontrar um valor h̃(j) entre
(j)

0 e h(j) , tal que, se h̃j := hj−1 + h̃(j) ej ,

f (x + hj ) − f (x + hj−1 ) = h(j) ∂j f (x + h̃j ).

180
Deduzimos que
d
X
f (x + h) − f (x) = h(j) ∂j f (x + h̃j ).
m=1

Para terminar a prova, definimos ∇f (x) como o vetor das derivadas parciais. Veja que:
d
X
f (x + h) − f (x) − ∇f (x) · h = rx (h) := h(j) (∂j f (x + h̃j ) − ∂j f (x)).
m=1

Por Cauchy-Schwartz,
v
u d
uX
|rx (h)| ≤ |h|2 t (∂j f (x + h̃j ) − ∂j f (x))2 .
j=1

Veja que |h̃j |2 ≤ |hj |2 ≤ |h|. Deste modo, quando h → 0, cada h̃j converge a 0. Podemos
combinar isto com nossa hipótese de continuidade das derivadas parciais e concluir que
o termo da raíz quadrada acima vai a 0. Portanto:
v
u d
|rx (h)| u X
≤t (∂j f (x + h̃j ) − ∂j f (x))2 → 0.
|h|2 m=1

Ou seja, ∇f (x) · h = Df (x) h, como queríamos mostrar. 2


Um corolário importante deste resultado é o seguinte.

Exercício 11.3 Dada f : U → R, as seguintes propriedades são equivalentes.


1. Df (x) está definido em todo U , e além disso Df : U → L(Rd , R) é função contínua;

2. ∇f (x) está definido em todo U , e além disso ∇f : U → Rd é função contínua;

3. todas as derivadas parciais de ∂i f (x) existem para qualquer x ∈ U e, além disso, as derivadas
parciais dependem continuamente de x.

No entanto, o exercício abaixo mostra que a derivadada de Fréchet pode existir mesmo
quando as derivadas parciais não são contínuas.

Exercício 11.4 Considere f : R2 → R definida por:


(  
|x|2 sin |x|1 2 ,
2
x ̸= 0R2 ;
f (x) :=
0, x = 0.

Prove que esta função é Fréchet diferenciável em 0R2 , mas não tem derivadas parciais contínuas
neste ponto.

181
11.2.4 O caso em que W tem dimensão finita
Também neste caso consideraremos apenas W = Rk . Neste caso, é possível mostrar o
seguinte resultado.

Exercício 11.5 f : U ⊂ Rk é diferenciável em x ∈ U se e somente se cada uma das funções


coordenadas é diferenciável. Isto é, se f [i] : U → R é diferenciável em x ∈ U para cada i ∈ [k],
então f é diferenciável em x e Df (x) h = (Df [i](x) h)ki=1 ; também vale a recíproca.

Considere agora a restrição a V = Rd , de modo que U ⊂ Rd . Assim como o gradiente é


o candidato “natural" a derivada quando W = Rk , nossa melhor tentativa para a derivada
de f é a matriz jacobiana Jac(f )(x) ∈ Rk×d com entradas

Jac(f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d).

De fato, os fatos abaixo seguem facilmente do que vimos no caso W = R.

Exercício 11.6 Quando V = Rd , W = Rk , f é como acima, x ∈ U e Df (x) existe, então a matriz


jacobiana está bem definida e

∀v ∈ Rd : Df (x) v = Jac(f )(x) v.

Isto é, Jac(f )(x) ∈ Rk×d é a matriz que representa Df (x) ∈ L(Rd , Rk ) na base canônica.

Exercício 11.7 Quando V = Rd , W = Rk , f é como acima, x ∈ U , Jac(f )(·) está definida numa
vizinhança de x e é contínua em x, então f é Fréchet-diferenciável em x.

Exercício 11.8 Dados U ⊂ Rd aberto e f : U → Rk , as seguintes propriedades são equivalentes:

1. Df (x) ∈ L(Rd , Rk ) está definida para qualquer x ∈ U e além disso Df : U → L(Rd , Rk ) é


função contínua;

2. A matriz jacobiana Jac(f )(x) ∈ Rk×d com entradas

Jac(f )(x)[i, j] = ∂j f [i](x) (1 ≤ i ≤ k, 1 ≤ j ≤ d)

está bem definida para qualquer x ∈ U e depende continuamente de x (o que é o mesmo que
dizer que suas entradas dependem continuamente de x).

Exercício 11.9 (Coordenadas polares) Podemos escrever cada vetor x ∈ Rd \{0Rd } na forma
r v, onde r := |x|2 > 0 e v := x/|x|2 ∈ Sd−1 . Note ainda que para cada v deste tipo há um único
vetor ṽ ∈ Rd−1 tal que v[i] = ṽ[i] para 1 ≤ i ≤ d − 1. Calcule a jacobiana da transformação que
leva x em (r, ṽ) ∈ R × Rd−1 ≡ Rd . Calcule ainda o determinante dessa transformação.

182
11.2.5 A derivada do determinante
Seção sendo escrita. Ao menos em princípio, as fórmulas acima nos permitem calcular as
derivadas de Fréchet para todas as funções entre espaços vetoriais. No entanto, há muitos
casos em que é mais fácil e mais interessante partir diretamente da definição. Veremos
alguns exemplos disso a seguir.

Exemplo 11.2 Considere a função det : Rd×d → R. Qual é a sua derivada em A ∈ Rd×d ?

Note que o determinante é um polinômio multilinear nas entradas da matriz, portanto


as derivadas parciais de det existem e são contínuas. Concluímos que Ddet(A) existe para
qualquer A e é um funcional linear de Rd×d em R. Apresentamos duas maneiras de fazer
isso abaixo.

Tratando Rd×d ∼
2
= Rd
Aqui aproveitamos a relação entre Rd×d e Rd . Note que o produto interno natural entre
2

matrizes A, B ∈ Rd×d é dado por:


d
X
⟨A, B⟩ := A[i, j]B[i, j] = tr(AB T ) = tr(AT B)
i,j=1

onde tr é o traço (soma das entradas diagonais). Adaptando a prova que vimos para Rd ,
sabemos que a existência da derivada de Fréchet em todo ponto garante que:

Ddet(A) H = ⟨∇det(A), H⟩ = tr(∇det(A)T H),

onde ∇det(A) ∈ Rd×d tem entradas:

∂det(A)
∇det(A)[i, j] = (1 ≤ i, j ≤ d).
∂A[i, j]

Para calcularmos as derivadas parciais, precisamos lembrar de como se escreve o


determinante a partir de uma linha de A e a chamada matriz de cofatores. Em primeiro
lugar, definimos, para cada par 1 ≤ i, j ≤ d, uma matriz Aij ∈ R(d−1)×(d−1) : esta matriz é
igual a A, exceto que omitimos a i-ésima linha e a j-ésima coluna. A matriz de cofatores
de A é definida como o elemento C(A) ∈ Rd×d com entradas

C(A)[i, j] := (−1)i+j det(Aij ) (1 ≤ i, j ≤ d).

Entre outras coisas, a matriz de cofatores é importante porque

C(A)T
det(A) ̸= 0 ⇒ A−1 = . (11.1) eq:determin
det(A)

183
Além disso, sabemos que o determinante pode ser escrito a partir dos elementos da
linha i da matriz A e dos cofatores correspondentes.
d
X d
X
det(A) = A[i, k] C(A)[i, k] = (−1)i+k A[i, k] det(Aik ).
k=1 k=1

Agora tomamos a derivada parcial da fórmula acima na variável A[i, j]. Note que as
matrizes Aik não incluem a entrada A[i, j] porque a linha i for omitida de cada uma delas.
Por isso, os termos A[i, k] det(Aik ) com k ̸= j tem derivada parcial 0 com respeito a A[i, j].
Portanto:
∂det(A) ∂
= A[i, j] C(A)[i, j] = C(A)[i, j].
∂A[i, j] ∂A[i, j]
Concluímos que:
∇det(A) = C(A)
e que
Ddet(A) H = tr(C(A)T H). (11.2) eq:Ddetgera
Em particular, a equação (11.1) nos diz que:

det(A) ̸= 0 ⇒ Ddet(A) H = det(A) tr(A−1 H). (11.3) eq:Ddetinve

Uma outra abordagem


Agora apresentamos um argumento mais abstrato, baseado nas propriedades fundamen-
tais do determinante, que nos permite chegar rapidamente à última fórmula acima. Com
algum trabalho a mais, provaremos a fórmula mais geral (11.2).
Fixe uma A ∈ Rd×d inversível. Como já sabemos que a derivada de Fréchet existe, ela
tem de coincidir com a derivada de Gâteaux.
det(A + ε H) − det(A)
Ddet(A) H = lim .
ε→0+ ε
Usaremos agora o fato de que o determinante é multiplicativo: o determinante do produto
é o produto dos determinantes.

A + εH = A (I + εA−1 H) ⇒ det(A + ε H) = det(A) det(I + εA−1 H).

Deduzimos que:
det(I + ε A−1 H) − 1
Ddet(A) H = det(A) lim .
ε→0+ ε
Para facilidar, escrevemos ∆ := A−1 H. Note que o limite acima é igual a:

det(I + ε A−1 H) − 1
lim = Ddet(I) ∆.
ε→0+ ε

184
Isto é, estamos calculando uma derivada de Fréchet (ou de Gâteaux, tanto faz) no ponto
I ∈ Rd×d .
Para calcular este limite, lembramos desta vez que o determinante é uma função
multilinear das colunas da matriz ∆. Para usar isso da melhor maneira, usamos a seguinte
notação: se (v1 , . . . , vd ) ∈ (Rd )d são dados, det(v1 , . . . , vd ) é o determinante da matriz com
colunas (v1 , . . . , vd ). Desta forma, se chamamos de ∆j a j-ésima coluna de ∆,

det(I + ε∆) = det(e1 + ε∆1 , e2 + ε∆2 , . . . , ed + ε∆d ).

Desenvolvendo o determinante, usando a multilinearidade, chegamos à seguinte expres-


são:

det(I + ε ∆) = det(I)
+ε (det(∆1 , e2 , . . . , ed−1 , ed ) + det(e1 , ∆2 , . . . , ed−1 , ed ) + · · · + det(e1 , e2 , . . . , ed−1 , ∆d ))
Xd
+ ε k ck ,
k=2

onde os ck são certas constantes. Subtraindo det(I), dividindo por ε e mandando ε a 0, os


termos εk ck desaparecem e ficamos com:

det(I + ε A−1 H) − 1
lim = det(∆1 , e2 , . . . , ed−1 , ed )+det(e1 , ∆2 , . . . , ed−1 , ed )+· · ·+det(e1 , e2 , . . . , ed−1 , ∆d )
ε→0+ ε

Cada matriz na soma do lado direito coincide com a identidade exceto na coluna j, que
é igual a ∆j . É um exercício mostrar que o determinante de uma matriz deste tipo é
∆j [j] = ∆[j, j]. Portanto,

det(I + ε A−1 H) − 1
lim = ∆[1, 1] + ∆[2, 2] + · · · + ∆[d, d] = tr(∆).
ε→0+ ε
Lembrando que ∆ = A−1 H e combinando com as igualdades anteriores, chegamos
novamente à fórmula (11.3). Para A ∈ Rd×d inversível, ela implica que Ddet(A) H =
tr(C(A)T H). Como C(A) depende continuamente de A; as matrizes inversíveis são den-
sas em Rd×d ; e sabemos que Ddet(A) depende continuamente de A, concluímos que a
fórmula mais geral (11.2) vale para todas as matrizes A ∈ Rd×d e qualquer H ∈ Rd×d .

Exercício 11.10 Descreva e justifique em detalhes o que aconteceu na última etapa da demonstra-
ção.

Exercício 11.11 Considere Rd×d e também o subespaço Rsimd×d


⊂ Rd×d das matrizes simétri-
cas. Calcule a derivada de Fréchet da operação f : Rd×d d×d
→ Rsim que leva uma M ∈ Rd×d
em M T M .

185
11.3 Boas propriedades da derivada de Fréchet
Nesta seção damos substância ao que já dissemos acima: a derivada de Fréchet tem boas
propriedades teóricas. Os dois teoremas desta seção nos dizem que ela satisfaz uma regra
da cadeia e uma desigualdade assemelhada ao Teorema do Valor Médio.

11.3.1 A regra da cadeia


Enunciamos abaixo a versão geral da regra da cadeia. Tão importante quanto entender
que ela vale é observar que as derivadas direcionais não satisfazem a regra da cadeia; veja a
Observação 11.1 abaixo.

Teorema 11.2 (Regra da cadeia) Suponha que (V, ∥ · ∥V ), (W, ∥ · ∥W ) e (Z, ∥ · ∥Z ) são espaços
vetoriais normados. Suponha que UV ⊂ V e UW ⊂ W são abertos, que f : UV → UW e
g : UW → Z. Fixos x ∈ UV e y = f (x) ∈ UW , suponha que as derivadas de Fréchet Df (x) e
Dg(y) existem. Então a derivada de g◦f em x também existe e é dada pelo produto de transformações
lineares Dg ◦ f (x) = Dg(y) Df (x).

Prova: Fixe x e y = f (x) como acima. Dado h ∈ V com x + h ∈ UV , escrevemos:


hy := f (x + h) − f (x) = f (x + h) − y. Temos:

g ◦ f (x + h) − g ◦ f (x) = g(y + hy ) − g(y) = Dg(y) hy + Ry (hy ),

com Ry o termo de resto esperado. Do mesmo modo,

hy = Df (x) h + rx (h).

Concluímos que:

g ◦ f (x + h) − g ◦ f (x) = Dg(y) Df (x) h + Ry (hy ) + Dg(y) rx (h).

Esta fórmula deixa clara a nossa missão: queremos provar que o termo Ry (hy ) + rx (h) se
comporta como esperamos de um resto. Ou seja, queremos que

∥Ry (hy ) + Dg(y) rx (h)∥Z


Objetivo final: → 0 quando h → 0.
∥h∥X

Vejamos como provar isso. O primeiro passo é quebrar a expressão em duas

∥Ry (hy ) + Dg(y) rx (h)∥Z ∥Ry (hy )∥Z ∥Dg(y) rx (h)∥Z


≤ +
∥h∥X ∥h∥V ∥h∥V

e controlar o segundo termo. De fato, como Dg(y) é uma transformação linear limitada,

∥Dg(y) rx (h)∥Z ∥rx (h)∥W h→0 ∥rx (h)∥W h→0


≤ ∥Dg(y)∥V →W → 0 porque → 0.
∥h∥V ∥h∥V ∥h∥V

186
Ainda nos falta mostrar que ∥Ry (hy )∥Z /∥h∥X também converge a 0. Tome ε > 0
qualquer. Como ∥Ry (a)∥Z /∥a∥V → 0 quando a → 0 sabemos que existe um δ > 0 tal que,

∀a ∈ W, ∥a∥W ≤ δ : y + a ∈ U e ∥Ry (a)∥Z ≤ ε ∥a∥W .

Por outro lado,


∥hy ∥W ∥f (x + h) − f (x)∥W ∥Df (x) h∥V + ∥rx (h)∥V ∥rx (h)∥V
= ≤ ≤ ∥Df (x)∥V →W + .
∥h∥V ∥h∥V ∥h∥V ∥h∥V

Portanto, quando h → 0, hy → 0. Em particular, se h é pequeno o suficiente, hy ∈ BV (y, δ)


e  
∥Ry (a)∥Z ∥rx (h)∥V
≤ ε ∥Df (x)∥V →W + .
∥h∥V ∥h∥V
Deduzimos que
∥Ry (hy )∥Z
lim sup ≤ ε (∥Df (x)∥V →W ) .
h→0 ∥h∥V
Como ε > 0 é arbitrário, o teorema segue. 2

teauxcadeia Observação 11.1 É instrutivo ver em um exemplo de que o resultado acima falha quando usamos
derivadas direcionais ao invés das de Fréchet. Considere a função f ◦ a do Exemplo 11.1 acima.
Veja que a, além de contínua, é diferenciável. Além disso, f tem derivadas direcionais ∂v f (x) para
todos x, v ∈ R2 . Apesar disso, a função f ◦ a não é diferenciável em 0R2 ; de fato, ela não é sequer
contínua. Isto tem a ver com os comentários depois do Exemplo 11.1: as derivadas direcionais não
se comportam bem quando calcularmos f ao longo de certas curvas indo para 0R2 . Já Fréchet não
sofre deste problema, o que foi importante na prova acima porque hy é uma função não-linear de h.

11.3.2 A desigualdade do valor médio


Vimos no Teorema 10.1 acima que o Teorema do Valor Médio se generaliza na forma de
desigualdade para funções diferenciáveis γ : [0, 1] → W com W espaço vetorial. Aqui vemos
uma extensão da desigualdade para funções F entre espaços vetoriais mais gerais. Recorde
que, dados dois pontos x, y num mesmo espaço vetorial V , [x, y] denota o segmento de
reta entre x e y, isto é:
[x, y] := {ty + (1 − t)x : t ∈ [0, 1].}

Teorema 11.3 (Desigualdade do valor médio) Considere f : U → W com U ⊂ V aberto.


Considere x, y ∈ U e suponha que o segmento de reta [x, y] está contido em U . Defina M :=
supa∈[x,y] ∥Df (a)∥V →W . Então ∥f (x) − f (y)∥W ≤ M ∥x − y∥V .

Prova: Considere m : [−ε, 1 + ε] → U definida por

m(t) := (1 − t) x + t y (t ∈ [0, 1]).

187
Veja que m está bem definida para ε > 0: como [x, y] ⊂ U e U é aberto, existe um ε positivo
tal que m(t) ∈ U para todo t ∈ (−ε, 1 + ε). Além disso, m é diferenciável, com derivada:

m′ (t) = (y − x).

A regra da cadeia garante que f ◦ m : (−ε, 1 + ε) → W . De fato, levando em conta


isomorfismos e tudo mais, temos (exercício!):

(f ◦ m)′ (t) = Df (m(t)) m′ (t) = Df (m(t)) (y − x).

Por sua vez, a desigualdade do valor médio para funções de [0, 1] em W (Teorema 10.1 acima)
nos garante que:

∥f (y) − f (x)∥W = ∥(f ◦ m)(1) − (f ◦ m)(0)∥W ≤ sup ∥Df (m(t)) (y − x)∥W .


t∈[0,1]

Para terminar, observamos que:

sup ∥Df (m(t)) (y − x)∥W ≤ sup ∥Df (m(t))∥V →W ∥y − x∥V = M ∥y − x∥V


t∈[0,1] t∈[0,1]

porque o conjunto dos valores m(t) é exatamente [x, y]. 2


Antes de prosseguirmos, enunciamos aqui, para conveniência futura, um resultado de
aproximação que nos será muito útil. Grosso modo, ele diz que, se a derivada não oscila
muito numa vizinhança de x, então a aproximação de primeira ordem f (x′ ) ≈ g(x′ ) :=
f (x) + Df (x) (x′ − x) ao redor de x é de alta qualidade. De fato, g aproxima f bem mesmo
quando consideramos diferenças de f entre pontos próximos de x.

cor:DVM Corolário 11.1 (Aproximação afim quando a derivada muda pouco) Suponha que f : U →
W como acima. Dados x ∈ U e r > 0 com BV (x, r) ⊂ U , suponha que f é diferenciável na bola
BV (x, r) e que
sup ∥Df (x′ ) − Df (x)∥V →W ≤ α.
x′ ∈BV (x,r)

Então a função g(x′ ) := f (x) + Df (x) (x′ − x) satisfaz Dg(x′ ) = Df (x) e

∀x′ , x′′ ∈ BV (x, r) : ∥g(x′′ ) − g(x′ ) − (f (x′′ ) − f (x′ ))∥W ≤ α ∥x′′ − x′ ∥V .

Prova: Isso segue de aplicar a desigualdade do valor médio à função f (x′ ) − g(x′ ) a cada
par x′ , x′′ ∈ BV (x, r), notando que [x′ , x′′ ] ⊂ BV (x, r) por convexidade e que

sup ∥D(f − g)(x′ )∥V →W = sup ∥Df (x′ ) − Df (x)∥V →W ≤ α.


x′ ∈BV (x,r) x′ ∈BV (x,r)

etLipschitz Exercício 11.12 Considere U ⊂ V aberto e convexo e f : U → W diferenciável. Mostre que

∥f ∥Lip = sup ∥Df (a)∥V →W .


a∈U

188
11.4 Derivadas mais complicadas de se calcular
Encerramos este primeiro capítulo sobre a derivada de Fréchet calculando derivadas de
funções que não são tão simples assim. O primeiro exemplo corresponde a funções de
operadores lineares e o segundo tem relação com o problema de existência e unicidade
para EDOs. O que estes exemplos têm em comum é que calcular as derivadas parciais
não parece ser mais simples que obter diretamente a derivada de Fréchet.

11.4.1 Exemplos no espaço de operadores lineares


eoperadores
Nesta seção, estaremos interessados no caso em que V = W = L(X, X) para algum
espaço vetorial normado (X, ∥ · ∥X ). Escreveremos L(X) := L(X, X) e chamaremos as
transformações lineares T ∈ L(X) de operadores lineares sobre X. Tudo que faremos já é
interessante no caso em que X = Rd , ∥ · ∥X = | · |2 é a norma Euclideana e L(X) ≡ Rd×d
com a norma de operador.
As operações que estamos interessados em derivar são as seguintes:

• Dado k ∈ N, a aplicação que leva T ∈ L(X) em T k .

• A aplicação que leva um T ∈ L(X) em T −1 ∈ L(X) (no caso de T ser uma bijeção e
T −1 ser limitado).

Mostraremos “no braço" que estas funções são diferenciáveis. Observe que isto envolve
encontrar operadores lineares A ∈ L(L(X), L(X))! Isso pode parecer estranho, mas
veremos que não há nada muito sério quando consideramos os casos concretos.
Nossas estiamtivas usarão muito a submultiplicatividade da norma de operador:

∀T, S ∈ L(X) : ∥T S∥X→X ≤ ∥T ∥X→X ∥S∥X→X .

Potências de operadores
Comecemos pela derivada de fk (T ) := T k .

Exemplo 11.3 Definimos fk (T ) := T k (T ∈ L(X)). Qual é sua derivada?

De fato, teremos interesse em calcular a derivada e estimar bem o termo de resto. A


maior dificuldade desta prova é que, ao contrário do caso em que T, H ∈ R a fórmular
para (T + H)k é bastante complicada por causa da não-comutatividade do produto de
operadores. Daremos um argumento que passará ao largo dessa dificuldade.
Considere o produto

(T + H)k := (T + H) (T + H) . . . (T + H) .
| {z }
k vezes

189
Para calcular o produto, devemos usar a propriedade distributiva. Ela diz que (T + H)k é a
soma de todos os 2k produtos de sequências do tipo T HT T HHH . . . HT H com exatamente
k termos.
Agruparemos estas sequências pelo número de vezes em que H aparece. Primeira-
mente, há exatamente uma sequência em que H aparece 0 vezes: T T T . . . T = T k .
Considere agora k sequências em que H aparece exatamente 1 vez. Elas são da forma

T . . T} H |T T {z
| .{z . . . T}
j termos j − k − 1 termos

com 0 ≤ j ≤ k − 1. Sua contribuição conjunta é


k−1
X
Ak (T ) H := T j H T k−1−j .
j=0

Note que, para cada T ∈ L(X), Ak (T ) : L(X) → L(X) é um operador linear. Ele é
limitado,porque, pela submultiplicatividade da norma de operador,
k−1
X
∥Ak (T ) H∥X→X ≤ ∥T ∥jX→X ∥H∥X→X ∥T ∥X→X
k−1−j
= k ∥T ∥k−1
X→X ∥H∥X→X . (11.4) eq:Akestima
j=0

Portanto, Ak (T ) ∈ L(L(X), L(X)).


Esta última estimativa tem algo de mágico. Tínhamos uma fórmula complicada para
Ak (T ) H. Quando passamos a norma de operador, ela de repente ficou tão simples quanto
o termo correspondente do teorema binomial usual. Para terminarmos a prova, vamos
usar um argumento parecido para estimar os demais termos de (T + H)k , observando eles
têm de ser o resto. E porque sabemos disso? Ora estes termos que restam certamente não
serão lineares em H, enquanto que o termo correspondendo à derivada tem de ser linear!
Façamos então uma estimativa de
k
X
rT (H) := (termos do produto com n ocorrências de H) = (T + H)k − T k − Ak (T ) H,
n=2

notando que, pela subaditividade da norma,


k
X
∥rT (H)∥X→X ≤ ∥(termos do produto com n ocorrências de H)∥X→X ,
n=2

Foquemo-nos em um dos termos da soma. Há nk escolhas de sequências de T s e Hs




com exatamente n termos iguais a H. Por sua vez, a norma de um produto de T s e Hs


deste tipo é limitada pela submultiplicatividade da norma.

∥T . . . T H T . . . T H . . . ∥X→X ≤ ∥H∥nX→X ∥T ∥k−n


X→X .

190
Concluímos que
 
k
∥(termos do produto com n ocorrências de H)∥X→X ≤ ∥H∥nX→X ∥T ∥k−n
X→X .
n
Somando estas cotas, obtemos:
k  
X k
∥rT (H)∥X→X ≤ ∥H∥nX→X ∥T ∥k−n
X→X
n=2
n

e a fórmula binomial nos dá uma expressão mais compacta:


k−1
∥rT (H)∥X→X ≤ (∥T ∥X→X + ∥H∥X→X )k − ∥T ∥kX→X − k ∥T ∥X→X ∥H∥X→X .

chame t := ∥T ∥X→X e h := ∥H∥X→X . Observe que:


     
k k(k − 1) k − 2 k (k − 1) k − 2
∀k ∈ N\{0, 1}∀n ∈ {2, . . . , k} : = ≤ ,
n n(n − 1) n − 2 2 n−2
logo
k
k(k − 1) k − 2 k−n n k (k − 1) h2
X  
k k k−1
(t + h) − t − kt = t h ≤ (t + h)k−2 .
n=2
n(n − 1) n − 2 2

Portanto,
k(k − 1)
∥rT (H)∥X→X ≤ (t + h)k−2 h2 .
2
Isto finalmente nos permite concluir que ∥rT (H)∥/∥H∥ → 0 quando H → 0. De fato,
temos o seguinte resultado.

Teorema 11.4 A aplicação fk (T ) := T k (T ∈ L(X)) é diferenciável. Sua derivada é dada pelo


operador limitado Ak (T ) dado acima. O termo de resto:

rT (H) := (T + H)k − T k − Ak (T ) H

satisfaz:
k (k − 1)
∥rT (H)∥X→X ≤ (∥T ∥X→X + ∥H∥X→X )k−2 ∥H∥2X→X .
2

Inversas de operadores
Temos agora um exemplo para tratar em que teremos muito mais trabalho.
Chame de U ⊂ L(X) o conjunto de todos os T que têm inversa T −1 ∈ L(X). Ou seja,
T ∈ L(X) se T é limitado, é uma bijeção de X em X e tem uma inversa satisfazendo
T −1 T = T T −1 = IX que também é um operador linear limitado. Nosso objetivo será
mostrar o seguinte resultado.

191
vadainversa Teorema 11.5 U é aberto de L(X). A função Inv : U → L(X) que leva T ∈ U em T −1 é
diferenciável e DInv(T ) H = −T −1 HT −1 .

Vamos começar com uma observação simples, que deixamos como exercício.

Exercício 11.13 Se A, B ∈ U são operadores inversíveis, então BA também o é e (BA)−1 =


A−1 B −1 .

Nosso próximo passo é estudar Inv numa vizinhança do operador identidade I.

Lema 11.2 A bola aberta BL(X) (I, 1) está contida em U. Além disso
X
∀A = I + H ∈ BL(X) (I, 1) : A−1 = Inv(I + H) = (−H)n .
n∈N

Prova: Já provamos que, em Pum espaço vetorial normado


P completo V , se uma sequência
de vetores {vn }n∈N satisfaz n∈N ∥vn ∥V < +∞, então n∈N vn converge. Aplicaremos isso
a V = L(X) com vn = H n . No primeiro caso, observamos que

∥vn ∥V = ∥(−H)n ∥X→X ≤ ∥H∥nL(X) com ∥H∥X→X < 1,

portanto n∈N (−H)n converge. Como a operação de tomar produtos em L(X) é contínua
P
(exercício), temos
X n
X
n
(I + H) (−H) = (I + H) lim (−H)j
n→+∞
n∈N j=0
n
X
= lim (I + H) (−H)j
n→+∞
j=0
Xn
= lim [(−H)j + (−1)j H j+1 ]
n→+∞
j=0
Xn
= lim [(−H)j − (−H)j+1 ]
n→+∞
j=0

(soma telescópica) = lim (I − H n+1 )


n→+∞
(∥H n+1 ∥X→X → 0) = I.

Do mesmo modo, ( n∈N (−H)n ) (I + H) = I. 2


P

Provemos agora o teorema.


Prova: Considere A ∈ U. Tome r = rA := 1/∥A−1 ∥X→X . Veja que, se H ∈ L(X) e
∥H∥X→X < r, vale ∥A−1 H∥X→X < 1. Portanto, o lema acima garante que
X
(I + A−1 H)−1 = (−A−1 H)j .
n∈N

192
Pelo exercício anterior, descobrimos que
X
(A + H)−1 = [A (I + A−1 H)]−1 = (−A−1 H)j A−1 .
n∈N

Em particular, provamos que, se A ∈ U, A + H ∈ U sempre que ∥H∥X→X < rA . Portanto,


U é aberto.
Para calcular a derivada, voltamos à série de potência. Observamos que a aplicação

DA : H 7→ −A−1 HA−1

é linear de L(X) no próprio espaço. Além disso, ela é limitada porque:

∀H ∈ L(X) : ∥DA H∥L(X) ≤ ∥A−1 ∥2L(X) ∥H∥L(X) .

Para provar que DA é a derivada de Inv no ponto A, veja que:


X
(A + H)−1 − A−1 − DA H = (−A−1 H)j A−1 .
n≥2

Como ∥H∥ ∥A−1 ∥ < 1,


X ∥H∥2 ∥A−1 ∥3
∥(A + H)−1 − A−1 − DA H∥X→X ≤ ∥A−1 ∥j+1 ∥H∥j = .
n≥2
1 − ∥H∥ ∥A−1 ∥

Com esta expressão é fácil concluir que

∥(A + H)−1 − A−1 − DA H∥X→X ∥H∥ ∥A−1 ∥3


≤ →0
∥H∥ 1 − ∥H∥ ∥A−1 ∥

quando H → 0. 2

11.4.2 Um exemplo sobre as funções contínuas


Dado um intervalo compacto [a, b] ⊂ R, defina o espaço usual C([a, b], Rd ). A função I
que associa a cada f ∈ C sua integral indefinida é um operador linear, portanto:
Z ·
DI(f ) h = I h = h(t) dt.
a

Consideraremos agora um tipo de função sobre C(I, Rd ) relacionado ao problema de


resolver EDOs. Dado U ⊂ Rd+1 aberto, considere o subconjunto U ⊂ C(I, Rd ) de funções
com f (I) ⊂ U .

193
Exercício 11.14 Prove que U é aberto de C(I, Rd ). (Dica: mostre primeiramente que

inf dRd (f (t), U c ) > 0.


t∈[a,b]

Se você não conseguir, tudo bem: há uma prova deste fato implícita na proposição abaixo!)

Considere uma função contínua Ψ : I × U → Rd . Dados x0 ∈ Rd , t0 ∈ I, considere ainda


a operação TΨ : U → C(I, R) que leva f numa nova função T (f ) com
Z t
T (f )(t) := x0 + Ψ(s, f (s)) ds.
t0

Veja que este operador está bem definido porque Ψ(t, f (t)) é contínua em t sempre que
f ∈ U. Como sabemos, a importância deste operador reside no fato que os seus pontos
fixos (se existem) são precisamente as soluções de ξ ′ (t) = Ψ(t, ξ(t)) com ξ(t0 ) = x0 .
Quando estudarmos o problema de existência para EDOs, vimos que T : U → C(I, R)
é contínua. Veremos agora que, sob hipóteses adicionais, esta aplicação é diferenciável e
calcularemos a sua derivada.

derivadaEDO Proposição 11.4 Dados (t, x) ∈ I × U , defina Dx Ψ(t, x) como a derivada da função em x ∈ U ,
com t mantido fixo. Suponha que esta derivada existe para todo par (t, x) ∈ I × U e que, além disso,
ela depende continuamente de (t, x). Então T é diferenciável em qualquer f ∈ U. Além disso, se
v ∈ C(I, Rd ),
DT (f ) ∈ L(C(I, R))
existe e é igual ao operador linear que leva v ∈ C(I, R) na função
Z t
(DT (f ) v)(t) := Dx Ψ(s, f (s)) v(s) ds (t ∈ I).
t0

Prova: Veja que T (f ) é a soma de uma função


R· constante igual a x0 com I ◦ F (f ), onde
I ∈ L(C(I, Rd )) leva cada f em I(f )(·) = t0 f (s) ds e F : U → C(I, Rd ) leva f em Ψ(·, f (·)).
Usando os resultados da seção 11.2.2, descobrimos que, se provarmos que DF (f ) existe e
satisfaz:
∀v ∈ C(I, Rd ), ∀t ∈ I : (DF (f ) v)(t) = Dx Ψ(t, f (t)),
então DT = I DF . Além disso, como I é linear e limitado (logo contínuo), a continuidade
de DT será consequência da continuidade de DF .
Mostremos, então, que F é diferenciável com a derivada que dizemos que ela tem.
Fixo um f ∈ U, diferenciaremos F nos pontos ao redor de f , mostrando que esta derivada
é contínua.
Em princípio podemos pensar num esquema simples para a prova da existência da
derivada. Nosso objetivo é provar que
∥F (f + h) − F (f ) − Dx Ψ(·, f (·)) h(·)∥∞
(queremos provar) → 0.
∥h∥∞

194
O que sabemos, em princípio, é que Ψ é diferenciável em x, portanto podemos escrever:

F (f + h)(t) − F (f (t)) = Ψ(t, f (t) + h(t)) − Ψ(t, f (t)) = Dx Ψ(t, f (t)) h(t) + r(t,f (t)) (h(t)).

Para cada t ∈ I, poderíamos mostrar algo na linha de

|r(t,f (t)) (h(t))|2 |r(t,f (t)) (h(t))|2


≤ → 0.
∥h∥∞ |h(t)|2

No entanto, isso não resolve nosso problema, porque precisamos mostrar uma convergên-
cia uniforme. Ou seja, a definição da derivada para funções F : U → C(I, Rd ) nos obriga a
mostrar que o termo de resto satisfaz

supt∈I |r(t,f (t)) (h(t))|2


→0
∥h∥∞

e isso é um pouco mais complicado.


Para vencermos esta dificuldade, será importante usar a continuidade uniforme de Dx Ψ.
Para isso, teremos de nos restringir a um compacto K ⊂ I × U . Que compacto seria este?
Ele deve ser grande a ponto de podemos “variar" entre f e f + h lá dentro. Por esta razão,
queremos (t, f (t) + h(t)) ∈ K para cada t ∈ I e h próxima de 0. Garantiremos que isso
vale tomando uma “faixa" (se d = 1) ou “cilindro" (se d > 1) ao redor do gráfico de f . Ou
seja, queremos um conjunto da forma

K := {(t, x) : t ∈ [a, b], |x − f (t)| ≤ R}. (11.5) eq:faixaK

A questão, então, é se podemos escolher um R > 0 de modo que K ⊂ U . Para concluirmos


que “sim, podemos", devemos observar que f (t) ∈ U para cada t ∈ I = [a, b]. A aplicação

t ∈ I 7→ dRd (f (t), U c )

é contínua (é a composição de funções contínuas) e positiva (U c é fechado, logo dRd (x, U c ) =


0 se e somente se x ∈ U c ). Combinando estes fatos com a compacidade de I, deduzimos
que
R0 := inf dRd (f (t), U c ) > 0.
t∈[a,b]

Portanto, se 0 < R < R0 , garantimos que o conjunto K em (11.5) realmente está contido
em U . Note que, se h ∈ C([a, b], V ) e ∥h∥∞ ≤ R, então (t, f (t) + h(t)) ∈ K para cada t,
portanto f + h ∈ U.
(Note que acabamos de provar “sem querer" que há uma bola BC(I,Rd ) [f, R] ⊂ U.
Notando que podemos achar um R > 0 para cada f ∈ U, provamos que U é aberto!)
Tendo o compacto K, queremos usar a continuidade uniforme de Dx Ψ |K . Tome um
(t, a), (t, b) ∈ K com |b−a| ≤ δ. Pelo corolário 11.1 acima (aplicado com x′ = a e x′′ = a+b),

∀(t, a), (t, a + b) ∈ K : |Ψ(t, a + b) − Ψ(t, a) − Dx Ψ(t, a) b|2 ≤ c(δ) |b|2 .

195
onde
c(δ) := sup |Dx Ψ(t, a) − Dx Ψ(t, b)|.
(t,a),(t′ ,b)∈K : |(t′ ,b)−(t,a)|2 ≤δ

Como Dx Ψ é contínua sobre I × U , e portanto é uniformemente contínua sobre o compacto


K, vemos que c(δ) → 0 quando δ → 0. Note que isto quer dizer que
|Ψ(t, a + b) − Ψ(t, a) − Dx Ψ(t, a) b|2
sup ≤ c(δ) → 0 quando δ → 0.
(t,a),(t,a+b)∈K : 0<|b|2 ≤δ |b|2

De posse dessa desigualdade, não é difícil completar a prova. Considere f e f + h


com ∥h∥∞ ≤ R, de modo que (t, f (t)) ∈ K e (t, f (t) + h(t)) ∈ K para cada t ∈ I. Como
|h(t)|2 ≤ ∥h∥∞ para cada t, temos

∀t ∈ I : |Ψ(t, f (t) + h(t)) − Ψ(t, f (t)) − Dx Ψ(t, f (t)) h(t)|2 ≤ c(∥h∥∞ ) ∥h∥∞ ,

ou
∥F (f + h) − F (f ) − Dx Ψ(·, f (·)) h(·)∥∞ ≤ c(∥h∥∞ ) ∥h∥∞ .
Portanto,
∥F (f + h) − F (f ) − Dx Ψ(·, f (·)) h(·)∥∞
≤ c(∥h∥∞ ) → 0 quando h → 0.
∥h∥∞
Isto demonstra que a derivada DF (f ) existe e é igual ao que dissemos que ela era.
Para terminar, observamos que esta derivada é contínua: se {fn }n∈N ⊂ C(I, Rd ) e
fn → f , temos (t, fn (t)) ∈ K para todo t e todo n grande, e aí vemos que

∥DF (fn ) − DF (f )∥L(C,C) = sup ∥(Dx Ψ(·, fn (·)) − Dx (Ψ(·, f (·)))) h(·)∥∞
h∈C, ∥h∥∞ ≤1

= sup ∥(Dx Ψ(t, fn (t)) − Dx Ψ(t, f (t))) h(t)∥Rd


|h(t)|2 ≤1
t∈I
≤ sup ∥Dx Ψ(t, fn (t)) − Dx Ψ(·, f (·))∥Rd →Rd → 0
t∈I

por continuidade uniforme de Dx Ψ em K. 2

Observação 11.2 O mesmo argumento que demos acima prova algo a mais. Considere um
compacto K ⊂ I × U ⊂ Rd+1 . Em primeiro lugar, vemos que existe uma função não-decrescente
c = c(δ) ≥ 0 com limδ→0 c(δ) = 0 tal que

∀(t, a), (t, b) ∈ K : |Ψ(t, a + δ) − Ψ(t, a) − Dx Ψ(t, a) (b − a)|2 ≤ c(|b − a|2 ) |b − a|2 .

Agora chame de
K := {f ∈ C(I, Rd ) : ∀t ∈ I, (t, f (t)) ∈ K}.
Neste caso, temos a estimativa:

∀t ∈ I, ∀f, f + h ∈ K : |Ψ(t, f (t) + h(t)) − Ψ(t, f (t)) − Dx Ψ(t, f (t)) h(t)|2 ≤ c(∥h∥∞ ) ∥h∥∞ ,

196
o que se traduz em
∀f, f + h ∈ K : ∥F (f + h) − F (f ) − DF (f ) h|2 ≤ c(∥h∥∞ ) ∥h∥∞ ,
e
∀f, f + h ∈ K : ∥T (f + h) − T (f ) − DT (f ) h|2 ≤ (b − a) c(∥h∥∞ ) ∥h∥∞ ,
já que T = I ◦ F , DT = I ◦ DF e a norma de operador de I é ≤ (b − a).

11.5 Mais exercícios


Exercício 11.15 (Mínimos são pontos críticos) Suponha que (V, ∥ · ∥V ) é espaço vetorial nor-
mado, U ⊂ V é aberto e f : U → R dada. Mostre que, se x ∈ U , f é diferenciável em x e
f (x) = inf x′ ∈U f (x′ ), então Df (x) = 0L(V,R) .
Exercício 11.16 (Derivadas de funções convexas) Suponha que (V, ∥ · ∥V ) é espaço vetorial
normado, U ⊂ V é aberto convexo e f : U → R é diferenciável. Mostre que f é convexa (isto é,
f (tx + (1 − t)x′ ) ≤ tf (x) + (1 − t)f (x′ ) para todos x, x′ ∈ U e 0 ≤ t ≤ 1) se e somente se:
∀x, x′ ∈ U : f (x′ ) ≥ f (x) + Df (x) (x′ − x).
bilipschitz Exercício 11.17 Suponha que (V, ∥ · ∥V ) é espaço vetorial normado, U ⊂ V é aberto e convexo e
f : U → W é diferenciável. Suponha ainda que f é bi-Lipschitz, isto é, ∃L− , L+ > 0 tais que
∥f (x) − f (x′ )∥W
∀x, x′ ∈ U : x ̸= x′ ⇒ L− ≤ ≤ L+ .
∥x − x′ ∥V
Mostre que, neste caso, temos a seguinte desigualdade:
∀x ∈ U ∀h ∈ V : L− ∥h∥V ≤ ∥Df (x) h∥W ≤ L+ ∥h∥V .
Exercício 11.18 Seja (V, ∥·∥V ) espaço vetorial normado. Dado k ∈ N , recorde-se que V k também
tem estrutura de espaço normado, por exemplo com a norma:
k
X
∥v∥V := ∥v[i]∥V , (v = (v[i])ki=1 ∈ V k ).
i=1

Agora defina uma operação Tk : V → V k que leva x ∈ V em (x, x, x, . . . , x) (x ∈ V ). Qual é a


derivada de Fréchet desta operação Tk ?
Exercício 11.19 O permanente de uma matriz A ∈ Rd×d é dado por:
d
XY
per(A) := A[i, σ(i)].
σ∈Sd i=1

Ou seja: o permanente é “quase igual" ao determinante, mas não aparecem os sinais alternados na
fórmula. (Estranhamente, isso o torna mais difícil de calcular, mas muito útil em certos modelos da
Mecânica Estatística.) Mostre que per : Rd×d → R é Fréchet-diferenciável e calcule sua derivada.

197
Exercício 11.20 Considere espaços vetoriais normados (V, ∥·∥V ) e (Wi , ∥·∥Wi ) para i = 1, 2, . . . , k.
Defina o espaço produto W := W1 ×W2 ×· · ·×Wk com uma das normas-produto que já estudamos.
Dado um aberto U ⊂ V , considere funções fi : U → Wi , com i = 1, . . . , k. Construa uma nova
função f : U → W que leva x ∈ U na k-tupla f (x) = (fi (x))ki=1 ∈ W . Mostre que f é
diferenciável em um certo x ∈ U se e somente se cada fi é diferenciável em x e calcule a derivada de
Fréchet de f em termos das derivadas Dfi (x).

Exercício 11.21 (“Regra de Leibniz" para derivada de Fréchet) Continue com a notação acima
e acrescente um novo espaço vetorial normado (Z, ∥ · ∥Z ) e uma Q : W → Z k-linear e limitada.
Defina F : U → Z através da fórmula:

F (x) := Q(f1 (x), . . . , fk (x)) (x ∈ U ).

Mostre que, se todas as fi são diferenciáveis num certo x ∈ U , então DF (x) existe. Além disso,
calcule DF (x).

Exercício 11.22 Neste problema, (X, ∥ · ∥X ) é um espaço vetorial normado completo e L(X) é
o espaço dos operadores lineares limitados de X em X. Considerand uma sequência {an }n∈N ,
queremos encontrar condições sob as quais a série de potência
X
f (T ) := an T n
n∈N

define uma função diferenciável sobre uma vizinhança de 0 em L(X). Como no caso de séries de
potência reais, definimos o raio de convergência:

R := (lim sup |an |1/n )−1 .


n∈N

1. Mostre que a série definindo f converge se ∥T ∥X→X < R.

2. Lembre da definição de Ak acima e mostre que a expressão


X
Df (T ) H := an An (T ) H (H ∈ L(X))
n≥1

define um operador linear sobre L(X), que é a derivada de Fréchet de f em T .

198
Capítulo 12

Derivadas de ordem superior

No capítulo anterior, tratamos da noção de derivada devida a Fréchet, estudamos suas


propriedades e entendemos alguns exemplos. Nosso trabalho agora será estender este
conceito para derivadas de ordem k > 1. Isso nos permitirá escrever uma versão da
fórmula de Taylor neste contexto geral.

12.1 Já sabemos definir, mas...


Considere espaços vetoriais normados (V, ∥ · ∥V ), (W, ∥ · ∥W ). Vimos acima que, quando
U ⊂ V é aberto, f : U → W é dada e x ∈ U , a derivada de f em x, se existir, é o operador
linear limitado Df (x) ∈ L(V, W ) tal que

∥f (x + h) − f (x) − Df (x) h∥W


lim = 0.
h→0 ∥h∥V

Suponhamos agora que Df (x) está definida para todo x, de modo que Df : U → L(V, W ).
(L(V, W ), ∥ · ∥V →W ) também é um espaço vetorial normado.
No cálculo em uma dimensão, a segunda derivada é tão somente a “derivada da
derivada". Isso continua a fazer sentido aqui e podemos dizer que a segunda derivada de
f em x, se existir, tem de ser uma transformação linear limitada D2 f (x) ∈ L(V, L(V, W ))
tal que:
∥Df (x + h) − Df (x) − D2 f (x) h∥V →W
lim = 0.
h→0 ∥h∥V
Do mesmo modo, se D2 f : U → L(V, W ) está definida em todo U , a terceira derivada em
x, se existir, deve ser uma transformação linear limitada D3 f (x) ∈ L(V L(V, L(V, W ))) tal
que
∥D2 f (x + h) − D2 f (x) − D3 f (x) h∥V →L(V,W )
lim = 0.
h→0 ∥h∥V
Poderíamos continuar com estas fórmulas ligeiramente estranhas, mas antes devemos
parar e pensar:

199
o que está acontecendo aqui?
Nada do que fizemos aqui está errado, mas a derivada que definimos não se presta a
uma compreensão muito intuitiva. Vamos pensar atentamente no que ela quer dizer para
compreendê-la um pouco melhor.

12.2 Segunda derivada, transformações bilineares e sime-


tria
A principal mensagem desta seção é que a segunda derivada pode ser pensada como uma
transformação bilinear limitada.
Definição 12.1 (Transformação bilinear) Uma transformação B : V 2 → W é dita bilinear se
é linear nos seus dois argumentos. Isto é:
1. dados v1 , v2 , v ′ ∈ V e λ ∈ R, B(λv1 + v2 , v ′ ) = λ B(v1 , v ′ ) + B(v2 , v ′ );
2. dados v, v1′ , v2′ ∈ V e λ′ ∈ R, B(v, λ′ v1′ + v2′ ) = λ′ B(v, v1′ ) + B(v, v2′ ).
Dizemos que uma transformação bilinear B : V 2 → W é limitada se
∥B(v, v ′ )∥W
∥B∥V 2 →W := sup < +∞.
(v,v ′ )∈(V \{0V })2 ∥v∥V ∥v ′ ∥V
Chamamos de L2 (V, W ) o conjunto das transformações bilineares limitadas.
Na próxima subseção, mostraremos que L(V, L(V, W )) – o espaço onde “mora" a
segunda derivada – é isomorfo ao espaço de transformações bilineares limitadas.

12.2.1 Relação de L(V, L(V, W )) com transformações bilineares


Os elementos de L(V, (L(V, W )) são transformações lineares T : V → L(V, W ). Uma tal T
associa a cada v ∈ V um T (v) ∈ L(V, W ) de forma linear, de modo que
∀v1 , v2 ∈ V ∀λ ∈ R : T (λ v1 + v2 ) = λ T (v1 ) + T (v2 ).
Quando fixamos um v ∈ V , T (v), pertence a L(V, W ). Portanto, T (v) : V → W associa a
cada v ′ ∈ V um elemento T (v) v ′ ∈ W de forma linear. Dito de outro modo:
∀v ∈ V ∀v1′ , v2′ ∈ V ∀λ′ ∈ R : T (v)(λ′ v1′ + v2′ ) = λ T (v) v1′ + T (v) v2′ .
O resumo disto tudo é que a cada T ∈ L(V, L(V, W )), podemos associar uma função:
BT : V2 → W
(v, v ) 7→ T (v) v ′ .

O que esta função tem de especial é que ela é bilinear. De fato, o que vemos é que a cada
T : V → L(V, W ) podemos associar uma transformação bilinear BT : V 2 → W . De fato, o
seguinte resultado é fácil de provar.

200
rmabilinear Exercício 12.1 A aplicação que leva T em BT é uma bijeção linear entre o conjunto das transfor-
mações lineares
T : V → {transformações lineares de V em W }
e o conjunto das transformações bilineares B : V 2 → W . Dica: observe que a inversa de
“T 7→ BT " leva uma transformação bilinear B : V 2 → W em

TB : v ∈ V 7→ B(v, ·).

Há no entanto um fato que ainda não consideramos: T é uma transformação linear


limitada entre os espaços normados (V, ∥ · ∥V ) e (L(V, W ), ∥ · ∥V →W ). Mais concretamente:
recorde que, se (Z, ∥ · ∥Z ) é espaço normado, a norma ∥ · ∥V →Z a norma V → Z sobre
L(V, Z) é dada por:
∥Sv∥Z
∥S∥V →Z = sup (S ∈ L(V, Z)).
v∈V \{0V } ∥v∥V

Se seguimos este raciocínio, descobrimos que a norma adequada sobre L(V, L(V, W )) é:
!
∥T (v)∥V →W ∥T (v)v ′ ∥W
∥T ∥V →L(V,W ) = sup = sup sup ′
(T ∈ L(V, L(V, W ))).
v∈V \{0V } ∥v∥V v∈V \{0V } v ′ ∈V \{0V } ∥v∥V ∥v ∥V

Vamos encontrar uma expressão mais simples para esta norma.

op:trocasup Proposição 12.1 Para qualquer transformação linear T : V → L(V, W ) (não necessariamente
limitada),
∥BT (v, v ′ )∥V →W
∥T ∥V →L(V,W ) = sup ;
(v,v ′ )∈(V \{0V })2 ∥v∥V ∥v ′ ∥V
Ou seja, na definição acima, não importa se tomamos o supremo primeiro em v ou em v ′ . (Nos dois
casos admitimos a hipótese de que ∥T ∥V →L(V,W ) pode ser infinito.)

Prova: Defina
′ ∥BT (v, v ′ )∥V →W
a(v, v ) := .
∥v∥V ∥v ′ ∥V
Nosso objetivo é provar que

sup sup a(v, v ′ ) = sup sup a(v, v ′ ) = sup a(v, v ′ ).


v∈V \{0V } v ′ ∈V \{0V } v ′ ∈V \{0V } v∈V \{0V } (v,v ′ )∈S×S ′

De fato, o que vamos provar o seguinte resultado.

Lema 12.1 Considere conjuntos A, B e uma função h : A × B → R+ . Então:


 
sup sup h(a, b) = sup h(a, b).
a∈A b∈B (a,b)∈A×B

201
Prova: Chame de S o supremo do lado direito. Veja que, por definição:

∀a ∈ A ∀b ∈ B : h(a, b) ≤ S

e portanto, para cada a ∈ A fixo, S é cota superior para os valores de h(a, b),
b ∈ B. Deduzimos que

∀a ∈ A : sup h(a, b) ≤ S
b∈B

e portanto
sup sup h(a, b) ≤ S.
a∈A b∈B

Agora observe que para todo (a, b) ∈ A × B,

h(a, b) ≤ sup h(a, b′ ) ≤ sup sup h(a′ , b′ ).


b′ ∈B a′ ∈A b′ ∈B

Ou seja,

sup sup h(a′ , b′ ) é cota superior para os valores de h(a, b), (a, b) ∈ A × B.
a′ ∈A b′ ∈B

Deduzimos que

sup sup h(a′ , b′ ) ≥ sup h(a, b) = S.


a′ ∈A b′ ∈B (a,b)∈A×B

2
Podemos agora concluir esta subseção com um exercício e um teorema.

Exercício 12.2 Mostre que L2 (V, W ) é um espaço vetorial e que ∥ · ∥V 2 →W é uma norma sobre este
espaço.

isobilinear Teorema 12.1 A aplicação que associa cada T ∈ L(V, L(V, W )) a BT ∈ L2 (V, W ) é um isomor-
fismo de espaços lineares normados. Isto é, “T 7→ BT "é uma bijeção linear e

∀T ∈ L(V, L(V, W )) : ∥T ∥V 7→L(V,W ) = ∥BT ∥V 2 →W .

Prova: Este teorema basicamente já foi provado acima. Falta apenas juntar os pedaços.
O último exercício mostra que (L2 (V, W ), ∥ · ∥V 2 →W ) é um espaço vetorial normado. O
exercício 12.1 nos diz que “T 7→ BT " é bijeção linear (e portanto tem inversa linear).
Finalmente, a proposição 12.1 garante que esta transformação preserva normas. 2

202
12.2.2 A segunda derivada é bilinear
Recorde que estávamos considerando a segunda derivada de f : U ⊂ V → W . Tudo o que
acabamos de ver nos diz que temos duas formas completamente equivalentes de pensar
na segunda derivada.

• D(Df )(x) é uma transformação linear limitada de V em L(V, W );

• D2 f (x) é uma transformação bilinear de V 2 em W .

Isto nos permite escrever que

D(Df )(x)(h1 ) h2 = D2 f (x) (h1 , h2 ).

De fato, no lado esquerdo da expressão pensamos em D(Df )(x) ∈ L(V, L(V, W )).
Aplicamos este objeto a h1 e obtemos D2 f (x)(h1 ) ∈ L(V, W ), aí tomamos o resultado, que
é uma transformação linear, e o aplicamos a h1 . Do lado direito, D2 f (x) é simplesmente
vista como transformação bilinear. Um fato que será importante a seguir é que toda forma
bilinear limitada tem uma derivada. Para isso, é bom lembrar de que, como já vimos
anotes, o conjunto
V 2 := {(v1 , v2 ) : v1 , v2 ∈ V }
tem uma estrutura natural de espaço vetorial (com operações coordenada a coordenada)
e pode ser dotado da norma

∥(v1 , v2 )∥V 2 = ∥v1 ∥V + ∥v2 ∥V ((v1 , v2 ) ∈ V 2 ).

Proposição 12.2 Toda B ∈ L2 (V, W ) é diferenciável e

DB(v1 , v2 ) (h1 , h2 ) = B(v1 , h2 ) + B(h1 , v2 ) ((v1 , v2 ) ∈ V 2 , (h1 , h2 ) ∈ V 2 ).

Uma outra observação importante é que a segunda derivada pode ser calculada de
uma forma mais direta, sem passar explicitamente pelo isomorfismo.

Proposição 12.3 Suponha que f : U → W é diferenciável e que, para um certo x0 ∈ U , existe


uma Q ∈ L2 (V, W ) tal que:

∀h2 ∈ V, ∀h1 com x0 + h1 ∈ U : Df (x0 + h1 ) h2 = Df (x0 ) h2 + Q(h1 , h2 ) + R(h1 , h2 )

onde
∥R(h1 , h2 )∥V →W
sup → 0 quando h1 → 0V . (12.1) eq:frechet2
h2 ∈V ∥h1 ∥V ∥h2 ∥V
Então Q = D2 f (x0 ).

203
Prova: O isomorfismo garante que existe TQ ∈ L(V, L(V, W )) com TQ (h1 ) h2 = Q(h1 , h2 ).
Voltando à equação acima, temos que, para um dado h1 fixo:

∀h2 ∈ V : Df (x0 + h1 ) h2 = Df (x0 ) h2 + TQ (h1 ) h2 + R(h1 , h2 ).

Deduzimos em particular que

∀h2 ∈ V : R(h1 , h2 ) = (Df (x0 + h1 ) − Df (x0 ) h2 − TQ (h1 )) h2 .

Portanto, para h1 fixo, R(h1 , h2 ) é linear e limitada em h2 : isto é, a função

R(h1 ) : h2 ∈ V 7→ R(h1 ) h2 := R(h1 , h2 ) = (Df (x0 + h1 ) − Df (x0 ) h2 − TQ (h1 )) h2

é linear e tem norma

∥R(h1 )∥V →W ≤ ∥Df (x0 + h1 )∥V →W + ∥Df (x0 )∥V →W − ∥TQ (h1 ))∥V →W < +∞.

Além disso, temos identidade de transformações lineares:

Df (x0 + h1 ) = Df (x0 ) + TQ (h1 ) + R(h1 ).

Veja que a expressão acima tem “cara de derivada de Fréchet.” Se escrevemos Z := L(V, W )
e F := Df , então F : U ⊂ V → Z, TQ ∈ L(V, Z) e vale a identidade acima. Além disso,
R(h1 ) = o(h1 ) porque

∥R(h1 )∥V →W ∥R(h1 , h2 )∥V →W


= sup → 0 quando h1 → 0V por (12.1).
∥h1 ∥V h2 ∈V ∥h1 ∥V ∥h2 ∥V

A conclusão é que F = Df é de fato diferenciável em x0 e sua derivada é TQ :

D(Df )(x0 ) = TQ ,

e aplicando o isomorfismo entre L(V, (V, W )) e L2 (V, W ), deduzimos que D(Df )(x0 ) = Q.
2

Exemplo 12.1 Usamos a proposição acima para calcular a fórmula da segunda derivada da apli-
cação que calcula a inversa de um operador A ∈ L(X), como visto no Teorema 11.5. Em particular,
usamos a notação empregada naquele teorema

Vimos naquela seção que a derivada da aplicação inversa é:

DInv(A).H := −A−1 HA−1 .

Ou seja:
(A + H)−1 = A−1 − A−1 HA−1 + R(A, H)

204
onde
∥R(A, H)∥X→X
→ 0 quando H → 0L(X) .
∥H∥X→X
Agora considere
DInv(A + H1 ).H2 = −(A + H1 )−1 H2 (A + H1 )−1 .
Aplicando a fórmula anterior, temos que
(A+H1 )−1 H2 (A+H1 )−1 = (A−1 −A−1 H1 A−1 +R(A, H1 )) H2 (A−1 −A−1 H1 A−1 +R(A, H1 )).
Podemos aplicar a propriedade distributiva a este produto de operadores. Definindo
QA : (H1 , H2 ) ∈ L(X)2 7→ A−1 H2 A−1 H1 A−1 + A−1 H1 A−1 H2 A−1
e aplicando doses iguais de cuidado e paciência, chegamos à seguinte expressão:
DInv(A + H1 ).H2 = DInv(A).H2 + QA (H1 , H2 ) + R(H1 , H2 ), onde
R(H1 , H2 ) := −A−1 H2 R(A, H1 ) − R(A, H1 ) H2 A−1
−A−1 H1 A−1 H2 A−1 H1 A−1 + A−1 H1 A−1 H2 R(A, H1 )
+R(A, H1 ) H2 A−1 H1 A−1 + A−1 H1 A−1 H2 R(A, H1 )
−R(A, H1 ) H2 R(A, H1 ).
É um exercício checar que QA ∈ L2 (L(X), L(X)). O termo R(H1 , H2 ) pode ser cotado
tomando-se a soma das normas dos vários termos e usando aub-multiplicatividade para
se lidar com as normas dos termos resultantes. Isso nos dá:
∥R(H1 , H2 )∥X→X ≤ 2∥A−1 ∥X→X ∥H2 ∥X→X ∥R(A, H1 )∥X→X
+∥A−1 ∥3X→X ∥H1 ∥2X→X ∥H2 ∥X→X
+2∥A−1 ∥2X→X ∥H1 ∥X→X ∥H2 ∥X→X ∥R(A, H1 )∥X→X
+∥R(A, H1 )∥2X→X ∥H2 ∥X→X .
Dividindo os dois lados por ∥H1 ∥X→X ∥H2 ∥X→X , obtemos do lado direito algo que não
depende de ∥H2 ∥X→X . Logo, se H1 ̸= 0L(X) , temos:
∥R(H1 , H2 )∥X→X ∥R(A, H1 )∥X→X
sup ≤ C1
H2 ∈L(X)\{0L(X) } ∥H1 ∥X→X ∥H2 ∥X→X ∥H1 ∥X→X
+C2 ∥H1 ∥X→X
+C3 ∥R(A, H1 )∥X→X
∥R(A, H1 )∥2X→X
+ ,
∥H1 ∥X→X
onde C1 , C2 , C3 > 0 não dependem de H1 . O fato de que R(A, H1 ) = o(H1 ) implica que o
lado direito vai para 0 quando H1 → 0L(X) . Portanto,
∥R(H1 , H2 )∥X→X
lim sup = 0,
H1 →0L(X) H2 ∈L(X)\{0
L(X) }
∥H1 ∥X→X ∥H2 ∥X→X
o que implica, pela proposição anterior, que D2 Inv(A) = QA .

205
12.2.3 Simetria da segunda derivada (quando contínua)
Agora vamos mostrar que, sob condições de continuidade, a derivada segunda é simétrica
em seus argumentos.

Proposição 12.4 Suponha que


D2 f : U → L2 (V, W )
é contínua em x ∈ U . Então D2 f (x) é simétrica, isto é:

∀v, v ′ ∈ V : D2 f (x) (v, v ′ ) = D2 f (x) (v ′ , v).

Prova: Como U ∋ x é aberto, podemos achar um aberto A ⊂ R2 contendo 0R2 onde a


função ϕ : A ⊂ R2 → W abaixo está bem definida.

ϕ(t, s) := f (x + tv + sv ′ ) − f (x + sv ′ ) − f (x + tv) + f (x) ((t, s) ∈ R2 ).

Mostraremos que
ϕ(t, s)
→ D2 f (x)(v ′ , v) quando t, s → 0.
ts
Isto nos bastará porque, trocando os papéis de v e v ′ (ou de t e s) em ϕ, também obtemos

ϕ(t, s)
→ D2 f (x)(v, v ′ ) quando t, s → 0
ts
o que nos dá a simetria desejada pela unicidade do limite.
Considere então

ϕ(t, s) − tsD2 f (x) (v ′ , v) = [f (x + θ v + sv ′ ) − f (x + θv) − θ sD2 f (x) (v ′ , v)] |θ=t


θ=0 .

Podemos cotar a norma deste termo usando a desigualdade do valor médio aplicada
ao termo dentro do colchete como função de θ.
É importante pararmos para fazer esta parte da conta com atenção. Pela Regra da
Cadeia, a derivada em θ é exatamente:

Df (x + θ v + sv ′ ) v − Df (x + θv) v − sD2 f (x) (v ′ , v).

Agora veja que esta expressão pode ser reescrita como

{Df (x + θ v + sv ′ ) − Df (x + θv) − sD(Df )(x) (v ′ )} v.

onde aqui usamos o isomorfismo

L(V, L(V, W )) ∼
= L(V, L(V, W ))

para passar de D2 f (x) ∈ L2 (V, W ) para D(Df )(x) ∈ L(V, L(V, W )). deste modo,
D(Df )f (x)(v ′ ) ∈ L(V, W ) correspondente. Esta passagem é conveniente para a conta,

206
pois teremos que diferenciar Df : U → L(V, W ) e a derivada D(Df )(x)L(V, L(V, W ))
ocorrerá naturalmente.
Voltando à conta acima, concluímos que:

∥{Df (x + θ v + sv ′ ) v − Df (x + θv) v − sD(Df )(x) (v ′ )} v∥W


≤ ∥v∥V ∥Df (x + θ v + sv ′ ) − Df (x + θv) − sD(Df )f (x) (v ′ )∥L(V,W )

Portanto, pela desigualdade do valor médio.

∥ϕ(t, s) − tsD2 f (x) (v ′ , v)∥W


≤ |t| sup0≤θ≤t ∥Df (x + θ v + sv ′ ) v − Df (x + θv) v − sD(Df )(x)(v ′ ).v∥W
≤ |t|∥v∥V sup0≤θ≤t ∥Df (x + θ v + sv ′ ) − Df (x + θv) − sD(Df )(x) (v ′ )∥V →W .

Observe agora que para cada θ ∈ [0, t] fixo, podemos aplicar a desigualdade do valor
médio a

Df (x + θ v + sv ′ ) − Df (x + θv) − sD(Df )(x) (v) = [Df (x + θ v + ηv ′ ) − η D(Df )(x)] |η=s


η=0

como função de s, obtendo:

∥[Df (x + θ v + ηv ′ ) − η D(Df )f (x)] |η=s


η=0 ∥V →W
≤ |s| sup ∥D(Df )(x + θ v + ηv )(v ) − D(Df )(x)(v ′ )∥L(V,W )
′ ′
0≤η≤s

(norma V → L(V, W )) ≤ |s|∥v ∥ ∥D(Df )(x + θ v + ηv ′ ) − D(Df )(x)∥V →L(V,W )


use
 
 L2 (V, W )) 
 = |s|∥v ′ ∥ ∥D2 f (x + θ v + ηv ′ ) − D2 f (x)∥V 2 →W


 = 
L(V, L(V, W ))
≤ |s| ∥v ′ ∥V sup ∥D2 f (x′ ) − D2 f (x)∥V 2 →W
|x′ −x|≤|t|∥v∥+|s|∥v ′ ∥

já que x′ := x + θ v + ηv ′ está sempre a distância no máximo |t|∥v∥ + |s|∥v ′ ∥ de x para os


valores de θ e η considerados acima. Deduzimos:

∥ϕ(t, s) − tsD2 f (x) (v ′ , v)∥W ≤ |ts| ∥v∥V ∥v ′ ∥V sup ∥D2 f (x′ ) − D2 f (x)∥V 2 →W .
|x′ −x|≤|t|∥v∥+|s|∥v ′ ∥

Dividindo por |ts| dos dois lados, obtemos:



ϕ(t, s) ′ ′ t,s→0
∥D2 f (x′ ) − D2 f (x)∥V 2 →W → 0
2

ts − D f (x) (v , v) ≤ ∥v∥V ∥v ∥V ′ sup


|x −x|≤|t|∥v∥+|s|∥v ∥
W

porque |t|∥v∥ + |s|∥v ′ ∥ vai a 0 e D2 f é contínua em x, por hipótese. 2

207
12.2.4 Derivadas parciais de ordem 2
Finalmente, colecionamos aqui algumas observações sobre a relação entre D2 f (x) e as
derivadas parciais de ordem 2 quando V = Rd e W = R (tudo pode ser estendido a
W = Rk se trabalhamos coordenada a coordenada).
Há uma bijeção entre formas bilineares B ∈ L2 (Rd , R) e matrizes A ∈ Rd×d . De fato,
a cada B podemos associar a matriz A de entradas Ai,j := B(ei , ej ) e aí a bilinearidade
implica B(v, v ′ ) = v · Av ′ .
No nosso caso, queremos estudar a matriz correspondente a D2 f (x). Como esta é
a derivada do gradiente ∇f (x), esperamos que, se D2 f (x) existe, ela corresponda às
derivadas parciais ∂i ∂j f (x) das coordenadas de ∇f (x). Logo, a matriz correspondente a
D2 f (x) é deve ser a matriz Hessiana, das derivadas parciais de ordem 2.
Façamos este passo em detalhes. Suponha que Df (·) existe em todo U e que D(Df )(x)
existe num determinado ponto x. Agora fize v, v ′ ∈ Rd A relação entre derivadas de
Fréchet e direcionais nos garante que:
 
′ Df (x + εv) − Df (x)
2
D f (x) (v, v ) = (D(Df )(x) v) = lim v′.
ε→0 ε

É um exercício mostrar que podemos passar o v ′ para dentro do limite. Quando fazemos
isso, temos termos Df (x + εv) v ′ = ∇f (x + εv).v ′ e Df (x) v ′ = ∇f (x).v ′ . Logo:

∇f (x + εv).v ′ − ∇f (x).v
 
2 ′
D f (x) (v, v ) = lim .
ε→0 ε

Ou seja, a existência de D2 f (x) garante que o limite acima existe para quaisquer v, v ′ ∈ Rd .
Tomando v = ei e v ′ = ej , e lembrando que a j-ésima coordenada de ∇f (x) é ∂j f (x),
obtemos:
∇f (x + εv).v ′ − ∇f (x).v ∂j f (x + εei ) − ∂j f (x)
=
ε ε
e o limite da expressão acima é a derivada parcial da derivada parcial: ∂i ∂j f (x). Concluí-
mos:
∀1 ≤ i, j ≤ d : D2 f (x) (ei ,j ) = ∂i ∂j f (x);
portanto, estas derivadas parciais de ordem 2 todas existem e concluímos que

D2 f (x) corresponde à matriz Hessiana ∇2 f (x) = (∂i ∂j f (x))di,j=1 .

Provamos a fórmula acima supondo que D2 f (x) existe. Como no caso das primeiras
derivadas, é possível achar um teorema na direção contrária se supomos a continuidade
das derivadas parciais de ordem 2.

Exercício 12.3 D2 f : U → L2 (Rd , R) é existe e contínua se e somente se cada derivada parcial


∂i ∂j f : U → R existe e é contínua. Mostre ainda que, sob estas hipóteses, a matriz Hessiana
∇2 f (x) é simétricxa para todo x ∈ Rd .

208
12.3 Derivadas de ordem maior que dois
Vamos agora estudar como estender a relação entre derivadas de ordem 2 e formas bili-
neares para derivadas de ordem superior. Em linhas gerais, provaremos o seguinte.

• As derivadas de ordem k ≥ 2 de uma função de V em W podem ser encaradas como


transformações k-lineares de V k em W .

• Sob hipóteses de continuidade, estas derivadas são simétricas em seus argumentos.

• Se V = Rd , W = R e as derivadas parciais de ordem ≤ k são contínuas, então f é k


vezes diferenciável.

Como no caso de ordem 2, o primeiro passo é compreender o espaço em que “vivem" as


derivadas de ordem k ≥ 2 dada. Mais uma vez teremos que lidar com isomorfismos e
optamos por abordar logo de cara o trabalho sujo para dar conta dessa tarefa.

12.3.1 Onde vivem as derivadas e um kit para cuidar dos isomorfismos


Como veremos, a derivada será definida por aplicação sucessiva da operação “D" seguida
com isomorfismos, para terminarmos com uma transformação s-linear limitada entre V s
e W . Começamos definindo este espaço de transformações s-lineares limitadas.

Definição 12.2 Dado s ≥ 1, uma função Q : V s → W é dita s-linear se vale a seguinte


propriedade: dados quaisquer (v1 , . . . , vs ) ∈ V s e um índice i ∈ [s], a função Qi dada por

Qi : ṽi ∈ V 7→ Q(v1 , . . . , vi−1 , ṽi , vi+1 , . . . , vs ) ∈ W

é uma transformação linear de V em W . Dizemos que Q é limitada se

∥Q(v1 , v2 , . . . , vs )∥W
∥Q∥V s →W := sup Qs < +∞.
(v1 ,...,vs )∈(V \{0V })s i=1 ∥vi ∥V

Chamamos de Ls (V, W ) o espaço de todas transformações s-lineares limitadas de V s em W .

O resultado abaixo é um exercício importante.

Exercício 12.4 Prove que Ls (V, W ) é um espaço vetorial e que ∥ · ∥V s →W é uma norma sobre
Ls (V, W ). Prove ainda que, se W é Banach, então (Ls (V, W ), ∥ · ∥V s →W ) também é completo.

Para realmente definirmos a derivada e analisarmos as propriedades, estaremos obriga-


dos a considerar expressões do tipo Ds1 Ds2 . . . Dsr f (x) e provar que elas são “isomorfas" a
Ds1 +···+sr f (x). Para começar, temos que provar e usar o fato que:

Ls1 (V, Ls2 (V, . . . , Lsr (V, W ) . . . )) ∼


= Ls1 +s2 +···+sr (V, W ).

209
Informalmente isto é simples. No final das contas, um elemento do lado direito pega de
entrada uma s1 -tupla em V ; depois uma s2 -tupla em V ; depois . . . uma sr -tupla em V ; e
produz uma saída em W ; tudo isso de forma linear em cada variável e contínua no geral.
Isso dá no mesmo que pegar uma (s1 + s2 + · · · + sr )-tupla em V e levar em W de maneira
multilinear e contínua.
O trabalho aparece quando queremos descrever isso de forma precisa. Considere
números r ∈ N\{0, 1} e s1 , . . . , sr ∈ N\{0} com s1 + s2 + · · · + sr = s. Considere o espaço
Ls (V, W ) e o um segundo espaço S = S1 definido da seguinte forma:

1. Sr := Lsr (V, W ), com a norma ∥ · ∥Sr := ∥ · ∥V sr →W ;

2. para i = r − 1, r − 2, . . . , 1, Si := Lsi (V, Si+1 ) com a norma ∥ · ∥Si := ∥ · ∥V si →Si+1 , ou


seja,
Si = Lsi (V, Lsi+1 (V, . . . , Lsr (V, W ) . . . ));

3. Finalmente,
S := S1 = Ls1 (V, Ls2 (V, . . . , Lsr (V, W ) . . . ))
com a norma definida acima.

Dado T ∈ S1 , queremos definir QT ∈ Ls (V, W ) correspondente. Isso quer dizer que


devemos definir, para cada v = (v1 , . . . , vs ) ∈ V s , um valor

QT v = QT (v1 , . . . , vs ) ∈ W

que corresponda de forma “natural" a T . Para isso, convém primeiro escrevermos:

Vs ∼
= V s1 × V s2 × · · · × V sr ;

isto é, a cada v = (vj )sj=1 ∈ V s associamos:

v (1) := (vj )sj=1


1
∈ V s1 , v (i) := (vj )sj=s
1 +···+si
1 +···+si−1
∈ V si (2 ≤ i ≤ r);

e notamos que a aplicação levando v ∈ V s em (v (1) , . . . , v (r) ) ∈ V1 × · · · × Vr é uma bijeção.


Além disso, dado u = (uj )kj=1 ∈ V k para algum k ∈ N\{0}, definimos mk (u) := kj=1 ∥uj ∥V
Q
e notamos que:
Yr
∀v ∈ V : ms (v) = msi (v (i) ).
i=1

Agora definimos QT v da seguinte forma. Como T ∈ Ls1 (V, S2 ), o valor T v (1) ∈ S2 está bem
definido. Como S2 = Ls2 (V, S3 ), também podemos calcular (T v (1) ) v (2) ∈ S3 . Seguindo
assim, chegamos a:
QT v := (. . . ((T v (1) ) v (2) ) . . . ) v (r) .
Portanto, definimos, para cada v ∈ V s , um valor QT v ∈ W . Isto é, QT : V s → W .
Abaixo relatamos algumas propriedades desta transformação.

210
QT é s-linear.
É um exercício mostrar esta propriedade. De fato, isso segue da observação que
“v (1) 7→ T v (1) "é multilinear e que, para i = 2, . . . , r − 1,
(. . . (T v (1) ) . . . ) v (i−1) ∈ Si = Lsi (V, Si+1 ),
e portanto
“v (i) 7→ [(. . . (T v (1) ) . . . ) v (i−1) ] v (i) ” é multilinear.
O próximo passo é mostrar que QT é limitada e tem a mesma norma que T .
∥T ∥S1 = ∥QT ∥V s →W .
Para isso, usamos repetidamente a nossa notação ms e o fato que podemos tomar o
supremo na ordem que quisermos:
∥QT v∥W
∥QT ∥V s →W = sup
v∈(V \{0V })s ms (v)
∥(. . . (T v (1) )v (2) . . . v (r−1) )v (r) ∥W
(V s ∼
= V s1 × · · · × V sr ) = sup Qr (i)
.
v (i) ∈(V \{0V })si i=1 msi (v )
i=1,...,r

Considere o lado direito da expressão quando tomamos o supremo em v (r) . Como


(. . . (T v (1) )v (2) . . . )v (r−1) ∈ Lsr (V, W ) = Sr ,
temos que:
∥(. . . (T v (1) )v (2) . . . v (r−1) )v (r) ∥W
sup = ∥(T v (1) )v (2) . . . v (r−1) ∥Sr .
v (r) ∈(V \{0V })sr msr (v (r) )
Portanto,
∥(T v (1) )v (2) . . . v (r−1) ∥Sr
∥QT ∥V s →W = sup Qr−1 .
m (v (i) )
v (i) ∈(V \{0V })si i=1 s i
i=1,...,r−1

Podemos repetir este raciocínio tomando agora o supremo em v (r−1) e lembrando que
(T v (1) )v (2) . . . v (r−2) ∈ Sr−1 = Lsr−1 (V, Sr ).
Obtemos:
∥(T v (1) )v (2) . . . v (r−2) ∥Sr−1
∥QT ∥V s →W = sup Qr−2 .
m (v (i) )
v (i) ∈(V \{0V })si i=1 s i
i=1,...,r−2

Repetindo este procedimento, chegamos a:


∥T v (1) ∥S2
∥QT ∥V s →Q = sup = ∥T ∥S1
v (1) ∈(V \{0})s1 m1 (v (1) )
já que S1 = Ls1 (V, S2 ).

211
A aplicação que leva T ∈ S em QT ∈ Ls (V, W ) é uma bijeção linear que preserva normas.

Este também é um exercício. A linearidade é bastante direta das definições e a pre-


servação de normas já foi provada. A propriedade de bijeção vem de construirmos, para
cada Q ∈ Ls (V, W ), uma T ∈ S com QT = T .

12.3.2 A derivada de ordem k ≥ 3


Agora podemos definir a derivada de Fréchet de ordem k indutivamente.

Definição 12.3 Considere V, W e U como acima e um certo k ≥ 2. Suponha que f : U → W


é (k − 1)-vezes diferenciável. Se Dk−1 f é diferenciável em x0 ∈ U , chamamos de Dk f (x0 ) o
elemento de Lk (V, W ) correspondente a D(Dk−1 f )(x0 ) ∈ L(V, Lk−1 (V, W )) pelo isomorfismo que
definimos na subseção anterior.

Em particular, notamos que:

∀v = (vj )kj=1 ∈ V k : Dk f (x) v = (D (Dk−1 f )(x) v1 ) (vj )kj=2

Portanto, a derivada de ordem k é (isomorfa a) uma derivada de uma função Dk−1 f : U →


Lk−1 (V, W ). Como a derivada direcional recupera a derivada de Fréchet (toda vez que
esta última existe), temos que:

Dk−1 f (x + εv1 ) − Dk−1 f (x)


D (Dk−1 f )(x) v1 = lim .
ε→0 ε
Agora observe que, fixos (v2 , . . . , vk ), a operação que associa a Q ∈ Lk−1 (V, W ) a Q(v2 , . . . , vk )
é contínua (exercício). Portanto, a equação acima mostra que:
 k−1
D f (x + εv1 ) − Dk−1 f (x)
 
k k k k
∀v = (vj )j=2 ∈ V : D f (x) (v1 , . . . , vk ) = lim (vj )j=2 .
ε→0 ε
(12.2) eq:Dkcomoli
Esta identidade será usada para provar a proposição “óbvia" abaixo.

op:todoido1 Proposição 12.5 Dada f : U → W , com U ⊂ V aberto e V, W como acima, dados inteiros k ≥ 1
Pr
e s1 , . . . , sr ≥ 1 com i=1 si = k, e dado um x ∈ U , as seguintes afirmações são equivalentes:
1. f é k − 1 vezes diferenciável em U e tem k-ésima derivada em x;

2. a derivada iterada Ds1 −1 Ds2 . . . Dsr f está definida em U e Ds1 Ds2 . . . Dsr f (x) existe.
Quando estas derivadas em x existem, temos ainda que

Ds1 Ds2 . . . Dsr f (x) ∼


= Dk f (x),

ou melhor dizendo: o isomorfismo Is1 ,...,sr que construímos entre S = Ls1 (V, . . . , Lsr (V, W )) e
Lk (V, W ) leva Ds1 Ds2 . . . Dsr f (x) em Dk f (x).

212
Prova: Podemos provar isso por indução em k. Quando k = 1, temos s1 = r = 1 e não há
o que provar.
Agora considere o caso em que k > 1 e suponha que o resultado que queremos provar
vale para k − 1. Provaremos que ele se estende também a k. Para isso, consideraremos
s1 , . . . , sr como no enunciado, mas trataremos apenas do caso em que s1 ≥ 2 (a demons-
tração para s1 = 1 é mais fácil).
Usando a hipótese de indução, já sabemos que o isomorfismo
Is1 −1,s2 ,...,sr : Ls1 −1 (V, Ls2 (V, . . . Lsr (V, W ) . . . )) → Lk−1 (V, W )
leva Ds1 −1 Ds2 . . . Dsr f (x′ ) em Dk−1 f (x′ ) para cada x′ ∈ U . Portanto,
∀x′ ∈ U : Is1 −1,s2 ,...,sr (Ds1 −1 Ds2 . . . Dsr f (x′ )) = Dk−1 f (x). (12.3) eq:isomorfi
Se queremos saber o que isto significa por extenso, podemos identificar
V k−1 ∼
= V s1 −1 × V s2 × · · · × V sr
e observar que (12.3) nos diz que, se v = (v (i) )i=1 ∈ V k−1 com v (1) ∈ V s1 −1 e cada v (i) ∈ V si
(2 ≤ i ≤ r), temos que, para qualquer x′ ∈ U :
Dk−1 f (x′ ) (v (i) )ri=1 = (. . . (Ds1 −1 Ds2 . . . Dsr f (x′ ) v (1) ) v (2) . . . ) v (r) .
Para abreviar isso, chamamos de G(x′ ) := Ds2 . . . Dsr f (x′ ) e deduzimos:
Dk−1 f (x′ ) (v (i) )ri=1 = (. . . (Ds1 −1 G(x′ ) v (1) ) v (2) . . . ) v (r) , (12.4) eq:isomorfi
novamente para todos os x′ ∈ U .
Repare que Is1 −1,s2 ,...,sr é contínua, linear e inversível com inversa linear contínua. Por
esta razão, segue da Regra da Cadeia que o lado esquerdo de (12.3) é diferenciável em x
se e somente se o direito é.
Por fim, suponha que um dos lados é diferenciável (e portanto os dois são). Agora
identificaremos
Vk ∼
= V × V s1 −1 × V s2 × · · · × V sr
acrescentando um v (0) ∈ V à “lista" (v (i) )ri=1 definida acima. Note que, pela equação (12.2),
 k−1
D f (x + εv (0) ) − Dk−1 f (x)

k (i) r
D f (x) (v )i=0 = lim (v (i) )ri=1 .
ε→0 ε
Este limite pode ser calculado de outra maneira se recorremos a (12.4) (e usando novamente
(12.2):
  s1 −1
G(x + εv (0) ) − Ds1 −1 G(x) (1)
 
D
... v v . . . v (r) = (. . . (Ds1 G(x) (v (0) , v (1) ) ) v (2) . . . ) v (r) .
(2)
ε
Portanto,
Dk f (x) (v (i) )ri=0 = (. . . (Ds1 G(x) (v (0) , v (1) ) ) v (2) . . . ) v (r) .
Como (v (i) )ri=0 ∈ V k é arbitrário, deduzimos que Ds1 G(x) = Ds1 Ds2 . . . Dsr f (x) é o “iso-
morfo" de Dk f (x). 2

213
Nosso próximo resultado significa que Dk f é simétrica sempre que é contínua como
função de x ∈ U .

Proposição 12.6 Suponha que f : U ⊂ V → W é k vezes diferenciável (com k ≥ 2) e que a


função Dk f : U → Lk (V, W ) é contínua em um certo x ∈ U . Então a derivada Dk f (x) também é
simétrica, ou seja:

∀(v1 , . . . , vk ) ∈ V k , Dk f (x) (v1 , . . . , vk ) é invariante por permutações de v1 , . . . , vk .

Prova: Provaremos isto por indução em k ≥ 2. O caso k = 2 já foi discutido acima.


Para k > 2, precisamos de um pouquinho de teoria de grupos. Mais exatamente,
lembramos que Sk é o grupo de permutações de {1, . . . , k} e definimos:

Hk := {σ ∈ Sk : ∀(v1 , . . . , vk ) ∈ V k , Dk f (x) (v1 , . . . , vk ) = Dk f (x) (vσ(1) , . . . , vσ(k) )}.

Nosso objetivo é mostrar que Hk = Sk . Para isso, notamos (exercício) que Hk é subgrupo
de Sk . Portanto, para terminar a prova, basta mostrar que Hk contem um conjunto gerador
de Sk . O conjunto gerador que escolhemos é o que contém a transposição (12) e todas as
permutações que deixam 1 fixo.
Em primeiro lugar, observamos que

∀x′ ∈ U : Dk f (x)(v1 , v2 , v3 , . . . , vk ) = (D2 G(x′ )(v1 , v2 )) (v3 , . . . , vk ),

onde G(x′ ) := Dk−2 f (x′ ) (para x′ ∈ U ). Como Dk f e D2 G estão ligadas por um dos
isomorfismos que construímos, e além disso Dk f é contínua em x, temos que D2 G também
é contínua em x. Portanto, esta segunda derivada é simétrica e temos:

(D2 G(x)(v1 , v2 )) (v3 , . . . , vk ) = (D2 G(x′ )(v2 , v1 )) (v3 , . . . , vk ) = Dk f (x) (v2 , v1 , v3 , . . . , vk ).

Falta provar a simetria em permutações que deixam 1 fixo. Para isso, usamos mais uma
vez a equação (12.2):

Dk−1 f (x + εv1 ) (v2 , . . . , vk ) − Dk−1 f (x) (v2 , . . . , vk )


Dk f (x) (v1 , . . . , vk ) = lim .
ε→0 ε
Como Dk f existe em todo x′ ∈ U , a derivada Dk−1 f (x′ ) é função contínua de x′ e portanto
é simétrica em todos os pontos de U . Segue que a expressão “dentro do limite" acima é
simétrica por permutações de (v2 , . . . , vk ). É um exercício mostrar que esta propriedade
se preserva no limite. 2

12.4 A fórmula de Taylor geral


Nesta seção enunciaremos a fórmula de Taylor na sua versão mais geral para funções k
vezes diferenciáveis.

214
Teorema 12.2 Tome k ∈ N\{0}. Suponha que f : U ⊂ V → W é (k − 1) vezes diferenciável no
conjunto U e que Dk f (x0 ) ∼
= D(Dk−1 f )(x0 ) existe. Defina o polinômio de Taylor de f de ordem k
ao redor de x0 como:

k
X 1 j
Px0 ,k (h) := f (x0 ) + D f (x) (h, . . . , h) .
j=1
j! | {z }
j vezes

Então:
f (x0 + h) = Px0 ,k (h) + rk (h)

onde rk (h)/∥h∥kV → 0W quando h → 0V .

Prova: Na verdade, provaremos um resultado bem mais forte. Dados um r > 0 com
BV (x0 , r) ⊂ U e um h ∈ V com ∥h∥V < r, escreva

Rk (h) := Dk−1 f (x0 + h) − Dk−1 f (x0 ) − D(Dk−1 f )(x0 ) h ∈ Lk−1 (V, W ).

Note que ∥Rk (h)∥V k−1 →W /∥h∥V → 0 quando h → 0V porque Dk−1 f é diferenciável em x0 .
Nós provaremos por indução em k ≥ 1 que, se h ̸= 0V , então:

∥rk (h)∥W ∥Rk (θ h)∥


Objetivo: ≤ sup ,
∥h∥kV θ∈(0,1] θ∥h∥V

o que certamente garante rk (h)/∥h∥kV → 0 quando h → 0V .


Base: k = 1. Este caso segue simplesmente da definição da derivada de Fréchet.

Passo indutivo. Suponha que k ≥ 2 e o teorema vale para k − 1. Se ∥h∥V é suficientemente


pequeno, de modo que x0 + th ∈ U para todo |t| ≤ 2, podemos definir

γ(t) := f (x + th) − Px0 ,k (th) (t ∈ (−2, 2)).

Vê-se que γ(0) = 0W porque Px0 ,k (0V ) = f (x0 ). Por isso,

∥f (x0 + h) − Px0 ,k (h)∥W = ∥γ(1) − γ(0)∥W ≤ sup ∥γ ′ (t)∥W .


t∈[0,1]

Para calcular γ ′ , observamos que

d
f (x + th) = Df (x + th).h,
dt
215
enquanto
 
k j
d d  t jX
Px0 ,k (th) = D f (x) (h, . . . , h)
dt dt j=1 j! | {z }
j vezes
k
X tj−1
= Dj f (x) (h, . . . , h)
j=1
(j − 1)! | {z }
j vezes
k
X tj−1
(isom.) = [Dj−1 (Df )(x) (h, . . . , h)].h
j=1
(j − 1)! | {z }
j−1 vezes
= Qx0 ,k−1 (th).h

onde Qx0 ,k−1 é o polinômio de Taylor de ordem k − 1 da função Df : U → L(V, W ).


Portanto, se h ̸= 0V ,
∥f (x0 +h)−Px0 ,k (h)∥W
∥h∥kV
∥[Df (x0 +th)−Qx0 ,k−1 (th)].h∥W
≤ supt∈[0,1] ∥h∥kV
∥Df (x0 +th)−Qx0 ,k−1 (th)∥V →W
≤ supt∈[0,1] ∥h∥k−1
.
V

Note que a expressão no supremo vale 0 em t = 0, logo podemos tomar um supremo


sobre t ∈ (0, 1]. Assim, podemos trocar h por th no denominador e ter uma cota superior.
Isso nos traz ao caso k − 1 do resultado, com f substituída por Df . Aplicando a hipótese
de indução, deduzimos que:

∥Df (x0 + th) − Qx0 ,k−1 (th)∥V →W ∥Rk−1 (tθ h)∥
k−1
≤ sup
∥th∥V θ∈(0,1] tθ∥h∥V

onde

Rk−1 (h′ ) := Dk−2 (Df )(x0 + h) − Dk−2 (Df )(x0 ) − D(Dk−2 (Df ))(x0 ).h.
Usando nossos isomorfismos com algum cuidado, podemos ver que Rk−1 ′
(h′ ) tem a mesma
norma que Rk (h′ ) e isso encerra a prova porque 0 < tθ ≤ 1 na expressão acima. 2

Exercício 12.5 Como no caso da reta, há outras versões da Fórmula de Taylor. Uma delas é útil
quando Dk f existe numa vizinhança de x0 e a função x 7→ Dk f (x) é contínua neste ponto x0 .
Mostre que, neste caso, para ∥h∥V suficientemente pequeno,

f (x0 + h) = Px0 ,k (h) + Rx0 ,k (h)

com resto
∥Rx0 ,k (h)∥W supa∈[x0 ,x0 +h] ∥Dk f (a) − Dk f (x0 )∥V k →W h→0V
≤ → 0.
∥h∥kV k!

216
12.5 Mais exercícios
Exercício 12.6 Fixe k > 1. Suponha que f : U → W é k − 1 vezes diferenciável. Mostre que
Q = Dk f (x0 ) existe, para um certo x0 ∈ U , se e somente se podemos escrever, para quaisquer
(hi )ki=1 ∈ V k com x0 + h1 ∈ U ,

Dk−1 f (x0 + h1 ) (hj )kj=2 = Dk−1 f (x0 + h1 ) (hj )kj=2 + Q((hi )ki=1 ) + R((hi )ki=1 ),

onde
∥R((hi )ki=1 )∥W
lim sup Qk = 0.
i=1 ∥hi ∥V
h1 →0V (h )k ∈(V \{0})k−1
j j=2

Exercício 12.7 Considere a aplicação de inversão de operadores lineares Inv : U → L(X) consi-
derada nas notas. Prove que, para qualquer A ∈ U e (Hi )ki=1 ∈ L(X)k ,
X
DInv(A) (Hi )ki=1 = (−1)k A−1 Hσ(1) A−1 Hσ(2) . . . A−1 Hσ(k) A−1 ,
σ∈Sk

onde Sk é o grupo de permutações de {1, . . . , k}. Se você quiser, pode usar os casos k = 1, 2
considerados acima como base para sua indução.

Exercício 12.8 Suponha que U é convexo e f : U → W é k vezes diferenciável. Prove a


sequinte versão da série de Taylor: se x0 , x0 + h ∈ U ,
k
X Dj f (x0 ) hj
f (x0 + h) = f (x0 ) + + Rk (h)
j=1
j!

onde
∥Rk (h)∥W
∀h ∈ V : x0 + h ∈ U ⇒ ≤ sup ∥Dk f (x0 + a) − Dk f (x0 )∥V k →W
∥h∥kV ∥a∥≤∥h∥

Exercício 12.9 Considere o caso V = Rd e W = R com as normas usuais. Suponha que


f : U → R tem derivadas parciais contínuas de ordem ≤ k. Prove que f é k vezes diferenciável
com k-ésima derivada dada por:
d
X k
Y
k
D f (x) (h1 , . . . , hk ) = ∂i1 ∂i2 . . . ∂ik f (x) h[ij ].
i−1,...,ik =1 j=1

Argumente ainda que ∂i1 ∂i2 . . . ∂ik f (x) é invariante por permutações de i1 , . . . , ik .

Exercício 12.10 Considere novamente o caso V = Rd e W = R com as normas usuais. Prove que
f : U → R tem derivadas parciais contínuas de ordem ≤ k se e somente se é k vezes diferenciável
com Dk f : U → Lk (V, W ) contínua.

217
Exercício 12.11 Enuncie de forma precisa e prove o seguinte enunciado. A composição de duas
funções k vezes diferenciáveis (no sentido de Fréchet) é uma função k vezes diferenciável.

io:EDOlegal Exercício 12.12 Volte à Proposição 11.4 e suponha agora que Dxk ψ(t, x) existe e é contínua, para
algum k ≥ 0. Prove que as funções Tψ e Fψ definidas na prova daquela proposição são k vezes
diferenciáveis e calcule suas derivadas de ordem até k.

Exercício 12.13 Considere Q ∈ Lk (V, W ) (com V e W “como sempre"e k ∈ N\{0, 1}) e defina
f (v) := Q(v, v, . . . , v) (v ∈ V ). Calcule as derivadas de todas as ordens desta função. Explique
como a fórmula se simplifica quando Q é simétrica.

Exercício 12.14 Dados espaços vetoriais normados (V, ∥ · ∥V ), (W, ∥ · ∥W ), chame de Lsim
k (V, W )
k
o conjunto das transformações k-lineares e simétricas de V em W . Mostre que este conjunto é
um subconjunto fechado de Lk (V, W ). Mostre ainda que podemos definir sobre Lsim k (V, W ) uma
norma ∥ · ∥sim que é equivalente à restrição da norma usual de Lk (V, W ) a este subespaço:

∥Q(v, v, . . . , v)∥W
∥Q∥sim := sup .
v∈V \{0V } ∥v∥kV

Dica: para v ∈ V , escreva v k := (v, v, . . . , v) ∈ V k . Mostre que existem


(i)
m ∈ N\{0} e {a(i) }m
i=1 ∪ {αj }1≤i≤m,1≤j≤k ⊂ R

tais que, para quaisquer vetores v1 , . . . , vk ∈ V e qualquer Q : V k → W k-linear,


m k
!
X X (i)
Q(v1 , v2 , . . . , vk ) = a(i) Q ( αj vj )k .
i=1 j=1

Depois explique porque a existência destes números implica que existe um Ck > 0 tal que
∥Q∥V k →W ≤ Ck ∥Q∥sim para qualquer Q ∈ Lsim
k (V, W ).

Exercício 12.15 (“Regra de Leibniz" para derivada de Fréchet) Dados espaços vetoriais nor-
mados (V, ∥ · ∥V ), (W, ∥ · ∥W ) e (Z, ∥ · ∥Z ); um aberto U ⊂ V ; uma Q ∈ Lk (W, Z); e funções
f1 , . . . , fk : U → W . Defina uma nova função F : U → Z via:

F (x) := Q(f1 (x), . . . , fk (x)) (x ∈ U ).

Mostre que, se todas as fi são diferenciáveis num certo x ∈ U , então DF (x) existe. Além disso,
calcule DF (x).

218
Capítulo 13

Pontos fixos, funções inversas e funções


implícitas

Neste capítulo abordaremos um teorema bem abstrato e duas consequências importantes


dele para o cálculo diferencial em espaços vetoriais. O que une estes temas é a necessidade
de achar pontos em um espaço V com uma certa propriedade desejada. Nosso meio de
fazer isso será procurar pontos fixos de certas operações.
Exemplo 13.1 (Problema de Cauchy para EDOs) No Exemplo 4.7, vimos que o problema de
achar uma solução para uma EDO é equivalente ao de achar um ponto fixo para uma certa função
T : C(I, V ) → C(I, V ).
Exemplo 13.2 Imagine que f : U0 ⊂ V → V com U0 ⊂ V aberto. Na prova do Teorema da
Função Inversa, que será vista abaixo, nos depararemos com o problema de provar que, sob certas
condições em f , f (U0 ) é um conjunto aberto. Repare que este tipo de resultado é bem forte. Dada
uma f bem pouco conhecida, um x ∈ U0 e um y = f (x) ∈ V , temos que provar que existe um raio
positivo δ > 0 tal que todo ponto y ′ ∈ BV (y, δ) tem uma preimagem em U0 . Mas como podemos
construir estas pré-imagens? Veremos que a maneira conveniente de fazer isso é achar um ponto
fixo para uma certa operação.
A mensagem deste capítulo é que há uma metodologia para estes problemas que
funciona em muitos casos.
Considere um espaço métrico (X, dX ). Você precisa provar que existe um ponto x∗ ∈ X
com certas propriedades. Uma estratégia é converter este problema no de achar um
ponto fixo de uma transformação H : X → X e depois mostrar que o ponto fixo existe
usando o Teorema do Ponto Fixo de Banach, provado logo a seguir.

13.1 O teorema do ponto fixo de Banach


Nesta seção daremos o enunciado e a prova deste teorema de Banach. Primeiro, algumas
definições.

219
Definição 13.1 Dada H : X → X, um ponto fixo de H é um x∗ ∈ X com H(x∗ ) = x∗ .
Abaixo usaremos a notação
H i := |H ◦ H ◦ H
{z ◦ · · · ◦ H} (i ∈ N\{0})
i vezes

com H 0 := I a função identidade sobre X.


O exercício a seguir nos diz que os pontos fixos são exatamente os limites de órbitas
{H i (x)}i∈N
aspontofixo Exercício 13.1 Supondo que H é contínua e (X, dX ) é completo, mostre que x∗ é ponto fixo de H
se e somente se existe um x ∈ X com H i (x) → x∗ quando i → +∞.
Teorema 13.1 (Ponto Fixo de Banach) Suponha que (X, dX ) é um espaço métrico completo e
que H : X → X é tal que cada H i é κi -Lipschitz (i ∈ N). Suponha que
+∞
X
M := κi < +∞.
i=0

Então:
(a) H tem um único ponto fixo x∗ .
(b) H i (x) → x∗ para qualquer x ∈ X.
(c) dX (x, x∗ ) ≤ M d(x, H(x)) para qualquer x ∈ X.
O uso deste teorema será fundamental no restante da seção. Observamos antes da
prova um caso especial importante e dois exemplos que explicam as hipóteses do teorema.
Exercício 13.2 Mostre que as hipóteses do Teorema seguem quando H é κ-Lipschitz com κ < 1,
já que neste caso podemos tomar κi = κi .
Exemplo 13.3 Note que a hipótese de que (X, dX ) é completo é fundamental. Por exemplo,
considere X = R\{0} e H(x) = x/2 (x ∈ X).
Exemplo 13.4 Neste exemplo mostramos que é possível se ter X completo, H : X → X tal que
∀x, x′ ∈ X : dX (H(x), H(x′ )) < dX (x, x′ ),
mas tais que H não tem ponto fixo. Por esta razão, é importante que a constante de Lipschitz seja
estritamente menor do que um.
Tome X = [1, +∞) ⊂ R. Este é um conjunto fechado da reta e é, portanto, um espaço métrico
completo com a métrica induzida por R. Defina H(x) = x + x−1 (x ∈ X). Observe que:

1
∀x, x ∈ X : |H(x) − H(x )| = |x − x | 1 − ′ < |x − x′ |.
′ ′ ′

xx
Por outro lado, se existisse um ponto fixo x ∈ X, teríamos x = x + x−1 , o que dá x−1 = 0, o que é
impossível.

220
Antes da prova, convém enunciarmos um lema simples.

Lema 13.1 Se (X, dX ) é completo, então uma sequência {xi }i∈N ⊂ X satisfazendo
X
dX (xi , xi+1 ) < +∞
i∈N

é convergente. Além disso,


X
∀k ∈ N : dX (xk , lim xi ) ≤ dX (xi , xi+1 ).
i∈N
i≥k

Prova: Fixando uma tal {xi }i∈N , mostraremos que ela necessariamente é Cau-
chy. Para isso, usaremos o fato de que a cauda de uma série convergente vai a
zero:
k→+∞
X
ck := dX (xi , xi+1 ) −→ 0,
i≥k

Agora estimaremos a distância entre xk e xℓ com k < ℓ naturais. Veja que


podemos aplicar a desigualdade triangular várias vezes e deduzir que:
ℓ−1
X
dX (xk , xℓ ) ≤ dX (xk , xk+1 ) + dX (xk+1 , xℓ ) ≤ · · · ≤ dX (xi , xi+1 ) ≤ ck ,
i=k

onde a última desigualdade segue do fato que todos os termos na série ck são
não-negativos.
A cota acima foi feita para k < ℓ. Ela também funciona para k > ℓ se
trocamos os papeis dos índices e certamente vale para k = ℓ. Concluímos que:

∀k, ℓ ∈ N : 0 ≤ dX (xk , xℓ ) ≤ cmin{k,ℓ} .

Quando k, ℓ → +∞, cmin{k,ℓ} → 0, portanto dX (xk , xℓ ) → 0. Ou seja, a sequência


{xi }i∈N é Cauchy, como queríamos demonstrar. Como (X, dX ) é completo,
existe um limite x∗ para a sequência. Além disso, veja que, quando ℓ → +∞,
xℓ → x∗ ; como ℓ ≥ k para todo ℓ grande, a estimativa acima nos permite
deduzir:
∀k ∈ N : dX (xk , xℓ ) ≤ ck .
2

Prova: [Prova do Teorema de Ponto Fixo de Banach] Nosso primeiro passo é provar que,
dado qualquer x ∈ X, {H i (x)}i∈N converge a um x∗ ∈ X que satisfaz a desigualdade do
item (c) acima.

221
De fato, como (X, dX ) é completo, sabemos do Lema acima uma condição suficiente
para uma sequência {xi }i∈N ⊂ X convergir é que
X
dX (xi , xi+1 ) < +∞.
i∈N

Mais ainda, quando vale este critério, podemos usar a desigualdade triangular para obter:
X
dX (x0 , lim xi ) ≤ dX (xi , xi+1 ).
i∈N
i∈N

Aplicaremos tudo isso a xi := H i (x), i ∈ N, observando que neste caso

dX (xi−1 , xi ) = dX (H i−1 (x), H i−1 (H(x))) ≤ κi−1 dX (x, H(x))

porque H i−1 é κi−1 -Lipschitz. Portanto,


X X
dX (xi , xi+1 ) ≤ κi dX (x, H(x)) = M dX (x, H(x)) < +∞
i∈N i∈N

e temos tanto a convergência de {H i (x)}i∈N a um x∗ quando a cota de (c) para dX (x, x∗ ).


Isto conclui a primeira parte da prova.
O restante da demonstração é basicamente uma série de observações simples. Veja
que o argumento acima garante que pontos fixos existem: afinal, qualquer x∗ = limi H i (x)
é ponto fixo pelo exercício 13.1. Para provar unicidade, provaremos que quaisquer dois
pontos fixos x∗ , y∗ são iguais. Primeiro notamos que, quando x∗ e y∗ são pontos fixos,
então H i (x∗ ) = x∗ e H i (y∗ ) = y∗ para qualquer i ∈ N. Em particular, como M < +∞ isto
vale para algum i ∈ N com κi < 1/2. Mas então:

dX (x∗ , y∗ )
0 ≤ dX (x∗ , y∗ ) = dX (H i (x∗ ), H i (y∗ )) ≤ κi−1 dX (x∗ , y∗ ) ≤ ⇒ dX (x∗ , y∗ ) = 0.
2
Finalmente, juntamos os ingredientes.

• O ponto fixo existe e é único, como pede (a);

• Como cada sequência {H i (x)}i∈N converge a um limite (pela primeira parte da prova)
e este limite é um ponto fixo (pelo exercício 13.1), temos que H i (x) converge a x∗ , o
único ponto fixo de H, não importando qual seja x. Isto é a parte (b) do teorema.

• Finalmente, a estimativa (c) foi provada no primeiro passo, onde tratamos x∗ como
o limite de H i (x) para um dado x. Como agora sabemos que este limite é o único
ponto fixo, está encerrada a prova.

222
13.2 O teorema da função inversa
Seção sendo reescrita em 17/05/2023.
Nesta seção provaremos um dos teoremas clássicos do Cálculo em várias variáveis: o
teorema da função inversa. Convém enunciar uma definição antes de começar.
Definição 13.2 Dados abertos U0 , U1 ⊂ V , dizemos que f : U0 → U1 é um difeomorfismo de
classe C ℓ (ℓ ∈ N\{0}) se f é uma bijeção entre U0 e U1 e tanto f quanto f −1 são funções com
derivadas contínuas até ordem ℓ.
Os difeomorfismos são importantes porque são correspondências entre conjuntos que
preservam não só cardinalidade (como seria se fossem só bijeções) ou topologia (como
seria se f e f −1 são contínuos), mas também qualquer “estrutura diferenciável até ordem
ℓ"que podemos botar nos conjuntos U0 e U1 . De fato, os “difeos" serão muito importantes
na hora de falarmos de variedades.
Uma observação simples é que, para que uma função f : U0 → U1 seja um difeo-
morfismo C 1 , é necessário que derivada de f seja um operador linear inversível. De fato,
supondo que f seja mesmo um difeo, podemos aplicar a regra da cadeia às expressões
∀x ∈ U0 , f −1 ◦ f (x) = x e ∀y ∈ U1 , f ◦ f −1 (y) = y
e descobrir que, dados x ∈ U0 e y = f (x) ∈ U1 ,
Df −1 (y) Df (x) = Df (x) Df −1 (y) = IdV ,
o operador identidade de V . Desta forma,
Df −1 = Inv ◦ Df ◦ f −1 .
aracontinua Exercício 13.3 Use a representação acima para Df −1 para provar o segunte resultado. Se f :
U0 → U1 é bijeção de classe C ℓ e a função inversa f −1 é diferenciável, então f −1 também é de classe
C ℓ (para ℓ = 1, isso segue do fato de que Df −1 é a composição de três funções contínuas).
Por outro lado, a simples invertibilidade da derivada não é suficiente para garantir que
f é um difeomorfismo.
Exemplo 13.5 Considere a parametrização de U0 = U1 = R2 \{0R2 } por coordenadas polares.

f : R2 \{0} → R2 \{0R2 }
(r, θ) 7→ (r cos θ, r sin θ).
Podemos calcular a derivada de f na forma matricial através da matriz de derivadas parciais.
 
cos θ −r sin θ
Df (r, θ) = .
sin θ r cos θ
Como o determinante desta matriz é r > 0, Df (r, θ) é sempre inversível. No entanto, f não
é um difeomorfismo. De fato, ela não é nem mesmo uma bijeção, já que é periódica na segunda
coordenada.

223
O que o Teorema da Função Inversa é que a invertibilidade da derivada num único
ponto x0 do domínio garante que f é um difeomorfismo local, ou seja, ao redor de x0 .

teo:inversa Teorema 13.2 (Teorema da função inversa) Considere um espaço vetorial normado completo
(V, ∥ · ∥V ). Suponha que U ⊂ V é aberto de V , que f : U → W é C ℓ , ℓ ∈ N\{0}. Suponha ainda
que, para um certo ponto x0 ∈ U , Df (x0 ) é inversível. Então há um aberto U0 ⊂ U com x ∈ U0
tal que:
1. U1 := f (U0 ) é aberto;
2. f |U0 : U0 → U1 é um difeomorfismo C ℓ .

A prova será apresentada ao longo de vários lemas abaixo. Convem entender desde
agora a intuição e a dificuldade técnica da prova. A intuição é simples. Localmente, f (x) se
parece muito com a função afim y0 + T (x − x0 ), com y0 = f (x0 ) e T = Df (x0 ). Como T é
inversível, a função afim também é e tudo indica que f deve ter as mesmas características
numa vizinhança de x0 .
A maior dificuldade técnica da prova será provar que U1 é aberto. Para entender o
desafio, imagine que você tem em mãos um y ∈ U1 = f (U0 ). Tudo o que sabemos, em
princípio, é que y = f (x) para algum x ∈ U0 . Para provar que U1 é aberto, precisamos
encontrar um δ > 0 tal que todo y ′ a distância < δ de y tem uma pré-imagem x′ em U0 .
Como poderemos fazer isso?

Invertendo funções não-lineares


Na verdade, esta parte difícil da prova nada tem a ver com diferenciabilidade. O que
faremos será abordar a sequinte questão.

Quando uma função não-linear ψ : U0 → U1 (com U0 , U1 ⊂ V ) é uma bijeção contínua com


inversa contínua e imagem aberta?

Não há como dar uma condição absolutamente geral para isso ser verdade, mas vere-
mos a seguir que perturbações de operadores lineares inversíveis têm essa propriedade.
Para entender melhor por que isso faz sentido, começamos com uma observação.

Observação 13.1 Se T ∈ L(V ) é inversível, então T (U ) é aberto para qualquer aberto U ⊂ V e


tanto T quanto T −1 são Lipschitz. Além disso,
v
∀v ∈ V : ≤ ∥T v∥V ≤ ∥T ∥V →V ∥v∥V . (13.1) eq:normadai
∥T −1 ∥V →V
De fato, vimos que um operador linear é contínuo se e somente se ele é limitado, o
que ocorre se e somente se ele é Lipschitz. Além disso, como T −1 é contínua, T (U ) =
(T −1 )−1 (U ) tem de ser aberto para qualquer aberto U . Por fim, a cota superior na estimativa
acima é óbvia e a inferior vem de
∥T −1 w∥V ≤ ∥T −1 ∥V →V ∥w∥V aplicada a w := T v.

224
Recorde agora que já sabemos lá da §11.4.1 que perturbações de operadores inversíveis
também são inversíveis. De fato, segue dos resultados lá provados que, se T, S ∈ L(V ), T
é inversível e
1
∥T − S∥V →V < −1
,
∥T ∥V →V
então S também é inversível. Logo, um S próximo de T também leva abertos em abertos
e também é Lipschitz com inversa Lipschitz.
O que veremos a seguir é um análogo disso para funções que não são necessariamente
lineares. De fato, o salto conceitual é substituir a norma de operador ∥T − S∥V →V pela
constante de Lipschitz ∥T − S∥Lip ; isso dá exatamente no mesmo para T, S ∈ L(V ), mas
também faz sentido para coisas que não são lineares.
versanaodif Teorema 13.3 Suponha que U0 ⊂ V é aberto e que ψ : U0 → V é dada. Se existe T ∈ L(V ) com
∥ψ − T ∥Lip < 1/∥T −1 ∥V →V , então:
1. U1 := ψ(U0 ) é aberto;
2. ψ : U0 → U1 é bijeção Lipschitz;
3. ψ −1 : U1 → U0 também é Lipschitz.
Note que o item 2 tem um pequeno abuso de notação, já que trocamos o contradomínio
da função sem trocar seu nome. No entanto, sabemos que isso não é realmente um
problema.
Além disso, devemos observar que dizer que ψ é perturbação de T não é exatamente
preciso. Afinal,
Prova: Mesmo sem saber que U1 é aberto, podemos provar que ψ : U0 → U1 é bijeção
Lipschitz com inversa Lipschitz. Afinal, veja que, dados x, x′ ∈ U0 ,
|∥T (x−x′ )∥V −∥ψ(x)−ψ(x′ )∥V | ≤ ∥(T −ψ)x−(T −ψ)(x′ )∥V ≤ ∥ψ −T ∥Lip ∥x−x′ ∥V , (13.2) eq:psiequas
ou melhor,
∥T (x−x′ )∥V −∥ψ−T ∥Lip ∥x−x′ ∥V ≤ ∥ψ(x)−ψ(x′ )∥V ≤ ∥T (x−x′ )∥V +∥ψ−T ∥Lip ∥x−x′ ∥V .
Combinando estas estimativas e (13.1), deduzimos que:
ℓ ∥x − x′ ∥V ≤ ∥ψ(x) − ψ(x′ )∥V ≤ L ∥x − x′ ∥V
onde L := ∥T ∥V →V + ∥ψ − T ∥Lip e
 
1
ℓ := − ∥ψ − T ∥Lip > 0.
∥T −1 ∥V →V
Portanto, ψ é bi-Lipschitz no sentido do Exercício 11.17. Em particular ela é injetiva;
portanto, ela é uma bijeção entre U0 e sua imagem ψ(U0 ) = U1 . Além disso, dados y, y ′ ∈ V ,
podemos tomar x = ψ −1 (y) e x′ = ψ −1 (y ′ ) na desigualdade anterior para obtermos
ℓ ∥ψ −1 (y) − ψ −1 (y ′ )∥V ≤ ∥y − y ′ ∥V ,

225
o que significa que ψ −1 é 1/ℓ-Lipschitz.
Ainda falta provar que U1 é um aberto: ou seja, queremos mostrar que, dado um
y0 ∈ U1 , existe um δ > 0 tal que BV [y0 , δ] ⊂ U1 . Como U1 é a imagem de U0 por ψ, um certo
y ∈ V está em U1 se e somente se existe um x ∈ U0 com ψ(x) = y. Portanto, nosso objetivo
é mostrar o seguinte:

Se y ∈ V e y = ψ(x) para algum x ∈ V , então existe um raio δ > 0 tal que, dado
qualquer y∗ ∈ V com ∥y∗ − y∥V ≤ δ, existe um x∗ ∈ U0 com ψ(x∗ ) = y∗ .

Nossa ideia para conseguir estas propriedades vai ser usar aplicar um argumento de
ponto fixo.
Fixe x ∈ U0 e y = ψ(x) ∈ U1 . O que faremos será encontrar um r > 0 e um δ > 0 tais
que
X := BV [x, r] ⊂ U0 , Y := BV [y, δ] ⊂ U1
e provaremos que ψ(X) ⊃ Y . A escolha precisa de r e δ será necessária para tudo funcionar,
mas, ao invés de fazê-la agora, iremos vendo as condições necessárias para tudo funcionar
ao longo do resto da prova. De qualquer forma, observe que X é um fechado de V .
Agora, dado um y ′ ∈ Y arbitrário, defina a função:

Hy∗ (x′ ) := x′ − T −1 (ψ(x′ ) − y∗ ) (x′ ∈ X).

Note que x′ é ponto fixo de Hy∗ se e somente se T −1 (ψ(x′ ) − y∗ ) = 0V . Como T −1 é


inversível, temos o seguinte fato.

Achar uma pré-imagem para y∗ é igual a achar um ponto fixo para Hy∗ .

Queremos aplicar o Teorema do Ponto Fixo de Banach para provar que o ponto fixo
existe. Para isso, precisamos de três coisas.

1. X é completo com a métrica adequada.

2. Hy∗ é κ-Lipschtz com κ < 1.

3. Hy∗ (X) ⊂ X.

A primeira condição é simples. Como X é fechado de V , que por sua vez é Banach,
temos que X é completo com a métrica induzida pela norma de X.
Agora observamos que H é κ-Lipschitz, com

κ := ∥T − ψ∥Lip ∥T −1 ∥V →V ;

note que κ < 1 justamente por causa da nossa hipótese sobre ∥T − ψ∥Lip !

226
Para provar a propriedade de Lipschitz, tome x′ , x′′ ∈ X e veja que:

∥Hy∗ (x′ ) − Hy∗ (x′′ )∥V = ∥(x′ − x′′ ) − T −1 (ψ(x′ ) − ψ(x′′ ))∥V
(T −1 , T lineares) = ∥T −1 [T (x′ ) − T (x′′ ) − (ψ(x′ ) − ψ(x′′ ))]∥V
= ∥T −1 [(T − ψ)(x′ ) − (T − ψ)(x′′ )]∥V
≤ ∥T −1 ∥V →V ∥(T − ψ)(x′ ) − (T − ψ)(x′′ )∥V
≤ ∥T −1 ∥V →V ∥T − ψ∥Lip ∥x′ − x′′ ∥V
= κ ∥x′ − x′′ ∥V .

Por fim, queremos mostrar que Hy∗ (X) ⊂ X. É neste momento da prova que aparecerão
as restrições sobre δ e r de que precisamos.
O primeiro ponto é observar que, como X = BV [x, r], provar a inclusão

∀x′ ∈ X, Hy∗ (x′ ) ∈ X

é a mesma coisa que mostrar que

Objetivo: ∀x′ ∈ V : ∥x′ − x∥V ≤ r ⇒ ∥Hy∗ (x′ ) − x∥V ≤ r. (13.3) eq:finalban

Cumpriremos este objetivo usando a recém-provada estimativa de Lipschitz, junto com a


desigualdade:

∀x′ ∈ X : ∥Hy∗ (x′ ) − x∥V ≤ ∥Hy∗ (x′ ) − Hy∗ (x)∥V + ∥Hy∗ (x) − x∥V

O primeiro termo é cotado por κ ∥x′ − x∥V . Pro segundo termo, recorde que ψ(x) = y e
y∗ ∈ Y = BV [y, δ], logo ∥y − y∗ ∥V ≤ δ e

∥Hy∗ (x) − x∥V = ∥T −1 (y − y∗ )∥V ≤ ∥T −1 ∥V →V δ.

Deduzimos:
∀x′ ∈ X : ∥Hy∗ (x′ ) − x∥V ≤ κ r + ∥T −1 ∥V →V δ.
Lembrando que κ < 1, vemos que a escolha
r
δ = δ(r) :=
(1 − κ) ∥T −1 ∥V →V
garante (13.3), contanto que sejam respeitadas as relações adicionais

X = BV [x, r] ⊂ U0 e Y = BV [y, δ] ⊂ U1 .

Mas tanto U0 quanto U1 são abertos, logo as bolas estão dentro dos respectivos abertos
para r e δ suficientemente pequenos. Como δ(r) → 0 quando r → 0, basta tomar r > 0
pequeno o suficiente para que tudo funcione. Isso justifica a aplicação do Teorema de
Banach e conclui a prova da existência do ponto fixo, ou seja, da pré-imagem x∗ ∈ X de
um y∗ ∈ Y = BV [y, δ] arbitrário. Logo, temos ψ(X) ⊃ Y , o que, como vimos, era o que
faltava para provarmos que U1 é aberto. 2

227
Prova do Teorema da Função Inversa
Agora que temos nossa principal ferramenta, a prova do Teorema da Função Inversa não
será tão difícil – mas ela ainda está um pouco longe de acabar. A ideia será aplicar o
Teorema 13.3 a ψ = f |U0 , com U0 definido abaixo.
Recorde que supomos que f : U → V é C ℓ , x0 ∈ U e Df (x0 ) é inversível.

lem:aberto Lema 13.2 Existe um ε > 0 tal que, definindo U0 := BV (x0 , ε) ⊂ U ,

1. U1 = f (U0 ) é aberto.

2. Df (x) é inversível para todo x ∈ U0 .

3. f |U0 : U0 → U1 é Lipschitz.

4. (f |U0 )−1 : U1 → U0 é Lipschitz.

Prova: A ideia será aplicar o Teorema 13.3 com T := Df (x0 ). Para isso, começamos
observando que, Df : U → V é contínua, é possível encontrar um ε > 0 tal que U0 :=
BV (x0 , ε) ⊂ U e
1
∀x ∈ BV (x0 , ε) : ∥Df (x) − Df (x0 )∥V →V ≤ .
2∥Df (x0 )−1 ∥V →V
Por tudo que vimos sobre invertibilidade de operadores lineares no §11.4.1, isso por si só
já garante que Df (x) é inversível para todo x ∈ U0 .
Agora defina ψ := f |U0 . Mostramos agora que ∥T − ψ∥Lip < ∥T −1 ∥−1 V →V , o que nos
permite terminar a prova via o Teorema 13.3.
Para provar a estimativa sobre a constante de Lipschitz, podemos aplicar o exercício
11.12 à função G = ψ − T , definida sobre o aberto convexo U0 . G tem derivada DG(x) =
Df (x) − T = Df (x) − Df (x0 ) para cada x ∈ U0 . Pela escolha de ε > 0 acima,
1
∥ψ − T ∥Lip = ∥G∥Lip = sup ∥Df (x) − Df (x0 )∥V →V ≤ .
x∈U0 2∥Df (x0 )−1 ∥V →V

Ou seja, ∥ψ − T ∥Lip < 1/∥T −1 ∥V →V . 2


Prova: [Fim da prova do Teorema da Função Inversa] A partir daqui, suporemos que
f : U0 → U1 , onde U0 ∋ x0 e U1 = f (U0 ) são os conjuntos obtidos no lema anterior. Ou
seja, abusaremos a notação de leve, trocando o domínio e o contradomínio de f .
Com estas redefinições, segue do que vimos acima que f é uma bijeção Lipschitz
com inversa Lipschitz, que tem derivada inversível em todo ponto de U0 . Além disso, o
contradomínio U1 é aberto. O que nos falta, então, é provar é f −1 diferenciável, já que o
Exercício 13.3 então garantirá que f −1 é C ℓ .
Fixe, então, y ∈ U1 ; provaremos que f −1 tem derivada em y. Como sabemos, esta
derivada, se existir, deve ser igual a S := Df (x)−1 , onde x ∈ U0 satisfaz f (x) = y.
Provemos, então, que isso é mesmo verdade.

228
Dado h tal que y + h ∈ U1 , podemos definir uh com x + uh ∈ U0 tal que f (x + uh ) = y + h;
este uh então satisfaz:
uh = f −1 (y + h) − f −1 (y). (13.4) eq:defuh
Nosso objetivo, portanto, é mostrar que
Objetivo: uh = f −1 (y + h) − f −1 (y) = S h + o(h).
Para isso, o primeiro passo é usar o fato de que f é diferenciável em x, com derivada igual
a Df (x) = S −1 . Ou seja,
h = y + h − y = f (x + uh ) − f (x) = S −1 uh + r(uh ),
onde ∥r(u)∥ = o(u). Isto implica que
uh = f −1 (y + h) − f −1 (y) = S h − S r(uh ).
O que nos resta agora é provar que S r(uh ) = o(h). Para isso, será boa ideia provar
que as normas de uh e h são parecidas. De fato, como f −1 é Lipschitz, obtemos que
∥uh ∥V = ∥f −1 (y + h) − f −1 (y)∥V ≤ c0 ∥h∥V com c0 > 0 independente de h. Por outro lado,
f também é Lipschitz, logo
∥f (x + uh ) − f (x)∥V = ∥h∥V ≤ c1 ∥uh ∥V
com c1 > 0 constante. Ou seja, a norma de uh é cotada por cima e por baixo pela norma
de h, a menos de fatores constantes.

∥h∥V
∀h ∈ V : y + h ∈ U1 ⇒ ≤ ∥uh ∥V ≤ c0 ∥h∥V .
c1
Concluímos que uh =
̸ 0V quando h ̸= 0V e que uh → 0V quando h → 0V . Assim
terminamos a prova:
∥f −1 (y + h) − f −1 (y) − S h∥V ∥S r(uh )∥V
=
∥h∥V ∥h∥V
∥r(uh )∥V
≤ ∥S∥V →V
∥h∥V
∥r(uh )∥V
≤ ∥S∥V →V
∥h∥V
∥r(uh )∥V
(use ∥uh ∥V ≥ c−1
1 ∥h∥V ) ≤ c1 ∥S∥V →V
∥uh ∥V
(combine h → 0V ⇒ uh → 0V com r(u) = o(u)) → 0,
como queríamos demonstrar. 2

Exercício 13.4 Mostre pelo método de prova do Lema ?? que, se U ⊂ V é aberto, ψ : U → V é


dada e
∥ψ − T ∥Lip < 1
para algum operador linear inversível T ∈ L(X), então ψ é aberta (isto é, ψ(A) é aberto de V para
todo aberto A ⊂ U ). Mostre que uma função bi-Lipschitz não é necessariamente aberta.

229
13.3 O teorema da função implícita
Provaremos agora um outro clássico do Cálculo em várias variáveis, com tantas ou mais
aplicações que o primeiro resultado. Para enunciá-lo, precisaremos de um preâmbulo.
Considere dois espaços vetoriais normados e completos (V, ∥ · ∥V ) e (W, ∥ · ∥W ). O
produto V ×W pode ser visto como um espaço vetorial composto de pares (v, w) ∈ V ×W .
Se fixamos p ∈ [1, +∞), a fórmula
q
∥(v, w)∥V ×W = p ∥v∥pV + ∥w∥pW ((v, w) ∈ V × W )

define uma norma sobre V × W que o torna um espaço completo. Por exemplo, se
V = Rd e W = Rk com as respectivas normas ℓp , ∥ · ∥Rd ×Rk corresponde à norma ℓp em
Rd × Rk = Rd+k .Também é um exercício mostrar que as normas obtidas para os diferentes
valores de p > 1 são todas equivalentes.
A seguir apresentaremos um resultado que nos dará condições de entender a estrutura
local de certos subconjuntos M ⊂ V × W definidos implicitamente por uma fórmula do
tipo:
M = {(v, w) ∈ V × W : Φ(v, w) = 0W }
onde Φ : V × W → W é uma função. Por exemplo: imagine que V = Rd , W = Rk e
portanto V × W ≈ Rd+k . Uma Φ como acima codifica k equações não lineares em d + k
variáveis:
Φ[j](x[1], . . . , x[d + k]) = 0, j = 1, 2, 3, . . . , k.
A principal mensagem do Teorema da Função Inversa é que, sob condições simples,
localmente o conjunto M é da forma (x, g(x)) para alguma função g de V em W . A
principal hipótese será a de que o operador linear D2 Φ(x, y) ∈ L(W ) dado por:
D2 Φ(x, y) w := DΦ(x, y) (0V , w) (w ∈ W )
é inversível para algum par (x0 , y0 ) ∈ V × W .

Teorema 13.4 (Teorema da Função Implícita) Considere U ⊂ V × W aberto e uma função C ℓ


Φ : U → W . Suponha que existe (x0 , y0 ) ∈ U tal que Φ(x0 , y0 ) = c ∈ W D2 f (x, y) ∈ L(W ) é
inversível. Então existem abertos A0 ⊂ V , com x0 ∈ A0 , e U0 ⊂ V × W , com (x0 , y0 ) ∈ U0 , além
de uma função C ℓ g : A0 → W com (x, g(x)) ∈ U0 para todo x ∈ A0 e ainda:
∀(x, y) ∈ U0 : Φ(x, y) = c ⇔ y = g(x),
ou ainda:
U0 ∩ Φ−1 (c) = {(x, g(x)) : x ∈ A0 }.

Antes da prova, convém anotar alguns preliminares. Observe que a derivada de Φ


deve ser uma transformação linear T ∈ L(V × W, W ). Abaixo teremos que considerar
transformações do tipo:
IV ⊗ T : (h, s) ∈ V × W 7→ (h, T (h, s)) ∈ V × W

230
e também
T1 : v ∈ V 7→ T (v, 0W ),
T2 : w ∈ W 7→ T (0V , w),
I × T2 : (v, w) ∈ V × W 7→ (v, T2 w).

Proposição 13.1 Temos T1 ∈ L(V, W ), T2 ∈ L(W ) e IV ⊗ T ∈ L(V × W ). Se a aplicação T2 é


inversível, o mesmo vale para IV ⊗ T . Além disso, se definimos

F (x, y) := (x, Φ(x, y)) ((x, y) ∈ U ),

então
∀(x, y) ∈ U : DF (x, y) = I ⊗ DΦ(x, y).

Prova: T2 é claramente linear. Note ainda que

∀w ∈ W : ∥T2 w∥W = ∥T (0V , w)∥W ≤ ∥T ∥V ×W →W ∥(0V , w)∥V ×W = ∥T ∥V ×W →W ∥w∥W ,

portanto ∥T2 ∥W →W ≤ ∥T ∥V ×W →W < +∞ e T2 é limitado. Do mesmo modo, podemos


mostrar que T1 ∈ L(V, W ) e I × T2 ∈ L(V × W ).
Suponha agora que T2 é inversível; queremos provar que I ⊗ T também é inversível.
Isto é, temos que provar que existe um operador limitado L ∈ L(V ×W ) tal que L (I ⊗T ) =
(I ⊗ T ) L = IV ×W . Observe primeiramente que:

I ⊗ T (h, s) = (h, T (h, s)) = (h, T1 h + T2 s).

Chame de H o operador que leva (v, w) ∈ V × W em (v, w − T1 v) ∈ V × W . É um exercício


mostrar que H ∈ L(V × W ), que:

H −1 : (v, w) ∈ V × W 7→ (v, w + T1 v)

também pertence a L(V × W ), e que, para todos (h, s) ∈ V × W :

I ⊗ T (h, s) = (h, T (h, s)) = (h, T1 h + T2 s) = H −1 (h, T2 s) = H −1 (I × T2 )(h, s).

Logo I ⊗ T = H −1 (I × T2 ). Portanto, podemos tomar L := (I × T2−1 ) H, observando que,


como T2−1 ∈ L(W ) por hipótese, I × T2−1 ∈ L(V × W ) e (I × T2 )−1 = I × T2−1 .
Finalmente, a prova de que DF = I ⊗ DΦ fica como exercício. 2
A ideia que nos leva a considerar F é que queremos aplicar o Teorema da Função
Inversa. Intuitivamente, a hipótese do teorema garante que Φ(x, y) é “injetiva na coorde-
nada y". A função F acrescenta x ao output de Φ para obtermos uma função realmente
inversível. Passamos agora à prova do teorema.

231
Prova: [Prova do Teorema da Função Implícita]

Aplicaremos o Teorema da Função Inversa à função F : U → V × W definida na


proposição acima. A hipótese deste teorema pode ser combinada com a proposição para
garantir que DF (x, y) ∈ L(V × W ) é inversível quando (x, y) = (x0 , y0 ).
O TFI nos garante que há uma vizinhança aberta U0 ⊂ U de (x0 , y0 ) na qual F é um
difeomorfismo C ℓ , F |U0 : U0 → U1 = F (U0 ). Por abuso de notação, chamaremos F |U0 de
F a partir de agora. Veja ainda que (x0 , c) = F (x0 , y0 ) ∈ U1 .
Considere G = F −1 : U1 7→ U0 . Como U0 = V × W , podemos escrever G(x, y) =
(h(x, y), q(x, y)), onde h : U1 → V e q : U1 → W . Veja que F ◦ G (x, y) = (x, y), ou

F (h(x, y), g(x, y)) = (h(x, y), Φ(x, y)) = (x, Φ(x, y)).

Em particular, h(x, y) = x e G(x, y) = (x, q(x, y)) para todos (x, y) ∈ U1 . É um exercício
mostrar que q : U1 → W é C ℓ porque F é C ℓ .
Agora considere o conjunto

U0 ∩ Φ−1 (c) = {(x, y) ∈ U0 : Φ(x, y) = c} = {(x, y) ∈ U0 : F (x, y) = (x, c)}.

Como F (x, y) ∈ U1 sempre que (x, y) ∈ U0 , e além disso G = F −1 , temos que, para
qualquer par (x, y) ∈ U0 :

Φ(x, y) = c ⇔ F (x, y) = (x, c) ⇔ (x, y) = G ◦ F (x, y) = G(x, c) = (x, q(x, c)) ⇔ y = q(x, c).

Definimos agora g(x) := q(x, c). Esta função g está definida no conjunto:

A0 := {x ∈ V : (x, c) ∈ U1 },

que é aberto. g é C ℓ porque q tem esta propriedade. Pelo raciocínio acima,

(x, y) ∈ U0 ∩ Φ−1 (c) ⇔ (x, c) = F (x, y) ∈ U1 ⇔ x ∈ A0 e y = g(x),

ou seja,

U0 ∩Φ−1 (c) = {(x, y) ∈ U0 : Φ(x, y) = c} = {(x, y) ∈ U0 : y = g(x)} = {(x, g(x)) : x ∈ A0 },

como queríamos mostrar. 2

Exercício 13.5 Explique porque podemos adicionar à tese do Teorema da Função Inversa a seguinte
condição: D2 Φ(x, y) é inversível para todo par (x, y) ∈ U0 . Mostre que, se fazemos isso, podemos
calcular a derivada de g da seguinte maneira:

∀x ∈ A0 : Dg(x) = −[D2 Φ(x, g(x))]−1 D1 Φ(x, g(x)),

onde D1 Φ(x, y) ∈ L(V, W ) é a transformação linear que leva hV ∈ V em D1 Φ(x, y) hV :=


DΦ(x, y) (hV , 0W ). (É parte do exercício mostrar que D1 Φ(x, y) é realmente bem definido e
limitado.)

232
13.4 Aplicações às equações diferenciais ordinárias
Depois de termos provado todos os resultados acima, é bom os botarmos em uso. Isso
será feito no capítulo seguinte, quando tratarmos de variedades. Por questões técnicas,
aquela teoria será apresentada em dimensão finita. Aqui, apresentamos aplicações que
envolvem dimensões infinitas. Nosso objetivo é mostrar que alguns teoremas clássicos
de existência, unicidade e suavidade das soluções de equações diferenciais ordinárias (ou
EDOs) seguem diretamente do Teorema do Ponto Fixo de Banach e do Teorema da Função
Implícita.

13.4.1 Existência, unicidade e dependência contínua: um teorema glo-


bal
Nesta seção, tomamos um espaço de Banach (V, ∥ · ∥V ) e uma função Ψ : R × V → V .
Dado um ponto x0 ∈ V , gostaríamos de encontrar uma função x : R → V tal que

x(0) = x0 e ∀t ∈ R : x′ (t) = ψ(t, x(t)).

Este é o problema de Cauchy em equações diferenciais ordinárias. Interessa-nos saber se o


problema acima tem solução; se essa solução é única; e ainda, se os valores de x(t) mudam
continuamente (ou suavemente) quando mudamos as condições iniciais do problema.
Muitas questões importantes em Física e Matemática têm a ver com a resposta a estas
perguntas.
Um ponto importante é que estamos interessados no problema global; isto é, queremos
uma solução que “funcione" para todos os tempos t ∈ R. É um fato da vida que nem
toda EDO tem solução global. Por isso, precisamos de certas condições para que soluções
globais existam. O teorema abaixo nos mostra que uma condição simples sobre Ψ garante
existência e unicidade globais.

Teorema 13.5 (Existência, unicidade e dependência contínua) Suponha que Ψ : R × V →


V é contínua. Além disso, suponha que Ψ é L-Lipschitz na variável espacial, isto é, que para
quaisquer t ∈ R, x, x′ ∈ V ,

∥Ψ(t, x) − Ψ(t, x′ )∥V ≤ L ∥x − x′ ∥V .

Então valem as seguintes propriedades.


1. Dado x0 ∈ V , existe uma única função contínua ϕx0 : R → R tal que ϕx0 (0) = x0 e
ψx′ 0 (t) = Ψ(t, ψx0 (t)) (t ∈ R). Qualquer função satisfazendo as mesmas propriedades em
um intervalo da forma [−T, T ] com T > 0 coincide com ξ dentro deste intervalo.

2. (Dependência contínua da condição inicial) As soluções ϕx0 , ϕx′0 associadas a condições


iniciais x0 , x′0 ∈ V satisfazem:

∀t ∈ R : ∥ϕx0 (t) − ϕx′0 (t)∥V ≤ eL|t| ∥x0 − x′0 ∥V .

233
Alguns casos de aplicação deste teorema são muito conhecidos.

Exemplo 13.6 Se V = R e Ψ(t, x) = Lx, a única solução com ξ(0) = 0 é a função exponencial
˜ V ≤ eL|t| ∥x − x0 ∥V é
ξ(t) = eLt x0 . Note que este caso mostra que em geral a cota ∥ξ(t) − ξ(t)∥
justa.

Exemplo 13.7 Se V = R2 e Ψ(t, x) = (x[2], −x[1]), a solução com ξ(0) = (0, 1) é dada por
ξ(t) = (sen t, cos t).

Prova: Esta prova tem três partes principais.

1. Provaremos existência, unicidade e estabilidade em cada intervalo de tempo da


forma [−T, T ], T > 0.

2. Mostraremos existência e unicidade para qualquer tempo real.

3. Usaremos a estabilidade do item 1 para provar a dependência contínua.

Parte 1. Fixe T > 0, x0 ∈ V e defina CT := C([−T, T ], V ). Usamos a norma do supremo


neste espaço,
∥f ∥∞,T := sup ∥f (t)∥V (f ∈ CT ).
−T ≤t≤T

Sabemos que (CT , ∥ · ∥∞,T ) é Banach. Além disso, toda solução do problema de Cauchy
é diferenciável e portanto também é contínua. Isto é, todas as eventuais soluções do
problema estão em CT .
O Teorema Fundamental do Cálculo para espaços de Banach, visto no Capítulo 10, nos
permite concluir que f ∈ CT resolve a EDO para t ∈ [−T, T ] se e somente se é um ponto
fixo do operador
Z t
Tx0 ,T : f ∈ C 7→ Tx0 ,T (f ) ∈ CT com Tx0 ,T (f )(t) := x0 + Ψ(s, f (s)) ds (t ∈ [−T, T ]).
0

De fato, se f é ponto fixo, então f ′ (t) é obtida diferenciando-se a integral; e, por outro
lado, f (0) = x0 e f ′ (t) = Ψ(s, f (s)) implica
Z t Z t
Ψ(s, f (s)) ds = f ′ (s) ds = f (t) − x0 e portanto Tx0 ,T (f )(t) = f (t).
0 0

Como neste momento fixamos T e x0 , escreveremos T := Tx0 ,T a seguir. Mostraremos


a seguir que T tem um único ponto fixo, ou seja, a EDO só tem uma solução.
Note que CT é completo com sua norma do sup (chamada de ∥·∥T abaixo). Provaremos
que o ponto fixo de T existe aplicando o Teorema do Ponto Fixo de Banach. Para isso,
precisamos calcular o coeficiente de Lipschitz de cada iterada T n do mapa T . O lema a
seguir dá conta disto:

234
af:picard Afirmação 13.1 (Estimativa de Picard) Dados n ∈ N e f, g ∈ CT :

(L|t|)n
∀t ∈ [−T, T ] : ∥T n (f )(t) − T n (g)(t)∥V ≤ ∥f − g∥∞,T ,
n!
Em particular, T n é (L T )n /n!-Lipschitz.

Veja que esta afirmação termina a prova do primeiro passo porque temos:
X (LT )n
= eLT < +∞
n∈N
n!

e portanto seguem a unicidade do ponto fixo e a desigualdade

∀f ∈ CT : ∥f − ξT ∥∞,T ≤ eLT ∥f − T (f )∥∞,T . (13.5) eq:estavel

Provemos então a afirmação. Veja que o caso n = 0 é trivial. Para seguir por indução,
suponha que, para algum n ≥ 0,

(L|t|)n
∀t ∈ [−T, T ] : ∥T n (f )(t) − T n (g)(t)∥V ≤ ∥f − g∥∞,T ;
n!
Vejamos agora como se comporta a mesma quantidade quando passamos de n para n + 1.
Escreva fn := T n (f ) e gn := T n (g). Usando a fórmula para T , vemos que, para t ≥ 0,
√ √
∥T n+1 (f )(t) − T n+1 (g)(t) −1V = ∥T (fn )(t) − T (gn )(t) −1V
Z t

= (Ψ(s, fn (s)) − Ψ(s, gn (s))) ds

0 V
Z t
≤ ∥Ψ(s, fn (s)) − Ψ(s, gn (s))∥V ds
0
Z t
(use prop. de Lipschitz) ≤ L ∥fn (s) − gn (s)∥V ds
0
Z t 
(Ls)n

(hip. de indução) ≤ L ∥f − g∥∞,T ds
0 n!
Ln+1 tn+1
(apenas faça a conta) = ∥f − g∥∞,T .
(n + 1)!

Uma conta muito parecida prova o resultado análogo para t < 0. Para terminar, temos:

Exercício 13.6 Deduza que T n é mesmo (LT )n /n!-Lipschitz.

Parte 2. Agora queremos provar a existência global. Já sabemos que para cada intervalo
[−T, T ] há uma solução ϕx0 ,T de nosso problema. A principal observação desta parte da
prova é que, se S > T , a solução ϕx0 ,S restrita ao intervalo [−T, T ] tem de coincidir com ϕx0 ,T .

235
Isto ocorre porque a restrição ϕx0 ,S |[−T,T ] : [−T, T ] → Rd também é contínua, satisfaz
ϕx0 ,S |[−T,T ] (0) = x0 e ϕx0 ,S |′[−T,T ] (t) = ϕ′x0 ,S (t) = Ψ(t, ϕx0 ,S (t)) for t ∈ [−T, T ]. Ou seja,
ϕx0 ,T |[−T,T ] resolve o mesmo problema de Cauchy que ϕx0 ,T . Como ϕx0 ,T é a única solução,
tem de valer a observação acima.
O valor da observação é que ela nos permite passar do local para o global. De fato, se
definimos
ϕx0 (t) := ϕx0 ,T (t), onde T > |t| (t ∈ R)
a observação acima nos mostra que isto está bem definido porque o valor do lado direito
não depende do T escolhido. Vê-se ainda que ϕx0 (0) = x0 e ϕ′x0 (t) = Ψ(t, ϕ′x0 (t)) para todo
t ∈ R pelo simples fato que as ϕ′x0 ,T satisfazem estas propriedades nos seus respectivos
intervalos. A unicidade para t ∈ R vem do fato que qualquer outra solução também terá
de coincidir com cada ϕ′x0 ,T no seu intervalo [−T, T ], pelo raciocínio exposto acima.
Parte 3. Provaremos agora a dependência contínua. Tome T := |t|. Considere os opera-
dores Tx0 ,T , Tx′0 ,T : CT → CT vistos acima. Vemos claramente que para qualquer f ∈ CT ,

Tx′0 ,T (f ) = x′0 − x0 + Tx0 ,T (f ).

Em particular, tomando f = ϕx′0 , deduzimos que:

ϕx′0 ,T = x′0 − x0 + Tx0 ,T (ϕx0 ,T ) e portanto ∥ϕx′0 ,T − Tx0 ,T (ϕx′0 ,T )∥∞, T = ∥x0 − x′0 ∥V .

A equação (15.1) então garante que

∥ϕx0 (t) − ϕx′0 (t)∥V = ∥ϕx0 ,T (t) − ϕx′0 ,T (t)∥V ≤ ∥ϕx0 ,T − ϕx′0 ,T ∥∞,T ≤ eLT ∥x0 − x′0 ∥V .

13.4.2 Suavidade da solução


Nesta seção, consideraremos em mais detalhes o que acontece com a função que associa a
cada x0 ∈ V a solução ϕx0 . Aqui nos restringiremos ao caso em que V = Rd por razões que
ficarão claras ao longo das provas. Suporemos ainda que ψ : R × Rd → Rd é L-Lipschitz
na variável espacial e também que C ℓ para algum ℓ ≥ 1.

denciasuave Teorema 13.6 Sob as hipóteses acima, temos que, para cada T > 0, a função ST : Rd →
C([−T, T ], Rd ) que associa a cada x0 ∈ Rd a função ϕx0 ,T ∈ CT é C ℓ .

Exercício 13.7 Antes de provar o Teorema, mostre que ele implica que a função levando (t, x0 ) ∈
R × Rd ∼
= Rd+1 em ϕx0 (t) é C ℓ .

Prova: Como na prova anterior, escrevemos CT := C([−T, T ], Rd ) e definimos Tx0 ,T : CT →


CT . Também pela prova anterior, sabemos que existe um k ∈ N tal que Txk0 ,T é Lipschitz
com constante ≤ (LT )k /k! ≤ 1/2. Sob esta hipótese, sabemos que Txk0 ,T tem um único

236
ponto fixo; como ϕx0 ,T é ponto fixo de Tx0 ,T , deduzimos que o único ponto fixo de Txk0 ,T é
ϕx0 ,T . Definimos uma função:
H T : R d × CT → CT
que leva um par (x0 , f ) ∈ Rd × CT em f − Txk0 ,T (f ). Pela observação sobre pontos fixos
acima, sabemos que:
{(x0 , ST (x0 )) : x0 ∈ Rd } = {(x0 , ϕx0 ,T ) ∈ x0 ∈ Rd } = HT−1 (0CT ).
O que desejamos mostrar é que ST é C ℓ . Para mostrar isso, usaremos o Teorema da
Função Implícita. Mostraremos que, dado qualquer x0 ∈ Rd , existem uma vizinhança
aberta U0 ⊂ Rd × CT de (x0 , ST (x0 )), uma vizinhança aberta A0 ⊂ Rd de x0 e uma função
g : A0 → CT de classe C ℓ tais que:
HT−1 (0CT ) ∩ U0 = {(x, g(x)) : x ∈ A0 }.
Por que isso implica que ST é C ℓ ? Comparando a última identidade com a nossa descrição
anterior de HT−1 (0CT ), vemos que:
∀x ∈ A0 : ST (x) = g(x);
portanto ST é C ℓ em A0 . Ou seja: todo ponto x0 ∈ Rd tem uma vizinhança aberta A0 onde
ST é C ℓ . É fácil ver que isso implica que ST é C ℓ .
Como exatamente aplicaremos o Teorema da Função Implícita? Tomaremos Φ = HT ,
V = Rd , W = CT e U = V × W . Para terminar nossa prova, precisamos mostrar que HT é
C ℓ e que D2 HT (x, f ) é inversível para quaisquer x e f .
Começamos mostrando que HT é C ℓ . Veja que HT é a diferença de termos f e Txk0 ,T (f ).
O primeiro é linear e portanto C ∞ . O segundo pode ser escrito como:
H(x0 , H(x0 , . . . , H(x0 , f ) . . . )) k vezes
| {z }
onde H(x0 , f ) := Tx0 ,T (f ) = x0 + T0,T (f ). Esta função U (x0 , f ) é a soma de uma função
linear em x0 (que não depende de f ) e outra que sabemos ser C ℓ em f (pelo Exercício 12.12
acima). É fácil ver que U é C ℓ e que sua derivada é:
DH(x0 , f ) (hx , hf ) = hx + DT0,T (f ) hf ((hx , hf ) ∈ Rd × CT ).
Note-se que foi só neste passo que usamos o fato de que sabemos diferenciar Tx0 ,T ; aqui
a dimensão finita de Rd foi usada para garantir, lá no Exercício 12.12, que Dx ψ fosse
uniformemente contínua sobre conjuntos fechados e limitados (que são compactos em
Rd mas não em geral). De qualquer modo, o exercício abaixo mostra que HT (x0 , f ) =
f − H(x0 , H(x0 , . . . , H(x0 , f ) . . . )) também é C ℓ .
Exercício 13.8 Suponha que H : V × W → W é dada, com (V, ∥ · ∥V ) e (W, ∥ · ∥W ) espaços
vetoriais normados. Mostre que, se H é C ℓ , a função M que leva (v, w) ∈ Rd × V em (v, H(v, w))
também é C ℓ . Deduza disto que M k é C ℓ e explique o que isso tem a ver com
H(x0 , H(x0 , . . . , H(x0 , f ) . . . )) k vezes.
| {z }

237
Agora temos que mostrar que D2 HT (x0 , f ) é inversível em todo ponto. Observamos
que, para qualquer hf ∈ CT ,

D2 HT (x0 , f ) hf = DHT (x0 , f ) (0Rd , hf )


hf − (Txk0 ,T (f + εhf ) − Txk0 ,f (f ))
= lim
ε→0 ε
= hf − D(Txk0 ,T (f )) hf .

Ou seja, D2 HT (x0 , f ) = IdCT − D(Txk0 ,T (f )) onde a derivada no segundo termos é em


f e não em x0 (de fato, D(Txk0 ,T (f )) = D(T0,T k
(f ))). Como IdCT + H é inversível para
qualquer H ∈ L(CT ) com norma menor que 1, podemos concluir a prova mostrando que
∥D(Txk0 ,T (f ))∥Ct →CT < 1 em todo ponto (x0 , f ). Mas isso vem da condição de Lipschitz:
nós escolhemos k de modo a termos ∥Txk0 ,T ∥Lip ≤ 1/2. Ao mesmo tempo, o Exercício 11.12
nos diz que:
1
sup ∥D(Txk0 ,T ∥CT →CT = ∥Txk0 ,T ∥Lip ≤ .
(x0 ,f )∈Rd ×CT 2

Concluímos que IdCT − D(Txk0 ,T (f )) é mesmo inversível, o que encerra a prova. 2

13.5 Mais exercicios


Exercício 13.9 Prove o seguinte corolário do Teorema da Função Inversa: dados (V, ∥ · ∥V )
Banach e U ⊂ V aberto, se f : U → V é de classe C ℓ , injetiva e tem derivada inversível em
todo ponto, então f é um difeomorfismo C ℓ entre U e f (U ) (em particular, f (U ) é aberto).

Exercício 13.10 Suponha que f : U → Rd é uma função C 1 com derivada inversível


em todo ponto. Tome C ⊂ Rd aberto, conexo e limitado com C ⊂ U . Supondo que
f (∂C) ⊂ Rd \C, mostre que ou f (C) ⊃ C, ou f (C) ∩ C = ∅. Dito de outro modo: se f (C)
atinge algum ponto de C e ao mesmo tempo manda a fronteira de C para fora do conjunto,
então f (C) ⊃ C (é divertido tentar visualizar este fato).

Exercício 13.11 (Estabilidade dos zeros de uma função) Considere (V, ∥·∥V ) Banach, U ⊂
V aberto e F : U → V diferenciável com ∥DF ∥Lip =: L ∈ R+ (isto é, ∥DF (x) −
DF (x′ )∥V →V ≤ L∥x − x′ ∥V para todos x, x′ ∈ U ). Suponha ainda que x⋆ ∈ U é dado,
F (x⋆ ) = 0V e DF (x⋆ ) é inversível, com ∥DF (x⋆ )−1 ∥V →V ≤ κ < +∞. Mostre que existem
r, ε > 0 dependendo apenas de d(x⋆ , U c ) e dos parâmetros L, κ tais que BV [x⋆ , r] ⊂ U e
toda função G : U → V com

sup ∥G(x) − F (x)∥V ≤ ε e sup ∥DG(x) − DF (x)∥V →V ≤ ε


x∈BV [x⋆ ,r] x∈BV [x⋆ ,r]

tem algum ponto x′⋆ ∈ BV [x′⋆ , r] com G(x′⋆ ) = 0V .

238
Exercício 13.12 (Convergência local do método de Newton) Considere F : U → V de
classe C 1 (com (V, ∥ · ∥V ) Banach e U ⊂ V aberto). Suponha que x⋆ ∈ F satisfaz F (x⋆ ) = 0V
com DF (x⋆ ) inversível. Mostre que existe um r > 0 tal que, se x0 ∈ BV (x⋆ , r) ⊂ U , então
podemos definir uma sequência {xn }n∈N via:

xn := xn−1 − DF (xn−1 )−1 F (xn−1 ) (n ∈ N\{0})

e garantir que
lim ∥xn − x⋆ ∥V = 0.
n→+∞

Supondo agora que F satisfaz as hipóteses do exercício anterior, mostre que podemos
escolher r de modo que, se x0 ∈ BV [x⋆ , r],
 2
∥xn−1 − x⋆ ∥V
∀n ∈ N\{0} : ∥xn − x⋆ ∥V ≤
2r

e deduza que ∥xn − x⋆ ∥ ≤ 2−(2 . (Ou seja, temos uma convergência extremamente
n −1)

rápida de xn a x⋆ .)

Exercício 13.13 (Uma forma invariante por coordenadas do Teorema da Função Implícita)
Neste problema identificamos Rd+k ∼ = Rd ×Rk da maneira usual. U ⊂ Rd+k é aberto, a0 ∈ U ,
f : U → Rk é C ℓ com f (a0 ) = c e, por fim, Df (a0 ) ∈ L(Rd+k , Rk ) é sobrejetiva.

1. Mostre que existe S ⊂ Rd+k de dimensão k tal que Df (a0 ) |S é bijetiva.

2. Prove que existe uma transformação linear inversível R : Rd × Rk → Rd+k que leva
{0Rd } × Rk em S.

3. Tomando Ũ := R−1 U ⊂ Rd × Rk , (x0 , y0 ) = R−1 a0 e Φ := f ◦ R, mostre que Φ é C ℓ e


satisfaz as hipóteses do Teorema da Função Implícita na versão que provamos. (O
ponto fundamental é provar que D2 Φ(x0 , y0 ) é inversível porque Df (a0 ) |S é bijeção.)

4. Deduza que existe um aberto U0 ⊂ U com a0 ∈ U0 tal que:

f −1 (c) ∩ U0 = {R (a, g(a)) : a ∈ A}

onde A é aberto de Rd e g : A → Rk é C ℓ . Portanto, f −1 (c) é localmente o gráfico de


uma função, a menos de uma mudança de coordenadas descrita por R.

Exercício 13.14 (Estabilidade dos autovalores simples de uma matriz) Lembre-se que o
polinômio característico de uma matriz A ∈ Rd×d é

pA (t) := det(A − tI) (t ∈ R).

Um λ ∈ R é dito autovalor simples de A se pA (λ) = 0 (o que significa que A − λI tem núcleo


não-trivial), mas p′A (λ) ̸= 0.

239
1. Prove que, se A0 ∈ Rd×d e λ0 ∈ R é autovalor simples de A0 , então existem ε > 0
e Λλ0 : BRd×d (A0 , ε) → R de classe C ∞ tais quequalquer Λλ0 (A0 ) = λ0 e Λλ0 (A) é
autovalor simples de A para qualquer A ∈ BRd×d (A0 , ε).

2. Deduza do resultado acima o seguinte fato: o conjunto U ⊂ Rd×d de matrizes com


d autovalores reais, simples e distintos é aberto. Além disso, se a cada A ∈ U
associamos seus autovalores λ1 (A) > λ2 (A) > · · · > λd (A), a função que leva A no
vetor (λi (A))di=1 é C ∞ .

Exercício 13.15 Usando a notação do Teorema 13.6, vamos tentar imaginar como deveria
ser a derivada em x0 de ST (x0 ) := ϕx0 . De fato, veja que esperamos que, com alguma
sorte, para h ≈ 0,
d d
(DS(x0 ) h)(t) ≈ (ϕx0 +h (t) − ϕx0 (t))
dt dt
e ao mesmo tempo

ψ(t, ϕx0 +h (t)) − ψ(t, ϕx0 (t)) ≈ Dx ψ(t, ϕx0 (t)) [(DS(x0 ) h)(t)].

Como ainda temos a relação

d
(ϕx +h (t) − ϕx0 (t)) = ψ(t, ϕx0 +h (t)) − ψ(t, ϕx0 (t))
dt 0
e sabemos S(x0 + h)(0) − S(x0 )(0) = h, é de se esperar que ξx0 ,h := (DS(x0 ) h) ∈ CT seja a
solução da EDO linearizada

ξx′ 0 ,h (t) = Dx ψ(t, S(x0 )(t)) ξx0 ,h (t)

com condição inicial ξx0 ,h (0) = h. Prove que esta fórmula é válida sob as hipóteses do
Teorema 13.6 (em particular, pode ajudar se você encontrar explicitamente a derivada da
função ST ).

240
Capítulo 14

Esboço da teoria de subvariedades de Rd

Neste capítulo aplicaremos os Teoremas da Função Inversa e Implícita para estudar a


estrutura de subvariedades do Rd .
Definição 14.1 Uma subvariedade m-dimensional do Rd de classe C ℓ é um subconjunto M ⊂ Rd
munido de um atlas, isto é, de uma coleção:
{(fα , Uα , Aα )}α∈I
onde cada Aα é aberto de Rd , com M ⊂ ∪α∈I Aα ; cada Uα é aberto de Rm ; e cada fα : Uα →
M ∩ Aα ⊂ Rd é um homeomorfismo e, além disso, uma função C ℓ com Dfα (x) injetiva para cada
xα ∈ Uα . Cada trio (fα , Uα , Aα ) é chamado de carta local de M . Às vezes usaremos a notação
M m para indicar que M tem dimensão m.
Portanto, uma subvariedade é, numa primeira aproximação, um subconjunto do Rd
que “localmente se parece com Rm até a ℓ-ésima derivada". Neste capítulo, buscaremos
responder a algumas perguntas simples sobre estes conjuntos.
1. Como é a estrutura local de uma subvariedade? (Mais precisamente, estudaremos
os conjuntos de vetores tangentes a uma subvariedade.)
2. Como podemos verificar se um conjunto é subvariedade ou não?
3. Como podemos definir a diferenciabilidade de funções f : M → N , onde M e N são
variedades?
A principal observação que faremos é que as propriedades interessantes de uma sub-
variedade são todas intrínsecas, isto é, não dependem do atlas escolhido. Isso permite o
desenvolvimento de uma teoria abstrata de variedades, que não estudaremos aqui.

14.1 Os dois primeiros exemplos


Para começar nosso estudo, apresentamos duas famílias de exemplos simples de subvari-
edade de Rd .

241
14.1.1 Abertos de Rd
Este primeiro exemplo é realmente simples: consideramos um aberto A ⊂ Rd e mostramos
que ele é uma subvariedade C ∞ de dimensão d. De fato, o atlas deste aberto tem um único
elemento (Id×d , A, A), onde Id×d é a função identidade.

14.1.2 Gráficos de funções


O próximo exemplo é um pouco menos simples. Considere um aberto U ⊂ Rm e uma
função g : U → Rk de classe C ℓ . Chamando de d = k + m, definimos o gráfico de g como
sendo:
graph(g) := {(x, g(x)) : x ∈ U } ⊂ Rd .
Abaixo mostraremos que todo gráfico de função como acima é subvariedade. Mais
adiante ficará claro que a recíproca é quase verdadeira: toda subvariedade é localmente
um gráfico de função, a menos de uma troca de sistema de coordenadas.

Proposição 14.1 graph(g) ⊂ Rd é uma subvariedade m-dimensional de Rd de classe C ℓ .

Prova: [Esboço] Para provar esta proposição, precisamos construir um atlas. Isso é bastante
simples e nosso atlas só terá uma tripla (f, U, A). Podemos tomar A = Rd e definir:

f : x ∈ U 7→ (x, g(x)).

Claramente, f é C ℓ . Sua derivada é Df (x) = I × Dg(x), que é injetiva porque é “injetiva


na primeira coordenada". Além disso, f é contínua e sua inversa é:

f −1 : (x, y) ∈ graph(g) 7→ x,

que é uma contração (e portanto é contínua). Logo f é um homeomorfismo entre U e


graph(g) = graph(g) ∩ A. 2

14.2 Parametrizações que viram difeomorfismos


O exemplo de grafos de funções foi especialmente simples. Para lidar com situações mais
complicadas, precisaremos de um resultado intermediário muito importante1. Ele será
enunciado em termos de uma definição um pouco mais geral.

Definição 14.2 Dados um conjunto M ⊂ Rd e um ponto p ∈ M , uma parametrização C ℓ de M


por Rm ao redor de p é uma tripla (f, U, A) onde A ⊂ Rd é aberto com p ∈ A, U ⊂ Rm é aberto e
f : U → A ∩ M é um homeomorfismo C ℓ com derivada injetiva.
1Esta é essencialmente a “forma local das imersões".

242
Deste modo, uma subvariedade de Rd de dimensão m e classe C ℓ é um conjunto de Rd
em que, para quaquer p ∈ M , há uma parametrização C ℓ de M por Rm ao redor de p. No
entanto, um conjunto que não é subvariedade pode ter parametrizações como definidas
acima ao redor de alguns (mas não todos) seus pontos.

Exercício 14.1 Desenhe um exemplo de M ⊂ R3 que tem parametrizações por R1 ao redor de


alguns pontos e por R2 ao redor de outros.

O enunciado abaixo é um bocado técnico, mas sua ideia é simples:

Princípio geral: quando parametrizamos uma subvariedade na vizinhança de


um ponto p ∈ M por um aberto U ⊂ Rm , podemos “adicionar coordenadas" a
esta parametrização de modo a parametrizar todo um aberto de Rd contendo p.
A parametrização original é recuperada tomando as d − m coordenadas extras
iguais a 0.

Na verdade, o princípio geral acima não é completamente fidedigno à proposição. Ele


omite o fato que, além de acrescentar coordenadas, é necessário reduzir o domínio de M
parametrizado. Este tipo de tecnicalidade será comum abaixo e em todos os resultados
que estudaremos. No fundo, elas vêm do fato que os Teoremas das Funções Inversa e
Implícita têm o mesmo problema.

:atlasdifeo Proposição 14.2 Dados um conjunto M ⊂ Rd , um ponto p ∈ M , uma parametrização C ℓ de M


por Rm ao redor de p, (f, U, A), podemos encontrar uma outra tripla (Fp , Bp , Ap ) com as seguintes
propriedades:
• Ap ⊂ A é aberto de Rd com p ∈ Ap ;

• Bp ⊂ Rm × Rd−m ≈ Rd é uma vizinhança aberta de (xp , 0Rd−m ), onde xp := f −1 (p) ∈ U ;

• temos também:

∀x ∈ Rm : (x, 0Rm−d ) ∈ Bp ⇒ x ∈ U e Fp (x, 0Rd−m ) = f (x)

• Fp : Bp → Ap é um difeomorfismo C ℓ

• finalmente,
M ∩ Ap = {Fp (x, 0Rm−d ) : (x, 0Rm−d ) ∈ Bp }.

Prova: Como Df (xp ) é injetiva, a imagem de Df (xp ) é um subespaço T ⊂ Rd de dimensão


m.
Chame de T ⊥ o complemento ortogonal de T . Tome uma base ortonormal v1 , . . . , vd−m
de T ⊥ . Definimos uma transformação linear R : Rd−m → Rd via:
d−m
X
R y := y[i] vi (y ∈ Rd−m ).
i=1

243
Note que R é injetiva: de fato, R y = 0Rd implica que cada coordenada de y é 0 (afinal, os
vi são linearmente independentes). Além disso, R y ∈ T ⊥ para todo y ∈ Rd−m .
Definimos F̃p : U × Rd−m → Rd como sendo a função que leva (x, y) ∈ U × Rd−m em
F̃p (x, y) = f (x) + R y. F̃p é C ℓ porque é a soma de uma função C ℓ com outra linear. Pode-se
verificar que a derivada DF̃p (x, y) aplicada a h = (hx , hy ) ∈ Rm × Rd−m é igual a:

DF̃p (x, y) (hx , hy ) = Df (x) hx + R hy .

Queremos aplicar o Teorema da Função Inversa a F̃p em uma vizinhança de (xp , 0Rd−m ).
Para isso, precisamos mostrar que vale a seguinte afirmação.

Afirmação: a derivada DF̃p (xp , 0Rd−m ) é inversível.

De fato, como DF̃p (x, y) ∈ L(Rm × Rd−m , Rd ) é uma aplicação linear entre espaços com
a mesma dimensão finita, só precisamos mostrar que DF̃p (xp , 0Rd−m ) é injetiva, o que é o
mesmo que mostrar que seu núcleo é {(0Rm , 0Rd−m )}.
Para isso, recordamos que Df (xp ) hx ∈ T e R hy ∈ T ⊥ são ortogonais e que a soma de
dois vetores ortogonais só se anula quando ambos são nulos. Desta forma, se (hx , hy ) está
no núcleo da derivada:

0Rd = DF̃p (xp , 0Rd−m ) (hx , hy ) = Df (xp ) hx + R hy ⇒ Df (xp ) hx = 0Rd e R hy = 0Rd .

Como tanto Df (xp ) quanto R são injetivas, deduzimos que hx = 0Rm e hy = 0Rd−m , o que
prova a afirmação.
De posse da afirmação, deduzimos do Teorema da Função Implícita que existe um
difeomorfismo C ℓ F̃p : Lp → Cp entre vizinhanças abertas Lp ⊂ U ×Rd−m , com (xp , 0Rd−m ) ∈
Lp , e Cp ∋ p. Por construção, Fp (xp , 0Rd−m ) = f (x) ∈ M ∩ Cp sempre que (x, 0Rd−m ) ∈ Lp .
Reduzindo Cp e Lp , se necessário, podemos garantir que Cp ⊂ A (basta intersectar Cp com
A, notando que p ∈ Cp ∩ A, e trocar Lp por F̃p−1 (Cp ∩ A), que é um aberto).
Neste ponto, já temos quase tudo que queremos. Poderíamos tentar tomar Bp = Lp ,
Ap = Cp e Fp = F̃p e declarar a prova encerrada. Vale um aviso.

Ainda falta alguma coisa!

A questão é que ainda não sabemos se os pontos de M ∩ Cp são exatamente aqueles que
têm a forma F̃p (x, 0Rm−d ) para (x, 0Rm−d ) ∈ Lp . Ou seja, poderia existir um ponto q ∈ M ∩Cp
que não é da forma q = F̃p (x, 0Rd−m ).
Para evitar esse problema, vamos reduzir um pouco os conjuntos Lp e Cp . Basicamente
a ideia é tomar um Ap ⊂ Cp que é o menor possível para conter f (Zp ), onde Zp é o conjunto
abaixo.
Zp := {x ∈ Rm : (x, 0Rd−m ) ∈ Lp }.
Será importante entender algumas propriedades deste conjunto. Em primeiro lugar,
Zp é aberto de Rm porque Lp é aberto de Rd . Além disso, Zp ⊂ U porque Zp × {0Rd−m } ⊂
Lp ⊂ U × Rd−m .

244
Recorde que f : U → A ∩ M é homeomorfismo. Como Zp é aberto de Rm , ele também
é um aberto relativo de U . Desta maneira, f (Zp ) é um aberto relativo de M ; ou seja, existe
um conjunto Z̃ ⊂ Rd aberto de Rd com f (Zp ) = M ∩ Z̃. Além disso, como Z ×{0Rd−m } ⊂ Lp ,

Z̃ ∩ M = f (Zp ) = F̃p (Zp × {0Rd−m }) ⊂ F̃p (Lp ) = Cp ,

portanto:
f (Zp ) = M ∩ (Z̃ ∩ Cp ).

Podemos finalmente definir Ap := Z̃ ∩ Cp , notando que M ∩ Ap = M ∩ Z̃ = f (Zp ). Para


que tudo dê certo, também tomamos Bp := F̃p−1 (Ap ) e Fp := F̃p |Bp .
Checaremos a seguir que as propriedades de fp , Bp e Ap enumerada pelo Teorema
são todas verdadeiras. Para começar, Ap é aberto de Rd porque é a interseção de dois
abertos Z̃ e Cp . Bp também é aberto (de Lp e portanto de Rd ) porque é preimagem de
um aberto por uma função contínua. Fp é difeomorfismo C ℓ porque F̃p o é. Claramente,
Fp (x, 0Rd−m ) = f (x) sempre que (x, 0Rd−m ) ∈ Bp .
Tudo que falta agora é verificar que

Queremos: M ∩ Ap := {f (x) : (x, 0Rd−m ) ∈ Bp } = {Fp (x, 0Rd−m ) : (x, 0Rd−m ) ∈ Bp }.

De fato, já sabemos que M ∩ Ap = f (Zp ) = F (Zp × {0Rd−m )). Basta então mostrar que

Queremos (equivalente): Zp × {0Rd−m } = {(x, y) ∈ Bp : y = 0Rd−m }.

Faremos isso provando inclusões nas duas direções.

Prova de que Zp × {0Rd−m } ⊂ {(x, y) ∈ Bp : y = 0Rd−m }

Isto é equivalente a mostrar que Zp × {0Rd−m } ⊂ Bp . Para isso, basta observar que:

Zp × {0Rd−m } ⊂ Lp ⇒ F̃p (Zp × {0Rd−m }) = f (Zp ) ⊂ Ap ⇒ Zp × {0Rd−m } ⊂ F̃p−1 (Ap ) = Bp .

Prova de que Zp × {0Rd−m } ⊃ {(x, y) ∈ Bp : y = 0Rd−m }.

Fixe um ponto arbitrário (x, 0Rd−m ) ∈ Bp . Temos Fp (x, 0Rd−m ) ∈ Fp (Bp ) = Ap . Ao


mesmo tempo,
Fp (x, 0Rd−m ) = f (x) ∈ M.

Portanto,
Fp (x, 0Rd−m ) ∈ M ∩ Ap = f (Zp ) = F (Zp × {0Rd−m }).

Como Fp é bijeção, deduzimos (x, 0Rd−m ) ∈ Zp × {0Rd−m }. 2

245
14.3 O espaço tangente e a dimensão
Agora o nosso propósito será explicar como é o chamado espaço tangente de uma variedade.
Primeiro temos uma definição geral.
Definição 14.3 Considere um conjunto M ⊂ Rd . O espaço tangente de M em p ∈ M , denotado
por Tp M , é o conjunto de todos os vetores γ ′ (0), onde γ : (−ε, ε) → M é uma curva parametrizada
(contínua) que é diferenciável na origem e satisfaz γ(0) = p.
Esta definição é puramente geométrica e não tem nada a ver com variedades: dado
qualquer conjunto M , Tp M é definido. Note que 0Rd ∈ Tp M sempre, porque podemos
tomar γ(t) ≡ p. Em alguns outros casos, o espaço tangente pode conter apenas este vetor,
ou conter todos os vetores.
p
Exercício 14.2 Considere o cone C := {x ∈ R3 : x[3] = 1 − x[1]2 + x[2]2 }. Mostre que e3 ∈ C
e que Te3 M = {0R3 }.
Exercício 14.3 Tome M ⊂ Rd qualquer. Mostre que Tp M = Rd para todo p ∈ M o (isto é, todo p
que é ponto interior de M ).
O que as subvariedades têm de especial é que, para todas elas, o espaço tangente é um
subespaço vetorial de Rd que tem dimensão igual à da subvariedade M .
teo:TpM Teorema 14.1 Considere um conjunto M ⊂ Rd e p ∈ M . Suponha que M tem uma parametri-
zação (f, U, A) por Rm e de classe C ℓ ao redor de p. Chame de xp = f −1 (p). Então
Tp M = ran Df (xp ).
Como corolário, Tp M é um subespaço vetorial de Rd com dimensão m.
Uma consequência importante deste teorema é que, quando M é uma subvariedade C ℓ
de dimensão m, a dimensão de M não depende do atlas escolhido. Se tomarmos dois atlas para
a mesma variedade, eles têm de “concordar sobre as dimensões do espaço tangente" e
portanto sobre a dimensão de M . Esta é a primeira manifestação de fenômenos intrínsecos
na teoria de subvariedades.
Prova: [Prova do Teorema 14.1] A prova deste teorema tem uma direção fácil, outra difícil
e o corolário no final.
Direção fácil: Tp M ⊃ ranDf (x).
Tome v ∈ ranDf (x) arbitrário; nosso objetivo é mostrar que v ∈ Tp M , isto é, que há
uma curva γ : (−ε, ε) → M com γ(0) = p e γ ′ (0) = v.
Para fazer isso, tome uma pré-imagem w ∈ Rm de v sob Df (x): ou seja, escolha w ∈ Rm
com Df (x) w = v. Tome a curva η(t) := xp + t w e observe que, se |t| < ε, com ε pequeno
o suficiente, η(t) ∈ U . Desta forma, podemos definir γ(t) := f (xp + t w) para t ∈ (−ε, ε).
Isto garante γ(0) = p. Também podemos obter pela regra da cadeia que
γ ′ (0) = Df (xp ) η ′ (0) = Df (xp ) w = v,
como queríamos.

246
Direção difícil: Tp M ⊂ ranDf (x).

Ou seja, temos que mostrar que, se há γ : (−ε, ε) → M contínua com γ(0) = p, γ ′ (0) = v,
então há um w ∈ Rm com Df (xp ) w = v.
Para isso, será fundamental usarmos a Proposição 14.2. Por hipótese, (f, U, A) é uma
parametrização C ℓ de M por Rm ao redor de p. Desta forma, a proposição nos diz que
existem abertos Bp ∋ (xp , 0Rd−m ) com Bp ⊂ U × Rd−m , e Ap ⊂ A ⊂ Rd , além de um
difeomorfismo C ℓ Fp : Bp → Ap , tais que:

∀(x, 0Rd−m ) ∈ Bp : Fp (x, 0Rd−m ) = f (x) e M ∩ Ap = {Fp (x, 0Rd−m ) : (x, 0Rd−m ) ∈ Bp }.

Chame de η(t) := Fp−1 ◦γ(t). Em princípio, η(t) só está definida para aqueles t ∈ (−ε, ε)
tais que γ(t) ∈ Ap . No entanto, como γ(0) = p ∈ Ap e Ap é aberto, podemos reduzir ε
se necessário para garantir que γ(t) ∈ Ap sempre que t ∈ (−ε, ε). De fato, suporemos a
seguir que esta troca de ε já foi feita.
Agora observe duas coisas. Em primeiro lugar, η é diferenciável em t = 0 porque Fp−1
e γ são diferenciáveis. Além disso – e esse é o principal ponto – como γ(t) ∈ M ∩ Ap , a
proposição garante que

∀t ∈ (−ε, ε) ∃ηm (t) ∈ Rm : (ηm (t), 0Rd−m ) ∈ Bp e η(t) = Fp−1 (γ(t)) = (ηm (t), 0Rd−m ).

Esta ηm é dada pela projeção de η nas m primeiras coordenadas. Em particular, o


fato de que η é diferenciável t = 0 implica que ηm também é diferenciável. Mais ainda,
ηm (0) = f −1 (p) = xp
Novamente usando as propriedades de Fp , temos que:

γ(t) = Fp ◦ η(t) = Fp (ηm (t), 0Rd−m ) = f (ηm (t)),

e pela regra da cadeia


γ ′ (0) = v = Df (xp ) ηm

(0).
Ou seja, o vetor que procurávamos é w := ηm

(0).

Sobre o corolário.

Df (xp ) ∈ L(Rm , Rd ). Como Df (xp ) é injetiva, ran Df (xp ) é um subespaço de dimensão


m de Rd . Logo, o mesmo vale para o espaço tangente. 2

14.4 Subvariedades definidas implicitamente


Os resultados que já vimos nos mostram algumas propriedades boas da definição de
subvariedade. Por outro lado, é muito difícil usar estas propriedades para provar que
um dado subconjunto de Rd é de fato uma subvariedade. Nesta seção, mostraremos que
certos conjuntos-solução de equações não-lineares são subvariedades de Rd , contanto que
a derivada seja não-degenerada neles. Mais exatamente, usaremos a definição a seguir.

247
Definição 14.4 Dadas Φ : U ⊂ Rd → Rk diferenciável, dizemos que c ∈ Rk é valor regular de
Φ se para todo x ∈ Φ−1 (c) a derivada DΦ(x) é sobrejetiva.

Nosso principal teorema nesta seção será que as imagens inversas de valores regulares
são sempre subvariedades de Rd . Mais ainda: o teorema nos diz como é o espaço tangente
da subvariedade.

deimplicita Teorema 14.2 Suponha que Φ : U ⊂ Rd → Rk C ℓ e que M := Φ−1 (c) ̸= ∅, onde c é um valor
regular de Φ. Defina m = d − k. Então M é uma subvariedade m-dimensional de Rd de classe C ℓ .
Em cada p ∈ M ,
Tp M = ker DΦ(p).

Vamos tentar uma expressão mais concreta. Sejam Φ[i] : U → R, 1 ≤ i ≤ k, as k


coordenadas de Φ. O conjunto M é precisamente o conjunto de soluções do seguinte
sistema de equações não-lineares:


 Φ[1](x) = c[1]
Φ[2](x) = c[2]


 ...
Φ[k](x) = c[k]

Vamos agora pensar como é este conjunto na vizinhança de um p ∈ M . Em primeiro lugar,


veja que  
∇Φ[1](p) · h
 ∇Φ[2](p) · h 
∀h ∈ Rd : DΦ(p) h =  .
 ... 
(k)
∇Φ (p) · h
Portanto, se x = p + h com h ≈ 0,

x ∈ M ⇔ Φ(p + h) = Φ(p) = c ⇔ DΦ(p) h ≈ 0Rk ⇔ ∇Φ[i](p) · h ≈ 0, 1 ≤ i ≤ k.

Agora repare que DΦ(p) é sobrejetiva se e somente se o posto – isto é, o número de colunas
linearmente independentes de DΦ(p) – é igual a k. Como sabemos, o posto também é
igual ao número de linhas l.i. de DΦ(p). Portanto, pedir que DΦ(p) seja sobrejetiva é o
mesmo que pedir a seguinte condição:

os gradientes ∇Φ[1](p), ∇Φ[i](p), . . . , ∇Φ[k](p) são linearmente independentes.

Neste caso, o conjunto

ker DΦ(p) = ∩ki=1 {y ∈ Rd : ∇Φ[i](p) · y = 0}

tem dimensão d − k. Como M se parece com este conjunto localmente, segue que ela deve
ser uma subvariedade de dimensão (d − k).
Provaremos o teorema abaixo, mas é tão ou mais importante entender suas aplicações
antes de seguir.

248
14.4.1 Exemplos de subvariedades definidas implicitamente
Exemplo 14.1 (Hiperplanos e subespaços) Se a1 , . . . , ak ∈ Rd são vetores l.i. e c[1], . . . , c(k) ∈
R, a teoria geral de Álgebra Linear nos diz que o sistema

x · ai = c[i], 1 ≤ i ≤ k

tem infinitas soluções, que (a menos de uma translação) formam um subespaço vetorial de dimensão
(d − k). Este é um caso particular de nosso teorema quando Φ(x) = (ai · x)ki=1 .

Exemplo 14.2 (Esferas e elipsóides) Outro exemplo é quando x0 ∈ Rd , r > 0 e A ∈ L(Rd )


inversível são dados e definimos:

M := {x ∈ Rd : |A(x − x0 )|22 = r2 }.

Este é um elipsóde que (a menos de rotação dos eixos) tem a forma:


d
X
M := {x ∈ Rd : λi (x[i] − x0 [i])2 = r2 }.
i=1

(Os λi são os autovalores de AT A, que são positivos porque A é inversível.) O fato de


que M é variedade de dimensão d − 1 segue de se aplicar os critérios do teorema a
Ψ(x) := |A(x − x0 )|22 .
2
Exemplo 14.3 (O grupo ortogonal O(d)) O espaço Rd×d pode ser pensado como o Rd escrito
de outra forma. Com esta ideia, o conjunto das matrizes ortogonais d × d é definido por:

O(d) := {A ∈ Rd×d : AT A = I}.

Para interpretar esta equação e calcular a dimensão de O(d), é conveniente definirmos:

simm := {matrizes d × d simétricas}.


Rd×d

Este é um subespaço vetorial de Rd×d com dimensão d(d + 1)/2 (exercício!). Portanto, a
função
d×d
Ψ : Rd×d → RSym
que leva A ∈ Rd×d em Ψ(A) := AT A pode ser pensada como uma função de d2 dimensões
em d(d + 1)/2 dimensões. Portanto, se O(d) for variedade, ele tem dimensão d(d − 1)/2.
Para ver que isso é verdade, checaremos que Ψ é suave e tem derivada sobrejetiva em
todo ponto A ∈ O(d) = Ψ−1 (I). A suavidade é trivial se percebemos que a função Ψ é um
polinômio nas entradas de A.
Quando à injetividade da derivada, veja em primeiro lugar que:
d×d
∀A, H ∈ Rd×d : DΨ(A) H = H T A + AT H ∈ RSym .

249
Se A ∈ O(d), então A−1 = AT e em particular A é inversível.
Para mostrarmos que DΨ(A) é injetiva devemos provar que, para cada A ∈ O(d) e cada
Sym há uma matriz H com A H + H A = M . Para isso, tome H = AM/2 e veja
M ∈ Rd×d T T

que, como M = M T :

DΨ(A) H = AT (AM/2) + (AM/2)T A = M.

Isto conclui a prova e ainda nos dá uma fórmula para calcular o espaço tangente. Por
exemplo:
TI O(d) = {H ∈ Rd×d : H = −H T }
é o espaço das matrizes d × d antissimétricas.

14.4.2 Um resultado intermediário


Obviamente, a prova do Teorema 14.2 deverá seguir de alguma forma do Teorema da
Função Implícita. Lembre que aquele teorema diz que, se Φ : U ⊂ Rm × Rd−m → Rd−m ,
então, sob certas hipóteses, podemos escrever Φ−1 (c) localmente como o gráfico de uma
função de Rm em Rd−m . Isto é, as d − m últimas coordenadas de um ponto em Φ−1 (c) são
escritas em função das m primeiras.
Este resultado claramente não se aplica a algumas das subvariedades que queremos
descrever. Por exemplo, na esfera Sd−1 ⊂ Rd , se tomamos uma vizinhança do ponto e1 ,
a última coordenada não pode ser escrita em função das d − 1 primeiras: de fato, se p
está perto de e1 e trocamos o sinal da última coordenada, temos em um ponto distinto e
também próximo de e1 .
O que precisamos, então, é estudar uma forma do Teorema da Função Implícita em que
este problema não apareça. Para isso, devemos admitir mudanças de sistemas de coordenadas.
Mais exatamente, exprimiremos Φ−1 (c) como o gráfico de uma função entre o núcleo de
DΦ(p) e seu complemento ortogonal. O lema abaixo diz basicamente isso.

tacoordfree Lema 14.1 Considere Φ : U ⊂ Rd ⊂ Rk , M = Φ−1 (c) e m = d − k como no Teorema 14.2. Tome
p ∈ M , chame de T := ker DΦ(p) e de T ⊥ o complemento ortogonal de T em Rd . Então podemos
encontrar uma vizinhança Ap ∋ p em Rd , uma vizinhança Bp de 0Rm em Rm , uma transformação
linear inversível Rp ∈ L(Rm , T ) e uma função C ℓ , gp : R(Bp ) → T ⊥ , tais que:

M ∩ Ap = {p + Rp x + gp (x) : x ∈ Bp }.

Logo, ao menos de uma translação por p, M é localmente a soma de um termo Rp x ∈ T


com uma função deste termo g(Rp x). Se T fosse o plano gerado pelas primeiras m coor-
denadas, isso seria exatamente o gráfico da função g ◦ Rp−1 !

Prova: Uma observação preliminar é que, como DΦ(p) ∈ L(Rd , Rk ) é sobrejetiva, seu
núcleo T tem dimensão d − k = m.

250
Tome, então, uma base ortonormal b1 , . . . , bd de Rd cujos m primeiros vetores são base
de T . Isto implica que os vetores bm+1 , bm+2 , . . . , bd são base ortonormal de T ⊥ . Definimos
Rp ∈ L(Rm , T ) e Sp ∈ L(Rk , T ⊥ ) via:
m
X
Rp x = x[i] bi (x ∈ Rm )
i=1
Xk
Sp y := y[j] bj+m (y ∈ Rk ).
j=1

É um exercício mostrar que tanto Rp quanto Sp são injetivas e portanto inversíveis (já que
dim(T ) = m e dim(T ⊥ ) = d − m).
Finalmente, defina
u : (x, y) ∈ Rm × Rk 7→ p + Rp x + Sp y ∈ Rd .
Observe que u é afim e contínua. Além disso, ela tem inversa contínua. Isso vem do fato
facilmente checável que a parte linear de u é Rp x + Sp y, uma transformação inversível de
Rm × Rk ≈ Rd em Rd .
Como u(0Rm , 0Rk ) = p, a composição Φ ◦ u está bem definida como função
Φ ◦ u : u−1 (U ) ⊂ Rm × Rk → Rd
com (0Rm , 0Rk ) no domínio.
Provaremos agora a seguinte afirmação.

Afirmação 14.1 As hipóteses do Teorema da Função Implícita se aplicam a Φ ◦ u ao


redor do ponto (x0 , y0 ) = (0Rm , 0Rk ).
Prova: [da Afirmação] Para checar esta afirmação, o primeiro passo é observar
que Φ ◦ u é C ℓ , o que segue do fato que Φ é C ℓ e u é C ∞ .

O segundo e último é checar é que a derivada na segunda variável


D2 (Φ ◦ u)(0Rm , 0Rk ) : hy ∈ Rk 7→ D(Φ ◦ u)(0Rm , 0Rk ) (0Rm , hy ) ∈ Rk
é operador inversível de Rk em Rk . Para isso, basta mostrar que ela é injetiva,
ou seja, que seu núcleo é trivial.
Observe que Du(x, y) (hx , hy ) = Rp hx + Sp hy porque u é afim. A regra da
cadeia nos diz:
D2 (Φ ◦ u)(0Rm , 0Rk ) hy = DΦ(p) Du(0Rm , 0Rk ) (0Rm , hy ) = DΦ(p) Sp hy .
Suponha agora que hy ∈ kerD2 (Φ◦u)(0Rm , 0Rk ). Isso quer dizer que DΦ(p) (Shy ) =
0, de modo que Shy ∈ T = ker DΦ(p). Mas sabemos (pela construção de S)
que Shy ⊥ T , donde Shy = 0Rd e (como S é injetiva) hy = 0Rk . Isto mostra que
o núcleo de D2 (Φ ◦ u)(0Rm , 0Rk ) é de fato trivial, como queríamos demonstrar.
[Fim da prova da afirmação] 2

251
Podemos agora aplicar o Teorema da Função Implícita, que garante que existem vizi-
nhanças U0 ∋ 0Rm e A0 ∋ (0Rm , 0Rk ), além de uma função C ℓ g0 : A0 → U0 com

(Φ ◦ u)−1 (c) ∩ A0 = {(x, g0 (x)) : x ∈ U0 }. (14.1) eq:formulai

Defina Ap := u(A0 ), de modo que p ∈ u(A0 ). Veja que um ponto z ∈ Ap se e somente se


existe um w ∈ A0 com u(w) = z. Deduzimos:

Φ−1 (c)∩Ap = {z ∈ Ap : Φ(z) = c} = {u(w) : w ∈ A0 , Φ◦u(w) = c} = {u(w) : w ∈ (Φ◦u)−1 (c)∩A0 }.

A combinação disso com (14.1) nos diz:

Φ−1 (c) ∩ Ap = {u(x, g(x)) : x ∈ U0 } = {p + Rp x + gp (x) : x ∈ Up }

onde Up := U0 e g = Sp ◦ g0 tem as propriedades desejadas (cheque!). 2

14.4.3 Prova do Teorema 14.2


Agora temos todas as ferramentas para provar o Teorema 14.2.
Prova: [Prova do teorema 14.2] O Lema 14.1 garante que para cada p ∈ M podemos
encontrar um aberto Ap ∈ p de Rd , um outro aberto Up ⊂ Rm com 0Rm e uma função C ℓ
dada por:
fp : x ∈ Up 7→ p + Rp x + gp (x) ∈ M ∩ Ap ,
onde gp é C ℓ e gp (x) ⊥ T = kerDΦ(p) e Rp ∈ L(Rm , T ). Mais ainda, fp (0Rm ) = p e

M ∩ Ap = {p + Rp x + gp (x) : x ∈ Up } = fp (Up ).

Afirmamos que (fp , Up , Ap )p∈M é um atlas. Para provar isso, começamos observando
que M ⊂ ∪p∈M Ap e fp : Up → M ∩ Ap é C ℓ .
Vamos checar que a derivada de fp é injetiva. Temos:

Dfp (x) h = Rp h + Dgp (x) h.

Se h ∈ kerDfp (x), Rp h + Dgp (x) h = 0Rd . Como gp (x) ∈ T ⊥ para todo x ∈ Up , temos que
Dgp (x) ∈ L(Rm , T ⊥ ) e Dgp (x) h. Além disso, Rp h ∈ T . Portanto, para que Rp h+Dgp (x) h =
0, devemos ter Rp h = Dgp (x) h = 0Rd , o que implica h = 0Rm (porque Rp é inversível). Ou
seja, o único elemento do núcleo de kerDfp (x) é o vetor nulo. Segue que Dfp (x) é injetiva
para todo x ∈ Up .
Falta mostrar que fp : Up → M ∩ Ap é um homeomorfismo. Como já sabemos que
fp é contínua, nos resta provar que fp é sobrejetiva, injetiva e tem inversa contínua.
Como vimos, fp (Up ) = M ∩ Ap , logo a sobrejetividade está garantida. As outras duas
propriedades seguem do seguinte fato, que provaremos a seguir:

∃c > 0 : ∀x, x′ ∈ Up : |fp (x) − fp (x′ )|2 ≥ c |x − x′ |2 .

252
Isto implica não só que fp é injetiva, mas que sua inversa é (1/c)-Lipschitz. Para provar a
desigualdade acima, partimos de:

|fp (x) − fp (x′ )|2 = |Rp (x − x′ ) + gp (x) − gp (x′ )|2 ≥ |Rp (x − x′ )|2

porque Rp (x − x′ ) ⊥ gp (x) − gp (x′ ). Mais ainda, como Rp é inversível,

|x − x′ |2 = |Rp−1 Rp (x − x′ )|2 ≤ ∥Rp−1 ∥Rm →Rm |Rp (x − x′ )|2 .

Como Rp−1 não se anula, podemos tomar c = 1/∥Rp−1 ∥Rm →Rm > 0 e deduzir a desigualdade
desejada.
Finalmente, falta calcular o espaço tangente de M em cada p ∈ M . Veja que este
espaço tem dimensão m, a mesma do núcleo de DΦ(p). Deste modo, para provar que
Tp M = kerDΦ(p), basta mostrar que Tp M ⊂ kerDΦ(p).
Isto é fácil. Tome fp como acima e v ∈ Tp M . Sabemos que fp (0Rm ) = p e v = Dfp (0Rm ) w
para algum w ∈ Rm . Por outro lado, Φ ◦ fp (x) = c para todo x ∈ Up , logo:

0Rk = DΦ ◦ fp (0Rm ) w = DΦ(p) Dfp (0Rm ) w = DΦ(p) v.

Logo, cada v ∈ Tp M também está no núcleo de DΦ(p), como queríamos demonstrar. 2

14.5 Trocas de cartas, funções diferenciáveis e estrutura in-


trínseca
Nossos últimos resultados sobre variedades têm a ver com a seguinte pergunta.

Dadas subvariedades M, N , o que significa que uma função f : M → N é diferenciável (ou C ℓ )?

A dificuldade deste problema nem M , nem N são em geral abertos de um espaço


vetorial. Isso não será um problema, mas, antes de explicar o porquê, precisamos entender
que há uma certa compatibilidade entre as diferentes cartas locais de uma variedade.

14.5.1 Trocas de cartas são difeomorfismos


Para esta subseção, fixamos uma subvariedade M m ⊂ Rd de classe C ℓ , com atlas

(fα , Uα , Aα )α∈I .

Tomamos dois índices α, β ∈ I tais que Aα ∩ Aβ ∩ M = ∅. Como veremos a seguir,


isso quer dizer que fα e fβ parametrizam um certo aberto comum da variedade. O que
mostraremos a seguir é que f
07/06/2023 - seção ainda sendo escrita

253
254
Parte IV

EDOs: unicidade e dependência suave


das condições iniciais

255
Capítulo 15

Existência e unicidade para certas EDOs

ESTA PARTE ESTÁ INCOMPLETA.


Agora veremos como uma aplicação relativamente simples do teorema de Banach basta
para provar um resultado fundamental. É conveniente que você se lembre das convenções
e notação usadas na seção ?? acima.

15.1 Existência e unicidade globais


Teorema 15.1 Suponha que Ψ : R × Rd → Rd é contínua. Além disso, suponha que Ψ é
L-Lipschitz na variável espacial, isto é, que para quaisquer t ∈ R, x, x′ ∈ Rd ,

|Ψ(t, x) − Ψ(t, x′ )|2 ≤ L |x − x′ |2 .

Então valem as seguintes propriedades.

1. Dados (t0 , x0 ) ∈ R × Rd , existe uma única função contínua ξ : R → R tal que ξ(t0 ) = x0
e ξ ′ (t) = Ψ(t, ξ(t)) (t ∈ R). Qualquer função satisfazendo as mesmas propriedades em um
intervalo fechado I ∋ t0 coincide com ξ dentro deste intervalo.

2. (Dependência contínua da condição inicial) Se t0 é dado e ξ, ξ˜ são soluções correspon-


˜ 0 ) = x˜0 , então
dendo a ξ(t0 ) = x0 e ξ(t
˜ 2 ≤ eL|t−t0 | |x − x̃|2 .
∀t ∈ I : |ξ(t) − ξ(t)|

Alguns casos de aplicação deste teorema são muito conhecidos.

Exemplo 15.1 Se d = 1 e Ψ(t, x) = x, a única solução com ξ(0) = 0 é a função exponencial


ξ(t) = et x0 . Várias propriedades da exponencial seguem disto.

Exemplo 15.2 Se d = 2 e Ψ(t, x) = (x[2], −x[1]), a solução com ξ(0) = (0, 1) é dada por
ξ(t) = (sen t, cos t).

257
Prova: Suporemos que t0 = 0 no que segue, para carregar menos a notação.
Esta prova tem três partes principais.

1. Provaremos existência, unicidade e estabilidade em cada intervalo de tempo da


forma [−T, T ], T > 0.

2. Mostraremos existência e unicidade para qualquer tempo real.

3. Usaremos a estabilidade do item 1 para provar a dependência contínua.

Parte 1. Fixe T > 0 e defina CT := C([−T, T ], R). Como já vimos muitas vezes, ξT resolve
nossa EDO para t ∈ [−T, T ] se e somente se é um ponto fixo do operador
Z t
T : f ∈ C 7→ T (f ) ∈ CT com T (f )(t) := x0 + Ψ(s, f (s)) ds (t ∈ [−T, T ]).
0

Aplicaremos o teorema do ponto fixo de Banach para provar que o ponto fixo existe, é
único e estável. Para isso, observamos que CT é completo com sua norma do sup (chamada
de ∥ · ∥T abaixo) e passamos a calcular o coeficiente de Lipschitz de cada iterada T n do
mapa T . O lema a seguir dá conta disto:

af:picard Afirmação 15.1 (Estimativa de Picard) Dados n ∈ N e f, g ∈ CT :

(L|t|)n
∀t ∈ [−T, T ] : |T n (f )(t) − T n (g)(t)| ≤ ∥f − g∥T ,
n!

Em particular, T n é (L T )n /n!-Lipschitz.

Veja que esta afirmação termina a prova do primeiro passo porque temos:

X (LT )n
= eLT < +∞
n∈N
n!

e portanto seguem a unicidade do ponto fixo e a desigualdade

∀f ∈ CT : ∥f − ξT ∥T ≤ eLT ∥f − T (f )∥T . (15.1) eq:estavel

Provemos então a afirmação. Veja que o caso n = 0 é trivial. Para seguir por indução,
suponha que, para algum n ≥ 0,

(L|t|)n
∀t ∈ [−T, T ] : |T n (f )(t) − T n (g)(t)|2 ≤ ∥f − g∥T ;
n!
258
Vejamos agora como se comporta a mesma quantidade quando passamos de n para n + 1.
Escreva fn := T n (f ) e gn := T n (g). Usando a fórmula para T , vemos que, para t ≥ 0,

|T n+1 (f )(t) − T n+1 (g)(t)|2 = |T (fn )(t) − T (gn )(t)|2


Z t

= (Ψ(s, fn (s)) − Ψ(s, gn (s))) ds

0 2
Z t
≤ |Ψ(s, fn (s)) − Ψ(s, gn (s))|2 ds
0
Z t
(use prop. de Lipschitz) ≤ L |fn (s) − gn (s)| ds
0
Z t 
(Ls)n

(hip. de indução) ≤ L ∥f − g∥T ds
0 n!
Ln+1 tn+1
(apenas faça a conta) = ∥f − g∥T .
(n + 1)!

Uma conta muito parecida prova o resultado análogo para t < 0. Para terminar, temos:

Exercício 15.1 Deduza que T n é mesmo (LT )n /n!-Lipschitz.

Parte 2. Agora queremos provar a existência global. Já sabemos que para cada intervalo
[−T, T ] há uma solução ξT de nosso problema. A principal observação desta parte da
prova é que, se S > T , a solução ξS restrita ao intervalo [−T, T ] tem de coincidir com ξT .
Isto ocorre porque ξS |[−T,T ] : [−T, T ] → Rd também é contínua, satisfaz ξS |[−T,T ] (0) =
x0 e ξS |′[−T,T ] (t) = ξS′ (t) = Ψ(t, ξS (t)) for t ∈ [−T, T ]. Ou seja, ξS |[−T,T ] resolve o mesmo
problema de Cauchy que ξT . Como ξT é a única solução, tem de valer a observação acima.
O valor da observação é que ela nos permite passar do local para o global. De fato, se
definimos
ξ(t) := ξT (t), onde T > |t| (t ∈ R)
a observação nos mostra que isto está bem definido porque, dados quaisquer S > T > |t|,
temos ξT (t) = ξS (t). Vê-se ainda que ξ(0) = 0 e ξ ′ (t) = Ψ(t, ξ(t)) para todo t ∈ R pelo
simples fato que as ξT satisfazem estas propriedades nos seus respectivos intervalos. A
unicidade para t ∈ R vem do fato que qualquer outra solução também terá de coincidir
com cada ξT no seu intervalo [−T, T ], pelo raciocínio exposto acima.
Parte 3. Provaremos agora a dependência contínua. Tome T := |t|. Considere o mesmo
operador T : CT → CT visto acima. Note que uma solução com ξ(0) ˜ = x˜0 satisfaz
Z t
˜ = x˜0 +
ξ(t) ˜
Ψ(s, ξ(s)) ˜
ds = (x˜0 − x0 ) + T (ξ)(t).
0

Portanto,
∥ξ˜ − T (ξ)∥
˜ T = |x0 − x̃0 |2 .

259
Isto nos permite comparar ξ˜ com a solução ξ para ξ(0) = x0 . De fato, sabemos que esta
solução coincide com ξT no intervalo [−T, T ]. Portanto, a desigualdade de estabilidade na
equação (15.1) nos garante que

˜ − ξ(t)| ≤ ∥ξ˜ − ξT ∥T ≤ eLT ∥ξ˜ − T (ξ)∥


|ξ(t) ˜ T = eL|t| |x0 − x̃0 |2 .

15.2 Existência e unicidade locais


Neste problema trataremos de uma situação muito mais geral do que a do teorema de
existência e unicidade anterior. Aqui pedimos apenas que a função Ψ seja localmente
Lipschitz.

Teorema 15.2 Suponha que A ⊂ R × Rd é aberto. Tome uma Ψ : A → Rd que é contínua e


localmente Lipschitz na variável x no seguinte sentido: dado qualquer compacto K ⊂ A, existe um
L = LK tal que para quaisquer pontos (t, x), (t, x′ ) ∈ K, |Ψ(t, x) − Ψ(t, x′ )|2 ≤ LK |x − x′ |2 .
Dado um ponto (t0 , x0 ) ∈ A, conseguimos encontrar um intervalo fechado I = [t0 − δ, t0 + δ] e
um raio R > 0 tal que, se x˜0 ∈ BRd [x0 , R], o problema abaixo tem uma única solução.

ξx˜ : I → Rd com
 0


(t, ξx˜0 (t)) ∈ A (t ∈ I)
P(x̃0 ) ′
ξ (t) = Ψ(t, ξx˜0 (t)) (t ∈ I)
 x˜0


ξx˜0 (t0 ) = x˜0 .

Além disso, se t ∈ I e x0 , x˜0 ∈ BRd [x0 , R/2],

||ξx0 (t) − ξx̃0 (t)|2 ≤ eL|t−t0 | |x0 − x̃0 |2 .

Prova: Como na prova anterior, suporemos que t0 = 0 para facilitar a notação.


A prova combina elementos da demonstração do teorema de existência (via Ascoli-
Arzèla) com a demonstração do teorema de existência e unicidade (via ponto fixo). O
passo principal será descobrir um δ > 0 e um R > 0 que garanta que a transformação
integral T correspondente a nossa EDO leva o espaço C(I, BRd [x0 , R]) nele mesmo. Daí
poderemos aplicar o teorema de Banach como no caso de existência global.
Para isso, começamos escolhendo δ0 > 0 e R tais que o compacto K0 = [−δ0 , δ0 ] ×
BRd [x0 , R] está contido em A (pode ser usado o mesmo argumento visto na seção 16.3.1
acima). Daí definimos:

M := sup |Ψ(t, x)|2 (finito porque Ψ é contínua e K0 é compacto).


(t,x)∈K0

L := LK0 = a constante local de Lipschitz para o compacto K0 , que supomos ser finita.

260
Agora nos restringimos a um subconjunto I × BRd [x0 , R], com I = [−δ, δ] e
 
R
δ := min δ0 , .
2M
Defina
Z t
Tx̃0 : f ∈ C(I, BRd [x0 , R]) 7→ Tx˜0 (f ) com Tx˜0 (f )(t) = x̃0 + Ψ(s, f (s)) ds (t ∈ I).
0

Veja que Tx̃0 (f ) ∈ C(I, Rd ). Afirmamos que, x̃0 ∈ BRd [x0 , R/2], Tx̃0 (f ) ∈ C(I, BRd [x0 , R])
sempre. De fato, veja que, para todo t ∈ I,

|Tx̃0 (f )(t) − x0 |2 ≤ |x˜0 − x0 |2 + |Tx̃0 (f )(t) − x̃0 |2


Z t
R
≤ + |Ψ(s, f (s))|2 ds
2 0
R
≤ + δ M ≤ R.
2
Portanto, Tx̃0 (f )(t) ∈ BRd [x0 , R] para cada t ∈ I.
Deduzimos que, se |x̃0 − x0 |2 ≤ R/2, Tx̃0 : C(I, BRd [x0 , R]) → C(I, BRd [x0 , R]). O
resto da prova consiste em repetir todas as contas da prova anterior, checando que tudo
funciona porque as T ’s todas mapeiam um espaço métrico completo nele mesmo. 2

15.3 Diferenciabilidade local - esboço

15.4 Mais exercícios


Exercício 15.2 Suponha que Ψ(t, x) é afim em x e limitada em t. Isto é, suponha que as
coordenadas Ψ[i](t, x) são da forma

Ψ[i](t, x) = ⟨a(i) (t), x⟩ + bi (t) ((t, x) ∈ R × Rd , 1 ≤ i ≤ d)

onde ai ∈ C(R, Rd ) e bi ∈ C(R, R) são funções uniformemente limitadas. Prove um resultado de


existência e unicidade global para este sistema.

Exercício 15.3 (Desigualdade de Gronwall) Esta desigualdade dá uma maneira alternativa de


se provar a unicidade e dependência contínua de sistemas de EDOs.
Sejam f, g : [a, b] → Rd contínuas. Suponha que existe um L > 0 tal que
Z t
∀t ∈ [a, b] : |f (t) − g(t)|2 ≤ |f (a) − g(a)|2 + L |f (s) − g(s)|2 ds.
a

Prove que |f (t) − g(t)|2 ≤ eL(t−a) |f (0) − g(0)| para todo t ∈ [a, b]. (A ideia é fazer uma indução
semelhante à usada na prova da Estimativa de Picard, Afirmação 15.1 acima.)

261
Exercício 15.4 Neste problema, usaremos o fato que existe uma única solução para a EDO E ′ (t) =
E(t) com E(0) = 1. Nosso objetivo será provar que esta função – que sabemos ser a exponencial
natural – satisfaz E(t) > 0 para todo t ∈ R, E(t + x) = E(t)E(x) para todos t, x ∈ R e outras
propriedades conhecidas.

1. Suponha primeiramente que x ∈ R é tal que E(x) > 0. Mostre que a função f (t) :=
E(t + x)/E(t) (t ∈ R) resolve a mesma EDO que a exponencial e que portanto f (t) = E(t)
para todo t. Deduza que E(t + x) = E(t) E(x).

2. Mostre que para todo x ∈ R existe um k ∈ N com E(x/k) > 0e deduza que E(x) =
E(x/k)k > 0. Como isto vale para todo x, deduza que E(t + x) = E(t) E(x).

3. Use a “regra do produto" para mostrar que E é estritamente crescente.

4. Mostre que limt→+∞ E(t) = +∞ e lims→−∞ E(s) = 0.

Exercício 15.5 Neste problema, usaremos o fato que existe uma única solução para o sistema de
EDOs 

 S, C : R → R,
 ′
S (t) = C(t)

 C ′ (t) = −S(t)
C(0) = 1, S(0) = 0

para provar propriedades do seno e do cosseno (que sabemos serem soluções do sistema acima).

1. Explique como este sistema pode ser posto na forma “ξ ′ (t) = Ψ(t, ξ(t))" com dimensão
espacial d = 2.

2. Mostre que S 2 (t) + C 2 (t) = 1 para todo t.

3. Mostre que S(−t) = −S(t) e C(−t) = C(t) para todo t (dica: que sistema as funções
−S(−t), C(−t) resolvem?).

4. Prove que há um número π/2 > 0 tal que S(π/2) = 1, C(π/2) = 0 e S(t), C(t) ∈ (0, 1)
para todo t ∈ (0, π/2).

5. Prove que C(t + π/2) = −S(t) e S(t + π/2) = C(t) para todo t ∈ R.

6. Prove que S(2π + t) = S(t) e C(2π + t) = C(t) para todo t ∈ R.

7. Prove que S(a + t) = S(a) C(t) + S(t) C(a) para todos a, t ∈ R.

262
Parte V

Mais sobre espaços de funções contínuas

263
Capítulo 16

Sequências e séries de funções

Em todo este capítulo, nos focaremos nos espaços de funções contínuas C := C(K, V ),
onde (K, dK ) é um espaço métrico compacto.

16.1 Séries de funções


Nosso problema nesta seção será dar condições suficientes para que, dada uma sequência
de funções {fn }n∈N ⊂ C, exista uma f ∈ C tal que
X
f (t) = fn (t), (t ∈ K).
n∈N

Também estaremos interessados em saber quando f ′ (t) = fn′ (t) para todo t ∈ K no
P
n∈N
caso em que isto faz sentido (isto é, quando K ⊂ R).
Um caso particular importante é dado a seguir.

ex:seriepot Exemplo 16.1 (Séries de potência) Neste caso supomos d = 1 e K = [t0 − R, t0 + R] com
t0 ∈ R e R ∈ R. Nosso objetivo será investigar quando uma série do tipo
X
f (t) = cn (t − t0 )n
n∈N

converge a uma função contínua de t ∈ K, onde {cn }n∈N é uma sequência previamente escolhida
de valores reais. Também procuraremos condições sob as quais podemos diferenciar a série, obtendo
a identidade esperada X
f ′ (t) = ncn (t − t0 )n−1 .
n∈N\{0}

16.1.1 Somando séries


Nosso primeiro resultado dá um critério simples para se definir quando uma série de
funções converge uniformemente.

265
P Pk
Proposição 16.1 Se n ∥fn ∥∞ < +∞, então existe f ∈ C tal que ∥f − n=0 fn ∥ → 0 quando
k → +∞.

Prova: Defina gk := kn=0 fn . Como C é completo, basta provar que {gn }n∈N é Cauchy.
P
Nossa hipótese garante que:
X
∥gn − gn+1 ∥∞ < +∞.
n

Em particular, a proposição segue do enunciado abaixo.

em:somadist
P Se (X, dX ) é um espaço métrico, então qualquer sequência {xn }n∈N que
Lema 16.1
satisfaz n∈N dX (xn , xn+1 ) < +∞ é Cauchy. (Em particular, se X é completo, a
sequência converge.)

Prova: Fixemos ε > 0. Nosso objetivo é mostrar que ∃n0 = n0 (ε) ∈ N tal que
xm ) < ε para todos n, m ∈ N com n, m ≥ n0 . Para isso, observamos que,
dX (xn ,P
como P n∈N d(xn , xn+1 ) é uma série convergente, necessariamente existe um n0
tal que k≥n0 (ε) dX (xk , xk+1 ) < ε. Afirmamos que este n0 tem a propriedade
que queremos. De fato, se m, n ≥ n0 e m ≥ n – ou seja, m = n + j para algum
j ∈ N – a desigualdade triangular garante

dX (xn , xm ) = dX (xn , xn+j )


j−1
X
≤ dX (xn+i , xn+i−1 )
i=0
n+j−1
X
= dX (xk , xk+1 )
k=n
+∞
X
(n ≥ n0 , n + j − 1 < +∞, termos ≥ 0) ≤ dX (xk , xk+1 ) < ε.
k=n0

De modo análogo, dX (xn , xm ) < ε também quando n ≥ m ≥ n0 . (Fim da prova


do Lema.) 2

2
Vejamos agora como aplicar este resultado ao Exemplo 16.1 sobre séries de potência.

Teorema 16.1 No Exemplo 16.1, temos que


1 1 X
lim sup |cn | n < ⇒ cn (t − t0 )n converge uniformemente.
n→+∞ R n∈N

266
Prova: Para cada n ∈ N, defina fn ∈ C como

fn (t) := cn (t − t0 )n (t ∈ K).

Veja que ∥fn ∥ = |cn | Rn . Sob as condições do enunciado, temos que


1 1
lim sup ∥fn ∥ n = R lim sup |cn | n < 1.
n n

Logo o teste da raíz garante a convergência de 2


P
n∈N ∥fn ∥.

PMostre que (X, dX ) é um espaço métrico completo se e somente se toda sequência


Exercício 16.1
{xn }n∈N com n∈N dX (xn , xn+1 ) < +∞ converge a algum x ∈ X.

16.1.2 Tomando derivadas


Consideraremos agora o caso particular em que K = [a, b] e portanto K ⊂ R. Nosso
problema fundamental é saber quando podemos deduzir que um limite de uma sequência
ou série de funções diferenciáveis é ele próprio diferenciável. Ou seja, se sabemos que
gk → f na norma uniforme, e além disso as gk são diferenciáveis, será verdade que
f ′ = limk gk′ ?
Já sabemos que a resposta a esta pergunta é não em geral, como vimos no Exemplo
4.8 acima. A chave para isso é que a operação de derivar uma função não é contínua sob
qualquer subconjunto razoável de C. No entanto, podemos nos aproveitar da continui-
dade da integral para provar que às vezes é possível “passar a derivada para dentro da
soma". Um ponto importante é que, para f : [a, b] → Rd , definimos a derivada coordenada
a coordenada.

eo:difserie Teorema 16.2 Seja {fn }n∈N ⊂ C([a, b], V ) uma sequência de funções satisfazendo as três propri-
edades a seguir.
Pk
1. Existe um ponto t0 ∈ [a, b] tal que n=0 fn (t0 ) → c ∈ Rd quando k → +∞.

2. Para todo n ∈ N, as derivadas fn′ existem e são elementos de C([a, b], Rd ).



P
3. n∈N ∥fn ∥∞ < +∞.

EntãoPexiste uma função contínua f ∈ C([a, b], V ) e com derivada f ′ ∈ C([a, b], V ) tal que
f = n∈N fn e f ′ = n∈N fn′ (no sentido de convergência uniforme de séries de funções).
P

Prova: (do Teorema 16.2) Defina gk := kn=0 fn (k ∈ N). Veja que, para cada k, o teorema
P
fundamental do Cálculo nos garante que

gk = gk (t0 ) + I(gk′ ),

267
Rt
onde I : C → C leva a função h numa nova função I(h) com I(h)(t) = t0 h(s)ds.
Recordamos que este é um operador limitado.
Sabemos ainda que é uma soma de funções diferenciáveis, n=0 fn . Como

Pk ′
g k gk =
n ∥fn ∥ < +∞, o resultado da seção anterior nos garante que existe h ∈ C que é o limite

P

uniforme das somas gk = n=0 fn . Como sabemos que I é contínuo, isto também quer

Pk
dizer que I(gk′ ) → I(h) uniformemente.
Defina agora f := c + I(h). Observe que, pela subaditividade da norma e as nossas
estimativas anteriores,

∥f − gk ∥ ≤ |c − gk (t0 )| + ∥I(gk′ ) − I(h)∥ ≤ |c − gk (t0 )| + ∥I∥C→C ∥gk′ − h∥ → 0.

Logo gk = kn=0 fn → f uniformemente. Além disso, o Teorema Fundamental do Cálculo


P

nos garante que f ′ = h e, como já vimos, kn=0 fn′ = gk′ → h = f ′ uniformemente. 2


P

Terminamos esta seção mostrando como o nosso resultado de diferenciação se aplica


ao caso de séries de potência. Aplicando-o indutivamente, deduzimos que toda série de
potência satisfazendo as condições do teorema é infinitamente diferenciável; além disso,
suas derivadas podem ser obtidas diferenciando os termos da série um a um.

Teorema 16.3 No Exemplo 16.1, temos que, com K = [t0 − R, t0 + R],

1 1 X
lim sup |cn | n < ⇒ f (t) := cn (t − t0 )n (t ∈ K) converge uniformemente em .
n→+∞ R n∈N

Além disso, f ′ (t) = ncn (t − t0 )n−1 também no sentido de convergência uniforme.


P
n∈N\{0}
Resultado anál

Prova: A ideia é checar que o Teorema 16.2 se aplica. Escreva fn (t) := cn (t − t0 )n . Veja
Pque′

fn (t) = ncn (t − t0 )n−1
existe para cada n e é função contínua. Além disso, veja que n fn
também é série de potência, em que o termo (t − t0 )n tem coeficiente (n + 1) cn+1 . Não é
difícil verificar que
1 1
lim sup |(n + 1) cn+1 | n = lim sup |cn | n ,
n→+∞ n→+∞

Portanto, se o lim sup é < 1/R para a série original, também é para a série das derivadas.
Usando novamente o teste da raíz, deduzimos que

1 1 X
lim sup |cn | n < ⇒ ∥fn′ ∥ < +∞.
n→+∞ R n

Por fim, vemos que fn (t0 ) = c0 para todo k, o que prova a convergência pontual em
Pk
n=0
t0 . 2

268
16.2 Mais exercícios
P 16.2 Seja f : [t0 − R, t0 + R] → R uma função dada por uma série de potência
Exercício
f (t) = Pn∈N cn (t − t0 )n com lim supn |cn |1/n < 1/R. Prove que eiste uma outra série de potência
g(t) = n∈N un (t − t0 )n com {un }n∈N ⊂ R também satisfazendo lim supn∈N |un |1/n < 1/R, tal
Rt
que t0 f (s) ds = g(t) para todo t ∈ [t0 − R, t0 + R].

Exercício 16.3 Mostre que as séries de potência a seguir convergem uniformemente e definem
funções infinitamente diferenciáveis sobre qualquer intervalo compacto [a, b] ⊂ R.
tn
P
1. n∈N n!

2t n
P 
2. n∈N n

tn
P
3. n∈N par n!

Exercício 16.4 Dado 0 < R < 1, escreva a série de potência de uma função f : [−R, R] → R tal
que f (0) = 0 e f ′ (t) = (1 + t)−1 para todos t no domínio. Chamando de cn os coeficientes da série,
1
mostre que limn∈N |cn | n = 1 e explique porque isto é razoável.

Exercício 16.5 Mostre que o conjunto de todas as funções polinomiais com coeficientes racionais
é denso em C([a, b], R), para qualquer intervalo compacto [a, b] ⊂ R.

16.3 O método de Euler e a existência de soluções para


EDOs
Nosso principal objetivo no restante deste capítulo será discutir a versão local do problema
de Cauchy para equações diferenciais ordinárias. Para definir este problema, precisamos
de alguns ingredientes especiais.

• Tempo e espaço: uma EDO representa a evolução ao longo do tempo de um vetor


em um certo espaço. O tempo para nós é uma variável unidimensional t ∈ R. O
espaço é Rd ou um subconjunto. Às vezes escreveremos (t, x) ∈ R × Rd para dizer
que (t, x[1], . . . , x[d]) ∈ Rd+1 . Isto é, R × Rd é o próprio Rd+1 escrito de uma forma
diferente, que enfatiza o papel distinto de variáveis espaciais.

• Função de evolução: seja A ⊂ R × Rd um aberto (ou seja, A na verdade é um


aberto de Rd+1 escrito de um jeito diferente). A evolução da EDO será determinada
por uma função Ψ : A → R. Ela associa a cada ponto (t, x) no tempo-espaço um
vetor Ψ(t, x) ∈ Rd que diz em que direção o sistema deve evoluir a partir de x num
intervalo infinitesimal de tempo.

269
• Problema de Cauchy Local (existência): Dados (t0 , x0 ) ∈ A, nossa pergunta é se
existe um δ > 0 e uma ξ : [t0 − δ, t0 + δ] → Rd satisfazendo as seguintes propriedades:

 ξ(t0 ) = x0 ;
(P ) (t, ξ(t)) ∈ A, t ∈ [t0 − δ, t0 + δ];
 ′
ξ (t) = Ψ(t, ξ(t)), t ∈ [t0 − δ, t0 + δ].

Uma outra pergunta que poderíamos fazer é se há unicidade, ou seja, quantas ξ há


satisfazendo as condições acima. Por ora não nos preocuparemos com esta pergunta, que
será abordada no próximo capítulo, mas é importante dizer que há problemas de Cauchy
com existência e sem unicidade.

Exemplo 16.2 Suponha que d = 1, A = R × R Ψ(t, x) = 2 |x|1/2 . Pode-se checar que, para
qualquer c > 0, a EDO ξ ′ (t) = |ξ(t)|1/2 (t ∈ R) com ξ(0) = 0 pode ser resolvida por

0 , −∞ < t ≤ c;
ξ(t) = 2
(t − c) , t > c.
O principal teorema desta seção é o seguinte.

Teorema 16.4 Suponha que A ⊂ R × Rd , Ψ : A → Rd e (t0 , x0 ) são como acima. Suponha ainda
que Ψ é contínua. Então o problema de Cauchy descrito acima tem pelo menos uma solução.

De fato, nossa prova dará uma maneira explícita de construir soluções aproximadas,
que é chamada de Método de Euler. A ideia é que esperamos que, pela condição da
derivada, esperamos que ξ(t + ε) − ξ(t) ≈ ε ξ ′ (t) = ε Ψ(t, ξ(t)). Grosso modo, o que o
Método de Euler faz é tomar esta aproximação como definição de uma ξε contínua sobre
os pontos t0 , t0 ± ε, t0 ± 2ε, t0 ± 3ε, . . . . Ou seja, a ideia é discretizar o tempo e usar Ψ para
definir a inclinação de ξε nestes instantes de tempo discretizado. Botar esta ideia para funcionar
vai requerer algum cuidado, como veremos a seguir.

16.3.1 Localização
localizacao
Teremos de restringir o domínio antes mesmo de construirmos a aproximação de Euler.
A razão para isso é que só sabemos definir a aproximação dentro do conjunto A. Para
garantirmos que estamos sempre lá dentro, será preciso “andar com cuidado" lá dentro,
mantendo a trajetória sempre dentro de um compacto K0 no espaço-tempo. Na verdade,
para isso, precisaremos de um compacto K1 ainda menor.
Mais precisamente, nossa ideia é escolher um δ0 > 0 e um R0 > 0 tais que o conjunto
compacto
K0 := [t0 − δ0 , t0 + δ0 ] × BRd [x0 , R0 ] ⊂ A.
Como sabemos que δ0 , R0 existem de fato? Observe que (t0 , x0 ) ∈ A – um conjunto
aberto – e uma conta fácil demonstra
q
[t0 − δ0 , t0 + δ0 ] × BRd [x0 , R0 ] ⊂ BRd+1 [(t0 , x0 ), R] com R := δ02 + R02 .

270
Portanto BRd+1 [(t0 , x0 ), R] ⊂ A se R > 0 é pequeno o suficiente.
Uma propriedade importante que ganhamos pela compacidade de K0 é que

M := sup |Ψ(t, x)|2 < +∞ (16.1)


(t,x)∈K0

já que Ψ : A → Rd é contínua e K0 é compacto. Outra propriedade que usaremos abaixo


é que K0 é convexo (exercício).
Lembre-se que nosso objetivo será que as aproximações de Euler se mantenham dentro
do compacto K0 . Para isso, ainda precisaremos “encurtar" ainda mais o tempo. Fixamos
um δ ∈ (0, δ0 ] com δ M ≤ R0 . Por razões que vão ficar claras abaixo, só poderemos
considerar tempos t ∈ [t0 − δ, t + δ].

16.3.2 A aproximação de Euler


sec:euler
Defina uma sequência de pontos t0 − δ = t−k1 < t−k1 +1 < · · · < t0 < t1 < · · · < tk2 = t0 + δ
com 0 < ti − ti−1 ≤ ε para −k1 + 1 ≤ i ≤ k2 . Veja que o ponto inicial no tempo t0 está neste
conjunto. Definimos uma função

ξε : [t0 − δ, t0 + δ] → Rd

da seguinte forma.

1. ξε (t0 ) = x0 ;

2. ξε (ti ) = ξε (ti−1 ) + (ti − ti−1 ) Ψ(ti−1 , ξε (ti−1 )), i = 1, 2, . . . , k2 ;

3. ξε (t−j ) = ξε (t−j+1 ) + (t−j − t−j+1 ) Ψ(t−j+1 , ξε (t−j+1 )), j = 1, 2, . . . , k1 ;

4. ξε é afim e contínua em cada intervalo [ti−1 , ti ].

Esta curva poligonal ξε é a aproximação de Euler para a solução do Problema de


Cauchy. Mas há um ponto que ainda não está claro. A construção acima só faz sentido
quando (ti , ξ(ti )) ∈ A para cada −k1 ≤ i ≤ k2 , de modo a podermos definir os valores de
Ψ(ti−1 , ξε (ti−1 )) e passarmos ao ponto ti (e o mesmo para os Ψ(t−j+1 , ξε (t−j+1 )) e t−j ).
É exatamente aqui que entra em cena a escolha de δ com M δ0 ≤ R0 . De fato, argumentaremos
que
∀i ∈ {0, . . . , k2 } : (ti , ξε (ti )) ∈ K0 e |ξε (ti ) − x0 |2 ≤ M (ti − t0 ), (16.2) eq:AAgood
o que garante que |ξε (ti ) − x0 |2 ≤ M δ ≤ R0 para todo i (já que ti ∈ [t0 , t0 + δ]). Do mesmo
modo, podemos tratar assim os t−j , o que fica como exercício para o leitor.
Provemos então a equação (16.2). Ela certamente vale para i = 0. Suponha indutiva-
mente que ela vale para i = 0, 1, . . . , r − 1. Veja que, neste caso,

R0
|ξε (tr−1 ) − x0 |2 ≤ M (tr−1 − t0 ) ≤ M δ ≤ ⇒ (tr−1 , ξε (tr−1 )) ∈ K0 .
2
271
Em particular, |Ψ(tr−1 , ξε (tr−1 ))|2 ≤ M . Portanto, usando a hipótese de indução,

|ξε (tr ) − x0 |2 ≤ (tr − tr−1 ) |Ψ(tr−1 , ξε (tr−1 )|2 + |ξε (tr−1 ) − x0 |2 ≤ M (tr − t0 ).

Para terminar esta seção, fazemos duas observações:


1. (t, ξε (t)) ∈ K0 para cada t ∈ [t0 − δ, t0 + δ]. De fato, isto segue do fato que K0 é
convexo (exercício), vale (t, ξε (t)) ∈ K0 quando t = ti (como visto acima) e qualquer
ponto (t, ξε (t)) está num segmento de reta entre (ti−1 , ξε (ti−1 )) e (ti , ξε (ti )).

2. ξε é M -Lipschitz. Isto segue facilmente do fato que ξε é diferenciável em [t0 − δ, t0 + δ]


exceto em um número finito de pontos, e sua derivada tem norma ≤ M .

16.3.3 O problema em forma integral


Nosso objetivo será mostrar que, quando ε ↘ 0, ξε converge para o conjunto de soluções
de do problema de Cauchy. Para levar este plano adiante, será importante ter algum tipo
de continuidade no limite. Já vimos há algum tempo que, para este fim, é melhor ter um
problema envolvendo integrais ao invés de derivadas.
Vamos definir, então, um operador integral que corresponde ao problema (P). Lembre-
se da definição de R0 e δ0 na Seção 16.3.1 e da definição de δ na Seção 16.3.2. Podemos
definir um conjunto
C := C([t0 − δ, t0 + δ], BRd [x0 , R0 ])
de todas as funções contínuas de [t0 − δ, t0 + δ] em BRd [x0 , R0 ]. Veja que a aproximação de
Euler ξε pertence a C. Definimos o operador:

T : C → C([t0 − δ, t0 + δ],RRd )
·
f 7→ T (f )(·) := x0 + t0 Ψ(s, f (s)) ds.
Como já observamos antes, qualquer ponto fixo de T é uma solução de (P) (isto é tão
somente uma consequência do Teorema Fundamental do Cálculo). O lema a seguir será
fundamental para a construção de soluções.

Lema 16.2 T é contínuo.

Prova: Vamos mostrar isto a partir da definição ε/δ de continuidade. Para não confundir
as coisas, vamos usar letras gregas distintas para estes símbolos. Nosso objetivo será o
seguinte.

Objetivo: fixo β > 0, devemos encontrar α > 0 tal que, se f, g ∈ C e ∥f − g∥ ≤ α, então


∥T (f ) − T (g)∥ ≤ β.

Note que há um ligeiro abuso de notação aqui, porque usamos a mesma notação de
norma ∥ · ∥ para dois espaços possivelmente diferentes de funções contínuas. No entanto,
isso não causará confusão.

272
Pare chegar a nosso objetivo, recordamos a definição do compacto K0 na Seção 16.3.1.
Como Ψ |K0 é contínua, logo uniformemente contínua, existe um α > 0 que garante que
β
∀(t, x), (t′ , x′ ) ∈ K0 : |(t, x) − (t′ , x′ )|2 ≤ α ⇒ |Ψ(t, x) − Ψ(t′ , x′ )|2 ≤ .

Em particular, se f, g ∈ C e ∥f − g∥ < α, os pares (t, f (t)) e (t, g(t)) pertencem a K0 para
cada t ∈ [t0 − δ, t0 + δ], de modo que
β
∀t ∈ [t0 − δ, t0 + δ] : |Ψ(t, f (t)) − Ψ(t, g(t))|2 ≤ .

Sabemos que, para cada t0 − δ ≤ t ≤ t0 + δ
Z t

|T (f )(t) − T (g)(t)|2 = (Ψ(s, f (s)) − Ψ(s, g(s)) ds .
t0 2

Como vimos anteriormente, a integral de uma função h com valores em Rd satisfaz


Rt
| t0 h(s) ds|2 ≤ |t − t0 | sups |h(s)|2 . Deduzimos que

|T (f )(t) − T (g)(t)|2 ≤ |t − t0 | sup |Ψ(s, f (s)) − Ψ(s, g(s))|2 < β.


s

Ou seja, |T (f )(t) − T (g)(t)|2 < β, como queríamos demonstrar. 2

16.3.4 Aproximações de Euler são pontos quase-fixos


Nosso próximo objetivo é provar que cada aproximação de Euler é uma quase-solução
para (P), se ε for pequeno o suficiente.

ntpontofixo Lema 16.3 Dado β > 0, existe um ε0 > 0 tal que, se 0 < ε < ε0 , então ∥T (ξε ) − ξε ∥ < β.

(Um corolário importante disto é que, se εk ↘ 0, então ∥T (ξεk ) − ξεk ∥ → 0.)


Prova: Temos que provar que há ε0 como acima tal que, se t ∈ [t0 − δ, t0 + δ], então
|T (ξε )(t) − ξε (t)|2 < β. Provaremos isto apenas para t0 ≤ t ≤ t0 + δ, já que a prova para
t0 − δ ≤ t ≤ t0 é análoga.
Retorne às definições da seção 16.3.2 e veja que ti−1 ≤ t ≤ ti para algum índice i ≥ 1.
Portanto,
i−1
X
ξε (t) = x0 + (tj − tj−1 ) Ψ(tj−1 , ξε (tj−1 )) + (t − ti−1 ) Ψ(ti−1 , ξε (ti−1 )).
j=1

Por outro lado,


i−1 Z
X tj Z t
T (ξε )(t) = x0 + Ψ(s, ξε (s)) ds + Ψ(s, ξε (s)) ds.
j=1 tj−1 ti−1

273
A diferença é igual a
i−1 Z
X tj
T (ξε (t)) − ξε (t) = (Ψ(s, ξε (s)) − Ψ(tj−1 , ξε (tj−1 ))) ds
j=1 tj−1
Z t
+ (Ψ(ti−1 , ξε (s)) − Ψ(ti−1 , ξε (ti−1 ))) ds. (16.3)
ti−1

Observe que (s, ξε (s)) ∈ K0 para todos os s ∈ [t0 , t0 + δ]. Como K0 é compacto e Ψ |K0 é
contínua, existe um α > 0 tal que, se (s, x) e (s′ , x′ ) estão em K0 e |(s, x) − (s′ , x′ )|2 < α,
então |Ψ(s, x) − Ψ(s′ , x′ )|2 < β/2δ. Por outro lado, recorde que ξε é M -Lipschitz, com
M := sup(t,x)∈K0 |Ψ(t, x)|2 . Portanto, se ε < ε0 := α/(M + 1), temos que, para cada termo
de j = 1 a i − 1 da soma acima,
tj−1 ≤ s ≤ tj ⇒ |tj−1 − s| ≤ ε e |ξε (tj−1 ) − ξε (s)|2 ≤ M ε,
de modo que
q
|Ψ(s, ξε (s)) − Ψ(tj−1 , ξε (tj−1 ))|2 ≤ (t − tj−1 )2 + M 2 (t − tj−1 )2 < α
e
i−1 Z tj
X β
| (Ψ(s, ξε (s)) − Ψ(tj−1 , ξε (tj−1 ))) ds|2 ≤ (tj − tj−1 )
j=1 tj−1 δ
O mesmo racicínio dá uma cota para a integral de ti−1 a t:
Z t
(t − ti−1 ) β
| (Ψ(ti−1 , ξε (s)) − Ψ(ti−1 , ξε (ti−1 ))) ds|2 < .
ti−1 δ
As desigualdades acima nos dão cotas para todas as integrais aparecendo em (16.3).
Somando-as, deduzimos:
i−1
X β (t − ti−1 ) β (t − t0 )β
|T (ξε )(t) − ξε (t)|2 ≤ (tj − tj−1 ) + ≤ ≤ β.
j=1
δ δ δ

Ou seja, sempre que 0 < ε ≤ ε0 = α/(M + 1), temos |T (ξε )(t) − ξε (t)|2 < β. 2

16.3.5 Fim da demonstração


Nesta seção, concluímos a prova da existência local de uma EDO. O enunciado exato é o
seguinte.
Teorema 16.5 Defina δ > 0 como na seção 16.3.1 e recorde todas as definições acima. Então o
problema (P) acima tem pelo menos uma solução. De fato, tomando uma sequência {ξεj }j∈N ⊂ C
de aproximações de Euler com εj → 0, alguma subsequência destas aproximações converge a uma
solução de (P). Por fim, se chamamos de S o conjunto de soluções de (P), temos que d(ξε , S) → 0
quando ε → 0.

274
Prova: Vamos trabalhar com todos os ingredientes vistos acima. Em primeiro lugar,
notamos o seguinte.

Afirmação 16.1 O conjunto das funções {ξε }ε>0 é totalmente limitado (portanto seu fecho é
compacto).

Isto segue do teorema de Ascoli-Arzèla. Veja primeiramente que cada aproximação de


Euler é M -Lipschitz, portanto esta família de funções é equicontínua. Temos ainda que
ξε (t0 ) = x0 e portanto, para qualquer t ∈ [t0 − δ, t0 + δ] e ε > 0,

{ξε (t) : ε > 0} ⊂ [x0 − δ M, x0 + δ M ]

é limitado.
Provada esta primeira afirmação, tome εj ↘ 0 como no enunciado. Pela afirmação,
{ξεj }j∈N ⊂ C possui uma subsequência convergente ξεjk → ξ ∈ C quando k → +∞. Veja
que também temos εjk → 0, portanto o Lema 16.3 e a continuidade de T garantem que:

∥T (ξ) − ξ∥ = lim ∥T (ξεjk ) − ξεjk ∥ = 0.


k

Ou seja, ξ é um ponto fixo de T e portanto resolve (P). A última afirmação segue do


exercício a seguir. 2

Exercício 16.6 Considere um espaço métrico (X, dX ). Seja S ⊂ X um subconjunto que a priori
poderia ser vazio. Suponha que uma sequência {xn }n∈N ⊂ X satisfaz as seguintes propriedades.

• Dada qualquer subsequência {xn }n∈N1 , há uma subsubsequência {xn }n∈N2 com N2 ⊃ N1
que é convergente.

• Qualquer subsequência convergente de {xn }n∈N tem limite em S.


n∈N
Mostre que S ̸= ∅ e dX (xn , S) → 0 (ou seja, a sequência inteira converge a S). Use isto para
terminar a demonstração acima.

275
276
Capítulo 17

Subconjuntos densos de C(K, R): o


teorema de Stone-Weierstrass

Neste conjunto, investigamos um critério para que um subconjunto A ⊂ C(K, R) seja


denso neste espaço. Ou seja, queremos encontrar condições suficientes para que

∀f ∈ C(K, R), ∀ε > 0, ∃g ∈ A : ∥f − g∥K,∞ ≤ ε.

Isso é importante? Sim, e muito! Uma maneira de ver isso é pensando no seguinte:

Exemplo 17.1 Como um computador pode armazenar uma função contínua de K em R?

A resposta simples é que não pode. Uma função contínua f : K → R é uma “lista" não
enumerável de valores reais (f (t))t∈K . Como poderíamos guardar uma descrição de um
objeto destes com memória finita?
Por outro lado, se temos um subconjunto denso e simples de C(K, R), pode ser que
seja sim possível guardar uma descrição finita deste objeto. Por exemplo, o teorema
de Weierstrass abaixo mostra que os polinômios multivariados de coeficientes racionais
são densos em C(K, R) para qualquer compacto K ⊂ Rd . Não é difícil perceber que
cada polinômio deste tipo pode ser descrito com uma quantidade finita de memória.
Como estes polinômios são densos em C(K, R), vemos que qualquer função pode ser bem
aproximada por um objeto com descrição finita. Isto é análogo ao fato que todo número
real pode ser bem aproximado por um racional.
Uma outra questão interessante, que veremos mais adiante, é a seguinte.

Exemplo 17.2 Uma rede neural de duas camadas pode aproximar qualquer função contínua.

Uma “rede neural de duas camadas"é um tipo bem específico de função de K ⊂ Rd em


R. Estas funções vem sendo usadas desde os anos 60 como modelos da “computação" feita
nos nossos cérebros e também como parte de sistemas artificiais inteligentes. O teorema
que provaremos mais adiante nos dará uma explicação parcial para o sucesso destas redes.

277
Exemplo 17.3 Para outro exemplo, considere o conjunto Cper ([0, 2π], R) de funções f : [0, 2π] →
R contínuas com f (0) = f (2π). Veremos abaixo que cada função deste tipo pode ser pensada como
uma função f˜ : S1 → R e que, usando esta conexão, podemos aproximar cada f ∈ Cper ([0, 2π], R)
por combinações lineares de sin kt e cos mt, m, k ∈ N. Isso tem algo a ver com a teoria de séries de
Fourier.

17.1 O teorema geral


Nesta seção, enunciaremos o teorema de Stone-Weierstrass, que nos dá um critério sufi-
ciente para provar que um subconjunto A ⊂ C é denso. A partir de agora, (K, dK ) é um
espaço métrico compacto e C := C(K, R). Precisaremos de uma definição.

Definição 17.1 Uma álgebra A ⊂ C é um conjunto de funções fechado por combinações lineares
e produtos de seus elementos. Isto é, A é álgebra se dados quaisquer f, g ∈ A e α ∈ R, vale que
α f + g ∈ A e f g ∈ A.

Por exemplo, se K ⊂ R, vemos que as funções polinomiais de K em R formam uma


álgebra de C(K, R), porque o produto de polinômios é um polinômio. Um exemplo
importante para o que vem a seguir é o seguinte.

ex:poliSW Exemplo 17.4 Sempre que A é uma álgebra e p : R → R é um polinômio, vale a seguinte
afirmação:
∀f ∈ A : p ◦ f ∈ A.

De fato, considere um polinômio p(x) = di=0 xi , com a0 , . . . , ad ∈ R constantes e x


P

variável. Veja que p ◦ f = di=0 ai f i . Se f ∈ A, f i ∈ A para cada i ∈ N, porque A é fechada


P

por produto, e di=0 ai f i ∈ A é uma combinação linear de elementos de A.


P
Nosso teorema geral dá uma condição suficiente simples de checar para que uma
álgebra seja densa em C.

Teorema 17.1 (Stone-Weiertrass) Considere uma álgebra A ⊂ C(K, R). Suponha que A satis-
faz as seguintes condições adicionais:

1. A contém todas as funções constantes. De fato, basta pedir que a função constante 1 ∈ A,
porque toda outra função constante é produto desta por um escalar.

2. A separa pontos: isto é, dados t0 , t1 ∈ K distintos, existe uma f ∈ A com f (t0 ) ̸= f (t1 ).

Então A é denso em C(K, R). Isto é:

∀ε > 0 ∀f ∈ C(K, R) ∃g ∈ A : ∥f − g∥K,∞ ≤ ε.

Vejamos um corolário imediato disso.

278
Exemplo 17.5 (Teorema Multidimensional de Weierstrass) Considere K ⊂ Rd . Um po-
linômio multivariado é uma função da forma
X d
Y
p : “x ∈ K 7→ a(n1 ,n2 ,...,nd ) (x[i])ni ”,
(n1 ,n2 ,...,nd )∈{0,1,...,k}d i=1

com k ∈ N\{0} e coeficientes a(n1 ,n2 ,...,nd ) ∈ R.


É um exercício checar que o subconjunto A ⊂ C(K, R) dos polinômios multivariados
é uma álgebra de C que contem as constantes e separa pontos. Portanto, A é denso
em C(K, R). Como cada elemento de A pode ser aproximado por um polinômio de
coeficientes racionais, estes últimos também são densos em C(K, R).

17.1.1 Prova do teorema de Stone-Weierstrass


Provaremos nesta subseção o teorema de Stone-Weiertrass, mas antes disso discutiremos
as principais ideias da prova.
Uma das noções centrais na demonstração será a de indicadores de conjuntos. Dado
S ⊂ K, chamamos de indicadora de S a função
1, se x ∈ K;

IS : x ∈ K 7→
0, se x ̸∈ K.
Nossa prova está baseada em duas ideias fundamentais. Por um lado, vamos usar o
seguinte princípio básico.
Ideia 1: toda função contínua f ≥ 0 pode ser bem aproximada por uma combinação finita de
funções indicadoras de conjuntos “bons".
Depois provaremos o seguinte.
Ideia 2: toda indicadora de conjunto “bom" pode ser bem aproximada por uma combinação linear
simples de elementos da álgebra.
Esta descrição intuitiva pode parecer meio duvidosa por dois motivos. Em primeiro
lugar, o que é um conjunto bom? E em segundo, como eu poderia aproximar uma
indicadora por um elemento da álgebra? A resposta para a primeira pergunta é que os
conjuntos bons são fechados. Isso, no entanto, não resolve nossas dúvidas sobre a segunda
pergunta. Afinal, considere uma função indicadora de um fechado, IF . Esta função em
geral é bastante descontínua. De que forma poderíamos aproximar IF por um elemento
da álgebra A, dado que todos os elementos da álgebra são funções contínuas? 1
A resposta será dada no lema a seguir. Na verdade, não buscaremos uma aproximação
de IF por a ∈ A na norma do supremo. O que sim queremos é que uma outra noção de
aproximação.
1De fato, não pode ser verdade que para todo ε > 0 há uma função contínua h com ∥h − IF ∥∞ ≤ ε, pois
neste caso IF seria o limite uniforme de funções contínuas e portanto seria ela própria contínua.

279
ndamentalSW Lema 17.1 (Lema Fundamental) Seja A uma álgebra satisfazendo as hipóteses do teorema de
Stone-Weierstrass. Então dados quaisquer dois fechados disjuntos F, G ⊂ K e qualquer η ∈ (0, 1),
existe uma aF,G,η ∈ A tal que 0 ≤ aF,G,η ≤ 1 e além disso aF,G,η |F ≥ 1 − η, aF,G,η |G ≤ η.
Este “Lema Fundamental" será provado na subseção 17.1.2, seguinte à atual. Por ora
nós o usaremos como uma “caixa-preta" para terminar a prova.
Um breve exame do Lema nos mostra que ele pode ser expressado através de indi-
cadoras. Podemos pensar que o conjunto F acima é aquele cuja indicadora queremos
aproximar e que G é escolhido de modo a Gc \F seja “pequeno"e portanto Gc ≈ F . Veja
que vale o seguinte:
1. aF,G,η ≥ (1 − η) IF . De fato, isto quer dizer que aF,G,η (t) ≥ 1 − η para t ∈ F e
aF,G,η (t) ≥ 0 sempre.
2. aF,G,η ≤ IGc + η. Ou seja, aF,G,η (t) ≤ 1 + η para qualquer t ∈ K e aF,G,η (t) ≤ η para
t ∈ G.
Isto nos prova o seguinte corolário do Lema Fundamental.
ndamentalSW Corolário 17.1 (do Lema Fundamental) Se A ⊂ C satisfaz as condições do Teorema de Stone-
Weierstrass, podemos encontrar, para quaisquer η ∈ (0, 1) e F, G ⊂ K fechados e disjuntos, uma
função aF,G,η ∈ A com:
(1 − η) IF ≤ aF,G,η ≤ IGc + η.
Como podemos usar esse corolário em nossa prova? Como já dissemos, a ideia é
aproximar f por uma soma de indicadoras. De alguma forma estas indicadoras devem
ser de conjuntos fechados de K, para que possamos usar nosso Lema Fundamental. Mas
como podemos fazer isso? A prova a seguir responde a esta indagação.

Prova: [de Stone-Weiertrass] No que vem a seguir, mostraremos como aproximar uma
f ≥ 0 em C := C(K, R) por uma g ∈ A na norma do supremo. Afirmamos que isto implica
que toda f ∈ C pode ser bem aproximada por elementos de A. De fato, se toda função
não-negativa pode ser bem aproximada e agora queremos aproximar uma f qualquer,
podemos fazê-lo pelos seguintes passos:
1. Somamos uma constante λ ≥ ∥f ∥∞ a f , de modo que f + λ ≥ 0.
2. Aproximamos f + λ por g ∈ A com ∥f + λ − g∥∞ ≤ ε.
3. Observar que f + λ − g = f − (g − λ) com g − λ ∈ A: afinal, g ∈ A, λ ∈ A (porque
as constantes estão lá) e g − λ é combinação linear destas duas funções. Deduzimos
que ∥f − (g − λ)∥∞ ≤ ε com g − λ ∈ A.
Suponha então a partir de agora que f ≥ 0. Vamos aproximar f por uma combinação
linear de conjuntos fechados. Primeiramente fixamos parâmetros η, α ∈ (0, 1) que serão
ajustados mais tarde. Definimos:
Fn := {x ∈ K : f (x) ≥ α n} = f −1 ([n, +∞)), n = 0, 1, 2, . . . , mα , onde mα := ⌈∥f ∥∞ /α⌉+1).

280
Nada nos impede em princípio de tomar n > m – de fato, faremos isso abaixo –, mas
observe que neste caso Fn = ∅, já que:
n > m ⇒ α n > ∥f ∥∞ ⇒ f (x) < α n for all x ∈ K ⇒ Fn = ∅.
Cada conjunto Fn é fechado porque [n, +∞) ⊂ R é fechado e f é contínua. Veja ainda
que F0 = K (porque f ≥ 0) e F0 ⊃ F1 ⊃ F2 ⊃ · · · ⊃ Fm ⊃ . . . , ou seja, temos fechados
encaixados.
Como podemos relacionar f aos indicadores IFn ? A ideia agora é imaginar que α é
um número muito pequeno. Neste caso, dado qualquer x ∈ K, se sabemos qual é o maior
índice 0 ≤ n(x) ≤ m tal que x ∈ Fn , praticamente sabemos o valor de f . De fato, veja que,
se escolhemos este maior índice,
x ∈ Fn(x) e x ̸∈ Fn(x)+1 ⇒ αn(x) ≤ f (x) < α (n(x) + 1).
Agora vem um ponto crucial: o valor do maior índice n = n(x) ∈ {0, 1, . . . , mα } tal que
x ∈ Fn pode ser expresso pela soma de indicadores! Melhor dizendo,

X
n(x) = max{0 ≤ n ≤ mα : Fn ∋ x} = IFj (x).
j=1

De fato, como os conjuntos Fj são encaixados,


∀0 ≤ j ≤ mα : IFj (x) = 1 ⇔ x ∈ Fj ⇔ j ≤ n(x).
Ou seja, n(x) é exatamente o número de termos iguais a um na soma de indicadores,
sendo que todos os outros termos valem 0. Deduzimos que:
mα mα
!
X X
∀x ∈ K : α IFj (x) ≤ f (x) < α IFj (x) + 1 (17.1) eq:aproxind
j=1 j=1

Temos agora de aplicar o corolário do Lema Fundamental a cada par de conjuntos

F = Fn , G = (K\Fn−1 ).
Para isso, devemos checar as condições daquele Lema.
• F e G são fechados. F = Fn é fechado, como vimos acima. G é um fecho, e todo fecho
é fechado.
• F e G são disjuntos. Dado x ∈ G, mostraremos que x ̸∈ Fn = F . De fato, x ∈ G
implica que xk → x para alguma sequência {xk }k ⊂ K\Fn−1 . Como xk ̸∈ Fn−1 ,
f (xk ) < (n − 1) α e isso vale para cada k ∈ N. Tomando limites,
f (x) = lim f (xk ) ≤ (n − 1)α < nα.
k

Como Fn = {y ∈ K : f (y) ≥ nα}, concluímos que x ̸∈ Fn , como queríamos


demonstrar.

281
Seja, então, an = aF,G,η ∈ A a função cuja existência é garantida pelo lema fundamental.
Veja que, pelo corolário,
(1 − η) IFn ≤ an ≤ IFn+1 + η, (17.2) eq:comparaa
e isto vale para cada índice 1 ≤ n ≤ m. Definimos finalmente:

X
g = gη,α := α an ,
j=1

que pertence a A porque é combinação linear dos elementos an ∈ A.


Provaremos a seguir que esta é uma boa aproximação para f , se α e η são pequenos o
suficiente. Para isso, temos que combinar as desiguadades entre an e indicadores (contidas
em (17.2)) com a equação relacionando f com indicadoras (veja (17.1)). O resultado é que
para todo x ∈ K:

X
gη,α (x) = α an (x)
n=1

X
(parte esquerda de (17.2) + 0 < η < 1) ≥ (1 − η) α IFn (x)
n=1
(parte direita de (17.1)) ≥ (1 − η) (f (x) − α); e ainda,

X
gη,α (x) = α an (x)
n=1

X mα
X
(parte direita de (17.2)) ≤ α IFn+1 (x) + α η 1
n=1 n=1

X
(renumere índices + use Fmα +1 = ∅) ≤ α IFj (x) + α η mα
j=2
(parte esquerda de (17.1) + αIF1 (x) ≥ 0) ≤ f (x) + α η mα
(mα = ⌈∥f ∥∞ /α⌉ + 1 ≤ ∥f ∥∞ /α + 2) ≤ f (x) + η (∥f ∥∞ + 2α).

Concluímos que

∀x ∈ K : −η f (x) − (1 − η)α ≤ g(x) − f (x) ≤ η (∥f ∥∞ + 2α).

Portanto,
∥f − gη,α ∥∞ ≤ max {η∥f ∥∞ + α, η (∥f ∥∞ + 2α)} .
Dado um ε > 0, podemos escolher η e α de modo a garantir que o lado direito desta
última desigualdade é ≤ ε. Isto nos diz então que há uma g = gη,α ∈ A com ∥f − g∥∞ ≤ ε.
Como isto vale para f ∈ C não negativa e ε > 0 arbitrários, está demonstrado o teorema
de Stone-Weierstrass, a menos do Lema Fundamental. 2

282
17.1.2 Prova do Lema Fundamental
:lemafundSW
Nesta seção o nosso objetivo é provar o Lema Fundamental 17.1, o que encerrará a prova
do teorema de Stone-Weierstrass. Uma observação que se repetirá várias vezes é que,
como K é compacto, F, G e todos os outros subconjuntos fechados de K são compactos.
Outra observação importante será a seguinte.
Observação 17.1 A desigualdade de Bernoulli diz que:
∀x ∈ R : x ≥ −1 ⇒ (1 + x)n ≥ 1 + nx.
Também usaremos abaixo a desigualdade:
∀x ∈ R : 1 + x ≤ ex .
Esta segunda desigualdade é consequência da convexidade da exponencial, mas também pode ser
provada via Bernoulli. De fato, se recordamos que exp(x) = limn→+∞ (1 + x/n)n para todo x ∈ R
e observamos que :
x  x n
∀n ∈ N com |x| ≤ n, ≥ −1 e portanto 1 + ≥ 1 + x,
n n
basta tomar n → +∞ para terminar a prova.
Também precisaremos do seguinte resultado que transforma uma “pequena separa-
ção" de valores de uma a ∈ A numa “grande separação". Melhor dizendo: se a toma
valores pequenos em um conjunto G e um pouco maiores em F , a composição p ◦ a de a
com um polinômio p bem escolhido fará os valores de a |G ainda menores e os de a |F tão
próximos de 1 quanto se possa querer. (Recorde que p ◦ a ∈ A pelo exemplo 17.4 acima.)
Proposição 17.1 (Explosão da separação) Dados ξ, δ ∈ (0, 1), existe um polinômio p : R → R
tal que 0 ≤ p |[0,1] ≤ 1, p |[0,δ/2] ≤ ξ e p |[δ,1] ≥ 1 − ξ.
Prova: Prosseguimos agora com a demonstração. Fixe δ ∈ (0, 1/2) como no enunciado.
Escolha o menor k ∈ N com kδ ≥ 1 e observe que (k − 1)δ ≤ 1, portanto kδ ≤ 1 + δ < 2.
Ou seja, encontramos um k ∈ N tal que

< 1 e kδ > 1.
2
Dado um n ∈ N, defina o polinômio:
n
pn (x) := 1 − (1 − xn )k .
Veja que 0 ≤ pn (x) ≤ 1 para quaisquer n ∈ N e x ∈ [0, 1]. Se x ≥ δ,
n
1 − pn (x) = (1 − xn )k ≤ exp(−(xk)n ) ≤ exp(−(δk)n ) ≤ ξ
para qualquer n grande o suficiente, já que δk > 1 (aqui usamos que 1 + t ≤ et para todo
t ∈ R). Por outro lado, se 0 ≤ x ≤ δ/2,
n
pn (x) = 1 − (1 − xn )k ≤ (kx)n ≤ (δk/2)n ≤ ξ
para todo n grande o suficiente, já que δk/2 < 1 (aqui usamos a desigualdade de Bernoulli).
Portanto, o p que desejamos obter é dado por pn , para n grande o suficiente. 2

283
Vamos agora à prova do Lema Fundamental. Nosso objetivo é construir uma a ∈ A que
“quase separa" F e G e que se mantém entre 0 e 1. Começamos com algo muito mais fraco,
sobre separar pontos.
Proposição 17.2 Dados x0 , x1 ∈ K quaisquer, existe uma vx0 ,x1 ∈ A com 0 ≤ vx0 ,x1 ≤ 1,
vx0 ,x1 (x1 ) > vx0 ,x1 (x0 ) = 0.
Prova: Lembre que A separa pontos: dados x0 , x1 ∈ K, existe u ∈ A com u(x0 ) ̸= u(x1 ). Em
particular, u(·) − u(x0 ) ∈ A (diferença entre u e uma constante, e as constantes pertencem
a A), ∥u(·) − u(x0 )∥∞ > 0 e portanto
(u(·) − u(x0 ))2
v(·) := ∈A
∥u(·) − u(x0 )∥2
satisfaz 0 ≤ v ≤ 1, v(x0 ) = 0 < v(x1 ). 2
O próximo passo é criar, para cada ponto x0 ∈ G, uma função em A separando x0 de
F.
Proposição 17.3 Dado qualquer x0 ∈ G, existe uma bx0 ∈ A com 0 ≤ bx0 ≤ 1, bx0 (x0 ) = 0,
bx0 |F > 0.
Prova: Para isso, tome uma função vx0 ,x1 como na proposição anterior para cada x1 ∈ F .
Temos vx0 ,x1 (x0 ) = 0 e vx0 ,x1 (x1 ) > 0, logo cada x1 ∈ F está contido numa vizinhança
Ax1 ∋ x1 onde vx0 ,x1 é estritamente positiva. Como F ⊂ K é fechado e K é compacto,
o próprio F é compacto. Além disso, ∪x1 ∈F Ax1 ⊃ K porque cada x1 ∈ Ax1 . Como F é
compacto, podemos cobri-lo por um número finito destas vizinhanças, digamos Ax(j) para
1
1 ≤ j ≤ k. Afirmamos que
k
1X
bx0 := v (j)
k j=1 x0 ,x1
é a função desejada. De fato, ela está em A pois é combinação convexa de funções em A.
Como cada 0 ≤ v ≤ 1, 0 ≤ bx0 ≤ 1 também. bx0 claramente vale 0 em x0 ; por outro lado,
se x ∈ F , x ∈ Ax(j) para algum j, de modo que vx0 ,x(j) (x) > 0 e portanto bx0 (x) > 0 2
1 1

Neste momento já temos as principais ideias para terminar a prova. Veja que usamos
acima o fato que F é compacto para cobrir este conjunto com abertos onde pelo menos
uma das funções v consideradas tem valor positivo. A ideia básica será agora cobrir G
com um número finito de abertos onde pelo menos uma das bx0 é pequena. Depois disso,
quase bastará tomar um produto destas funções para acabar a prova. O detalhe sutil é
que temos que garantir que a função obtida é “grande" em F e para isso precisaremos da
proposição sobre explosão de separação que provamos acima.
Prova: [do Lema Fundamental] Para cada x0 ∈ G podemos escolher uma função 0 ≤
bx0 ≤ 1 como na proposição anterior. Sabemos que bx0 (x0 ) = 0 e bx0 (x) > 0 sobre F . Pela
compacidade de F ,
∃δ(x0 ) ∈ (0, 1) : inf bx0 (x) ≥ δ(x0 ).
x∈F

284
Podemos então encontrar uma vizinhança aberta Ux0 ∋ x0 onde bx0 |Ux0 ≤ δ(x0 )/2. Ou
seja, G é coberto pela coleção de abertos Ux0 , x0 ∈ G, e em cada um destes abertos
bx0 (x) ≤ δ(x0 )/2 enquanto bx0 |F ≥ δ0 (x).
Como G é compacto, podemos escolher uma subcoleção finita destes abertos, chamada
de U1 , . . . , Uk , com a seguinte propriedade:
Para cada 1 ≤ i ≤ k existem δi ∈ (0, 1) e bi ∈ A com 0 ≤ bi ≤ 1 e bi |Ui ≤ δi /2 e bi |F ≥ δi .
Agora precisamos construir uma única função que valha “muito" em F e “pouco" em G.
Para isso, fixamos o η ∈ (0, 1) desejado. Pela proposição sobre Explosão de Separação,
podemos conseguir polinômios pi tais que pi (x) ∈ [0, 1] para x ∈ [0, 1], pi (x) ≤ η/k se
0 ≤ x ≤ δi /2 e pi (x) ≥ 1 − η/k se x ∈ [δi , 1]. Veja que cada função ci := pi ◦ bi está em A
(ver a observação no início da prova), toma valores em [0, 1] e satisfaz:
η η
ci |Ui ≤ , ci |F ≥ 1 − .
k k
Podemos finalmente definir a = aF,G,η := i=1 ci e observar que ela tem as propriedades
Qk
desejadas:
1. 0 ≤ a ≤ 1 pertence a A porque é produto de funções com estas propriedades;
2. Para x ∈ G, temos x ∈ Ui para algum i, de modo que ci (x) ≤ η/k e a(x) =
Qk
j=1 cj (x) ≤ η/k < η.

3. Para x ∈ F , ci (x) > 1 − η/k para cada 1 ≤ i ≤ k e portanto a(x) ≥ (1 − η/k)k ≥ 1 − η


(pela desigualdade de Bernoulli).
2

Exercício 17.1 Dado F ⊂ Rd , considere o subconjunto C(K, F ) ⊂ C(K, Rd ) que consiste de


todas as f ∈ C(K, Rd ) com f (t) ∈ F para todo t ∈ K. Prove que C(K, F ) é um subconjunto
fechado de C(K, Rd ) se e somente se F é um subconjunto fechado de Rd . Dê um exemplo em que
F ⊂ Rd é compacto, mas C(K, F ) não é compacto.
Exercício 17.2 Considere o conjunto A de todas as funções f ∈ C([0, 1], Rd ) que são afins por
partes, isto é, tais que existem pontos 0 = t0 < t1 < t2 < · · · < tk = 1 tais que, para cada intervalo
   
t − ti−1 ti − t
∀1 ≤ i ≤ k, ∀t ∈ [ti−1 , ti ] : f (t) = f (ti−1 ) + f (ti ).
ti − ti−1 ti − ti−1
Mostre que A é denso em C([0, 1], Rd ).
Exercício 17.3 Suponha que A1 , . . . , Ad ⊂ C([0, 1], R) são subálgebras contendo funções cons-
tantes e separando pontos em [0, 1]. Considere o conjunto A ⊂ C([0, 1]d , R) que contem todas as
combinações lineares de funções da forma
h(x) = h1 (x[1]) h2 (x[2]) . . . hd (x[d]) (x ∈ [0, 1]d ).
Mostre que A é denso em C([0, 1]d , R). Deduza como caso particular que os polinômios multiva-
riados são densos em C([0, 1]d , R).

285

Você também pode gostar