Escolar Documentos
Profissional Documentos
Cultura Documentos
notas de aula
15 de junho de 2023
I Os objetos fundamentais 9
1 Prólogo 11
1.1 Fatos sobre R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.1 Intervalos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.1.2 Limites e convergência de sequências . . . . . . . . . . . . . . . . . . 12
1.1.3 Limites superior e inferior . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.1.4 Limites e convergência de séries . . . . . . . . . . . . . . . . . . . . . 13
1.1.5 Limites de funções, continuidade, máximos e mínimos . . . . . . . . 15
1.1.6 Derivadas e integrais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2 Algumas funções especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.2.1 A função exponencial . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
1.2.2 A função logaritmo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2.3 As funções seno e cosseno . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.3 A desigualdade das médias . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
3
3.2.1 Subsequências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2.2 Convergência em Rd com as normas ℓp . . . . . . . . . . . . . . . . . . 51
3.2.3 Convergência sob a métrica discreta . . . . . . . . . . . . . . . . . . . 53
3.2.4 Convergência em C(I, R) . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.3 Equivalência de métricas e normas . . . . . . . . . . . . . . . . . . . . . . . . 57
3.4 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
4 Funções e continuidade 63
4.1 Funções contínuas de X em R . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.2 Funções Lipschitz e distâncias . . . . . . . . . . . . . . . . . . . . . . . . . . . 64
4.3 Funções contínuas sobre o espaço de funções contínuas . . . . . . . . . . . . 66
4.4 Funções contínuas de X em Rd . . . . . . . . . . . . . . . . . . . . . . . . . . 69
4.5 Transformações e funcionais lineares . . . . . . . . . . . . . . . . . . . . . . . 69
4.6 Transformações multilineares e tensores . . . . . . . . . . . . . . . . . . . . . 72
4.6.1 Tensores em dimensão finita . . . . . . . . . . . . . . . . . . . . . . . 75
4.6.2 Alguns exemplos em dimensão infinita . . . . . . . . . . . . . . . . . 76
4.7 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78
4
7 Compactos: casos particulares 125
7.1 Compactos de Rd : o Teorema de Heine-Borel . . . . . . . . . . . . . . . . . . 125
7.2 Aplicações do teorema de Heine-Borel . . . . . . . . . . . . . . . . . . . . . . 127
7.2.1 Todas as normas sobre Rd são equivalentes . . . . . . . . . . . . . . . 127
7.2.2 Funções contínuas e convergência uniforme sobre compactos . . . . 128
7.3 Compactos nos espaços de funções contínuas . . . . . . . . . . . . . . . . . . 135
7.3.1 Bolas fechadas não são compactas . . . . . . . . . . . . . . . . . . . . 135
7.3.2 O teorema de Arzelà-Ascoli . . . . . . . . . . . . . . . . . . . . . . . . 135
7.4 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
5
11.2.4 O caso em que W tem dimensão finita . . . . . . . . . . . . . . . . . . 182
11.2.5 A derivada do determinante . . . . . . . . . . . . . . . . . . . . . . . 183
11.3 Boas propriedades da derivada de Fréchet . . . . . . . . . . . . . . . . . . . . 186
11.3.1 A regra da cadeia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 186
11.3.2 A desigualdade do valor médio . . . . . . . . . . . . . . . . . . . . . . 187
11.4 Derivadas mais complicadas de se calcular . . . . . . . . . . . . . . . . . . . 189
11.4.1 Exemplos no espaço de operadores lineares . . . . . . . . . . . . . . . 189
11.4.2 Um exemplo sobre as funções contínuas . . . . . . . . . . . . . . . . . 193
11.5 Mais exercícios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
6
14.5.1 Trocas de cartas são difeomorfismos . . . . . . . . . . . . . . . . . . . 253
7
8
Parte I
Os objetos fundamentais
9
Capítulo 1
Prólogo
Este capítulo pode ser ignorado. Ele só contem alguns fatos úteis.
O objetivo deste curso será começar um estudo de Análise em espaços vetoriais e (de
forma mais geral) em espaços métricos. Por um lado, estes dois conceitos generalizam
a reta real R. Por outro, fazer Análise nestes espaços requer contas e resultados vindos
do mundo unidimensional da reta real. Portanto, há dois pré-requisitos fundamentais
para nosso curso: um bom curso de Análise na Reta e um conhecimento operacional de
Álgebra Linear. É possível que alguns alunos sobrevivam sem um dos pré-requisitos, mas
será basicamente por conta própria: não poderemos parar por muito tempo para rever
estes dois assuntos.
Nesta seção recordaremos alguns fatos e resultados importantes para tudo que vem a
seguir.
1.1.1 Intervalos
Lembre-se que um intervalo I ⊂ R é um conjunto da forma [a, b), (a, b], (a, b) ou [a, b] com
a, b ∈ R ∪ {±∞}. Por convenção, o intervalo é vazio se a > b; além disso, permitimos
a, b = ±∞ quando a extremidade correspondente do intervalo for aberta. Chamamos I de
intervalo compacto se a, b ̸= ±∞ e as duas extremidades são fechadas. Usaremos a notação
R+ := [0, ∞). Usaremos muitas vezes o resultado a seguir.
11
1.1.2 Limites e convergência de sequências
Uma sequência de números reais {xn }n∈N ⊂ R converge a x ∈ R – ou xn → x, ou
x = limn∈N xn – se, dado qualquer ε > 0, podemos encontrar um n0 ∈ N tal que, para
qualquer n ∈ N com n ≥ n0 , temos |x − xn | < ε. Simbolicamente, podemos escrever isto
da seguinte forma
Exercício 1.2 Prove que uma sequência {xn }n∈N ⊂ R converge a ±∞ se e somente se
xn
lim = ±1.
n∈N 1 + |xn |
Além disso, se uma sequência converge, toda subsequência sua converge ao mesmo li-
mite. Nada impede, aliás, de tomarmos subsequências de subsequências, como faremos
algumas vezes abaixo.
Uma propriedade importante dos intervalos compactos I ̸= ∅ é que toda sequência em
I possui uma subsequência convergindo a um ponto de I.
temos lim inf xn ≤ lim sup xn , com igualdade se e somente se ∃ limn xn ∈ R ∪ {±∞}.
12
1.1.4 Limites e convergência de séries
DadosPnúmeros a1 , a2 , . . . , an , · · · ∈ R, dizemos que a se existe j=0 aj .
P Pn
série n a n converge limn→+∞
Caso n |an | convirja, dizemos que n an é absolutamente convergente. Pode-se provar que,
P
a convergência absoluta implica convergência usual. No entanto, a recíproca não vale.
As
P condições lim supn |an+1 |/|an | < 1 e lim supn |an | < 1 são suficientes para garantir
1/n
que n∈N an é absolutamente convergente. De fato, nos dois casos a prova da convergência
absoluta se baseia em progressões geométricas, ou seja, no fato que:
∞ 1
X
n 1−ρ
, 0 ≤ ρ < 1;
∀ρ ∈ R+ , ρ =
n=0
+∞, ρ ≥ 1.
Por hipótese, sabemos que limk Pk = n∈N bn . Além disso, as duas séries
P P
n∈N an
neste produto são convergentes. Podemos ainda observar que as duas somas se parecem,
no seguinte sentido:
2k
! 2k s
!
X X X X
Pk = ai b j = ai bs−i ξi,s,k ,
s=0 0≤i,j≤k : i+j=s s=0 i=0
13
onde
1 se i ≤ k e s − i ≤ k;
ξi,s,k =
0 em caso contrário.
Começamos a prova com um caso particular do teorema.
Passo 1: se os ai e bj são não-negativos, então vale o teorema.
Note que, neste caso, {Hk }k∈N é uma sequência de somas parciais
P de uma série com
termos não-negativos. Se provarmos que ela converge a n∈N bn , garantimos
P
n∈N an
automaticamente que a série limk Hk converge absolutamente.
Basta, portanto, provar que limk Hk = limk Pk . Para fazer isto, observe primeiramente
que todos os termos da soma que define H2k , que é
2k s
!
X X
H2k = ai bs−i
s=0 i=0
aparecem na soma Pk multiplicados por ξi,s,k ∈ {0, 1}. Ou seja, Pk é a soma de alguns termos
que aparecem em H2k . Como todos estes termos são não-negativos, concluímos que
Pk ≤ H2k . (Se o leitor preferir, pode fazer um argumento mais algébrico:
2k s
!
X X
H2k − Pk = ai bs−i (1 − ξi,s,k ) ≥ 0
s=0 i=0
ou seja, ! !
X X
lim Hk = an bn .
k
n∈N n∈N
14
Passo 2: estendendo a prova para ai e bj gerais.
Até agora trabalhamos supondo que ai , bj ≥ 0. Vamos agora ver o que acontece no
caso geral. Usando o Passo 1, vemos que
n
! ! !
X X X X
|ai | |bn−i | = |an | |bn | < +∞, (1.1) eq:positiva
n∈N i=0 n∈N n∈N
O último termo acima é a cauda da série n ( si=0 |ai | |bs−i |), que aparece do lado esquerdo
P P
de (1.1). Como esta série converge, sua cauda vai a 0 e concluímos |Pk − H2k | → 0 quando
k → +∞. Portanto,
! !
X X
lim Hk = lim H2k = lim Pk = an bm .
k k k
n m
lim f (y) = a
y→x
15
se para qualquer sequência {yn }n∈N ⊂ I\{x} com yn → x temos também f (yn ) → a.
Dizemos que f é contínua em x ∈ I se limy→x f (y) = f (x).
Se I é compacto, toda função contínua tem duas propriedades adicionais automatica-
mente. A primeira é que ela atinge seus supremo e ínfimo: isto é,
Em particular, f é limitada.
A segunda propriedade que temos sobre intervalos compactos é que f é uniformemente
contínua. Isto quer dizer que, se definimos o módulo de continuidade de f :
Exercício 1.3 Dê exemplos de funções contínuas sobre I aberto que não são limitadas ou unifor-
memente contínuas.
f (y) − f (x)
∃f ′ (x) := lim .
y→x y−x
x n−1
x−aX i (x − a)
Z
I(f )(x) := f (t) dt = lim f a+ .
a n→+∞ n i=0 n
Ou seja, I(f ′ )(x) = f (x) − f (a) e I(g)′ (x) = g(x) para quaisquer f, g : [a, b] → R tais que f ′
e g são Riemann-integráveis.
Recordamos ainda que toda função diferenciável é contínua.
16
1.2.1 A função exponencial
Definimos a função exponencial através da série de potência usual.
+∞ n
X t
exp(t) := , t ∈ R. (1.2)
n=0
n!
Note que a definição acima faz sentido porque a série converge absolutamente para
qualquer t ∈ R. Pode-se verificar isto a partir do teste da razão:
17
Prova: Queremos mostrar que
exp(t + h) − exp(t)
Queremos: → exp(t) quando h → 0.
h
Usando o fato que exp(t + h) = exp(t) exp(h), observamos que o que queremos equivale
a:
(exp(h) − 1) exp(t)
Queremos (equivalente): → exp(t) para todo t,
h
e para isto basta provar que
exp(h) − 1
Basta: → 1.
h
Para tal, observe que
∞
X hn
exp(h) − 1 = = h + R(h)
n=1
n!
com
X hn
R(h) = .
n≥2
n!
Como n! ≥ 1 sempre, podemos comparar a série de R(h) termo a termo com a série
geométrica:
X |h|n X |h|2
∀|h| ≤ 1/2 : |R(h)| ≤ ≤ |h|n = .
n≥2
n! n≥2
1 − |h|
Como o lado direito desta desigualdade tende a 0 quando h → 0, deduzimos que |(exp(h)−
1)/h − 1| → 0, o que encerra a prova. 2
18
Proposição 1.4 exp é estritamente crescente. Além disso, limt→+∞ exp(t) = +∞ e limt→+∞ exp(−t) =
0.
Prova: As duas proposições anteriores implicam que exp tem derivada estritamente posi-
tiva em todo ponto da reta. Portanto, exp é estritamente crescente. Em particular, isto quer
dizer que há um a > 0 com exp(a) = m > 1 = exp(0). Usando o raciocínio da proposição
anterior, vemos que
Em particular, dado M > 0 existe um t ∈ R como exp(t) > M . Como exp é crescente, isto
implica que exp(t) → +∞ quando t → +∞.
Por outro lado, a regra de que adição vira produto implica que
1
exp(−t) = → 0 quando t → +∞.
exp(t)
2
Proposição 1.5 exp(R) = R+ \{0} Além disso, exp é uma bijeção entre domínio e imagem.
Prova: Já vimos que exp(t) ∈ R+ \{0} para todo t. Resta mostrar que, dado x ∈ R+ \{0},
existe um único t com exp(t) = x. Veja que a unicidade segue do fato que exp é estrita-
mente crescente. Para provar existência, observe que, pela proposição anterior, certamente
existem t− , t+ com exp(t− ) ≤ x ≤ exp(t+ ) (e necessariamente t− ≤ t+ , posto que exp é
estritamente crescente). Como exp é diferenciável, ela é contínua e o Teorema do Valor
Intermediário nos diz que existe um t ∈ [t− , t+ ] com exp(t) = x. 2
Proposição 1.6 (Prova omitida) log(xy) = log x + log y para quaisquer x, y > 0.
19
Prova: Fixo x > 0, devemos provar que
log(x + h) − log x 1
Queremos: lim = .
h→0 h x
Para isso, vamos fixar uma sequência {hn }n∈N com hn → 0 e min{hn , x + hn } > 0 para todo
n. Nosso objetivo é provar que, não importando qual sequência deste tipo escolhemos,
log(x + hn ) − log x 1
Queremos (equivalente): lim = .
h→0 hn x
log(x + hn ) − log x tn − t 1 1
lim = lim = .
n→+∞ hn n→+∞ exp(tn ) − exp(t) exp(t) x
Observação 1.1 A mesma prova acima mostra que, se f é contínua e estritamente crescente, então
sua inversa tem as mesmas propriedades.
Repare que os termos destas séries são termos da série da exponencial, agora multi-
plicados por sinais alternados. Podemos portanto usar uma comparação com a série da
exponencial para provar que as duas séries convergem.
Proposição 1.9 cos(t + s) = cos(t) cos(s) − sin(t) sin(s) e sin(t + s) = sin(t) cos(s) +
cos(t) sin(s) para todos t, s ∈ R.
20
Prova: Provaremos apenas a primeira identidade, já que a segunda é similar.
Usando um argumento parecido com a fórmula da exponencial:
+∞ +∞ 2n i
!
2n 2n−i
X (t + s) X X t s
cos(t + s) = (−1)n = (−1)n
n=0
(2n)! n=0 i=0
i! (2n − i)!
e
∞ n−1
!
X X (−1)k t2k+1 (−1)n−k s2(n−k)−1
= − sin(s) sin(s),
n=0 k=0
(2k + 1)! (2n − 2k − 1)!
com convergência uniforme em ambos os casos. Como a soma destas séries para cos(t) cos(s)
e − sin(t) sin(s) é a série de cos(t + s), temos a identidade desejada. 2
Prova: Apenas esboçaremos a prova do primeiro fato acima, já que a segunda é similar.
Veja que, dado h ̸= 0, podemos utilizar a identidade das somas acima para escrever
cos(t + h) − cos(t) cos(h) − 1 sin h
= cos(t) − sin t.
h h h
Seguindo a conta que fizemos para a exponencial, podemos mostrar que sin h/h → 1 e
(cos h − 1)/h → 0: basta separar
sin h = h + resto da ordem |h|3 e cos h = 1 + resto da ordem |h|2 .
2
21
Proposição 1.11 sin2 (t) + cos2 (t) = 1 para todo t ∈ R.
Prova: Isto vale se t = 0 por inspeção. Além disso, sin2 (t) + cos2 (t) é constante:
(sin2 (t) + cos2 (t))′ = 2 sin(t) sin′ (t) + 2 cos(t) cos′ (t) = 0.
2
Proposição 1.12 Dados t, s ∈ R (cos t, sin t) = (cos s, sin s), implica cos(t−s) = 1, sin(t−s) =
0.
Proposição 1.13 Existe um p > 0 tal que cos p = 0 e cos t > 0 para t ∈ [0, p). Temos também
sin t = p e 0 < sin t < 1 para t ∈ [0, p) (No que segue, π := 2p).
22
Proposição 1.14 cos(t + p) = − sin(t) e sin(t + p) = cos t para todo t ∈ R. Portanto, os únicos
pontos onde cos t = 0 ou sin t = 0 são os múltiplos de p.
Prova: A primeira afirmação segue das fórmulas para cos(t + s) e sin(t + s) aplicadas a
s := p.
Para a segunda, veja que podemos escrever qualquer t ∈ R na forma t = ±p n + a com
0 ≤ a < p e n ∈ N. Usando indução em n, podemos provar a partir da primeira parte que
cos(±np + a) ∈ {± cos a, ± sin a} para qualquer n ∈ N. Deduzimos que
Proposição 1.15 (cos t, sin t) = (cos s, sin s) se e somente se t − s é múltiplo inteiro de 2π.
Proposição 1.16 A aplicação “t 7→ (cos t, sin t)" é uma bijeção entre [0, 2π) e o círculo unitário:
S1 := {(x, y) ∈ R2 : x2 + y 2 = 1}.
Prova: Como cos2 t + sin2 t = 1, todo t é levado em S1 . Além disso, a aplicação é injetiva
para t ∈ [0, 2π) pela proposição anterior.
Para provar a sobrejetividade, fixamos (x, y) ∈ S1 para mostrar que existem t0 ∈ [0, π/2]
e m ∈ {0, 1, 2, 3} tais que
Verificamos que, como cos 0 = 1, cos(π/2) = 0 e cos é contínuo, existe um tx ∈ [0, π/2]
com cos tx = |x| e portanto sin tx = |y| (já que y 2 = 1 − x2 = 1 − cos2 t e sin t ≥ 0 para
t ∈ [0, π/2]). Do mesmo modo, há um ty ∈ [0, π/2] com cos ty = |y| e sin ty = |x|. Portanto,
temos o seguinte:
1. Se x ≥ 0, y ≥ 0, (x, y) = (cos tx , sin tx ).
23
3. Se x ≤ 0, y ≤ 0,
(x, y) = (cos(tx + π), sin(tx + π)).
teo:MAMG Teorema 1.1 (Desigualdade das médias aritmética e geométrica) Sejam α1 , . . . , αk núme-
ros positivos com soma 1. Dados t1 , . . . , tk ∈ R+ , temos a desigualdade:
k
Y k
X
tαi i ≤ αi ti .
i=1 i=1
xp y q
Queremos: ∀x, y ≥ 0 : xy ≤ + , com igualdade se e somente se xp = y q .
p q
Isto é trivial quando x = 0, logo vamos supôr x > 0. O que queremos, então, é equivalente
a provar que:
Queremos (de forma equivalente): ∀x ∈ R+ \{0} :
yq xp
sup xy − = , atingido só quando y q = xp .
y∈R+ q p
Para provar esta propriedade, fixe x ∈ R+ \{0} e defina ϕx (y) := xy − y q /q, y ∈ R+ .
Recordando que q > 1, x > 0, vemos que ϕx é diferenciável e que
1
> 0 se y < x q−1 ;
1
ϕ′x (y) = x − y q−1 = 0 se y = x q−1 ;
1
< 0 se y > x q−1 .
24
1
Segue que y∗ := x q−1 é o único máximo global da função ϕx . Note ainda que, como
(1/p) + (1/q) = 1, temos p = q/(q − 1) = 1 + 1/(q − 1), portanto y∗ é o único ponto com
y∗q = xp .
Vamos calcular agora ϕx (y∗ ). A conta abaixo usa novamente o fato que p = q/(q − 1) =
1 + 1/(q − 1):
q
1
1+ q−1 x q−1 xp xp
ϕx (y∗ ) = x − = xp − = .
q q p
O que deduzimos então é o seguinte:
1. Como y∗ é máximo global de ϕx , vale que, para qualquer y ∈ R+ ,
yq xp
ϕx (y) = xy − ≤ ϕx (y∗ ) = .
q p
2. Além disso, apenas y∗ , que satisfaz y∗q = xp , atinge este máximo global.
Isto era exatamente o que queríamos provar e encerra a demonstração para k = 2.
Vejamos agora a prova para k > 2. A ideia é fazer indução forte em k tomando k = 2
como base. Se k > 2, defina novos expoentes
αi
βi := i = 1, 2, . . . , k − 1.
1 − αk
Observe que
k
Y
tαi i = T 1−αk tαk k , (1.3) eq:AMGMaqui
i=1
Exercício 1.4 Sejam 1 < p, q < +∞ com (1/p)+(1/q) = 1. Mostre que para quaisquer x, y ∈ R,
|x|p |y|q
xy ≤ +
p q
com igualdade se e somente valem seguintes condições:
25
• |x|p = |y|q ;
• ou x = y = 0, ou x ̸= 0 ̸= y e os sinais de x e y coincidem.
ascomlambda Exercício 1.5 Sejam 1 < p, q < +∞ com (1/p) + (1/q) = 1. Mostre que para quaisquer x, y ∈ R
e λ > 0,
|x|p λq |y|q
xy ≤ + .
p λp q
Além disso, se x, y ∈ R+ , existe uma escolha de λ tal que
|x|p λq |y|q
|xy| = + .
p λp q
26
Capítulo 2
O principal objetivo deste curso é estender a Análise que aprendemos na reta a espaços
mais gerais: os chamados espaços métricos. Antes de defini-los, vamos começar com a
classe mais restrita, mas muito importante, de espaços vetoriais normados. Aqui já veremos
alguns dos desafios de levar a Análise a uma dimensão mais alta.
27
2. Multiplicação por escalar: dados x ∈ Rd e λ ∈ R λ x ∈ Rd é o vetor cujas coordenadas
são (λ x)[i] = λ x[i], 1 ≤ i ≤ d.
• 0 x = 0 para todo x ∈ Rd .
Definição 2.1 Uma norma sobre Rd é uma função ∥ · ∥ : Rd → R com as seguintes propriedades:
Como podemos definir uma norma em Rd ? Quase todos já sabemos que a norma
euclideana serve: v
u d
uX
|x|2 := t (x[i])2 (x ∈ Rd ).
i=1
Essa é a noção de “tamanho de um vetor" que aprendemos desde cedo nos cursos de
Álgebra Linear ou Geometria Analítica. A pergunta, no entanto, é a seguinte: como
podemos provar que esta norma euclideana é mesmo uma norma?
28
Provar que a norma é positiva definida é simples. Primeiro, observamos que |x|2 é bem
definida porque |x|22 é uma soma de termos (x[i])2 não-negativos; logo, a raíz quadrada
desta quantidade é bem-definida e não-negativa. Além disso, |x|2 se anula se e somente
se esta soma de termos não negativos se anula, o que só pode ocorrer se cada termo é nulo:
x[i]2 = 0 para cada 1 ≤ i ≤ d, ou seja, x = 0Rd .
Agora argumentamos a homogeneidade positiva: tomando x ∈ Rd e λ ∈ R, queremos
demonstrar que |λx|2 = |λ| |x|2 . Para isso, para cada i = 1, 2, . . . , d, a i-ésima coordenada
de λx é λx[i]. Como o quadrado de um produto é o produto dos quadrados, temos:
d
X d
X
|λx|22 = 2
(λx[i]) = λ 2
x[i]2 = λ2 |x|22 .
i=1 i=1
Lembramos agora que a raíz quadrada de λ2 é |λ| (por definição). Como a raíz de um
produto é o produto das raízes, obtemos |λx|2 = |λ||x|2 , como queríamos demonstrar.
Como último passo, precisamos provar que a norma euclideana é subaditiva. Em geral
esta é a parte mais difícil de se provar que uma candidata a norma é mesmo norma. No
caso que estamos analisando, faremos isso a partir das propriedades do produto interno
que quase todos conhecem. Dados x, y ∈ Rd , definimos:
d
X
x · y := x[i] y[i] ∈ R.
i=1
A relação entre norma euclideana e produto interno é que |x|22 = x · x. Nossa prova da
subaditividade da norma será baseada nas propriedades do produto interno listadas a
seguir.
Prova: A primeira propriedade é exatamente a mesma coisa que dizer que a norma eucli-
deana é positiva definida, o que já provamos acima.
A propriedade 2 é consequência do fato que x[i] x′ [i] = x′ [i] x[i] para cada coordenada
i ∈ {1, . . . , d}, de modo que
d
X d
X
′
x·y = x[i] x [i] = y[i] x[i] = x′ · x.
i=1 i=1
29
de modo que, pelas distributividade e associatividade de R,
d
X d
X
′ ′
x·x = x[i] x [i] = (λ a[i] + b[i]) x′ [i]
i=1 i=1
d
X Xd
= λ a[i] x′ [i] + b[i] x′ [i]
i=1 i=1
= λ (a · x′ ) + (b · x′ ).
2
A subaditividade vai precisar de um passo a mais, derivado do último lema: a desi-
gualdade de Cauchy-Schwartz.
x · y ≤ |x|2 |y|2 ⇔ v · w ≤ 1.
d
X
v·w = v[i] w[i]
i=1
Xd
≤ |v[i] w[i]| (2.1)
i=1
d
X |v[i]|2 + |w[i]|2
(média geo. ≤ aritmética p/ cada termo) ≤ (2.2)
i=1
2
(|v|2 = |w|2 = 1) = 1.
Como podemos ter igualdade acima? Em primeiro lugar, (2.1) deve ser uma igualdade,
o que acontece se e somente se todos os termos da soma forem maiores ou iguais a zero.
Ou seja, queremos que v[i] e w[i] tenham o mesmo sinal para cada índice i. Em segundo
lugar, precisamos de igualdade na aplicação da desigualdade das médias em (2.2), o que
só ocorre quando |v[i]|2 = |w[i]|2 – ou seja, v[i] = ±w[i] – para cada i. Deduzimos que
v · w = 1 se e somente se v = w, o que ocorre se e somente se y = |y|2 x/|x|2 . 2
30
Terminamos a seção usando Cauchy-Schwartz para provar que a norma é sub-aditiva.
normalinear Teorema 2.2 Vale a identidade:
Portanto,
|x + y|2 = max{z · (x + y) : z ∈ Rd , |z|2 = 1} ≤ |x|2 + |y|2 .
2
Observação 2.1 Um caminho ainda mais simples para provar a subaditividade é observar que,
pela bilinearidade do produto interno e Cauchy-Schwartz
|x + y|22 = |x|22 + |y|22 + 2 x.y ≤ |x|22 + |y|22 + 2 |x|2 |y|2 = (|x|2 + |y|2 )2 .
Como a raíz quadrada é uma função monótona, obtemos |x + y|2 ≤ |x|2 + |y|2 . No entanto, a ideia
contida no Teorema 2.2 de expressar a norma como máximo se aplica de forma ainda mais geral;
veja os Exemplos 2.3 e 2.4 e o Exercício 2.16.
31
2. Associatividade do produto por escalar: para quaisquer λ, η ∈ R, v ∈ V , λ(ηv) =
(λη) v.
O espaço Rd discutido acima é um espaço vetorial segundo esta definição. Note que
d = 1 é uma escolha válida, ou seja: com as operações usuais, R é um espaço vetorial sobre
R!
Veremos agora mais dois exemplos.
Exemplo 2.1 (Matrizes ℓ × d) Sejam agora ℓ, d ∈ N\{0}. Considere o conjunto Rℓ×d de todas
as matrizes com ℓ linhas, d colunas e entradas reais.
Ou seja, as entradas (ou “coordenadas") de uma matriz ℓ × d são chamadas de A[i, j],
com 1 ≤ i ≤ ℓ e 1 ≤ j ≤ d. Podemos definir a soma e subtração de matrizes, além do
produto de uma matriz por escalar, fazendo tudo entrada a entrada. Como no caso de
Rd , a estrutura resultante nos dá um espaço vetorial. Isso não chega a ser uma surpresa
porque, afinal, uma matriz ℓ×d pode ser reescrita como um vetor de ℓ d números reais. No
entanto, o fato que matrizes representam transformações lineares sugere maneiras diferentes
de se medir os elementos de Rℓ×d .
O exemplo a seguir é um tanto quanto diferente.
C(I, R) := {f : I → R : f contínua}.
Este espaço tem uma estrutura natural de espaço vetorial. O elemento 0 é a função
que se anula em todo ponto. A soma é exatamente a soma usual de funções, o que
“funciona" porque a soma de funções contínuas é contínua. O produto por escalar consiste
em tomar a função f e o escalar λ e definir uma nova função λ f que leva t ∈ I em λ f (t). É
um exercício mostrar que estas operações realmente satisfazem todos axiomas de espaço
vetorial.
32
ssaofuncoes Observação 2.2 (Vetores são funções e vice-versa) O espaço de funções tem uma certa relação
de analogia o Rd . Numa direção, podemos conceber cada vetor x ∈ Rd como uma representação de
uma função de x : {1, . . . , d} → R associando cada 1 ≤ i ≤ d um valor x[i]. Na outra direção,
podemos pensar numa função f : I → R como um "vetor" cujas coordenadas f (t) são indexadas
pelos elementos t ∈ I. Isso nos mostra que pensar em C(I, R) como espaço vetorial, além de ser
formalmente correto, tem um significado intuitivo também. Manter isso em mente pode ajudar a
compreender várias provas abaixo.
Ha := {x ∈ Rd : a · x = 0}
Exercício 2.2 O conjunto das matrizes d × d simétricas – isto é, as A ∈ Rd×d com A[i, j] = A[j, i]
para cada par 1 ≤ i, j ≤ d – é um subespaço de Rd×d
2.2.3 Normas
sec:normas
Para fazermos Análise, vamos precisar medir distâncias em espaços vetoriais. Isto nos
leva à definição de norma, que é exatamente aquela que usamos em Rd .
Definição 2.4 Uma norma sobre um espaço vetorial real V é uma função ∥ · ∥ : V → R com as
seguintes propriedades:
• A norma é positiva definida, isto é, para todo x ∈ V , ∥x∥ ≥ 0, e ∥x∥ = 0 se e somente se
x = 0.
33
• A norma é sub-aditiva, isto é, para quaisquer x, y ∈ V , ∥x + y∥ ≤ ∥x∥ + ∥y∥.
ex:linfty Exemplo 2.3 Uma outra maneira de definir uma norma em Rd é tomando-se a norma do máximo,
ou ℓ∞ .
|x|∞ := max |x[i]| (x ∈ Rd ).
1≤i≤d
Vejamos que esta é mesmo uma norma. Em primeiro lugar, ela é bem definida porque
o máximo de um conjunto finito sempre é bem definido. Ela é positiva-definida porque é
sempre não-negativa (o módulo de cada x[i] é não-negativo) e vale 0 se e somente todas
as coordenadas de x se anulam (afinal, |x[i]| ≤ |x|∞ para cada i). Também não é difícil ver
que ela é homogênea positiva, usando que |λx[i]| = |λ| |x[i]| para cada i = 1, . . . , d.
A subaditividade também não é difícil de se mostrar neste caso. Tome x, x′ ∈ Rd . Para
cada coordenada i =, . . . , d, podemos usar a sub-aditividade do valor absoluto (sobre os
reais) e a definição de | · |∞ e deduzir:
Como o valor absoluto de cada uma das coordenadas pode ser cotado por cima pelo
máximo dos valores absolutos, chegamos à seguinte desigualdade:
|x[i]| + |x′ [i]| ≤ max |x[j]| + max |x′ [j]| = |x|∞ + |x′ |∞ .
1≤j≤d 1≤j≤d
:normadosup Exemplo 2.4 Tome I ⊂ R compacto e escreva C := C(I, R). Para f ∈ C, definimos:
34
A razão pela qual ∥f ∥I,∞ é bem definida é que toda função contínua sobre um compacto
é limitada, como já sabemos de Análise na Reta.
Vejamos por que ∥ · ∥∞ é mesmo norma. As demonstrações de que a norma é positiva-
definida e homogênia positiva ficam como exercício. A prova da subaditividade não é
difícil. Sejam f, g ∈ C dadas. Observem que, pela subaditividade do módulo sobre a reta,
Sabemos ainda que |f (t)| ≤ sups∈I |f (s)| = ∥f ∥∞ e |g(t)| ≤ sups∈I |g(s)| = ∥g∥∞ , portanto
|f (t) + g(t)| ≤ ∥f ∥∞ + ∥g∥∞ para cada t ∈ I. Assim, ∥f ∥∞ + ∥g∥∞ é cota superior para os
valores de |f (t)| para t ∈ I. Como o supremo é a menor cota superior, deduzimos que:
∥f + g∥∞ ≤ ∥f ∥∞ + ∥g∥∞ ,
Observação 2.3 (Vetores são funções e vice-versa) Comparando os dois últimos exemplos,
vemos claramente como pode ser útil a analogia feita na Observação 2.2 entre vetores de Rd e
funções. As duas provas acima são essencialmente idênticas!
exemplo:lp Exemplo 2.5 Fixe um expoente 1 ≤ p < +∞. A norma ℓp sobre Rd é definida por:
d
! p1
X
|x|p := |x[i]|p (x ∈ Rd ).
i=1
Há algumas razões pelas quais pode-se querer definir esta família geral de normas.
Uma delas é que normas codificam esparsidade aproximada. Isto é, um vetor de norma ℓp
pequena tem poucas coordenadas grandes e este efeito se acentua quando p é maior (veja
o exercício 2.13 abaixo).
Temos como missão provar que o Exemplo 2.5 de fato define uma norma. Para começar,
note que a candidata a norma é bem definida e que o caso p = 2 é precisamente o da
norma euclideana. A questão é se temos uma norma para um 1 ≤ p < +∞ arbitrário.
Para responder isso, precisamos checar que | · |p satisfaz os três axiomas de norma.
A prova de que | · |p é positiva-definida e homogênea positiva fica como um exercício
não muito difícil para o leitor. A subaditividade pode ser provada de duas maneiras.
No exercício 2.16 abaixo, mostramos que | · |p é um supremo de produtos internos, o que
nos permite usar a estratégia do caso p = 2. Aqui apresentamos uma outra estratégia de
prova, que se baseia na ideia de convexidade.
35
A função “x 7→ xp " é crescente. Além disso, ela é convexa, isto é:
∀λ ∈ [0, 1] ∀t, s ≥ 0 : (λ t + (1 − λ)s)p ≤ λ sp + (1 − λ) sp . (2.3) eq:convexid
(Isto é consequência do fato que a a função é contínua e sua derivada segunda é positiva
sobre o intervalo (0, +∞).)
Agora considere x, z ∈ Rd ; queremos provar que |x + z|p ≤ |x|p + |z|p . Se um dos dois
vetores se anula, esta desigualdade vale por inspeção. Portanto, suporemos a seguir que
tanto x quanto z não são nulos. Neste caso, podemos observar que, para cada coordenada
i,
|(x + z)[i]| |x[i] + z[i]| |x[i]| + |z[i]| |x[i]| |z[i]|
= ≤ =λ + (1 − λ) ,
|x|p + |z|p |x|p + |z|p |x|p + |z|p |x|p |z|p
onde
|x|p
λ := ∈ [0, 1].
|x|p + |z|p
Usando que “x 7→ xp " é crescente e convexa, deduzimos:
p p p p
|(x + z)[i]| |x[i]| |z[i]| |x[i]| |z[i]|
≤ λ + (1 − λ) ≤λ + (1 − λ) .
|x|p + |z|p |x|p |z|p |x|p |z|p
Isso vale para todo 1 ≤ i ≤ d. Somando sobre as coordenadas, obtemos:
d p d p d p
X |(x + z)[i]| X |x[i]| X |z[i]|
≤λ + (1 − λ) .
i=1
|x|p + |z|p i=1
|x|p i=1
|z|p
Ou seja: p
|x|pp |z|pp
|x + z|p
≤λ + (1 − λ) = 1.
|x|p + |z|p |x|pp |z|pp
Como a função “t ≥ 0 7→ t1/p " também é crescente, deduzimos que
|x + z|p
≤ 1,
|x|p + |z|p
como queríamos demonstrar.
36
Normas baseadas em outras normas
O último exemplo que vemos de norma é fundamental para várias aplicações de Álgebra
Linear. Ela é uma norma “derivada" de outras “normas-base" e suas propriedades serão
deduzidas das normas base.
adeoperador Exemplo 2.6 (Norma de operador em Rℓ×d ) Recorde do seu curso de Álgebra Linear que há
uma relação direta entre matrizes A ∈ Rℓ×d e transformações lineares A : Rd → Rℓ (usamos A
duas vezes por abuso de notação). De fato, dado x ∈ Rd , Ax ∈ Rℓ é o vetor de coordenadas:
d
X
(Ax)[i] := A[i, j] x[j], 1 ≤ i ≤ ℓ.
j=1
A chamada norma de operador p2 → p1 sobre Rℓ×d é definida da seguinte forma. Fixe expoentes
p2 , p1 ∈ [1, +∞]. Definimos
|Av|p1
∥A∥p2 →p1 := sup .
v∈Rd \{0} |v|p2
Normas como esta são muito importantes em Álgebra Linear Numérica. Um problema
importante é saber como diversos problemas envolvendo a matriz A se portam quando
a matriz é ligeiramente perturbada. Na maioria dos casos, tanto a formulação quanto a
solução deste tipo de problema tem a ver com normas de matrizes. O Exercício 2.12 traz
um exemplo disso.
Como podemos provar que ∥A∥p2 →p1 é norma? Observe em primeiro lugar que, por
linearidade e homogeneidade positiva da norma,
|Av|p1 v
= A
|v|p2 |v|p2 p1
e v/|v|p2 tem norma 1. Portanto, podemos trocar o supremo na definição da norma de
operador por
∥A∥p2 →p1 = sup |Av|p1 . (2.4) eq:normaopc
v∈Rd : |v|p2 =1
Isso facilita um pouco a prova das propriedades de norma, que veremos a seguir.
Primeiramente, temos de mostrar que a norma é uma função bem-definida de Rℓ×d em
R. Como o supremo é sempre unicamente definido como elemento de R ∪ {+∞}, o que
nos resta fazer é mostrar que o supremo na definição da (candidata a) norma é finito. Para
isso, usaremos a segunda fórmula, apresentada em (2.4) e algumas estimativas bastante
“cruas", mas válidas.
Veja que, em primeiro lugar, se v ∈ Rd tem norma |v|p2 = 1, todas as suas coordenadas
estão limitadas por 1 em valor absoluto. Desta forma, quando calculamos Av, cada
coordenada do vetor satisfaz:
d d d
X X X
|(Av)[i]| = A[i, j]v[j] ≤ |A[i, j]| |v[j]| ≤ |A[i, j]| ≤ d M,
j=1 j=1 j=1
37
onde M := max1≤i≤ℓ,1≤j≤d |A[i, j]| < +∞ (note que utilizamos a subaditividade da função
módulo sobre R!). Portanto, quando |v|p2 = 1, as coordenadas de Av são uniformeme-
mente limitadas por dM , quantidade que não depende de v. Concluímos que:
ou seja, |Av|p1 é limitada sobre os vetores de norma 1. Isto quer dizer que o supremo em
(2.4) é finito, como queríamos demonstrar.
O próximo passo é mostrar que ∥ · ∥p2 →p1 é positiva-definida. Como a norma é um
supremo de números não-negativos, ela certamente é não-negativa. Claramente a matriz
0Rℓ×d tem norma zero. Por outro lado, se ∥A∥p2 →p1 = 0, isto quer dizer que, dado qualquer
v ∈ Rd , |Av|p1 ≤ 0. Como | · |p1 é positiva definida, isso quer dizer que Av = 0Rℓ para
qualquer v ∈ Rd . Em particular, se tomamos v = ei para cada um dos vetores da base
canônica (com 1 ≤ i ≤ ℓ), Aei é o vetor cujas coordenadas são A[i, j]; logo, estas são a
fortiori nulas. Concluímos: a hipótese de que ∥A∥p2 →p1 = 0 implica que A é a matriz nula.
A seguir, provamos que a norma é homogênea positiva. Para isso, usaremos o fato que
| · |p1 tem esta propriedade e que, dados A ∈ Rℓ×d e λ ∈ R,
∀v ∈ Rd : (λA)v = λ(Av).
De fato, isto é consequência da definição das operações envolvidas e nos permite concluir:
Quando multiplicamos todos os elementos de um conjunto por |λ|, seu supremo é multi-
plicado pelo mesmo valor. Desta forma,
Por fim, provaremos que a norma sobre matrizes é subaditiva. Se tomamos A, B ∈ Rℓ×d
e v ∈ Rd , vemos que (A + B)v = Av + Bv por virtude das definições envolvidas. Portanto,
para qualquer vetor v ∈ Rd de norma 1,
Como a desigualdade vale para todo v de norma 1, o supremo do lado esquerdo é cotado
pelo lado direito, e obtemos:
38
2.3 Mais exercicios
Exercício 2.6 Dado I ⊂ R compacto, considere o conjunto de todas as funções polinomiais
de I a R. Prove que este é um subespaço vetorial de C(I, R).
x:limitadas Exercício 2.7 (Funções limitadas) Dado um conjunto qualquer I ̸= ∅, chame de B(I, R)
o conjunto de todas as funções limitadas de I a R. Prove que este conjunto tem uma
estrutura natural de espaço vetorial e que a expressão
∥f ∥∞ := sup |f (t)| (f ∈ B(I, R))
t∈I
define uma norma sobre B(I, R). Mostre ainda que, quando I ⊂ R é compacto, o espaço
C(I, R) definido acima é um subespaço de B(I, R).
:transposta Exercício 2.10 Dada uma matriz A ∈ Rℓ×d , sua transposta, denotada por AT , é a matriz em
Rd×ℓ cujas entradas são definidas da seguinte forma:
AT [i, j] := A[j, i] (1 ≤ i ≤ d, 1 ≤ j ≤ ℓ).
Exercício 2.11 Como já observado, podemos associar de modo natural o espaço de matri-
zes Rℓ×d com o espaço euclideano Rℓ d . Isto nos permite definir uma norma correspondente
à norma | · |2 sobre Rℓ×d , que às vezes é chamada de norma de Frobenius:
v
u ℓ d
uX X
∥A∥F := t |A[i, j]|2 (A ∈ Rℓ×d ).
i=1 j=1
39
Outra norma natural é a versão da norma ℓ∞ em Rℓ×d : a magnitude da maior entrada.
matriznorma Exercício 2.12 Chamamos de Id×d a matriz idendidade d × d, que tem 1 na diagonal e
zeros em todas as outras entradas. Uma matriz A ∈ Rd×d é dita inversível se existe uma
outra matriz A−1 ∈ Rd×d tal que A A−1 = A−1 A = Id×d . Em cursos de Álgebra Linear,
aprendemos que a inversa existe e é única se e somente se o determinante de A não se
anula.
Fixos dois expoentes p1 , p2 ∈ [1, +∞], definimos:
1
|A−1 |p2 →p1 = ; em particular, quando A é inversível, σp−1 →p2 (A) > 0.
σp−1 →p2 (A)
3. Prove que qualquer matriz B ∈ Rd×d com |A − B|p1 →p2 < σp−1 →p2 (A) é inversível.
Observação: a quantidade
κ(A) := |A−1 |2→2 |A|2→2
é chamada de número de condicionamento da matriz A. Segue do primeiro item deste exercício
que ele é sempre ≥ 1. Quando o número de condicionamento é muito grande, isto significa que o
problema de se resolver um sistema “Ax = b" é instável: pequenas alterações em b ou na matriz A
podem levar a grandes mudanças na solução. Por outro lado, o terceiro item acima implica que o
número de condicionamento não muda muito sob pequenas perturbações de A. Mais informações
sobre o número de condicionamento estão disponíveis no artigo https://en.wikipedia.org/
wiki/Condition_number.
x:lppequeno Exercício 2.13 Definimos acima as normas ℓp para 1 ≤ p ≤ +∞. No entanto, a função que
leva x ∈ Rd em |x|p também está bem definida quando 0 < p < 1.
40
1. Prove que | · |p para 0 < p < 1 não é subaditiva e portanto não é norma (dica: isso tem
a ver com concavidade estrita da função “t ≥ 0 7→ tp ").
2. Prove que, para qualquer x ∈ Rd , |x|0 := limp→0+ |x|pp é o número de coordenadas
diferentes de 0 de x.
3. Prove ainda que, dados quaisquer x ∈ Rd , t > 0 e p > 0,
|x|pp
#{1 ≤ i ≤ d : |x[i]| ≥ t} ≤ p .
t
Deste modo ter “norma ℓp pequena” quer dizer que poucas coordenadas são grandes.
ex:lp Exercício 2.16 Apresentamos aqui uma forma baseada em dualidade de provar que as normas ℓp
apresentadas no Exemplo 2.5 são de fato normas.
Definimos o expoente dual de p como q := p/(p − 1) quando 1 < p < +∞. Se p ∈ {1, +∞},
definimos q via um limite: portanto q = 1 se p = ∞ e q = ∞ se p = 1.
1. Nos próximos itens, mostraremos a relação de dualidade entre as normas ℓp e ℓq
Copiando nosso argumento para p = 2, explique porque esta relação implica que a norma ℓp
é de fato uma norma (ou seja, satisfaz os três axiomas da definição).
2. Prove dualidade diretamente para p ∈ {1, ∞}.
3. A partir daqui supomos p ∈ (1, +∞). Mostre que a desigualdade entre as médias aritmética
e geométrica implica que
|a|p |b|q
∀a, b ∈ R : ab ≤ + ,
p q
com igualdade se e somente se a, b têm o mesmo sinal e |a|p = |b|q .
4. Deduza do primeiro item que
x·y
∀x, y ∈ Rd \{0} : ≤1
|x|p |y|q
e obtenha a Desigualdade de Hölder x.y ≤ |x|p |y|q .
41
5. Cheque as condições de igualdade no item anterior para terminar a prova da dualidade.
Mostre ainda que, se x ̸= 0Rd , o supremo na fórmula de dualidade só é atingido por um único
vetor v.
Exercício 2.17 Retorne ao exercício 2.10 e use o resultado do exercício 2.16 para mostrar
que ∥AT ∥p1 →p2 = ∥A∥p2 →p1 para quaisquer 1 ≤ p1 , p2 ≤ +∞.
x:lpfuncoes Exercício 2.18 Considere o espaço C([a, b], R) com a < b reais. Dado 1 ≤ p < +∞, mostre
que a expressão:
Z b p1
∥f ∥p := |f (t)|p dt (f ∈ C([a, b], R))
a
define uma norma sobre C([a, b], R), para qualquer 1 ≤ p < +∞ fixo. Prove ainda uma
versão da desigualdade de Hölder para estas normas:
onde q é o expoente dual de p definido no Exercício 2.16. (Dica: este é mais um caso em que
a analogia contida na Observação 2.2 pode ser útil.)
Exercício 2.19 Neste exercício, apresentamos outras normas que “são subaditivas por motivos de
convexidade". Considere uma função Ψ : [0, +∞) → [0, +∞) com as seguintes propriedades:
• Ψ é crescente e convexa;
define uma norma sobre Rd . Prove ainda que esta norma coincide com a norma ℓp usual no caso
em que Ψ1 (x) = xp .
iaisproduto Exercício 2.20 (Espaços vetoriais produto) Suponha que (Vi , ∥ · ∥Vi ), i = 1, 2, . . . , m, são
espaços vetoriais normados. Considere V := V1 × V2 × · · · × Vm e denote os elementos v ∈ V como
v = (v[i])m
i=1 , onde cada v[i] ∈ Vi .
42
1. Defina um elemento 0V ∈ V com 0V [i] = 0Vi para cada 1 ≤ i ≤ m. Defina ainda operações
de soma e multiplicação por escalar em V : dados v, v ′ ∈ V , λ ∈ R, λ v e v + v ′ são definidos
pelas receitas
onde usamos as operações de produto por escalar e soma de cada espaço Vi . Mostre que V é
espaço vetorial com estas escolhas de operações e elemento neutro.
m
! p1
X
∥v∥V,p := ∥v[i]∥pVi (v ∈ V ).
i=1
Mostre que esta expressão define numa norma sobre V . Estenda a definição a p = +∞.
3. Suponha agora que cada Vi = Rdi com aPnorma ℓp . Explique porque (V, ∥ · ∥V,p ) é “essenci-
almente” Rd com a norma ℓp , onde d = mi=1 di .
43
44
Capítulo 3
No capítulo anterior vimos vários espaços vetoriais V com suas respectivas normas ∥ · ∥.
Isto nos permite medir tamanhos de vetores e distância entre pontos v e v ′ .
Medir distâncias é bom porque nos permite tomar limites e fazer Análise. No entanto,
é muito fácil encontrar espaços em que se deseja fazer Análise, mas que não possuem a
estrutura linear de um espaço vetorial: ou seja, espaços em que tomar somas, diferenças
ou produtos de elementos não faz sentido. Por exemplo, a esfera d-dimensional e o
conjunto de Cantor não têm nada de “linear”, ainda que estejam ambos contidos em
espaços vetoriais.
No fim das contas, será bastante conveniente tomarmos um ponto de vista mais geral,
baseado apenas na noção de distância. Por isso estudaremos a partir daqui o conceito
de espaço métrico. Esta é a estrutura mínima que nos permite estender a Análise a que
estamos acostumados, com ε e δ, limites e tudo o mais. Todo espaço vetorial normado
pode ser visto como espaço métrico, mas a recíproca não é verdadeira.
A classe de espaços métricos é a principal categoria de objetos que trataremos neste
curso. Ela é geral o suficiente para quase todos os nossos propósitos, mas ainda assim
é tratável. Neste capítulo veremos como ela é definida e como ela nos permite falar de
convergência em conjuntos muito gerais.
45
2. d é simétrica: para qualquer par (a, b) ∈ X × X, d(a, b) = d(b, a);
3. d satisfaz a desigualdade triangular: para quaisquer a, b, c ∈ X, d(a, b) ≤ d(a, c) +
d(c, b).
Todas as propriedades de métrica acima têm uma interpretação intuitiva se pensamos
em d como uma noção de distância. A propriedade 1 diz que a distância de um lugar
a ele mesmo é nula, mas que qualquer outro lugar está a distância positiva. A segunda
propriedade afirma que ir de a a b não é mais fácil ou difícil que ir de b a a. A terceira
propriedade afirma que ir de a para c e depois para b não pode resultar em um caminho
mais curto que a rota direta de a para b. Apesar da clareza do que significam estas
condições, veremos abaixo que nem todo espaço métrico é fácil de se entender.
Veremos abaixo os principais exemplos de espaços métricos que serão recorrentes no
curso. Ocasionalmente usaremos a convenção de denotar por dX a métrica de X; isto será
útil quando tratarmos muitos espaços métricos de uma única vez.
46
3.1.4 Espaços vetoriais: normas nos dão métricas
A maneira canônica de se definir uma métrica sobre um espaço normado é através da
norma.
• ∥a − b∥V = ∥b − a∥V ;
47
3.2 Sequências, limites e completude
O leitor deve lembrar que uma sequência de elementos em X, escrita {xn }n∈N ⊂ X, é tão
somente uma maneira de escrever uma função f : N → X, de modo que xn = f (n) para
cada n ∈ N.
Tomamos como dado que o leitor já sabe o que é convergência de uma sequência em
R, mas lembramos a definição mesmo assim. Dados {xn }n∈N ⊂ R e x ∈ R, dizemos que
xn → x, ou limn∈N xn = x, ou ainda que xn converge a x, se
Definição 3.2 Fixo um espaço métrico (X, dX ), dizemos que uma sequência {xn }n∈N ⊂ X con-
verge a x ∈ X (segundo a métrica dX ) se a sequência {dX (xn , x)}n∈N ⊂ R converge a 0, no sentido
do parágrafo anterior. Dito de outro modo: xn → x se
Esta segunda forma de definir as coisas mostra que as duas noções de convergência
coincidem no caso de X = R com a métrica usual. Podemos mostrar facilmente que, como
no caso de números, trocar < ε por ≤ ε na segunda definição não muda nada. Além disso:
Prova: Pelos axiomas de métrica, para provarmos que x = x′ , basta mostrarmos que
dX (x, x′ ) = 0. Pela desigualdade triangular, temos a seguinte desigualdade para cada
n ∈ N:
0 ≤ dX (x, x′ ) ≤ dX (x, xn ) + dX (xn , x′ ).
Por hipótese, dX (x, xn ) → 0 e dX (x′ , xn ) → 0 no sentido usual de R. Como “o limite da
soma é a soma dos limites", temos:
48
convnormado Exercício 3.1 Considere um espaço vetorial normado (V, ∥ · ∥V ) com a métrica induzida pela
norma. Se {vn }n∈N ⊂ V e v ∈ V são dados, mostre que
vn → v ⇔ vn − v → 0V .
Vamos agora definir o que é uma sequência de Cauchy em um espaço métrico e o que
é um espaço métrico completo.
Definição 3.3 Fixo um espaço métrico (X, dX ), dizemos que uma sequência {xn }n∈N ⊂ X é de
Cauchy se
lim dX (xn , xm ) = 0,
m,n→+∞
isto é,
∀ε > 0 ∃ n0 (ε) ∈ N ∀m, n ∈ N : m, n ≥ n0 (ε) ⇒ dX (xn , xm ) < ε.
(X, dX ) é dito completo se toda sequência de Cauchy {xn }n∈N ⊂ X converge a algum x ∈ X.
A mesma prova conhecida de R de que toda sequência convergente é Cauchy vale para
espaços métricos gerais. Observe, no entanto, que nem todo espaço métrico é de Cauchy.
Por exemplo, (R, dR ) é completo, mas Q com a métrica induzida não é completo. Veremos
a seguir vários exemplos naturais de espaços métricos que são completos e (com menos
destaque) alguns outros que não são. Antes, uma definição fundamental.
Definição 3.4 Um espaço vetorial normado (V, ∥ · ∥V ) que é completo com a distância induzida
pela norma ∥ · ∥V é dito espaço de Banach.
3.2.1 Subsequências
bsequencias
Em vários momentos do texto, seremos forçados a falar de subsequências, definidas abaixo.
Definição 3.5 Considere um subconjunto infinito N ⊂ N. Dada uma sequência {xn }n∈N num
espaço métrico (X, dX ), chamamos de subsequência {xn }n∈N (com índices em N ) a sequência
{yj }j∈N definida da seguinte maneira: se n1 < n2 < . . . é a única enumeração crescente dos
elementos de N , então yj := xnj para cada j ∈ N. Normalmente escreveremos xnj ao invés de yj .
Chamamos de limn∈N xn ou limj∈N xnj o limite de yj (caso exista).
Ainda não teremos muito motivo para olhar subsequências nesta altura do texto, mas
em breve isto ocorrerá. Em geral a motivação para se definir uma subsequência é a
seguinte.
• Precisamos achar um elemento x com certa propriedade “boa” num espaço métrico.
Muitas vezes, a melhor (ou única) forma de se fazer isso é definir uma “sequência
boa” {xn }n∈N e torcer para que ela convirja.
• O problema é que nem sempre a “sequência boa” converge. Por sorte, em muitos
casos basta que uma subsequência convirja para conseguirmos terminar a prova.
49
O melhor de tudo é que a convergência da subsequência pode ser quase automática.
Por exemplo, a Proposição 3.5 garante que qualquer sequência limitada em Rd tem uma
subsequência convergente.
Antes de seguirmos, vejamos algumas propriedades básicas de subsequências.
Exercício 3.2 Mostre que uma subsequência {xn }n∈N como a definida acima converge a x ∈ X se
e somente se:
∀ε > 0 ∃n0 (ε) ∈ N ∀n ∈ N : n ≥ n0 (ε) ⇒ dX (xn , x) ≤ ε.
É conveniente enunciarmos de uma vez duas proposições muito úteis. A primeira diz
que, ao passarmos para uma subsequência, não "estragamos"uma eventual convergência
da sequência original.
qnaoestraga Proposição 3.3 Considere uma sequência {xn }n∈N num espaço métrico (X, dX ). Se xn converge
a um limite x ∈ X, então qualquer subsequência converge ao mesmo x.
Prova: Tome {xn }n∈N e x ∈ X como acima. O fato que xn → x quer dizer que:
(⋆) ∀ε > 0 ∃n0 (ε) ∈ N ∀n ∈ N : n ≥ n0 (ε) ⇒ dX (xn , x) ≤ ε.
Agora considere N ⊂ N infinito. Queremos mostrar que limn∈N xn = x. Considerando xnj
como na definição de subsequência, precisamos provar que, dado um ε > 0,
queremos : ∃j0 (ε) ∈ N ∀j ∈ N : j ≥ j0 (ε) ⇒ dX (xnj , x) ≤ ε.
Mas isso é simples. Como N := {n1 < n2 < n3 < . . . } é conjunto infinito, podemos
escolher j0 (ε) com nj0 (ε) ≥ n0 (ε) (ver (⋆)). Deste modo, garantimos que nj ≥ n0 (ε) para
todo j ≥ j0 (ε), de modo a garantir dX (xnj , x) ≤ ε. 2
No próximo problema, veremos como podemos usar subsequências para garantir a
convergência de uma sequência inteira.
Proposição 3.4 Considere uma sequência de Cauchy {xn }n∈N num espaço métrico (X, dX ) que
tem uma subsequência convergente. Então {xn }n∈N também converge e seu limite é igual ao da
subsequência.
Prova: Sejam x ∈ X o limite da subsequência e N ⊂ N o seu conjunto (infinito) de índices.
Como {xn }n∈N é Cauchy, dado ε > 0, podemos encontrar n0 (ε) ∈ N tal que dX (xn , xm ) ≤ ε
para n, m ≥ n0 (ε). Ao mesmo tempo, como N é infinito, sabemos que existem infinitos
índices k ∈≥ n0 (ε) com k ∈ N . Tomando um destes índices, vemos que:
∀n ≥ n0 (ε) : dX (xn , x) ≤ dX (xn , xk ) + dX (xk , x) ≤ ε + dX (xk , x).
Se agora mandamos k → +∞ com k ∈ N , temos dX (xk , x) → 0 e portanto:
∀n ≥ n0 (ε) : dX (xn , x) ≤ ε.
Ou seja, o mesmo n0 (ε) que vem da "Cauchyaniedade" da sequência {xn }n se adequa à
definição de limite. 2
50
3.2.2 Convergência em Rd com as normas ℓp
sec:convlp
Recorde o Exercício 2.15 acima, onde apresentamos as normas ℓp , 1 ≤ p ≤ ∞, sobre Rd .
Observe que, para qualquer uma destas normas,
2. {xn }n∈N é Cauchy de acordo com uma das normas ℓp acima se e somente se cada uma das
sequências de coordenadas {xn [i]}n∈N ⊂ R, com i = 1, 2 . . . , d, é Cauchy.
Segue que (Rd , | · |p ) é Banach: toda sequência em Rd que é Cauchy de acordo com a norma ℓp
converge a um limite em Rd .
Prova: Começamos com o primeiro item. Tome uma sequência {xn }n∈N ⊂ Rd e um
x ∈ Rd . Lembre-se do Exercício 3.1 e veja que xn →ℓp x se e somente se xn − x →ℓp 0Rd .
Pela observação antes da prova relacionando as normas ℓp , deduzimos que:
Por um argumento de sanduíche, vemos que, se max1≤i≤d |x[i] − xn [i]| → 0, então |x[j] −
xn [j]| → 0, e portanto xn [j] → x[j], para cada j ∈ {1, . . . , d}. Por outro lado, se cada uma
das sequências {xn [j]}n∈N converge a x[j], temos que {|x[j] − xn [j]|}n∈N converge a 0 para
cada j e o máximo dessas sequências converge a 0 (um resultado de Análise na Reta!).
Concluímos:
51
Do mesmo modo que acima, observamos que o máximo max1≤j≤d |xn [j] − xm [j]| converge
a 0 se e somente se |xn [j] − xm [j]| converge a 0 para cada coordenada j ∈ {1, 2, . . . , d}:
n,m→+∞ n,m→+∞
max |xn [j] − xm [j]| −→ 0 ⇔ ∀ 1 ≤ j ≤ d : |xn [j] − xm [j]| −→ 0.
1≤j≤d
Assim,
n,m→+∞ n,m→+∞
|xn − xm |p −→ 0 ⇔ ∀ 1 ≤ j ≤ d : |xn [j] − xm [j]| −→ 0,
o que é a tradução em símbolos matemáticos do item 2 do teorema.
Para terminar, provaremos que (Rd , | · |p ) é completo. Para isso, tomamos uma sequên-
cia de Cauchy {xn }n∈N ⊂ Rd arbitrária. Pelo item 2, cada sequência das coordenadas
{xn [i]}n∈N ⊂ R é Cauchy. Como R é completo, isto quer dizer que:
∀i ∈ {1, . . . , d} : ∃ lim xn [i].
n→+∞
Agora defina x ∈ Rd como o vetor de coordenadas x[i] := limn→+∞ xn [i] (1 ≤ i ≤ d). Com
esta definição, garantimos que as coordenadas de xn convergem para as coordenadas de
x e portanto xn →ℓp x. Desta forma, provamos que a sequência de Cauchy {xn }n∈N ⊂ Rd
(uma sequência de Cauchy arbitrária em Rd ) tem limite x ∈ Rd . 2
Fazemos uma pausa aqui para mostrar um fato importante, que será usado muitas
vezes no texto. Ele é um prelúdio para o assunto de compacidade, que será discutido mais
adiante no texto.
prop:HBRd Proposição 3.5 (Sequências limitadas em Rd têm subsequências convergentes) Suponha
que {xn }n∈N ⊂ Rd é uma sequência limitada, isto é, que supn∈N |xn |2 < +∞. Então existe uma
subsequência {xnj }j∈N convergente.
Prova: Vamos provar isso por indução na dimensão d ∈ N\{0}. O caso base é d = 1 é um
teorema conhecido de Análise na Reta.
Para o passo indutivo, suponha que o teorema é verdade para dimensão d − 1. Tome
agora {xn }n∈N ⊂ Rd limitada e chame de yn as projeções dos xn a Rd−1 .
yn ∈ Rd−1 é o vetor com yn [i] = xn [i] para i ∈ [d − 1] (n ∈ N).
√
Para cada n ∈ N, podemos usar o fato de que xn [d]2 ≥ 0 e · é função crescente para
observar que:
v v v
u d−1 u d−1 u d
uX uX uX
|yn |2 = t |yn [i]|2 = t |xn [i]|2 ≤ t |xn [i]|2 = |xn |2 .
i=1 i=1 i=1
Por esta razão, a sequência {yn }n∈N é limitada: supn∈N |yn |2 ≤ supn∈N |xn |2 < +∞. Por
hipótese de indução, podemos encontrar um subconjunto infinito Nd−1 ⊂ N tal que
limn∈Nd−1 yn = y ∈ Rd−1 . Como visto acima, isto quer dizer que
∀i ∈ [d − 1] : lim xn [i] = lim yn [i] = y[i].
n∈Nd−1 n∈Nd−1
52
Agora considere {xn [d]}n∈Nd−1 ⊂ R. Esta é uma sequência limitada de números reais, pois
afinal:
sup |xn [d]| ≤ sup |xn |2 < +∞.
n n
Por Análise na Reta, sabemos que existe um Nd ⊂ Nd−1 infinito tal que:
∃ lim xn [d] = z ∈ R.
n∈Nd
Pela Proposição 3.3, sabemos que essa passagem a uma subsequência não estraga a con-
vergência das outras coordenadas, que havia sido garantida antes. Isto é, agora sabemos
que:
∀i ∈ [d] : ∃ lim xn [i],
n∈Nd−1
o que, como visto acima, é a mesma coisa que dizer que {xn }n∈N converge. 2
Exercício 3.3 Considere um espaço (X, dX ) com a métrica discreta. Dada {xn }n∈N ⊂ X, mostre
que xn → x ∈ X se e somente se existe um n0 ∈ N tal que xn = x para todo n ≥ n0 . Prove ainda
que {xn }n∈N é Cauchy se e somente se existe um n0 ∈ N tal que xn = xn0 para todo n ≥ n0 .
Vamos primeiro tentar entender do que estamos falando aqui. Vamos considerar em
primeiro lugar o que quer dizer fn → f nesta métrica. Como ∥fn − f ∥I,∞ é um supremo,
e além disso este supremo é atingido, temos que
Veja que a mudança dos quantificadores faz bastante diferença. Na convergência pontual,
o índice n0 a partir do qual a distância fica menor que ε pode depender tanto de ε quanto
do ponto t. Por outro lado, a convergência uniforme pede que seja achado, para cada
53
ε > 0, um n0 tal que |fn (t) − f (t)| < ε para todo e qualquer qualquer t ∈ I, sempre que
n ≥ n0 . Ou seja, a escolha de n0 deve ser uniforme em t.
Os exemplos abaixo nos mostram duas coisas. A primeira é que o limite pontual de
funções contínuas pode não ser uma função contínua.
Exemplo 3.1 Considere I = [0, 1] e fn (x) = xn , x ∈ I. O limite pontual das fn é f com f (1) = 1
e f (x) = 0 para 0 ≤ x < 1.
xemplo:bola Exemplo 3.2 Considere C([0, 1], R) com a norma do sup. Existe uma sequência {fn }n∈N ⊂
C([0, 1], R) de funções com ∥fn ∥[0,1],∞ = 1, mas fn (x) → 0 para todo x ∈ [0, 1].
A sequência {fn }n∈N para n > 0 é feita de "tendas". A fn é uma "tenda"de altura
1 plantada no intervalo (1/(n + 1), 1/n). Mais precisamente, fn será igual a 0 fora do
intervalo (1/(n + 1), 1/n) e será um "V invertido"dentro do intervalo.
Apresentamos agora a fórmula. Considere a função contínua Ψ : R → R dada por:
0, t ≤ 0;
2t, 0 ≤ t ≤ 21 ;
Ψ(t) := (t ∈ R).
1 − 2 t − 12 , 12 ≤ t ≤ 1;
0, t ≥ 1.
onde
1 1 1
an := − =
n n+1 n(n + 1)
é o comprimento do intervalo (1/(n + 1), 1/n).
Exercício 3.4 Prove que cada fn com n > 0 vale 0 fora do intervalo (1/(n + 1), 1/n) e vale 1 no
ponto médio deste intervalo. Deduza disso as propriedades enunciadas acima.
Por outro lado, nosso principal teorema nesta seção pode ser resumido dizendo-se que
o limite uniforme de funções contínuas é uma função contínua.
ompletoreta Teorema 3.2 C(I, R) é completo com a métrica induzida pela norma ∥ · ∥I,∞ . Ou seja, uma
sequência de funções contínuas sobre I = [a, b] que converge uniformemente tem como limite uma
função contínua.
54
Prova: Tomemos {fn }n∈N ⊂ C(I, R) que é de Cauchy, ou seja, tal que ∥fn − fm ∥I,∞ → 0
quando n, m → +∞. Desejamos mostrar que existe uma função f ∈ C(I, R) tal que
∥fn − f ∥I,∞ → 0. Antes de entrar na prova, fazemos alguns comentários que serão úteis
para entender o que veremos a seguir.
A dificuldade desta prova é que não sabemos de antemão como encontrar uma f
candidata a limite uniforme da sequência. Se tivéssemos essa f , só teríamos que checar
que esta f é mesmo o limite. Como não temos, vamos primeiro construir a função f e
depois provar que ela é o limite que buscamos. Para isso, uma etapa fundamental será
mostrar que as {fn }n∈N convergem pontualmente a uma certa função f (passo 1). Para isso,
mostraremos que, dado qualquer ∀t ∈ I, {fn (t)}n∈N é uma sequência de Cauchy em R.
Como convergência uniforme implica convergência pontual, sabemos que, se as fn
convergem, o limite tem mesmo de ser f . Por isso, a etapa seguinte da prova será mostrar
que fn e f estão uniformemente próximas para f grande (passo 2). A dificuldade aqui é que
temos um "limite duplo" que tem de ser tomado com cuidado. Como último passo,
mostraremos que f ∈ C(I, R), ou seja, o limite uniforme de funções contínuas é função contínua
(passo 3). Assim concluiremos a prova.
Ou seja,
∀x ∈ I : |fn (x) − fm (x)| → 0 quando n, m → +∞,
o que quer dizer que {fn (x)}n ⊂ R é Cauchy, como queríamos demonstrar. Isto quer dizer
que ∃f (x) := limn fn (x) para cada x ∈ I, o que define uma função f : I → R.
55
Observe que o lado direito desta cadeia de desigualdades não depende de x e é uma cota
superior para todo x. Tomando o supremo, descobrimos que
∥fn − f ∥I,∞ = sup |fn (x) − f (x)| ≤ sup ∥fn − fm ∥I,∞ .
x∈I m≥n
Recordamos mais uma vez que {fn }n∈N ⊂ C(I, R) é Cauchy. Isto quer dizer que, dado
ε > 0, podemos encontrar n0 (ε) tal que, se n, m ≥ n0 (ε), então ∥fn − fm ∥I,∞ < ε. Tomando
o sup em m, vemos que
∃n0 (ε) ∈ N, ∀n ≥ n0 (ε) : 0 ≤ ∥fn − f ∥I,∞ = sup |fn (x) − f (x)| ≤ ε.
x∈I
Como isto vale para todo ε, deduzimos que ∥fn − f ∥I,∞ → 0, como queríamos demonstrar.
Passo 3: f é contínua e o fim da prova.
Falta apenas um detalhe, que é provar que f ∈ C(I, R), ou seja, que f é contínua (ou:
o limite uniforme de funções contínuas é uma função contínua). Isto vale se e somente se
para toda sequência convergente {xj }j∈N ⊂ I e todo x ∈ I, xj → x ⇒ f (xj ) → f (x). Para
fazer isto, basta provar que:
(Basta provar) ∀ε > 0 : lim sup |f (xj ) − f (x)| ≤ 0.
j
Para prova esta última desigualdade, observe que, pela desigualdade triangular:
|f (xj ) − f (x)| = |f (xj ) − fn (xj ) + fn (xj ) − fn (x) + fn (x) − f (x)|
≤ |f (xj ) − fn (xj )| + |fn (xj ) − fn (x)| + |fn (x) − f (x)|
O primeiro e o terceiro termo nesta última expressão são da forma |f (t) − fn (t)| com t ∈ I,
sendo, portanto cotados pelo supremo de |f (t) − fn (t)| sobre t ∈ I, que por sua vez é
exatamente ∥f − fn ∥I,∞ . Ou seja,
|f (xj ) − f (x)| ≤ |fn (xj ) − fn (x)| + 2 ∥fn − f ∥I,∞ .
Esta desigualdade vale para cada j e n. Em particular, podemos tomar j → +∞: a
continuidade de fn nos garante que |fn (xj ) − fn (x)| → 0 e portanto,
∀n ∈ N : lim sup |f (xj ) − f (x)| ≤ 2∥fn − f ∥I,∞ .
j∈N
Por fim, mandando n → +∞, vemos que ∥fn − f ∥I,∞ → 0 enquanto o lado esquerdo não
muda. Deduzimos:
lim sup |f (xj ) − f (x)| ≤ 0,
j∈N
56
3.3 Equivalência de métricas e normas
quivalencia
Na seção anterior nós vimos como descrever a convergência em alguns espaços onde isso
não é completamente óbvio à primeira vista. Um ponto importante de se enfatizar é que
em vários casos mostramos que definições diferentes de métrica ou norma conduziram a
uma única noção de convergência. Isto é um ponto importante, que merece uma definição.
Definição 3.6 Considere um conjunto X ̸= ∅ e duas métricas d1 , d2 definidas sobre ele. Dizemos
que as duas métricas são equivalentes se
∀{xn }n∈N ⊂ X, ∀x ∈ X : d1 (xn , x) → 0 ⇔ d2 (xn , x) → 0.
Quando X é um espaço vetorial e as duas distâncias são induzidas por normas ∥ · ∥1 , ∥ · ∥2 , dizemos
que as duas normas são equivalentes quando as métricas induzidas são equivalentes de acordo com
a definição acima.
Por exemplo, a Seção 3.2.2 mostra que as métricas induzidas pelas normas ℓp sobre Rd
são todas equivalentes. Agora apresentamos um caso de não-equivalência de normas (e
métricas).
Exemplo 3.3 Vamos mostrar que duas normas que vimos acima sobre C([0, 1], R) não são equi-
valentes. A primeira é a nossa “norma preferencial":
∥f ∥∞ := sup |f (t)|
t∈[0,1]
Como |f (t)| ≤ ∥f ∥∞ para cada t ∈ [0, 1], vemos facilmente que ∥f ∥1 ≤ ∥f ∥∞ para toda
f ∈ C([0, 1], R). Disto podemos facilmente deduzir que
∥fn − f ∥∞ → 0 ⇒ ∥fn − f ∥1 → 0.
A recíproca, no entanto, não é verdadeira. Considere por exemplo a sequência de funções
{fn }n∈N definidas da seguinte forma:
t ≤ 1 − n1
0,
fn (t) :=
nt − n + 1, 1 − n1 < t ≤ 1.
O leitor pode checar que fn ∈ C([0, 1], R) é não negativa e que
Z 1
1
∥fn ∥1 = fn (t) dt = .
0 2n
Portanto ∥fn − 0∥1 → 0. No entanto, para todo n
∥fn ∥∞ = fn (1) = 1 ̸→ 0,
o que nos diz que fn ̸→ 0 de acordo com a norma ∥ · ∥∞ .
57
Exercício 3.5 Estenda as considerações acima às demais normas ∥ · ∥p (com 1 ≤ p < +∞)
apresentadas no Exercício 2.18.
Em resumo, as normas ∥·∥1 e ∥·∥∞ sobre C não são equivalentes porque há vetores com
norma ∥ · ∥∞ “grande" (igual a 1) e norma ∥ · ∥1 “arbitrariamente pequena" (próxima de 0).
O teorema a seguir e a sua prova mostram que isto é geral: duas normas são equivalentes
se a razão delas (quando definida) nunca está nem muito perto de zero, nem de infinito.
quivalentes Teorema 3.3 Duas normas ∥ · ∥1 e ∥ · ∥2 sobre o mesmo espaço vetorial V são equivalentes se e
somente se existem constantes C, c > 0 tais que
Prova: Deixamos como exercício provar que, se tais constantes existem, as métricas são
equivalentes. Vejamos agora que, se as normas são equivalentes, então existem constantes
C, c > 0 com as propriedades desejadas. Recorde que a equivalência das normas é a
mesma coisa que a equivalência das métricas induzidas pelas normas. Portanto, nossa
hipótese é que
Agora suporemos para chegar a uma contradição que não existe a constante C apontada
acima. Ou seja
(?) ∀C > 0 ∃vC ∈ V : ∥vC ∥2 > C ∥vC ∥1 .
Em particular, podemos encontrar um vetor vn ∈ V com ∥vn ∥2 > (n + 1) ∥vn ∥1 , para cada
n ∈ N. Note que tal vetor não pode ser 0 porque neste caso teríamos ∥vn ∥2 = (n + 1) ∥vn ∥1 .
Portanto, podemos (se necessário) substituir cada vetor vn por vn /(n + 1)∥vn ∥1 e deduzir
que
1
(?) ⇒ ∃{vn }n∈N ⊂ V ∀n ∈ N : ∥vn ∥1 = e ∥vn ∥2 > (n + 1) ∥vn ∥1 = 1.
n+1
No entanto, isto contradiz Hip’: afinal, ∥vn ∥1 → 0 e ∥vn ∥2 ̸→ 0. Isto quer dizer que (?)
nos levou a uma contradição, o que implica que existe, sim, a constante C que queríamos
encontrar. Uma prova semelhante mostra que a c > 0 desejada também existe. 2
58
3.4 Mais exercícios
ntelimitada Exercício 3.6 Seja (X, dX ) um espaço métrico. Considere:
Prove que esta é outra métrica sobre X e que ela é equivalente à métrica original.
2. Defina:
d(t, s) := |ϕ(t) − ϕ(s)| ((t, s) ∈ R2 ).
Mostre que d é uma métrica sobre R e que esta métrica é equivalente à usual.
3. Prove que a sequência {n}n∈N é Cauchy segundo d, mas não converge. Portanto,
(R, d) não é completo (isso mostra que duas métricas podem ser equivalentes e
ainda assim “discordar" no que diz respeito a completude).
• Para k = 0, y ↔0 x se e somente se y = x;
Exercício 3.9 Considere Ψ : [0, +∞) → [0, +∞). Seja (X, dX ) um espaço métrico e defina
Dê condições suficientes sobre Ψ para que dX,ψ seja uma nova métrica sobre X, para qualquer
(X, dX ).
59
Exercício 3.10 (Equivalência das normas em espaços vetoriais produto) Retorne ao exer-
cício 2.20 e mostre que as normas ∥ · ∥V,p (para cada 1 ≤ p ≤ +∞) são todas equivalentes. Prove
ainda que vn → v numa destas normas se e somente se vn [i] → v[i] para cada i ∈ {1, . . . , m}.
ex:produto Exercício 3.11 (Métricas produto) Suponha que (Xi , dXi ), i = 1, . . . , d, são espaços métricos.
Escreveremos os elementos de
X := X1 × X2 × · · · × Xd
como x = (x[1], . . . , x[d]), com cada coordenada x[i] ∈ Xi . Mostre que, para qualquer p ∈ [1, +∞),
a expressão v
u d
uX
p
p d (x, y) := t d (x[i], y[i])p (x, y ∈ X)
Xi
i=1
também define uma métrica sobre X. Prove ainda que uma sequência {xn }n∈N ⊂ X converge a um
x ∈ X e acordo com a métrica dp (com 1 ≤ p ≤ +∞) se e somente se {xn [i]}n∈N ⊂ Xi converge
x[i] ∈ X para cada coordenada 1 ≤ i ≤ d. Prove um resultado semelhante para a propriedade de
Cauchy e deduza que (X, dp ) é completo se e somente se cada espaço (Xi , dXi ) é completo. Mostre
ainda que as métricas definidas acima são todas equivalentes umas às outras.
Exercício 3.12 Considere um espaço vetorial V . Já vimos que uma norma sobre V induz natu-
ralmente uma métrica sobre V . No entanto, nem toda métrica sobre V vem de uma norma. Dê
condições necessárias e suficientes que uma métrica dV deve satisfazer para que exista uma norma
∥ · ∥V tal que
∀v, w ∈ V : ∥v − w∥V = dV (v, w).
Exercício 3.13 Mostre que a métrica discreta e a métrica induzida por R são equivalentes sobre N
ou Z, mas não sobre Q.
Exercício 3.14 Suponha que (V, ∥ · ∥V ) é um espaço vetorial completo e ∥ · ∥′V é uma outra norma
sobre V . Se as duas normas são equivalentes, é necessariamente verdade que (V, ∥ · ∥′V ) é completo?
Exercício 3.15 Considere uma família enumerável de espaços métricos (Xi , di ), i ∈ N\{0}. Cha-
mamos de X o produto cartesiano infinito
X := X1 × X2 × X3 × X4 × . . .
+∞
X
dX (x, y) := 2−i min{di (x[i], y[i]), 1} (x, y ∈ X)
i=1
60
define uma métrica sobre X e que
Exercício 3.16 Dado um espaço métrico (X, dX ), dizemos que D ⊂ X é denso em X se e somente
se todo elemento de X é o limite de alguma sequência de elementos de D. Dizemos que (X, dX ) é
separável se X tem um subconjunto denso e enumerável. Prove que Rd e C([0, 1], R) são separáveis
com suas métricas usuais.
Exercício 3.17 Defina ℓ∞ (N) como sendo o conjunto de todas as sequências limitadas {an }n∈N ⊂
R. Defina uma função sobre este espaço da seguinte forma:
Prove que podemos dar a ℓ∞ (N) uma estrutura de espaço vetorial segundo a qual (ℓ∞ (N), ∥ · ∥∞ )
é um espaço vetorial normado completo. Este espaço é separável?
Exercício 3.18 (Um teorema de Fréchet) A tese de doutorado de Maurice Fréchet introduziu os
conceitos gerais de espaço métrico e compacidade. Ele também demonstrou o seguinte resultado.
Teorema: todo espaço métrico (X, dX ) separável e de diâmetro finito pode ser
“posto dentro de ℓ∞ (N)" no seguinte sentido: se ∥ · ∥∞ é a norma do problema
anterior, então:
Ou seja, há uma bijeção que preserva distâncias entre X (com a métrica dX ) e um subconjunto
S = ϕ(X) ⊂ ℓ∞ (N) (com a métrica induzida por ℓ∞ (N)). Note que o diâmetro de (X, dX ) é
definido por diam(X, dX ) := supx,x′ ∈X dX (x, x′ ).
Para definir esta função ϕ, seja {xn }n∈N uma enumeração de um subconjunto denso de X. Dado
x ∈ X, definimos:
Ou seja, ϕ(x) “lista" a distância de x a cada um dos pontos da sequência {xn }n∈N . Prove que esta
função satisfaz (⋆).
61
62
Capítulo 4
Funções e continuidade
O capítulo anterior nos ensinou o que é convergência em espaços métricos. Isto nos
permite definir continuidade de maneira fácil.
Definição 4.1 Considere dois espaços métricos (X, dX ) e (Y, dY ) e D ⊂ X Dizemos que f : D →
Y é contínua em x ∈ D se
Esta definição é das mais importantes do curso e vamos gastar bastante tempo analisando-
a e testando-a em exemplos. Uma primeira observação (praticamente trivial) está contida
no exercício a seguir.
Exercício 4.1 Formalize e prove a seguinte afirmação: a composição de funções contínuas é uma
função contínua.
63
4.1 Funções contínuas de X em R
Aqui o melhor é proceder a partir de exemplos.
Em primeiro lugar, conhecemos as funções contínuas f : D → R com D ⊂ R. Tome
agora uma nova função:
fi : x ∈ Di := {z ∈ Rd : z[i] ∈ D} 7→ f (x[i]) ∈ R.
Por exemplo, se f (t) = log t, com domínio D = R+ , fi (x) := log x[i], com domínio Di :=
{z ∈ Rd : z[i] ∈ R+ }. Dizemos que este tipo de função só depende da i-ésima coordenada.
Afirmamos que esta função é contínua sempre que a f original é contínua. Para isto,
precisamos provar que, se {xn }n∈N ⊂ Di é uma sequência arbitrária com xn → x ∈ Di ,
então fi (xn ) → fi (x). Para demonstrar isso, recorde que nosso critério de convergência
para sequências em Rd nos diz que xn [i] → x[i] em R. Além disso, a definição de Di garante
que {xn [i]}n∈N ⊂ D, x ∈ D. Concluímos que f (xn [i]) → f (x[i]) porque f é contínua sobre
D. Ou seja, fi (xn ) → fi (x), como queríamos demonstrar.
Vejamos agora alguns exemplos mais interessantes.
Exercício 4.3 Sabemos que o limite de um produto ou soma de sequências convergentes é o produto
(ou soma) dos limites. Deduza disto que, se D ⊂ X e f, g : D → R são contínuas, o mesmo vale
para λ f + g e f g (com λ ∈ R fixo). Com a hipótese adicional de que g não se anula, prove que f /g
também é contínua.
Definição 4.2 Considere dois espaços métricos (X, dX ) e (Y, dY ) e D ⊂ X Dada uma constante
L > 0, dizemos que f : D → Y é L-Lipschitz se
64
Já é sabido de Análise na Reta que funções L-Lipschitz são contínuas. Verifiquemos isto
para espaços métricos arbitrários. Suponha f : D → Y é L-Lipschitz, {xn }n∈N ∪ {x} ⊂ D
e xn → x, isto é, dX (xn , x) → 0. Veja que
logo dY (f (xn ), f (x)) está entre duas sequências que vão a 0. Deduzimos que dY (f (xn ), f (x)) →
0, ou seja f (xn ) → f (x). Como isto vale para todos {xn }n∈N ∪{x} e f como acima, podemos
deduzir que funções Lipschitz são sempre contínuas.
s:Lipschitz Observação 4.1 Uma notação útil para a constante de Lipschitz de uma f : D → Y é a seguinte:
dY (f (x), f (x′ ))
∥f ∥Lip := sup .
x,x′ ∈D, x̸=x′ dX (x, x′ )
e
dX (x′ , x0 ) ≤ dX (x, x0 ) + dX (x, x′ ),
portanto
dR (dX (x, x0 ), dX (x′ , x0 )) = |dX (x, x0 ) − dX (x′ , x0 )| ≤ dX (x, x′ ).
é bem definida, no sentido que os valores dX (x, s) são todos cotados inferiormente por 0 (afinal, a
métrica é positiva definida). Veja que, do mesmo jeito que provamos acima,
65
naocompleto Exemplo 4.3 Como um último exemplo, tomamos uma sequência de Cauchy {xn }n∈N ⊂ X.
Afirmamos que a expressão
f (x) := lim dX (x, xn ) (x ∈ X)
n
Para provar isso, primeiro temos que mostrar que o valor de f (x) está bem definido para
todo x ∈ X. Ou seja, devemos provar que o limite acima existe. Para isso, basta reusar
um exemplo acima e observar que
Deste modo, para cada x ∈ X fixo, a sequência de números reais {dX (x, xn )}n é Cauchy e
portanto convergente.
Para provar que f é 1-Lipschitz, tomamos x, x′ ∈ X arbitrários e, novamente usando
as ideias anteriores, observamos o seguinte:
A principal “graça" deste problema é que ele resulta no exercício a seguir, que será
importante quando estudarmos conjuntos compactos.
Exercício 4.6 Prove que, se (X, dX ) não é completo, então existe uma função f : X → (0, 1]
com f (x) > 0 para todo x ∈ X, mas inf x∈X f (x) = 0.
Exemplo 4.4 Dado t ∈ I, defina a aplicação et : C → R que leva f ∈ C em f (t). Esta é uma
função de C em R.
66
Dadas f, g ∈ C, as propriedades usuais da integral definida nos dizem que:
Z y
|Ix,y (f ) − Ix,y (g)| = (f (t) − g(t)) dt
x
≤ |x − y| sup |f (t) − g(t)|
t∈[x,y]
Ou seja, I(f ) é a única função com as seguintes duas propriedades: a derivada de I(f ) é f e
I(f )(a) = 0. Obviamente I(f ) ∈ C, pois toda função diferenciável é contínua.
Provemos agora que I : C → C é (b − a)-Lipschitz. O que queremos é mostrar que,
dadas f, g ∈ C:
Z t
∥I(f ) − I(g)∥I,∞ = sup (f (s) − g(s)) ds ≤ (b − a) ∥f − g∥I,∞ .
t∈I a
Rt
Mas isto segue do fato que | a
(f (s) − g(s)) ds| ≤ (t − a) sups∈[a,t] |f (s) − g(s)| para cada
t ∈ I.
Exercício 4.7 Mostre que Ix,y = ey ◦ I − ex ◦ I.
ontofixoedo Exemplo 4.7 (EDOs e pontos fixos) Dados (t0 , x0 ) ∈ R × R e Ψ : R → R contínua, definimos
uma nova aplicação TΨ,t0 ,x0 : C → C da seguinte forma: dada f ∈ C, TΨ,t0 ,x0 (f ) ∈ C é a função
cujos valores em cada ponto t ∈ I são dados por
Z t
TΨ,t0 ,x0 (f )(t) := x0 + Ψ(f (s)) ds.
t0
Novamente é fácil ver que TΨ,t0 ,x0 é uma função dem-definida de C em C. A importância dela tem
a ver com a teoria de equações diferenciais ordinárias (ou EDOs). De fato, é um exercício mostrar
que uma função f : I → R resolve o problema de Cauchy autônomo no tempo
′
f (t) = Ψ(f (t)) (t ∈ I)
f (t0 ) = x0
se e somente se f é um ponto fixo de TΨ,t0 ,x0 , ou seja, f = TΨ,t0 ,x0 (f ). Mais adiante desenvolveremos
ferramentas para provar que certas funções contínuas têm um único ponto fixo, provando assim
que o problema de Cauchy acima tem uma única solução.
67
Queremos agora provar que T = TΨ,t0 ,x0 é contínua. Ou seja, dadas {fn }n∈N ∪ {f } ⊂ C,
precisamos mostrar que:
∥fn − f ∥∞ → 0 ⇒ ∥T (fn ) − T (f )∥∞ → 0.
Vamos proceder por partes. Note que
∥T (fn ) − T (f )∥∞ = ∥I(Ψ ◦ fn ) − I(Ψ ◦ f )∥∞ ≤ (b − a) ∥Ψ ◦ fn − Ψ ◦ f ∥∞ .
Portanto, o que precisamos é provar que Ψ ◦ fn converge a Ψ ◦ f uniformemente sobre
I. Ou seja, queremos mostrar que:
∀ε > 0 ∃n0 ∈ N ∀n ≥ n0 : ∥Ψ ◦ fn − Ψ ◦ f ∥∞ ≤ ε.
Antes de partir para prova, faremos algumas observações. A convergência pontual
está assegurada porque Ψ é contínua e fn → f pontualmente, de modo que:
∀t ∈ I : fn (t) → f (t) e portanto Ψ ◦ fn (t) = Ψ(fn (t)) → Ψ(f (t)) = Ψ ◦ f (t).
A convergência uniforme é um pouco mais sutil. O fato de que fn (t) converge unifor-
memente a f (t) não implica diretamente que Ψ ◦ fn (t) → Ψ ◦ f (t) de forma uniforme. Para
isso, teremos de usar o fato que Ψ é uniformemente contínua sobre intervalos compactos. Ou
seja, precisamos nos recordar que:
∀M > 0 ∀η > 0 ∃δ = δ(M, η) > 0 : ∀x, y ∈ [−M, M ], |x − y| ≤ δ ⇒ |Ψ(x) − Ψ(y)| ≤ η.
Note que, em nossa prova, queremos estudar os valores de |Ψ(x) − Ψ(y)| quando
x = fn (t) e y = f (t). Por isso, tomaremos M de modo que os valores de fn (t) e f (t) estejam
em [−M, M ] para todo n. De fato, veja que
68
naocontinua Exemplo 4.8 Suponha I = [0, 1] e seja D ⊂ C(I, R) o conjunto de todas as funções diferenciáveis
em t = 1/2. Defina D : D → R como D(f ) := f ′ (1/2), f ∈ D. Argumentamos que D não é
contínua.
De fato, basta observar que existem funções próximas de 0 na norma do sup que têm
derivada arbitrariamente grande em t = 1/2. Por exemplo, tomando
1
fk (x) := sin(2π k 2 (x − 1/2)), (x ∈ [0, 1])
k
temos que ∥fk ∥I,∞ = 1/k → 0, mas D(fk ) = fk′ (1/2) = k → +∞.
Definição 4.3 Se V, W são espaços vetoriais reais, uma função T : V → W é dita uma transfor-
mação linear se:
∀v, v ′ ∈ V, ∀λ ∈ R : T (λ v + v ′ ) = λT (v) + T (v ′ ).
Se W = R, dizemos que T é um funcional linear.
69
Se V = Rd e W = Rℓ , sabemos de Álgebra Linear que há uma correspondência entre
transformações lineares e matrizes. Isso será útil para o exemplo a seguir.
De fato, sabemos que existe um elemento AT ∈ Rℓ×d que representa T , no sentido que
AT v = T (v) para todo v ∈ Rd . Recordando a definição da norma de operador no Exemplo
2.6, deduzimos que:
|T (v) − T (v ′ )|p2
∥T ∥Lip := sup
v,v ′ ∈Rd , v̸=v ′ |v − v ′ |p1
|T (v − v ′ )|p2
(linearidade de T ) = sup
v,v ′ ∈Rd , v̸=v ′ |v − v ′ |p1
|T (h)|p2
(tome h = v − v ′ ) = sup
h∈Rd , h̸=0Rd |h|p1
|AT h|p2
(AT representa T + def. da norma de op.) = sup = ∥AT ∥p1 →p2 < +∞.
h∈Rd , h̸=0Rd |h|p1
Exemplo 4.10 Usando a notação da Seção 4.3, as funções et , Ix,y : C → R são funcionais lineares
contínuos (posto que Lipschitz), I : C → C também é Lipschitz (logo contínua) e TΨ,t0 ,x0 em geral
não é linear. O operador D é um funcional linear descontínuo sobre o subconjunto D ⊂ C das
funções diferenciáveis em t = 1/2, que também é um espaço vetorial real.
O teorema abaixo nos diz que uma transformação linear é contínua se e somente se é
Lipschitz.
teo:contlim Teorema 4.1 Considere dois espaços vetoriais reais normados (V, ∥ · ∥V ), (W, ∥ · ∥W ). Dada uma
transformação linear T : V → W , são equivalentes:
1. T é limitada, ou seja:
3. T é contínua no ponto 0V .
70
Prova: 1⇒2. Chame de L := ∥T ∥V →W . Afirmamos que para quaisquer v, v ′ ∈ V vale a
desigualdade ∥T (v) − T (v ′ )∥W ≤ L ∥v − v ′ ∥V . De fato, esta desigualdade é trivialmente
satisfeita se v = v ′ . Caso contrário, podemos olhar para o vetor z := (v − v ′ )/∥v − v ′ ∥V ;
ele tem norma ∥z∥V = 1 e portanto ∥T (z)∥W ≤ ∥T ∥V →W = L. Deduzimos por linearidade
que
T (v) − T (v ′ ) ∥T (v) − T (v ′ )∥W
T (z) = , portanto = ∥T (z)∥W ≤ L,
∥v − v ′ ∥V ∥v − v ′ ∥V
como queríamos demonstrar.
2⇒3 é direto.
3⇒1. A ideia da prova é muito semelhante à que usamos na prova do Teorema 3.3.
Supondo (para chegar a uma contradição) que T não é limitado, podemos encontrar, para
cada n ∈ N, um vetor vn ∈ V com ∥vn ∥V = 1 e ∥T (vn )∥W ≥ n + 1. Isto quer dizer que, por
um lado, vn /(n + 1) → 0V , mas, por outro lado (usando linearidade),
vn
= ∥T (vn )∥W = 1 ̸→ 0.
T
n + 1
W n+1
Isto quer dizer que T não é contínuo, o que contradiz a hipótese 3. Deduzimos que T é,
sim, limitado, como queríamos demonstrar. 2
∥T v∥W
∥T ∥V →W = sup = ∥T ∥Lip
v∈V \{0}V ∥v∥V
ex:scriptL Exercício 4.10 Chame de L(V, W ) o espaço das transformações lineares limitadas entre V e W
(como no teorema acima), com a estrutura "natural" de soma e produto por escalar. Mostre que
(L(V, W ), ∥ · ∥V →W )
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ∥ · ∥W ) é Banach.
[Dica: a ideia para provar que é espaço normado é mostrar logo de cara que ∥ · ∥V →W é
subaditiva. Para provar que é Banach, mostre que, se {Tn }n∈N ⊂ L(V, W ) é uma sequência
de Cauchy, então {Tn v}b∈N é Cauchy para qualquer v ∈ V ; deduza que há convergência
pontual e pode-se definir um limite T v = limn Tn v. Não é difícil provar que T é linear pela
convergência pontual. Como provar que T ∈ L(V, W ) e ∥Tn − T ∥V →W → 0?]
71
4.6 Transformações multilineares e tensores
Uma extensão importante das espaços vetoriais é a de transformações multilineares.
Definição 4.4 Considere espaços vetoriais reais V1 , V2 , . . . , Vk , W com suas respectivas normas.
Uma função:
Q : V1 × V2 × · · · × Vk → W
é dita transformação k-linear se é linear em cada argumento, isto é, se, dados um índice i ∈ [k] e
vetores vj ∈ Vj , j ∈ [k]\{i}, a função
∥Q(v1 , v2 , . . . , vk )∥W
∥Q∥V1 ×...Vk →W := sup Qk < +∞.
(v1 ,...,vk )∈(V1 \{0V1 })×···×(Vk \{0Vk }) i=1 ∥v i ∥ V i
Veja que, neste caso, não garantimos que Q é Lipschitz. De fato, funções bilienares em
geral não são Lipschitz. O exemplo mais simples de função bilinear é a que leva (x, y) ∈ R2
em xy; não é difícil ver que esta função não é Lipschitz.
Prova: Vamos começar provando que “limitada⇒contínua".
Suponha que L := ∥Q∥V1 ×...Vk →W < +∞. Imagine que temos uma sequência {vn }n∈N ⊂
V e um ponto v ∈ V com vn → v. Nosso objetivo será mostrar que Q(vn ) → Q(v).
Escrevemos
vn = (vn,1 , vn,2 , . . . , vn,k ) ∈ V1 × V2 × · · · × Vk
e
v = (v1 , v2 , . . . , vk ) ∈ V1 × V2 × · · · × Vk .
A ideia principal da prova é a seguinte. A convergência vn → v implica que vn,i → vi ,
como veremos a seguir. Deste modo, esperamos que vn,i esteja próximo de vi para n grande.
Nossa ideia será usar essa proximidade “coordenada a coordenada" para comparar Q(vn )
72
e Q(v). Para isso, vamos tentar escrever Q(v) − Q(vn ) passando de v a vn de uma forma
que só muda uma coordenada de cada vez, porque aí poderemos usar a linearidade.
Para ilustrar isso, vamos considerar o caso em que k = 2 e Q é bilinear. Dados
v = (v1 , v2 ), u = (u1 , u2 ) ∈ V podemos escrever:
Q(v1 , v2 )−Q(u1 , u2 ) = Q(v1 , v2 )−Q(u1 , v2 )+Q(u1 , v2 )−Q(u1 , u2 ) = Q(v1 −u1 , v2 )+Q(u1 , v2 −u2 ).
Portanto,
∥Q(v1 , v2 ) − Q(u1 , u2 )∥ ≤ ∥Q∥V →W ∥v1 − u1 ∥V1 ∥v2 ∥V2 + ∥Q∥V →W ∥u1 ∥V1 ∥v2 − u2 ∥V2 .
Disso podemos deduzir que, se u1 → v1 e u2 → v2 , então Q(u1 , u2 ) → Q(v1 , v2 ). Daremos
mais detalhes abaixo na prova para Q geral.
Comecemos com a parte de convergência. Nossa hipótese diz que
k
X
∥v − vn ∥V = ∥vi − vn,i ∥Vi → 0.
i=1
Portanto,
∀1 ≤ i ≤ k : ∥vi − vn,i ∥Vi → 0.
Em particular, cada sequência ∥vi − vn,i ∥Vi é limitada, de modo que existe um C > 0 com
∀1 ≤ i ≤ k, ∀n ∈ N : ∥vi − vn,i ∥Vi ≤ C.
(j)
Consideramos agora termos “intermediários"wn entre vn e v, com j = 0, . . . , k, que
definimos da seguinte forma.
(j) (j) (j)
wn(j) = (wn,1 , wn,2 , . . . , wn,k ) ∈ V1 × V2 × · · · × Vk
onde
(j) vn,i , i ≤ j;
wn,i = (i ∈ [k])
vi , i > j.
(0) (k) (j) (j−1)
Deste modo, wn = v, wn = vn e cada wn difere de wn apenas na j-ésima coordenada.
Usando uma soma telescópica, podemos escrever:
k
X
Q(v) − Q(vn ) = Q(wn(j) ) − Q(wn(j−1) ).
j=1
Portanto,
k
X
∥Q(v) − Q(vn )∥W ≤ ∥Q(wn(j) ) − Q(wn(j−1) )∥W .
j=1
73
(j) (j−1)
Recorde agora que cada wn difere de wn apenas na j-ésima coordenada. Esse é o tipo
de situação em que a multilinearidade de Q se aplica. Mais exatamente, vemos que
vn,i , i < j;
(j) (j) (j)
Q(wn ) − Q(wn ) = Q(xn,1 , . . . , xn,k ) onde xn,k =
(j) (j−1)
vn,j − vj , i = j; (i ∈ [k]).
vi , i > j.
Portanto,
k
Y (j)
∥Q(wn(j) ) − Q(wn(j−1) )∥W ≤ ∥Q∥V1 ×···×Vk →W ∥xn,k ∥Vj ≤ L C k−1 ∥vn,j − vj ∥Vj .
j=1
Deduzimos que
k
X
∥Q(v) − Q(vn )∥W ≤ L C k−1 ∥vn,j − vj ∥W → 0,
j=1
Exercício 4.11 Por que escolhemos a função ln n na hora de “renormalizar os vn,i " na prova acima?
Mostre que, de fato, poderíamos ter tomado a função n1/k−a , com qualquer 0 < a < 1/k, e a mesma
estratégia ainda funcionaria.
Exercício 4.12 Chame de Lk (V1 × · · · × Vk , W ) o espaço das transformações k-lineares limitadas
entre V1 , . . . , Vk e W (como no teorema acima), com a estrutura "natural" de soma e produto por
escalar. Mostre que
(Lk (V1 × · · · × Vk , W ), ∥ · ∥V1 ×···×Vk →W )
é espaço vetorial normado. Prove ainda que este espaço é Banach sempre que (W, ∥ · ∥W ) é Banach.
74
4.6.1 Tensores em dimensão finita
Como são as funções multilineares Q : Rd1 × Rd2 × . . . Rdk → R com k ≥ 2? Vamos chamar
(d ) dj
de {ei j }i=1 a base canônica de Rdj . Como todo xj ∈ Rdj é da forma
dj
(dj )
X
xj = xj [i] ei
i=1
temos que
d1
X dk
X k
Y
Q(x1 , . . . , xk ) = ··· A[i1 , . . . , ik ] xj [ij ] (x1 ∈ Rd1 , . . . , xk ∈ Rdk ). (4.1) eq:tensormu
i1 =1 ik =1 j=1
(d ) (d )
onde A[i1 , . . . , ik ] := Q(ei1 1 , . . . , eik k ) ∈ R.
Do mesmo modo, se chamados de tensor qualquer elemento do espaço
Rd1 ×d2 ×···×dk := {A = (A[i1 , . . . , ik ])i1 ∈[d1 ]....,ik ∈[dk ] : cada A[i1 , . . . , ik ] ∈ R},
vemos que cada tensor define uma transformação multilinear de Rd1 × . . . Rdk em R.
Portanto, há uma correspondência biunívoca entre tensores e tais transformações. Em
particular, no caso k = 2, os tensores são matrizes as funções bilineares correspondentes
são formas quadráticas.
75
Veja que, dado (x1 , . . . , xk ) no domínio do tensor:
d dk
X1 X
|Q(x1 , . . . , xk )| = ··· A[i1 , . . . , ik ] x1 [i1 ] x2 [i2 ] . . . xk [ik ]
i1 =1 ik =1
d1
X dk
X
≤ ··· |A[i1 , . . . , ik ]| |x1 [i1 ]| |x2 [i2 ]| . . . |xk [ik ]|
i1 =1 ik =1
d1
X dk
X
≤ L ··· |x1 [i1 ]| |x2 [i2 ]| . . . |xk [ik ]|
i1 =1 ik =1
k
Y
= L ∥xi ∥1
i=1
k
k
Y
≤ Ld 2 ∥xi ∥2 .
i=1
Prod(f, g) := f g.
Ou seja, a função Prod toma como entrada duas funções contínuas e retorna seu produto f g.
Como o produto de funções contínuas é uma função contínua, esta é uma aplicação
bem definida de C × C em C.
A bilinearidade de Prod fica como exercício. Para mostrar que esta aplicação é limitada,
e portanto contínua, basta observar que:
e portanto
∥Prod∥C×C→C ≤ 1.
Exemplo 4.12 (Convolução) Suponha para simplificar que [a, b] = [0, 1]. Defina Conv : C ×
C → C via a fórmula
Z t
Conv(f, g)(t) = f ∗ g(t) := f (s) g(t − s) ds (t ∈ I).
0
76
Para fixar, a expressão acima quer dizer o seguinte: dadas as funções f, g : I → R,
formamos uma nova função Conv(f, g) = f ∗ g. Essa função estará definida do momento
em que especificamos o valor de f ∗ g(t) para cada ponto t ∈ I. Nossa especificação é dada
pela integral acima.
Queremos provar que esta é uma operação bilinear limitada (contínua) Conv : C × C →
C. A bilinearidade é evidente e a limitação vem do fato de que
Z t
∀t ∈ [0, 1] :
f (s) g(t − s) ds ≤ sup |f (s)| |g(t − s)| ≤ ∥f ∥∞ ∥g∥∞ .
0 t,s∈I
Portanto,
∀f, g ∈ C : ∥Conv(f, g)∥∞ ≤ ∥f ∥∞ ∥g∥∞ .
A parte mais difícil do argumento é mostrar que f ∗g é uma função contínua para quaisquer
f, g ∈ C. Para fazer isso, fixamos primeiramente um t′ ∈ I e estimamos a diferença:
f ∗ g(t) − f ∗ g(t′ )
no caso em que |t − t′ | = δ. Para facilitar, supomos que t′ ≤ t, pois o outro caso é análogo.
Veja que
Z t Z t′
′
f ∗ g(t) − f ∗ g(t ) = f (s) g(t − s) ds − f (s) g(t′ − s) ds
0 0
Z t′ Z t
′
= f (s) (g(t − s) − g(t − s)) ds + f (s) g(t − s) ds
0 t′
=: (I) + (II).
Portanto,
77
Agora imagine que t′ → t, de modo que δ → 0. Veja que o primeiro termo do lado direito
vai a 0. O segundo também, porque g : I → R é contínua e portanto uniformemente
contínua. Deduzimos que:
0 ≤ lim
′
|f ∗ g(t) − f ∗ g(t′ )| ≤ lim sup(δ ∥f ∥∞ ∥g∥∞ + ∥f ∥∞ sup |g(a) − g(b)|) = 0.
t →t δ→0 a,b∈I, |a−b|≤δ
Enuncie e esboce a prova de uma versão do resultado acima para o produto de k > 2 matrizes.
Exercício 4.15 Veremos neste exercício e nos próximos algumas propriedades da notação ∥f ∥Lip
introduzida na observação 4.1 acima. Como lá, supomos que f : D → Y com D ⊂ X e (X, dX ),
(Y, dY ) espaços métricos. Prove que:
∀L ∈ R+ : f é L-Lipschitz ⇔ L ≥ ∥f ∥Lip .
Deduza que f é Lipschitz (com alguma constante) se e somente se ∥f ∥Lip < +∞.
:Lipschitz1 Exercício 4.16 Seguimos com a notação do exercício anterior, mas agora no caso específico em que
Y = R com a métrica usual.
78
3. Suponha que F é uma família de funções Lipschitz de D em R tal que
∀x ∈ D, inf f (x) ∈ R.
f ∈F
Mostre que a funcão f∗ : D → R que associa a cada x ∈ D o valor f∗ (x) = inf f ∈F f (x)
satisfaz:
∥f∗ ∥Lip ≤ sup ∥f ∥Lip .
f ∈F
∀x ∈ D, sup f (x) ∈ R.
f ∈F
Mostre que a funcão f ∗ : D → R que associa a cada x ∈ D o valor f ∗ (x) = supf ∈F f (x)
satisfaz:
∥f ∗ ∥Lip ≤ sup ∥f ∥Lip .
f ∈F
(Juntos, este item e o anterior mostram que o ínfimo e supremo de funções Lipschitz com
constantes uniformemente limitadas também é Lipschitz.)
1. BL(X, R) é espaço vetorial com as operações naturais de soma e multiplicação por escalar.
Além disso,
∥f ∥BL := ∥f ∥∞ + ∥f ∥Lip (f ∈ BL(X, R))
é norma sobre este espaço.
3. Dadas f, g ∈ BL(X, R), temos que f.g, min{f, g} e max{f, g} também pertencem a
BL(X, R), com
79
oconvolucao Exercício 4.18 Este exercício mostra que toda função contínua e limitada de um espaço métrico
em R é o limite pontual de uma sequência crescente de funções Lipschitz. Nos últimos itens,
discutiremos se esta convergência pode ser tomada uniforme.
Tome um espaço métrico (X, dX ) e uma função limitada f : X → R. Dado M > 0, chame de
fM a seguinte aproximação de f , chamada de ínfimo-convolução:
fM (x) := inf (f (y) + M dX (x, y)).
y∈X
e recursivamente para j = 2, 3, . . . , d
x∗ [j] := min x[i] e ij (x) := min{i ∈ [n]\{i1 (x), . . . , ij−1 (x)} : x[i] = x∗ [1]}.
i∈[n]\{i1 (x),...,ij−1 (x)}
A função que queremos estudar, chamada de Ord : Rd → Rd , leva x em Ord(x) := x∗ . Prove que
esta função é 1-Lipschitz na norma ℓ∞ (e portanto contínua em qualquer norma). Se quiser, use os
itens abaixo para provar isso.
80
1. Dado x ∈ Rd , mostre que os índices i1 (x), . . . , in (x) são uma permutação de [n], que:
Use este fato para deduzir que |Ord(x) − Ord(x′ )|∞ ≤ |x − x′ |∞ para quaisquer x, x′ ∈ Rd .
Exercício 4.22 (O espectro de uma matriz simétrica) Recorde de Álgebra Linear que toda ma-
triz simétrica A ∈ Rd×dsim tem d autovalores reais (com possívels multiplicidades). Nestas notas,
usaremos a convenção de que estes autovalores são ordenados de forma decrescente: λ1 (A) ≥
λ2 (A) ≥ · · · ≥ λd (A). Desta forma, existe uma função
Λ : Rd×d
sim → R
d
associando cada A ao seu vetor de autovalores correspondente. Prove que esta função é 1-Lipschitz
quando usamos a norma ∥ · ∥2→2 nas matrizes e a norma | · |∞ nos vetores, isto é:
∀A, B ∈ Rd×d
sim : |Λ(A) − Λ(B)|∞ ≤ ∥A − B∥2→2 .
Uma dica é primeiro tentar provar que “A 7→ λj (A)” é 1-Lipschitz para cada j ∈ [d]. Para fazer
isso, pode ser útil usar a fórmula de Courant-Fisher (que você não precisa provar):
!
λj (A) := inf sup v · Av .
E subespaço de Rd , dim(E)=n−j+1 v∈E, |v|2 =1
Obs: este é um resultado importante de estabilidade para matrizes simétricas, que tem muita
importância em aplicações. No entanto, os autovetores podem ser muito menos estáveis!
81
82
Parte II
83
Capítulo 5
Neste capítulo, começaremos a discutir conceitos topológicos. Veremos o que são conjuntos
abertos e fechados em um espaço métrico; discutiremos porque os abertos formam o que se
chama de topologia; relacionaremos continuidade a estes dois conceitos; e ainda, trataremos
da topologia relativa que um conjunto pode herdar de outro maior. A linguagem e os
resultados desenvolvidos aqui serão importantes para tudo o que vem a seguir.
Ao longo deste capítulo, (X, dX ) será um espaço métrico dado. Dados x ∈ X e r ≥ 0,
denotamos por B(X,dX ) (x, r) BX (x, r) ou apenas B(x, r) a chamada bola aberta de raio r ao
redor de x:
B(x, r) := {y ∈ X : d(x, y) < r}.
Também definimos a bola fechada B(X,dX ) [x, r], BX [x, r] ou B[x, r] como
Mostre ainda que B[x, 0] = B[x, 1/2] = B(x, 1) = {x} se a métrica é discreta.
Definição 5.1 A ⊂ X é dito aberto (segundo a métrica dX ) se para todo x ∈ X existe um δ > 0
tal que BX (x, δ) ⊂ A. F ⊂ X é dito fechado (também segundo a métrica dX ) se X\F é aberto.
85
Exemplo 5.1 Todos os subconjuntos são abertos e fechados se a métrica é discreta. Isto porque,
como visto acima, todo dado A ⊂ X, temos
∀x ∈ A : {x} = BX (x, 1) ⊂ A.
Também observamos que toda bola aberta é aberta. A prova é simples, mas será
apresentada inteira para que possamos praticar o conceito.
Para ver isso, tome uma bola B(x, r) com r > 0 e um elemento y ∈ B(x, r). Nosso
objetivo é mostrar que existe um raio positivo δ > 0 tal que B(y, δ) ⊂ B(x, r). Para isso, é
necessário provar que δ > 0 tem a seguinte propriedade: todo z ∈ B(y, δ) também está em
B(x, r). Usando as definições das bolas, isto significa que devemos mostrar o seguinte:
O que nos permite achar este δ é a desigualdade triangular. Afinal, sabemos que
Logo, precisamos escolher δ tal que δ + d(y, x) < r e δ > 0. Como d(x, y) < r (já que
y ∈ B(x, r)), podemos escolher δ := r − d(x, y) > 0 e terminar assim a prova.
Exemplo 5.3 De forma semelhante, toda bola fechada B[x, r] é um subconjunto fechado de X,
onde agora r ≥ 0.
De fato, isto equivale a mostrar que X\B[x, r] é aberto, ou seja, que para todo todo
y ∈ X\B[x, r] existe um δ > 0 tal que B(y, δ) ⊂ X\B[x, r]. A condição necessária sobre δ
desta vez é que
Como y ̸∈ B[x, r], d(x, y) > r, podemos tomar δ = r − d(x, y) e garantir que d(z, y) < δ
implica d(z, x) > r.
Exercício 5.3 Prove que os intervalos abertos e fechados de R são mesmo abertos e fechados,
segundo a definição acima. (De fato, todo intervalo aberto ou fechado de comprimento finito é uma
bola aberta.)
86
Exercício 5.4 Dados (X, dX ), x ∈ X e r1 , r2 > 0, prove que BX (x, r1 )∪BX (x, r2 ) = BX (x, max{r1 , r2 })
e BX (x, r1 )∩BX (x, r2 ) = BX (x, min{r1 , r2 }). Prove um resultado semelhante para bolas fechadas.
Nas definições acima definimos fechado em função de aberto. O próximo resultado nos
permite definir o que é um conjunto fechado em termos de limites de sequências.
:fechadoseq Teorema 5.1 F ⊂ X é fechado se e somente se limn xn ∈ F para toda sequência convergente
{xn }n∈N ⊂ F .
Vamos provar primeiro a direção “⇒". Supondo que A é aberto, seja {xn }n qualquer
sequência convergente contida em X\A e seja x = limn xn . Suponha (para chegar a uma
contradição) que x ̸∈ X\A, ou seja, x ∈ A. Como A é aberto, existe um r > 0 tal que
B(x, r) ⊂ A. Por outro lado, como xn ̸∈ A para todo n, temos:
Segue que d(xn , x) não converge a 0, ou seja, x não é o limite da sequência. Como isto é
uma contradição, deduzimos que x ∈ X\A.
Agora mostraremos a direção “⇐" da equivalência via a afirmação contrapositiva. Isto
é, mostraremos que:
Vejamos: se A não é aberto, então existe um ponto x ∈ A tal que B(x, r) ̸⊂ A para
qualquer r > 0. Em particular, dado n ∈ N, podemos sempre encontrar um elemento
xn ∈ B(x, 1/(n + 1)) ∩ (X\A). Isto quer dizer que:
Deste modo, vemos que x ∈ A, dX (xn , x) → 0(ou seja, xn → x) e {xn }n∈N ⊂ X\A. Ou
seja, supondo que A não é aberto, provamos que há uma sequência contida em X\A com
limite em A. 2
ex:todabola Exercício 5.5 Demonstre o seguinte escólio da demonstração acima: um ponto x ∈ X é o limite
de uma sequência de pontos em S ⊂ X se e somente se B(x, r) ∩ S ̸= ∅ para todo r > 0.
87
5.1 Os abertos formam uma topologia
Nesta seção provaremos que os abertos de um espaço métrico formam uma topologia.
Primeiro temos de definir esta palavra.
Exercício 5.6 Todo X possui duas topologias extremas: Tgrossa = {∅, X} e Tf ina = {todos os
subconjuntos de X}. Mostre que estas topologias são mesmo topologias.
Exercício 5.7 Mostre que a interseção de um número finito de conjuntos abertos é sempre um
conjunto aberto.
O principal resultado desta seção é que os abertos de um espaço métrico formam uma
topologia.
m:topologia Teorema 5.2 Considere um espaço métrico (X, dX ). Seja T(X,dX ) a coleção de todos os subcon-
juntos de X que são abertos na noção dada pela métrica dX . Então T(X,dX ) é uma topologia sobre
X.
Corolário 5.1 Qualquer união de abertos em (X, dX ) é também um conjunto aberto. Qualquer
interseção de dois conjuntos abertos em X é aberta (do mesmo modo, qualquer interseção finita é
aberta).
Note que interseções infinitas podem não ser abertas. Por exemplo, em R (com a
métrica usual), a coleção de conjuntos
A := {(−t, t) : t > 0}
88
Provaremos agora que vale o segundo axioma. Dada uma coleção qualquer de abertos
A ⊂ TdX , queremos provar que ∪A∈A A ∈ TdX . Recorde o que isto quer dizer: se tomarmos
um elemento qualquer x ∈ ∪A∈A A, deve existir um raio positivo r com BX (x, r) ⊂ ∪A∈A A.
Para achar o raio, lembramos que um dado x só pode pertencer à união se pertence a pelo
menos um dos conjuntos Ax ∈ A. Como todos os elementos de A são abertos, sabemos que
Ax é aberto e x ∈ Ax . Logo, existe um r > 0 tal que BX (x, r) ⊂ Ax . Também sabemos que
Ax ⊂ ∪A∈A A, pois a união dos conjuntos A ∈ A contem todos os conjuntos A ∈ A. Como
a relação “⊂" é transitiva, deduzimos que BX (x, r) ⊂ ∪A∈A A. Dito de outro modo: como
x está num conjunto da união, ele tem uma “bolha" ao seu redor dentro deste conjunto e,
portanto, tem uma bolha na união.
Consideremos agora o terceiro axioma, que fala da interseção de dois abertos A, A′ ⊂ X.
Para provar que A ∩ A′ é aberto, devemos mostrar que, dado um x ∈ A ∩ A′ , temos
B(x, r) ⊂ A ∩ A para algum r > 0. Para isto, partimos do fato de que A e A′ são ambos
abertos e que x pertence aos dois; afinal, só assim x pode estar na interseção. Deduzimos:
x ∈ A ⇒ ∃R > 0 : B(x, R) ⊂ A (porque A é aberto)
′ (intersecção)
x∈A∩A ⇒
x ∈ A′ ⇒ ∃R′ > 0 : B(x, R′ ) ⊂ A (porque A′ é aberto)
Tomemos então r = min{R, R′ }. Como R, R′ > 0, r > 0 também. Além disso, B(x, r) ⊂
B(x, R) ⊂ A e B(x, r) ⊂ B(x, R′ ) ⊂ A′ , de modo que B(x, r) ⊂ A ∩ A′ . Ou seja, mostramos
que a “menor das bolhas" que x tem dentro de A e A′ está inteiramente contida na
interseção. 2
Exercício 5.8 De modo geral, chamamos uma topologia T sobre X de metrizável se ela provem
de uma métrica, ou seja, se existe uma métrica sobre X tal que T = TdX . Mostre que existem
topologias não metrizáveis; por exemplo, a topologia grossa definida acima não é metrizável.
O estudo de espaços topológicos gerais é chamado de Topologia Geral. Esta área tem
relações profundas com a Lógica e a Teoria de Conjuntos. De fato, muitas propriedades
que já estudamos e ainda estudaremos são demonstradas com apelos simples às leis de
DeMorgan para operações com conjuntos. Por exemplo:
1. O complementar do complementar é o próprio conjunto. Fixo X, o complementar de
S⊂Xé
S c := {x ∈ X : x ̸∈ S} = X\S.
A operação complementar é idempotente: ou seja, (S c )c = S.
2. O complementar da união é a interseção dos complementares. Com X como acima, se A é
uma coleção de subconjuntos de X,
[ \
( A)c = Ac .
A∈A A∈A
Estas leis são uma ótima maneira de passarmos de propriedades de abertos para as de
fechados. Por exemplo, o exercício abaixo segue diretamente desse tipo de observação.
89
terfechados Exercício 5.9 Mostre que, em qualquer espaço topológico, qualquer interseção de conjuntos fecha-
dos é fechada. Prove ainda que a união de um número finito de conjuntos fechados resulta em outro
conjunto fechado. (Estes dois fatos seguem das leis sobre complementares de uniões e interseções
aplicadas às propriedades dos abertos.)
Exercício 5.10 (Vizinhanças abertas) Se (X, TX ) é espaço topológico e x ∈ X, uma vizinhança
aberta de x é um aberto Bx ∈ TX com x ∈ B. Mostre que A ⊂ X é aberto se e somente se podemos
encontrar, para cada x ∈ A, podemos encontrar uma vizinhança aberta Bx de x com Bx ⊂ A.
90
Agora vamos tentar pensar no que os conceitos significam, partindo do princípio que
um conjunto aberto “protege" seus elementos do mundo exterior (como falamos das bolhas
acima).
Segue das regras da união que um ponto x ∈ X é elemento de S o se e somente se existe
um aberto A ⊂ X com x ∈ A; isto é, x ∈ S o se está “protegido do complementar de S".
Por esta razão, o resultado abaixo é natural.
2
Para o fecho, temos um resultado análogo ao acima.
Por fim, apresentamos mais uma definição topológica relacionada à de fecho. Como
acabamos de ver, x ∈ S se e somente se não está protegido de S. Isso pode acontecer
simplesmente porque x ∈ S, mas essa é a forma “boba" de estar desprotegido. O mais
interessante é quando um ponto não está protegido de S\{x}.
91
Definição 5.4 Dado x ∈ X e S ⊂ X, dizemos que x é ponto de acumulação de S se e somente se
qualquer aberto A ⊂ X com x ∈ A satisfaz A ∩ (S\{x}) ̸= ∅ (dá no mesmo pedir que A ∩ S ̸= ∅
e A ∩ S ̸= {x}). Chamamos de S ′ o conjunto de pontos de acumulação de S, também chamado de
conjunto derivado de S.
Proposição 5.5 Suponha que a topologia T é tal que todo conjunto unitário é fechado. S ′ é fechado
para qualquer S ⊂ X.
Observação 5.1 Topologias com a propriedade de que todo conjunto unitário é fechado são cha-
madas de T1 . Sem esta propriedade, pode ser que S ′ não seja fechado (veja os exercícios 5.29, 5.30
e 5.31 no fim da seção). De qualquer modo, toda topologia que vem de uma métrica é T1 , porque
{x} = B[x, 0] é sempre fechado.
Prova: Devemos mostrar que X\S ′ é aberto. Para isso, vamos mostrar que X\S ′ é uma
união de abertos Ax que definiremos a seguir.
Tome x ∈ X\S ′ , ou seja, um x que não é ponto de acumulação. Tal x está contido em
um aberto Ax ∋ x tal que Ax ∩ S = ∅ ou {x}. Veja que A = ∪x∈X\S ′ Ax é aberto e que
A ⊃ X\S ′ , porque cada x em X\S ′ está no seu “próprio" conjunto Ax .
Para demonstrar que S ′ é fechado, é suficiente mostrar que o aberto A é igual a X\S ′ .
Como já sabemos A ⊃ X\S ′ , basta mostrar que A ⊂ X\S ′ . De fato, como A é a união
dos Ax para x ∈ X\S, basta provarmos que cada um destes conjuntos Ax está contido em
X\S ′ . Ou seja, queremos provar o seguinte:
Se z = x isso já vale, então suporemos que z ̸= x. Para provar que z não é ponto de
acumulação, temos de achar um aberto Oz ∋ z com Oz ∩ S = ∅ ou {z}.
Ocorre que
Oz := Ax \{x} = Ax ∩ {x}c
funciona. Oz é aberto porque é a interseção dos abertos Ax e {x}c (o conjunto unitário é
fechado por hipótese!). Além disso, z ∈ Oz porque z ∈ Ax e z ∈ {x}c (afinal, z ̸= x). Por
fim, sabemos que Ax ∩ S = ∅ ou Ax ∩ S = {x}, portanto Oz ∩ S = ∅ obrigatoriamente. Ou
seja, provamos que z ∈ Oz aberto e Oz ∩ S = ∅, o que garante que z ̸∈ S ′ . 2
Exercício 5.13 Mostre que N′ = ∅ e Q′ = R (como subconjuntos de R, com a topologia dada pela
métrica usual).
92
5.3 Caracterizações métricas dos conceitos topológicos
A partir de agora, voltamos ao caso particular em que (X, dX ) é espaço métrico e usamos
sobre X a topologia T(X,dX ) que vem da métrica. Sabemos que, neste caso, os conjuntos
fechados podem ser identificados a partir de limites de sequências, ou seja, a partir da
métrica. Agora veremos como podemos fazer isso com os outros conceitos que estudamos.
Proposição 5.6 Dados S ⊂ X aberto, S o é o conjunto dos x ∈ S tais que existe um δ > 0 com
B(x, δ) ⊂ S.
Prova: Como vimos, acima x ∈ S o se e somente se x ∈ A ⊂ S para um aberto A. Por esta
razão, todo ponto x ∈ S que está contido numa bola aberta B(x, δ) ⊂ S com δ > 0 satisfaz
x ∈ S o ; afinal, bolas abertas são abertos. Por outro lado, se x ∈ A ⊂ S com A aberto,
sabemos que existe um δ > 0 com B(x, δ) ⊂ A, de modo que B(x, δ) ⊂ S também. Por
esta razão,
x ∈ B(x, δ) ⊂ S para algum δ > 0 ⇔ x ∈ A ⊂ S para algum A ⊂ S aberto.
Mas o lado direito desta equivalência vale se e somente se
[
x∈ A = S o.
A⊂S aberto
olasabertas Exercício 5.14 Prove ainda que A ⊂ X é aberto se e somente se A = ∪B∈B B, onde B é uma
coleção de bolas abertas em X.
Proposição 5.7 Dado S ⊂ X, S é conjunto de pontos que são limites de sequências convergentes
contidas em S.
Prova: Suponha que {xn }n∈N ⊂ S é uma sequência que converge a x ∈ X. Veja que, para
qualquer fechado F ⊃ S,{xn }n∈N ⊂ F e portanto x = limn xn ∈ F . Portanto:
\
∀F ⊃ S fechado, x ∈ F , portanto x ∈ F = S.
F ⊃S fechado
Por outro lado, tome x ∈ S. Pela Proposição 5.4 acima, qualquer aberto contendo x
intersecta S. Em particular, para qualquer δ > 0 tem-se B(x, δ) ∩ S ̸= ∅. Concluímos pelo
exercício 5.5 que x é o limite de uma sequência de pontos em S. 2
Corolário 5.2 ∂S é precisamente o conjunto dos pontos que são limites tanto de sequências em S,
quanto de sequências em S c .
Exercício 5.15 Mostre que S ′ é o conjunto de pontos x ∈ X que são limites de sequências de
pontos em S\{x}.
Exercício 5.16 Se S ̸= ∅, S = {x ∈ X : d(x, S) = 0}.
93
5.4 Continuidade, abertos e fechados
Nosso objetivo nesta seção é apresentar a ideia de continuidade de forma topológica, ao
invés da forma métrica (via limites) que já mostramos acima. Na prova da equivalência a
seguir, veremos ainda uma outra definição métrica de continuidade.
Recorreremos a uma notação que será muito usada no que segue: dados f : X → Y e
S ⊂Y,
f −1 (S) := {x ∈ X : f (x) ∈ S}.
Teorema 5.3 Sejam (X, dX ) e (Y, dY ) espaços métricos. Dada f : X → Y , as seguintes afirmações
são equivalentes.
Passo 2 ⇒ 3. Vem do exercício anterior à prova juntamente com o fato de que A é aberto
se e somente se X\A é fechado.
Passo 3 ⇒ 4. Fixos ε > 0 e x ∈ X, vamos encontrar o δ desejado. Para fazer isto observe
que a bola BY (f (x), ε) ⊂ Y é um aberto de Y , de modo que (pelo item 3) f −1 (BY (f (x), ε))
é aberto. Como f (x) ∈ BY (f (x), ε), x é um elemento do aberto f −1 (BY (f (x), ε)); pela
definição de aberto, isto implica que ∃δ > 0 tal que BX (x, δ) ∈ f −1 (BY (f (y), ε)). Isto
94
quer dizer que, para todo x′ ∈ B(x, δ) – ou seja, todo x′ ∈ X com dX (x, x′ ) < δ – temos
f (x′ ) ∈ BY (f (x), ε) – ou seja, dY (f (x), f (x′ )) < ε. Em outras palavras, o δ que apresenta-
mos é precisamente o que tínhamos de encontrar.
Passo 4 ⇒ 1. Suponha que xn → x em X; nosso objetivo é provar que limn f (xn ) = f (x),
ou seja, que dado ε > 0 existe um n0 ∈ N tal que dY (f (xn ), f (x)) < ε se n ≥ n0 . Fixemos
então um ε > 0. Pelo item 4 podemos encontrar δ > 0 tal que dX (x′ , x) < δ implica
dY (f (x′ ), f (x)) < ε. Como xn → x, existe n0 ∈ N tal que dX (xn , x) < δ sempre que n ≥ n0 .
Mas então temos dY (f (xn ), f (x)) < ε sempre que n ≥ n0 . Ou seja, este n0 assegura a
propriedade desejada. 2
Uma observação crucial sobre o teorema acima é que os itens 2 e 3 só dizem respeito
às propriedades topológicas de X e Y . Deste modo, temos uma definição natural de
continuidade entre espaços topológicos.
Definição 5.5 Uma função f : X → Y entre espaços topológicos (X, TX ) e (Y, TY ) é dita contínua
se ela satisfaz alguma das propriedades (equivalentes) abaixo:
Embora este não seja nosso foco, usaremos esta definição em diversos pontos do texto.
(P) Dada qualquer vizinhança aberta Bf′ (x) de f (x) em Y , existe uma vizinhança Bx de x em X
com f −1 (Bf′ (x) ) ⊃ Bx (ou f (Bx ) ⊂ f (Bf′ (x) )).
Deste modo, (P) pode ser tomada como a definição de continuidade num ponto para funções
entre espaços topológicos arbitrários.
95
Isso suscita a pergunta: como sabemos se um dado subconjunto U ⊂ D é aberto na
métrica induzida? Isto também não é difícil de deduzir. Veja que
e ainda
Ou seja
U ⊂ D é aberto ⇔ ∀x ∈ U ∃r > 0 BX (x, r) ∩ D ⊂ U.
Isto nos leva naturalmente à definição de topologia induzida. Note que ela não tem
nada a ver com a de métrica, em princípio.
TD := {A ∩ D : A ∈ TX }.
Não é difícil provar que TD é mesmo uma topologia: a ideia é só mostrar que a união
e a interseção de conjuntos da forma A ∩ D é ela própria desta forma.
Começamos a prova pela direção “⇒". Como observamos acima, U é aberto de D quando
para cada x ∈ U existe um raio rx > 0 tal que B(x, rx ) ∩ D ⊂ U . Se definimos
A := ∪x∈U B(x, rx ),
vemos imediatamente que A é aberto, posto que é uma união de abertos. Afirmamos que
A ∩ D = U e provaremos isso mostrando A ∩ D ⊂ U e U ⊂ A ∩ D. De um lado, temos a
inclusão
A ∩ D = ∪x∈U (B(x, rx ) ∩ D) ⊂ U
por conta do fato que B(x, rx )∩D ⊂ U para cada x ∈ U . Por outro lado, cada x ∈ U pertence
a B(x, rx ) ∩ D: isto quer dizer que todo x ∈ U pertence à união ∪x∈U (B(x, rx ) ∩ D) = A ∩ D,
96
o que nos diz U ⊂ A ∩ D e termina a prova de que U = A ∩ D. Ou seja, dado U ⊂ D
aberto, encontramos A ⊂ X aberto de X com U = A ∩ D. Isto termina a prova da direção
“⇒".
Tratemos agora da direção “⇐". Suponha que U = A ∩ D com A ⊂ X aberto de X.
Dado x ∈ X, devemos encontrar rx > 0 tal que BD (x, rx ) = BX (x, rx ) ∩ D ⊂ U = A ∩ D.
Mas para isto é evidente que basta pedir BX (x, rx ) ⊂ A, o que é possível (com algum
rx > 0) exatamente porque A é aberto em X. 2
Observamos o seguinte corolário dos resultados acima.
Prova: Faremos a prova apenas no caso de D aberto. Sabemos que, para que A ⊂ D seja
aberto de D, é necessário e suficiente que exista B ⊂ X aberto de X com A = B ∩ D.
Em particular, se D é aberto e tal B existe, o conjunto A é a interseção de dois abertos;
portanto, ele próprio é aberto.
Por outro lado, se A é aberto de X, podemos escrever A = A ∩ D; ou seja, A e a
interseção de um aberto de X com D, sendo portanto um aberto da topologia relativa. 2
ex:LSC Exercício 5.21 Dado (X, dX ), uma função f : X → R é semicontínua por baixo se
Ou seja, f é semicontínua por baixo se não pode ter uma “salto para cima no limite". Mostre que,
para qualquer f : X → R,
eq:Zariski Exercício 5.22 (Topologia de Zariski) Neste exercício, apresentamos a “topologia de Zariski
afim" sobre Rd . Ela é prima da “topologia de Zariski projetiva", que é extremente importante em
Geometria Algébrica.
Dado um conjunto S de polinômios multivariados p : Rd → R, chamamos de variedade de S o
conjunto V(S) := {x ∈ Rd : ∀p ∈ S, p(x) = 0} (se S = ∅, tomamos V(S) = Rd por definição).
97
Um subconjunto A ⊂ Rd é (por definição) um aberto de Zariski se A = Rd \V(S) para algum S
como acima. Mostre que os abertos de Zariski formam uma topologia sobre Rd . Mostre ainda que
todo aberto de Zariski é aberto no sentido usual.
2. Mostre que um subconjunto A ⊂ X é aberto se e somente se ele pode ser escrito como a união
de conjuntos A1 × · · · × Ad , onde cada Ai é aberto do Xi correspondente.
Exercício 5.24 Fixe um espaço métrico (X, dX ). Tome alguma métrica produto sobre X × R.
Dada f : X → R, chamamos de gráfico de f o conjunto
2. Prove que, se f é semicontínua por baixo (como definimos no exercício 5.21), epi(f ) é fechado.
A recíproca vale?
letofechado Exercício 5.25 Suponha que (X, dX ) é completo e F ⊂ X. Mostre que F é fechado em X se e
somente se (F, dF ) é completo, onde dF é a métrica induzida por (X, dX ).
chsubespaco Exercício 5.27 Considere um espaço de Banach (V, ∥ · ∥V ). Como já vimos, um subespaço de V
é um subconjunto W ⊂ V contendo 0V e fechado pelas operações de espaço vetorial (isto é, para
quaisquer w, w′ ∈ W e λ ∈ R, λ w + w′ ∈ W ).
3. Ache um subespaço de C([0, 1], R) que não é fechado (portanto, o item anterior não se estende
para qualquer V Banach).
98
Exercício 5.28 Considere as duas definições abaixo de separabilidade.
Prove que o espaço métrico (X, dX ) é separável (de acordo com a primeira definição) se e somente
se o espaço topológico correspondente (X, T(X,dX ) ) é separável (de acordo com a segunda definição).
Deduza que Rd e C(I, R) são espaços topológicos separáveis com suas topologias usuais.
ex:derivado Exercício 5.29 Suponha que X tem pelo menos dois elementos e usamos a topologia grossa sobre
ele. Mostre que {x}′ = X\{x} não é fechado para qualquer x ∈ X. Ou seja, há exemplos simples
de topologias em que conjuntos derivados não são necessariamente fechados.
x:derivado2 Exercício 5.30 A topologia grossa é um tanto quanto patológica. Uma propriedade simples adici-
onal que pode se pedir de uma topologia é que ela seja T0 :
Esta propriedade é sutilmente diferente da T1 descrita acima, que é equivalente à propriedade abaixo:
Prove que esta formulação da propriedade T1 é equivalente à que vimos acima (todo conjunto unitário
é fechado).
x:derivado3 Exercício 5.31 Neste exercício, apresentamos uma topologia T0 não-padrão (de acordo com a
definição do exercício anterior) no espaço X = [−1, 1] para a qual {0}′ não é fechado. Definimos:
2. Mostre que TX tem a propriedade T0 , mas não tem a propriedade T1 (de fato, {0} não é
fechado).
A + B := {a + b : (a, b) ∈ A × B}.
99
1. Prove que, A = BV [xA , rA ] e B = BV [xB , rB ] (com xA , xB ∈ V e rA , rB > 0), então
A + B = BV [xA + xB , rA + rB ];
:fechoetudo Exercício 5.33 Encontre os fechos, interiores e conjuntos de acumulação de cada um dos subcon-
juntos abaixo de C = C([0, 1], R) (com a métrica usual).
D := {f ∈ C : ∃f ′ };
Mk := {f ∈ C : ∀i = 1, 2, . . . , k, f (1/i) < 1/i} (onde k ∈ N\{0}).
2. Prove que qualquer espaço métrico perfeito e completo não pode ser enumerável. (Em parti-
cular, um subconjunto S ̸= ∅ fechado e perfeito de um (X, dX ) completo não é enumerável.)
100
Capítulo 6
101
6.1 Compactos do ponto de vista de Topologia Geral
A definição de um espaço compacto usando apenas Topologia é um tanto quanto abstrata.
Mesmo assim, veremos que ela serve para provar alguns resultados interessantes.
Definição 6.1 Um espaço topológico (X, T ) é dito compacto se, dada qualquer coleção de abertos
A ⊂ T com X = ∪A∈A A, então existe uma subcoleção B ⊂ A, com B finito, tal que X = ∪A∈B A.
Um subconjunto K ⊂ X é dito compacto se é compacto com a topologia induzida, isto é, dada
qualquer coleção de abertos A ⊂ T com K ⊂ ∪A∈A A, então existe uma subcoleção F ⊂ B, com B
finito, tal que X ⊂ ∪B∈B B.
É bom explicarmos brevemente o “isto é" acima. Lembre que os abertos de K são os
conjuntos da forma A e = A ∩ K com A ⊂ X aberto. Uma coleção de abertos Ae de K é,
portanto, uma coleção de conjuntos com a forma Ae := {A ∩ X : A ∈ A}, onde A é uma
coleção de abertos de X. Usando as regras de De Morgan, obtemos:
!
[ [ [
A
e= (A ∩ K) = A ∩ K.
e A
A∈ e A∈A A∈A
Portanto, [ [
K= e⇔K ⊂
A A.
e A
A∈ e A∈A
Ou seja, \ [
F =∅⇔ A = X;
F ∈F A∈A
102
ou ainda, dizendo de outro modo, uma coleção de fechados tem interseção vazia se e
somente se a coleção de abertos correspondente cobre X.
Do mesmo modo, existe um G ⊂ F finito com ∩F ∈G F = ∅ se e somente se existe uma
subcoleção B ⊂ A, formada pelos complementares dos elementos de G, tal que
!c
[ [ \
A= Fc = F = ∅c = X.
A∈B F ∈G F ∈G
naocompacto Exemplo 6.1 (R não é compacto) A reta não é compacta com sua topologia usual. Para ver isso,
notem que os intervalos da forma (−∞, t], com t ∈ R são uma coleção de fechados com interseção
vazia. Ao mesmo tempo, dados t1 , . . . , tk ∈ R,
k
\
(−∞, ti ] = (−∞, min ti ] ̸= ∅.
1≤i≤k
i=1
Exercício 6.1 Prove que forma análoga que Rd e C([0, 1], R) não são compactos com suas topologias
usuais.
aocompactos Exemplo 6.2 (Intervalos abertos e semiabertos não são compactos) Considere agora um sub-
conjunto S da reta da forma S = (a, b] ou S = (a, b), com a < b reais. Use em S a topologia
induzida pela tradicional em R. Veja que a coleção:
F := {(a, t] : t ∈ (a, b)}
é uma coleção de fechados de S na topologia relativa ((a, t] = (−∞, t]∩S). Seguindo o raciocínio do
exercícios anterior, vê-se que ∩F ∈F F = ∅, mas qualquer subcoleção finita tem interseção não-vazia.
Uma tarefa mais difícil será provar que um espaço topológico é, sim, compacto. Não
trataremos disso nesta seara de espaços topológicos, com a exceção do exemplo abaixo.
Exercício 6.2 Considere a topologia discreta (ou "fina") sobre um X ̸= ∅ em que todos os subcon-
juntos são abertos. Mostre que X é compacto com esta topologia se e somente se ele é finito.
O principal resultado sobre conjuntos compactos nesta seção é o Teorema 6.1 abaixo,
que diz que funções reais contínuas sobre compactos sempre atingem seus ínfimos. Antes
dele, no entanto, há outras coisas interessantes para provar, que são um tanto quanto mais
fáceis. Vamos a elas.
O primeiro desses resultados mais diretos nos diz que "fechado em compacto também
é compacto".
103
Proposição 6.2 Um subconjunto fechado de um espaço topológico compacto é compacto.
Proposição 6.3 Considere dois espaços topológicos (X, TX ) e (Z, TZ ). Se (X, TX ) é compacto e
f : X → Z é contínua, então a imagem de f , f (X) ⊂ Z, é compacta.
Prova: Suponha que X Z e f são como acima. Tome uma cobertura A qualquer de f (X)
por abertos de Z: isto é, f (X) ⊂ ∪A∈A A. Mostraremos que A tem uma subcobertura finita
usando a seguinte afirmação.
continuatop Teorema 6.1 Se (X, T ) é um espaço métrico compacto, então, dada uma função contínua f :
X → R, existe um x⋆ ∈ X com f (x⋆ ) = inf x∈X f (x). Em particular, inf x∈X f (x) > −∞.
Prova: Na verdade, nossa prova mostra que toda função semicontínua por baixo atinge o
ínfimo. Por definição, uma f : X → R é semicontínua por baixo se, dado qualquer t ∈ R,
o conjunto
Ft := f −1 ((−∞, t])
é fechado (veja o exercício 5.21 acima para uma caracterização equivalente). Como (−∞, t]
é fechado de R, toda função contínua de X em R é semicontínua por baixo.
Em toda prova, faremos referência ao ínfimo de f : inf x∈X f (x). Isso pode parecer
suspeito, pois ainda não temos como garantir que os valores de f são mesmo limitados
104
por baixo. A verdade é que isso não importa. Admitimos que, em princípio, seria possível
que inf x∈X f (x) = −∞. Nada do que dizemos abaixo é afetado por essa possibilidade,
que será finalmente afastada no fim da prova.
Vamos, então, fazer uma afirmação envolvendo o ínfimo, que diz respeito aos conjuntos
Ft .
Ft ̸= ∅ para qualquer t > inf f (x). (6.1) eq:Ftnaovaz
x∈X
Afinal, se t > inf x∈X f (x), t não é cota inferior para os valores de f e há pelo menos um
xt ∈ X com f (xt ) ≤ t, o que quer dizer xt ∈ f −1 ((−∞, t]) = Ft .
Feita essaa afirmação, vem um passo crucial: a observação de que
\
(⋆) Ft = {x⋆ ∈ X : f (x⋆ ) = inf f (x)}.
x∈X
t>inf x∈X f (x)
Na verdade, vale igualdade acima. Aqui dizemos que, se a interseção do lado esquerdo não for
vazia, o ínfimo de f é atingido.
Para provar a igualdade (⋆), observe primeiro que, se há de fato um x⋆ atingindo o
ínfimo, ele está na interseção do lado esquerdo. Por outro lado, se x⋆ está na interseção,
sabemos que f (x⋆ ) ≥ inf x∈X f (x) (o ínfimo é cota inferior para todo mundo) e
∀t ∈ R : t > inf f (x) ⇒ inf f (x) ≤ f (x⋆ ) ≤ t, ou seja, f (x⋆ ) = inf f (x).
x∈X x∈X x∈X
Note que provamos (⋆) sem supôr a priori que inf x∈X f (x) > −∞!
ResultaTde (⋆) que a existência de um ponto x⋆ ∈ X atingindo o ínfimo de f é equi-
valente a t>inf x∈X f (x) Ft ̸= ∅. Para provar que a interseção não é vazia, usaremos a
propriedade da interseção finita. Em forma contrapositiva, essa propriedade nos diz que,
se todas as subcoleções finitas dos Ft com t > inf x∈X f (x) não têm interseção vazia, o
mesmo vale para a interseção de toda a coleção.
Tome, então, uma coleção finita dos Ft : Ft1 , . . . , Ftk , com cada ti > inf x∈X f (x). Que-
remos demonstrar que a interseção destes conjuntos não é vazia. Para isso, voltamos ao
Exemplo 6.1, sabemos que
k
\
(−∞, ti ] = (−∞, min ti ]
1≤i≤k
i=1
105
e portanto
k
\ k
\
Fti = f −1 ((−∞, ti ])
i=1 i=1
k
!
\
= f −1 (−∞, ti ]
i=1
−1
= f (−∞, min ti ]
1≤i≤k
= Fmin1≤i≤k ti .
Como cada ti > inf x∈X f (x), min1≤i≤k ti > inf x∈X f (x) também e (6.1) implica que Fmin1≤i≤k ti ̸=
∅, como queríamos demonstrar.
Terminamos recapitulando a prova de trás para frente. Acabamos de mostrar toda
subcoleção finita dos Ft com t > inf x∈X f (x) tem interseção não-vazia. TComo os Ft são
fechados e X é compacto, a propriedade da interseção finita implica que t>inf x∈X f (x) Ft ̸=
∅. Portanto, a identidade (⋆) garante que há pelo menos um ponto x⋆ em que f atinge o
ínfimo. 2
uivcompacto Teorema 6.2 Dado um espaço métrico (K, dK ) com a topologia T(K,dK ) dada pela métrica, as
seguintes afirmações são equivalentes.
2. para qualquer função contínua f : K → R, existem x− , x+ ∈ K com inf x∈K f (x) = f (x− )
e supx∈K f (x) = f (x+ );
3. toda função contínua f : K → R é limitada por cima e por baixo, isto é, −∞ < inf x∈K f (x) ≤
supx∈K f (x) < +∞;
4. (K, dK ) é um espaço métrico completo e totalmente limitado (isto quer dizer que, dado um
ε > 0 qualquer, K pode ser coberto por um número finito de bolas de raio ε);
5. (K, dK ) é sequencialmente compacto, isto é, toda sequência {xn }n∈N ⊂ K tem uma sub-
sequência convergente {xnk }k∈N com limite x ∈ K;
106
Note que aqui supomos que nosso interesse é saber se um espaço métrico "inteiro" é
compacto. Na próxima seção, especializamos esse teorema para o caso de subconjuntos
K ⊂ X e teremos de falar da topologia induzida.
A prova do Teorema 6.2 será trabalho pra várias subseções. No entanto, algumas
etapas são bastante simples e podemos apresentá-las aqui.
ca3compacto Proposição 6.4 Considere um espaço métrico (K, dK ) que tem a propriedade 2 do Teorema 6.2.
Então ele também tem a propriedade 3 do mesmo teorema.
Prova: Suponha que K satisfaz o item 2, tome f : K → R e defina m± = f (x± ) como no dito
item. Como f tem valores reais, m− , m+ ∈ R. Além disso, sabemos que m− = inf x∈K f (x)
e m+ = supx∈K f (x). Portanto, f (K) ⊂ [m− , m+ ] e f é limitada. 2
O próximo resultado normalmente é provado (num caso particular) em cursos de
Análise na Reta.
ca2compacto Proposição 6.5 Considere um espaço métrico (K, dK ) que tem a propriedade 5 do Teorema 6.2.
Então ele também tem a propriedade 2 do mesmo teorema.
107
Como próximos passos, veremos que um espaço métrico onde toda função contínua
é limitada tem de ser completo (§6.2.2) e totalmente limitado (§6.2.3). Juntas, essas duas
provas mostram 3 ⇒ 4 no Teorema.
Depois, mostraremos no §6.2.4 que um espaço métrico completo e totalmente limitado
é sequencialmente compacto; isto é a implicação 4 ⇒ 5 no Teorema.
Neste ponto da prova, já saberemos que 1 ⇒ 2 e que 2 ⇒ 3 ⇒ 4 ⇒ 5 ⇒ 2. Portanto, 2
a 5 são equivalentes e uma forma de terminar a prova é mostrar que estas propriedades
juntas implicam 1. É isso que será feito no §6.2.5, onde a prova será encerrada.
porque {xn }n é Cauchy. Logo g(xm ) → 0 quando m cresce. Por outro lado, g(x) > 0 para
todo x porque, se não, dK (x, xn ) → 0 e x seria o limite de xn , que supomos não existir.
Portanto a imagem de g está contida em (0, +∞). Como a função x 7→ −1/x é contínua
sobre (0, +∞), deduzimos que
1 1
f (x) := − =−
limn dK (xn , x) g(x)
é contínua e f (xm ) → +∞ quando m → +∞, de modo que f não tem cota inferior. Segue
que K não é compacto. 2
108
Definição 6.2 Fixe um espaço métrico (X, dX ). Dado um subconjunto K ⊂ X, dizemos que
um subconjunto R ⊂ K é uma ε-rede para K se para qualquer x ∈ K existe um x′ ∈ R com
dX (x, x′ ) ≤ ε. Chamamos de número de ε-cobertura de K, N (K, ε), o menor n ∈ N ∪ {+∞}
tal que K possui uma ε-rede com n elementos. K é dito totalmente limitado se N (K, ε) < +∞
para todo ε > 0.
Uma maneira de pensar na definição de "totalmente limitado" é a seguinte. Uma ε-rede
é uma "discretização"para K em que todo ponto é representado com "precisão"ε. Portanto,
K é totalmente limitado se e somente se, para qualquer precisão escolhida, ele tem uma
discretização finita com esta precisão.
Antes de seguir, notamos o seguinte fato.
Exercício 6.4 N (K, ε) ≤ n se e somente se existem x1 , . . . , xn ∈ K com K ⊂ ∪ni=1 BX [xi , ε]. (Se
K = X, então o contenimento se transforma em K = ∪ni=1 BK [xi , ε].)
Os números de empacotamento são uma espécie de "dual"dos números de cobertura.
Isso ficará claro quando apresentarmos a proposição a seguir.
Definição 6.3 Fixe um espaço métrico (X, dX ). Dado um subconjunto K ⊂ X, dizemos que um
Q ⊂ K é um δ-empacotamento em K (com δ > 0) se quaisquer x, x′ ∈ Q com x ̸= x′ satisfazem
dX (x, x′ ) > δ. Chamamos de número de δ-empacotamento de K, P (K, δ), o supremo sobre
todos os n ∈ N tais que K possui um δ-empacotamento com n elementos.
Proposição 6.6 Usando a notação acima, as desigualdades abaixo valem para quaisquer K ⊂ X
e ε > 0:
N (K, ε) ≤ P (K, ε) ≤ N (K, ε/2).
(Em particular, K é totalmente limitado se e somente se P (K, ε) < +∞ para todo ε > 0.)
Prova: Vamos começar mostrando que P (K, ε) ≤ N (K, ε/2).. Para isso, basta supor que
N (K, ε/2) = m ∈ N, pois o caso N (K, ε/2) = ∞ é trivial. Considere, então, uma ε/2-
rede x1 , . . . , xm em K. Isto quer dizer que K é coberto pelas m bolas BX [xi , ε/2]. Afirmo
que um ε-empacotamento em K não pode conter mais do que um elemento em cada
uma dessas bolas; afinal, quaisquer dois elementos q, q ′ ∈ BX [xi , ε/2], então dX (q, q ′ ) ≤
dX (q, xi ) + dX (q ′ , xi ) ≤ ε. Da afirmação conclui-se que qualquer ε-empacotamento em K
tem no máximo m elementos, o que demonstra P (K, ε) ≤ m.
Agora provamos que N (K, ε) ≤ P (K, ε). Se P (K, ε) = +∞, não há o que mostrar.
Em caso contrário, P (K, ε) = k ∈ N e pode-se tomar um empacotamento Q ⊂ K com
k elementos. Mostraremos que Q também é uma ε-rede para K, o que mostra que
N (K, ε) ≤ k.
Para mostrar que Q é uma ε-rede, tomamos um x ∈ K arbirtrário e mostramos que
existe um q ∈ Q com dX (x, q) ≤ ε. Isso é trivial se x ∈ Q, portanto suporemos x ̸∈ Q.
Neste caso, o conjunto Q ∪ {x} tem mais elementos que Q. A cardinalidade de Q é o
tamanho do maior ε-empacotamento em K. Sendo assim, Q ∪ {x} não é ε-empacotamento.
Portanto, há dois elementos distintos q1 , q2 ∈ Q∪{x} a distância no máximo ε um do outro.
Como Q é ε-empacotamento, não pode ser verdade que q1 , q2 ∈ Q: um dos dois tem de ser
x e o outro, um q ∈ Q. Logo, dX (x, q) ≤ ε para este q, como queríamos demonstrar. 2
109
Um último fato sobre conjuntos que não são totalmente limitados será importante a
seguir. Note que, se K não é totalmente limitado, então há δ-empacotamentos em K
com tamanho finito, mas arbitrariamente grande. Abaixo vemos que há, de fato, um
empacotamento infinito em qualquer conjunto que não é totalmente limitado.
totlimcover Proposição 6.7 Com a notação acima, se K ⊂ X não é totalmente limitado, então existe um
ε-empacotamento dentro de K com cardinalidade infinita, para algum ε > 0.
Prova: Se K não é totalmente limitado, então N (K, ε) = +∞ para algum ε > 0. Portanto,
qualquer subconjunto finito de K não é uma ε-rede. Com base nisso, podemos construir
uma sequência de pontos da seguinte forma.
1. Escolha x1 ∈ K arbitrariamente.
lem:totlim Lema 6.2 Considere um espaço métrico (K, dK ) tal que que funções contínuas de K em R são
sempre limitadas. Então (K, dK ) é totalmente limitado.
Prova: Vamos mostrar que um espaço métrico (X, dX ) que não é totalmente limitado tem uma
função contínua f : X → R com supx∈X f (x) = +∞. Para isto, usamos a Proposição 6.7: ela
garante que, para algum δ > 0, há um δ-empacotamento S ⊂ X de cardinalidade infinita:
d(s, s′ ) ≥ δ para quaisquer elementos distintos s, s′ ∈ S. Sem perda de generalidade,
suporemos que S é enumerável e escreveremos S = {sj : j ∈ N}. Nosso objetivo será
construir uma função contínua f : X → R com sup{f (x) : x ∈ S} = +∞.
A ideia da prova será construir uma função que atinge valor ≥ j + 1 em cada sj . Se
estivéssemos na reta, não seria difícil construir uma f assim por interpolação. Num espaço
métrico arbitrário, será um pouco mais conveniente construir g = 1/f . Mostraremos,
então, o seguinte resultado.
Afirmação 6.1 Existe uma função g : X → R tal que g(x) > 0 para todo x ∈ X, ∥g∥Lip ≤ 1 e
g(sj ) ≤ 1/(j + 1) para todo j ∈ N.
Esta g toma valores estritamente maiores que 0 em todo ponto, mas g(sj ) → 0 quando
j → +∞. Em particular, se definimos
1
f (x) := (x ∈ X),
g(x)
110
podemos observar que f é contínua (já que o denominador não se anula) e f (sj ) ≥ j + 1 →
+∞ quando j → +∞.
Para construir g, vamos fazer uma espécie de colagem de várias funções. Para cada
j ∈ N, definimos uma função gj : X → R da seguinte forma:
1
gj (x) := d(x, sj ) + (x ∈ X).
j+1
Claramente, ∥gj ∥Lip ≤ 1 e gj (x) ≥ 1/(j + 1) > 0 para todo x ∈ X. Agora defina g : X → R
pela receita:
g(x) := inf gj (x) (x ∈ X).
j∈N
Note que g(x) ∈ R está bem definida porque os valores de gj (x) são limitados por baixo
por 0 para qualquer x ∈ X, e portanto o ínfimo na definição sempre nos dá um número
real. Além disso, ∥g∥Lip ≤ supj∈N ∥gj ∥Lip ≤ 1 pelo Exercício 4.16. Note ainda que:
1
∀k ∈ N : g(sk ) = inf gj (x) ≤ gk (sk ) =
.
j∈N k+1
Para terminar a prova da Afirmação, precisamos mostrar que g(x) > 0 para todo x ∈ X.
Para isso, fixamos x ∈ X e observamos duas possibilidades.
• Se d(x, sj ) ≥ δ/2 para todos j ∈ N, deduzimos que
gj (x) ≥ d(x, sj ) ≥ δ/2 > 0
pra todo j ∈ N. Isto quer dizer que
δ
é cota inferior para {gj (x) : j ∈ N};
2
como o ínfimo é a maior cota inferior, deduzimos que
δ
g(x) = inf gj (x) ≥ > 0.
j∈N 2
• Agora suponha que d(x, sk ) < δ/2 para algum k ∈ N (o que em particular ocorre se
x = sk ). Observe que, isso só pode ocorrer para um único índice k: se ℓ ∈ N\{k}, o
fato de que {sj }j∈N é δ-empacotamento para deduzir que:
δ δ
δ < d(sk , sℓ ) ≤ d(sk , x) + d(x, sℓ ) < + d(x, sℓ ), ou d(sℓ , x) > .
2 2
Portanto, temos que
1 δ
gk (x) ≥ e gℓ (x) ≥ d(x, sℓ ) ≥ quando ℓ ̸= k.
k+1 2
Deduzimos que
δ 1
′
δ := min , é cota inferior para {gj (x) : j ∈ N}
2 k+1
e, como antes, obtemos g(x) ≥ δ ′ > 0.
2
111
6.2.4 O critério das subsequências convergentes
sub:subseq
Nesta subseção vamos mostrar que a compacidade de um espaço métrico pode ser avaliada
a partir de subsequências. Na verdade, o que faremos será mostrar que, num espaço mé-
trico completo e totalmente limitado, toda sequência tem uma subsequência que converge
a um limite dentro do espaço.
Primeiro, lembremos o que são subsequências.
Definição 6.4 Dados um conjunto infinito N ⊂ N e uma sequência {xn }n∈N , a subsequência
{xn }n∈N é definida da forma {x̃j }j∈N com x̃j := {xnj }, onde n1 < n2 < n3 < . . . é a única
enumeração crescente dos elementos de N . Também escrevemos {xnj }j∈N diretamente. Falamos
que limn∈N xn = x se xnj → x quando j → +∞.
seqcompacto Proposição 6.8 Um espaço métrico completo e totalmente limitado é sequencialmente compacto,
isto é: toda sequência nesse espaço tem uma subsequência que converge nesse mesmo espaço.
Prova: Fixe um espaço métrico (K, dK ) que é completo e totalmente limitado. Dada
{xn }n∈N ⊂ K, nosso principal objetivo será provar que {xn }n∈N possui uma subsequência de
Cauchy. Como (K, dK ) é completo, isto basta para provar que sempre há uma subsequência
convergente.
Não é muito simples achar esta subsequência buscada. Começamos a busca por ela
com um resultado mais fraco que apenas garante o seguinte: sempre há uma subsequência
“apertada".
Afirmação 6.2 Dado qualquer r > 0 existe subsequência {xn }n∈N com dK (xm , xn ) < r para
todos m, n ∈ N .
De fato, como estamos supondo que K é totalmente limitado, a Proposição 6.7 nos diz que
podemos cobrir K por um número finito de bolas de raio r/2. Como o número de bolas é
finito, uma das bolas, que chamaremos de B(z, r/2), é tal que o conjunto
N := {n ∈ N : xn ∈ B(z, r/2)}
é infinito, e um argumento simples mostra que {xn }n∈N tem a propriedade desejada.
O que vem a seguir é uma espécie de “truque diagonal" que mostra como esta afirmação
pode ser usada para achar uma subsequência de Cauchy. A primeira ideia deste truque
diagonal é que, aplicando a afirmação infinitas vezes, podemos encontrar subsequências
encaixadas e cada vez mais apertadas. Mais precisamente:
1. A afirmação implica que existe N1 ⊂ N infinito tal que dK (xn , xm ) < 1/2 para todos
n, m ∈ N1 .
112
2. Suponha (recursivamente) que existem conjuntos infinitos N1 ⊃ N2 ⊃ · · · ⊃ Nk ,
todos contidos em N, tais que, para qualquer 1 ≤ i ≤ k e quaisquer n, m ∈ Ni , vale
a desigualdade dK (xn , xm ) < 2−i . Vamos mostrar como construir um conjunto Nk+1
de forma a estender por mais um passo esta construção. Para isto, aplicaremos a
afirmação à sequência
{xnj }j∈N onde {nj : j ∈ N} = Nk .
com r = 2−k−1 . Isto nos dá um conjunto N e podemos definir Nk+1 := {nj : j ∈ N },
de modo a termos as propriedades desejadas.
Nossa tarefa final é extrair destas subsequências encaixadas e cada vez mais apertadas
uma subsequência de Cauchy. Uma tentativa poderia ser definir {xn }n∈Ñ com Ñ := ∩k Nk ,
mas isto não pode funcionar em geral: afinal,
Exercício 6.6 Para terminar a prova, deduza disto que {xnk }k∈N é Cauchy, provando que, dado
ε > 0, existe um k0 ∈ N tal que dX (xnk , xnℓ ) ≤ ε para quaisquer índices k, ℓ ≥ k0 .
2
113
6.2.5 O fim da prova da grande equivalência
ovacompacto
Chegamos finalmente ao fim da prova do Teorema 6.2.
Prova: [do Teorema 6.2] Voltando ao roteiro descrito em §6.2.1 acima, observamos que
já sabemos que as propriedades de 2 a 5 no Teorema 6.2 são equivalentes. Além disso,
sabemos que 1 implica 2. O que nos falta é provarmos que 2 a 5 juntas implicam 1.
Na verdade, não são todas as propriedades de 2 a 5 que serão usadas. Ao invés disso,
provaremos o seguinte.
Ou seja, existe um δ > 0 tal que, dado qualquer x ∈ K, B(x, δ) ⊂ A para algum A ∈ A.
Na verdade, esta "ideia" suscita duas perguntas:
1. Por que achar este δ > 0 é uma boa ideia? Como K é compacto, ele é totalmente limitado
e pode ser coberto por um número finito de bolas de raio δ > 0. Mas cada bola destas
pode ser coberta por um elemento da cobertura A. Deste modo, K pode ser coberto
por um número finito de elementos de A.
2. Como sabemos que este δ existe? Vamos exprimir δ em termos do ínfimo de uma função
contínua r : K → (0, 1] que associa a cada x o seu “maior δ particular". Como cada
x tem seu δ > 0, o ínfimo de r será positivo.
114
I(x) ⊃ (−∞, 0] porque as bolas abertas de raio δ ≤ 0 são vazias! De fato, deixar que I(x)
contenha números negativos é só uma conveniência para a demonstração.).
Agora observamos que I(x) é um intervalo semi-infinito: se δ ∈ I(x), então para
qualquer δ ′ < δ temos
Deduzimos que I(x) é intervalo semi-infinito e contem pelo men os um número posi-
tivo. Como I(x) também é limitado por 1, podemos definir r : K → R como
Como I(x) contem elementos positivos, vale que r(x) > 0 para todo x ∈ K. Além disso,
é fácil ver que (−∞, r(x)) ⊂ I(x). Intuitivamente, r(x) é basicamente o “maior" δ que
podemos escolher. Uma explicação para esta escolha é que, se queremos achar um único
δ que sirva para todos os x, é boa ideia partir do maior δ possível para cada x.
A afirmação a seguir é chave para a prova.
Prova: [da Afirmação] Vamos mostrar que r é 1-Lipschitz. Para isto basta
mostrar que:
Entre outras coisas, esta afirmação nos diz que inf x∈K r(x) = r(x∗ ) para algum x ∈ K;
afinal, K é sequencialmente compacto! Mas note então que r(x∗ ) > 0, porque r é positiva
em todos os pontos de K. Deduzimos que inf x∈K r(x) > 0, o que nos permite escolher um
δ ∈ (0, inf x∈K r(x)).
115
Este δ nos permite terminar a prova. Veja que, dado x ∈ K, r(x) > δ. Pela definição
de r(x), isto quer dizer que 0 < δ < sup I(x); como I(x) é intervalo, isto quer dizer que
δ ∈ I(x) e existe um A ∈ A com BK (x, δ) ⊂ A.
Lembre-se que K é totalmente limitado, portanto K = ∪ki=1 BK (xi , δ) para alguma
escolha de x1 , . . . , xk ∈ K. Mas então podemos escolher, para cada 1 ≤ i ≤ k, um aberto
Ai ∈ A com B(xi , δ) ⊂ Ai , e observamos que K ⊂ ∪ki=1 Ai . Deste modo, B := {Ai : 1 ≤
i ≤ k} é uma subcoleção finita de A que cobre K. 2
bs:Lebesgue Observação 6.1 Um dado importante que surgiu na prova acima é que, se K é compacto, então
toda cobertura A de K por abertos possui um número de Lebesgue, isto é, um δ > 0 tal que,
se x, x′ ∈ K e dK (x, x′ ) < δ, então x, x′ ∈ A para algum A ∈ A. Isto é, se dK (x, x′ ) < δ, x, x′
pertencem ao mesmo aberto da cobertura. Usaremos isto mais adiante.
C = C(K, Z) := {f : K → Z : f continua }.
O próximo resultado mostra que é possível dar uma métrica a C e que o espaço métrico
resultante é completo.
Prova: Esta prova deve muito à prova de que C(I, R) é espaço métrico completo (Teorema
3.2). Faremos abaixo um esboço dos passos que são iguais e assinalaremos as principais
diferenças.
116
Primeiro vamos provar que o supremo na definição de dC é atingido por algum t∗ ∈ K;
em particular, dC (f, g) ∈ R está bem definida. Para ver que o sup é atingido, como K é
compacto, basta ver que a função
t ∈ K 7→ dZ (f (t), g(t)) ∈ R
|dZ (f (t), g(t)) − dZ (f (tn ), g(tn ))| ≤ |dZ (f (t), g(t)) − dZ (f (tn ), g(t))|
+|dZ (f (tn ), g(t)) − dZ (f (tn ), g(tn ))|
(desig. triangular nos dois termos) ≤ dZ (f (tn ), f (t)) + dZ (g(tn ), g(t))
→ 0 quando n → +∞.
1. Para cada t ∈ K,
n,m→+∞
0 ≤ dZ (fn (t), fm (t)) ≤ dC (fn , fm ) → 0.
Logo {fn (t)}t∈N ⊂ Z é Cauchy e, como Z é completo, existe o limite pontual f (t) =
limn fn (t) para cada t ∈ K.
Logo
0 ≤ sup dZ (fn (t), f (t)) ≤ sup dC (fn , fm ) → 0 porque {fn }n∈N é Cauchy.
t∈K m≥n
117
3. Por fim, dada uma sequência tk → t em K, para qualquer n ∈ N
(Aqui abusamos notação e usamos dC (fn , f ) apesar de ainda não sabemos que f ∈
C!). Como fn é contínua, fn (tk ) → fn (t) e
e mandar n → +∞ nos mostra que o lim sup é 0, logo f (tk ) → f (t). Como isto vale
para qualquer sequência como acima, f ∈ C é contínua.
118
Agora vamos checar as propriedades de norma. Como ∥f (t)∥V ≥ 0 sempre, temos que
∥f ∥C ≥ 0. Portanto, ∥ · ∥C : C → [0, +∞) é uma função bem-definida. Para provar que
ela é uma norma, precisamos provar que ela é positiva definida, homogênea positiva e
subaditiva. Como a prova é bem semelhante à do caso em que V = R, demonstraremos
apenas a subaditividade.
De fato, dadas f, g ∈ C, podemos usar a subaditividade de ∥ · ∥V e a definição de ∥ · ∥C
para provar que:
Portanto, ∥f ∥C + ∥g∥C é cota superior para os valores de ∥f (t) + g(t)∥V , donde deduzimos
que
∥f + g∥C = sup ∥f (t) + g(t)∥V ≤ ∥f ∥C + ∥g∥C
t∈I
Definição 6.5 Uma função f : K → Z entre espaços métricos (K, dK ) e (Z, dZ ) é dita uniforme-
mente contínua se seu módulo de continuidade, denotado por
converge a 0 quando δ → 0+ .
Uma função uniformemente contínua é contínua (exercício!). Por outro lado, uma
função contínua pode não ser uniformemente contínua: por exemplo, “t 7→ t2 ", definida
na reta, tem mf (δ) = +∞ para todo δ > 0, já que:
eo:unifcont Teorema 6.5 Uma função contínua f : K → Z entre espaços métricos (K, dK ) e (Z, dZ ), com
(K, dK ) compacto, é necessariamente uniformemente contínua.
119
Prova: Apresentamos uma prova baseada na ideia de número de Lebesgue, contida na
observação 6.1 acima. O Exercício 6.7 apresenta um argumento mais clássico, baseado em
subsequências.
Tome f : K → Z contínua. Dado um ε > 0, mostraremos que existe um δ0 > 0 tal que
mf (δ) ≤ ε para todo 0 < δ < δ0 . Isto implica lim supδ→0+ mf (δ) ≤ ε, para qualquer ε > 0.
Note que, dado qualquer x′′ ∈ K, o conjunto
é aberto de K, já que Ax = f −1 (BZ (f (x), ε/2)). Note ainda que, se x, x′ ∈ Ax′′ para um
mesmo x′′ , naturalmente dZ (f (x′ ), f (x′′ )) < ε pela desigualdade triangular:
Os abertos Ax′′ , com x′′ ∈ K, cobrem K; afinal, cada x′′ ∈ K pertence ao seu próprio Ax′′ .
Deduzimos que
A := {Ax′′ : x′′ ∈ K}
é uma cobertura de K por abertos. Pela Observação 6.1, existe um δ0 > 0 tal que, dados
quaisquer x, x′ ∈ K com dK (x, x′ ) < δ0 , existe um conjunto Ax′′ com x, x′ ∈ Ax′′ , o que,
como observado acima, garante que dZ (f (x), f (x′ )) < ε. Portanto,
Proposição 6.9 Dada uma função f : K → Z entre espaços métricos (K, dK ) e (Z, dZ ), as
seguintes propriedades são equivalentes.
1. f é uniformemente contínua;
2. dado qualquer ε > 0, existe um δ > 0 tal que, se x, x′ ∈ K satisfazem dK (x, x′ ) ≤ δ, então
dZ (f (x), f (x′ )) ≤ ε;
Prova: Uma primeira observação da prova é que a função mf (·) é monótona não-decrescente.
De fato, se 0 < δ < δ ′ , o conjunto de pares (x, x′ ) com dK (x, x′ ) ≤ δ está contido no conjunto
de pares com dK (x, x′ ) ≤ δ ′ ; portanto, o supremo que define mf (δ) é tomado sobre um
conjunto menor do que o supremo que define mf (δ ′ ).
120
Usamos a observação acima para provar que 1 e 2 são equivalentes. Sendo mf crescente,
sabemos que existe o limite de mf (δ) quando δ → 0+ e vemos que:
fcontsubseq Exercício 6.7 Escreva uma prova do Teorema 6.5 baseada no item 3 da Proposição acima. Para isso,
siga os seguintes passos: tome uma sequência {δn }n decrescendo a 0 e observe que limδ→0+ mf (δ)
se e somente se mf (δnk ) → 0 ao longo de uma subsequência {δnk }k . Para cada n, tome xn , x′n ∈ K
com dK (xn , x′n ) ≤ δn e dY (f (xn ), f (x′n )) ≥ mf (δn ) − 1/n. Mostre agora que é possível encontrar
uma subsequência {nk }k tal que xnk , x′nk → x ∈ K e use a continuidade de f em x para terminar
a prova.
2. Quando (X, dX ) é completo (como é o caso aqui), pedir que K seja completo com a
métrica induzida é a mesma coisa que pedir que K seja fechado de X (cf. Exercício
121
5.25). Logo, ao invés de pedir que K seja completo, pediremos que ele seja fechado.
Portanto, se (X, dX ) é completo, um K ⊂ X é compacto se e somente se é fechado e
totalmente limitado.
A diferença para (6.3) é que, neste segundo caso, os centros das bolas podem estar dentro
ou fora de K. O exercício abaixo mostra que isso não faz muita diferença para o que nos
interessa.
Exercício 6.8 Prove que, para qualquer espaço métrico (X, dX ) e qualquer K ⊂ X,
Deduza que K é totalmente limitado (isto é, N (K, ε) < +∞ para todo ε > 0) se e somente se
N ′ (K, ε) < +∞ para todo ε > 0.
Exercício 6.10 Considere um espaço vetorial normado (V, ∥·∥V ) e subconjuntos não-vazios A, B ⊂
V . Defina a soma de Minkowski A + B como no Exercício 5.32:
A + B := {a + b : (a, b) ∈ A × B}.
122
1. Mostre que, se A é fechado e B é compacto, então A + B é fechado.
2. Suponha agora que tanto A quanto B são compactos e prove que A + B é compacto.
Exercício 6.12 Determine quais dos subconjuntos de C([0, 1], R) abaixo são compactos.
1. Todas as funções Lipschitz.
Exercício 6.13 Considere um espaço métrico compacto (K, dK ). Chame p ∈ K de ponto isolado
se existe um δ > 0 tal que BK (p, δ) = {p} (ou seja, não há qualquer ponto de K, além do próprio p,
a distância < δ do p). Prove que o conjunto de pontos isolados de K é vazio, finito ou enumerável.
Exercício 6.14 Suponha que (X, dX ) é um espaço métrico e que {xn }n∈N ⊂ X é Cauchy. Mostre
que o conjunto S := {xn : n ∈ N} é totalmente limitado.
Exercício 6.15 Recorde que um espaço métrico é separável se possui um subconjunto denso e
enumerável. Mostre que todo espaço métrico compacto é separável.
tlimproduto Exercício 6.16 Sejam (Ti , di ) espaços métricos totalmente limitados, 1 ≤ i ≤ k. Mostre que
T := T1 × T2 × · · · × Tk
é espaço métrico totalmente limitado com qualquer uma das métricas-produto consideradas no
exercício 3.11, em particular
Faça isso provando uma cota explícita para o valor dos números de cobertura de T (com a métrica
d∞ ):
Yk
∀ε > 0 : N (T, ε) ≤ N (Ti , ε).
i=1
Mais exatamente, mostre que, se Ri ⊂ Ti é ε-rede para cada Ti (comQa métrica di ), então R :=
R1 × R2 × · · · × Rk é ε-rede para T . Conclua observando que |R| = i |Ri |.
123
Exercício 6.17 Seguindo a linha do exercício acima, mostre que T é compacto se e somente se cada
Ti é compacto.
ex:totlim Exercício 6.18 Sejam (X, dX ) um espaço métrico completo e S ⊂ X um subconjunto. Mostre
que S é totalmente limitado se e somente se S é compacto.
Exercício 6.19 Demonstre que a primeira das afirmações abaixo é verdadeira e a segunda é falsa.
Exercício 6.20 É verdade que um espaço métrico (X, dX ) é compacto se e somente se toda função
contínua f : X → R é uniformemente contínua? Mostre que a resposta é não considerando
qualquer conjunto X infinito com a métrica discreta. (Na verdade, há exemplos de mais complicados
de espaços que não são compactos, mas são perfeitos – X ′ = X – e tais que qualquer função contínua
é uniformemente contínua. Ou seja: a resposta “não" acima não tem nada a ver com métrica discreta
só ter pontos isolados.)
124
Capítulo 7
Agora que já sabemos quem são os espaços compactos e que propriedades importantes eles
têm, veremos como este conceito se aplica a subconjuntos de Rd e das funções contínuas.
No caso do Rd , provaremos o Teorema de Heine-Borel, que diz que um conjunto
K ⊂ Rd é compacto se e somente se ele é fechado e limitado. Logo depois, usaremos
este resultado para dois fins: mostrar que todas as normas sobre Rd são equivalentes e
construir uma métrica sobre as funções contínuas de A ⊂ Rd aberto em R.
O próximo passo será apresentar o Teorema de Arzelà-Ascoli, que descreve subcon-
juntos compactos de espaços de funções contínuas. As aplicações deste teorema são mais
complicadas e são deixadas para outros capítulos, onde discutirmos curvas de compri-
mento mínimo (a incluir) e existência de soluções para Equações Diferenciais Ordinárias.
• Se K é totalmente limitado, K ⊂ ∪m
i=1 BRd (xi , δ). Mas então a desigualdade triangular
mostra que dRd (0, x) ≤ max{dRd (0, xi )}1≤i≤n + δ para todo x ∈ K, ou seja, K é
limitado.
125
é dividido em um número finito de cubos tais que |x − x′ | < δ para quaisquer
dois elementos no mesmo cubo. Tomando um ponto xi em cada cubo, vemos que
K ⊂ [−n, n]d ⊂ ∪mi=1 BRd (xi , δ) para uma certa coleção finita de pontos. Deste modo,
K é totalmente limitado.
Exercício 7.1 Use o Teorema de Heine-Borel para decidir quais dentre os seguintes subconjuntos
de Rd são compactos: Rd ; ∅; BRd (0, 1); BRd [0, 1];
Exercício 7.2 Para cada um dos conjuntos S ⊂ Rd que não são compactos apresentados no exercício
anterior, encontre uma f : S → R com inf s∈S f (s) = −∞ e uma cobertura de S por abertos que
não tem subcobertura finita. (Você já sabe que uma tal f e uma tal subcobertura existem pela teoria
geral, claro.)
Exercício 7.3 Considere uma função contínua f : Rd → R satisfazendo lim|x|2 →+∞ f (x) = +∞.
Dado c ∈ R, mostre que seus conjuntos de “nível c"e “subnível c"
são compactos.
126
7.2 Aplicações do teorema de Heine-Borel
Poucos teoremas na Análise são tão usados quanto o de Heine-Borel. Nesta seção, não
fazemos mais do que apresentar duas situações em que ele é útil: para entender normas
em Rd e discutir o conceito de convergência sobre compactos para funções contínuas.
Vamos provar agora a existência de C > 0 como acima. Veja que, dado x ∈ Rd qualquer
d
X
∥x∥ = ∥ x[i]ei ∥
i=1
d
X
(subaditividade) ≤ ∥x[i] ei ∥
i=1
d
X
(homogeneidade positiva) = |x[i]| ∥ei ∥
i=1
Xd
≤ |x[i]| max ∥ej ∥
1≤j≤d
i=1
= max ∥ej ∥ (|x|1 )
1≤j≤d
√ √
(| · |1 ≤ d | · |2 ) ≤ ( d max ∥ej ∥) |x|2 .
1≤j≤d
127
√
Logo a constante C := d max1≤j≤d ∥ej ∥ satisfaz o que queremos. Note que C > 0 porque
ei ̸= 0 para cada i e portanto ∥ei ∥ > 0 para cada i.
Provaremos agora que existe c > 0 como acima usando a primeira parte. Considere a
esfera unitária Sd−1 ⊂ Rd , dada por
Como f (x) = |x|2 = dRd (x, 0) (x ∈ Rd ) é contínua, Sd−1 = f −1 ({1}) é subconjunto fechado
de Rd . Além disso, Sd−1 é limitado. Deduzimos que a esfera Sd−1 é compacta. Além disso,
a função g(x) := ∥x∥ (com x ∈ S d−1 ) é C-Lipschitz, já que
Exercício 7.4 Mostre que quaisquer duas normas sobre um espaço de matrizes Rd×ℓ são equiva-
lentes.
lo:unifcomp Exemplo 7.1 Considere o caso particular em que A = V = R (com as métricas/normas usuais).
A sequência de funções “fn : t ∈ R 7→ t2 /(n + 1)" converge a 0C pontualmente, mas não converge
uniformememnte já que fn (n) → +∞. No entanto, esta é uma sequência “bem comportada" em
Rb
vários sentidos: por exemplo, para quaisquer a < b reais, a fn (t) dt → 0.
128
Note que este supremo é um número real porque a restrição de f a K é contínua e,
portanto, limitada. Além disso, pode-se verificar que ∥ · ∥K,∞ é homogênea positiva e
subaditiva:
Note que ∥ · ∥K não é positiva-definida em geral: a função f (·) = dRd (·, K) se anula
em K, de modo que ∥f ∥K,∞ = 0, mas f > 0 em A\K. Uma função homogênea positiva e
subaditiva que não é necessariamente positiva-definida é dita uma seminorma.
A definição de convergência uniforme em compactos é dada abaixo.
Definição 7.1 Dados elementos {fn }n∈N ∪ {f } ⊂ C, dizemos que fn converge a f uniformemente
sobre compactos se limn∈N ∥fn − f ∥K,∞ = 0 para todo K ⊂ A compacto. Dizemos ainda que
{fn }n∈N é Cauchy uniformemente sobre compactos se limm,n∈N ∥fn − fm ∥K,∞ = 0 para todo
K ⊂ A compacto.
Exercício 7.5 Para esquentar, prove que a sequência de funções {fn }n∈N ⊂ C(R, R) no Exemplo
7.1 converge a 0C uniformemente sobre compactos.
O próximo teorema é o principal resultado desta subseção. Ele nos diz que a noção
de convergência uniforme sobre compactos corresponde a uma métrica bem-comportada
sobre C(A, V )
emcompactos Teorema 7.3 Existe uma métrica dC sobre C = C(A, V ) com as seguintes propriedades.
2. (C, dC ) é completo.
orcompactos Lema 7.1 (Exaustão de A por número enumerável de compactos) Dado A ⊂ Rd aberto e
não-vazio, existe uma sequência de compactos {Kn }n∈N de Rd com
∅=
̸ K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A
tais que ∪n∈N Kn = A e com a propriedade que qualquer K ⊂ A compacto está contido num dos
Kn .
129
Prova: Se A = Rd , basta tomar Kn := BRd [0Rd , n] (n ∈ N) e observar que cada K ⊂ Rd é
limitado e portanto está contido numa destas bolas.
Considere agora o caso em que o aberto A ̸= Rd , de modo que F := Rd \A é fechado e
não é vazio. Isto quer dizer que a função:
ψ(a0 )
∀a ∈ Rd : a ∈ A ⇔ ∃n ∈ N : |a|2 ≤ n + |a0 |2 e ψ(a) ≥ . (7.2) eq:propried
n+1
A partir destas propriedade, definiremos os compactos que buscamos. De fato, veremos
que a definição a seguir funciona:
ψ(a0 )
Kn := a ∈ R : |a|2 ≤ n + |a0 |2 e ψ(a) ≥
d
(n ∈ N).
n+1
Para provar que de fato funciona, checamos primeiramente que os conjuntos Kn são todos
compactos de Rd . Percebe-se por inspeção que:
−1 ψ(a0 )
∀n ∈ N : Kn := BRd [0Rd , n + |a0 |2 ] ∩ ψ , +∞ .
n+1
̸ K0 ⊂ K1 ⊂ K2 ⊂ · · · ⊂ A e ∪n∈N Kn = A.
∅=
De fato, K0 não é vazio porque vê-se que a0 ∈ K0 . O fato de que Kn ⊂ Kn+1 para cada
n ∈ N segue do fato que
ψ(a0 ) ψ(a0 )
∀a ∈ Rd : |a|2 ≤ n + |a0 | e ψ(a) ≥ ⇒ |a|2 ≤ n + 1 + |a0 | e ψ(a) ≥
n+1 n+2
(já que ψ(a0 ) > 0). Por fim, ∪n∈N Kn = A segue do fato de que, comparando (7.2) com a
definição de Kn , temos que um a ∈ Rd pertence a A se e somente se a ∈ Kn para algum
n ∈ N.
Falta apenas mostrar que todo K ⊂ A compacto está contido em algum Kn . Para isso,
fixe um tal K e observe que, como K ⊂ A, ψ(x) > 0 para todo x ∈ K. A continuidade
de ψ e a compacidade de K garantem que o ínfimo de ψ sobre K é atingido e portanto
130
inf x∈K ψ(x) > 0. Além disso, sabemos que K é limitado, logo supx∈K |x|2 < +∞. Se n ∈ N
é grande o suficiente, podemos garantir que
ψ(a0 )
inf ψ(x) ≥ e sup |x|2 ≤ n + |a0 |.
x∈K n + 1 x∈K
emimetricas Proposição 7.1 Dado K ⊂ A compacto e não vazio, a função αK : C → [0, 1] definida por:
Prova: Omitimos a prova das duas primeiras propriedades. Resta mostrar a desigualdade
triangular. Queremos provar que, para f, g, h ∈ C:
que pode ser checado por inspeção. Aceitando isso, observamos que, pela subaditividade
da norma,
c := ∥f − g∥K,∞ ≤ a + b := ∥f − h∥K,∞ + ∥g − h∥K,∞
portanto a desigualdade acima se aplica. 2
Agora provaremos o teorema, mostrando que uma soma das “semimétricas" αKn (com
pesos adequados) nos dá a métrica que buscamos. Os exercícios abaixo serão necessários
na prova.
icamonotona Exercício 7.6 Dados K ⊂ F compactos contidos em A, mostre que αK (f, g) ≤ αF (f, g) para
todas as funções f, g ∈ C.
131
Prova: [do Teorema 7.3] Fixe uma sequência {Kn }n∈N de compactos com as propriedades
especificadas no Lema 7.1 e defina, para f, g ∈ C:
X αK (f, g)
n
dC (f, g) := ,
n∈N
2n
onde as αKn vêm da Proposição 7.1. Note que, como as funções αKn tomam valores entre
0 e 1, a série acima é cotada pela soma da progressão geométrica 1/2n . Portanto, a série é
absolutamente convergente para quaisquer f, g. Logo, dC (f, g) é bem-definida.
A próxima etapa da demonstração é mostrar o seguinte.
Em particular, se f (t) ̸= g(t) para algum t ∈ A, o Lema 7.1 garante que t ∈ Kn para algum
n ∈ N (afinal, A = ∪n Kn ) e vê-se que ∥f − g∥Kn ,∞ ≥ |f (t) − g(t)| > 0. Ou seja, f ̸= g
implica dC (f, g) > 0. Isto concui a prova de que dC é positiva-definida. (Repare que aqui
usamos o fato de que A = ∪n∈N Kn pela primeira vez. A outra propriedade garantida pelo
Lema só será usada mais para o final da prova abaixo.)
Ainda nos resta provar que dC é simétrica e satisfaz a desigualdade triangular. Para isso,
usamos novamente a Proposição 7.1: a simetria vem do fato de que cada αKn é simétrica
e a desigualdade triangular vem do fato que, dadas f, g, h ∈ C:
e podemos aplicar isso termo a termo na definição de dC (usando o fato de que séries
absolutamente convergentes podem ser “somadas termo a termo"). Concluímos assim a
prova de que dC é de fato uma métrica.
αKn0 (f, g) 1
∀f, g ∈ C : ≤ dC (f, g) ≤ 2α Kn (f, g) + .
2n0 0
2n0
132
Prova: [da Afirmação 7.1] A cota inferior segue da definição de dC e do fato que todos os
termos da forma αKn (f, g)/2n aparecendo naquela definição são não-negativos.
Para a cota superior, usamos as seguintes estimativas:
αKn0 (f, g), se 0 ≤ n ≤ n0 (pelo Exercício 7.6);
αKn (f, g) ≤
1, se n > n0 (pela Proposição 7.1).
Deste modo,
+∞
X αKn (f, g)
dC (f, g) =
n=0
2n
n0
X αKn0 (f, g) X 1
≤ +
n=0
2n n>n
2n
0
1
= (2 − 2−n0 ) αKn0 (f, g) +
2n0
1
≤ 2αKn0 (f, g) + .
2n0
2
De posse da afirmação, vai ser relativamente fácil terminar a prova. Começamos
mostrando o seguinte.
Dadas {fj }j∈N ∪ {f } ⊂ C, dC (fj , f ) → 0 se e somente se fj → f uniformemente sobre
compactos.
Para ver isso, suponha primeiramente que dC (fj , f ) → 0. Dado K ⊂ A compacto e
não-vazio, queremos provar que ∥fj − f ∥K,∞ → 0, o que é o mesmo que αK (fj , f ) → 0.
O Lema 7.1 garante que K ⊂ Kn0 para algum n0 ∈ N e então o Exercício 7.6 garante que
αK (fj , f ) ≤ αKn (fj , f ). Usando a Afirmação, concluímos que
0 ≤ αK (fj , f ) ≤ αKn0 (fj , f ) ≤ 2n0 dC (fj , f ) → 0,
e um raciocínio de sanduíche implica αK (fj , f ) → 0.
Por outro lado, se fj → f uniformemente sobre compactos, temos que αK (fj , f ) → 0
para todo K ⊂ A compacto. Em particular, isso vale quando K = Kn0 para qualquer
n0 ∈ N. Segue da Afirmação que:
1 1
∀n0 ∈ N : lim sup dC (fj , f ) ≤ 2 lim sup αKn0 (fj , f ) + n
= n0 .
j∈N j∈N 2 0 2
Como isto vale para todo n0 ∈ N, podemos mandar n0 → +∞ e obter:
lim sup dC (fj , f ) ≤ 0,
j∈N
133
Dada {fj }j∈N ⊂ C, dC (fj , fℓ ) → 0 se e somente se {fj }j∈N é uniformemente Cauchy
sobre compactos.
A prova é bastante parecida com a anterior e será apenas esboçada. Se {fj }j∈N é Cauchy
sobre compactos, então ∥fj −fℓ ∥Kn ,∞ → 0 (e portanto αKn (fj , fℓ ) → 0) para qualquer n ∈ N.
Fixando um n0 ∈ N\{0}, a Afirmação nos dá a estimativa:
1
dC (fj , fℓ ) ≤ 2αKn0 (fj , fℓ ) + .
2n0
Tomando j, ℓ → +∞, deduzimos:
1
∀n0 ∈ N : lim sup dC (fj , fℓ ) ≤
j,l→+∞ 2n0
e podemos concluir que dC (fj , fℓ ) → 0 como na prova anterior.
Suponha agora que {fj }j∈N é Cauchy de acordo com a métrica dC . Fixo um compacto
K ⊂ A, precisamos mostrar que ∥fj − fℓ ∥K,∞ → 0 quando j, ℓ → +∞. De fato, é fácil ver
que é equivalente mostrar que αK (fj , fℓ ) → 0. Para isso, seguimos o raciocínio anterior,
tomando n0 ∈ N com K ⊂ Kn0 e observando que
j,ℓ→+∞
0 ≤ αK (fj , fℓ ) ≤ 2n0 dC (fj , fℓ ) −→ 0,
donde segue o αK (fj , fℓ ) → 0.
Para terminar a prova, mostramos a afirmação final do teorema.
(C, dC ) é completo.
Tome uma sequência {fj }j∈N que é Cauchy segundo dC . Mostramos abaixo que existe
f ∈ C com dC (fj , f ) → 0.
Em primeiro lugar, sabemos (pelos itens acima) que {fj }j∈N é uniformemente Cauchy
sobre compactos. Em particular, para cada t ∈ A, {fj (t)}j∈N ⊂ V é Cauchy (já que {t} é
compacto) e existe o limite pontual:
f (t) := lim fj (t).
j→+∞
Além disso, podemos provar pelo raciocínio usual que ∥fj − f ∥K,∞ → 0 para qualquer
K ⊂ A compacto.
Dado t ∈ A arbitrário, precisamos mostrar que f é contínua em t. Para isso, usamos que
A é aberto e portanto existe um δ > 0 tal que a bola fechada BRd [t, δ] ⊂ A. Como esta bola
fechada é compacta (por Heine-Borel!), fj → f uniformemente sobre a bola. Mas sabemos
que o limite uniforme de funções contínuas sobre um compacto é uma função contínua.
Deduzimos que a restrição de f à bola BRd [t, δ] é contínua, o que implica (exercício!) a
continuidade de f em t.
Agora, sabemos que f é contínua em cada t ∈ A, logo f ∈ C. Como vimos acima,
∥fj − f ∥K,∞ → 0 para qualquer K ⊂ A compacto. Já sabemos que isso é equivalente a
dC (fj , f ) → 0. Ou seja: provamos (como queríamos) que {fj }j∈N converge em C. 2
134
7.3 Compactos nos espaços de funções contínuas
Acima mostramos que os subconjuntos compactos de Rd têm uma “cara" simples: são
simplesmente os fechados e limitados. Em particular, bolas fechadas são sempre compac-
tas. Abaixo, veremos que este resultado não se estende a espaços de funções contínuas.
No entanto, conseguiremos uma caracterização dos compactos via um teorema chamado
de Arzelà-Ascoli.
Exercício 7.7 Cheque que a sequência de "tendas" construída no Exemplo 3.2 tem as propriedades
requeridas acima acima.
Na verdade, o que ocorre é um fenômeno muito mais geral: C([0, 1], R) não tem bolas
compactas porque não é um espaço vetorial de dimensão finita.
Lema 7.2 (Lema de Riesz) Considere um espaço de Banach (V, ∥ · ∥V ). Então, as bolas fechadas
de V são compactas se e somente se V tem dimensão finita.
Não provaremos este resultado aqui, embora a prova não seja muito difícil. No entanto,
ele indica que um critério para achar quem são os compactos de C([0, 1], Rd ) tem de ser
mais complicado que o teorema de Heine-Borel. Veremos o critério adequado quando
estudarmos o teorema de Arzèla-Ascoli, no capítulo adequado.
135
teo:AA Teorema 7.4 (Arzelà-Ascoli) Uma família de funções F ⊂ C(K, Z) (com (K, dK ) compacto e
(Z, dZ ) completo) é totalmente limitada se e somente se ela tem as duas propriedades abaixo.
F(t) := {f (t) : f ∈ F}
é totalmente limitado.
Observação 7.1 Em particular, o teorema nos diz que, se F ⊂ C satisfaz 1 e 2, então toda
sequência em F tem uma subsequência convergente.
A prova do Teorema 7.4 está contida nos Lemas 7.3 e 7.4 abaixo. Antes de apresentar
os lemas, vamos tentar entender as duas condições no teorema. O ponto é que as duas
condições valem se F tem um número finito de funções: a propriedade 1 é trivial e a 2
vale porque cada f ∈ C é uniformemente contínua e portanto limδ→0+ mf (δ) = 0 para cada
f ∈ F. O que o teorema nos diz, para famílias gerais de funções, é que as propriedades 1
e 2 valem se e somente se F pode ser bem aproximada por uma família finita de funções;
isto é, se F tem ε-redes finitas para qualquer ε > 0.
O próximo resultado mostra uma direção do Teorema de Arzèla-Ascoli.
Anecessario Lema 7.3 (Necessidade das condições no teorema) Com a notação do Teorema 7.4, vale que,
se F é totalmente limitada, então valem as condições 1 e 2.
Prova: Suponha que F é totalmente limitada e fixe um ε > 0 qualquer. Iremos mostrar
que:
(i) Dado t ∈ K, podemos cobrir F(t) por um número finito de bolas fechadas de raio ε.
De fato, se (i) vale para qualquer ε > 0, isto nos diz que cada conjunto F(t) pode
ser coberto por um número finito de bolas de raio ε; ou seja, cada F(t) é totalmente
limitado. Ao mesmo tempo, se (ii) vale para qualquer ε > 0, lim supδ→0+ supf ∈F mf (δ) ≤ 0
e (como mf (δ) ≥ 0 sempre) temos limδ→0+ supf ∈F mf (δ) = 0. Portanto, provar (i) e (ii) será
suficiente para concluir a prova deste lema.
Para demonstrar (i) e (ii), usaremos o fato de que F é totalmente limitado. Deste modo,
existe uma ε-rede finita R ⊂ F, que satisfaz:
A existência desta rede finita nos permite provar a propriedade (i). De fato, veremos
que
R(t) := {g(t) : g ∈ R}
136
é ε-rede de F(t) (e é finita porque R é finito). Para mostrar isso, tome um a ∈ F(t)
qualquer. Pela definição de F(t), a = f (t) para alguma f ∈ F. Considere agora gf ∈ R
como em (7.3) e note que b := gf (t) ∈ R(t) satisfaz:
Portanto, dado a ∈ F(t), há um b ∈ R(t) com dZ (a, b) ≤ ε. Ou seja, R(t) é mesmo ε-rede.
Agora usaremos R para mostrar a propriedade (ii). Observe que, dados quaisquer
x, x′ ∈ K com dX (x, x′ ) ≤ δ e qualquer f ∈ F (com gf como em (7.3))
dZ (f (x), f (x′ )) ≤ dZ (gf (x), gf (x′ )) + dZ (gf (x), f (x)) + dZ (gf (x′ ), f (x′ ))
≤ sup dZ (gf (t), gf (s)) + 2 sup dZ (gf (x), gf (x′ ))
s,t∈K : dX (s,t)≤δ t∈K
Note que usamos maxg∈R (e não supg∈R ) na última linha porque R é finito. Note ainda
que este último termo é independente de f, x, x′ . Ou seja, a desigualdade
vale para toda função f ∈ F e para todos os pares de pontos x, x′ ∈ K com dX (x, x′ ) ≤ δ.
Tomando supremos, deduzimos que:
Asuficiente Lema 7.4 (Suficiência das condições no teorema) Com a notação do Teorema 7.4, se F satis-
faz as condições 1 e 2, então F é totalmente limitada.
Prova: Provaremos que, dado qualquer ε > 0, se F satisfaz 1 e 2, então F não contem um
ε-empacotamento infinito. Isso basta pela Proposição 6.7.
Como faremos isso? A prova será por contradição. Suporemos que F satisfaz as
propriedades 1 e 2 e ao mesmo tempo contem um ε-empacotamento infinito. Veremos
137
que isso implicaria a existência de um (ε/2)-empacotamento infinito em F(t1 ) × F(t2 ) ×
. . . F(tk ), para alguma escolha de pontos t1 , . . . , tk ∈ K. Veremos que isso contradiz o fato
de que cada F(ti ) é totalmente limitado (a propriedade 1 no teorema).
Uma questão crucial é como escolher os pontos ti . A ideia é que estes pontos sejam tais
que cada função f ∈ F seja “bem representada" pelos valores f (ti ) nos pontos t1 , . . . , tk .
Para isso, usaremos a propriedade 2: sabemos controlar uniformemente sobre f ∈ F a
variação de f (t) quando t muda: deste modo, bastará tomar uma δ-rede {t1 , . . . , tk } para
um δ bem escolhido para garantir que os valores de f (ti ) “determinam f a menos de um
erro pequeno". A afirmação abaixo apresenta este raciocínio de forma precisa.
Afirmação 7.2 Dado ε > 0, e supondo que F satisfaz 1 e 2, existem um k ∈ N\{0} e pontos
t1 , . . . , tk ∈ K tais que, se
ε
∀f1 , f2 ∈ F : max dZ (f1 (ti ), f2 (ti )) ≤ dC (f1 , f2 ) ≤ max dZ (f1 (ti ), f2 (ti )) + .
1≤i≤k 1≤i≤k 2
Prova: [da Afirmação] Como ε > 0, a propriedade 2 implica que existe um δ > 0 tal que
supf ∈F mf (δ) ≤ ε/4. Como K é compacto (e portanto totalmente limitado), existe uma
δ-rede finita {t1 , . . . , tk } ⊂ K. Pela definição de δ-rede, sabemos que, para cada x ∈ K,
existe um ti com dX (x, ti ) ≤ δ, de modo que dZ (f (ti ), f (x)) ≤ ε/4 para qualquer f ∈ F.
Mas então, dadas quaisquer f1 , f2 ∈ K e dado qualquer x ∈ K:
ε
∃1 ≤ i ≤ k : dZ (f1 (x), f2 (x)) ≤ dZ (f1 (ti ), f2 (ti )) + 2mf (δ) ≤ max dZ (f1 (ti ), f2 (ti )) + .
1≤i≤k 2
T := T1 × T2 × · · · × Tk
munido da métrica-produto:
138
associando a cada f ∈ F o vetor ϕ(f ) ∈ T com coordenadas ϕ(f )[i] := f (ti ) (1 ≤ i ≤ k) é
bem definida. A Afirmação garanate que:
ε
∀f1 , f2 ∈ F : dT (ϕ(f1 ), ϕ(f2 )) ≤ dC (f1 , f2 ) ≤ dT (ϕ(f1 ), ϕ(f2 )) + .
2
Agora usaremos a suposição (que fizemos para chegar a uma contradição) que há um
ε-empacotamento infinito P ⊂ F. Num ε-empacotamento, como sabemos, quaisquer dois
elementos distintos estão a distância estritamente maior do que ε um do outro. Disso
deduzimos que:
ε ε
∀f1 , f2 ∈ P : f1 ̸= f2 ⇒ dT (ϕ(f1 ), ϕ(f2 )) ≥ dC (f1 , f2 ) − > .
2 2
Dito de outro modo, a função ϕ é injetiva sobre P e a imagem deste conjunto,
ϕ(P ) := {ϕ(f ) : f ∈ P } ⊂ T,
Exercício 7.8 Ao invés de fazermos uma prova por contradição, poderíamos apresentar um ar-
gumento direto mostrando que P (F, ε) ≤ P (T, ε/2), para o T construído acima. Utilize esta
observação e o Exercício 6.16 para achar uma cota superior para P (F, ε) (e portanto para N (F, ε))
em termos de supt∈K N (F(t), ε) e N (K, δ).
d
X
∀x ∈ R : p(x) = aj (p) xj .
j=0
Mostre que, dado qualquer conjunto S ⊂ R com mais de d + 1 pontos, existe uma constante Cd,S
dependendo apenas de d e S tal que:
139
Exercício 7.10 Deduza do Teorema de Heine-Borel o seguinte resultado: dados d, ℓ naturais
positivos, um subconjunto K ⊂ Rd×ℓ é compacto (com a topologia dada por qualquer norma) se
e somente se ele é fechado e limitado. Use este resultado para decidir se os conjuntos abaixo são
subconjuntos compactos de Rd×d .
1. O(d) := {A ∈ Rd×d : AT A = Id×d } (grupo das matrizes ortogonais d × d);
2. SL(d, R) := {A ∈ Rd×d : det(A) = 1} (grupo linear especial em d dimensões);
3. PSD1 (d, R) := {A ∈ Rd×d : A = AT , ∀v ∈ Rd , v.Av ≥ 0 e tr(A) = 1}.
Exercício 7.11 Tome d ∈ N\{0}. Lembre-se de Álgebra Linear que um autovalor de uma matriz
A ∈ Rd×d é um número λ ∈ R tal que Ax = λx para algum x ∈ Rd \{0Rd }. Dado um conjunto
S ⊂ Rd×d , defina:
Exercício 7.12 Prove que um espaço métrico (K, dK ) é compacto se e somente se, dada qualquer
função contínua f : K → R, a imagem f (K) ⊂ R é compacta.
Exercício 7.13 Considere K ⊂ Rd compacto e convexo (convexidade significa que, dados quais-
quer dois pontos x, x′ ∈ K, o segmento [x, x′ ] := {(1 − λ)x + λx′ : 0 ≤ λ ≤ 1} está todo contido
em K). Mostre que um subconjunto F ⊂ C(K, Rℓ ) é totalmente limitado se e somente se ele é
equicontínuo e existe um ponto t0 ∈ K tal que F(t0 ) := {f (t0 ) : f ∈ F} é limitado.
Exercício 7.14 Fixados α > 0 e espaços métricos (K, dK ), (Z, dZ ) como no início do §7.3.2,
dizemos que uma f : K → Z é α-Hölder com constante L > 0 se:
Note que este conceito generaliza o conceito de função Lipschitz (o caso α = 1 da definição acima).
1. Mostre que toda f que é α-Hölder com alguma constante também é contínua.
2. No caso particular em que K ⊂ Rd é compacto e convexo (v. exercício anterior) e dK é a
métrica induzida por | · |2 , mostre que
3. Permita novamente que (K, dK ) seja um espaço métrico compacto arbitrário e agora considere
Z = Rd com a métrica usual. Fixos L, α > 0 e um par (t0 , z0 ) ∈ K × Rd , mostre que o
conjunto a seguir é um subconjunto compacto de (C(K, Z), dC ):
140
Exercício 7.15 (Arzèla-Ascoli para funções contínuas sobre um aberto) Dado A ⊂ Rd aberto,
considere o espaço C(A, V ) com a métrica dC apresentada no §7.2.2. Dada uma função f ∈
C(A, V ), podemos definir, para cada compacto K ⊂ A, a restrição de f a K, denotada por f |K .
Prove que uma família F ⊂ C(A, V ) é totalmente limitada de acordo com a métrica dC se e somente
se ele tem as seguintes propriedades:
1. F é pontualmente totalmente limitada, isto é, para todo t ∈ A,
Deduza que toda sequência {fn }n∈N ⊂ C(A, V ) com as duas propriedades acima tem uma sub-
sequência {fnk }k∈N com fnk → f ∈ C(A, V ) uniformemente sobre compactos.
Exercício 7.16 (Teorema de Dini) Considere um espaço topológico compacto (X, T ) e funções
contínuas {f } ∪ {fn : n ∈ N} de X em R. Suponha que para todo x ∈ X a sequência {fn (x)}n∈N
é monótona crescente e converge a f . Prove que fn tem de convergir uniformemente a f , isto é
supx∈X |fn (x) − f (x)| → 0 quando n → +∞.
Exercício 7.17 Recorde o Exercício 4.18. Naquele problema, tomamos um espaço métrico (X, dX )
e uma f : X → R dada. Dado M > 0, definimos uma nova função fM : X → R,
Exercício 7.18 Considere um conjunto S ⊂ Rd não-vazio. Dizemos que uma curva (isto é, uma
função contínua) γ : [0, 1] → Rd cobre S se γ([0, 1]) ⊃ S. Suponha agora que o conjunto
141
142
Capítulo 8
Caminhos e conexidade
Se neste momento faz 30o C no Rio de Janeiro e −10o C em São Petesburgo, podemos
garantir que qualquer temperatura entre −10o e 30o C ocorre em algum ponto da superfície
do planeta? Este é um exemplo de uma classe mais geral de perguntas.
Dada uma função real f : X → R, se ela atinge um par de valores a < b, é necessa-
riamente verdade que ela atinge todos os valores entre a e b? Ou seja, quando vale a
implicação:
“∀a, b ∈ f (X) : a < b ⇒ [a, b] ⊂ f (X)”?
143
ainda que γ conecta x a x′ em U ⊂ X se x, x′ ∈ U , γ conecta estes dois pontos e a imagem
U
Im(γ) ⊂ U . Simbolizaremos esta relação pelo símbolo x ↔ x′ .
U
Definição 8.1 Dizemos que U ⊂ X é conexo por caminhos se x ↔ x′ para todos x, x′ ∈ U .
Prova: Reflexividade segue do fato de que a curva γ(t) ≡ x, t ∈ [0, 1], conecta x a x.
Simetria vem do fato que γ conecta x a x′ se e somente se t 7→ γ(1 − t) conecta x′ a x, e
tanto γ quanto t 7→ 1 − t são contínuas.
U U U
Por fim, suponha x ↔ x′ ↔ x′′ . Queremos demonstrar que x ↔ x′′ , ou seja, que há
uma curva que conecta x a x′′ em U . Veja primeiramente que, por hipótese, existem curvas
γ0 , γ1 : [0, 1] → U com γ0 (0) = x, γ0 (1) = γ1 (0) = x′ e γ1 (1) = x′′ . Defina agora:
γ0 (2t), 0 ≤ t ≤ 1/2;
γ(t) :=
γ1 (2t − 1), 1/2 < t ≤ 1.
A ideia é que nós “colamos" a curva γ0 com a curva γ1 , o que resulta numa única curva
contínua porque γ0 termina onde γ1 começa. De fato, supondo por um instante que γ
é contínua, vemos que γ(t) ∈ U para todo t (afinal, γ(t) = γ0 (s) ou γ1 (s) para algum
U
s ∈ [0, 1]) e conecta x a x′′ , de modo que x ↔ x′′ .
Falta checar que γ é mesmo contínua. Há várias maneiras de fazer isso e aqui optamos
pela mais topológica.
Dado um conjunto F ⊂ U fechado em U , vamos mostrar que γ −1 (F ) ⊂ [0, 1] é fechado.
Veja que, dado um t ∈ [0, 1] qualquer,
t ∈ γ −1 (F ) ⇔ (t ≤ 1/2 e γ0 (2t) ∈ F ) ou (t ≥ 1/2 e γ1 (2t − 1) ∈ F ).
O ponto sutil acima é que as duas cláusulas do “ou" serão verdade simultaneamente no
caso em que t = 1/2. Isto vem do simples fato que γ0 (2t) = x′ = γ1 (2t − 1) se t = 1/2. Aqui
usamos o fato de que γ0 termina onde γ1 começa, que é fundamental para termos a continuidade.
Vamos agora terminar a prova observando o seguinte. Defina as funções contínuas
ϕ0 (t) := 2t, definida para t ∈ [0, 1/2], e ϕ1 (s) := 2s − 1, para s ∈ [1/2, 1]. A equivalência
acima nos mostra que
γ −1 (F ) = (γ0 ◦ ϕ0 )−1 (F ) ∪ (γ1 ◦ ϕ1 )−1 (F ).
144
Como γ0 , γ1 , ϕ0 e ϕ1 são contínuas, temos que (γ0 ◦ ϕ0 )−1 (F ) ⊂ [0, 1/2] é fechado em [0, 1/2]
e (γ1 ◦ ϕ1 )−1 (F ) ⊂ [1/2, 1] é fechado em [1/2, 1]. Como ambos os intervalos são fechados,
deduzimos que (γ0 ◦ ϕ0 )−1 (F ) e (γ1 ◦ ϕ1 )−1 (F ) são ambos fechados em [0, 1] e portanto
γ −1 (F ), que é a união dos outros dois, também é fechado em [0, 1], como queríamos
demonstrar. 2
plo:convexo Exemplo 8.2 Seja (V, ∥ · ∥V ) um espaço vetorial normado e C ⊂ V um conjunto convexo, isto
é tal que, dados quaisquer v, v ′ ∈ C e t ∈ [0, 1], (1 − t) v + tv ′ ∈ C. Geometricamente, isto quer
dizer que, dados dois pontos em C, todo o segmento de reta entre eles também está em C.
Mas então, para quaisquer v, v ′ ∈ B(v0 , R) e t ∈ [0, 1], temos ∥v − v0 ∥V < R, ∥v ′ − v0 ∥V < R
e portanto
145
Exemplo 8.3 Suponha que U, V ⊂ X são conexos por caminhos e têm um ponto em comum.
Então U ∪ V é conexo por caminhos.
U
De fato, seja x0 ∈ U ∩ V . Então, para todo x ∈ U ∪ V , ou x ∈ U e x ↔ x0 (já que U é
V U ∪V
conexo por caminhos), ou x ↔ x0 (e vale o análogo para V ). Em ambos os casos, x ↔ x0
U ∪V
e a transitividade desta relação garante que x ↔ x′′ para quaisquer x, x′′ ∈ U ∪ V .
Exemplo 8.4 Seja U ⊂ X conexo por caminhos. Para qualquer função contínua f : U → Y , a
imagem f (U ) é conexa por caminhos. Em particular, se Y = R, f (U ) é um intervalo.
Para ver isso, observe que, dados x, x′ ∈ U e uma curva γ ligando estes dois pontos em
U , a composição f ◦ γ é contínua e conecta f (x) a f (x′ ) em f (U ). Deste modo, como todos
os pares de pontos em U são conectados por curvas em U , quaisquer dois pontos y = f (x),
y ′ = f (x′ ) em f (U ) são conectados por caminhos em f (U ). Ou seja, f (U ) é conexo por
caminhos.
sferaconexa Exemplo 8.5 Dado d ∈ N\{0, 1}, a esfera unitária Sd−1 ⊂ Rd é conexa por caminhos.
Para provar este resultado, a ideia geométrica é a seguinte: dados x, x′ ∈ Sd−1 , podemos
pensa na interseção da esfera com o plano que passa por x, x′ e a origem de Rd . Esta
interseção é um círculo que passa pelos dois pontos e podemos tomar o arco do círculo
entre x e x′ como a curva que conecta os dois pontos.
Formalizamos este raciocínio usando geometria analítica. Tome x, x′ ∈ Sd−1 . Como
ambos os vetores estão na esfera, eles têm norma 1 e podemos achar um vetor x⊥ tal que:
p
x′ = (x.x′ ) x + 1 − (x.x′ )2 x⊥ .
Como |x.x′ | ≤ 1 por Cauchy Schwartz, podemos também escrever x.x′ = cos θ para
algum √0 ≤ θ ≤ π; deste modo, sin θ ≥ 0 e a relação cos2 θ + sin2 θ = 1 nos diz que
sin θ = 1 − cos2 θ. Deduzimos que:
x′ = cos θ x + sin θ x⊥ .
Portanto, a curva
γ : t ∈ [0, θ] 7→ (cos t) x + (sin t) x⊥
é contínua, tem imagem na esfera (exercício) e vai de γ(0) = x e γ(1) = x′ . Como x e x′ são
arbitrários, Sd−1 é conexa por caminhos.
Exercício 8.1 Determine se os conjuntos contidos em Rd (d > 1) abaixo são convexos e/ou conexos
por caminhos.
1. O simplexo
( d
)
X
∆d := x ∈ Rd : x[j] = 1 e ∀i ∈ {1, . . . , d}, x[i] ≥ 0 .
j=1
146
2. A esfera unitária Sd−1 := {x ∈ Rd : |x|2 = 1.}
3. Rd \{0}.
Exercício 8.2 Tome a métrica discreta sobre X e prove que este espaço é conexo por caminhos se e
somente se X tem apenas um elemento.
def:conexo Definição 8.2 Um espaço topológico (X, T ) é conexo se todo L ⊂ X com L ̸= ∅, X tem ∂L ̸= ∅.
Um subconjunto U ⊂ X é conexo se (U, TU ) é conexo, onde TU é a topologia induzida por T em U .
Exercício 8.3 Suponha que X tem pelo menos dois elementos. Ele é conexo com a topologia grossa?
E com a topologia fina?
equivalente Teorema 8.1 Dado um espaço topológico (X, T ), as seguintes propriedades são equialentes.
1. (X, T ) é conexo;
147
4. para toda toda função contínua f : X → R, f (X) := {f (x) : x ∈ X} é um intervalo.
Vejamos o que cada item diz. O primeiro é a nossa definição: X é conexo se qualquer
maneira de parti-lo em dois resulta numa “quebra". O segundo, como veremos, tem a ver
com a relação entre "∂S = ∅" e um subconjunto ser simultaneamente aberto e fechado. O
terceiro diz que não dá para pintar os pontos de X usando duas cores (aqui representadas
por 0 e 1) sem criar uma região onde se “pula" abruptamente de uma cor pra outra (o que
seria uma descontinuidade em η). O último item nos fala que a imagem de X por f não
pode "pular" um ponto da reta; ou seja, X é conexo se e somente se o Teorema do Valor
Intermediário se aplica a X!
Faremos esta prova por partes e de uma forma que não é “econômica em implicações".
Começamos com uma proposição que mostra “1 ⇔ 2".
tosfechados Proposição 8.1 Um espaço topológico (X, T ) é conexo se e somente se ∅ e X são os únicos
conjuntos simultaneamente abertos e fechados de X.
Prova: Olhando para a Definição 8.2, vemos que esta Proposição segue da seguinte afir-
mação.
Afirmação 8.1 Em qualquer espaço topológico (X, T ), um conjunto L ⊂ X satisfaz ∂L = ∅ se e
somente se L é ao mesmo tempo aberto e fechado.
Provemos, então, esta afirmação.
Começamos supondo que L ⊂ X é ao mesmo tempo aberto e fechado; nosso objetivo
será mostrar ∂L = ∅. Para isso, recorde que complementares de abertos/fechados são
fechados/abertos (respectivamente). Portanto, o complementar de L também é ao mesmo
tempo aberto e fechado. Sendo assim, L = L, Lc = Lc e
Proposição 8.2 Um espaço topológico (X, T ) é conexo se e somente se toda função contínua
η : X → {0, 1} é constante (aqui tomamos a topologia discreta sobre {0, 1}, que é a mesma
topologia induzida pela métrica usual da reta real).
148
Prova: A prova se baseia caracterização de conexidade na Proposição 8.1 e na seguinte
observação:
Para ver isso, tome η : X → {0, 1} contínua. Como {0}, {1} são subconjuntos simulta-
neamente abertos e fechados de {0, 1},
op:conexo01 Proposição 8.3 Um espaço topológico (X, T ) tem a propriedade de que toda função contínua
η : X → {0, 1} é constante se e somente se para qualquer f : X → R contínua, f (X) é intervalo.
• mesmo que fossem a mesma função, não é completamente evidente que f seja
contínua (com contradomínio R e a topologia correspondente) só porque η é cotínua.
O primeiro ponto é resolvido observando que podemos definir f : X → R pela fórmula
∀x ∈ X : f (x) = η(x).
149
em {0, 1}. Como η é contínua, isto quer dizer que f −1 (S) é aberto de X para todo S ⊂ R, o
que é mais do que suficiente para garantir que f : X → R é contínua.
Agora suporemos que existe uma f : X → R contínua tal que não é intervalo e
mostraremos que existe η : X → R contínua e não constante. Dizer que f (X) não é
intervalo significa que existem números reais r < r′ < r′′ na reta com r, r′′ ∈ f (X) e
r′ ̸∈ f (X). Observe que isso quer dizer que f (X) ⊂ R\{r′ }. Em particular, podemos
“abusar notação" e dizer que o contradomínio de f é R\{r′ }.
Observe agora que a função ξ : R\{r′ } → {0, 1} que leva t ∈ R\{r′ } em 0 se t < r′ e
em 1 se t > r′ , é contínua. Isso quer dizer que η := ξ ◦ f : X → {0, 1} também é contínua.
Afirmamos que η não é constante. Para ver isso, basta lembrarmos que r < r′ < r′′ com
r, r′′ ∈ f (X), logo existem x, x′′ ∈ X com f (x) = r, f (x′′ ) = r′′ . Concluímos que
8.2.2 Exemplos
Nossa próxima tarefa é analisar alguns exemplos em que a definição de convexidade é
aplicada. Começamos descobrindo quem são os conjuntos conexos da reta real.
Para ver isso, tome I ⊂ R intervalo. Dada η : I → {0, 1} contínua, veremos que ela tem
de ser constante. Suponha (para chegar a uma contradição) que η não é constante. Como
vimos na prova da Proposição 8.3, podemos “abusar notação" e pensar em η como uma
função contínua de I em R. Como ela não é constante, há pontos t0 , t1 ∈ I com η(t0 ) = 0 e
η(t1 ) = 1. O Teorema do Valor Intermediário implica que para cada x ∈ (0, 1) há um t ∈ I
com γ(t) = x. Mas isto contradiz o fato de que o contradomínio de η é {0, 1}. Portanto, se
I é intervalo, toda η : I → {0, 1} tem de ser constante.
Por outro lado, suponha que I não é intervalo. Mostraremos que I é desconexo usando
uma função análoga à ξ da prova da Proposição 8.3. Como I não é intervalo, existe um
ponto r ∈ R\I tal que inf I < r < sup I. A função
0, t < r
ξ(t) :=
1, t > r.
Esta função está definida para t ∈ R e é sabido que ela só é descontínua em t = x. Como
x ̸∈ I, sua restrição η = η0 |I é contínua. Além disso, vemos que, como x > inf I, existe
t0 ∈ (inf I, x) com t0 ∈ I e portanto η(t0 ) = 0. Do mesmo modo, como x < sup I, existe
t1 ∈ (x, sup I) com η(t1 ) = 1. Portanto, o fato de que I não é um intervalo implica que
existe η : I → {0, 1} contínua e não constante.
Exemplo 8.7 Todo conjunto conexo por caminhos é conexo. (A recíproca em geral é falsa.)
150
Um contraexemplo para a recíproca será discutido na próxima seção. Para ver que
conexidade por caminhos implica conexidade, imagine que U é conexo por caminhos e
que η : U → {0, 1} é contínua. Sem perda de generalidade, supomos que U ̸= ∅ e tomamos
x0 ∈ U . Nossa tarefa será mostrar que η(x) = η(x0 ) para todo x ∈ U . De fato, dado x ∈ U ,
U
sabemos que x ↔ x0 , portanto existe γ : [0, 1] → U contínua com γ(0) = x0 e γ(1) = x. A
composição η ◦ γ : [0, 1] → {0, 1} é contínua; como [0, 1] é conexo, η ◦ γ é constante. Logo
η(x) = η(γ(1)) = η(γ(0)) = η(x0 ), como queríamos demonstrar.
É um bom exercício provar isso no caso em que a topologia de X é dada por uma
métrica. Abaixo, damos uma prova puramente topológica.
Considere η : V → {0, 1} contínua; nosso objetivo é provar que ela é constante. O
primeiro passo é observar que a restrição η |U também é contínua e, como U é conexo,
η |U é constante. Suporemos sem perda de generalidade que η(x) = 0 para todo x ∈ U . A
ideia agora é provar que η(y) = 0 para todo y ∈ V .
Para isso, é suficiente mostrar que, dado um ponto arbitrário y ∈ V , existe um x ∈ U
com η(x) = η(y). Fixe então um y ∈ V e tome b := η(y). Temos y ∈ η −1 ({b}). Como η
é contínua, η −1 ({b}) é aberto relativo de V , o que quer dizer que η −1 ({b}) = A ∩ V para
algum aberto A ⊂ X da topologia T . Então, y ∈ A com A aberto. Também sabemos que
y ∈ V ⊂ U e que todo aberto interceptando U também intercepta U ; logo, existe um ponto
x ∈ A ∩ U . Como U ⊂ V ,
Ou seja, achamos o ponto x ∈ U com η(x) = η(y) de que precisávamos. Isso conclui a
prova de que V é conexo.
Exercício 8.4 Utilize argumentos relacionados com os que vimos acima para mostrar o seguinte
resultado: se U ⊂ X é dado (não necessariamente conexo) e U ⊂ V ⊂ U , então V é o fecho de U
na topologia relativa de V .
Ou seja, η(a) = η(a′ ) para quaisquer dois pontos a, a′ ∈ U . Isso quer dizer que é constante
sobre f (U ). Como η : f (U ) → {0, 1} é uma função contínua qualquer, deduzimos que
f (U ) é conexo.
151
Exemplo 8.10 Se F é uma coleção de subconjuntos conexos de X e F ∩ F ′ ̸= ∅ para quaisquer
F, F ′ ∈ F, então ∪F ∈F F é conexo.
Note que provamos que uma união de dois conjuntos conexos por caminhos com ponto
em comum é conexa por caminhos. Aqui, a união é conexa mesmo que a coleção F tenha
infinitos elementos.
Para provar que vale a propriedade acima, tomemos η : ∪F ∈F F → {0, 1} contínua
e dois pontos quaisquer x, x′ da união, para mostrar que η(x) = η(x′ ). Para isto, tome
F, F ′ ∈ F tais que x ∈ F e x′ ∈ F ′ (tais conjuntos têm de existir, porque x e x′ estão na
união). Por hipótese, podemos encontrar um elemento x0 ∈ F ∩ F ′ . Como F é conexo,
η é contínua, a restrição de η a F é constante; isto quer dizer que η(x) = η(x0 ) porque
x0 , x ∈ F . Do mesmo modo, a conexidade de F ′ implica η(x′ ) = η(x0 ). Deduzimos que
η(x) = η(x′ ), como queríamos demonstrar.
Não provamos esta proposição, que fica como exercício, mas observamos (para ajudar)
que as duas condições sobre A e B querem dizer que B ∩ D é o complementar de A ∩ D
em D.
152
Nossos objetivos nesta seção são três. Em primeiro lugar, mostraremos a conexidade
ou não-conexidade do conjunto de matrizes ortogonais. Em segundo lugar, veremos que
os conceitos de conexidade e conexidade por caminhos, que são equivalentes em dimensão
1, não são equivalentes já em dimensão 2. Por último, mostraremos que as duas noções
de conexidade coincidem sempre que falamos de abertos em espaços vetoriais normados.
det : Rd×d → R.
e seus subconjuntos
Então O(d) = SO(d) ∪ SO− (d) (com união disjunta). O(d) é desconexo, mas SO(d) e SO− (d)
são conexos por caminhos.
153
Este resultado pode ser apreciado de duas maneiras. Uma é matemática: SO(d) e O(d)
são grupos de Lie – isto é, grupos que têm estruturas de variedade – e este resultado nos dá
informação sobre a topolgia do espaço.
Outra maneira é mais aplicada. Imagine que quero descolar um conjunto de pontos
S ⊂ R3 para um outro, QS ⊂ R3 com Q ∈ SO(3). Podemos imaginar por exemplo que S é
um pedaço de chapa metálica que está deitado e queremos botar em outra posição. O fato
de que SO(3) é conexo por caminhos significa que há uma maneira contínua de passar
de Q(0) = Id×d para Q(1) = Q; ou seja, há como mexer S sem saltos para passar de uma
posição a outra.
Esta prova dará um bocado de trabalho, mas a graça dela é termos a oportunidade de
trabalhar com o grupo SO(d) mais de perto. Vários passos serão deixados como exercícios
que não são difíceis para quem lembra bem de Álgebra Linear.
Prova: Começamos a prova com algumas observações de Álgebra Linear, que deixamos
como exercício.
Exercício 8.5 O(d) e SO(d) são grupos (fechados por produtos e inversas). Além disso, uma
matriz pertence a O(d) se e somente se suas colunas são ortonormais (têm norma 1 e são ortogonais
umas às outras).
Para continuar, vamos entender porque O(d) tem duas partes. Veja que:
Como det(Q) toma valores reais, deduzimos que det(Q) ∈ {−1, +1} para qualquer matriz
Q ∈ O(d), o que quer dizer que toda Q ∈ O(d) está ou em SO(d) ou em SO− (d). Além
disso, notamos que estes dois conjuntos não são vazios, já que a identidade está em SO(d)
e a matriz
0
..
.
R=
Id−1 ∈ SO− (d)
0
0 ... 0 1
(em virtude da propriedade 5 do determinante). Concluímos que O(d) é a união disjunta
de SO(d) e SO− (d) e estes dois conjuntos não são vazios: em particular, a imagem da
função determinante sobre O(d) é det(O(d)) = {−1, 1}, que não é intervalo. Por isso, O(d)
não é conexo.
Agora que encontramos as duas “partes naturais" de O(d), mostraremos que as duas
são conexas por caminhos. De fato, o próximo argumento nos mostra que só precisamos
nos preocupar com uma delas.
154
De fato, considere a matriz R definida acima. Usando a continuidade da multiplicação
de matrizes, vê-se facilmente (exercício) que
é uma bijeção contínua com inversa contínua. Em particular, SO− (d) = ψ(SO(d)). Com-
pletamos este passo lembrando que a imagem de um espaço conexo por caminhos por
uma função contínua também é conexa por caminhos.
A partir daqui, usaremos indução em d ≥ 2 para provar que SO(d) é conexo por
caminhos.
e deduza que SO(2) é conexo por caminhos. (A dica é usar o fato que as colunas de Q ∈ SO(2)
são ortonormais para observar que a primeira coluna é Q1 = (cosθ, sin θ)T para algum θ. A outra
coluna é um dos dois vetores unitários ortogonais a Q1 . A condição de determinante igual a 1 diz
qual vetor ortogonal escolher.)
A ideia será encontrarmos dentro de SO(d) uma cópia (que na verdade é um subgrupo)
que é uma “cópia" de SO(d − 1) (e portanto é conexo por caminhos). Daí, encerraremos
a prova mostrando que toda Q ∈ SO(d) pode ser conectada por uma curva contínua a
alguma Q1 ∈ H(d).
Exercício 8.7 Mostre que as duas afirmações acima – H(d) conexo por caminhos e todo Q ∈ SO(d)
conectado por curva contínua a alguma Q1 ∈ H(d) – são suficientes para se deduzir que SO(d) é
conexo por caminhos.
Achando uma “cópia" de SO(d − 1) em SO(d). Para encontrarmos H(d), começamos de-
finindo uma função função Φd : R(d−1)×(d−1) → Rd×d da seguinte forma.
0
..
.
Φd (Q̃) :=
Q̃ (Q̃ ∈ R(d−1)×(d−1) ).
0
0 ... 0 1
Pode-se verificar diretamente que Φd é contínua entrada a entrada e portanto é contínua.
ALém disso, ela tem as seguintes propriedades
155
Exercício 8.8 Mostre que Φd (I(d−1)×(d−1) ) = Id×d e que, para quaisquer Q̃1 , Q̃2 ∈ R(d−1)×(d−1) ,
Conectando elementos de SO(d) a H(d). Nosso próximo passo será mostrar a seguinte
afirmação.
SO(d)
Afirmação 8.2 Dada Q ∈ SO(d), existe uma Q1 ∈ H(d) com Q ↔ Q1 .
Para isso, precisamos primeiramente de uma informação adicional sobre H(d).
d com Qd ⊥ Qd .
ed = cos θ Qd + sin θ Q⊥ ⊥
Se seguíssemos aquele Exemplo, traçaríamos agora uma trajetória num círculo na esfera
unitária para conectar Qd a ed . É isto que faremos abaixo, mas construindo um caminho
γ0 no espaço de matrizes SO(d) tal que γ0 (θ)Qd = ed . Para isso, precisamos do seguinte
primeiro passo.
156
Exercício 8.9 Use o fato que d ≥ 3 para mostrar que existe uma transformação ortogonal V ∈
SO(d) levando Qd em ed e Q⊥d em ed−1 .
Agora considere
0
..
.
I(d−2)×(d−2)
γ0 (t) := V Z(t) V, onde Z(t) :=
T
(0 ≤ t ≤ θ).
0
cos t sin t
0 ... 0
− sin t cos t
Note que γ0 (0) = Id×d (pois V T V = Id×d ) e que γ0 (t) ∈ SO(d) (porque é o produto de
V, V T , Z(t) ∈ SO(d), como se pode verificar diretamente) para cada 0 ≤ t ≤ θ. Portanto,
γ(·) := γ0 (·) Q é uma curva com valores em SO(d) e γ(0) = Q. Também não é difícil
verificar que γ é contínua.
Para terminarmos a prova, veremos que γ(θ) ∈ H(d). Por tudo que já vimos até agora,
isto se resume a mostrar que a d-ésima coluna de γ(θ) = γ0 (θ)Q é ed . Será útil usar o
seguinte exercício.
Exercício 8.10 Prove que, dadas quaisquer matrizes A, B ∈ Rd×d , se Bj é a j-ésima coluna de B,
ABj é a j-ésima coluna de AB; ou seja, as colunas de AB são as colunas de B multiplicadas por
A à esquerda.
Portanto:
• A última coluna de V Q é V Qd = ed ;
157
Prova: A prova terá três partes.
Passo 3 Veremos que Γ0 ⊂ Γ ⊂ Γ0 , o que implica que Γ é conexo (pelo Exemplo 8.8).
de modo que, para cada 0 ≤ m ≤ n, γ1 (tm ) = 1/(mπ + π/2). Veja que novamente γ1 (0) <
1/((n + 1)π + π/2) < γ1 (tn ), logo existe um tn+1 ∈ (0, tn ) com γ1 (tn ) = 1/((n + 1)π + π/2).
Desta forma, provamos que existe uma sequência decrescente {tn }n∈N ⊂ (0, 1) com
1
∀n ∈ N : γ2 (tn ) = sin = ±1,
γ1 (tn )
158
8.3.3 Concordância para abertos de espaços vetoriais
Nesta seção mostramos um caso muito importante em que os dois conceitos de conexidade
concordam.
Prova: Uma direção já está dada; além disso, o resultado é trivial se A = ∅. Só nos falta
provar que um A ⊂ V , A ̸= ∅ que é aberto e conexo também é conexo por caminhos. O
argumento que usaremos é típico de provas envolvendo conexidade.
Como A ̸= ∅, podemos encontrar x0 ∈ A. Considere o subconjunto L ⊂ A de todos
A
os x ∈ A com x0 ↔ x. Nosso objetivo é provar que L = A; para isso, suporemos (para
chegar a uma contradição) que L ̸= A, de modo que R = A\L ̸= ∅. A contradição estará
provada quando mostrarmos que L e R são relativamente abertos em A, o que quer dizer que
A é desconexo. Vejamos, portanto, a prova destes fatos.
2. Do mesmo modo que acima, queremos provar que R ⊂ V é aberto. Para isto, dado
A
x ∈ R, tomamos δ > 0 com B(x, δ) ⊂ A. Novamente temos x′ ↔ x para todos
A
x′ ∈ B(x, δ). Deste modo, se algum x′ ∈ B(x, δ) satisfaz x′ ↔ x0 , também teremos
A
x ↔ x0 , o que contradiz o fato que x ̸∈ L. Deduzimos que x′ não está conectado em
A a x0 para qualquer x′ ∈ B(x, δ), ou seja, B(x, δ) ⊂ A\L = R.
159
Exercício 8.13 (Componentes conexas) Tome um espaço topológico (X, T ). Dado x ∈ X,
chamamos da componente conexa de x em X o conjunto:
[
C(x) := U.
U ⊂X conexo
x∈U
1. Prove que C(x) ̸= ∅ é conexa para cada x ∈ X. Além disso, mostre que C(x) é fechado de X.
2. Prove que quaisquer dois pontos x, x′ ∈ X ou têm a mesma componente conexa (C(x) ̸=
C(x′ )), ou têm componentes disjuntas (C(x) ∩ C(x′ ) = ∅).
3. Deduza que existe A ⊂ X tal que X = ∪x∈A C(x) com união disjunta (ou seja, todo espaço
topológico é uma união disjunta de componentes conexas) e que qualquer U ⊂ X conexo está
contido em C(x) para algum x ∈ A.
Exercício 8.14 (Componentes conexas da diferença) Tome um espaço topológico conexo (X, T )
e um subconjunto conexo Y ⊂ X. Considere qualquer uma das componentes conexas CY \X (x) de
Y \X e mostre que Y ∪ CY \X (x) tem de ser conexo.
Exercício 8.17 Neste problema, seguimos a notação do Exercício 5.32 e consideramos a soma de
Minkowski A + B de dois subconjuntos não-vazios A, B ⊂ V de um espaço vetorial normado
(V, ∥ · ∥V ). Prove os seguintes fatos:
1. se A e B são conexos por caminhos, A + B também é;
2. se A e B são conexos, A + B também é.
Exercício 8.18 Considere um espaço vetorial normado (V, ∥ · ∥V ). Dizemos que um conjunto
A ⊂ V é conexo por caminhos poligonais se, dados x0 , x1 ∈ A, podemos encontrar um k ∈ N\{0}
e pontos y0 = x0 , y1 , . . . , yk = x1 ∈ A tais que, para cada i = 0, 1, . . . , k − 1, o s segmentos de
reta [yi , yi+1 ] estão contidos em A. Prove que, se A ⊂ V é aberto é conexo, então A é conexo por
caminhos poligonais.
160
Exercício 8.19 Um espaço métrico (X, dX ) é localmente conexo por caminhos se para cada x ∈ X,
existe um δ0 > 0 tal que, dado qualquer δ ∈ (0, δ0 ), BX (x, δ) é conexa por caminhos. Mostre que,
se (X, dX ) é localmente conexo por caminhos, então qualquer A ⊂ X aberto e conexo também é
conexo por caminhos.
Exercício 8.20 Mostre que um espaço métrico (X, dX ) é conexo se a imagem de qualquer função
contínua f : X → R é um intervalo. Prove ainda que (X, dX ) é conexo e compacto se e somente se
a imagem de qualquer função contínua f : X → R é um intervalo compacto.
Exercício 8.21 Considere um espaço métrico (X, dX ). Dizemos que uma coleção F de subconjun-
tos F ⊂ X é combinatorialmente conexa se dada qualquer partição F = F0 ∪ F1 com F0 , F1 ̸= ∅ e
F0 ∪ F1 = F, existem F0 ∈ F0 e F1 ∈ F1 com F0 ∩ F1 ̸= ∅. Prove que se F é combinatorialmente
conexa e cada F ∈ F é conexo, então a união ∪F ∈F F é um subconjunto conexo de X.
161
162
Parte III
163
Capítulo 9
Preâmbulo
165
aproximação de f por uma função afim, isto é, a soma de uma função linear com uma
constante. A analogia natural para outros espaços é escrever
f (x + h) ≈ f (x) + A h
Observação 9.1 O leitor pode se perguntar porque não tentamos definir derivadas em espaços
ainda mais gerais, por exemplo, espaços métricos. Uma resposta possível é que a derivada é uma
tentativa de aproximar funções por somas de funções constantes e lineares, logo devemos trabalhar
num espaço em que isso faça sentido. Certamente há espaços métricos em que seria muito difícil
de se falar disso. No entanto, veremos neste curso que, ao menos em um caso particular – o das
subvariedades de Rd – será possível falar de derivadas por causa de uma estrutura linear local.
166
Capítulo 10
f (t + h) − f (t)
f ′ (t) := lim .
h→0 h
A definição é a mesma do caso real e podemos fazer algumas considerações gerais rela-
cionadas. Por exemplo, o fato abaixo decorre de que limites em Rd são sempre tomados
coordenada a coordenada.
Exercício 10.1 Mostre que, se V = Rd , então f ′ (t) existe se e somente se cada uma das funções
coordenadas f [i] é diferenciável em t. Neste caso,
f ′ (t) = (f ′ [i](t))di=1 .
167
Exercício 10.3 Fixe v ∈ V e uma função F : I → R diferenciável. Podemos definir uma nova
função f : I → W dada por:
f (t) := F (t) v (t ∈ I).
Supondo que F ′ (t) existe para um certo t ∈ I, mostre que f ′ (t) = F ′ (t) v.
Exercício 10.5 (Regra de Leibniz geral) Suponha que V, W, Z são espaços vetoriais com res-
pectivas normas ∥ · ∥V , ∥ · ∥W e ∥ · ∥Z . Neste exercício, supomos que B : V × W → Z é bilinear e
contínua. Eis alguns exemplos abaixo.
Exercício 10.6 Se f (t) = (t2 , t3 ), t ∈ [0, 1], vemos que f (1) − f (0) ̸= f ′ (θ) para qualquer
θ ∈ [0, 1].
O que podemos guardar do caso unidimensional é uma cota na magnitude de f (x)−f (y).
De fato, temos a Desigualdade do Valor Médio neste caso.
168
:DVMsimples Teorema 10.1 (Desigualdade do Valor Médio) Dados t, s ∈ I e f : I → V contínua em
I = [a, b] e diferenciável em (a, b), suponha que
M := sup ∥f ′ (x)∥V < +∞.
x∈(a,b)
169
Exercício 10.7 Prove que, para qualquer função diferenciável f : I → V ,
com
tP0 = a ≤ sP0 ≤ tP1 ≤ sP1 ≤ tP2 ≤ · · · ≤ tPnP ≤ sPnP ≤ tPnP +1 =: b.
Note a convenção de que tPnP +1 = b sempre. Informalmente, dividimos [a, b] em intervalos
[tPi , tPi+1 ] e escolhemos um ponto sPi em cada intervalo. O tamanho da partição P é definido
como |P | := max0≤i≤nP (tPi+1 − tPi ).
Definição 10.2 Dada uma função f : I → V e uma partição pontilhada P como acima, definimos
a soma de Riemann para f sobre a partição pontilhada P da seguinte maneira:
nP
X
s(f, P ) := (tPi+1 − tPi ) f (sPi ) ∈ V.
i=0
Dizemos que f é Riemann-integrável sobre [a, b] se existe um limite para as somas de Riemann
quando |P | → 0, ou seja, quando existe um elemento Iab (f ) ∈ V tal que, para qualquer sequência
{Pj }j de partições pontilhadas de [a, b],
170
Exercício 10.9 (Linearidade da integral) Prove a partir da definição que, se f, g : I → V são
Riemann-integráveis e λ ∈ R, então λf + g também é Riemann-integrável e
Z b Z b Z b
(λf (t) + g(t)) dt = λ f (t) dt + g(t) dt.
a a a
Observação 10.1 No caso de V = R, é costumeiro falar das somas de Riemann superior e inferior.
Não é possível fazer o mesmo em nosso caso geral porque não há uma ordem total natural para os
elementos de V .
b b
Z
Z
f (t) dt
≤
∥f (t)∥V dt ≤ (b − a) sup ∥f (t)∥V .
a V a t∈I
Esta prova será baseada num lema preliminar. Este lema nos permite comparar as
somas de Riemann de duas partições de tamanho pequeno.
de modo que:
• Existem índices j0P = 0 < j1P < · · · < jnPP +1 = k + 1 tais que tPi = rjiP para cada
i = 0, 1, 2, . . . , nP ;
• Existem índices j0Q = 0 < j1Q < · · · < jnPQ +1 = k + 1 tais que tPi = rj Q para cada
i
i = 0, 1, 2, . . . , nP .
171
Não provaremos que tal R existe porque isso é feito nos cursos de Análise na Reta.
Escreva:
Xk
S := f (rj ) (rj+1 − rj ).
j=0
o que claramente implica nosso objetivo. Faremos a conta apenas para P porque o caso
de Q é análogo.
Com nossa notação, temos a seguinte fórmula para S:
P−1
nP ji+1
X X
S= f (rj ) (rj+1 − rj ).
i=0 j=jiP
De fato, tudo que fizemos foi quebrar a soma em j de acordo com o índice i tal que
jiP ≤ j < ji+1
P
(é fácil ver que este índice existe e é único para cada j).
Agora observe que, para cada índice 0 ≤ i ≤ nP ,
P −1
ji+1
X
tPi+1 − tPi = rji+1
P − rjiP = (rj+1 − rj ).
j=jiP
Deduzimos que
P −1
P
ji+1
ji+1 −1
P X
X
(ti+1 − tPi )f (sPi ) − (rj+1 − rj )f (rj )
=
P
(rj+1 − rj )(f (si ) − f (rj ))
j=j P
j=j P
i V i V
≤ mf (|P |)(tPi+1 − tPi ).
Portanto,
P −1
nP
ji+1
nP
X
P X
X
P P
∥s(f, P ) − S∥V ≤
(ti+1 − ti )f (si ) −
(rj+1 − rj )f (rj )
≤ mf (|P |)
(tPi+1 − tPi ).
i=0
j=j P
i=0
i V
172
Prova: [Prova do Teorema]Note que o Lema anterior mostra que, dada qualquer sequência
{Pn }n∈N como acima, com δn := |Pn | → 0,
Exercício 10.11 Prove a partir das somas de Riemann que, se f ∈ C(I, V ) e P é uma partição
pontilhada,
Z b
∥s(f, P ) − f (t) dt∥V ≤ (b − a) mf (|P |).
a
173
Ou seja,
R y
x f (s) ds
≤ sup ∥f (s) − f (x)∥V ≤ mf (|y − x|) → 0 quando y → x.
y−x − f (x)
V s∈[x,y]
nuaintegral Exercício 10.15 Mostre que a operação I definida implicitamente no Teorema Fundamental do
Cálculo é uma aplicação linear contínua de C(I, V ) em C(I, V ).
Exercício 10.16 Considere espaços vetoriais (V, ∥ · ∥V ) e (W, ∥ · ∥W ) e T : V → W linear e
contínua. Mostre que, se f : [a, b] → V é diferenciável em t ∈ [a, b], então
(T f )′ (t) = T f ′ (t).
Exercício 10.17 (Série de Taylor) Suponha que f : I → V é k vezes diferenciável e que
f (k) (t0 ) existe num certo ponto t0 ∈ (a, b). Mostre que podemos escrever:
k
X f (j) (t0 )
∀h ∈ R com t0 ∈ h ∈ [a, b] : f (t0 + h) = f (t0 ) + hj + rk (h),
j=1
j!
174
Capítulo 11
No capítulo anterior, fizemos a parte fácil do trabalho de diferenciar funções com valores
vetoriais. O tema deste capítulo é considerar funções cujas entradas e valores podem ser
vetoriais. Apresentaremos os principais conceitos da teoria e veremos muitos exemplos
interessantes.
f (x + h) = f (x) + T h + rx (h)
para uma “função-resto" rx com ∥rx (h)∥W /∥h∥V → 0. De forma equivalente, pedimos que
rx (h) := f (x + h) − f (x) − T h satisfaça o seguinte:
Um ponto fundamental da definição acima é que Df (x) deve ser uma transformação
linear contínua, ou limitada:
175
parte do trabalho de provar que uma transformação linear T é a derivada de f em x é mostrar que
∥T ∥V →W < +∞.
Outra observação básica é sobre notação. Frequentemente usaremos o(h) para denotar
uma função de h ∈ V (com norma pequena) que satisfaz o(h)/∥h∥V → 0 quando ∥h∥V → 0.
Por isso, a propriedade do resto na definição de derivada será escrita como:
rx (h) = f (x + h) − f (x) − T h = o(h).
Usaremos esta notação abaixo sem muita preocupação.
Antes de prosseguirmos, notamos uma propriedade simples de uma função diferen-
ciável num ponto.
Exercício 11.1 Com V qualquer, note que, se f é diferenciável em x, então f também é contínua
em x.
A dica para provar isso é mostrar que uma função o(h) tende a 0W quando h → 0V
(isto é, “nem precisa" dividir por ∥h∥V ).
rechetunica Proposição 11.1 No contexto da definição acima, Suponha que S ∈ L(V, W ) satisfaz:
∥Rx (h)∥W
f (x + h) = f (x) + S h + Rx (h), com → 0,
∥h∥V
assim como T . Então S = T . De fato, para cada v ∈ V , vale:
f (x + tv) − f (x)
Sv = T v = lim .
t→+∞ t
Prova: Veja que S 0V = T 0V = 0W por linearidade. Se v ̸= 0V , podemos tomar h := tv,
notando que este vetor vai a 0V quando t → 0 e ∥tv∥V = |t|∥v∥V . Deduzimos que
f (x + tv) − f (x)
f (x + tv) − f (x) − T (tv)
= ∥rx (tv)∥ ∥v∥V → 0,
− T v
=
t
W
t
W ∥t v∥V
ou seja,
f (x + tv) − f (x)
T v = lim .
t→0 t
Repetindo a prova com S, deduzimos:
f (x + tv) − f (x)
Sv = lim .
t→0 t
2
176
Esta prova pode deixar o leitor com a pulga atrás da orelha. Afinal, acabamos de
mostrar que:
f (x + h) − f (x)
Df (x) v = lim
h→0 h
e o limite do lado direito é bem mais palatável do que a derivada que acabamos de definir.
De fato, ele tem um nome.
Proposição 11.2 (Prova omitida.) Quando a derivada de Fréchet Df (x) existe para um certo
x ∈ U , então as derivadas de Gâteaux também existem neste ponto e em todas as direções. Além
disso, Df (x).v = ∂v f (x) para todo v ∈ V .
A recíproca da proposição não é verdadeira: há casos em que ∂v f (x) existe para todo v, mas
f não é nem sequer contínua. Isso pode ocorrer mesmo quando V = R2 e W = R, como
mostra o exemplo abaixo.
É fácil ver que as derivadas direcionais ∂v f (0R2 ) existem e são todas iguais a 0. No entanto, f não
é nem sequer contínua em 0R2 . Por exemplo, se fazemos a(t) := (t, t3 ) (t > 0), vemos que a é
contínua, mas f ◦ a(t) → 1/2 ̸= f ◦ a(0) quando t → 0.
Uma explicação para esta discrepância é que as derivadas direcionais ∂v f (x) só ligam
para o comportamento de f ao longo de retas a partir de x. Por isso, elas não “enxer-
gam" eventuais descontinuidades de f sobre curvas.
Concluindo, a derivada de Fréchet é mais exigente que a de Gâteaux. Por essa razão, ela
tem propriedades melhores. Por exemplo, a existência de Df (x) implica continuidade de
f em x, e as derivadas de Fréchet satisfazem a regra da cadeia (discutida mais adiante). As
derivadas de Gâteaux são mais fracas e não garantem muita coisa sobre o comportamento
de f numa vizinhança de x. No entanto, a derivada de Gâteaux é mais simples de calcular:
começar com ela pode ser uma boa maneira de “adivinhar" quem deve ser a derivada de
Fréchet. Além disso, há situações em que sabemos de antemão que a derivada de Fréchet
existe: nestes casos, sabemos que calcular ∂v f (x) para cada v vai nos dizer quem é Df (x).
177
11.2 Alguns casos simples da derivada de Fréchet
11.2.1 Quando o domínio está na reta
Um caso simples desta definição se dá quando V = R e U ⊂ R é aberto. Neste caso, parece
natural definir a derivada como o limite usual.
f (x + h) − f (x)
f ′ (x) := lim .
h→0 h
Nesta seção mostraremos que a derivada de Fréchet coincide com esta definição por limite
a menos de um isomorfismo. A proposição a seguir esclarece o que seria este isomorfismo.
Proposição 11.3 Os espaços L(R, W ) e W são isomorfos como espaços vetoriais normados. Isto
é, há uma bijeção linear entre estes dois espaços que preserva normas. De fato, esta bijeção leva
T ∈ L(R, W ) em vT := T 1 ∈ W .
Prova: Neste teorema, estamos pensando em R como espaço vetorial normado sobre o
corpo R. Por esta razão, podemos pensar num elemento x ∈ R como o produto x.1 do
escalar x com o elemento 1 deste espaço vetorial. Isto nos leva à constatação de que
vT := T (1) define inteiramente a transformação T , já que, dado qualquer x ∈ R,
Agora argumentamos que a aplicação T 7→ vT nos dá uma bijeção linear de L(R, W ) com
W que preserva normas. Veja em primeiro lugar que, dados T, T ′ ∈ L(R, W ) e λ ∈ R,
Além disso, vT = 0W implica que T (x) = 0W para todo x ∈ W , ou seja, T = 0L(R,W ) . Isto
implica que T 7→ vT é injetiva. Temos ainda:
∥T x∥W ∥xvT ∥W
∥T ∥R→W = sup = sup = ∥vT ∥W .
x∈R\{0}R |x| x∈R\{0}R |x|
2. Existe o limite:
f (x + h) − f (x)
f ′ (x) := lim .
h→0 h
178
Além disso, quando f ′ (x) e Df (x) estão ambas definidas, temos f ′ (x) = Df (x)(1).
f (x + h) − f (x) − T h = f (x + h) − f (x) − h vT
O lema segue trivialmente desta última identidade já que um dos limites existe e é zero
se e somente se o outro também é. Isto é, vT = f ′ (x) se e somente se T = Df (x). 2
O leitor é convidado a provar isto diretamente, mas observamos que esta é uma
consequência da regra da cadeia.
179
coisas sobre como é Df (x), caso ela exista. Observe que, como W = R, se f : U → R é
diferenciável, então Df (x) ∈ L(Rd , R) é um funcional linear contínuo entre V = Rd e R.
Em particular, dado v ∈ Rd :
d
X d
X d
X
Df (x) v := Df (x) v[i]ei = vi (Df (x) ei ) = vi ∂i f (x).
i=1 i=1 i=1
Portanto, se existe Df (x), então o vetor gradiente ∇f (x) = (∂i f (x))di=1 determina essa
derivada, no sentido que Df (x) · v = ∇f (x) · v para cada v ∈ Rd . Esta conclusão, no
entanto, não responde nossa pergunta anterior, que é se podemos saber que Df (x) existe
a partir das derivadas parciais.
O resultado a seguir nos diz que, se as derivadas parciais são contínuas numa vizinhança
de x, isso é suficiente para garantir que Df (x) existe.
Prova: A ideia da prova é usar o Teorema do Valor Médio, que diz que, se g : I → R é
diferenciável num intervalo I e a, a + t ∈ I, então existe um ponto s com |s| ≤ |t|, a + s ∈ I
e g(a + t) − g(a) = g ′ (a + s) t.
Vamos aplicar este resultado às derivadas parciais que, no final das contas, são de-
rivadas em uma variável. Tome r > 0 tal √ que as derivadas
√ parciais de f existem em
BRd [x, r] ⊂ R . Veja que, se Ii := [x[i] − r/ d, x[i] + r/ d], então
d
que √para cada o vetor i=1 h[i] ei ∈ Q também tem coordenadas entre
Pj
√ j ∈ [d] ∪ {0} h j :=
−r/ d e r/ d. Portanto, x + hj ∈ Q para cada um destes j e podemos escrever uma soma
telescópica.
Xd
f (x + h) − f (x) = (f (x + hj ) − f (x + hj−1 )).
m=1
Como x + hj = x + hj−1 + h ej para cada j ∈ [d], podemos encontrar um valor h̃(j) entre
(j)
180
Deduzimos que
d
X
f (x + h) − f (x) = h(j) ∂j f (x + h̃j ).
m=1
Para terminar a prova, definimos ∇f (x) como o vetor das derivadas parciais. Veja que:
d
X
f (x + h) − f (x) − ∇f (x) · h = rx (h) := h(j) (∂j f (x + h̃j ) − ∂j f (x)).
m=1
Por Cauchy-Schwartz,
v
u d
uX
|rx (h)| ≤ |h|2 t (∂j f (x + h̃j ) − ∂j f (x))2 .
j=1
Veja que |h̃j |2 ≤ |hj |2 ≤ |h|. Deste modo, quando h → 0, cada h̃j converge a 0. Podemos
combinar isto com nossa hipótese de continuidade das derivadas parciais e concluir que
o termo da raíz quadrada acima vai a 0. Portanto:
v
u d
|rx (h)| u X
≤t (∂j f (x + h̃j ) − ∂j f (x))2 → 0.
|h|2 m=1
3. todas as derivadas parciais de ∂i f (x) existem para qualquer x ∈ U e, além disso, as derivadas
parciais dependem continuamente de x.
No entanto, o exercício abaixo mostra que a derivadada de Fréchet pode existir mesmo
quando as derivadas parciais não são contínuas.
Prove que esta função é Fréchet diferenciável em 0R2 , mas não tem derivadas parciais contínuas
neste ponto.
181
11.2.4 O caso em que W tem dimensão finita
Também neste caso consideraremos apenas W = Rk . Neste caso, é possível mostrar o
seguinte resultado.
Isto é, Jac(f )(x) ∈ Rk×d é a matriz que representa Df (x) ∈ L(Rd , Rk ) na base canônica.
Exercício 11.7 Quando V = Rd , W = Rk , f é como acima, x ∈ U , Jac(f )(·) está definida numa
vizinhança de x e é contínua em x, então f é Fréchet-diferenciável em x.
está bem definida para qualquer x ∈ U e depende continuamente de x (o que é o mesmo que
dizer que suas entradas dependem continuamente de x).
Exercício 11.9 (Coordenadas polares) Podemos escrever cada vetor x ∈ Rd \{0Rd } na forma
r v, onde r := |x|2 > 0 e v := x/|x|2 ∈ Sd−1 . Note ainda que para cada v deste tipo há um único
vetor ṽ ∈ Rd−1 tal que v[i] = ṽ[i] para 1 ≤ i ≤ d − 1. Calcule a jacobiana da transformação que
leva x em (r, ṽ) ∈ R × Rd−1 ≡ Rd . Calcule ainda o determinante dessa transformação.
182
11.2.5 A derivada do determinante
Seção sendo escrita. Ao menos em princípio, as fórmulas acima nos permitem calcular as
derivadas de Fréchet para todas as funções entre espaços vetoriais. No entanto, há muitos
casos em que é mais fácil e mais interessante partir diretamente da definição. Veremos
alguns exemplos disso a seguir.
Exemplo 11.2 Considere a função det : Rd×d → R. Qual é a sua derivada em A ∈ Rd×d ?
Tratando Rd×d ∼
2
= Rd
Aqui aproveitamos a relação entre Rd×d e Rd . Note que o produto interno natural entre
2
onde tr é o traço (soma das entradas diagonais). Adaptando a prova que vimos para Rd ,
sabemos que a existência da derivada de Fréchet em todo ponto garante que:
∂det(A)
∇det(A)[i, j] = (1 ≤ i, j ≤ d).
∂A[i, j]
C(A)T
det(A) ̸= 0 ⇒ A−1 = . (11.1) eq:determin
det(A)
183
Além disso, sabemos que o determinante pode ser escrito a partir dos elementos da
linha i da matriz A e dos cofatores correspondentes.
d
X d
X
det(A) = A[i, k] C(A)[i, k] = (−1)i+k A[i, k] det(Aik ).
k=1 k=1
Agora tomamos a derivada parcial da fórmula acima na variável A[i, j]. Note que as
matrizes Aik não incluem a entrada A[i, j] porque a linha i for omitida de cada uma delas.
Por isso, os termos A[i, k] det(Aik ) com k ̸= j tem derivada parcial 0 com respeito a A[i, j].
Portanto:
∂det(A) ∂
= A[i, j] C(A)[i, j] = C(A)[i, j].
∂A[i, j] ∂A[i, j]
Concluímos que:
∇det(A) = C(A)
e que
Ddet(A) H = tr(C(A)T H). (11.2) eq:Ddetgera
Em particular, a equação (11.1) nos diz que:
Deduzimos que:
det(I + ε A−1 H) − 1
Ddet(A) H = det(A) lim .
ε→0+ ε
Para facilidar, escrevemos ∆ := A−1 H. Note que o limite acima é igual a:
det(I + ε A−1 H) − 1
lim = Ddet(I) ∆.
ε→0+ ε
184
Isto é, estamos calculando uma derivada de Fréchet (ou de Gâteaux, tanto faz) no ponto
I ∈ Rd×d .
Para calcular este limite, lembramos desta vez que o determinante é uma função
multilinear das colunas da matriz ∆. Para usar isso da melhor maneira, usamos a seguinte
notação: se (v1 , . . . , vd ) ∈ (Rd )d são dados, det(v1 , . . . , vd ) é o determinante da matriz com
colunas (v1 , . . . , vd ). Desta forma, se chamamos de ∆j a j-ésima coluna de ∆,
det(I + ε ∆) = det(I)
+ε (det(∆1 , e2 , . . . , ed−1 , ed ) + det(e1 , ∆2 , . . . , ed−1 , ed ) + · · · + det(e1 , e2 , . . . , ed−1 , ∆d ))
Xd
+ ε k ck ,
k=2
det(I + ε A−1 H) − 1
lim = det(∆1 , e2 , . . . , ed−1 , ed )+det(e1 , ∆2 , . . . , ed−1 , ed )+· · ·+det(e1 , e2 , . . . , ed−1 , ∆d )
ε→0+ ε
Cada matriz na soma do lado direito coincide com a identidade exceto na coluna j, que
é igual a ∆j . É um exercício mostrar que o determinante de uma matriz deste tipo é
∆j [j] = ∆[j, j]. Portanto,
det(I + ε A−1 H) − 1
lim = ∆[1, 1] + ∆[2, 2] + · · · + ∆[d, d] = tr(∆).
ε→0+ ε
Lembrando que ∆ = A−1 H e combinando com as igualdades anteriores, chegamos
novamente à fórmula (11.3). Para A ∈ Rd×d inversível, ela implica que Ddet(A) H =
tr(C(A)T H). Como C(A) depende continuamente de A; as matrizes inversíveis são den-
sas em Rd×d ; e sabemos que Ddet(A) depende continuamente de A, concluímos que a
fórmula mais geral (11.2) vale para todas as matrizes A ∈ Rd×d e qualquer H ∈ Rd×d .
Exercício 11.10 Descreva e justifique em detalhes o que aconteceu na última etapa da demonstra-
ção.
185
11.3 Boas propriedades da derivada de Fréchet
Nesta seção damos substância ao que já dissemos acima: a derivada de Fréchet tem boas
propriedades teóricas. Os dois teoremas desta seção nos dizem que ela satisfaz uma regra
da cadeia e uma desigualdade assemelhada ao Teorema do Valor Médio.
Teorema 11.2 (Regra da cadeia) Suponha que (V, ∥ · ∥V ), (W, ∥ · ∥W ) e (Z, ∥ · ∥Z ) são espaços
vetoriais normados. Suponha que UV ⊂ V e UW ⊂ W são abertos, que f : UV → UW e
g : UW → Z. Fixos x ∈ UV e y = f (x) ∈ UW , suponha que as derivadas de Fréchet Df (x) e
Dg(y) existem. Então a derivada de g◦f em x também existe e é dada pelo produto de transformações
lineares Dg ◦ f (x) = Dg(y) Df (x).
hy = Df (x) h + rx (h).
Concluímos que:
Esta fórmula deixa clara a nossa missão: queremos provar que o termo Ry (hy ) + rx (h) se
comporta como esperamos de um resto. Ou seja, queremos que
e controlar o segundo termo. De fato, como Dg(y) é uma transformação linear limitada,
186
Ainda nos falta mostrar que ∥Ry (hy )∥Z /∥h∥X também converge a 0. Tome ε > 0
qualquer. Como ∥Ry (a)∥Z /∥a∥V → 0 quando a → 0 sabemos que existe um δ > 0 tal que,
teauxcadeia Observação 11.1 É instrutivo ver em um exemplo de que o resultado acima falha quando usamos
derivadas direcionais ao invés das de Fréchet. Considere a função f ◦ a do Exemplo 11.1 acima.
Veja que a, além de contínua, é diferenciável. Além disso, f tem derivadas direcionais ∂v f (x) para
todos x, v ∈ R2 . Apesar disso, a função f ◦ a não é diferenciável em 0R2 ; de fato, ela não é sequer
contínua. Isto tem a ver com os comentários depois do Exemplo 11.1: as derivadas direcionais não
se comportam bem quando calcularmos f ao longo de certas curvas indo para 0R2 . Já Fréchet não
sofre deste problema, o que foi importante na prova acima porque hy é uma função não-linear de h.
187
Veja que m está bem definida para ε > 0: como [x, y] ⊂ U e U é aberto, existe um ε positivo
tal que m(t) ∈ U para todo t ∈ (−ε, 1 + ε). Além disso, m é diferenciável, com derivada:
m′ (t) = (y − x).
Por sua vez, a desigualdade do valor médio para funções de [0, 1] em W (Teorema 10.1 acima)
nos garante que:
cor:DVM Corolário 11.1 (Aproximação afim quando a derivada muda pouco) Suponha que f : U →
W como acima. Dados x ∈ U e r > 0 com BV (x, r) ⊂ U , suponha que f é diferenciável na bola
BV (x, r) e que
sup ∥Df (x′ ) − Df (x)∥V →W ≤ α.
x′ ∈BV (x,r)
Prova: Isso segue de aplicar a desigualdade do valor médio à função f (x′ ) − g(x′ ) a cada
par x′ , x′′ ∈ BV (x, r), notando que [x′ , x′′ ] ⊂ BV (x, r) por convexidade e que
188
11.4 Derivadas mais complicadas de se calcular
Encerramos este primeiro capítulo sobre a derivada de Fréchet calculando derivadas de
funções que não são tão simples assim. O primeiro exemplo corresponde a funções de
operadores lineares e o segundo tem relação com o problema de existência e unicidade
para EDOs. O que estes exemplos têm em comum é que calcular as derivadas parciais
não parece ser mais simples que obter diretamente a derivada de Fréchet.
• A aplicação que leva um T ∈ L(X) em T −1 ∈ L(X) (no caso de T ser uma bijeção e
T −1 ser limitado).
Mostraremos “no braço" que estas funções são diferenciáveis. Observe que isto envolve
encontrar operadores lineares A ∈ L(L(X), L(X))! Isso pode parecer estranho, mas
veremos que não há nada muito sério quando consideramos os casos concretos.
Nossas estiamtivas usarão muito a submultiplicatividade da norma de operador:
Potências de operadores
Comecemos pela derivada de fk (T ) := T k .
(T + H)k := (T + H) (T + H) . . . (T + H) .
| {z }
k vezes
189
Para calcular o produto, devemos usar a propriedade distributiva. Ela diz que (T + H)k é a
soma de todos os 2k produtos de sequências do tipo T HT T HHH . . . HT H com exatamente
k termos.
Agruparemos estas sequências pelo número de vezes em que H aparece. Primeira-
mente, há exatamente uma sequência em que H aparece 0 vezes: T T T . . . T = T k .
Considere agora k sequências em que H aparece exatamente 1 vez. Elas são da forma
T . . T} H |T T {z
| .{z . . . T}
j termos j − k − 1 termos
Note que, para cada T ∈ L(X), Ak (T ) : L(X) → L(X) é um operador linear. Ele é
limitado,porque, pela submultiplicatividade da norma de operador,
k−1
X
∥Ak (T ) H∥X→X ≤ ∥T ∥jX→X ∥H∥X→X ∥T ∥X→X
k−1−j
= k ∥T ∥k−1
X→X ∥H∥X→X . (11.4) eq:Akestima
j=0
190
Concluímos que
k
∥(termos do produto com n ocorrências de H)∥X→X ≤ ∥H∥nX→X ∥T ∥k−n
X→X .
n
Somando estas cotas, obtemos:
k
X k
∥rT (H)∥X→X ≤ ∥H∥nX→X ∥T ∥k−n
X→X
n=2
n
Portanto,
k(k − 1)
∥rT (H)∥X→X ≤ (t + h)k−2 h2 .
2
Isto finalmente nos permite concluir que ∥rT (H)∥/∥H∥ → 0 quando H → 0. De fato,
temos o seguinte resultado.
rT (H) := (T + H)k − T k − Ak (T ) H
satisfaz:
k (k − 1)
∥rT (H)∥X→X ≤ (∥T ∥X→X + ∥H∥X→X )k−2 ∥H∥2X→X .
2
Inversas de operadores
Temos agora um exemplo para tratar em que teremos muito mais trabalho.
Chame de U ⊂ L(X) o conjunto de todos os T que têm inversa T −1 ∈ L(X). Ou seja,
T ∈ L(X) se T é limitado, é uma bijeção de X em X e tem uma inversa satisfazendo
T −1 T = T T −1 = IX que também é um operador linear limitado. Nosso objetivo será
mostrar o seguinte resultado.
191
vadainversa Teorema 11.5 U é aberto de L(X). A função Inv : U → L(X) que leva T ∈ U em T −1 é
diferenciável e DInv(T ) H = −T −1 HT −1 .
Vamos começar com uma observação simples, que deixamos como exercício.
Lema 11.2 A bola aberta BL(X) (I, 1) está contida em U. Além disso
X
∀A = I + H ∈ BL(X) (I, 1) : A−1 = Inv(I + H) = (−H)n .
n∈N
portanto n∈N (−H)n converge. Como a operação de tomar produtos em L(X) é contínua
P
(exercício), temos
X n
X
n
(I + H) (−H) = (I + H) lim (−H)j
n→+∞
n∈N j=0
n
X
= lim (I + H) (−H)j
n→+∞
j=0
Xn
= lim [(−H)j + (−1)j H j+1 ]
n→+∞
j=0
Xn
= lim [(−H)j − (−H)j+1 ]
n→+∞
j=0
192
Pelo exercício anterior, descobrimos que
X
(A + H)−1 = [A (I + A−1 H)]−1 = (−A−1 H)j A−1 .
n∈N
DA : H 7→ −A−1 HA−1
quando H → 0. 2
193
Exercício 11.14 Prove que U é aberto de C(I, Rd ). (Dica: mostre primeiramente que
Se você não conseguir, tudo bem: há uma prova deste fato implícita na proposição abaixo!)
Veja que este operador está bem definido porque Ψ(t, f (t)) é contínua em t sempre que
f ∈ U. Como sabemos, a importância deste operador reside no fato que os seus pontos
fixos (se existem) são precisamente as soluções de ξ ′ (t) = Ψ(t, ξ(t)) com ξ(t0 ) = x0 .
Quando estudarmos o problema de existência para EDOs, vimos que T : U → C(I, R)
é contínua. Veremos agora que, sob hipóteses adicionais, esta aplicação é diferenciável e
calcularemos a sua derivada.
derivadaEDO Proposição 11.4 Dados (t, x) ∈ I × U , defina Dx Ψ(t, x) como a derivada da função em x ∈ U ,
com t mantido fixo. Suponha que esta derivada existe para todo par (t, x) ∈ I × U e que, além disso,
ela depende continuamente de (t, x). Então T é diferenciável em qualquer f ∈ U. Além disso, se
v ∈ C(I, Rd ),
DT (f ) ∈ L(C(I, R))
existe e é igual ao operador linear que leva v ∈ C(I, R) na função
Z t
(DT (f ) v)(t) := Dx Ψ(s, f (s)) v(s) ds (t ∈ I).
t0
194
O que sabemos, em princípio, é que Ψ é diferenciável em x, portanto podemos escrever:
F (f + h)(t) − F (f (t)) = Ψ(t, f (t) + h(t)) − Ψ(t, f (t)) = Dx Ψ(t, f (t)) h(t) + r(t,f (t)) (h(t)).
No entanto, isso não resolve nosso problema, porque precisamos mostrar uma convergên-
cia uniforme. Ou seja, a definição da derivada para funções F : U → C(I, Rd ) nos obriga a
mostrar que o termo de resto satisfaz
t ∈ I 7→ dRd (f (t), U c )
Portanto, se 0 < R < R0 , garantimos que o conjunto K em (11.5) realmente está contido
em U . Note que, se h ∈ C([a, b], V ) e ∥h∥∞ ≤ R, então (t, f (t) + h(t)) ∈ K para cada t,
portanto f + h ∈ U.
(Note que acabamos de provar “sem querer" que há uma bola BC(I,Rd ) [f, R] ⊂ U.
Notando que podemos achar um R > 0 para cada f ∈ U, provamos que U é aberto!)
Tendo o compacto K, queremos usar a continuidade uniforme de Dx Ψ |K . Tome um
(t, a), (t, b) ∈ K com |b−a| ≤ δ. Pelo corolário 11.1 acima (aplicado com x′ = a e x′′ = a+b),
195
onde
c(δ) := sup |Dx Ψ(t, a) − Dx Ψ(t, b)|.
(t,a),(t′ ,b)∈K : |(t′ ,b)−(t,a)|2 ≤δ
∀t ∈ I : |Ψ(t, f (t) + h(t)) − Ψ(t, f (t)) − Dx Ψ(t, f (t)) h(t)|2 ≤ c(∥h∥∞ ) ∥h∥∞ ,
ou
∥F (f + h) − F (f ) − Dx Ψ(·, f (·)) h(·)∥∞ ≤ c(∥h∥∞ ) ∥h∥∞ .
Portanto,
∥F (f + h) − F (f ) − Dx Ψ(·, f (·)) h(·)∥∞
≤ c(∥h∥∞ ) → 0 quando h → 0.
∥h∥∞
Isto demonstra que a derivada DF (f ) existe e é igual ao que dissemos que ela era.
Para terminar, observamos que esta derivada é contínua: se {fn }n∈N ⊂ C(I, Rd ) e
fn → f , temos (t, fn (t)) ∈ K para todo t e todo n grande, e aí vemos que
∥DF (fn ) − DF (f )∥L(C,C) = sup ∥(Dx Ψ(·, fn (·)) − Dx (Ψ(·, f (·)))) h(·)∥∞
h∈C, ∥h∥∞ ≤1
Observação 11.2 O mesmo argumento que demos acima prova algo a mais. Considere um
compacto K ⊂ I × U ⊂ Rd+1 . Em primeiro lugar, vemos que existe uma função não-decrescente
c = c(δ) ≥ 0 com limδ→0 c(δ) = 0 tal que
∀(t, a), (t, b) ∈ K : |Ψ(t, a + δ) − Ψ(t, a) − Dx Ψ(t, a) (b − a)|2 ≤ c(|b − a|2 ) |b − a|2 .
Agora chame de
K := {f ∈ C(I, Rd ) : ∀t ∈ I, (t, f (t)) ∈ K}.
Neste caso, temos a estimativa:
∀t ∈ I, ∀f, f + h ∈ K : |Ψ(t, f (t) + h(t)) − Ψ(t, f (t)) − Dx Ψ(t, f (t)) h(t)|2 ≤ c(∥h∥∞ ) ∥h∥∞ ,
196
o que se traduz em
∀f, f + h ∈ K : ∥F (f + h) − F (f ) − DF (f ) h|2 ≤ c(∥h∥∞ ) ∥h∥∞ ,
e
∀f, f + h ∈ K : ∥T (f + h) − T (f ) − DT (f ) h|2 ≤ (b − a) c(∥h∥∞ ) ∥h∥∞ ,
já que T = I ◦ F , DT = I ◦ DF e a norma de operador de I é ≤ (b − a).
Ou seja: o permanente é “quase igual" ao determinante, mas não aparecem os sinais alternados na
fórmula. (Estranhamente, isso o torna mais difícil de calcular, mas muito útil em certos modelos da
Mecânica Estatística.) Mostre que per : Rd×d → R é Fréchet-diferenciável e calcule sua derivada.
197
Exercício 11.20 Considere espaços vetoriais normados (V, ∥·∥V ) e (Wi , ∥·∥Wi ) para i = 1, 2, . . . , k.
Defina o espaço produto W := W1 ×W2 ×· · ·×Wk com uma das normas-produto que já estudamos.
Dado um aberto U ⊂ V , considere funções fi : U → Wi , com i = 1, . . . , k. Construa uma nova
função f : U → W que leva x ∈ U na k-tupla f (x) = (fi (x))ki=1 ∈ W . Mostre que f é
diferenciável em um certo x ∈ U se e somente se cada fi é diferenciável em x e calcule a derivada de
Fréchet de f em termos das derivadas Dfi (x).
Exercício 11.21 (“Regra de Leibniz" para derivada de Fréchet) Continue com a notação acima
e acrescente um novo espaço vetorial normado (Z, ∥ · ∥Z ) e uma Q : W → Z k-linear e limitada.
Defina F : U → Z através da fórmula:
Mostre que, se todas as fi são diferenciáveis num certo x ∈ U , então DF (x) existe. Além disso,
calcule DF (x).
Exercício 11.22 Neste problema, (X, ∥ · ∥X ) é um espaço vetorial normado completo e L(X) é
o espaço dos operadores lineares limitados de X em X. Considerand uma sequência {an }n∈N ,
queremos encontrar condições sob as quais a série de potência
X
f (T ) := an T n
n∈N
define uma função diferenciável sobre uma vizinhança de 0 em L(X). Como no caso de séries de
potência reais, definimos o raio de convergência:
198
Capítulo 12
Suponhamos agora que Df (x) está definida para todo x, de modo que Df : U → L(V, W ).
(L(V, W ), ∥ · ∥V →W ) também é um espaço vetorial normado.
No cálculo em uma dimensão, a segunda derivada é tão somente a “derivada da
derivada". Isso continua a fazer sentido aqui e podemos dizer que a segunda derivada de
f em x, se existir, tem de ser uma transformação linear limitada D2 f (x) ∈ L(V, L(V, W ))
tal que:
∥Df (x + h) − Df (x) − D2 f (x) h∥V →W
lim = 0.
h→0 ∥h∥V
Do mesmo modo, se D2 f : U → L(V, W ) está definida em todo U , a terceira derivada em
x, se existir, deve ser uma transformação linear limitada D3 f (x) ∈ L(V L(V, L(V, W ))) tal
que
∥D2 f (x + h) − D2 f (x) − D3 f (x) h∥V →L(V,W )
lim = 0.
h→0 ∥h∥V
Poderíamos continuar com estas fórmulas ligeiramente estranhas, mas antes devemos
parar e pensar:
199
o que está acontecendo aqui?
Nada do que fizemos aqui está errado, mas a derivada que definimos não se presta a
uma compreensão muito intuitiva. Vamos pensar atentamente no que ela quer dizer para
compreendê-la um pouco melhor.
O que esta função tem de especial é que ela é bilinear. De fato, o que vemos é que a cada
T : V → L(V, W ) podemos associar uma transformação bilinear BT : V 2 → W . De fato, o
seguinte resultado é fácil de provar.
200
rmabilinear Exercício 12.1 A aplicação que leva T em BT é uma bijeção linear entre o conjunto das transfor-
mações lineares
T : V → {transformações lineares de V em W }
e o conjunto das transformações bilineares B : V 2 → W . Dica: observe que a inversa de
“T 7→ BT " leva uma transformação bilinear B : V 2 → W em
TB : v ∈ V 7→ B(v, ·).
Se seguimos este raciocínio, descobrimos que a norma adequada sobre L(V, L(V, W )) é:
!
∥T (v)∥V →W ∥T (v)v ′ ∥W
∥T ∥V →L(V,W ) = sup = sup sup ′
(T ∈ L(V, L(V, W ))).
v∈V \{0V } ∥v∥V v∈V \{0V } v ′ ∈V \{0V } ∥v∥V ∥v ∥V
op:trocasup Proposição 12.1 Para qualquer transformação linear T : V → L(V, W ) (não necessariamente
limitada),
∥BT (v, v ′ )∥V →W
∥T ∥V →L(V,W ) = sup ;
(v,v ′ )∈(V \{0V })2 ∥v∥V ∥v ′ ∥V
Ou seja, na definição acima, não importa se tomamos o supremo primeiro em v ou em v ′ . (Nos dois
casos admitimos a hipótese de que ∥T ∥V →L(V,W ) pode ser infinito.)
Prova: Defina
′ ∥BT (v, v ′ )∥V →W
a(v, v ) := .
∥v∥V ∥v ′ ∥V
Nosso objetivo é provar que
201
Prova: Chame de S o supremo do lado direito. Veja que, por definição:
∀a ∈ A ∀b ∈ B : h(a, b) ≤ S
e portanto, para cada a ∈ A fixo, S é cota superior para os valores de h(a, b),
b ∈ B. Deduzimos que
∀a ∈ A : sup h(a, b) ≤ S
b∈B
e portanto
sup sup h(a, b) ≤ S.
a∈A b∈B
Ou seja,
sup sup h(a′ , b′ ) é cota superior para os valores de h(a, b), (a, b) ∈ A × B.
a′ ∈A b′ ∈B
Deduzimos que
2
Podemos agora concluir esta subseção com um exercício e um teorema.
Exercício 12.2 Mostre que L2 (V, W ) é um espaço vetorial e que ∥ · ∥V 2 →W é uma norma sobre este
espaço.
isobilinear Teorema 12.1 A aplicação que associa cada T ∈ L(V, L(V, W )) a BT ∈ L2 (V, W ) é um isomor-
fismo de espaços lineares normados. Isto é, “T 7→ BT "é uma bijeção linear e
Prova: Este teorema basicamente já foi provado acima. Falta apenas juntar os pedaços.
O último exercício mostra que (L2 (V, W ), ∥ · ∥V 2 →W ) é um espaço vetorial normado. O
exercício 12.1 nos diz que “T 7→ BT " é bijeção linear (e portanto tem inversa linear).
Finalmente, a proposição 12.1 garante que esta transformação preserva normas. 2
202
12.2.2 A segunda derivada é bilinear
Recorde que estávamos considerando a segunda derivada de f : U ⊂ V → W . Tudo o que
acabamos de ver nos diz que temos duas formas completamente equivalentes de pensar
na segunda derivada.
De fato, no lado esquerdo da expressão pensamos em D(Df )(x) ∈ L(V, L(V, W )).
Aplicamos este objeto a h1 e obtemos D2 f (x)(h1 ) ∈ L(V, W ), aí tomamos o resultado, que
é uma transformação linear, e o aplicamos a h1 . Do lado direito, D2 f (x) é simplesmente
vista como transformação bilinear. Um fato que será importante a seguir é que toda forma
bilinear limitada tem uma derivada. Para isso, é bom lembrar de que, como já vimos
anotes, o conjunto
V 2 := {(v1 , v2 ) : v1 , v2 ∈ V }
tem uma estrutura natural de espaço vetorial (com operações coordenada a coordenada)
e pode ser dotado da norma
Uma outra observação importante é que a segunda derivada pode ser calculada de
uma forma mais direta, sem passar explicitamente pelo isomorfismo.
onde
∥R(h1 , h2 )∥V →W
sup → 0 quando h1 → 0V . (12.1) eq:frechet2
h2 ∈V ∥h1 ∥V ∥h2 ∥V
Então Q = D2 f (x0 ).
203
Prova: O isomorfismo garante que existe TQ ∈ L(V, L(V, W )) com TQ (h1 ) h2 = Q(h1 , h2 ).
Voltando à equação acima, temos que, para um dado h1 fixo:
∥R(h1 )∥V →W ≤ ∥Df (x0 + h1 )∥V →W + ∥Df (x0 )∥V →W − ∥TQ (h1 ))∥V →W < +∞.
Veja que a expressão acima tem “cara de derivada de Fréchet.” Se escrevemos Z := L(V, W )
e F := Df , então F : U ⊂ V → Z, TQ ∈ L(V, Z) e vale a identidade acima. Além disso,
R(h1 ) = o(h1 ) porque
D(Df )(x0 ) = TQ ,
e aplicando o isomorfismo entre L(V, (V, W )) e L2 (V, W ), deduzimos que D(Df )(x0 ) = Q.
2
Exemplo 12.1 Usamos a proposição acima para calcular a fórmula da segunda derivada da apli-
cação que calcula a inversa de um operador A ∈ L(X), como visto no Teorema 11.5. Em particular,
usamos a notação empregada naquele teorema
Ou seja:
(A + H)−1 = A−1 − A−1 HA−1 + R(A, H)
204
onde
∥R(A, H)∥X→X
→ 0 quando H → 0L(X) .
∥H∥X→X
Agora considere
DInv(A + H1 ).H2 = −(A + H1 )−1 H2 (A + H1 )−1 .
Aplicando a fórmula anterior, temos que
(A+H1 )−1 H2 (A+H1 )−1 = (A−1 −A−1 H1 A−1 +R(A, H1 )) H2 (A−1 −A−1 H1 A−1 +R(A, H1 )).
Podemos aplicar a propriedade distributiva a este produto de operadores. Definindo
QA : (H1 , H2 ) ∈ L(X)2 7→ A−1 H2 A−1 H1 A−1 + A−1 H1 A−1 H2 A−1
e aplicando doses iguais de cuidado e paciência, chegamos à seguinte expressão:
DInv(A + H1 ).H2 = DInv(A).H2 + QA (H1 , H2 ) + R(H1 , H2 ), onde
R(H1 , H2 ) := −A−1 H2 R(A, H1 ) − R(A, H1 ) H2 A−1
−A−1 H1 A−1 H2 A−1 H1 A−1 + A−1 H1 A−1 H2 R(A, H1 )
+R(A, H1 ) H2 A−1 H1 A−1 + A−1 H1 A−1 H2 R(A, H1 )
−R(A, H1 ) H2 R(A, H1 ).
É um exercício checar que QA ∈ L2 (L(X), L(X)). O termo R(H1 , H2 ) pode ser cotado
tomando-se a soma das normas dos vários termos e usando aub-multiplicatividade para
se lidar com as normas dos termos resultantes. Isso nos dá:
∥R(H1 , H2 )∥X→X ≤ 2∥A−1 ∥X→X ∥H2 ∥X→X ∥R(A, H1 )∥X→X
+∥A−1 ∥3X→X ∥H1 ∥2X→X ∥H2 ∥X→X
+2∥A−1 ∥2X→X ∥H1 ∥X→X ∥H2 ∥X→X ∥R(A, H1 )∥X→X
+∥R(A, H1 )∥2X→X ∥H2 ∥X→X .
Dividindo os dois lados por ∥H1 ∥X→X ∥H2 ∥X→X , obtemos do lado direito algo que não
depende de ∥H2 ∥X→X . Logo, se H1 ̸= 0L(X) , temos:
∥R(H1 , H2 )∥X→X ∥R(A, H1 )∥X→X
sup ≤ C1
H2 ∈L(X)\{0L(X) } ∥H1 ∥X→X ∥H2 ∥X→X ∥H1 ∥X→X
+C2 ∥H1 ∥X→X
+C3 ∥R(A, H1 )∥X→X
∥R(A, H1 )∥2X→X
+ ,
∥H1 ∥X→X
onde C1 , C2 , C3 > 0 não dependem de H1 . O fato de que R(A, H1 ) = o(H1 ) implica que o
lado direito vai para 0 quando H1 → 0L(X) . Portanto,
∥R(H1 , H2 )∥X→X
lim sup = 0,
H1 →0L(X) H2 ∈L(X)\{0
L(X) }
∥H1 ∥X→X ∥H2 ∥X→X
o que implica, pela proposição anterior, que D2 Inv(A) = QA .
205
12.2.3 Simetria da segunda derivada (quando contínua)
Agora vamos mostrar que, sob condições de continuidade, a derivada segunda é simétrica
em seus argumentos.
Mostraremos que
ϕ(t, s)
→ D2 f (x)(v ′ , v) quando t, s → 0.
ts
Isto nos bastará porque, trocando os papéis de v e v ′ (ou de t e s) em ϕ, também obtemos
ϕ(t, s)
→ D2 f (x)(v, v ′ ) quando t, s → 0
ts
o que nos dá a simetria desejada pela unicidade do limite.
Considere então
Podemos cotar a norma deste termo usando a desigualdade do valor médio aplicada
ao termo dentro do colchete como função de θ.
É importante pararmos para fazer esta parte da conta com atenção. Pela Regra da
Cadeia, a derivada em θ é exatamente:
L(V, L(V, W )) ∼
= L(V, L(V, W ))
para passar de D2 f (x) ∈ L2 (V, W ) para D(Df )(x) ∈ L(V, L(V, W )). deste modo,
D(Df )f (x)(v ′ ) ∈ L(V, W ) correspondente. Esta passagem é conveniente para a conta,
206
pois teremos que diferenciar Df : U → L(V, W ) e a derivada D(Df )(x)L(V, L(V, W ))
ocorrerá naturalmente.
Voltando à conta acima, concluímos que:
Observe agora que para cada θ ∈ [0, t] fixo, podemos aplicar a desigualdade do valor
médio a
use
L2 (V, W ))
= |s|∥v ′ ∥ ∥D2 f (x + θ v + ηv ′ ) − D2 f (x)∥V 2 →W
∼
=
L(V, L(V, W ))
≤ |s| ∥v ′ ∥V sup ∥D2 f (x′ ) − D2 f (x)∥V 2 →W
|x′ −x|≤|t|∥v∥+|s|∥v ′ ∥
∥ϕ(t, s) − tsD2 f (x) (v ′ , v)∥W ≤ |ts| ∥v∥V ∥v ′ ∥V sup ∥D2 f (x′ ) − D2 f (x)∥V 2 →W .
|x′ −x|≤|t|∥v∥+|s|∥v ′ ∥
207
12.2.4 Derivadas parciais de ordem 2
Finalmente, colecionamos aqui algumas observações sobre a relação entre D2 f (x) e as
derivadas parciais de ordem 2 quando V = Rd e W = R (tudo pode ser estendido a
W = Rk se trabalhamos coordenada a coordenada).
Há uma bijeção entre formas bilineares B ∈ L2 (Rd , R) e matrizes A ∈ Rd×d . De fato,
a cada B podemos associar a matriz A de entradas Ai,j := B(ei , ej ) e aí a bilinearidade
implica B(v, v ′ ) = v · Av ′ .
No nosso caso, queremos estudar a matriz correspondente a D2 f (x). Como esta é
a derivada do gradiente ∇f (x), esperamos que, se D2 f (x) existe, ela corresponda às
derivadas parciais ∂i ∂j f (x) das coordenadas de ∇f (x). Logo, a matriz correspondente a
D2 f (x) é deve ser a matriz Hessiana, das derivadas parciais de ordem 2.
Façamos este passo em detalhes. Suponha que Df (·) existe em todo U e que D(Df )(x)
existe num determinado ponto x. Agora fize v, v ′ ∈ Rd A relação entre derivadas de
Fréchet e direcionais nos garante que:
′ Df (x + εv) − Df (x)
2
D f (x) (v, v ) = (D(Df )(x) v) = lim v′.
ε→0 ε
É um exercício mostrar que podemos passar o v ′ para dentro do limite. Quando fazemos
isso, temos termos Df (x + εv) v ′ = ∇f (x + εv).v ′ e Df (x) v ′ = ∇f (x).v ′ . Logo:
∇f (x + εv).v ′ − ∇f (x).v
2 ′
D f (x) (v, v ) = lim .
ε→0 ε
Ou seja, a existência de D2 f (x) garante que o limite acima existe para quaisquer v, v ′ ∈ Rd .
Tomando v = ei e v ′ = ej , e lembrando que a j-ésima coordenada de ∇f (x) é ∂j f (x),
obtemos:
∇f (x + εv).v ′ − ∇f (x).v ∂j f (x + εei ) − ∂j f (x)
=
ε ε
e o limite da expressão acima é a derivada parcial da derivada parcial: ∂i ∂j f (x). Concluí-
mos:
∀1 ≤ i, j ≤ d : D2 f (x) (ei ,j ) = ∂i ∂j f (x);
portanto, estas derivadas parciais de ordem 2 todas existem e concluímos que
Provamos a fórmula acima supondo que D2 f (x) existe. Como no caso das primeiras
derivadas, é possível achar um teorema na direção contrária se supomos a continuidade
das derivadas parciais de ordem 2.
208
12.3 Derivadas de ordem maior que dois
Vamos agora estudar como estender a relação entre derivadas de ordem 2 e formas bili-
neares para derivadas de ordem superior. Em linhas gerais, provaremos o seguinte.
∥Q(v1 , v2 , . . . , vs )∥W
∥Q∥V s →W := sup Qs < +∞.
(v1 ,...,vs )∈(V \{0V })s i=1 ∥vi ∥V
Exercício 12.4 Prove que Ls (V, W ) é um espaço vetorial e que ∥ · ∥V s →W é uma norma sobre
Ls (V, W ). Prove ainda que, se W é Banach, então (Ls (V, W ), ∥ · ∥V s →W ) também é completo.
209
Informalmente isto é simples. No final das contas, um elemento do lado direito pega de
entrada uma s1 -tupla em V ; depois uma s2 -tupla em V ; depois . . . uma sr -tupla em V ; e
produz uma saída em W ; tudo isso de forma linear em cada variável e contínua no geral.
Isso dá no mesmo que pegar uma (s1 + s2 + · · · + sr )-tupla em V e levar em W de maneira
multilinear e contínua.
O trabalho aparece quando queremos descrever isso de forma precisa. Considere
números r ∈ N\{0, 1} e s1 , . . . , sr ∈ N\{0} com s1 + s2 + · · · + sr = s. Considere o espaço
Ls (V, W ) e o um segundo espaço S = S1 definido da seguinte forma:
3. Finalmente,
S := S1 = Ls1 (V, Ls2 (V, . . . , Lsr (V, W ) . . . ))
com a norma definida acima.
QT v = QT (v1 , . . . , vs ) ∈ W
Vs ∼
= V s1 × V s2 × · · · × V sr ;
Agora definimos QT v da seguinte forma. Como T ∈ Ls1 (V, S2 ), o valor T v (1) ∈ S2 está bem
definido. Como S2 = Ls2 (V, S3 ), também podemos calcular (T v (1) ) v (2) ∈ S3 . Seguindo
assim, chegamos a:
QT v := (. . . ((T v (1) ) v (2) ) . . . ) v (r) .
Portanto, definimos, para cada v ∈ V s , um valor QT v ∈ W . Isto é, QT : V s → W .
Abaixo relatamos algumas propriedades desta transformação.
210
QT é s-linear.
É um exercício mostrar esta propriedade. De fato, isso segue da observação que
“v (1) 7→ T v (1) "é multilinear e que, para i = 2, . . . , r − 1,
(. . . (T v (1) ) . . . ) v (i−1) ∈ Si = Lsi (V, Si+1 ),
e portanto
“v (i) 7→ [(. . . (T v (1) ) . . . ) v (i−1) ] v (i) ” é multilinear.
O próximo passo é mostrar que QT é limitada e tem a mesma norma que T .
∥T ∥S1 = ∥QT ∥V s →W .
Para isso, usamos repetidamente a nossa notação ms e o fato que podemos tomar o
supremo na ordem que quisermos:
∥QT v∥W
∥QT ∥V s →W = sup
v∈(V \{0V })s ms (v)
∥(. . . (T v (1) )v (2) . . . v (r−1) )v (r) ∥W
(V s ∼
= V s1 × · · · × V sr ) = sup Qr (i)
.
v (i) ∈(V \{0V })si i=1 msi (v )
i=1,...,r
Podemos repetir este raciocínio tomando agora o supremo em v (r−1) e lembrando que
(T v (1) )v (2) . . . v (r−2) ∈ Sr−1 = Lsr−1 (V, Sr ).
Obtemos:
∥(T v (1) )v (2) . . . v (r−2) ∥Sr−1
∥QT ∥V s →W = sup Qr−2 .
m (v (i) )
v (i) ∈(V \{0V })si i=1 s i
i=1,...,r−2
211
A aplicação que leva T ∈ S em QT ∈ Ls (V, W ) é uma bijeção linear que preserva normas.
op:todoido1 Proposição 12.5 Dada f : U → W , com U ⊂ V aberto e V, W como acima, dados inteiros k ≥ 1
Pr
e s1 , . . . , sr ≥ 1 com i=1 si = k, e dado um x ∈ U , as seguintes afirmações são equivalentes:
1. f é k − 1 vezes diferenciável em U e tem k-ésima derivada em x;
2. a derivada iterada Ds1 −1 Ds2 . . . Dsr f está definida em U e Ds1 Ds2 . . . Dsr f (x) existe.
Quando estas derivadas em x existem, temos ainda que
ou melhor dizendo: o isomorfismo Is1 ,...,sr que construímos entre S = Ls1 (V, . . . , Lsr (V, W )) e
Lk (V, W ) leva Ds1 Ds2 . . . Dsr f (x) em Dk f (x).
212
Prova: Podemos provar isso por indução em k. Quando k = 1, temos s1 = r = 1 e não há
o que provar.
Agora considere o caso em que k > 1 e suponha que o resultado que queremos provar
vale para k − 1. Provaremos que ele se estende também a k. Para isso, consideraremos
s1 , . . . , sr como no enunciado, mas trataremos apenas do caso em que s1 ≥ 2 (a demons-
tração para s1 = 1 é mais fácil).
Usando a hipótese de indução, já sabemos que o isomorfismo
Is1 −1,s2 ,...,sr : Ls1 −1 (V, Ls2 (V, . . . Lsr (V, W ) . . . )) → Lk−1 (V, W )
leva Ds1 −1 Ds2 . . . Dsr f (x′ ) em Dk−1 f (x′ ) para cada x′ ∈ U . Portanto,
∀x′ ∈ U : Is1 −1,s2 ,...,sr (Ds1 −1 Ds2 . . . Dsr f (x′ )) = Dk−1 f (x). (12.3) eq:isomorfi
Se queremos saber o que isto significa por extenso, podemos identificar
V k−1 ∼
= V s1 −1 × V s2 × · · · × V sr
e observar que (12.3) nos diz que, se v = (v (i) )i=1 ∈ V k−1 com v (1) ∈ V s1 −1 e cada v (i) ∈ V si
(2 ≤ i ≤ r), temos que, para qualquer x′ ∈ U :
Dk−1 f (x′ ) (v (i) )ri=1 = (. . . (Ds1 −1 Ds2 . . . Dsr f (x′ ) v (1) ) v (2) . . . ) v (r) .
Para abreviar isso, chamamos de G(x′ ) := Ds2 . . . Dsr f (x′ ) e deduzimos:
Dk−1 f (x′ ) (v (i) )ri=1 = (. . . (Ds1 −1 G(x′ ) v (1) ) v (2) . . . ) v (r) , (12.4) eq:isomorfi
novamente para todos os x′ ∈ U .
Repare que Is1 −1,s2 ,...,sr é contínua, linear e inversível com inversa linear contínua. Por
esta razão, segue da Regra da Cadeia que o lado esquerdo de (12.3) é diferenciável em x
se e somente se o direito é.
Por fim, suponha que um dos lados é diferenciável (e portanto os dois são). Agora
identificaremos
Vk ∼
= V × V s1 −1 × V s2 × · · · × V sr
acrescentando um v (0) ∈ V à “lista" (v (i) )ri=1 definida acima. Note que, pela equação (12.2),
k−1
D f (x + εv (0) ) − Dk−1 f (x)
k (i) r
D f (x) (v )i=0 = lim (v (i) )ri=1 .
ε→0 ε
Este limite pode ser calculado de outra maneira se recorremos a (12.4) (e usando novamente
(12.2):
s1 −1
G(x + εv (0) ) − Ds1 −1 G(x) (1)
D
... v v . . . v (r) = (. . . (Ds1 G(x) (v (0) , v (1) ) ) v (2) . . . ) v (r) .
(2)
ε
Portanto,
Dk f (x) (v (i) )ri=0 = (. . . (Ds1 G(x) (v (0) , v (1) ) ) v (2) . . . ) v (r) .
Como (v (i) )ri=0 ∈ V k é arbitrário, deduzimos que Ds1 G(x) = Ds1 Ds2 . . . Dsr f (x) é o “iso-
morfo" de Dk f (x). 2
213
Nosso próximo resultado significa que Dk f é simétrica sempre que é contínua como
função de x ∈ U .
Nosso objetivo é mostrar que Hk = Sk . Para isso, notamos (exercício) que Hk é subgrupo
de Sk . Portanto, para terminar a prova, basta mostrar que Hk contem um conjunto gerador
de Sk . O conjunto gerador que escolhemos é o que contém a transposição (12) e todas as
permutações que deixam 1 fixo.
Em primeiro lugar, observamos que
onde G(x′ ) := Dk−2 f (x′ ) (para x′ ∈ U ). Como Dk f e D2 G estão ligadas por um dos
isomorfismos que construímos, e além disso Dk f é contínua em x, temos que D2 G também
é contínua em x. Portanto, esta segunda derivada é simétrica e temos:
Falta provar a simetria em permutações que deixam 1 fixo. Para isso, usamos mais uma
vez a equação (12.2):
214
Teorema 12.2 Tome k ∈ N\{0}. Suponha que f : U ⊂ V → W é (k − 1) vezes diferenciável no
conjunto U e que Dk f (x0 ) ∼
= D(Dk−1 f )(x0 ) existe. Defina o polinômio de Taylor de f de ordem k
ao redor de x0 como:
k
X 1 j
Px0 ,k (h) := f (x0 ) + D f (x) (h, . . . , h) .
j=1
j! | {z }
j vezes
Então:
f (x0 + h) = Px0 ,k (h) + rk (h)
Prova: Na verdade, provaremos um resultado bem mais forte. Dados um r > 0 com
BV (x0 , r) ⊂ U e um h ∈ V com ∥h∥V < r, escreva
Note que ∥Rk (h)∥V k−1 →W /∥h∥V → 0 quando h → 0V porque Dk−1 f é diferenciável em x0 .
Nós provaremos por indução em k ≥ 1 que, se h ̸= 0V , então:
d
f (x + th) = Df (x + th).h,
dt
215
enquanto
k j
d d t jX
Px0 ,k (th) = D f (x) (h, . . . , h)
dt dt j=1 j! | {z }
j vezes
k
X tj−1
= Dj f (x) (h, . . . , h)
j=1
(j − 1)! | {z }
j vezes
k
X tj−1
(isom.) = [Dj−1 (Df )(x) (h, . . . , h)].h
j=1
(j − 1)! | {z }
j−1 vezes
= Qx0 ,k−1 (th).h
onde
′
Rk−1 (h′ ) := Dk−2 (Df )(x0 + h) − Dk−2 (Df )(x0 ) − D(Dk−2 (Df ))(x0 ).h.
Usando nossos isomorfismos com algum cuidado, podemos ver que Rk−1 ′
(h′ ) tem a mesma
norma que Rk (h′ ) e isso encerra a prova porque 0 < tθ ≤ 1 na expressão acima. 2
Exercício 12.5 Como no caso da reta, há outras versões da Fórmula de Taylor. Uma delas é útil
quando Dk f existe numa vizinhança de x0 e a função x 7→ Dk f (x) é contínua neste ponto x0 .
Mostre que, neste caso, para ∥h∥V suficientemente pequeno,
com resto
∥Rx0 ,k (h)∥W supa∈[x0 ,x0 +h] ∥Dk f (a) − Dk f (x0 )∥V k →W h→0V
≤ → 0.
∥h∥kV k!
216
12.5 Mais exercícios
Exercício 12.6 Fixe k > 1. Suponha que f : U → W é k − 1 vezes diferenciável. Mostre que
Q = Dk f (x0 ) existe, para um certo x0 ∈ U , se e somente se podemos escrever, para quaisquer
(hi )ki=1 ∈ V k com x0 + h1 ∈ U ,
Dk−1 f (x0 + h1 ) (hj )kj=2 = Dk−1 f (x0 + h1 ) (hj )kj=2 + Q((hi )ki=1 ) + R((hi )ki=1 ),
onde
∥R((hi )ki=1 )∥W
lim sup Qk = 0.
i=1 ∥hi ∥V
h1 →0V (h )k ∈(V \{0})k−1
j j=2
Exercício 12.7 Considere a aplicação de inversão de operadores lineares Inv : U → L(X) consi-
derada nas notas. Prove que, para qualquer A ∈ U e (Hi )ki=1 ∈ L(X)k ,
X
DInv(A) (Hi )ki=1 = (−1)k A−1 Hσ(1) A−1 Hσ(2) . . . A−1 Hσ(k) A−1 ,
σ∈Sk
onde Sk é o grupo de permutações de {1, . . . , k}. Se você quiser, pode usar os casos k = 1, 2
considerados acima como base para sua indução.
onde
∥Rk (h)∥W
∀h ∈ V : x0 + h ∈ U ⇒ ≤ sup ∥Dk f (x0 + a) − Dk f (x0 )∥V k →W
∥h∥kV ∥a∥≤∥h∥
Argumente ainda que ∂i1 ∂i2 . . . ∂ik f (x) é invariante por permutações de i1 , . . . , ik .
Exercício 12.10 Considere novamente o caso V = Rd e W = R com as normas usuais. Prove que
f : U → R tem derivadas parciais contínuas de ordem ≤ k se e somente se é k vezes diferenciável
com Dk f : U → Lk (V, W ) contínua.
217
Exercício 12.11 Enuncie de forma precisa e prove o seguinte enunciado. A composição de duas
funções k vezes diferenciáveis (no sentido de Fréchet) é uma função k vezes diferenciável.
io:EDOlegal Exercício 12.12 Volte à Proposição 11.4 e suponha agora que Dxk ψ(t, x) existe e é contínua, para
algum k ≥ 0. Prove que as funções Tψ e Fψ definidas na prova daquela proposição são k vezes
diferenciáveis e calcule suas derivadas de ordem até k.
Exercício 12.13 Considere Q ∈ Lk (V, W ) (com V e W “como sempre"e k ∈ N\{0, 1}) e defina
f (v) := Q(v, v, . . . , v) (v ∈ V ). Calcule as derivadas de todas as ordens desta função. Explique
como a fórmula se simplifica quando Q é simétrica.
Exercício 12.14 Dados espaços vetoriais normados (V, ∥ · ∥V ), (W, ∥ · ∥W ), chame de Lsim
k (V, W )
k
o conjunto das transformações k-lineares e simétricas de V em W . Mostre que este conjunto é
um subconjunto fechado de Lk (V, W ). Mostre ainda que podemos definir sobre Lsim k (V, W ) uma
norma ∥ · ∥sim que é equivalente à restrição da norma usual de Lk (V, W ) a este subespaço:
∥Q(v, v, . . . , v)∥W
∥Q∥sim := sup .
v∈V \{0V } ∥v∥kV
Depois explique porque a existência destes números implica que existe um Ck > 0 tal que
∥Q∥V k →W ≤ Ck ∥Q∥sim para qualquer Q ∈ Lsim
k (V, W ).
Exercício 12.15 (“Regra de Leibniz" para derivada de Fréchet) Dados espaços vetoriais nor-
mados (V, ∥ · ∥V ), (W, ∥ · ∥W ) e (Z, ∥ · ∥Z ); um aberto U ⊂ V ; uma Q ∈ Lk (W, Z); e funções
f1 , . . . , fk : U → W . Defina uma nova função F : U → Z via:
Mostre que, se todas as fi são diferenciáveis num certo x ∈ U , então DF (x) existe. Além disso,
calcule DF (x).
218
Capítulo 13
219
Definição 13.1 Dada H : X → X, um ponto fixo de H é um x∗ ∈ X com H(x∗ ) = x∗ .
Abaixo usaremos a notação
H i := |H ◦ H ◦ H
{z ◦ · · · ◦ H} (i ∈ N\{0})
i vezes
Então:
(a) H tem um único ponto fixo x∗ .
(b) H i (x) → x∗ para qualquer x ∈ X.
(c) dX (x, x∗ ) ≤ M d(x, H(x)) para qualquer x ∈ X.
O uso deste teorema será fundamental no restante da seção. Observamos antes da
prova um caso especial importante e dois exemplos que explicam as hipóteses do teorema.
Exercício 13.2 Mostre que as hipóteses do Teorema seguem quando H é κ-Lipschitz com κ < 1,
já que neste caso podemos tomar κi = κi .
Exemplo 13.3 Note que a hipótese de que (X, dX ) é completo é fundamental. Por exemplo,
considere X = R\{0} e H(x) = x/2 (x ∈ X).
Exemplo 13.4 Neste exemplo mostramos que é possível se ter X completo, H : X → X tal que
∀x, x′ ∈ X : dX (H(x), H(x′ )) < dX (x, x′ ),
mas tais que H não tem ponto fixo. Por esta razão, é importante que a constante de Lipschitz seja
estritamente menor do que um.
Tome X = [1, +∞) ⊂ R. Este é um conjunto fechado da reta e é, portanto, um espaço métrico
completo com a métrica induzida por R. Defina H(x) = x + x−1 (x ∈ X). Observe que:
1
∀x, x ∈ X : |H(x) − H(x )| = |x − x | 1 − ′ < |x − x′ |.
′ ′ ′
xx
Por outro lado, se existisse um ponto fixo x ∈ X, teríamos x = x + x−1 , o que dá x−1 = 0, o que é
impossível.
220
Antes da prova, convém enunciarmos um lema simples.
Lema 13.1 Se (X, dX ) é completo, então uma sequência {xi }i∈N ⊂ X satisfazendo
X
dX (xi , xi+1 ) < +∞
i∈N
Prova: Fixando uma tal {xi }i∈N , mostraremos que ela necessariamente é Cau-
chy. Para isso, usaremos o fato de que a cauda de uma série convergente vai a
zero:
k→+∞
X
ck := dX (xi , xi+1 ) −→ 0,
i≥k
onde a última desigualdade segue do fato que todos os termos na série ck são
não-negativos.
A cota acima foi feita para k < ℓ. Ela também funciona para k > ℓ se
trocamos os papeis dos índices e certamente vale para k = ℓ. Concluímos que:
Prova: [Prova do Teorema de Ponto Fixo de Banach] Nosso primeiro passo é provar que,
dado qualquer x ∈ X, {H i (x)}i∈N converge a um x∗ ∈ X que satisfaz a desigualdade do
item (c) acima.
221
De fato, como (X, dX ) é completo, sabemos do Lema acima uma condição suficiente
para uma sequência {xi }i∈N ⊂ X convergir é que
X
dX (xi , xi+1 ) < +∞.
i∈N
Mais ainda, quando vale este critério, podemos usar a desigualdade triangular para obter:
X
dX (x0 , lim xi ) ≤ dX (xi , xi+1 ).
i∈N
i∈N
dX (x∗ , y∗ )
0 ≤ dX (x∗ , y∗ ) = dX (H i (x∗ ), H i (y∗ )) ≤ κi−1 dX (x∗ , y∗ ) ≤ ⇒ dX (x∗ , y∗ ) = 0.
2
Finalmente, juntamos os ingredientes.
• Como cada sequência {H i (x)}i∈N converge a um limite (pela primeira parte da prova)
e este limite é um ponto fixo (pelo exercício 13.1), temos que H i (x) converge a x∗ , o
único ponto fixo de H, não importando qual seja x. Isto é a parte (b) do teorema.
• Finalmente, a estimativa (c) foi provada no primeiro passo, onde tratamos x∗ como
o limite de H i (x) para um dado x. Como agora sabemos que este limite é o único
ponto fixo, está encerrada a prova.
222
13.2 O teorema da função inversa
Seção sendo reescrita em 17/05/2023.
Nesta seção provaremos um dos teoremas clássicos do Cálculo em várias variáveis: o
teorema da função inversa. Convém enunciar uma definição antes de começar.
Definição 13.2 Dados abertos U0 , U1 ⊂ V , dizemos que f : U0 → U1 é um difeomorfismo de
classe C ℓ (ℓ ∈ N\{0}) se f é uma bijeção entre U0 e U1 e tanto f quanto f −1 são funções com
derivadas contínuas até ordem ℓ.
Os difeomorfismos são importantes porque são correspondências entre conjuntos que
preservam não só cardinalidade (como seria se fossem só bijeções) ou topologia (como
seria se f e f −1 são contínuos), mas também qualquer “estrutura diferenciável até ordem
ℓ"que podemos botar nos conjuntos U0 e U1 . De fato, os “difeos" serão muito importantes
na hora de falarmos de variedades.
Uma observação simples é que, para que uma função f : U0 → U1 seja um difeo-
morfismo C 1 , é necessário que derivada de f seja um operador linear inversível. De fato,
supondo que f seja mesmo um difeo, podemos aplicar a regra da cadeia às expressões
∀x ∈ U0 , f −1 ◦ f (x) = x e ∀y ∈ U1 , f ◦ f −1 (y) = y
e descobrir que, dados x ∈ U0 e y = f (x) ∈ U1 ,
Df −1 (y) Df (x) = Df (x) Df −1 (y) = IdV ,
o operador identidade de V . Desta forma,
Df −1 = Inv ◦ Df ◦ f −1 .
aracontinua Exercício 13.3 Use a representação acima para Df −1 para provar o segunte resultado. Se f :
U0 → U1 é bijeção de classe C ℓ e a função inversa f −1 é diferenciável, então f −1 também é de classe
C ℓ (para ℓ = 1, isso segue do fato de que Df −1 é a composição de três funções contínuas).
Por outro lado, a simples invertibilidade da derivada não é suficiente para garantir que
f é um difeomorfismo.
Exemplo 13.5 Considere a parametrização de U0 = U1 = R2 \{0R2 } por coordenadas polares.
f : R2 \{0} → R2 \{0R2 }
(r, θ) 7→ (r cos θ, r sin θ).
Podemos calcular a derivada de f na forma matricial através da matriz de derivadas parciais.
cos θ −r sin θ
Df (r, θ) = .
sin θ r cos θ
Como o determinante desta matriz é r > 0, Df (r, θ) é sempre inversível. No entanto, f não
é um difeomorfismo. De fato, ela não é nem mesmo uma bijeção, já que é periódica na segunda
coordenada.
223
O que o Teorema da Função Inversa é que a invertibilidade da derivada num único
ponto x0 do domínio garante que f é um difeomorfismo local, ou seja, ao redor de x0 .
teo:inversa Teorema 13.2 (Teorema da função inversa) Considere um espaço vetorial normado completo
(V, ∥ · ∥V ). Suponha que U ⊂ V é aberto de V , que f : U → W é C ℓ , ℓ ∈ N\{0}. Suponha ainda
que, para um certo ponto x0 ∈ U , Df (x0 ) é inversível. Então há um aberto U0 ⊂ U com x ∈ U0
tal que:
1. U1 := f (U0 ) é aberto;
2. f |U0 : U0 → U1 é um difeomorfismo C ℓ .
A prova será apresentada ao longo de vários lemas abaixo. Convem entender desde
agora a intuição e a dificuldade técnica da prova. A intuição é simples. Localmente, f (x) se
parece muito com a função afim y0 + T (x − x0 ), com y0 = f (x0 ) e T = Df (x0 ). Como T é
inversível, a função afim também é e tudo indica que f deve ter as mesmas características
numa vizinhança de x0 .
A maior dificuldade técnica da prova será provar que U1 é aberto. Para entender o
desafio, imagine que você tem em mãos um y ∈ U1 = f (U0 ). Tudo o que sabemos, em
princípio, é que y = f (x) para algum x ∈ U0 . Para provar que U1 é aberto, precisamos
encontrar um δ > 0 tal que todo y ′ a distância < δ de y tem uma pré-imagem x′ em U0 .
Como poderemos fazer isso?
Não há como dar uma condição absolutamente geral para isso ser verdade, mas vere-
mos a seguir que perturbações de operadores lineares inversíveis têm essa propriedade.
Para entender melhor por que isso faz sentido, começamos com uma observação.
224
Recorde agora que já sabemos lá da §11.4.1 que perturbações de operadores inversíveis
também são inversíveis. De fato, segue dos resultados lá provados que, se T, S ∈ L(V ), T
é inversível e
1
∥T − S∥V →V < −1
,
∥T ∥V →V
então S também é inversível. Logo, um S próximo de T também leva abertos em abertos
e também é Lipschitz com inversa Lipschitz.
O que veremos a seguir é um análogo disso para funções que não são necessariamente
lineares. De fato, o salto conceitual é substituir a norma de operador ∥T − S∥V →V pela
constante de Lipschitz ∥T − S∥Lip ; isso dá exatamente no mesmo para T, S ∈ L(V ), mas
também faz sentido para coisas que não são lineares.
versanaodif Teorema 13.3 Suponha que U0 ⊂ V é aberto e que ψ : U0 → V é dada. Se existe T ∈ L(V ) com
∥ψ − T ∥Lip < 1/∥T −1 ∥V →V , então:
1. U1 := ψ(U0 ) é aberto;
2. ψ : U0 → U1 é bijeção Lipschitz;
3. ψ −1 : U1 → U0 também é Lipschitz.
Note que o item 2 tem um pequeno abuso de notação, já que trocamos o contradomínio
da função sem trocar seu nome. No entanto, sabemos que isso não é realmente um
problema.
Além disso, devemos observar que dizer que ψ é perturbação de T não é exatamente
preciso. Afinal,
Prova: Mesmo sem saber que U1 é aberto, podemos provar que ψ : U0 → U1 é bijeção
Lipschitz com inversa Lipschitz. Afinal, veja que, dados x, x′ ∈ U0 ,
|∥T (x−x′ )∥V −∥ψ(x)−ψ(x′ )∥V | ≤ ∥(T −ψ)x−(T −ψ)(x′ )∥V ≤ ∥ψ −T ∥Lip ∥x−x′ ∥V , (13.2) eq:psiequas
ou melhor,
∥T (x−x′ )∥V −∥ψ−T ∥Lip ∥x−x′ ∥V ≤ ∥ψ(x)−ψ(x′ )∥V ≤ ∥T (x−x′ )∥V +∥ψ−T ∥Lip ∥x−x′ ∥V .
Combinando estas estimativas e (13.1), deduzimos que:
ℓ ∥x − x′ ∥V ≤ ∥ψ(x) − ψ(x′ )∥V ≤ L ∥x − x′ ∥V
onde L := ∥T ∥V →V + ∥ψ − T ∥Lip e
1
ℓ := − ∥ψ − T ∥Lip > 0.
∥T −1 ∥V →V
Portanto, ψ é bi-Lipschitz no sentido do Exercício 11.17. Em particular ela é injetiva;
portanto, ela é uma bijeção entre U0 e sua imagem ψ(U0 ) = U1 . Além disso, dados y, y ′ ∈ V ,
podemos tomar x = ψ −1 (y) e x′ = ψ −1 (y ′ ) na desigualdade anterior para obtermos
ℓ ∥ψ −1 (y) − ψ −1 (y ′ )∥V ≤ ∥y − y ′ ∥V ,
225
o que significa que ψ −1 é 1/ℓ-Lipschitz.
Ainda falta provar que U1 é um aberto: ou seja, queremos mostrar que, dado um
y0 ∈ U1 , existe um δ > 0 tal que BV [y0 , δ] ⊂ U1 . Como U1 é a imagem de U0 por ψ, um certo
y ∈ V está em U1 se e somente se existe um x ∈ U0 com ψ(x) = y. Portanto, nosso objetivo
é mostrar o seguinte:
Se y ∈ V e y = ψ(x) para algum x ∈ V , então existe um raio δ > 0 tal que, dado
qualquer y∗ ∈ V com ∥y∗ − y∥V ≤ δ, existe um x∗ ∈ U0 com ψ(x∗ ) = y∗ .
Nossa ideia para conseguir estas propriedades vai ser usar aplicar um argumento de
ponto fixo.
Fixe x ∈ U0 e y = ψ(x) ∈ U1 . O que faremos será encontrar um r > 0 e um δ > 0 tais
que
X := BV [x, r] ⊂ U0 , Y := BV [y, δ] ⊂ U1
e provaremos que ψ(X) ⊃ Y . A escolha precisa de r e δ será necessária para tudo funcionar,
mas, ao invés de fazê-la agora, iremos vendo as condições necessárias para tudo funcionar
ao longo do resto da prova. De qualquer forma, observe que X é um fechado de V .
Agora, dado um y ′ ∈ Y arbitrário, defina a função:
Achar uma pré-imagem para y∗ é igual a achar um ponto fixo para Hy∗ .
Queremos aplicar o Teorema do Ponto Fixo de Banach para provar que o ponto fixo
existe. Para isso, precisamos de três coisas.
3. Hy∗ (X) ⊂ X.
A primeira condição é simples. Como X é fechado de V , que por sua vez é Banach,
temos que X é completo com a métrica induzida pela norma de X.
Agora observamos que H é κ-Lipschitz, com
κ := ∥T − ψ∥Lip ∥T −1 ∥V →V ;
note que κ < 1 justamente por causa da nossa hipótese sobre ∥T − ψ∥Lip !
226
Para provar a propriedade de Lipschitz, tome x′ , x′′ ∈ X e veja que:
∥Hy∗ (x′ ) − Hy∗ (x′′ )∥V = ∥(x′ − x′′ ) − T −1 (ψ(x′ ) − ψ(x′′ ))∥V
(T −1 , T lineares) = ∥T −1 [T (x′ ) − T (x′′ ) − (ψ(x′ ) − ψ(x′′ ))]∥V
= ∥T −1 [(T − ψ)(x′ ) − (T − ψ)(x′′ )]∥V
≤ ∥T −1 ∥V →V ∥(T − ψ)(x′ ) − (T − ψ)(x′′ )∥V
≤ ∥T −1 ∥V →V ∥T − ψ∥Lip ∥x′ − x′′ ∥V
= κ ∥x′ − x′′ ∥V .
Por fim, queremos mostrar que Hy∗ (X) ⊂ X. É neste momento da prova que aparecerão
as restrições sobre δ e r de que precisamos.
O primeiro ponto é observar que, como X = BV [x, r], provar a inclusão
∀x′ ∈ X : ∥Hy∗ (x′ ) − x∥V ≤ ∥Hy∗ (x′ ) − Hy∗ (x)∥V + ∥Hy∗ (x) − x∥V
O primeiro termo é cotado por κ ∥x′ − x∥V . Pro segundo termo, recorde que ψ(x) = y e
y∗ ∈ Y = BV [y, δ], logo ∥y − y∗ ∥V ≤ δ e
Deduzimos:
∀x′ ∈ X : ∥Hy∗ (x′ ) − x∥V ≤ κ r + ∥T −1 ∥V →V δ.
Lembrando que κ < 1, vemos que a escolha
r
δ = δ(r) :=
(1 − κ) ∥T −1 ∥V →V
garante (13.3), contanto que sejam respeitadas as relações adicionais
X = BV [x, r] ⊂ U0 e Y = BV [y, δ] ⊂ U1 .
Mas tanto U0 quanto U1 são abertos, logo as bolas estão dentro dos respectivos abertos
para r e δ suficientemente pequenos. Como δ(r) → 0 quando r → 0, basta tomar r > 0
pequeno o suficiente para que tudo funcione. Isso justifica a aplicação do Teorema de
Banach e conclui a prova da existência do ponto fixo, ou seja, da pré-imagem x∗ ∈ X de
um y∗ ∈ Y = BV [y, δ] arbitrário. Logo, temos ψ(X) ⊃ Y , o que, como vimos, era o que
faltava para provarmos que U1 é aberto. 2
227
Prova do Teorema da Função Inversa
Agora que temos nossa principal ferramenta, a prova do Teorema da Função Inversa não
será tão difícil – mas ela ainda está um pouco longe de acabar. A ideia será aplicar o
Teorema 13.3 a ψ = f |U0 , com U0 definido abaixo.
Recorde que supomos que f : U → V é C ℓ , x0 ∈ U e Df (x0 ) é inversível.
1. U1 = f (U0 ) é aberto.
3. f |U0 : U0 → U1 é Lipschitz.
Prova: A ideia será aplicar o Teorema 13.3 com T := Df (x0 ). Para isso, começamos
observando que, Df : U → V é contínua, é possível encontrar um ε > 0 tal que U0 :=
BV (x0 , ε) ⊂ U e
1
∀x ∈ BV (x0 , ε) : ∥Df (x) − Df (x0 )∥V →V ≤ .
2∥Df (x0 )−1 ∥V →V
Por tudo que vimos sobre invertibilidade de operadores lineares no §11.4.1, isso por si só
já garante que Df (x) é inversível para todo x ∈ U0 .
Agora defina ψ := f |U0 . Mostramos agora que ∥T − ψ∥Lip < ∥T −1 ∥−1 V →V , o que nos
permite terminar a prova via o Teorema 13.3.
Para provar a estimativa sobre a constante de Lipschitz, podemos aplicar o exercício
11.12 à função G = ψ − T , definida sobre o aberto convexo U0 . G tem derivada DG(x) =
Df (x) − T = Df (x) − Df (x0 ) para cada x ∈ U0 . Pela escolha de ε > 0 acima,
1
∥ψ − T ∥Lip = ∥G∥Lip = sup ∥Df (x) − Df (x0 )∥V →V ≤ .
x∈U0 2∥Df (x0 )−1 ∥V →V
228
Dado h tal que y + h ∈ U1 , podemos definir uh com x + uh ∈ U0 tal que f (x + uh ) = y + h;
este uh então satisfaz:
uh = f −1 (y + h) − f −1 (y). (13.4) eq:defuh
Nosso objetivo, portanto, é mostrar que
Objetivo: uh = f −1 (y + h) − f −1 (y) = S h + o(h).
Para isso, o primeiro passo é usar o fato de que f é diferenciável em x, com derivada igual
a Df (x) = S −1 . Ou seja,
h = y + h − y = f (x + uh ) − f (x) = S −1 uh + r(uh ),
onde ∥r(u)∥ = o(u). Isto implica que
uh = f −1 (y + h) − f −1 (y) = S h − S r(uh ).
O que nos resta agora é provar que S r(uh ) = o(h). Para isso, será boa ideia provar
que as normas de uh e h são parecidas. De fato, como f −1 é Lipschitz, obtemos que
∥uh ∥V = ∥f −1 (y + h) − f −1 (y)∥V ≤ c0 ∥h∥V com c0 > 0 independente de h. Por outro lado,
f também é Lipschitz, logo
∥f (x + uh ) − f (x)∥V = ∥h∥V ≤ c1 ∥uh ∥V
com c1 > 0 constante. Ou seja, a norma de uh é cotada por cima e por baixo pela norma
de h, a menos de fatores constantes.
∥h∥V
∀h ∈ V : y + h ∈ U1 ⇒ ≤ ∥uh ∥V ≤ c0 ∥h∥V .
c1
Concluímos que uh =
̸ 0V quando h ̸= 0V e que uh → 0V quando h → 0V . Assim
terminamos a prova:
∥f −1 (y + h) − f −1 (y) − S h∥V ∥S r(uh )∥V
=
∥h∥V ∥h∥V
∥r(uh )∥V
≤ ∥S∥V →V
∥h∥V
∥r(uh )∥V
≤ ∥S∥V →V
∥h∥V
∥r(uh )∥V
(use ∥uh ∥V ≥ c−1
1 ∥h∥V ) ≤ c1 ∥S∥V →V
∥uh ∥V
(combine h → 0V ⇒ uh → 0V com r(u) = o(u)) → 0,
como queríamos demonstrar. 2
229
13.3 O teorema da função implícita
Provaremos agora um outro clássico do Cálculo em várias variáveis, com tantas ou mais
aplicações que o primeiro resultado. Para enunciá-lo, precisaremos de um preâmbulo.
Considere dois espaços vetoriais normados e completos (V, ∥ · ∥V ) e (W, ∥ · ∥W ). O
produto V ×W pode ser visto como um espaço vetorial composto de pares (v, w) ∈ V ×W .
Se fixamos p ∈ [1, +∞), a fórmula
q
∥(v, w)∥V ×W = p ∥v∥pV + ∥w∥pW ((v, w) ∈ V × W )
define uma norma sobre V × W que o torna um espaço completo. Por exemplo, se
V = Rd e W = Rk com as respectivas normas ℓp , ∥ · ∥Rd ×Rk corresponde à norma ℓp em
Rd × Rk = Rd+k .Também é um exercício mostrar que as normas obtidas para os diferentes
valores de p > 1 são todas equivalentes.
A seguir apresentaremos um resultado que nos dará condições de entender a estrutura
local de certos subconjuntos M ⊂ V × W definidos implicitamente por uma fórmula do
tipo:
M = {(v, w) ∈ V × W : Φ(v, w) = 0W }
onde Φ : V × W → W é uma função. Por exemplo: imagine que V = Rd , W = Rk e
portanto V × W ≈ Rd+k . Uma Φ como acima codifica k equações não lineares em d + k
variáveis:
Φ[j](x[1], . . . , x[d + k]) = 0, j = 1, 2, 3, . . . , k.
A principal mensagem do Teorema da Função Inversa é que, sob condições simples,
localmente o conjunto M é da forma (x, g(x)) para alguma função g de V em W . A
principal hipótese será a de que o operador linear D2 Φ(x, y) ∈ L(W ) dado por:
D2 Φ(x, y) w := DΦ(x, y) (0V , w) (w ∈ W )
é inversível para algum par (x0 , y0 ) ∈ V × W .
230
e também
T1 : v ∈ V 7→ T (v, 0W ),
T2 : w ∈ W 7→ T (0V , w),
I × T2 : (v, w) ∈ V × W 7→ (v, T2 w).
então
∀(x, y) ∈ U : DF (x, y) = I ⊗ DΦ(x, y).
H −1 : (v, w) ∈ V × W 7→ (v, w + T1 v)
231
Prova: [Prova do Teorema da Função Implícita]
F (h(x, y), g(x, y)) = (h(x, y), Φ(x, y)) = (x, Φ(x, y)).
Em particular, h(x, y) = x e G(x, y) = (x, q(x, y)) para todos (x, y) ∈ U1 . É um exercício
mostrar que q : U1 → W é C ℓ porque F é C ℓ .
Agora considere o conjunto
Como F (x, y) ∈ U1 sempre que (x, y) ∈ U0 , e além disso G = F −1 , temos que, para
qualquer par (x, y) ∈ U0 :
Φ(x, y) = c ⇔ F (x, y) = (x, c) ⇔ (x, y) = G ◦ F (x, y) = G(x, c) = (x, q(x, c)) ⇔ y = q(x, c).
Definimos agora g(x) := q(x, c). Esta função g está definida no conjunto:
A0 := {x ∈ V : (x, c) ∈ U1 },
ou seja,
Exercício 13.5 Explique porque podemos adicionar à tese do Teorema da Função Inversa a seguinte
condição: D2 Φ(x, y) é inversível para todo par (x, y) ∈ U0 . Mostre que, se fazemos isso, podemos
calcular a derivada de g da seguinte maneira:
232
13.4 Aplicações às equações diferenciais ordinárias
Depois de termos provado todos os resultados acima, é bom os botarmos em uso. Isso
será feito no capítulo seguinte, quando tratarmos de variedades. Por questões técnicas,
aquela teoria será apresentada em dimensão finita. Aqui, apresentamos aplicações que
envolvem dimensões infinitas. Nosso objetivo é mostrar que alguns teoremas clássicos
de existência, unicidade e suavidade das soluções de equações diferenciais ordinárias (ou
EDOs) seguem diretamente do Teorema do Ponto Fixo de Banach e do Teorema da Função
Implícita.
233
Alguns casos de aplicação deste teorema são muito conhecidos.
Exemplo 13.6 Se V = R e Ψ(t, x) = Lx, a única solução com ξ(0) = 0 é a função exponencial
˜ V ≤ eL|t| ∥x − x0 ∥V é
ξ(t) = eLt x0 . Note que este caso mostra que em geral a cota ∥ξ(t) − ξ(t)∥
justa.
Exemplo 13.7 Se V = R2 e Ψ(t, x) = (x[2], −x[1]), a solução com ξ(0) = (0, 1) é dada por
ξ(t) = (sen t, cos t).
Sabemos que (CT , ∥ · ∥∞,T ) é Banach. Além disso, toda solução do problema de Cauchy
é diferenciável e portanto também é contínua. Isto é, todas as eventuais soluções do
problema estão em CT .
O Teorema Fundamental do Cálculo para espaços de Banach, visto no Capítulo 10, nos
permite concluir que f ∈ CT resolve a EDO para t ∈ [−T, T ] se e somente se é um ponto
fixo do operador
Z t
Tx0 ,T : f ∈ C 7→ Tx0 ,T (f ) ∈ CT com Tx0 ,T (f )(t) := x0 + Ψ(s, f (s)) ds (t ∈ [−T, T ]).
0
De fato, se f é ponto fixo, então f ′ (t) é obtida diferenciando-se a integral; e, por outro
lado, f (0) = x0 e f ′ (t) = Ψ(s, f (s)) implica
Z t Z t
Ψ(s, f (s)) ds = f ′ (s) ds = f (t) − x0 e portanto Tx0 ,T (f )(t) = f (t).
0 0
234
af:picard Afirmação 13.1 (Estimativa de Picard) Dados n ∈ N e f, g ∈ CT :
(L|t|)n
∀t ∈ [−T, T ] : ∥T n (f )(t) − T n (g)(t)∥V ≤ ∥f − g∥∞,T ,
n!
Em particular, T n é (L T )n /n!-Lipschitz.
Veja que esta afirmação termina a prova do primeiro passo porque temos:
X (LT )n
= eLT < +∞
n∈N
n!
Provemos então a afirmação. Veja que o caso n = 0 é trivial. Para seguir por indução,
suponha que, para algum n ≥ 0,
(L|t|)n
∀t ∈ [−T, T ] : ∥T n (f )(t) − T n (g)(t)∥V ≤ ∥f − g∥∞,T ;
n!
Vejamos agora como se comporta a mesma quantidade quando passamos de n para n + 1.
Escreva fn := T n (f ) e gn := T n (g). Usando a fórmula para T , vemos que, para t ≥ 0,
√ √
∥T n+1 (f )(t) − T n+1 (g)(t) −1V = ∥T (fn )(t) − T (gn )(t) −1V
Z t
=
(Ψ(s, fn (s)) − Ψ(s, gn (s))) ds
0 V
Z t
≤ ∥Ψ(s, fn (s)) − Ψ(s, gn (s))∥V ds
0
Z t
(use prop. de Lipschitz) ≤ L ∥fn (s) − gn (s)∥V ds
0
Z t
(Ls)n
(hip. de indução) ≤ L ∥f − g∥∞,T ds
0 n!
Ln+1 tn+1
(apenas faça a conta) = ∥f − g∥∞,T .
(n + 1)!
Uma conta muito parecida prova o resultado análogo para t < 0. Para terminar, temos:
Parte 2. Agora queremos provar a existência global. Já sabemos que para cada intervalo
[−T, T ] há uma solução ϕx0 ,T de nosso problema. A principal observação desta parte da
prova é que, se S > T , a solução ϕx0 ,S restrita ao intervalo [−T, T ] tem de coincidir com ϕx0 ,T .
235
Isto ocorre porque a restrição ϕx0 ,S |[−T,T ] : [−T, T ] → Rd também é contínua, satisfaz
ϕx0 ,S |[−T,T ] (0) = x0 e ϕx0 ,S |′[−T,T ] (t) = ϕ′x0 ,S (t) = Ψ(t, ϕx0 ,S (t)) for t ∈ [−T, T ]. Ou seja,
ϕx0 ,T |[−T,T ] resolve o mesmo problema de Cauchy que ϕx0 ,T . Como ϕx0 ,T é a única solução,
tem de valer a observação acima.
O valor da observação é que ela nos permite passar do local para o global. De fato, se
definimos
ϕx0 (t) := ϕx0 ,T (t), onde T > |t| (t ∈ R)
a observação acima nos mostra que isto está bem definido porque o valor do lado direito
não depende do T escolhido. Vê-se ainda que ϕx0 (0) = x0 e ϕ′x0 (t) = Ψ(t, ϕ′x0 (t)) para todo
t ∈ R pelo simples fato que as ϕ′x0 ,T satisfazem estas propriedades nos seus respectivos
intervalos. A unicidade para t ∈ R vem do fato que qualquer outra solução também terá
de coincidir com cada ϕ′x0 ,T no seu intervalo [−T, T ], pelo raciocínio exposto acima.
Parte 3. Provaremos agora a dependência contínua. Tome T := |t|. Considere os opera-
dores Tx0 ,T , Tx′0 ,T : CT → CT vistos acima. Vemos claramente que para qualquer f ∈ CT ,
ϕx′0 ,T = x′0 − x0 + Tx0 ,T (ϕx0 ,T ) e portanto ∥ϕx′0 ,T − Tx0 ,T (ϕx′0 ,T )∥∞, T = ∥x0 − x′0 ∥V .
∥ϕx0 (t) − ϕx′0 (t)∥V = ∥ϕx0 ,T (t) − ϕx′0 ,T (t)∥V ≤ ∥ϕx0 ,T − ϕx′0 ,T ∥∞,T ≤ eLT ∥x0 − x′0 ∥V .
denciasuave Teorema 13.6 Sob as hipóteses acima, temos que, para cada T > 0, a função ST : Rd →
C([−T, T ], Rd ) que associa a cada x0 ∈ Rd a função ϕx0 ,T ∈ CT é C ℓ .
Exercício 13.7 Antes de provar o Teorema, mostre que ele implica que a função levando (t, x0 ) ∈
R × Rd ∼
= Rd+1 em ϕx0 (t) é C ℓ .
236
ponto fixo; como ϕx0 ,T é ponto fixo de Tx0 ,T , deduzimos que o único ponto fixo de Txk0 ,T é
ϕx0 ,T . Definimos uma função:
H T : R d × CT → CT
que leva um par (x0 , f ) ∈ Rd × CT em f − Txk0 ,T (f ). Pela observação sobre pontos fixos
acima, sabemos que:
{(x0 , ST (x0 )) : x0 ∈ Rd } = {(x0 , ϕx0 ,T ) ∈ x0 ∈ Rd } = HT−1 (0CT ).
O que desejamos mostrar é que ST é C ℓ . Para mostrar isso, usaremos o Teorema da
Função Implícita. Mostraremos que, dado qualquer x0 ∈ Rd , existem uma vizinhança
aberta U0 ⊂ Rd × CT de (x0 , ST (x0 )), uma vizinhança aberta A0 ⊂ Rd de x0 e uma função
g : A0 → CT de classe C ℓ tais que:
HT−1 (0CT ) ∩ U0 = {(x, g(x)) : x ∈ A0 }.
Por que isso implica que ST é C ℓ ? Comparando a última identidade com a nossa descrição
anterior de HT−1 (0CT ), vemos que:
∀x ∈ A0 : ST (x) = g(x);
portanto ST é C ℓ em A0 . Ou seja: todo ponto x0 ∈ Rd tem uma vizinhança aberta A0 onde
ST é C ℓ . É fácil ver que isso implica que ST é C ℓ .
Como exatamente aplicaremos o Teorema da Função Implícita? Tomaremos Φ = HT ,
V = Rd , W = CT e U = V × W . Para terminar nossa prova, precisamos mostrar que HT é
C ℓ e que D2 HT (x, f ) é inversível para quaisquer x e f .
Começamos mostrando que HT é C ℓ . Veja que HT é a diferença de termos f e Txk0 ,T (f ).
O primeiro é linear e portanto C ∞ . O segundo pode ser escrito como:
H(x0 , H(x0 , . . . , H(x0 , f ) . . . )) k vezes
| {z }
onde H(x0 , f ) := Tx0 ,T (f ) = x0 + T0,T (f ). Esta função U (x0 , f ) é a soma de uma função
linear em x0 (que não depende de f ) e outra que sabemos ser C ℓ em f (pelo Exercício 12.12
acima). É fácil ver que U é C ℓ e que sua derivada é:
DH(x0 , f ) (hx , hf ) = hx + DT0,T (f ) hf ((hx , hf ) ∈ Rd × CT ).
Note-se que foi só neste passo que usamos o fato de que sabemos diferenciar Tx0 ,T ; aqui
a dimensão finita de Rd foi usada para garantir, lá no Exercício 12.12, que Dx ψ fosse
uniformemente contínua sobre conjuntos fechados e limitados (que são compactos em
Rd mas não em geral). De qualquer modo, o exercício abaixo mostra que HT (x0 , f ) =
f − H(x0 , H(x0 , . . . , H(x0 , f ) . . . )) também é C ℓ .
Exercício 13.8 Suponha que H : V × W → W é dada, com (V, ∥ · ∥V ) e (W, ∥ · ∥W ) espaços
vetoriais normados. Mostre que, se H é C ℓ , a função M que leva (v, w) ∈ Rd × V em (v, H(v, w))
também é C ℓ . Deduza disto que M k é C ℓ e explique o que isso tem a ver com
H(x0 , H(x0 , . . . , H(x0 , f ) . . . )) k vezes.
| {z }
237
Agora temos que mostrar que D2 HT (x0 , f ) é inversível em todo ponto. Observamos
que, para qualquer hf ∈ CT ,
Exercício 13.11 (Estabilidade dos zeros de uma função) Considere (V, ∥·∥V ) Banach, U ⊂
V aberto e F : U → V diferenciável com ∥DF ∥Lip =: L ∈ R+ (isto é, ∥DF (x) −
DF (x′ )∥V →V ≤ L∥x − x′ ∥V para todos x, x′ ∈ U ). Suponha ainda que x⋆ ∈ U é dado,
F (x⋆ ) = 0V e DF (x⋆ ) é inversível, com ∥DF (x⋆ )−1 ∥V →V ≤ κ < +∞. Mostre que existem
r, ε > 0 dependendo apenas de d(x⋆ , U c ) e dos parâmetros L, κ tais que BV [x⋆ , r] ⊂ U e
toda função G : U → V com
238
Exercício 13.12 (Convergência local do método de Newton) Considere F : U → V de
classe C 1 (com (V, ∥ · ∥V ) Banach e U ⊂ V aberto). Suponha que x⋆ ∈ F satisfaz F (x⋆ ) = 0V
com DF (x⋆ ) inversível. Mostre que existe um r > 0 tal que, se x0 ∈ BV (x⋆ , r) ⊂ U , então
podemos definir uma sequência {xn }n∈N via:
e garantir que
lim ∥xn − x⋆ ∥V = 0.
n→+∞
Supondo agora que F satisfaz as hipóteses do exercício anterior, mostre que podemos
escolher r de modo que, se x0 ∈ BV [x⋆ , r],
2
∥xn−1 − x⋆ ∥V
∀n ∈ N\{0} : ∥xn − x⋆ ∥V ≤
2r
e deduza que ∥xn − x⋆ ∥ ≤ 2−(2 . (Ou seja, temos uma convergência extremamente
n −1)
rápida de xn a x⋆ .)
Exercício 13.13 (Uma forma invariante por coordenadas do Teorema da Função Implícita)
Neste problema identificamos Rd+k ∼ = Rd ×Rk da maneira usual. U ⊂ Rd+k é aberto, a0 ∈ U ,
f : U → Rk é C ℓ com f (a0 ) = c e, por fim, Df (a0 ) ∈ L(Rd+k , Rk ) é sobrejetiva.
2. Prove que existe uma transformação linear inversível R : Rd × Rk → Rd+k que leva
{0Rd } × Rk em S.
Exercício 13.14 (Estabilidade dos autovalores simples de uma matriz) Lembre-se que o
polinômio característico de uma matriz A ∈ Rd×d é
239
1. Prove que, se A0 ∈ Rd×d e λ0 ∈ R é autovalor simples de A0 , então existem ε > 0
e Λλ0 : BRd×d (A0 , ε) → R de classe C ∞ tais quequalquer Λλ0 (A0 ) = λ0 e Λλ0 (A) é
autovalor simples de A para qualquer A ∈ BRd×d (A0 , ε).
Exercício 13.15 Usando a notação do Teorema 13.6, vamos tentar imaginar como deveria
ser a derivada em x0 de ST (x0 ) := ϕx0 . De fato, veja que esperamos que, com alguma
sorte, para h ≈ 0,
d d
(DS(x0 ) h)(t) ≈ (ϕx0 +h (t) − ϕx0 (t))
dt dt
e ao mesmo tempo
ψ(t, ϕx0 +h (t)) − ψ(t, ϕx0 (t)) ≈ Dx ψ(t, ϕx0 (t)) [(DS(x0 ) h)(t)].
d
(ϕx +h (t) − ϕx0 (t)) = ψ(t, ϕx0 +h (t)) − ψ(t, ϕx0 (t))
dt 0
e sabemos S(x0 + h)(0) − S(x0 )(0) = h, é de se esperar que ξx0 ,h := (DS(x0 ) h) ∈ CT seja a
solução da EDO linearizada
com condição inicial ξx0 ,h (0) = h. Prove que esta fórmula é válida sob as hipóteses do
Teorema 13.6 (em particular, pode ajudar se você encontrar explicitamente a derivada da
função ST ).
240
Capítulo 14
241
14.1.1 Abertos de Rd
Este primeiro exemplo é realmente simples: consideramos um aberto A ⊂ Rd e mostramos
que ele é uma subvariedade C ∞ de dimensão d. De fato, o atlas deste aberto tem um único
elemento (Id×d , A, A), onde Id×d é a função identidade.
Prova: [Esboço] Para provar esta proposição, precisamos construir um atlas. Isso é bastante
simples e nosso atlas só terá uma tripla (f, U, A). Podemos tomar A = Rd e definir:
f : x ∈ U 7→ (x, g(x)).
f −1 : (x, y) ∈ graph(g) 7→ x,
242
Deste modo, uma subvariedade de Rd de dimensão m e classe C ℓ é um conjunto de Rd
em que, para quaquer p ∈ M , há uma parametrização C ℓ de M por Rm ao redor de p. No
entanto, um conjunto que não é subvariedade pode ter parametrizações como definidas
acima ao redor de alguns (mas não todos) seus pontos.
• temos também:
• Fp : Bp → Ap é um difeomorfismo C ℓ
• finalmente,
M ∩ Ap = {Fp (x, 0Rm−d ) : (x, 0Rm−d ) ∈ Bp }.
243
Note que R é injetiva: de fato, R y = 0Rd implica que cada coordenada de y é 0 (afinal, os
vi são linearmente independentes). Além disso, R y ∈ T ⊥ para todo y ∈ Rd−m .
Definimos F̃p : U × Rd−m → Rd como sendo a função que leva (x, y) ∈ U × Rd−m em
F̃p (x, y) = f (x) + R y. F̃p é C ℓ porque é a soma de uma função C ℓ com outra linear. Pode-se
verificar que a derivada DF̃p (x, y) aplicada a h = (hx , hy ) ∈ Rm × Rd−m é igual a:
Queremos aplicar o Teorema da Função Inversa a F̃p em uma vizinhança de (xp , 0Rd−m ).
Para isso, precisamos mostrar que vale a seguinte afirmação.
De fato, como DF̃p (x, y) ∈ L(Rm × Rd−m , Rd ) é uma aplicação linear entre espaços com
a mesma dimensão finita, só precisamos mostrar que DF̃p (xp , 0Rd−m ) é injetiva, o que é o
mesmo que mostrar que seu núcleo é {(0Rm , 0Rd−m )}.
Para isso, recordamos que Df (xp ) hx ∈ T e R hy ∈ T ⊥ são ortogonais e que a soma de
dois vetores ortogonais só se anula quando ambos são nulos. Desta forma, se (hx , hy ) está
no núcleo da derivada:
Como tanto Df (xp ) quanto R são injetivas, deduzimos que hx = 0Rm e hy = 0Rd−m , o que
prova a afirmação.
De posse da afirmação, deduzimos do Teorema da Função Implícita que existe um
difeomorfismo C ℓ F̃p : Lp → Cp entre vizinhanças abertas Lp ⊂ U ×Rd−m , com (xp , 0Rd−m ) ∈
Lp , e Cp ∋ p. Por construção, Fp (xp , 0Rd−m ) = f (x) ∈ M ∩ Cp sempre que (x, 0Rd−m ) ∈ Lp .
Reduzindo Cp e Lp , se necessário, podemos garantir que Cp ⊂ A (basta intersectar Cp com
A, notando que p ∈ Cp ∩ A, e trocar Lp por F̃p−1 (Cp ∩ A), que é um aberto).
Neste ponto, já temos quase tudo que queremos. Poderíamos tentar tomar Bp = Lp ,
Ap = Cp e Fp = F̃p e declarar a prova encerrada. Vale um aviso.
A questão é que ainda não sabemos se os pontos de M ∩ Cp são exatamente aqueles que
têm a forma F̃p (x, 0Rm−d ) para (x, 0Rm−d ) ∈ Lp . Ou seja, poderia existir um ponto q ∈ M ∩Cp
que não é da forma q = F̃p (x, 0Rd−m ).
Para evitar esse problema, vamos reduzir um pouco os conjuntos Lp e Cp . Basicamente
a ideia é tomar um Ap ⊂ Cp que é o menor possível para conter f (Zp ), onde Zp é o conjunto
abaixo.
Zp := {x ∈ Rm : (x, 0Rd−m ) ∈ Lp }.
Será importante entender algumas propriedades deste conjunto. Em primeiro lugar,
Zp é aberto de Rm porque Lp é aberto de Rd . Além disso, Zp ⊂ U porque Zp × {0Rd−m } ⊂
Lp ⊂ U × Rd−m .
244
Recorde que f : U → A ∩ M é homeomorfismo. Como Zp é aberto de Rm , ele também
é um aberto relativo de U . Desta maneira, f (Zp ) é um aberto relativo de M ; ou seja, existe
um conjunto Z̃ ⊂ Rd aberto de Rd com f (Zp ) = M ∩ Z̃. Além disso, como Z ×{0Rd−m } ⊂ Lp ,
portanto:
f (Zp ) = M ∩ (Z̃ ∩ Cp ).
De fato, já sabemos que M ∩ Ap = f (Zp ) = F (Zp × {0Rd−m )). Basta então mostrar que
Isto é equivalente a mostrar que Zp × {0Rd−m } ⊂ Bp . Para isso, basta observar que:
Portanto,
Fp (x, 0Rd−m ) ∈ M ∩ Ap = f (Zp ) = F (Zp × {0Rd−m }).
245
14.3 O espaço tangente e a dimensão
Agora o nosso propósito será explicar como é o chamado espaço tangente de uma variedade.
Primeiro temos uma definição geral.
Definição 14.3 Considere um conjunto M ⊂ Rd . O espaço tangente de M em p ∈ M , denotado
por Tp M , é o conjunto de todos os vetores γ ′ (0), onde γ : (−ε, ε) → M é uma curva parametrizada
(contínua) que é diferenciável na origem e satisfaz γ(0) = p.
Esta definição é puramente geométrica e não tem nada a ver com variedades: dado
qualquer conjunto M , Tp M é definido. Note que 0Rd ∈ Tp M sempre, porque podemos
tomar γ(t) ≡ p. Em alguns outros casos, o espaço tangente pode conter apenas este vetor,
ou conter todos os vetores.
p
Exercício 14.2 Considere o cone C := {x ∈ R3 : x[3] = 1 − x[1]2 + x[2]2 }. Mostre que e3 ∈ C
e que Te3 M = {0R3 }.
Exercício 14.3 Tome M ⊂ Rd qualquer. Mostre que Tp M = Rd para todo p ∈ M o (isto é, todo p
que é ponto interior de M ).
O que as subvariedades têm de especial é que, para todas elas, o espaço tangente é um
subespaço vetorial de Rd que tem dimensão igual à da subvariedade M .
teo:TpM Teorema 14.1 Considere um conjunto M ⊂ Rd e p ∈ M . Suponha que M tem uma parametri-
zação (f, U, A) por Rm e de classe C ℓ ao redor de p. Chame de xp = f −1 (p). Então
Tp M = ran Df (xp ).
Como corolário, Tp M é um subespaço vetorial de Rd com dimensão m.
Uma consequência importante deste teorema é que, quando M é uma subvariedade C ℓ
de dimensão m, a dimensão de M não depende do atlas escolhido. Se tomarmos dois atlas para
a mesma variedade, eles têm de “concordar sobre as dimensões do espaço tangente" e
portanto sobre a dimensão de M . Esta é a primeira manifestação de fenômenos intrínsecos
na teoria de subvariedades.
Prova: [Prova do Teorema 14.1] A prova deste teorema tem uma direção fácil, outra difícil
e o corolário no final.
Direção fácil: Tp M ⊃ ranDf (x).
Tome v ∈ ranDf (x) arbitrário; nosso objetivo é mostrar que v ∈ Tp M , isto é, que há
uma curva γ : (−ε, ε) → M com γ(0) = p e γ ′ (0) = v.
Para fazer isso, tome uma pré-imagem w ∈ Rm de v sob Df (x): ou seja, escolha w ∈ Rm
com Df (x) w = v. Tome a curva η(t) := xp + t w e observe que, se |t| < ε, com ε pequeno
o suficiente, η(t) ∈ U . Desta forma, podemos definir γ(t) := f (xp + t w) para t ∈ (−ε, ε).
Isto garante γ(0) = p. Também podemos obter pela regra da cadeia que
γ ′ (0) = Df (xp ) η ′ (0) = Df (xp ) w = v,
como queríamos.
246
Direção difícil: Tp M ⊂ ranDf (x).
Ou seja, temos que mostrar que, se há γ : (−ε, ε) → M contínua com γ(0) = p, γ ′ (0) = v,
então há um w ∈ Rm com Df (xp ) w = v.
Para isso, será fundamental usarmos a Proposição 14.2. Por hipótese, (f, U, A) é uma
parametrização C ℓ de M por Rm ao redor de p. Desta forma, a proposição nos diz que
existem abertos Bp ∋ (xp , 0Rd−m ) com Bp ⊂ U × Rd−m , e Ap ⊂ A ⊂ Rd , além de um
difeomorfismo C ℓ Fp : Bp → Ap , tais que:
∀(x, 0Rd−m ) ∈ Bp : Fp (x, 0Rd−m ) = f (x) e M ∩ Ap = {Fp (x, 0Rd−m ) : (x, 0Rd−m ) ∈ Bp }.
Chame de η(t) := Fp−1 ◦γ(t). Em princípio, η(t) só está definida para aqueles t ∈ (−ε, ε)
tais que γ(t) ∈ Ap . No entanto, como γ(0) = p ∈ Ap e Ap é aberto, podemos reduzir ε
se necessário para garantir que γ(t) ∈ Ap sempre que t ∈ (−ε, ε). De fato, suporemos a
seguir que esta troca de ε já foi feita.
Agora observe duas coisas. Em primeiro lugar, η é diferenciável em t = 0 porque Fp−1
e γ são diferenciáveis. Além disso – e esse é o principal ponto – como γ(t) ∈ M ∩ Ap , a
proposição garante que
∀t ∈ (−ε, ε) ∃ηm (t) ∈ Rm : (ηm (t), 0Rd−m ) ∈ Bp e η(t) = Fp−1 (γ(t)) = (ηm (t), 0Rd−m ).
Sobre o corolário.
247
Definição 14.4 Dadas Φ : U ⊂ Rd → Rk diferenciável, dizemos que c ∈ Rk é valor regular de
Φ se para todo x ∈ Φ−1 (c) a derivada DΦ(x) é sobrejetiva.
Nosso principal teorema nesta seção será que as imagens inversas de valores regulares
são sempre subvariedades de Rd . Mais ainda: o teorema nos diz como é o espaço tangente
da subvariedade.
deimplicita Teorema 14.2 Suponha que Φ : U ⊂ Rd → Rk C ℓ e que M := Φ−1 (c) ̸= ∅, onde c é um valor
regular de Φ. Defina m = d − k. Então M é uma subvariedade m-dimensional de Rd de classe C ℓ .
Em cada p ∈ M ,
Tp M = ker DΦ(p).
Agora repare que DΦ(p) é sobrejetiva se e somente se o posto – isto é, o número de colunas
linearmente independentes de DΦ(p) – é igual a k. Como sabemos, o posto também é
igual ao número de linhas l.i. de DΦ(p). Portanto, pedir que DΦ(p) seja sobrejetiva é o
mesmo que pedir a seguinte condição:
tem dimensão d − k. Como M se parece com este conjunto localmente, segue que ela deve
ser uma subvariedade de dimensão (d − k).
Provaremos o teorema abaixo, mas é tão ou mais importante entender suas aplicações
antes de seguir.
248
14.4.1 Exemplos de subvariedades definidas implicitamente
Exemplo 14.1 (Hiperplanos e subespaços) Se a1 , . . . , ak ∈ Rd são vetores l.i. e c[1], . . . , c(k) ∈
R, a teoria geral de Álgebra Linear nos diz que o sistema
x · ai = c[i], 1 ≤ i ≤ k
tem infinitas soluções, que (a menos de uma translação) formam um subespaço vetorial de dimensão
(d − k). Este é um caso particular de nosso teorema quando Φ(x) = (ai · x)ki=1 .
M := {x ∈ Rd : |A(x − x0 )|22 = r2 }.
Este é um subespaço vetorial de Rd×d com dimensão d(d + 1)/2 (exercício!). Portanto, a
função
d×d
Ψ : Rd×d → RSym
que leva A ∈ Rd×d em Ψ(A) := AT A pode ser pensada como uma função de d2 dimensões
em d(d + 1)/2 dimensões. Portanto, se O(d) for variedade, ele tem dimensão d(d − 1)/2.
Para ver que isso é verdade, checaremos que Ψ é suave e tem derivada sobrejetiva em
todo ponto A ∈ O(d) = Ψ−1 (I). A suavidade é trivial se percebemos que a função Ψ é um
polinômio nas entradas de A.
Quando à injetividade da derivada, veja em primeiro lugar que:
d×d
∀A, H ∈ Rd×d : DΨ(A) H = H T A + AT H ∈ RSym .
249
Se A ∈ O(d), então A−1 = AT e em particular A é inversível.
Para mostrarmos que DΨ(A) é injetiva devemos provar que, para cada A ∈ O(d) e cada
Sym há uma matriz H com A H + H A = M . Para isso, tome H = AM/2 e veja
M ∈ Rd×d T T
que, como M = M T :
Isto conclui a prova e ainda nos dá uma fórmula para calcular o espaço tangente. Por
exemplo:
TI O(d) = {H ∈ Rd×d : H = −H T }
é o espaço das matrizes d × d antissimétricas.
tacoordfree Lema 14.1 Considere Φ : U ⊂ Rd ⊂ Rk , M = Φ−1 (c) e m = d − k como no Teorema 14.2. Tome
p ∈ M , chame de T := ker DΦ(p) e de T ⊥ o complemento ortogonal de T em Rd . Então podemos
encontrar uma vizinhança Ap ∋ p em Rd , uma vizinhança Bp de 0Rm em Rm , uma transformação
linear inversível Rp ∈ L(Rm , T ) e uma função C ℓ , gp : R(Bp ) → T ⊥ , tais que:
M ∩ Ap = {p + Rp x + gp (x) : x ∈ Bp }.
Prova: Uma observação preliminar é que, como DΦ(p) ∈ L(Rd , Rk ) é sobrejetiva, seu
núcleo T tem dimensão d − k = m.
250
Tome, então, uma base ortonormal b1 , . . . , bd de Rd cujos m primeiros vetores são base
de T . Isto implica que os vetores bm+1 , bm+2 , . . . , bd são base ortonormal de T ⊥ . Definimos
Rp ∈ L(Rm , T ) e Sp ∈ L(Rk , T ⊥ ) via:
m
X
Rp x = x[i] bi (x ∈ Rm )
i=1
Xk
Sp y := y[j] bj+m (y ∈ Rk ).
j=1
É um exercício mostrar que tanto Rp quanto Sp são injetivas e portanto inversíveis (já que
dim(T ) = m e dim(T ⊥ ) = d − m).
Finalmente, defina
u : (x, y) ∈ Rm × Rk 7→ p + Rp x + Sp y ∈ Rd .
Observe que u é afim e contínua. Além disso, ela tem inversa contínua. Isso vem do fato
facilmente checável que a parte linear de u é Rp x + Sp y, uma transformação inversível de
Rm × Rk ≈ Rd em Rd .
Como u(0Rm , 0Rk ) = p, a composição Φ ◦ u está bem definida como função
Φ ◦ u : u−1 (U ) ⊂ Rm × Rk → Rd
com (0Rm , 0Rk ) no domínio.
Provaremos agora a seguinte afirmação.
251
Podemos agora aplicar o Teorema da Função Implícita, que garante que existem vizi-
nhanças U0 ∋ 0Rm e A0 ∋ (0Rm , 0Rk ), além de uma função C ℓ g0 : A0 → U0 com
M ∩ Ap = {p + Rp x + gp (x) : x ∈ Up } = fp (Up ).
Afirmamos que (fp , Up , Ap )p∈M é um atlas. Para provar isso, começamos observando
que M ⊂ ∪p∈M Ap e fp : Up → M ∩ Ap é C ℓ .
Vamos checar que a derivada de fp é injetiva. Temos:
Se h ∈ kerDfp (x), Rp h + Dgp (x) h = 0Rd . Como gp (x) ∈ T ⊥ para todo x ∈ Up , temos que
Dgp (x) ∈ L(Rm , T ⊥ ) e Dgp (x) h. Além disso, Rp h ∈ T . Portanto, para que Rp h+Dgp (x) h =
0, devemos ter Rp h = Dgp (x) h = 0Rd , o que implica h = 0Rm (porque Rp é inversível). Ou
seja, o único elemento do núcleo de kerDfp (x) é o vetor nulo. Segue que Dfp (x) é injetiva
para todo x ∈ Up .
Falta mostrar que fp : Up → M ∩ Ap é um homeomorfismo. Como já sabemos que
fp é contínua, nos resta provar que fp é sobrejetiva, injetiva e tem inversa contínua.
Como vimos, fp (Up ) = M ∩ Ap , logo a sobrejetividade está garantida. As outras duas
propriedades seguem do seguinte fato, que provaremos a seguir:
252
Isto implica não só que fp é injetiva, mas que sua inversa é (1/c)-Lipschitz. Para provar a
desigualdade acima, partimos de:
|fp (x) − fp (x′ )|2 = |Rp (x − x′ ) + gp (x) − gp (x′ )|2 ≥ |Rp (x − x′ )|2
Como Rp−1 não se anula, podemos tomar c = 1/∥Rp−1 ∥Rm →Rm > 0 e deduzir a desigualdade
desejada.
Finalmente, falta calcular o espaço tangente de M em cada p ∈ M . Veja que este
espaço tem dimensão m, a mesma do núcleo de DΦ(p). Deste modo, para provar que
Tp M = kerDΦ(p), basta mostrar que Tp M ⊂ kerDΦ(p).
Isto é fácil. Tome fp como acima e v ∈ Tp M . Sabemos que fp (0Rm ) = p e v = Dfp (0Rm ) w
para algum w ∈ Rm . Por outro lado, Φ ◦ fp (x) = c para todo x ∈ Up , logo:
(fα , Uα , Aα )α∈I .
253
254
Parte IV
255
Capítulo 15
1. Dados (t0 , x0 ) ∈ R × Rd , existe uma única função contínua ξ : R → R tal que ξ(t0 ) = x0
e ξ ′ (t) = Ψ(t, ξ(t)) (t ∈ R). Qualquer função satisfazendo as mesmas propriedades em um
intervalo fechado I ∋ t0 coincide com ξ dentro deste intervalo.
Exemplo 15.2 Se d = 2 e Ψ(t, x) = (x[2], −x[1]), a solução com ξ(0) = (0, 1) é dada por
ξ(t) = (sen t, cos t).
257
Prova: Suporemos que t0 = 0 no que segue, para carregar menos a notação.
Esta prova tem três partes principais.
Parte 1. Fixe T > 0 e defina CT := C([−T, T ], R). Como já vimos muitas vezes, ξT resolve
nossa EDO para t ∈ [−T, T ] se e somente se é um ponto fixo do operador
Z t
T : f ∈ C 7→ T (f ) ∈ CT com T (f )(t) := x0 + Ψ(s, f (s)) ds (t ∈ [−T, T ]).
0
Aplicaremos o teorema do ponto fixo de Banach para provar que o ponto fixo existe, é
único e estável. Para isso, observamos que CT é completo com sua norma do sup (chamada
de ∥ · ∥T abaixo) e passamos a calcular o coeficiente de Lipschitz de cada iterada T n do
mapa T . O lema a seguir dá conta disto:
(L|t|)n
∀t ∈ [−T, T ] : |T n (f )(t) − T n (g)(t)| ≤ ∥f − g∥T ,
n!
Em particular, T n é (L T )n /n!-Lipschitz.
Veja que esta afirmação termina a prova do primeiro passo porque temos:
X (LT )n
= eLT < +∞
n∈N
n!
Provemos então a afirmação. Veja que o caso n = 0 é trivial. Para seguir por indução,
suponha que, para algum n ≥ 0,
(L|t|)n
∀t ∈ [−T, T ] : |T n (f )(t) − T n (g)(t)|2 ≤ ∥f − g∥T ;
n!
258
Vejamos agora como se comporta a mesma quantidade quando passamos de n para n + 1.
Escreva fn := T n (f ) e gn := T n (g). Usando a fórmula para T , vemos que, para t ≥ 0,
Uma conta muito parecida prova o resultado análogo para t < 0. Para terminar, temos:
Parte 2. Agora queremos provar a existência global. Já sabemos que para cada intervalo
[−T, T ] há uma solução ξT de nosso problema. A principal observação desta parte da
prova é que, se S > T , a solução ξS restrita ao intervalo [−T, T ] tem de coincidir com ξT .
Isto ocorre porque ξS |[−T,T ] : [−T, T ] → Rd também é contínua, satisfaz ξS |[−T,T ] (0) =
x0 e ξS |′[−T,T ] (t) = ξS′ (t) = Ψ(t, ξS (t)) for t ∈ [−T, T ]. Ou seja, ξS |[−T,T ] resolve o mesmo
problema de Cauchy que ξT . Como ξT é a única solução, tem de valer a observação acima.
O valor da observação é que ela nos permite passar do local para o global. De fato, se
definimos
ξ(t) := ξT (t), onde T > |t| (t ∈ R)
a observação nos mostra que isto está bem definido porque, dados quaisquer S > T > |t|,
temos ξT (t) = ξS (t). Vê-se ainda que ξ(0) = 0 e ξ ′ (t) = Ψ(t, ξ(t)) para todo t ∈ R pelo
simples fato que as ξT satisfazem estas propriedades nos seus respectivos intervalos. A
unicidade para t ∈ R vem do fato que qualquer outra solução também terá de coincidir
com cada ξT no seu intervalo [−T, T ], pelo raciocínio exposto acima.
Parte 3. Provaremos agora a dependência contínua. Tome T := |t|. Considere o mesmo
operador T : CT → CT visto acima. Note que uma solução com ξ(0) ˜ = x˜0 satisfaz
Z t
˜ = x˜0 +
ξ(t) ˜
Ψ(s, ξ(s)) ˜
ds = (x˜0 − x0 ) + T (ξ)(t).
0
Portanto,
∥ξ˜ − T (ξ)∥
˜ T = |x0 − x̃0 |2 .
259
Isto nos permite comparar ξ˜ com a solução ξ para ξ(0) = x0 . De fato, sabemos que esta
solução coincide com ξT no intervalo [−T, T ]. Portanto, a desigualdade de estabilidade na
equação (15.1) nos garante que
L := LK0 = a constante local de Lipschitz para o compacto K0 , que supomos ser finita.
260
Agora nos restringimos a um subconjunto I × BRd [x0 , R], com I = [−δ, δ] e
R
δ := min δ0 , .
2M
Defina
Z t
Tx̃0 : f ∈ C(I, BRd [x0 , R]) 7→ Tx˜0 (f ) com Tx˜0 (f )(t) = x̃0 + Ψ(s, f (s)) ds (t ∈ I).
0
Veja que Tx̃0 (f ) ∈ C(I, Rd ). Afirmamos que, x̃0 ∈ BRd [x0 , R/2], Tx̃0 (f ) ∈ C(I, BRd [x0 , R])
sempre. De fato, veja que, para todo t ∈ I,
Prove que |f (t) − g(t)|2 ≤ eL(t−a) |f (0) − g(0)| para todo t ∈ [a, b]. (A ideia é fazer uma indução
semelhante à usada na prova da Estimativa de Picard, Afirmação 15.1 acima.)
261
Exercício 15.4 Neste problema, usaremos o fato que existe uma única solução para a EDO E ′ (t) =
E(t) com E(0) = 1. Nosso objetivo será provar que esta função – que sabemos ser a exponencial
natural – satisfaz E(t) > 0 para todo t ∈ R, E(t + x) = E(t)E(x) para todos t, x ∈ R e outras
propriedades conhecidas.
1. Suponha primeiramente que x ∈ R é tal que E(x) > 0. Mostre que a função f (t) :=
E(t + x)/E(t) (t ∈ R) resolve a mesma EDO que a exponencial e que portanto f (t) = E(t)
para todo t. Deduza que E(t + x) = E(t) E(x).
2. Mostre que para todo x ∈ R existe um k ∈ N com E(x/k) > 0e deduza que E(x) =
E(x/k)k > 0. Como isto vale para todo x, deduza que E(t + x) = E(t) E(x).
Exercício 15.5 Neste problema, usaremos o fato que existe uma única solução para o sistema de
EDOs
S, C : R → R,
′
S (t) = C(t)
C ′ (t) = −S(t)
C(0) = 1, S(0) = 0
para provar propriedades do seno e do cosseno (que sabemos serem soluções do sistema acima).
1. Explique como este sistema pode ser posto na forma “ξ ′ (t) = Ψ(t, ξ(t))" com dimensão
espacial d = 2.
3. Mostre que S(−t) = −S(t) e C(−t) = C(t) para todo t (dica: que sistema as funções
−S(−t), C(−t) resolvem?).
4. Prove que há um número π/2 > 0 tal que S(π/2) = 1, C(π/2) = 0 e S(t), C(t) ∈ (0, 1)
para todo t ∈ (0, π/2).
5. Prove que C(t + π/2) = −S(t) e S(t + π/2) = C(t) para todo t ∈ R.
262
Parte V
263
Capítulo 16
Em todo este capítulo, nos focaremos nos espaços de funções contínuas C := C(K, V ),
onde (K, dK ) é um espaço métrico compacto.
Também estaremos interessados em saber quando f ′ (t) = fn′ (t) para todo t ∈ K no
P
n∈N
caso em que isto faz sentido (isto é, quando K ⊂ R).
Um caso particular importante é dado a seguir.
ex:seriepot Exemplo 16.1 (Séries de potência) Neste caso supomos d = 1 e K = [t0 − R, t0 + R] com
t0 ∈ R e R ∈ R. Nosso objetivo será investigar quando uma série do tipo
X
f (t) = cn (t − t0 )n
n∈N
converge a uma função contínua de t ∈ K, onde {cn }n∈N é uma sequência previamente escolhida
de valores reais. Também procuraremos condições sob as quais podemos diferenciar a série, obtendo
a identidade esperada X
f ′ (t) = ncn (t − t0 )n−1 .
n∈N\{0}
265
P Pk
Proposição 16.1 Se n ∥fn ∥∞ < +∞, então existe f ∈ C tal que ∥f − n=0 fn ∥ → 0 quando
k → +∞.
Prova: Defina gk := kn=0 fn . Como C é completo, basta provar que {gn }n∈N é Cauchy.
P
Nossa hipótese garante que:
X
∥gn − gn+1 ∥∞ < +∞.
n
em:somadist
P Se (X, dX ) é um espaço métrico, então qualquer sequência {xn }n∈N que
Lema 16.1
satisfaz n∈N dX (xn , xn+1 ) < +∞ é Cauchy. (Em particular, se X é completo, a
sequência converge.)
Prova: Fixemos ε > 0. Nosso objetivo é mostrar que ∃n0 = n0 (ε) ∈ N tal que
xm ) < ε para todos n, m ∈ N com n, m ≥ n0 . Para isso, observamos que,
dX (xn ,P
como P n∈N d(xn , xn+1 ) é uma série convergente, necessariamente existe um n0
tal que k≥n0 (ε) dX (xk , xk+1 ) < ε. Afirmamos que este n0 tem a propriedade
que queremos. De fato, se m, n ≥ n0 e m ≥ n – ou seja, m = n + j para algum
j ∈ N – a desigualdade triangular garante
2
Vejamos agora como aplicar este resultado ao Exemplo 16.1 sobre séries de potência.
266
Prova: Para cada n ∈ N, defina fn ∈ C como
fn (t) := cn (t − t0 )n (t ∈ K).
eo:difserie Teorema 16.2 Seja {fn }n∈N ⊂ C([a, b], V ) uma sequência de funções satisfazendo as três propri-
edades a seguir.
Pk
1. Existe um ponto t0 ∈ [a, b] tal que n=0 fn (t0 ) → c ∈ Rd quando k → +∞.
EntãoPexiste uma função contínua f ∈ C([a, b], V ) e com derivada f ′ ∈ C([a, b], V ) tal que
f = n∈N fn e f ′ = n∈N fn′ (no sentido de convergência uniforme de séries de funções).
P
Prova: (do Teorema 16.2) Defina gk := kn=0 fn (k ∈ N). Veja que, para cada k, o teorema
P
fundamental do Cálculo nos garante que
gk = gk (t0 ) + I(gk′ ),
267
Rt
onde I : C → C leva a função h numa nova função I(h) com I(h)(t) = t0 h(s)ds.
Recordamos que este é um operador limitado.
Sabemos ainda que é uma soma de funções diferenciáveis, n=0 fn . Como
′
Pk ′
g k gk =
n ∥fn ∥ < +∞, o resultado da seção anterior nos garante que existe h ∈ C que é o limite
′
P
uniforme das somas gk = n=0 fn . Como sabemos que I é contínuo, isto também quer
′
Pk
dizer que I(gk′ ) → I(h) uniformemente.
Defina agora f := c + I(h). Observe que, pela subaditividade da norma e as nossas
estimativas anteriores,
1 1 X
lim sup |cn | n < ⇒ f (t) := cn (t − t0 )n (t ∈ K) converge uniformemente em .
n→+∞ R n∈N
Prova: A ideia é checar que o Teorema 16.2 se aplica. Escreva fn (t) := cn (t − t0 )n . Veja
Pque′
′
fn (t) = ncn (t − t0 )n−1
existe para cada n e é função contínua. Além disso, veja que n fn
também é série de potência, em que o termo (t − t0 )n tem coeficiente (n + 1) cn+1 . Não é
difícil verificar que
1 1
lim sup |(n + 1) cn+1 | n = lim sup |cn | n ,
n→+∞ n→+∞
Portanto, se o lim sup é < 1/R para a série original, também é para a série das derivadas.
Usando novamente o teste da raíz, deduzimos que
1 1 X
lim sup |cn | n < ⇒ ∥fn′ ∥ < +∞.
n→+∞ R n
Por fim, vemos que fn (t0 ) = c0 para todo k, o que prova a convergência pontual em
Pk
n=0
t0 . 2
268
16.2 Mais exercícios
P 16.2 Seja f : [t0 − R, t0 + R] → R uma função dada por uma série de potência
Exercício
f (t) = Pn∈N cn (t − t0 )n com lim supn |cn |1/n < 1/R. Prove que eiste uma outra série de potência
g(t) = n∈N un (t − t0 )n com {un }n∈N ⊂ R também satisfazendo lim supn∈N |un |1/n < 1/R, tal
Rt
que t0 f (s) ds = g(t) para todo t ∈ [t0 − R, t0 + R].
Exercício 16.3 Mostre que as séries de potência a seguir convergem uniformemente e definem
funções infinitamente diferenciáveis sobre qualquer intervalo compacto [a, b] ⊂ R.
tn
P
1. n∈N n!
2t n
P
2. n∈N n
tn
P
3. n∈N par n!
Exercício 16.4 Dado 0 < R < 1, escreva a série de potência de uma função f : [−R, R] → R tal
que f (0) = 0 e f ′ (t) = (1 + t)−1 para todos t no domínio. Chamando de cn os coeficientes da série,
1
mostre que limn∈N |cn | n = 1 e explique porque isto é razoável.
Exercício 16.5 Mostre que o conjunto de todas as funções polinomiais com coeficientes racionais
é denso em C([a, b], R), para qualquer intervalo compacto [a, b] ⊂ R.
269
• Problema de Cauchy Local (existência): Dados (t0 , x0 ) ∈ A, nossa pergunta é se
existe um δ > 0 e uma ξ : [t0 − δ, t0 + δ] → Rd satisfazendo as seguintes propriedades:
ξ(t0 ) = x0 ;
(P ) (t, ξ(t)) ∈ A, t ∈ [t0 − δ, t0 + δ];
′
ξ (t) = Ψ(t, ξ(t)), t ∈ [t0 − δ, t0 + δ].
Exemplo 16.2 Suponha que d = 1, A = R × R Ψ(t, x) = 2 |x|1/2 . Pode-se checar que, para
qualquer c > 0, a EDO ξ ′ (t) = |ξ(t)|1/2 (t ∈ R) com ξ(0) = 0 pode ser resolvida por
0 , −∞ < t ≤ c;
ξ(t) = 2
(t − c) , t > c.
O principal teorema desta seção é o seguinte.
Teorema 16.4 Suponha que A ⊂ R × Rd , Ψ : A → Rd e (t0 , x0 ) são como acima. Suponha ainda
que Ψ é contínua. Então o problema de Cauchy descrito acima tem pelo menos uma solução.
De fato, nossa prova dará uma maneira explícita de construir soluções aproximadas,
que é chamada de Método de Euler. A ideia é que esperamos que, pela condição da
derivada, esperamos que ξ(t + ε) − ξ(t) ≈ ε ξ ′ (t) = ε Ψ(t, ξ(t)). Grosso modo, o que o
Método de Euler faz é tomar esta aproximação como definição de uma ξε contínua sobre
os pontos t0 , t0 ± ε, t0 ± 2ε, t0 ± 3ε, . . . . Ou seja, a ideia é discretizar o tempo e usar Ψ para
definir a inclinação de ξε nestes instantes de tempo discretizado. Botar esta ideia para funcionar
vai requerer algum cuidado, como veremos a seguir.
16.3.1 Localização
localizacao
Teremos de restringir o domínio antes mesmo de construirmos a aproximação de Euler.
A razão para isso é que só sabemos definir a aproximação dentro do conjunto A. Para
garantirmos que estamos sempre lá dentro, será preciso “andar com cuidado" lá dentro,
mantendo a trajetória sempre dentro de um compacto K0 no espaço-tempo. Na verdade,
para isso, precisaremos de um compacto K1 ainda menor.
Mais precisamente, nossa ideia é escolher um δ0 > 0 e um R0 > 0 tais que o conjunto
compacto
K0 := [t0 − δ0 , t0 + δ0 ] × BRd [x0 , R0 ] ⊂ A.
Como sabemos que δ0 , R0 existem de fato? Observe que (t0 , x0 ) ∈ A – um conjunto
aberto – e uma conta fácil demonstra
q
[t0 − δ0 , t0 + δ0 ] × BRd [x0 , R0 ] ⊂ BRd+1 [(t0 , x0 ), R] com R := δ02 + R02 .
270
Portanto BRd+1 [(t0 , x0 ), R] ⊂ A se R > 0 é pequeno o suficiente.
Uma propriedade importante que ganhamos pela compacidade de K0 é que
ξε : [t0 − δ, t0 + δ] → Rd
da seguinte forma.
1. ξε (t0 ) = x0 ;
R0
|ξε (tr−1 ) − x0 |2 ≤ M (tr−1 − t0 ) ≤ M δ ≤ ⇒ (tr−1 , ξε (tr−1 )) ∈ K0 .
2
271
Em particular, |Ψ(tr−1 , ξε (tr−1 ))|2 ≤ M . Portanto, usando a hipótese de indução,
|ξε (tr ) − x0 |2 ≤ (tr − tr−1 ) |Ψ(tr−1 , ξε (tr−1 )|2 + |ξε (tr−1 ) − x0 |2 ≤ M (tr − t0 ).
T : C → C([t0 − δ, t0 + δ],RRd )
·
f 7→ T (f )(·) := x0 + t0 Ψ(s, f (s)) ds.
Como já observamos antes, qualquer ponto fixo de T é uma solução de (P) (isto é tão
somente uma consequência do Teorema Fundamental do Cálculo). O lema a seguir será
fundamental para a construção de soluções.
Prova: Vamos mostrar isto a partir da definição ε/δ de continuidade. Para não confundir
as coisas, vamos usar letras gregas distintas para estes símbolos. Nosso objetivo será o
seguinte.
Note que há um ligeiro abuso de notação aqui, porque usamos a mesma notação de
norma ∥ · ∥ para dois espaços possivelmente diferentes de funções contínuas. No entanto,
isso não causará confusão.
272
Pare chegar a nosso objetivo, recordamos a definição do compacto K0 na Seção 16.3.1.
Como Ψ |K0 é contínua, logo uniformemente contínua, existe um α > 0 que garante que
β
∀(t, x), (t′ , x′ ) ∈ K0 : |(t, x) − (t′ , x′ )|2 ≤ α ⇒ |Ψ(t, x) − Ψ(t′ , x′ )|2 ≤ .
2δ
Em particular, se f, g ∈ C e ∥f − g∥ < α, os pares (t, f (t)) e (t, g(t)) pertencem a K0 para
cada t ∈ [t0 − δ, t0 + δ], de modo que
β
∀t ∈ [t0 − δ, t0 + δ] : |Ψ(t, f (t)) − Ψ(t, g(t))|2 ≤ .
2δ
Sabemos que, para cada t0 − δ ≤ t ≤ t0 + δ
Z t
|T (f )(t) − T (g)(t)|2 = (Ψ(s, f (s)) − Ψ(s, g(s)) ds .
t0 2
ntpontofixo Lema 16.3 Dado β > 0, existe um ε0 > 0 tal que, se 0 < ε < ε0 , então ∥T (ξε ) − ξε ∥ < β.
273
A diferença é igual a
i−1 Z
X tj
T (ξε (t)) − ξε (t) = (Ψ(s, ξε (s)) − Ψ(tj−1 , ξε (tj−1 ))) ds
j=1 tj−1
Z t
+ (Ψ(ti−1 , ξε (s)) − Ψ(ti−1 , ξε (ti−1 ))) ds. (16.3)
ti−1
Observe que (s, ξε (s)) ∈ K0 para todos os s ∈ [t0 , t0 + δ]. Como K0 é compacto e Ψ |K0 é
contínua, existe um α > 0 tal que, se (s, x) e (s′ , x′ ) estão em K0 e |(s, x) − (s′ , x′ )|2 < α,
então |Ψ(s, x) − Ψ(s′ , x′ )|2 < β/2δ. Por outro lado, recorde que ξε é M -Lipschitz, com
M := sup(t,x)∈K0 |Ψ(t, x)|2 . Portanto, se ε < ε0 := α/(M + 1), temos que, para cada termo
de j = 1 a i − 1 da soma acima,
tj−1 ≤ s ≤ tj ⇒ |tj−1 − s| ≤ ε e |ξε (tj−1 ) − ξε (s)|2 ≤ M ε,
de modo que
q
|Ψ(s, ξε (s)) − Ψ(tj−1 , ξε (tj−1 ))|2 ≤ (t − tj−1 )2 + M 2 (t − tj−1 )2 < α
e
i−1 Z tj
X β
| (Ψ(s, ξε (s)) − Ψ(tj−1 , ξε (tj−1 ))) ds|2 ≤ (tj − tj−1 )
j=1 tj−1 δ
O mesmo racicínio dá uma cota para a integral de ti−1 a t:
Z t
(t − ti−1 ) β
| (Ψ(ti−1 , ξε (s)) − Ψ(ti−1 , ξε (ti−1 ))) ds|2 < .
ti−1 δ
As desigualdades acima nos dão cotas para todas as integrais aparecendo em (16.3).
Somando-as, deduzimos:
i−1
X β (t − ti−1 ) β (t − t0 )β
|T (ξε )(t) − ξε (t)|2 ≤ (tj − tj−1 ) + ≤ ≤ β.
j=1
δ δ δ
Ou seja, sempre que 0 < ε ≤ ε0 = α/(M + 1), temos |T (ξε )(t) − ξε (t)|2 < β. 2
274
Prova: Vamos trabalhar com todos os ingredientes vistos acima. Em primeiro lugar,
notamos o seguinte.
Afirmação 16.1 O conjunto das funções {ξε }ε>0 é totalmente limitado (portanto seu fecho é
compacto).
é limitado.
Provada esta primeira afirmação, tome εj ↘ 0 como no enunciado. Pela afirmação,
{ξεj }j∈N ⊂ C possui uma subsequência convergente ξεjk → ξ ∈ C quando k → +∞. Veja
que também temos εjk → 0, portanto o Lema 16.3 e a continuidade de T garantem que:
Exercício 16.6 Considere um espaço métrico (X, dX ). Seja S ⊂ X um subconjunto que a priori
poderia ser vazio. Suponha que uma sequência {xn }n∈N ⊂ X satisfaz as seguintes propriedades.
• Dada qualquer subsequência {xn }n∈N1 , há uma subsubsequência {xn }n∈N2 com N2 ⊃ N1
que é convergente.
275
276
Capítulo 17
Isso é importante? Sim, e muito! Uma maneira de ver isso é pensando no seguinte:
A resposta simples é que não pode. Uma função contínua f : K → R é uma “lista" não
enumerável de valores reais (f (t))t∈K . Como poderíamos guardar uma descrição de um
objeto destes com memória finita?
Por outro lado, se temos um subconjunto denso e simples de C(K, R), pode ser que
seja sim possível guardar uma descrição finita deste objeto. Por exemplo, o teorema
de Weierstrass abaixo mostra que os polinômios multivariados de coeficientes racionais
são densos em C(K, R) para qualquer compacto K ⊂ Rd . Não é difícil perceber que
cada polinômio deste tipo pode ser descrito com uma quantidade finita de memória.
Como estes polinômios são densos em C(K, R), vemos que qualquer função pode ser bem
aproximada por um objeto com descrição finita. Isto é análogo ao fato que todo número
real pode ser bem aproximado por um racional.
Uma outra questão interessante, que veremos mais adiante, é a seguinte.
Exemplo 17.2 Uma rede neural de duas camadas pode aproximar qualquer função contínua.
277
Exemplo 17.3 Para outro exemplo, considere o conjunto Cper ([0, 2π], R) de funções f : [0, 2π] →
R contínuas com f (0) = f (2π). Veremos abaixo que cada função deste tipo pode ser pensada como
uma função f˜ : S1 → R e que, usando esta conexão, podemos aproximar cada f ∈ Cper ([0, 2π], R)
por combinações lineares de sin kt e cos mt, m, k ∈ N. Isso tem algo a ver com a teoria de séries de
Fourier.
Definição 17.1 Uma álgebra A ⊂ C é um conjunto de funções fechado por combinações lineares
e produtos de seus elementos. Isto é, A é álgebra se dados quaisquer f, g ∈ A e α ∈ R, vale que
α f + g ∈ A e f g ∈ A.
ex:poliSW Exemplo 17.4 Sempre que A é uma álgebra e p : R → R é um polinômio, vale a seguinte
afirmação:
∀f ∈ A : p ◦ f ∈ A.
Teorema 17.1 (Stone-Weiertrass) Considere uma álgebra A ⊂ C(K, R). Suponha que A satis-
faz as seguintes condições adicionais:
1. A contém todas as funções constantes. De fato, basta pedir que a função constante 1 ∈ A,
porque toda outra função constante é produto desta por um escalar.
2. A separa pontos: isto é, dados t0 , t1 ∈ K distintos, existe uma f ∈ A com f (t0 ) ̸= f (t1 ).
278
Exemplo 17.5 (Teorema Multidimensional de Weierstrass) Considere K ⊂ Rd . Um po-
linômio multivariado é uma função da forma
X d
Y
p : “x ∈ K 7→ a(n1 ,n2 ,...,nd ) (x[i])ni ”,
(n1 ,n2 ,...,nd )∈{0,1,...,k}d i=1
279
ndamentalSW Lema 17.1 (Lema Fundamental) Seja A uma álgebra satisfazendo as hipóteses do teorema de
Stone-Weierstrass. Então dados quaisquer dois fechados disjuntos F, G ⊂ K e qualquer η ∈ (0, 1),
existe uma aF,G,η ∈ A tal que 0 ≤ aF,G,η ≤ 1 e além disso aF,G,η |F ≥ 1 − η, aF,G,η |G ≤ η.
Este “Lema Fundamental" será provado na subseção 17.1.2, seguinte à atual. Por ora
nós o usaremos como uma “caixa-preta" para terminar a prova.
Um breve exame do Lema nos mostra que ele pode ser expressado através de indi-
cadoras. Podemos pensar que o conjunto F acima é aquele cuja indicadora queremos
aproximar e que G é escolhido de modo a Gc \F seja “pequeno"e portanto Gc ≈ F . Veja
que vale o seguinte:
1. aF,G,η ≥ (1 − η) IF . De fato, isto quer dizer que aF,G,η (t) ≥ 1 − η para t ∈ F e
aF,G,η (t) ≥ 0 sempre.
2. aF,G,η ≤ IGc + η. Ou seja, aF,G,η (t) ≤ 1 + η para qualquer t ∈ K e aF,G,η (t) ≤ η para
t ∈ G.
Isto nos prova o seguinte corolário do Lema Fundamental.
ndamentalSW Corolário 17.1 (do Lema Fundamental) Se A ⊂ C satisfaz as condições do Teorema de Stone-
Weierstrass, podemos encontrar, para quaisquer η ∈ (0, 1) e F, G ⊂ K fechados e disjuntos, uma
função aF,G,η ∈ A com:
(1 − η) IF ≤ aF,G,η ≤ IGc + η.
Como podemos usar esse corolário em nossa prova? Como já dissemos, a ideia é
aproximar f por uma soma de indicadoras. De alguma forma estas indicadoras devem
ser de conjuntos fechados de K, para que possamos usar nosso Lema Fundamental. Mas
como podemos fazer isso? A prova a seguir responde a esta indagação.
Prova: [de Stone-Weiertrass] No que vem a seguir, mostraremos como aproximar uma
f ≥ 0 em C := C(K, R) por uma g ∈ A na norma do supremo. Afirmamos que isto implica
que toda f ∈ C pode ser bem aproximada por elementos de A. De fato, se toda função
não-negativa pode ser bem aproximada e agora queremos aproximar uma f qualquer,
podemos fazê-lo pelos seguintes passos:
1. Somamos uma constante λ ≥ ∥f ∥∞ a f , de modo que f + λ ≥ 0.
2. Aproximamos f + λ por g ∈ A com ∥f + λ − g∥∞ ≤ ε.
3. Observar que f + λ − g = f − (g − λ) com g − λ ∈ A: afinal, g ∈ A, λ ∈ A (porque
as constantes estão lá) e g − λ é combinação linear destas duas funções. Deduzimos
que ∥f − (g − λ)∥∞ ≤ ε com g − λ ∈ A.
Suponha então a partir de agora que f ≥ 0. Vamos aproximar f por uma combinação
linear de conjuntos fechados. Primeiramente fixamos parâmetros η, α ∈ (0, 1) que serão
ajustados mais tarde. Definimos:
Fn := {x ∈ K : f (x) ≥ α n} = f −1 ([n, +∞)), n = 0, 1, 2, . . . , mα , onde mα := ⌈∥f ∥∞ /α⌉+1).
280
Nada nos impede em princípio de tomar n > m – de fato, faremos isso abaixo –, mas
observe que neste caso Fn = ∅, já que:
n > m ⇒ α n > ∥f ∥∞ ⇒ f (x) < α n for all x ∈ K ⇒ Fn = ∅.
Cada conjunto Fn é fechado porque [n, +∞) ⊂ R é fechado e f é contínua. Veja ainda
que F0 = K (porque f ≥ 0) e F0 ⊃ F1 ⊃ F2 ⊃ · · · ⊃ Fm ⊃ . . . , ou seja, temos fechados
encaixados.
Como podemos relacionar f aos indicadores IFn ? A ideia agora é imaginar que α é
um número muito pequeno. Neste caso, dado qualquer x ∈ K, se sabemos qual é o maior
índice 0 ≤ n(x) ≤ m tal que x ∈ Fn , praticamente sabemos o valor de f . De fato, veja que,
se escolhemos este maior índice,
x ∈ Fn(x) e x ̸∈ Fn(x)+1 ⇒ αn(x) ≤ f (x) < α (n(x) + 1).
Agora vem um ponto crucial: o valor do maior índice n = n(x) ∈ {0, 1, . . . , mα } tal que
x ∈ Fn pode ser expresso pela soma de indicadores! Melhor dizendo,
mα
X
n(x) = max{0 ≤ n ≤ mα : Fn ∋ x} = IFj (x).
j=1
F = Fn , G = (K\Fn−1 ).
Para isso, devemos checar as condições daquele Lema.
• F e G são fechados. F = Fn é fechado, como vimos acima. G é um fecho, e todo fecho
é fechado.
• F e G são disjuntos. Dado x ∈ G, mostraremos que x ̸∈ Fn = F . De fato, x ∈ G
implica que xk → x para alguma sequência {xk }k ⊂ K\Fn−1 . Como xk ̸∈ Fn−1 ,
f (xk ) < (n − 1) α e isso vale para cada k ∈ N. Tomando limites,
f (x) = lim f (xk ) ≤ (n − 1)α < nα.
k
281
Seja, então, an = aF,G,η ∈ A a função cuja existência é garantida pelo lema fundamental.
Veja que, pelo corolário,
(1 − η) IFn ≤ an ≤ IFn+1 + η, (17.2) eq:comparaa
e isto vale para cada índice 1 ≤ n ≤ m. Definimos finalmente:
mα
X
g = gη,α := α an ,
j=1
Concluímos que
Portanto,
∥f − gη,α ∥∞ ≤ max {η∥f ∥∞ + α, η (∥f ∥∞ + 2α)} .
Dado um ε > 0, podemos escolher η e α de modo a garantir que o lado direito desta
última desigualdade é ≤ ε. Isto nos diz então que há uma g = gη,α ∈ A com ∥f − g∥∞ ≤ ε.
Como isto vale para f ∈ C não negativa e ε > 0 arbitrários, está demonstrado o teorema
de Stone-Weierstrass, a menos do Lema Fundamental. 2
282
17.1.2 Prova do Lema Fundamental
:lemafundSW
Nesta seção o nosso objetivo é provar o Lema Fundamental 17.1, o que encerrará a prova
do teorema de Stone-Weierstrass. Uma observação que se repetirá várias vezes é que,
como K é compacto, F, G e todos os outros subconjuntos fechados de K são compactos.
Outra observação importante será a seguinte.
Observação 17.1 A desigualdade de Bernoulli diz que:
∀x ∈ R : x ≥ −1 ⇒ (1 + x)n ≥ 1 + nx.
Também usaremos abaixo a desigualdade:
∀x ∈ R : 1 + x ≤ ex .
Esta segunda desigualdade é consequência da convexidade da exponencial, mas também pode ser
provada via Bernoulli. De fato, se recordamos que exp(x) = limn→+∞ (1 + x/n)n para todo x ∈ R
e observamos que :
x x n
∀n ∈ N com |x| ≤ n, ≥ −1 e portanto 1 + ≥ 1 + x,
n n
basta tomar n → +∞ para terminar a prova.
Também precisaremos do seguinte resultado que transforma uma “pequena separa-
ção" de valores de uma a ∈ A numa “grande separação". Melhor dizendo: se a toma
valores pequenos em um conjunto G e um pouco maiores em F , a composição p ◦ a de a
com um polinômio p bem escolhido fará os valores de a |G ainda menores e os de a |F tão
próximos de 1 quanto se possa querer. (Recorde que p ◦ a ∈ A pelo exemplo 17.4 acima.)
Proposição 17.1 (Explosão da separação) Dados ξ, δ ∈ (0, 1), existe um polinômio p : R → R
tal que 0 ≤ p |[0,1] ≤ 1, p |[0,δ/2] ≤ ξ e p |[δ,1] ≥ 1 − ξ.
Prova: Prosseguimos agora com a demonstração. Fixe δ ∈ (0, 1/2) como no enunciado.
Escolha o menor k ∈ N com kδ ≥ 1 e observe que (k − 1)δ ≤ 1, portanto kδ ≤ 1 + δ < 2.
Ou seja, encontramos um k ∈ N tal que
kδ
< 1 e kδ > 1.
2
Dado um n ∈ N, defina o polinômio:
n
pn (x) := 1 − (1 − xn )k .
Veja que 0 ≤ pn (x) ≤ 1 para quaisquer n ∈ N e x ∈ [0, 1]. Se x ≥ δ,
n
1 − pn (x) = (1 − xn )k ≤ exp(−(xk)n ) ≤ exp(−(δk)n ) ≤ ξ
para qualquer n grande o suficiente, já que δk > 1 (aqui usamos que 1 + t ≤ et para todo
t ∈ R). Por outro lado, se 0 ≤ x ≤ δ/2,
n
pn (x) = 1 − (1 − xn )k ≤ (kx)n ≤ (δk/2)n ≤ ξ
para todo n grande o suficiente, já que δk/2 < 1 (aqui usamos a desigualdade de Bernoulli).
Portanto, o p que desejamos obter é dado por pn , para n grande o suficiente. 2
283
Vamos agora à prova do Lema Fundamental. Nosso objetivo é construir uma a ∈ A que
“quase separa" F e G e que se mantém entre 0 e 1. Começamos com algo muito mais fraco,
sobre separar pontos.
Proposição 17.2 Dados x0 , x1 ∈ K quaisquer, existe uma vx0 ,x1 ∈ A com 0 ≤ vx0 ,x1 ≤ 1,
vx0 ,x1 (x1 ) > vx0 ,x1 (x0 ) = 0.
Prova: Lembre que A separa pontos: dados x0 , x1 ∈ K, existe u ∈ A com u(x0 ) ̸= u(x1 ). Em
particular, u(·) − u(x0 ) ∈ A (diferença entre u e uma constante, e as constantes pertencem
a A), ∥u(·) − u(x0 )∥∞ > 0 e portanto
(u(·) − u(x0 ))2
v(·) := ∈A
∥u(·) − u(x0 )∥2
satisfaz 0 ≤ v ≤ 1, v(x0 ) = 0 < v(x1 ). 2
O próximo passo é criar, para cada ponto x0 ∈ G, uma função em A separando x0 de
F.
Proposição 17.3 Dado qualquer x0 ∈ G, existe uma bx0 ∈ A com 0 ≤ bx0 ≤ 1, bx0 (x0 ) = 0,
bx0 |F > 0.
Prova: Para isso, tome uma função vx0 ,x1 como na proposição anterior para cada x1 ∈ F .
Temos vx0 ,x1 (x0 ) = 0 e vx0 ,x1 (x1 ) > 0, logo cada x1 ∈ F está contido numa vizinhança
Ax1 ∋ x1 onde vx0 ,x1 é estritamente positiva. Como F ⊂ K é fechado e K é compacto,
o próprio F é compacto. Além disso, ∪x1 ∈F Ax1 ⊃ K porque cada x1 ∈ Ax1 . Como F é
compacto, podemos cobri-lo por um número finito destas vizinhanças, digamos Ax(j) para
1
1 ≤ j ≤ k. Afirmamos que
k
1X
bx0 := v (j)
k j=1 x0 ,x1
é a função desejada. De fato, ela está em A pois é combinação convexa de funções em A.
Como cada 0 ≤ v ≤ 1, 0 ≤ bx0 ≤ 1 também. bx0 claramente vale 0 em x0 ; por outro lado,
se x ∈ F , x ∈ Ax(j) para algum j, de modo que vx0 ,x(j) (x) > 0 e portanto bx0 (x) > 0 2
1 1
Neste momento já temos as principais ideias para terminar a prova. Veja que usamos
acima o fato que F é compacto para cobrir este conjunto com abertos onde pelo menos
uma das funções v consideradas tem valor positivo. A ideia básica será agora cobrir G
com um número finito de abertos onde pelo menos uma das bx0 é pequena. Depois disso,
quase bastará tomar um produto destas funções para acabar a prova. O detalhe sutil é
que temos que garantir que a função obtida é “grande" em F e para isso precisaremos da
proposição sobre explosão de separação que provamos acima.
Prova: [do Lema Fundamental] Para cada x0 ∈ G podemos escolher uma função 0 ≤
bx0 ≤ 1 como na proposição anterior. Sabemos que bx0 (x0 ) = 0 e bx0 (x) > 0 sobre F . Pela
compacidade de F ,
∃δ(x0 ) ∈ (0, 1) : inf bx0 (x) ≥ δ(x0 ).
x∈F
284
Podemos então encontrar uma vizinhança aberta Ux0 ∋ x0 onde bx0 |Ux0 ≤ δ(x0 )/2. Ou
seja, G é coberto pela coleção de abertos Ux0 , x0 ∈ G, e em cada um destes abertos
bx0 (x) ≤ δ(x0 )/2 enquanto bx0 |F ≥ δ0 (x).
Como G é compacto, podemos escolher uma subcoleção finita destes abertos, chamada
de U1 , . . . , Uk , com a seguinte propriedade:
Para cada 1 ≤ i ≤ k existem δi ∈ (0, 1) e bi ∈ A com 0 ≤ bi ≤ 1 e bi |Ui ≤ δi /2 e bi |F ≥ δi .
Agora precisamos construir uma única função que valha “muito" em F e “pouco" em G.
Para isso, fixamos o η ∈ (0, 1) desejado. Pela proposição sobre Explosão de Separação,
podemos conseguir polinômios pi tais que pi (x) ∈ [0, 1] para x ∈ [0, 1], pi (x) ≤ η/k se
0 ≤ x ≤ δi /2 e pi (x) ≥ 1 − η/k se x ∈ [δi , 1]. Veja que cada função ci := pi ◦ bi está em A
(ver a observação no início da prova), toma valores em [0, 1] e satisfaz:
η η
ci |Ui ≤ , ci |F ≥ 1 − .
k k
Podemos finalmente definir a = aF,G,η := i=1 ci e observar que ela tem as propriedades
Qk
desejadas:
1. 0 ≤ a ≤ 1 pertence a A porque é produto de funções com estas propriedades;
2. Para x ∈ G, temos x ∈ Ui para algum i, de modo que ci (x) ≤ η/k e a(x) =
Qk
j=1 cj (x) ≤ η/k < η.
285