Você está na página 1de 221

Análise Real volume 2

Funções de n Variáveis
Lima, Elon Lages
Análise real, v.2 / Elon Lages Lima. 1 ed. Rio de
Janeiro : IMPA, 2014.
202 p. : il. ; 23 cm. (Coleção matemática universitária)

Inclui bibliografia.
e-ISBN 978-85-244-0381-1

1. Análise Matemática. I. Título. II. Série.

CDD-517
COLEÇÃO MATEMÁTICA UNIVERSITÁRIA

Análise Real volume 2


Funções de n Variáveis

Elon Lages Lima

INSTITUTO NACIONAL DE MATEMÁTICA PURA E APLICADA


Copyright  2014 by Elon Lages Lima

Impresso no Brasil / Printed in Brazil

Capa: Rodolfo Capeto, Noni Geiger e Sérgio R. Vaz

Coleção Matemática Universitária


Comissão Editorial:
Elon Lages Lima
S. Collier Coutinho
Paulo Sad

Títulos Publicados:
• Análise Real, vol. 1: Funções de uma Variável – Elon Lages Lima
• EDP. Um Curso de Graduação – Valéria Iório
• Curso de Álgebra, Volume 1 – Abramo Hefez
• Álgebra Linear – Elon Lages Lima
• Introdução às Curvas Algébricas Planas – Israel Vainsencher
• Equações Diferenciais Aplicadas – Djairo G. de Figueiredo e Aloisio Freiria Neves
• Geometria Diferencial – Paulo Ventura Araújo
• Introdução à Teoria dos Números – José Plínio de Oliveira Santos
• Cálculo em uma Variável Complexa – Marcio G. Soares
• Geometria Analítica e Álgebra Linear – Elon Lages Lima
• Números Primos: Mistérios e Recordes – Paulo Ribenboim
• Análise no Espaço Rn – Elon Lages Lima
• Análise Real, vol. 2: Funções de n Variáveis – Elon Lages Lima
• Álgebra Exterior – Elon Lages Lima
• Equações Diferenciais Ordinárias – Claus Ivo Doering e Artur Oscar Lopes
• Análise Real, vol. 3: Análise Vetorial – Elon Lages Lima
• Álgebra Linear. Exercícios e Soluções – Ralph Costa Teixeira
• Números Primos. Velhos Mistérios e Novos Recordes – Paulo Ribenboim

Distribuição:
IMPA
Estrada Dona Castorina, 110
22460-320 Rio de Janeiro, RJ
e-mail: ddic@impa.br
http://www.impa.br
Prefácio

Este segundo volume do livro “Análise Real” trata das funções de n


variáveis. Sua leitura pressupõe, naturalmente, conhecimento das noções
básicas sobre funções de uma variável, conforme estão apresentadas no
primeiro volume, ou em algum texto equivalente. Além disso, é conve-
niente que o leitor tenha alguma familiaridade com os conceitos elemen-
tares da Álgebra Linear, tais como dependência linear, transformações
lineares e suas matrizes, produto interno etc, a nı́vel de um curso intro-
dutório.
Como no seu antecessor, procuramos expor a matéria de modo que
ela possa ser coberta num curso com a duração de um semestre letivo.
Com isto em mente, procuramos seguir uma trajetória objetiva, visando
os resultados mais relevantes, sem preocupação com a extrema genera-
lidade.
O objetivo principal do curso é o Cálculo Diferencial das aplicações
de Rm (ou de um seu subconjunto) em Rn e das integrais múltiplas. Para
atingi-lo, estudamos no capı́tulo inicial as funções contı́nuas f : X → Rn ,
definidas num subconjunto X ⊂ Rm e, para melhor entendê-las, analisa-
mos as propriedades topológicas desses subconjuntos. Em seguida, con-
sideramos dois casos particulares (e particularmente interessantes) do
Cálculo que queremos estudar, a saber: os caminhos, que são aplicações
contı́nuas f : I → Rn , definidas em intervalos I ⊂ R e as funções
numéricas f : U → R, definidas em conjuntos U ⊂ Rm . Este segundo
caso particular nos permite destacar o importante conceito de vetor gra-
diente, que ficaria diluı́do no contexto geral se não tivéssemos isolado
o caso n = 1. Ainda no contexto de funções numéricas, tratamos se-
paradamente os casos de uma só função implı́cita, as hiperfı́cies e o
multiplicador de Lagrange.
Os capı́tulos 5, 6 e 7 se ocupam do Cálculo Diferencial das aplica-
ções f : U → Rn , onde a derivada, que antes era vista como um vetor
(o gradiente) agora aparece como uma transformação linear. O resultado
principal é o Teorema da Função Inversa, do qual se derivam o Teorema
das Funções Implı́citas e os multiplicadores de Lagrange. Olhando para
as funções implı́citas de forma global, somos conduzidos à noção de
superfı́cie diferenciável (de dimensão qualquer) no espaço euclidiano e o
Cálculo Diferencial nas mesmas.
Os capı́tulos 8 e 9 tratam das integrais múltiplas (no sentido de
Riemann), culminando com a demonstração da fórmula de mudança de
variáveis.
O livro contém 170 exercı́cios, propostos ao final de cada capı́tulo. O
capı́tulo 10, último do livro, contém as soluções completas de todos eles.
O leitor deve considerá-los como um meio de verificar até que ponto
assimilou o conteúdo de cada seção. As soluções por mim sugeridas
podem ser bem diferentes das suas, mais simples ou mais complicadas
do que as que imaginou mas, acima de tudo, devem ser vistas como um
auxı́lio a ser solicitado somente depois de tentar seriamente resolver o
problema com seus próprios recursos.
Um tratamento mais extenso e completo dos assuntos aqui estudados
encontra-se no “Curso de Análise”, vol. 2, o qual, entretanto, é um livro
muito longo para ser estudado num único semestre.
Ao terminar, agradeço ao Professor Hilário Alencar pela leitura de
uma versão preliminar, com a correção de vários misprints, e ao Professor
Florêncio Guimarães, pela revisão do manuscrito final.

Rio de Janeiro, 25 de maio de 2004

Elon Lages Lima

Prefácio da sexta edição


A partir da segunda edição, foram feitas algumas correções de natu-
reza tipográfica e diversas pequenas mudanças visando tornar mais clara
a exposição. Em particular, na quinta edição foi incluı́do um Apêndice ao
Capı́tulo 7, sobre o volume do paralelepı́pedo. Agradeço a colaboração
de José Regis, Mariana Garcia, Rick Rischter e Raphael Antunes dos
Santos por terem apontado certas impropriedades, a Rogerio Dias Trin-
dade e Wilson Góes, que redigitaram o texto.

Rio de Janeiro, abril de 2012

Elon Lages Lima


Conteúdo

1 Topologia do Espaço Euclidiano 1


1 O espaço euclidiano n-dimensional . . . . . . . . . . . . . 1
2 Bolas e conjuntos limitados . . . . . . . . . . . . . . . . . 5
3 Conjuntos abertos . . . . . . . . . . . . . . . . . . . . . . 7
4 Seqüências em Rn . . . . . . . . . . . . . . . . . . . . . . 10
5 Conjuntos fechados . . . . . . . . . . . . . . . . . . . . . . 12
6 Conjuntos compactos . . . . . . . . . . . . . . . . . . . . . 16
7 Aplicações contı́nuas . . . . . . . . . . . . . . . . . . . . . 19
8 Continuidade uniforme . . . . . . . . . . . . . . . . . . . . 23
9 Homeomorfismos . . . . . . . . . . . . . . . . . . . . . . . 26
10 Conjuntos conexos . . . . . . . . . . . . . . . . . . . . . . 27
11 Limites . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
12 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 36

2 Caminhos em Rn 41
1 Caminhos diferenciáveis . . . . . . . . . . . . . . . . . . . 41
2 Cálculo diferencial de caminhos . . . . . . . . . . . . . . . 43
3 A integral de um caminho . . . . . . . . . . . . . . . . . . 45
4 Caminhos retificáveis . . . . . . . . . . . . . . . . . . . . . 48
5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 52

3 Funções Reais de n Variáveis 55


1 Derivadas parciais . . . . . . . . . . . . . . . . . . . . . . 55
2 Funções de classe C 1 . . . . . . . . . . . . . . . . . . . . . 57
3 O Teorema de Schwarz . . . . . . . . . . . . . . . . . . . . 65
4 A fórmula de Taylor . . . . . . . . . . . . . . . . . . . . . 68
5 Pontos crı́ticos . . . . . . . . . . . . . . . . . . . . . . . . 70
6 Funções convexas . . . . . . . . . . . . . . . . . . . . . . . 75

3
4 CONTEÚDO Cap. 0

7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 81

4 Funções Implı́citas 84
1 Uma função implı́cita . . . . . . . . . . . . . . . . . . . . 84
2 Hiperfı́cies . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3 Multiplicador de Lagrange . . . . . . . . . . . . . . . . . . 91
4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 96

5 Aplicações Diferenciáveis 98
1 A derivada como transformação linear . . . . . . . . . . . 98
2 Exemplos de derivadas . . . . . . . . . . . . . . . . . . . . 100
3 Cálculo diferencial de aplicações . . . . . . . . . . . . . . 103
4 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 109

6 Aplicações Inversas e Implı́citas 111


1 O Teorema da Aplicação Inversa . . . . . . . . . . . . . . 111
2 Várias Funções Implı́citas . . . . . . . . . . . . . . . . . . 117
3 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 122

7 Superfı́cies Diferenciáveis 124


1 Parametrizações . . . . . . . . . . . . . . . . . . . . . . . 124
2 Superfı́cies diferenciáveis . . . . . . . . . . . . . . . . . . . 126
3 O espaço vetorial tangente . . . . . . . . . . . . . . . . . . 129
4 Superfı́cies orientáveis . . . . . . . . . . . . . . . . . . . . 132
5 Multiplicadores de Lagrange . . . . . . . . . . . . . . . . . 139
6 Aplicações diferenciáveis entre superfı́cies . . . . . . . . . 142
7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 146

8 Integrais Múltiplas 148


1 A definição de integral . . . . . . . . . . . . . . . . . . . . 148
2 Conjuntos de medida nula . . . . . . . . . . . . . . . . . . 152
3 Cálculo com integrais . . . . . . . . . . . . . . . . . . . . 159
4 Conjuntos J-mensuráveis . . . . . . . . . . . . . . . . . . 162
5 A integral como limite de somas de Riemann . . . . . . . 165
6 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 170

9 Mudança de Variáveis 172


1 O caso unidimensional . . . . . . . . . . . . . . . . . . . . 173
2 Difeomorfismos primitivos . . . . . . . . . . . . . . . . . . 175
1 CONTEÚDO 5

3 Todo difeomorfismo C 1 é localmente admissı́vel . . . . . . 177


4 Conclusão: todo difeomorfismo de classe C 1 é admissı́vel . 178
5 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

10 Soluções dos exercı́cios 181


1 Topologia do Espaço Euclidiano . . . . . . . . . . . . . . . 181
2 Caminhos diferenciáveis . . . . . . . . . . . . . . . . . . . 186
3 Funções reais de n variáveis . . . . . . . . . . . . . . . . . 188
4 Funções implı́citas . . . . . . . . . . . . . . . . . . . . . . 192
5 Aplicações diferenciáveis . . . . . . . . . . . . . . . . . . . 194
6 Aplicações Inversas e Implı́citas . . . . . . . . . . . . . . . 195
7 Superfı́cies Diferenciáveis . . . . . . . . . . . . . . . . . . 197
8 Integrais múltiplas . . . . . . . . . . . . . . . . . . . . . . 201
9 Mudança de variáveis . . . . . . . . . . . . . . . . . . . . 203

Referências Bibliográficas 205

Índice Remissivo 206


1

Topologia do Espaço
Euclidiano

1 O espaço euclidiano n-dimensional

Seja n um número natural. O espaço euclidiano n-dimensional Rn é


o produto cartesiano de n fatores iguais a R : Rn = R × R × · · · × R.
Seus elementos, portanto, são as seqüências (ou listas) de n termos reais
x = (x1 , . . . , xn ). Para cada i = 1, . . . , n, o termo xi chama-se a i-ésima
coordenada de x. Se x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), tem-se x = y
se, e somente se, x1 = y1 , . . . , xn = yn . Assim, toda igualdade entre dois
elementos de Rn equivale a n igualdades entre números reais. R1 = R
é o conjunto dos números reais, R2 é o modelo numérico do plano e
R3 é o modelo do espaço euclidiano tridimensional. Por simplicidade,
adotaremos o hábito de escrever z = (x, y) em vez de x = (x1 , x2 ) e
w = (x, y, z) em vez de x = (x1 , x2 , x3 ).
Os elementos de Rn às vezes são chamados pontos e às vezes vetores.
Este segundo nome se aplica principalmente quando se considerarem
entre eles as operações que definiremos agora.
A adição faz corresponder a cada par de elementos x = (x1 , . . . , xn )
e y = (y1 , . . . , yn ) a soma
x + y = (x1 + y1 , . . . , xn + yn ).
e a multiplicação do número real α pelo elemento x = (x1 , . . . , xn ) tem
como resultado o produto
α · x = (αx1 , . . . , αxn ).
2 Topologia do Espaço Euclidiano Cap. 1

O vetor 0 = (0, 0, . . . , 0), cujas coordenadas são todas nulas, chama-


se a origem de Rn . Para todo x = (x1 , . . . , xn ), o vetor −x =
(−x1 , . . . , −xn ) chama-se o oposto, ou simétrico de x. Dados quaisquer
x, y, z ∈ Rn e α, β ∈ R valem as igualdades

x + y = y + x, x + 0 = x, −x + x = 0,
x + (y + z) = (x + y) + z, α(βx) = (αβ)x,
(α + β)x = αx + βx, α(x + y) = αx + αy,
1 · x = x.
A segunda e a terceira delas dizem que 0 é o elemento neutro da
adição e −x é o inverso aditivo de x.
Os vetores e1 = (1, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . en = (0, . . . , 1),
que têm uma única coordenada não-nula, igual a 1, constituem a base
canônica de Rn . A igualdade x = (x1 , . . . , xn ) significa que x = x1 · e1
+ · · · + xn · en .
Existe ainda uma operação que associa a cada par de vetores
x = (x1 , . . . , xn ), y = (y1 , . . . , yn ) o número real

hx, yi = x1 y1 + · · · + xn yn ,

chamado o produto interno de x por y.


Para x, y, z ∈ Rn e α ∈ R quaisquer, tem-se

hx, yi = hy, xi, hx, y + zi = hx, yi + hx, zi,


hαx, yi = α · hx, yi, hx, xi > 0 se x 6= 0.

Segue-se que hx+y, zi = hx, zi+hy, zi, hx, αyi = αhx, yi e hx, 0i = 0.
Diz-se que os vetores x, y ∈ Rn são ortogonais, e escreve-se x ⊥ y,
quando hx, yi = 0. Por exemplo, ei ⊥ ej se i 6= j.
Um exemplo menos trivial de ortogonalidade é o seguinte:
hx, yi
(1.1) Seja x ∈ Rn não-nulo. Para todo y ∈ Rn , o vetor z = y − ·x
hx, xi
é ortogonal a x.
hx, yi
Demonstração: hx, zi = hx, yi − · hx, xi = 0.
hx, xi
hx, yi
Escrevendo y = · x + z, vemos assim que, uma vez dado um
hx, xi
vetor não-nulo x ∈ Rn , todo vetor y ∈ Rn se escreve como soma de um
múltiplo de x com um vetor ortogonal a x. Esta decomposição é única
Seção 1 O espaço euclidiano n-dimensional 3

pois se y = α · x + z com z ⊥ x, tomando-se o produto interno de ambos


os membros por x obtemos hx, yi = α · hx, xi, logo α = hx, yi/hx, xi.
O vetor αx = (hx, yi/hx, xi)x chama-se a projeção ortogonal de y sobre
(a reta que contém) x.

x
hx,yi
hx,xi ·x

Figura 1.1

p
O número não-negativo |x| = hx, xi chama-se a norma (ou o com-
primento) do vetor x. Se x = (x1 , . . . , xn ) então
q
|x| = x21 + · · · + x2n .

Por definição, tem-se hx, xi = |x|2 . Quando |x| = 1, diz-se que x é um


vetor unitário. Para todo x 6= 0, o vetor u = x/|x| é unitário.
(1.2) (Teorema de Pitágoras). Se x ⊥ y então |x + y|2 = |x|2 + |y|2 .
Demonstração: |x + y|2 = hx + y, x + yi = hx, xi + 2hx, yi + hy, yi =
hx, xi + hy, yi = |x|2 + |y|2 .

(1.3) (Desigualdade de Schwarz). Para quaisquer x, y ∈ Rn , tem-se


|hx, yi| ≤ |x| · |y|, valendo a igualdade se, e somente se, um dos vetores
x, y é múltiplo do outro.
Demonstração: Isto é óbvio se x = 0. Supondo x 6= 0, podemos
escrever y = αx + z com z ⊥ x e α = hx, yi/|x|2 . Por Pitágoras,
|y|2 = α2 |x|2 + |z|2 , logo |y|2 ≥ α2 |x|2 , valendo a igualdade se, e somente
se, y = α·x. Entrando com o valor de α, vem |y|2 ≥ hx, yi2 /|x|2 , ou seja,
hx, yi2 ≤ |x|2 · |y|2 , o que nos dá |hx, yi| ≤ |x| · |y|, valendo a igualdade
se, e somente se, y = α · x.
4 Topologia do Espaço Euclidiano Cap. 1

A norma goza das seguintes propriedades:

1. |x| ≥ 0, valendo |x| = 0 somente quando x = 0;

2. |α · x| = |α| |x|;

3. |x + y| ≤ |x| + |y|.

A última desigualdade, referindo-se a números não-negativos, equi-


vale a
|x + y|2 ≤ (|x| + |y|)2 .
Ora,

|x + y|2 = hx + y, x + yi = |x|2 + 2hx, yi + |y|2


≤ |x|2 + 2|x||y| + |y|2 = (|x| + |y|)2

pois, em virtude da desigualdade de Schwarz, hx, yi ≤ |x| |y|.


Mais geralmente, qualquer função Rn → R, que associe a cada vetor
x ∈ Rn um número |x| com as três propriedades acima, chama-se uma
norma. A norma q
|x| = x21 + · · · + x2n ,
chama-se norma euclidiana.
Há duas outras normas que poderemos utilizar em Rn quando houver
conveniência. Elas são

1. |x|M = max ·{|x1 |, . . . , |xn |} (norma do máximo),

2. |x|S = |x1 | + · · · + |xn | (norma da soma).

As condições que definem uma norma são fáceis de verificar para


estas duas. Também é simples mostrar que, para todo x ∈ Rn , vale

|x|M ≤ |x| ≤ |x|S ≤ n · |x|M ,

onde |x| é a norma euclidiana.


Quando, num determinado contexto, estivermos usando apenas uma
das normas |x|M ou |x|S , podemos indicá-la com a notação |x|, por
simplicidade.
Para toda norma, vale a desigualdade

| |x| − |y| | ≤ |x − y|.


Seção 2 Bolas e conjuntos limitados 5

Com efeito, de x = (x − y) + y resulta que |x| ≤ |x − y| + |y|, logo


|x| − |y| ≤ |x − y|.
Trocando os papéis de x e y, obtemos |y| − |x| ≤ |y − x|. Mas
|y − x| = |x − y|, logo |y| − |x| ≤ |x − y|. Conclusão: ||x| − |y|| ≤ |x − y|.
Uma norma em Rn dá origem à noção de distância d(x, y) entre dois
pontos x, y ∈ Rn . Para x = (x1 , . . . , xn ) e y = (y1 , . . . , yn ), pomos
p
d(x, y) = |x − y| = (x1 − y1 )2 + · · · + (xn − yn )2 .

As três condições que definem uma norma implicam que d(x, y) tem
as propriedades caracterı́sticas de uma distância, a saber:

1. d(x, y) ≥ 0, com d(x, y) = 0 se, e somente se, x = y;

2. d(x, y) = d(y, x);

3. d(x, z) ≤ d(x, y) + d(y, z) (desigualdade triangular).

Observe que a igualdade |α · x| = |α| |x| com α = −1 dá | − x| = |x|,


logo |x−y| = |y−x|. Além disso, |x−z| = |x−y+y−z| ≤ |x−y|+|y−z|,
portanto d(x, z) ≤ d(x, y) + d(y, z).

2 Bolas e conjuntos limitados

Dados o ponto a ∈ Rn e o número real r > 0, a bola aberta de centro a


e raio r é o conjunto B(a; r) dos pontos x ∈ Rn cuja distância ao ponto
a é menor que r. Em sı́mbolos:

B(a; r) = {x ∈ Rn ; |x − a| < r}.

Analogamente, a bola fechada de centro a e raio r é o conjunto B[a; r]


assim definido:
B[a; r] = {x ∈ Rn ; |x − a| ≤ r}.
Por sua vez, a esfera de centro a e raio r é o conjunto

S[a; r] = {x ∈ Rn ; |x − a| = r}.

Evidentemente, B[a; r] = B(a; r) ∪ S[a; r].


A bola fechada B[a; r] ⊂ Rn também é chamada o disco n-dimensi-
onal de centro a e raio r. Em particular, o disco B[0; 1] de centro 0 e
raio 1 é chamado o disco unitário de Rn .
6 Topologia do Espaço Euclidiano Cap. 1

Uma notação especial é reservada para a esfera unitária de


dimensão n − 1:
S n−1 = {x ∈ Rn ; |x| = 1}.
Assim, S n−1 é a esfera de centro na origem 0 e raio 1. Quando n = 2,
S 1 é a circunferência de centro 0 e raio 1.
Acima estamos (pelo menos tacitamente) admitindo que a norma
adotada em Rn é a euclidiana, já que não foi feita menção em contrário.
Convém, entretanto, observar que a forma geométrica das bolas e esferas
em Rn depende da norma que se considera. Por exemplo, se tomarmos
em R2 a norma do máximo, a “esfera unitária” é o bordo do quadrado
de centro 0 e lados de comprimento 2, paralelos aos eixos. Ainda em R2 ,
com a norma da soma, o “disco unitário” é o quadrado cujos vértices
são os pontos (1, 0), (0, 1), (−1, 0) e (0, −1).

(a) (b) (c)

Figura 1.2: O conjunto dos pontos z ∈ R2 tais que |z| ≤ 1, conforme a norma
seja (a) a euclidiana, (b) do máximo, ou (c) da soma.

Observação: Indiquemos com as notações B, BM e BS respectivamente


as bolas de centro a e raio r em Rn , relativamente às normas euclidiana,
do máximo e da soma. Seja ainda BM ′ a bola de centro a e raio r/n

na norma do máximo. As desigualdades |x|M ≤ |x| ≤ |x|S ≤ n|x|M


implicam que BM ′ ⊂B ⊂B ⊂B .
S M

Diz-se que o conjunto X ⊂ Rn é limitado quando está contido em


alguma bola B[a; r]. Como B[a; r] ⊂ B[0; k], onde k = r + |a| (conforme
veremos agora), dizer que X é limitado equivale a dizer que existe k > 0
tal que |x| ≤ k para todo x ∈ X.
Para mostrar que B[a; r] ⊂ B[0; r + |a| ], note que |x − a| ≤ r ⇒
|x| = |x − a + a| ≤ |x − a| + |a| ≤ r + |a|.
Assim, x ∈ B[a; r] ⇒ x ∈ B[0; r + |a|].
Seção 3 Conjuntos abertos 7

Uma aplicação f : X → Rn diz-se limitada no conjunto X ⊂ Rm


quando sua imagem f (X) ⊂ Rn é um conjunto limitado, isto é, quando
existe c > 0 tal que |f (x)| ≤ c para todo x ∈ X.
Dados a 6= b em Rn , a reta que une esses dois pontos é o conjunto
ab = {(1−t)a+tb ; t ∈ R}. Por sua vez, o segmento de reta de extremos
a, b é o conjunto [a, b] = {(1 − t)a + tb ; 0 ≤ t ≤ 1}.
Um conjunto X ⊂ Rn chama-se convexo quando o segmento de reta
que une dois quaisquer de seus pontos está inteiramente contido em X.
Noutros termos, dizer que X é convexo equivale a afirmar que

a, b ∈ X, 0≤t≤1 ⇒ (1 − t)a + tb ∈ X .

Exemplo 1. Toda bola (aberta ou fechada) é um conjunto convexo.


Para fixar as idéias, consideremos a bola fechada B = B[x0 ; r]. Dados
a, b ∈ B, temos |a − x0 | ≤ r e |b − x0 | ≤ r. Para qualquer t ∈ [0, 1] vale
x0 = (1 − t)x0 + tx0 , logo

|(1 − t)a + tb − x0 | = |(1 − t)a + tb − (1 − t)x0 − tx0 |


= |(1 − t)(a − x0 ) + t(b − x0 )|
≤ (1 − t)|a − x0 | + t|b − x0 |
≤ (1 − t)r + tr = r,


Exemplo 2. Seja X = {(x, y) ∈ R2 ; y ≤ x2 }. O conjunto X ⊂ R2 não
é convexo. Com efeito os pontos a = (−1, 1) e b = (1, 1) pertencem a X
1 1
mas a + b = (0, 1) não pertence a X. ⊳
2 2

3 Conjuntos abertos

Seja a ∈ X ⊂ Rn . Diz-se que o ponto a é interior ao conjunto X


quando, para algum r > 0, tem-se B(a; r) ⊂ X. Isto significa que
todos os pontos suficientemente próximos de a também pertencem a
X. O conjunto int.X dos pontos interiores a X chama-se o interior do
conjunto X. Evidentemente, int.X ⊂ X. Quando a ∈ int.X, diz-se que
X é uma vizinhança de a.
Exemplo 3. Seja X={(x, y) ∈ R2 ; y ≥ 0} o semi-plano superior fe-
chado. Se p = (a, b) com b > 0, então p ∈ int.X. Com efeito, afirmamos
que B = B(p; b) ⊂ X. Isto é claro geometricamente.
8 Topologia do Espaço Euclidiano Cap. 1

b
b p

Figura 1.3

Em termos mais precisos, argumentamos assim:


p
(x, y) ∈ B ⇒ (x − a)2 + (y − b)2 < b ⇒ (y − b)2 < b2
⇒ y 2 − 2by + b2 < b2 ⇒ y 2 < 2by ⇒ y > 0 (pois b > 0),

e portanto (x, y) ∈ X. ⊳
Exemplo 4. Com a notação do Exemplo 3, os pontos da forma
q = (a, 0), pertencem a X porém não são interiores a X. Com efeito,
nenhuma bola B(q; r) de centro q pode estar contida em X pois o
ponto (a, −r/2) pertence a B(q; r) mas não a X. Segue-se então que
int.X = {(x, y) ∈ R2 ; y > 0}.
Um conjunto A ⊂ Rn chama-se aberto quando todos os seus pontos
são interiores, isto é, quando A = int.A. ⊳

y
x

Figura 1.4

Exemplo 5. Toda bola aberta B = B(a; r) é um conjunto aberto. Com


efeito, seja x ∈ B. Então |x−a| < r, logo s = r −|x−a| > 0. Afirmamos
Seção 3 Conjuntos abertos 9

que, B(x; s) ⊂ B. Com efeito, y ∈ B(x; s) ⇒ |y − x| < r − |x − a|. Logo

y ∈ B(x; s) ⇒ |y − a| ≤ |y − x| + |x − a| < r − |x − a| + |x − a| = r.

Daı́ concluimos que y ∈ B(a; r). ⊳


A fronteira de um conjunto X ⊂ Rn é o conjunto fr.X formado pelos
pontos de X que não são interiores a X, juntamente com os pontos de
Rn − X que não são interiores a Rn − X. De forma mais simples: tem-se
x ∈ fr.X quando toda bola de centro x contém pontos de X e pontos de
Rn − X.
Exemplo 6. Seja X = {(x, y) ∈ R2 ; y ≥ 0}, como no Exemplo 3.
De forma análoga ao argumento usado no Exemplo 3, mostra-se que
todo ponto de R2 − X = {(x, y) ∈ R2 ; y < 0} é um ponto interior
(ou seja, que R2 − X é um conjunto aberto). Logo, nenhum ponto de
R2 − X pode estar na fronteira de X. Segue-se então do Exemplo 4 que
fr.X = {(x, 0) ; x ∈ R} = eixo dos xx.
Teorema 1. (a) Se A1 , A2 são abertos em Rn então A1 ∩ A2 é aberto.
(b) Se (Aλ )λ∈L é umaSfamı́lia arbitrária de conjuntos abertos Aλ ⊂ Rn
então a reunião A = Aλ é um conjunto aberto.
λ∈L

Demonstração: Vide vol. 1, pág. 49. Mesma demonstração, substi-


tuindo apenas cada intervalo (a − ε, a + ε) pela bola B(a; ε).
Resulta imediatamente do Teorema 1 que a interseção A = A1
∩ · · · ∩ Ak de um número finito de conjuntos abertos A1 , . . . , Ak é ainda
um conjunto aberto. Entretanto, a interseção de infinitos abertos pode
T

não ser aberta, como mostra o exemplo B(a; 1/k) = {a}.
k=1

Seja X ⊂ Rn . Diz-se que um subconjunto A ⊂ X é aberto em X


quando cada ponto a ∈ A é centro de uma bola aberta B(a; r), tal
que B(a; r) ∩ X ⊂ A. Isto significa que os pontos de X que estão
suficientemente próximos de cada a ∈ A pertencem a A. A reunião U
de todas essas bolas é um aberto tal que A = U ∩ X. A recı́proca é
óbvia, de modo que um conjunto A ⊂ X é aberto em X se, e somente
se, A = U ∩ X onde U é aberto em Rn .
Por exemplo, o intervalo (0, 1] é aberto em [0, 1] pois (0, 1] =
(0, 2) ∩ [0, 1].
10 Topologia do Espaço Euclidiano Cap. 1

4 Seqüências em Rn

Uma seqüência em Rn é uma função x : N → Rn , que associa a cada


número natural k um ponto xk ∈ Rn . As notações para uma seqüência
são (x1 , . . . , xk , . . . ), (xk )k∈N ou simplesmente (xk ).
Para cada i = 1, . . . , n, indicamos com xki a i-ésima coordenada
de xk . Assim, xk = (xk1 , xk2 , . . . , xkn ). Dar uma seqüência em
Rn equivale a dar as n seqüências de números reais
(xk1 )k∈N , . . . , (xkn )k∈N .
Diz-se que a seqüência (xk )k∈N é limitada quando existe uma bola
em Rn que contém todos os termos xk . Isto equivale a dizer que existe
c > 0 tal que |xk | ≤ c para todo k ∈ N. Em virtude das desigualdades
que relacionam as três normas que consideramos em Rn , ser limitada é
uma propriedade da seqüência que independe de qual dessas três normas
estamos tratando.
Se a seqüência (xk ) é limitada então, para todo i = 1, . . . , n, a
seqüência (xki )k∈N das i-ésimas coordenadas de xk é também limitada,
pois |xki | ≤ |xk |. Vale também a recı́proca. Para prová-la, adotaremos
em Rn a norma do máximo. Então, se |xk1 | ≤ c1 , |xk2 | ≤ c2 , . . . , |xkn | ≤
cn para todo k ∈ N, chamando de c o maior dos números c1 , c2 , . . . , cn
teremos |xk | = max{|xk1 |, . . . , |xkn |} ≤ c para todo k ∈ N. Assim, se
cada (xki )k∈N (i = 1, . . . , n) é limitada, a seqüência (xk )k∈N é limitada.
Uma subseqüência de (xk )k∈N é a restrição desta seqüência a um
subconjunto infinito N′ = {k1 < · · · < km < . . . } ⊂ N. As notações
(xk )k∈N′ , (xkm )m∈N ou (xk1 , . . . , xkm , . . . ) são usadas para indicar uma
subseqüência.
Diz-se que o ponto a ∈ Rn é o limite da seqüência (xk ) quando,
para todo ε > 0 dado arbitrariamente, é possı́vel obter k0 ∈ N tal que
k > k0 ⇒ |xk − a| < ε. Noutras palavras: k > k0 ⇒ xk ∈ B(a; ε).
Escreve-se então lim xk = a, lim xk = a ou lim xk = a, simplesmente.
k→∞ k∈N
De acordo com esta definição, tem-se lim xk = a se, e somente se,
lim |xk − a| = 0.
Dizer que lim xk = a significa afirmar que qualquer bola de centro
a contém todos os xk com a possı́vel exceção de um número finito de
valores de k (que são 1, 2, . . . , k0 ).
Uma seqüência (xk ) em Rn diz-se convergente quando existe
a = lim xk . Da observação acima resulta que toda seqüência conver-
Seção 4 Seqüências em Rn 11

gente é limitada. É também óbvio que qualquer subseqüência de uma


seqüência convergente é também convergente e tem o mesmo limite.
Observe-se ainda que a definição de limite faz uso de uma norma,
porém as desigualdades |x|M ≤ |x| ≤ |x|S ≤ n · |x|M mostram que a
existência e o valor do limite não dependem de qual das três normas
usuais se está considerando. Este fato será empregado na demonstração
do teorema abaixo, onde no final usamos a norma do máximo.
Teorema 2. A seqüência (xk ) em Rn converge para o ponto
a = (a1 , . . . , an ) se, e somente se, para cada i = 1, . . . , n, tem-se
lim xki = ai , isto é, cada coordenada de xk converge para a coorde-
k→∞
nada correspondente de a.
Demonstração: Para cada i = 1, . . . , n, tem-se |xki − ai | ≤ |xk − a|,
portanto lim xk = a ⇒ lim xki = ai . Reciprocamente, se vale esta
k→∞
última igualdade então, dado ε > 0, existem k1 , . . . , kn ∈ N tais que
k > ki ⇒ |xki − ai | < ε (i = 1, . . . , n). Tomando k0 = max{k1 , . . . , kn }
e adotando em Rn a norma do máximo, vemos que k > k0 ⇒ |xk −a| < ε.
Logo lim xk = a.
Corolário 1. Se lim xk = a, lim yk = b em Rn e lim αk = α em R então
lim(xk + yk ) = a + b e lim αk xk = αa.
Tomando cada seqüência de coordenadas, o corolário resulta da pro-
priedade correspondente em R.
Além disso, lim hxk , yk i = ha, bi, como se vê facilmente. E a desi-
gualdade ||xk | − |a|| ≤ |xk − a| mostra ainda que se tem lim |xk | = |a|
seja qual for a norma adotada.
Teorema 3 (Bolzano-Weierstrass). Toda seqüência limitada em Rn
possui uma subseqüência convergente.
Demonstração: Seja (xk ) uma seqüência limitada em Rn . As pri-
meiras coordenadas dos seus termos formam uma seqüência limitada
(xk1 )k∈N de números reais, a qual, pelo Teorema de Bolzano-Weierstrass
na reta (vol. 1, pág. 25), possui uma subseqüência convergente. Isto
é, existem um subconjunto infinito N1 ⊂ N e um número real a1 tais
que lim xk1 = a1 . Por sua vez, a seqüência limitada (xk2 )k∈N1 em R
k∈N1
possui uma subseqüência convergente: existem um subconjunto infinito
N2 ⊂ N1 e um número real a2 tais que lim xk2 = a2 . E assim por
k∈N2
12 Topologia do Espaço Euclidiano Cap. 1

diante, até obtermos n conjuntos infinitos N ⊃ N1 ⊃ N2 ⊃ · · · ⊃ Nn e


números reais a1 , a2 , . . . , an tais que lim xki = ai , para i = 1, 2, . . . , n.
k∈Ni
Então pomos a = (a1 , . . . , an ) e, pelo Teorema 2, temos lim xk = a, o
k∈Nn
que prova o teorema.
Uma seqüência de pontos xk ∈ Rn chama-se uma seqüência de Cau-
chy quando, para todo ε > 0 dado, existe k0 ∈ N tal que
k, r > k0 ⇒ |xk − xr | < ε.
Toda seqüência de Cauchy (xk ) é limitada. Com efeito, tomando
ε = 1 na definição acima, vemos que existe um ı́ndice k0 tal que, salvo
possivelmente os pontos x1 , . . . , xk0 todos os demais termos xk perten-
cem à bola B(xk0 +1 ; 1). Portanto o conjunto dos termos da seqüência é
limitado.
A condição para que a seqüência (xk ) seja de Cauchy pode ser refor-
mulada dizendo-se que lim |xk −xr | = 0, isto é, que lim |xk −xr | = 0.
k,r→∞ k,r∈N
Daı́ resulta que se N′ ⊂ N é um subconjunto infinito, ou seja, se (xr )r∈N′
é uma subseqüência de (xk ) então lim ′ |xk − xr | = 0.
k∈N, r∈N

Teorema 4 (Critério de Cauchy). Uma seqüência em Rn converge


se, e somente se, é uma seqüência de Cauchy.
Demonstração: Seja (xk ) uma seqüência de Cauchy em Rn . Sendo li-
mitada, ela possui uma subseqüência convergente (xr )r∈N′ . Seja
a = lim′ xr . Temos lim′ |xr − a| = 0 e lim ′ |xk − xr | = 0, como
r∈N r∈N k∈N, r∈N
observamos acima. Então, de |xk − a| ≤ |xk − xr | + |xr − a| resulta
que lim |xk − a| = 0, ou seja, lim xk = a. Reciprocamente, se (xk ) é
k∈N k→∞
convergente, com lim xk = a, então, como |xk − xr | ≤ |xk − a| + |xr − a|,
concluı́mos que lim |xk − xr | = 0, ou seja, (xk ) é de Cauchy.
k,r→∞

5 Conjuntos fechados

Diz-se que o ponto a é aderente ao conjunto X ⊂ Rn quando existe uma


seqüência de pontos xk ∈ X tais que lim xk = a.
Chama-se fecho do conjunto X ⊂ Rn ao conjunto X formado por
todos os pontos aderentes a X. Portanto a ∈ X ⇔ a = lim xk , xk ∈ X.
Dizer que a ∈ X é o mesmo que afirmar que a é aderente a X.
Um conjunto F ∈ Rn chama-se fechado quando F = F , isto é,
Seção 5 Conjuntos fechados 13

quando o limite de toda seqüência convergente de pontos de F é ainda


um ponto de F .
Todo ponto x ∈ X é aderente a X pois é limite da seqüência cons-
tante (x, x, . . . ). Assim, X ⊂ X qualquer que seja X ⊂ Rn . Também é
óbvio que X ⊂ Y ⇒ X ⊂ Y .
Exemplo 7. Se |x| = r então x não pertence à bola aberta B = B(0; r)
1
porém é aderente a ela. Com efeito, pondo xk = 1 − x para todo
k
k ∈ N, temos xk ∈ B(0; r) e lim xk = x, logo x ∈ B.
Reciprocamente, se x ∈ B então x = lim xk com |xk | < r para todo
k ∈ N, portanto |x| = lim |xk | ≤ r. Conclui-se então que x ∈ B⇔|x|≤r,
ou seja, B = B[0; r]. O mesmo argumento mostra que o fecho de toda
bola aberta B(a; r) é a bola fechada B[a; r].
O teorema abaixo resume as principais propriedades do fecho de um
conjunto.
Teorema 5. (a) O ponto a é aderente ao conjunto X ⊂ Rn se, e
somente se, toda bola de centro a contém algum ponto de X.
(b) Um conjunto F ⊂ Rn é fechado se, e somente se, seu complementar
Rn − F é aberto. Equivalentemente: A ⊂ Rn é aberto se, e somente
se, Rn − A é fechado.
(c) O fecho de qualquer conjunto X ⊂ Rn é fechado. Noutras palavras:
para todo X ⊂ Rn tem-se X = X.
Demonstração: (a) Se a é aderente a X então a = lim xk , com
xk ∈ X para todo k ∈ N. Portanto qualquer bola B(a; r) contém pontos
de X, a saber, todos os xk com k suficientemente grande. Reciproca-
mente, se toda bola de centro a contém pontos de X, podemos escolher,
para cada k ∈ N, um ponto xk ∈ X que esteja na bola B(a; 1/k), isto é,
|xk − a| < 1/k. Então lim xk = a, logo a é aderente a X.
(b) As seguintes afirmações são equivalentes: (1) F é fechado. (2) Se
x ∈ Rn − F então x não é aderente a F . (3) Se x ∈ Rn − F então
existe r > 0 tal que B(x; r) ⊂ Rn − F (em virtude da parte (a) acima).
(4) Rn − F é aberto. Assim, F fechado ⇔ Rn − F aberto.
Escrevendo A = Rn − F , donde F = Rn − A, esta última conclusão
lê-se assim: A é aberto se, e somente se, Rn − A é fechado.
(c) Se x ∈ Rn − X (isto é, x não é aderente a X) então, por (a),
existe uma bola B = B(x; r) que não contém pontos de X, ou seja,
14 Topologia do Espaço Euclidiano Cap. 1

X ⊂ Rn − B. Logo X ⊂ Rn − B. Mas, pela parte (b) acima, Rn − B


é fechado; portanto X ⊂ Rn − B ou, equivalentemente, B ⊂ Rn − X.
Assim, todo ponto x ∈ Rn − X é um ponto interior, logo Rn − X é
aberto. Segue-se que X é fechado.

Alguns conjuntos X ⊂ Rn não são abertos nem fechados, como


X = B(a; r) ∪ {b}, onde |b − a| = r. Ou então X = conjunto dos
pontos de Rn com coordenadas racionais (X = Qn ).
Chama-se distância do ponto a ∈ Rn ao conjunto X ⊂ Rn ao número

d(a; X) = inf{|x − a| ; x ∈ X}.

Pela definição de ı́nfimo, para cada k ∈ N existe um ponto xk ∈ X tal


1
que d(a; X) ≤ |xk − a| < d(a, X) + , portanto lim |xk − a| = d(a; X).
k k→∞
A seqüência (xk ) é certamente limitada, portanto possui uma subse-
qüência convergente. Descartando (por serem desnecessários) os termos
xk que não estejam nessa subseqüência, vemos que existe um ponto
x0 = lim xk tal que d(a, X) = |x0 − a|. Tem-se x0 ∈ X. Se o conjunto
X for fechado então x0 ∈ X. Podemos então enunciar o

Teorema 6. Seja F ⊂ Rn um conjunto fechado. Dado qualquer a ∈ Rn


existe (pelo menos um) x0 ∈ F tal que |x0 −a| ≤ |x−a| para todo x ∈ F .

Noutras palavras: Se F ⊂ Rn é fechado então, para a ∈ Rn qualquer,


a função f : F → R dada por f (x) = |x − a| assume seu valor mı́nimo
em algum ponto x0 ∈ F . Então tem-se d(a, F ) = |x0 − a|.
Se X ⊂ Y ⊂ Rn , diz-se que X é denso em Y quando X = Y . Por
exemplo, B(a; r) é denso em B[a; r] e Qn é denso em Rn .
Dizemos que a ∈ Rn é ponto de acumulação do conjunto X ⊂ Rn
quando toda bola de centro a contém algum ponto de X diferente de a.
(Noutras palavras, quando a ∈ X − {a}.) Um ponto de acumulação de
X pode pertencer a X ou não. Se a ∈ X não é ponto de acumulação de
X, diz-se que a é um ponto isolado de X. Isto significa que existe r > 0
tal que B(a; r) ∩ X = {a}. Quando todos os pontos de X são isolados,
dizemos que X é um conjunto discreto.

Exemplo 8. Todos os pontos de uma bola são pontos de acumulação. O


conjunto Zn dos pontos de Rn com coordenadas inteiras é um conjunto
discreto. ⊳
Seção 5 Conjuntos fechados 15

As demonstrações dos três teoremas seguintes são omitidas pois são


praticamente as mesmas dos seus análogos unidimensionais, provados no
volume 1 (págs. 50, 52 e 53). Basta substituir cada intervalo (a−r, a+r)
pela bola B(a; r) e considerar |x| como a norma de x.

Teorema 7. Sejam a um ponto e X um subconjunto de Rn . As seguintes


afirmações são equivalentes:
(1) a é um ponto de acumulação de X.
(2) a é limite de uma seqüência de pontos xk ∈ X − {a}.
(3) Toda bola de centro a contém uma infinidade de pontos de X.

Teorema 8. Todo subconjunto infinito limitado X ⊂ Rn admite pelo


menos um ponto de acumulação.

Teorema 9. (a) Se F1 e F2 são subconjuntos fechados de Rn então


F1 ∪ F2 é também fechado.
(b) Se (Fλ )λ∈L éTuma famı́lia arbitrária de conjuntos fechados então a
interseção F = Fλ é um conjunto fechado.
λ∈L

Cabe aqui a observação de que (a) implica que a reunião F1 ∪ · · · ∪Fk


de um número finito de conjuntos fechados é ainda um conjunto fechado.
Entretanto isto não vale para reuniões infinitas. Com efeito, um conjunto
qualquer, fechado ou não, é a reunião dos seus pontos, que são conjuntos
fechados.
Segue-se do item (2) do Teorema 7 que o fecho do conjunto X é
formado acrescentando-lhe seus pontos de acumulação que por ventura
não pertençam a X.
Seja X ⊂ Rn . Diz-se que um subconjunto F ⊂ X é fechado em X
quando F contém todos os seus pontos aderentes que pertencem a X.
Assim, F é fechado em X se, e somente se, F = F ∩ X. F é fechado
em X quando, e somente quando, F = G ∩ X onde G ⊂ Rn é fechado.
Com efeito se F = G ∩ X com G fechado então F ⊂ G, logo
F = F ∩ X ⊂ F ∩ X ⊂ G ∩ X = F , donde F = F ∩ X e F é fechado
em X.
O conjunto F ⊂ X é fechado em X se, e somente se, X − F
(seu complementar relativamente a X) é aberto em X. Com efeito
F = G ∩ X ⇔ X − F = (Rn − G) ∩ X, onde G ⊂ Rn é fechado se, e
somente se, Rn − G é aberto.
16 Topologia do Espaço Euclidiano Cap. 1

Analogamente, A ⊂ X é aberto em X se, e somente se, X − A é


fechado em X pois A = U ∩ X ⇔ X − A = (Rn − U ) ∩ X e U ⊂ Rn é
aberto se, e somente se, Rn − U é fechado.

6 Conjuntos compactos

Um conjunto X ⊂ Rn chama-se compacto quando é limitado e fechado.


Exemplo 9. Toda bola fechada B[a; r] é compacta e nenhuma bola
aberta é. O conjunto Zn é fechado mas não é limitado, logo não é
compacto. Toda esfera S[a; r] é compacta. ⊳
Teorema 10. As seguintes afirmações sobre o conjunto K ⊂ Rn são
equivalentes:
(1) K é compacto;
(2) Toda seqüência de pontos xk ∈ K possui uma subseqüência que
converge para um ponto de K.
Demonstração. Se K é compacto então toda seqüência de pontos
xk ∈ K é limitada, pois K é limitado. Por Bolzano-Weierstrass, uma
subseqüência (xk )k∈N′ converge para um ponto a = lim′ xk . Como K é
k∈N
fechado, tem-se a ∈ K. Logo (1) implica (2). Reciprocamente, se vale
(2) então K é limitado pois do contrário existiria, para cada k ∈ N,
um ponto xk ∈ K tal que |xk | > k. A seqüência (xk ) assim obtida não
possuiria subseqüência limitada, logo nenhuma de suas subseqüências
seria convergente. Além disso, K é fechado pois se a = lim xk com xk ∈
K para todo k ∈ N então, por (2), uma subseqüência de (xk ) convergiria
para um ponto de K. Mas toda subseqüência de (xk ) converge para a.
Logo a ∈ K. Isto mostra que (2) ⇒ (1) e completa a demonstração.
Estendendo a discussão da seção 5, dados os conjuntos X, Y ⊂ Rn ,
podemos definir a distância entre eles pondo

d(X, Y ) = inf{|x − y|; x ∈ X, y ∈ Y },

cabendo-nos agora indagar se, supondo X e Y fechados, existem x0 ∈ X


e y0 ∈ Y tais que d(X, Y ) = |x0 − y0 |. Nem sempre. Com efeito,
tomando em R2 o conjunto X como sendo o eixo das abcissas, isto é,
X = {(x, 0); x ∈ R} e Y = {(x, 1/x); x > 0}, ou seja, Y = ramo positivo
da hipérbole y = 1/x, vemos que X e Y são subconjuntos fechados
Seção 6 Conjuntos compactos 17

disjuntos em R2 tais que d(X, Y ) = 0. Entretanto, vale o seguinte


resultado, que contém o Teorema 6 como caso particular:

Teorema 11. Sejam K ⊂ Rn compacto e F ⊂ Rn fechado. Existem


x0 ∈ K e y0 ∈ F tais que |x0 − y0 | ≤ |x − y| para quaisquer x ∈ K e
y ∈ F.

Demonstração. Da definição de ı́nfimo segue-se que existem seqüências


de pontos xk ∈ K e yk ∈ F tais que d(K, F ) = lim |xk − yk |. Passando
a uma subseqüência, se necessário, a compacidade de K nos permite
admitir que lim xk = x0 ∈ K. Além disso, a seqüência (yk ) é limitada
pois |yk | ≤ |yk − xk | + |xk |, onde |yk − xk | é limitada por ser convergente
e |xk | é limitada pois xk ∈ K. Logo, passando novamente a uma sub-
seqüência, se necessário, podemos admitir que lim yk = y0 , com y0 ∈ F
pois F é fechado. Então |x0 − y0 | = lim |xk − yk | = d(K, F ) ≤ |x − y|
para quaisquer x ∈ K e y ∈ F .

Corolário 2. Sejam K ⊂ U ⊂ Rn , onde K é compacto e U é aberto.


Existe ε > 0 tal que toda bola B(x; ε), de raio ε e centro num ponto
x ∈ K, está contida em U .

Com efeito, sejam x0 ∈ K e y0 ∈ F = Rn − U tais que |x0 − y0 | ≤


|x − y| para quaisquer x ∈ K e y ∈ F . Ponhamos ε = |x0 − y0 |. Como
K ⊂ U , vemos que K ∩ F = ∅, portanto x0 6= y0 e daı́ ε > 0. Assim, se
x∈K ey∈ / U , tem-se |x − y| ≥ ε. Noutras palavras, se x ∈ K então
B(x; ε) ⊂ U .
Se F1 ⊃ F2 ⊃ · · · ⊃ Fk ⊃ . . . é uma seqüência decrescente de
T

fechados não-vazios em Rn , pode ocorrer que Fk = ∅. Isto ocorre,
k=1
por exemplo, quando tomamos Fk = [k, +∞) em R. O teorema abaixo
mostra que isto não acontece quando um dos Fk é limitado (portanto
todos os seguintes são).

Teorema 12 (Cantor). Seja K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . . uma


seqüência decrescente de compactos não-vazios em Rn . Existe pelo me-
nos um ponto a ∈ Rn que pertence a todos os Kk . Noutros termos:
T

Kk6= ∅.
k=1

Demonstração. Para cada k ∈ N, escolhamos um ponto xk ∈ Kk . A


seqüência (xk ) é limitada, logo possui uma subseqüência (xr )r∈N′ , que
18 Topologia do Espaço Euclidiano Cap. 1

converge para a = lim′ xr . Mostremos que a ∈ Kk para todo k ∈ N.


r∈N
De fato, dado k, temos Kr ⊂ Kk sempre que r ∈ N′ e r > k. Assim,
r ∈ N′ , r > k ⇒ xr ∈ Kk . Segue-se que a = lim′ xr pertence ao
r∈N
conjunto fechado Kk .
Uma propriedade fundamental dos conjuntos compactos é o fato de
que toda cobertura aberta de um compacto possui uma subcobertura
finita. Vejamos isto.
Uma cobertura do conjunto X ⊂SRn é uma famı́lia (Cλ )λ∈L de sub-
conjuntos Cλ ⊂ Rn tais que X ⊂ Cλ . Isto significa que para cada
λ∈L
x ∈ X existe um λ ∈ L tal que x ∈ Cλ .
Uma subcobertura
S é uma subfamı́lia (Cλ )λ∈L′ , L′ ⊂ L, tal que ainda
se tem X ⊂ Cλ .
λ∈L′
Diz-se que a cobertura S ⊂ ∪Cλ é aberta quando os Cλ forem todos
abertos, ou finita quando L é um conjunto finito.
Teorema 13 (Borel-Lebesgue). Toda cobertura aberta K ⊂ ∪Aλ
de um compacto K ⊂ Rn admite uma subcobertura finita K ⊂ Aλ1
∪ · · · ∪ Aλk .
Inicialmente, prepararemos o terreno para estabelecer um lema que
torna a demonstração do teorema quase imediata.
Seja X ⊂ Rn um conjunto limitado. O diâmetro de X é o número

diam.X = sup{|x − y|; x, y ∈ X}.

Segue-se imediatamente desta definição que se diam.X = d e x ∈ X


então X ⊂ B[x; d].
Dado α > 0, um cubo de aresta α é um produto cartesiano
Q
n
C= [ai , ai +α] de n intervalos de comprimento α. Se x = (x1 , . . . , xn )
i=1
e y = (y1 , . . . , yn ) pertencem p
a C então, para cada i = 1, . . . , n, tem-se

|xi − yi | ≤ α, logo |x − y| = Σ(xi − yi )2 ≤ α n. Tomando xi = ai e
√ √
yi = ai + α temos |x − y| = α n, portanto α n é o diâmetro do cubo
de aresta α em Rn .
S
A decomposição R = [mα, (m + 1)α] da reta em intervalos
m∈Z
adjacentes de comprimento α determina uma decomposição de Rn como
reunião de cubos adjacentes de aresta α. A saber, para cada
Seção 7 Aplicações contı́nuas 19

Q
n
m = (m1 , . . . , mn ) ∈ Zn , pomos Cm = [mi α, (mi + 1)α] e temos
S i=1 S
Rn = Cm . Para todo X ⊂ Rn tem-se X = (X ∩ Cm ). Se X é
m∈Zn m∈Zn
limitado, há apenas um número finito de interseções X ∩ Cm não-vazias,
logo podemos escrever

X = X1 ∪ · · · ∪ Xk

onde cada Xi é da forma X ∩ Cm , logo tem diâmetro ≤ α n. Se X for
compacto então cada Xi é compacto. Isto prova o

Lema 1. Seja K ⊂ Rn compacto. Para todo ε > 0 existe uma decom-


posição K = K1 ∪ · · · ∪ Kk onde cada Ki é compacto e tem diâmetro
≤ ε.

Demonstração do Teorema de Borel-Lebesgue. Seja K ⊂ Rn


compacto. Suponhamos, por absurdo, que K ⊂ ∪Aλ seja uma cobertura
aberta que não admite subcobertura finita. Exprimamos K como reu-
nião finita de compactos, todos com diâmetro < 1. Pelo menos um deles,
que chamaremos K1 , é tal que K1 ⊂ ∪Aλ não admite subcobertura
finita. Escrevendo K1 como reunião finita de compactos de diâmetro
< 1/2, vemos que pelo menos um deles, digamos K2 , não pode ser
coberto por um número finito de Aλ ’s. Prosseguindo assim, obtemos
uma seqüência decrescente de compactos K1 ⊃ K2 ⊃ · · · ⊃ Kk ⊃ . . .
com diam Kk < 1/k e tal que nenhum deles está contido numa reunião
finita de Aλ ’s. Em particular, todos os Kk são não-vazios. Pelo Teorema
T

12, existe a ∈ Kk . Para algum λ, tem-se a ∈ Aλ . Como Aλ é aberto,
k=1
tem-se B(a; 1/k) ⊂ Aλ para algum k. Sendo a ∈ Kk e diam Kk <
1/k, concluı́mos que Kk ⊂ B(a; 1/k), donde Kk ⊂ Aλ , o que é uma
contradição.

7 Aplicações contı́nuas

Uma aplicação f : X → Rn , definida no conjunto X ⊂ Rm , associa a


cada ponto x ∈ X sua imagem f (x) = (f1 (x), . . . , fn (x)). As funções
reais f1 , . . . , fn : X → R, assim definidas, chamam-se as funções-coorde-
nada de f . Escreve-se então f = (f1 , . . . , fn ).
20 Topologia do Espaço Euclidiano Cap. 1

Se Y ⊂ Rn é tal que f (X) ⊂ Y podemos (com um abuso de notação


que é irrelevante em nosso contexto) escrever f : X → Y em vez de
f : X → Rn .
Diz-se que f é contı́nua no ponto a ∈ X quando, para cada ε > 0
arbitrariamente dado, pode-se obter δ > 0 tal que

x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| < ε.

Noutros termos: para cada bola B(f (a); ε) dada, existe uma bola B(a; δ)
tal que f (B(a; δ) ∩ X) ⊂ B(f (a); ε).
A continuidade de f no ponto a independe das normas que se utilizem
em Rm e Rn .
Diremos que f : X → Rn é uma aplicação contı́nua no conjunto
X ⊂ Rm quando f é contı́nua em todos os pontos a ∈ X.
Teorema 14. Sejam X ⊂ Rm , Y ⊂ Rn , f : X → Rn com f (X) ⊂ Y
e g : Y → Rp . Se f é contı́nua no ponto a ∈ X e g é contı́nua no ponto
f (a) então g ◦ f : X → Rp é contı́nua no ponto a. Ou seja: a composta
de duas aplicações contı́nuas é contı́nua.
Demonstração. Seja dado ε > 0. A continuidade de g no ponto
f (a) assegura a existência de λ > 0 tal que y ∈ Y , |y − f (a)| < λ ⇒
|g(y) − g(f (a))| < ε. Por sua vez, dado λ > 0, a continuidade de f no
ponto a fornece δ > 0 tal que x ∈ X, |x − a| < δ ⇒ |f (x) − f (a)| <
λ ⇒ |g(f (x)) − g(f (a))| < ε, logo g ◦ f é contı́nua no ponto a.
Teorema 15. (a) A aplicação f : X → Rn é contı́nua no ponto a ∈ X
se, e somente se, para toda seqüência de pontos xk ∈ X com lim xk = a,
tem-se lim f (xk ) = f (a).
(b) A aplicação f : X → Rn é contı́nua no ponto a ∈ X se, e somente se,
suas funções-coordenada f1 , . . . , fn : X → R são contı́nuas nesse ponto.
Demonstração. (a) Seja f : X → Rn contı́nua no ponto a. Dada
a seqüência de pontos xk ∈ X com lim xk = a, para todo ε > 0 existe
δ > 0 tal que f (B(a; δ)) ⊂ B(f (a); ε). Correspondente a δ, existe k0 ∈ N
tal que k > k0 ⇒ xk ∈ B(a; δ), logo k > k0 ⇒ f (xk ) ∈ B(f (a); ε).
Isto mostra que lim f (xk ) = f (a). Reciprocamente, suponhamos, por
absurdo, que lim xk = a implica lim f (xk ) = f (a), porém f seja des-
contı́nua no ponto a. Então existe ε > 0 com a seguinte propriedade:
para todo k ∈ N, podemos encontrar xk ∈ X com |xk − a| < 1/k e
Seção 7 Aplicações contı́nuas 21

|f (xk ) − f (a)| ≥ ε. Assim, temos lim xk = a mas não temos lim f (xk ) =
f (a), uma contradição.
(b) Isto decorre imediatamente do Teorema 2 junto com a parte (a)
que acabamos de provar.
Teorema 16. Seja X ⊂ Rm . Se as aplicações f, g : X → Rn e
α : X → R são contı́nuas no ponto a ∈ X então são também contı́nuas
nesse ponto as aplicações f + g : X → Rn , hf, gi : X → R, |f | : X → R
e αf : X → Rn , definidas por (f + g)(x) = f (x) + g(x), hf, gi(x) =
hf (x), g(x)i, |f |(x) = |f (x)| e (αf )(x) = α(x) · f (x).
Demonstração. Isto resulta do Teorema 15(a) juntamente com o Co-
rolário do Teorema 2.
Teorema 17. A imagem f (K) do conjunto compacto K ⊂ X pela
aplicação contı́nua f : X → Rn é também um conjunto compacto.
Demonstração. Seja (yk ) uma seqüência de pontos em f (K). Para
cada k ∈ N existe xk ∈ K tal que f (xk ) = yk . Como K é compacto,
uma subseqüência (xk )k∈N′ converge para um ponto a ∈ K. Sendo f
contı́nua nesse ponto a, de lim′ xk = a resulta, pelo Teorema 15, que
k∈N
lim′ f (xk ) = f (a). Logo toda seqüência de pontos yk = f (xk ) ∈ f (K)
k∈N
possui uma subseqüência (yk )k∈N′ convergente para um ponto f (a) ∈
f (K). Noutras palavras: f (K) é compacto.
Corolário 3. (Weierstrass.) Seja K ⊂ Rm compacto. Se f : K → R
é uma função real contı́nua, então existem x0 , x1 ∈ K tais que f (x0 ) ≤
f (x) ≤ f (x1 ) para todo x ∈ K.
Noutas palavras: toda função real contı́nua num conjunto compacto
K atinge seus valores mı́nimo e máximo em pontos de K.
Para provar o Teorema de Weierstrass basta observar que, sendo
f (K) ⊂ R compacto, os números y0 = inf f (K) e y1 = sup f (K) perten-
cem a f (K), isto é, y0 = f (x0 ) e y1 = f (x1 ), com x0 , x1 ∈ K.
Teorema 18. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e
somente se, a imagem inversa f −1 (A) de todo conjunto aberto A ⊂ Rn
é um subconjunto aberto em X.
Demonstração. Seja f contı́nua. Se A ⊂ Rn é aberto então, para todo
x ∈ f −1 (A) existe ε > 0 tal que B(f (x); ε) ⊂ A. Pela continuidade de f ,
x é centro de uma bola aberta Bx tal que f (Bx ∩X)⊂B(f (x); ε)⊂A, logo
22 Topologia do Espaço Euclidiano Cap. 1

x ∈ Bx ∩ X ⊂ f −1 (A). Isto valendo para todo x ∈ f −1 (A), resulta que


f −1 (A) ⊂ U ∩X ⊂ f −1 (A), logo f −1 (A) = U ∩X, onde U é a reunião das
bolas abertas Bx , x ∈ f −1 (A). Reciprocamente, suponhamos que, para
todo aberto A ⊂ Rn , f −1 (A) seja aberto em X, isto é, f −1 (A) = U ∩ X
com U aberto em Rm . Então, dados x ∈ X e ε > 0, tomamos A =
B(f (x); ε) e obtemos U ⊂ Rm aberto tal que U ∩ X = f −1 (B(f (x); ε)).
Certamente x ∈ U , logo existe δ > 0 tal que B(x; δ) ⊂ U e assim
f (B(x; δ) ∩ X) ⊂ B(f (x); ε). Portanto, f é contı́nua em todos os pontos
x ∈ X.

Teorema 19. Seja X ⊂ Rm . A aplicação f : X → Rn é contı́nua se, e


somente se, a imagem inversa de todo conjunto fechado F ⊂ Rn é um
subconjunto f −1 (F ) fechado em X.

Demonstração. Isto resulta do Teorema 18 se observarmos que, pondo


A = Rn − F , então A é aberto em Rn e que f −1 (F ) = X − f −1 (A) é
fechado em X se, e somente se, f −1 (A) é aberto em X.

Observação. Dada f : X → Rn , se f (X) ⊂ Y ⊂ Rn podemos consi-


derar f como uma aplicação de X em Y e escrever f : X → Y . Se A
e F são subconjuntos de Rn então f −1 (A) = f −1 (A ∩ Y ) e f −1 (F ) =
f −1 (F ∩ Y ). Logo podemos enunciar os Teoremas 18 e 19 assim: A
aplicação f : X → Y é contı́nua se, e somente se, a imagem inversa por
f de todo subconjunto aberto (respect. fechado) em Y é um subconjunto
aberto (respect. fechado) em X.

Corolário 4. Seja X ⊂ Rm aberto (respect. fechado). A fim de que


f : X → Rn seja contı́nua é necessário e suficiente que a imagem inversa
por f de todo subconjunto aberto (respect. fechado) em Rn seja um
conjunto aberto (respect. fechado) em Rm .

Corolário 5. Sejam f, g : X → R contı́nuas no conjunto X ⊂ Rm .


O conjunto A = {x ∈ X; f (x) < g(x)} é aberto em X enquanto os
conjuntos F = {x ∈ X; f (x) ≤ g(x)} e G = {x ∈ X; f (x) = g(x)} são
fechados em X.

Em particular, tomando g constante, vemos que o conjunto dos pon-


tos x ∈ X tais que f (x) < c é aberto em X enquanto as soluções x ∈ X
da inequação f (x) ≤ c ou da equação f (x) = c formam conjuntos fecha-
dos em X.
Seção 8 Continuidade uniforme 23

Teorema 20. Sejam ϕ : K → Rn contı́nua no compacto K ⊂ Rm e


L = ϕ(K) a imagem (compacta) de ϕ. A fim de que uma aplicação
f : L → Rp seja contı́nua, é necessário e suficiente que a composta
f ◦ ϕ : K → Rp seja contı́nua.
f ◦ϕ
K Rp

ϕ
f

Demonstração. Se f é contı́nua então f ◦ ϕ é contı́nua, pelo Teo-


rema 14. Reciprocamente, supondo f ◦ ϕ contı́nua então, para todo con-
junto fechado F ⊂ Rp , a imagem inversa (f ◦ ϕ)−1 (F ) = ϕ−1 [f −1 (F )]
é um subconjunto fechado de K, logo é compacto. Então, pelo Teo-
rema 17, f −1 (F ) = ϕ[ϕ−1 (f −1 (F ))] é compacto, logo fechado em Rm .
Segue-se do Corolário 4 que f é contı́nua.
Observação. Quando se tem uma aplicação arbitrária ϕ : K → L entre
dois conjuntos, para todo Z ⊂ L vale a inclusão ϕ[ϕ−1 (Z)] ⊂ Z. En-
tretanto, quando ϕ : K → L é sobrejetiva, como no caso acima, tem-se
ϕ[ϕ−1 (Z)] = Z.
Exemplo 10. Tomemos K = [0, 2π] ⊂ R, L = S 1 = {(x, y) ∈ R2 ; x2 +
y 2 = 1} e ϕ : [0, 2π] → R2 dada por ϕ(t) = (cos t, sen t). Então [0, 2π] e
S 1 são compactos e ϕ : [0, 2π] → S 1 é contı́nua e sobrejetiva. Seja agora
g : [0, 2π] → Rn uma aplicação contı́nua tal que g(0) = g(2π). A partir
de g, podemos definir f : S 1 → Rn , pondo f (cos t, sen t) = g(t). Como
g(0) = g(2π), f está bem definida. Além disso, f ◦ ϕ = g é contı́nua.
Segue-se do Teorema 20 que f é contı́nua. Isto se exprime dizendo que
“para definir uma aplicação contı́nua no cı́rculo S 1 basta defini-la no
intervalo [0, 2π] de modo que assuma valores iguais nos extremos 0 e
2π.” ⊳

8 Continuidade uniforme

A adição e a multiplicação de números reais são funções contı́nuas


s, p : R2 → R, definidas por s(x, y) = x + y e p(x, y) = x · y. Exa-
24 Topologia do Espaço Euclidiano Cap. 1

minemos a continuidade de cada uma delas no ponto (a, b) ∈ R2 . Para


isso, usaremos em R2 a norma do máximo, segundo a qual tem-se (x, y) ∈
B((a, b); δ) se, e somente se, |x − a| < δ e |y − b| < δ.
Comecemos com a adição: dado ε > 0, tomemos δ = ε/2. Se |x−a| <
ε/2 e |y − b| < ε/2, isto é, (x, y) ∈ B((a, b), δ), então |s(x, y) − s(a, b)| =
|x + y − (a + b)| ≤ |x − a| + |y − b| < ε.
Em seguida, a multiplicação: dado ε > 0, temos xy − ab = (x − a)
(y − b) + (x − a)b + a(y − b), logo, tomando δ > 0 menor do que cada um
p ε ε
dos números ε/3, e veremos que se |x − a| < δ
3(|a| + 1) 3(|b| + 1)
e |y − b| < δ isto é, (x, y) ∈ B((a, b), δ), então

|p(x, y) − p(a, b)| = |xy − ab| ≤ |x − a| |y − b| + |x − a| |b| + |a| |y − b| ≤


ε ε ε
≤ + + = ε.
3 3 3

Note-se a diferença: no caso da adição, δ depende apenas de ε, mas


não do ponto (a, b) onde a continuidade é testada. Já na multiplicação,
δ depende não apenas de ε mas também de (a, b). Se um dos números
a ou b aumentar, para o mesmo ε deve-se tomar δ cada vez menor. Isto
significa que a adição é uniformemente contı́nua mas a multiplicação não
é. Segue-se a definição pertinente:
Uma aplicação f : X → Rn diz-se uniformente contı́nua no conjunto
X ⊂ Rm quando, para todo ε > 0, for possı́vel obter δ > 0 tal que
|x − y| < δ ⇒ |f (x) − f (y)| < ε, sejam quais forem x, y ∈ X.
Teorema 21. A fim de que f : X → Rn seja uniformente contı́nua no
conjunto X ⊂ Rm é necessário e suficiente que, para todo par de seqüên-
cias de pontos xk , yk ∈ X com lim |xk − yk | = 0, se tenha lim |f (xk ) −
f (yk )| = 0.
Teorema 22. Toda aplicação contı́nua f : X → Rn , definida num con-
junto compacto X ⊂ Rm , é uniformemente contı́nua.
As demonstrações dos Teoremas 21 e 22 são exatamente as mesmas
que se encontram nas páginas 83 e 84 do volume 1.
Exemplo 11. Uma aplicação f : X → Rn , definida no conjunto X ⊂
Rm , chama-se lipschitziana quando existe c > 0 tal que |f (x) − f (y)| ≤
c|x − y| para quaisquer x, y ∈ X. O número c é chamado uma cons-
tante de Lipschitz de f . Toda aplicação lipschitziana é uniformemente
Seção 9 Homeomorfismos 25

contı́nua: dado ε > 0, basta tomar δ = ε/c. A função f : [0, 1] → R, defi-



nida por f (x) = x, é uniformemente contı́nua mas não é lipschitziana.
Basta ver que
√ √ 1√
| x − y| = √x+ y
|x − y|
√ √
e que, com x, y ∈ [0, 1] pode-se tornar x + y tão pequeno, (logo
√ √
( x + y)−1 tão grande) quanto se queira. ⊳
Exemplo 12. Toda transformação linear A : Rm → Rn é contı́nua pois,
para cada i = 1, 2, . . . , n, a i-ésima função-coordenada de A é a função
contı́nua (x1 , . . . , xm ) 7→ ai1 x1 + · · · + aim xm , onde [aij ] é a matriz de
A. A esfera unitária S m−1 = {x ∈ Rm ; |x| = 1} é compacta. Logo A é
limitada em S m−1 . O número
|A| = sup{|A · x|; x ∈ S m−1 }
chama-se a norma da transformação A. Para todo vetor v ∈ Rm , tem-se
v
|A · v| ≤ |A| · |v|. Isto é óbvio quando v = 0. Se v 6= 0 então ∈ S m−1
|v|
logo  
v
|A · v| = |v| · |A | ≤ |A| |v|.
|v|
Para x, y ∈ Rm quaisquer, tem-se |A · x − A · y| = |A(x − y)| ≤ |A| ·
|x − y|. Logo a transformação linear A é uma aplicação lipschitziana,
com constante de Lipschitz |A|. ⊳
Exemplo 13. Dado A ⊂ Rn não-vazio, seja f : Rn → R definida por
f (x) = d(x, A). Afirmamos que |d(x, A) − d(y, A)| ≤ |x − y| para
quaisquer x, y ∈ Rn . Logo f é lipschitziana, com constante c = 1,
donde uniformemente contı́nua. Para provar nossa afirmação, observe-
mos que, dados x, y ∈ Rn , existem ā, b̄ ∈ A tais que d(x, A) = |x − ā| e
d(y, A) = |y − b̄|. (Vide seção 5.)
Temos b̄ = lim yk , com yk ∈ A. Como |x − ā| ≤ |x − yk | para todo
k ∈ N, segue-se que |x−ā| ≤ |x−b̄|. Sem perda de generalidade, podemos
supor que d(x, A) ≥ d(y, A), logo |d(x, A)−d(y, A)| = d(x, A)−d(y, A) =
|x − ā| − |y − b̄| ≤ |x − b̄| − |y − b̄| ≤ |x − y|, como querı́amos demons-
trar. ⊳
Quando |f (x) − f (y)| ≤ |x − y| para quaisquer x, y ∈ X, a aplicação
lipschitziana f : X → Rn chama-se uma contração fraca. Se
|f (x) − f (y)| ≤ c|x − y| com 0 < c < 1, a aplicação f chama-se uma
contração, simplesmente.
26 Topologia do Espaço Euclidiano Cap. 1

9 Homeomorfismos

Um homeomorfismo do conjunto X ⊂ Rm sobre um conjunto Y ⊂ Rn


é uma bijeção contı́nua f : X → Y cuja inversa f −1 : Y → X também é
contı́nua.
O gráfico de uma aplicação f : X → Rn , definida no conjunto X ⊂
R é o conjunto G = {(x, f (x)); x ∈ X} ⊂ Rm × Rn . Se f é contı́nua
m

então seu gráfico G é homeomorfo a seu domı́nio X. Com efeito, a


aplicação contı́nua ϕ : X → G, dada por ϕ(x) = (x, f (x)), é um homo-
morfismo, cujo inverso (x, f (x)) 7→ x é a restrição a G da projeção de
Rm × Rn sobre Rm .
Exemplo 14. A aplicação f : [0, 2π) → S 1 , onde f (t) = (cos t, sen t),
é uma bijeção contı́nua mas não é um homeomorfismo. Sua inversa
f −1 : S 1 → [0, 2π) aplica o compacto S 1 sobre o intervalo [0, 2π), que
não é compacto, logo é descontı́nua. Mais precisamente, f −1 é descon-
tı́nua no ponto a = (1, 0) = f (0) ∈ S 1 . Com efeito, se pusermos, para
cada k ∈ N, tk = (1 − 1/k) · 2π e zk = (cos tk , sen tk ), teremos lim zk = a
mas lim f −1 (zk )= lim tk =2π, logo não vale lim f −1 (zk )=f −1 (a)=0. ⊳
Exemplo 15. A bola aberta B = B(0; 1) ⊂ Rn é homeomorfa ao espaço
Rn . De fato, as aplicações f : Rn → B e g : B → Rn , definidas por
x y
f (x) = e g(y) =
1 + |x| 1 − |y|
são contı́nuas e, como se verifica sem dificuldade, vale g(f (x)) = x,
f (g(y)) = y, para quaisquer x ∈ Rn e y ∈ B, logo g = f −1 . ⊳
Exemplo 16. Sejam S n = {x ∈ Rn+1 ; hx, xi = 1} a esfera unitária
n-dimensional e N = (0, . . . , 0, 1) ∈ S n seu pólo norte. A projeção
estereográfica ξ : S n − {N } → Rn é um importante exemplo de homeo-
morfismo. Para todo x ∈ S n − {N }, ξ(x) é o ponto em que a semi-reta

N x corta o hiperplano xn+1 = 0, o qual identificamos com Rn . Os pontos

da semi-reta N x são da forma N +t(x−N ) com t > 0. Um tal ponto está
no hiperplano Rn quando sua última coordenada 1 + t(xn+1 − 1) é igual
a zero, ou seja, quando t = 1/(1 − xn+1 ). Logo ξ(x) = x′ /(1 − xn+1 ),
onde x′ = (x1 , . . . , xn ) para x = (x1 , . . . , xn , xn+1 ). Isto mostra que
ξ : S n − {N } → Rn é contı́nua. Seja agora ϕ : Rn → S n − {N } dada
por ϕ(y) = x, onde x′ = 2y/(|y|2 + 1) e xn+1 = (|y|2 − 1)/(|y|2 + 1).
Uma verificação simples mostra que ξ(ϕ(y)) = y para todo y ∈ Rn e
Seção 10 Conjuntos conexos 27

ϕ(ξ(x)) = x para todo x ∈ S n . Portanto a aplicação contı́nua ϕ : Rn →


S n − {N } é a inversa de ξ e conseqüentemente, ξ e um homeomor-
fismo. ⊳
Teorema 23. Se K ⊂ Rm é compacto então toda aplicação contı́nua
injetiva f : K → Rn é um homeomorfismo sobre sua imagem (compacta)
L = f (K).
Demonstração. Chamemos de g : L → K a inversa de f . Como L ⊂
Rn é compacto, portanto fechado, pelo Teorema 19, g é contı́nua se,
e somente se, para todo conjunto fechado F ⊂ Rm , a imagem inversa
g −1 (F ) = g −1 (F ∩ K) é um fechado em Rn . Mas F ∩ K é compacto,
logo g −1 (F ∩ K) = f (F ∩ K) é compacto (em virtude do Teorema 17)
logo é fechado.
O teorema acima resulta do Teorema 20, com f em vez de ϕ e f −1
no lugar de f . Ele mostra por que foi possı́vel dar o Exemplo 14: o
intervalo [0, 2π) não é compacto.

10 Conjuntos conexos

Uma cisão do conjunto X ⊂ Rn é uma decomposição X = A ∪ B onde


A∩B = A∩B = ∅, isto é, nenhum ponto de A é aderente a B e nenhum
ponto de B é aderente a A.
Um exemplo óbvio é a cisão trivial X = X ∪ ∅. Já R − {0} =
(−∞, 0) ∪ (0, +∞) é uma cisão não-trivial. Por outro lado, pondo A =
(−∞, 0] e B = (0, +∞) a decomposição R = A ∪ B não é uma cisão pois
0 ∈ A ∩ B.
Se X = A ∪ B é uma cisão então os pontos de X que são aderentes a
A, não pertencendo a B, estão em A, logo A = A ∩ X. Analogamente,
B = B ∩ X. Assim, A e B são ambos fechados em X. Como A = X − B
e B = X − A, segue-se que A e B são também abertos em X.
Reciprocamente, se A ⊂ X é aberto e fechado em X então, pondo
B = X −A, a decomposição X = A∪B é uma cisão. Com efeito, nenhum
ponto de X aderente a A pode pertencer a B pois A é fechado em X
e, da mesma forma, nenhum ponto de X aderente a B pode pertencer
a A.
Em particular, se X ⊂ Rn é aberto, uma cisão X = A ∪ B é uma
expressão de X como reunião de dois abertos disjuntos. E se X ⊂ Rn
é fechado, toda cisão X = A ∪ B é a expressão de X como reunião de
28 Topologia do Espaço Euclidiano Cap. 1

dois conjuntos fechados disjuntos. Mais particularmente ainda, se X é


compacto então A e B são compactos.
Exemplo 17. Escrevendo as linhas de uma matriz, uma após a outra,
2
numa só lista, identificaremos o espaço Rn com o conjunto das matrizes
quadradas n × n. Sejam Gn , G+ e G− respectivamente os conjuntos das
matrizes com determinante 6= 0, das matrizes com determinante > 0
e com determinante < 0. A igualdade Gn = G+ ∪ G− é uma cisão,
pois uma seqüência de matrizes com determinantes positivos não pode
convergir para uma matriz de determinante negativo. Assim G+ ∩ G− =
∅. Analogamente, G+ ∩ G− = ∅.
Se X = A ∪ B é uma cisão então, para todo Z ⊂ X, Z = (A ∩ Z) ∪
(B ∩ Z) é uma cisão.
Um conjunto X ⊂ Rn chama-se conexo quando só admite a cisão
trivial. Caso contrário, diz-se que X é desconexo.
Como vimos no Exemplo 17 acima, o conjunto ds matrizes n×n com
determinante 6= 0 é desconexo.
Na página 51 do vol. 1 foi provado que todo intervalo da reta R (seja
ele aberto ou não, limitado ou não) é conexo.
Vale a recı́proca:
Teorema 24. Os únicos subconjuntos conexos de R são os intervalos.
Demonstração. Suponha que X ⊂ R não seja um intervalo. Então
existem a < c < b tais que a, b ∈ X e c ∈ / X. Neste caso, pondo
A = {x ∈ X; x < c} e B = {x ∈ X; x > c}, vemos que X = A ∪ B é
uma cisão. Como a ∈ A e b ∈ B, esta cisão não é trivial. Portanto X é
desconexo.
Teorema 25. (a) A imagem do conjunto conexo X ⊂ Rm por uma
aplicação contı́nua f : X → Rn é um conjunto conexo.
S
(b) A reunião X = Xλ de uma famı́lia qualquer de conjuntos conexos
λ∈L
Xλ ⊂ Rn que têm um ponto a em comum é um conjunto conexo.
(c) O produto cartesiano X × Y ⊂ Rm+n dos conjuntos X ⊂ Rm e
Y ⊂ Rn é um conjunto conexo se, e somente se, X e Y são conexos.
(d) Se X ⊂ Rn é conexo e X ⊂ Y ⊂ X então Y é conexo. Em particular,
o fecho de um conjunto conexo é conexo.
Demonstração. (a) Se f (X) = A ∪ B é uma cisão da imagem de X
então A e B são ambos abertos e fechados em f (X), além de disjuntos.
Seção 10 Conjuntos conexos 29

Logo f −1 (A) e f −1 (B) são também disjuntos, abertos e fechados em X,


portanto X = f −1 (A) ∪ f −1 (B) é uma cisão, a qual é trivial pois X
é conexo. Mas A = f (f −1 (A)) e B = f (f −1 (B)) porque A e B estão
contidos em f (X). Assim, A ou B é vazio e daı́ a cisão f (X) = A ∪ B
é trivial. Então f (X) é conexo.
(b) Seja a tal que a ∈ Xλ para todo λ ∈ L. Se X = A ∪ B é uma cisão
então o ponto a pertence a um dos conjuntos, A ou B. Digamos que
a ∈ A. Para todo λ ∈ L, Xλ = (A ∩ Xλ ) ∪ (B ∩ Xλ ) é uma cisão, a
qual é trivial pois XλSé conexo. Como a ∈ A ∩ Xλ , segue-se que B ∩ Xλ
é vazio. Logo B = (B ∩ Xλ ) é vazio e a cisão X = A ∪ B é trivial.
λ
Portanto X é conexo.
(c) Se X × Y é conexo então X e Y são conexos porque são as imagens
de X × Y pelas projeções p : X × Y → X, p(x, y) = x e q : X × Y → Y ,
q(x, y) = y, as quais são contı́nuas. Reciprocamente, se X e Y são
conexos, tomamos um ponto c = (a, b) ∈ X × Y . Para cada z = (x, y) ∈
X ×Y o conjunto Cz = (X ×{b})∪({x})×Y ) é conexo pois é reunião dos
conjuntos conexos X ×{b} e {x}×Y (homeomorfos respectivamente a X
e Y ) com o ponto (x, b) em comum. S Além disso, também c = (a, b) ∈ Cz
para todo z ∈ X × Y e X × Y = Cz logo, pelo item (b), X × Y é
z
conexo.
(d) Seja Y = A ∪ B uma cisão. Então X = (A ∩ X) ∪ (B ∩ X) também é
uma cisão. Como X é conexo, tem-se, digamos, A ∩ X = ∅. De X ⊂ Y
e Y = A ∪ B resulta então que X ⊂ B, logo X ⊂ B e daı́ Y ⊂ B, pois
Y ⊂ X. Assim, tem-se A = A ∩ Y ⊂ A ∩ B = ∅, ou seja, A = ∅.
Portanto toda cisão Y = A ∪ B é trivial e Y é conexo.
Corolário 6. Se X1 , . . . , Xk são conexos então X1 × · · · × Xk é conexo.
Em particular, Rn = R × · · · × R é conexo.
Com efeito, X1 × X2 × X3 = (X1 × X2 ) × X3 e assim por diante.
Corolário 7. Se X ⊂ Rn é conexo então a imagem de toda função real
contı́nua f : X → R é um intervalo.
Com efeito, pelo Teorema 24 todo subconjunto conexo de R é um
intervalo.
Este corolário é conhecido como o Teorema do Valor Intermediário
pois pode também ser enunciado assim: “Sejam X ⊂ Rn conexo e
f : X → R contı́nua. Se a, b ∈ X são tais que f (a) < f (b) então,
30 Topologia do Espaço Euclidiano Cap. 1

para cada d com f (a) < d < f (b), existe c ∈ X tal que f (c) = d.”
Corolário 8 (“Teorema da Alfândega”). Seja X ⊂ Rn um conjunto
arbitrário. Se um conjunto conexo C ⊂ Rn contém um ponto a ∈ X e
um ponto b ∈ / X então C contém um ponto c ∈ fr.X.
Com efeito, a função contı́nua f : C → R, definida por f (x) =
d(x, X) − d(x, Rn − X), é tal que f (a) ≤ 0 e f (b) ≥ 0. Logo, pelo
Teorema do Valor Intermediário, deve existir c ∈ C tal que f (c) = 0,
isto é, d(c, X) = d(c, Rn − X). Como c ∈ X ou c ∈ Rn − X, um desses
dois números é zero, logo ambos o são e daı́ c ∈ fr.X.
Como Rn é conexo, resulta do corolário acima que se o conjunto
X ⊂ Rn não é vazio nem coincide com Rn então a fronteira de X não é
vazia. De fato, se X 6= ∅ e X 6= Rn então o conjunto conexo Rn contém
algum ponto de X e algum ponto que não pertence a X, logo contém
algum ponto da fronteira de X.
Exemplo 18. Para todo n ∈ N, a esfera S n é um conjunto conexo. Com
efeito, retirando o pólo norte N = (0, . . . , 0, 1), vemos que X = S n −{N }
é conexo por ser homeomorfo a Rn (cfr. Exemplo 16). Como S n = X,
segue-se do item (d) que a esfera S n é conexa.
Exemplo 19. Uma conseqüência do Teorema do Valor Intermediário
é que para toda função real contı́nua f : S 1 → R existe (pelo menos)
um ponto z ∈ S 1 tal que f (z) = f (−z). Para ver isto, consideremos
a função contı́nua ϕ : S 1 → R, dada por ϕ(z) = f (z) − f (−z). Vale
ϕ(−z) = −ϕ(z). Assim, ou ϕ(z) = 0 para todo z (assunto encerrado)
ou existe a ∈ S 1 com ϕ(−a) < 0 < ϕ(a), logo ϕ(z) = 0 para algum
z ∈ S 1 , pois S 1 é conexo. ⊳
Existe uma noção bem geométrica que fornece uma condição sufici-
ente para a conexidade de um conjunto, que é a conexidade por cami-
nhos.
Um caminho num conjunto X ⊂ Rn é uma aplicação contı́nua
f : I → X, definida num intervalo I.
Por exemplo, dados x, y ∈ Rn , o caminho f : [0, 1] → Rn , definido
por f (t) = (1 − t)x + ty, chama-se o caminho retilı́neo que liga x a y.
Às vezes nos referiremos a ele como o caminho [x, y].
Diremos que os pontos a, b ∈ X podem ser ligados por um caminho
em X quando existe um caminho f : I → X tal que a = f (α), b = f (β)
com α < β ∈ I.
Seção 10 Conjuntos conexos 31

Por exemplo, se X ⊂ Rn é convexo, dois pontos quaisquer


a, b ∈ X podem ser ligados por um caminho em X, a saber, o cami-
nho retilı́neo [a, b].
Se a, b ∈ X podem ser ligados por um caminho f : I → X, então
existe um caminho ϕ : [0, 1] → X tal que ϕ(0) = a e ϕ(1) = b. Basta
pôr ϕ(t) = f ((1 − t)α + tβ), onde a = f (α) e b = f (β).
Se f, g : [0, 1] → X são caminhos em X, com f (1) = g(0), então
definimos o caminho justaposto h = f ∨g : [0, 1] → X pondo h(t) = f (2t)
se 0 ≤ t ≤ 1/2 e h(t) = g(2t − 1) se 1/2 ≤ t ≤ 1. Note que estas duas
expressões definem o mesmo valor de h(1/2). Como h|[0, 1/2] e h|[1/2, 1]
são contı́nuas, segue-se que h é contı́nua. Intuitivamente, o caminho h
percorre a trajetória de f (com velocidade dobrada) até t = 1/2 e depois,
para t ≥ 1/2, descreve (ainda com velocidade dobrada) o percurso de g.
Sejam a, b, c pontos do conjunto X ⊂ Rn . Se a, b podem ser ligados
por um caminho em X e b, c também podem ser ligados por um caminho
em X, então existe um caminho em X ligando a a c. Basta tomar
caminhos f, g : [0, 1] → X com f (0) = a, f (1) = b, g(0) = b, g(1) = c
e pôr h = f ∨ g. Então h(0) = a, h(1) = c.
Um conjunto X ⊂ Rn diz-se conexo por caminhos quando dois pontos
quaisquer a, b ∈ X podem ser ligados por um caminho em X.
Todo conjunto convexo X ⊂ Rn é conexo por caminhos. Em parti-
cular, toda bola (aberta ou fechada) no espaço euclidiano é conexa por
caminhos.
A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é conexa por caminhos. Com
efeito, dados a, b ∈ S n , se a e b não são antı́podas, isto é, se b 6= −a,
então f : [0, 1] → S n , definida por
(1 − t)a + tb
f (t) =
|(1 − t)a + tb|
é contı́nua (pois seu denominador nunca se anula), com f (0) = a,
f (1) = b. Se, porém, b = −a, tomamos um ponto c ∈ S n − {a, b},
ligamos a com c e c com b pelo processo acima. O caminho justaposto
ligará o ponto a ao seu antı́poda b.
Todo conjunto X ⊂ Rn , conexo por caminhos, é conexo.
Com efeito, fixando a ∈ X seja, para cada x ∈ X, Cx a imagem de
um caminho em X ligando a até x. Pelo item (a) do Teorema 25, Cx é
um conjunto conexo que contém
S a e x. Logo, pelo item (b) do mesmo
teorema, o conjunto X = Cx é conexo.
x∈X
32 Topologia do Espaço Euclidiano Cap. 1

A recı́proca é falsa. O conjunto X0 ⊂ R2 , reunião do gráfico da


função f (x) = cos(1/x), 0 < x ≤ 1, com a origem p = (0, 0), é conexo
mas não é conexo por caminhos. Com efeito, X0 está compreendido entre
o gráfico da função contı́nua f (o qual é conexo por ser homeomorfo a
(0, 1]) e o fecho desse mesmo gráfico. Assim, pelo Teorema 25, X0 é
conexo. Mas não é conexo por caminhos pois todo caminho λ : [0, 1] →
X0 com λ(0) = p é constante. (Ver pag. 103 do livro “Espaços Métricos”,
do autor.)
Há, porém, um caso particular importante, no qual a conexidade
implica em conexidade por caminhos: quando o conjunto X ⊂ Rn é
aberto.
Diremos que f : [0, 1] → X é um caminho poligonal em X quando f
é a justaposição de um número finito de caminhos retilı́neos.

Teorema 26. Um aberto A ⊂ Rn é conexo se, e somente se, é conexo


por caminhos.

Demonstração. Seja A ⊂ Rn aberto e conexo. Fixemos um ponto


a ∈ A e consideremos o conjunto U , formado pelos pontos x ∈ A que
podem ser ligados ao ponto a por um caminho poligonal contido em A.
Afirmamos que U é aberto. Com efeito, seja x ∈ U . Sendo A aberto,
existe B = B(x; r), com x ∈ B ⊂ A. Como a bola B é convexa, todo
ponto y ∈ B pode ser ligado a x por um segmento de reta contido em
B, logo y se liga a a por um caminho poligonal contido em A. Portanto
B ⊂ U e U ⊂ A é aberto. Também V = A − U é aberto, pois se v ∈ V
então v não pode ser ligado a a por um caminho poligonal contido em
A. Tomando uma bola aberta B1 , com v ∈ B1 ⊂ A, todo z ∈ B1 se liga
a v por um segmento de reta contido em B1 . Se z pudesse ser ligado
a a por um caminho poligonal contido em A, justapondo-se [v, z] a esse
caminho, verı́amos que v ∈ U , um absurdo. Temos então A = U ∪ V ,
uma cisão. Como A é conexo e a ∈ U , temos V = ∅, donde A = U , o
que prova o teorema.

Corolário 9 (da demonstração). Se A ⊂ Rn é aberto e conexo,


dois pontos quaisquer de A podem ser ligados por um caminho poligonal
contido em A.

Mostraremos a seguir que todo conjunto X ⊂ Rn se exprime como


reunião disjunta de subconjuntos conexos máximos, chamados compo-
nentes conexas de X.
Seção 11 Limites 33

Sejam x ∈ X ⊂ Rn . A componente conexa do ponto x no conjunto


X é a reunião Cx de todos os subconjuntos conexos de X que contêm o
ponto x.
Por exemplo, se X = Q ⊂ R então a componente conexa de qualquer
ponto x ∈ X é {x}. Por outro lado, se X ⊂ Rn é conexo então, para
todo x ∈ X temos Cx = X. Se X = R − {0} então a componente
conexa de 1 em X é (0, +∞) enquanto que a componente conexa de −1
é (−∞, 0).
Dados x ∈ X ⊂ Rn , a componente conexa Cx é um conjunto conexo,
pelo Teorema 25(b). Na realidade, Cx é o maior subconjunto conexo
de X contendo o ponto x. Com efeito, se C ⊂ X é conexo e contém
x, então C é um dos conjuntos cuja reunião é Cx , logo C ⊂ Cx . Mais
ainda, se C ⊂ X é conexo e tem algum ponto em comum com Cx então
C ⊂ Cx , pois C ∪ Cx é conexo contendo x logo C ∪ Cx ⊂ Cx e daı́
C ⊂ Cx . Em particular, nenhum subconjunto conexo de X pode conter
Cx propriamente.
Sejam x, y dois pontos de X. Suas componentes conexas Cx e Cy ou
coincidem ou são disjuntas pois se z ∈ Cx ∩Cy então Cx ⊂ Cy e Cy ⊂ Cx .
Assim a relação “x e y pertencem à mesma componente conexa em X ”é
uma equivalência no conjunto X. As classes de equivalência são as
componentes conexas dos pontos de X.
Toda componente conexa Cx é um conjunto fechado em X. Com
efeito, sendo Cx ⊂ C x ∩ X ⊂ C x , o Teorema 25(d) nos assegura que
C x ∩X é um subconjunto conexo de X, contendo Cx . Logo C x ∩X = Cx ,
o que mostra que Cx é fechado em X.

11 Limites

Sejam f : X → Rn definida no conjunto X ⊂ Rm e a ∈ Rm um ponto de


acumulação de X. Diz-se que b ∈ Rn é o limite de f (x) quando x tende
para a e escreve-se lim f (x) = b quando a seguinte condição é válida:
x→a
“para todo ε > 0 dado, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ
implicam |f (x) − b| < ε”.
O ponto a pode pertencer ou não a X. Em muitos dos exemplos
mais importantes de limite, na verdade, tem-se a ∈
/ X. Mas, mesmo que
a pertença a X, o valor f (a) não desempenha papel algum na definição
de limite.
34 Topologia do Espaço Euclidiano Cap. 1

Quando o ponto de acumulação a pertence a X, a aplicação f : X →


Rn é contı́nua no ponto a se, e somente se, lim f (x) = f (a).
x→a
A propriedade seguinte decorre imediatamente da definição mas é
útil o bastante para ser destacada como um teorema.
Teorema 27 (Permanência do sinal). Sejam a um ponto de acu-
mulação de X ⊂ Rn e f : X → R uma função real. Se b = lim f (x) é
x→a
um número positivo então existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ
implicam f (x) > 0.
Demonstração. Como b é positivo, tomamos ε = b. Pela definição
de limite, existe δ > 0 tal que x ∈ X e 0 < |x − a| < δ implicam
b − ε < f (x) < b + ε, isto é, 0 < f (x) < 2b, logo f (x) > 0.

Quando X é um intervalo da reta, tem sentido a noção de limite


lateral de uma aplicação f : I → Rn , ou seja, de um caminho, num
ponto a ∈ I. Por exemplo, se a não é o extremo superior de I, diz-se
que b ∈ Rn é o limite à direita de f (t) quando t tende para a, e escreve-se
lim f (t) = b, para significar que:
t→a+
Para todo ε > 0 dado, existe δ > 0 tal que a < t < a + δ implica
t ∈ I e |f (t) − b| < ε.
Analogamente se define o limite à esquerda lim f (t).
t→a−
Assim como a continuidade de uma aplicação, a existência e o valor
do limite se exprimem em termos das funções-coordenada, como veremos
agora.

Teorema 28. Sejam a um ponto de acumulação do conjunto X,


f : X → Rn uma aplicação e f1 , f2 . . . , fn : X → R as funções-coorde-
nada de f . Então lim f (x) = b = (b1 , b2 , . . . , bn ) se, e somente se,
x→a

lim fi (x) = bi para cada i = 1, . . . , n.


x→a

Demonstração. Se lim f (x) = b então, para cada i = 1, . . . , n, tem-


x→a
se lim fi (x) = bi porque |fi (x) − bi | ≤ |f (x) − b|. Reciprocamente,
x→a
se lim fi (x) = bi para cada i = 1, . . . , n então lim f (x) = b porque
x→a x→a
P
n
|f (x) − b| ≤ |fi (x) − bi |.
i=1
Seção 11 Limites 35

A proposição seguinte relaciona o limite de aplicações com o limite


de seqüências.
Teorema 29. Seja a um ponto de acumulação do conjunto
X ⊂ Rm . A fim de que se tenha lim f (x) = b é necessário e sufici-
x→a
ente que, para toda seqüência de pontos xk ∈ X − {a} com lim xk = a,
seja lim f (xk ) = b.
A demonstração é idêntica à feita no vol. 1 (pág. 63).
Teorema 30. Sejam: a um ponto de acumulação de X ⊂ Rm , b ∈ Y ,
f : X → Y uma aplicação tal que lim f (x) = b e g : Y → Rp contı́nua
x→a
no ponto b. Então lim g(f (x)) = g(b).
x→a
Isto é mais fácil de provar do que enunciar. Basta imitar a de-
monstração de que a composta de duas aplicações contı́nuas é contı́nua
(Teorema 14).
Teorema 31. Sejam f, g : X → Rn e α : X → R definidas no conjunto
X ⊂ Rm e a um ponto de acumulação de X. Se existem lim f (x) = b,
x→a
lim g(x) = c e lim α(x) = α0 , então existem os limites e valem as
x→a x→a
igualdades abaixo:
lim [f (x) + g(x)] = b + c, lim α(x) · f (x) = α0 · b
x→a x→a
lim hf (x), g(x)i = hb, ci, lim |f (x)| = |b|.
x→a x→a

Demonstração. A aplicação s : Rn × Rn → Rn , definida por s(x, y) =


x + y, é contı́nua. Observando que f (x) + g(x) = s(f (x), g(x)), resulta
do Teorema 30 que lim [f (x) + g(x)] = lim f (x) + lim g(x) = b + c.
x→a x→a x→a
Analogamente para as outras três igualdades.
Além disso, é útil saber que se lim α(x) = 0 e f : X → Rn é limitada
x→a
na vizinhança de a (isto é, existem δ > 0 e M > 0 tais que x ∈ X e
|x − a| < δ implicam |f (x)| ≤ M ) então lim α(x)f (x) = 0, mesmo que
x→a
não exista lim f (x). (Muito fácil.)
x→a

Exemplo 20. Seja g : R2 − {0} → R definida por g(x, y) =


x2 y/(x2 + y 2 ). Então podemos escrever g(x, y) = α(x, y) · f (x, y) onde
α(x, y) = x e
xy x y
f (x, y) = 2 =p ·p = cos θ sen θ,
x + y2 2
x +y 2 x + y2
2
36 Topologia do Espaço Euclidiano Cap. 1

sendo θ o ângulo de eixo OX com o segmento Oz, z = (x, y). Assim,


temos lim α(x, y) = 0 e |f (x, y)| ≤ 1, logo lim g(x, y) = 0. ⊳
(x,y)→(0,0) (x,y)→(0,0)
Agora que já vimos ser lim (f (x) − g(x)) = lim f (x) − lim g(x),
x→a x→a x→a
podemos demonstrar a seguinte conseqüência do Teorema 27:
Teorema 32 (Permanência da desigualdade). Sejam f, g : X → R
definidas no conjunto X ⊂ Rm e a um ponto de acumulação de X. Se
f (x) ≤ g(x) para todo x ∈ X e existem lim f (x) e lim g(x) então tem-se
x→a x→a
lim f (x) ≤ lim g(x).
x→a x→a

Demonstração. Se fosse o contrário, lim f (x) > lim g(x), terı́amos


x→a x→a
lim (f (x) − g(x)) > 0 e então, pelo Teorema 27, valeria f (x) > g(x) para
x→a
todo x ∈ X suficientemente próximo de a, uma contradição.

12 Exercı́cios
Seção 1: O espaço euclidiano n-dimensional
1. Se |u + v| = |u| + |v| com u 6= 0 (norma euclidiana), prove que existe α ≥ 0 tal
que v = α · u.
2. Sejam x, y, z ∈ Rn tais que (na norma euclidiana) |x − z| = |x − y| +
|y − z|. Prove que existe t ∈ [0, 1] tal que y = (1 − t)x + tz. Mostre que
isto seria falso nas normas do máximo e da soma.
3. Sejam x, y ∈ Rn não-nulos. Se todo z ∈ Rn que é ortogonal a x for também
ortogonal a y, prove que x e y são múltiplos um do outro.
1
4. Se |x| = |y|, prove que z = (x + y) é ortogonal a y − x. (A mediana de um
2
triângulo isósceles é também altura.)

Seção 2: Bolas e conjuntos limitados


1. Dados a 6= b em Rn determine c, pertencente à reta ab, tal que c ⊥ (b − a).
Conclua que para todo x ∈ ab, com x 6= c, tem-se |c| < |x|. Interprete
geometricamente.
2. Sejam |x| = |y| = r, com x 6= y (norma euclidiana). Se 0 < t < 1, prove que
|(1 − t)x + ty| < r. Conclua que a esfera S(0; r) não contém segmentos de reta.
3. Dados
S o conjunto convexo X ⊂ Rn e o número real r > 0, seja B(X; r) =
B(x; r). Prove que B(X; r) é convexo.
x∈X

4. Prove que o conjunto X = {(x, y) ∈ R2 ; x2 ≤ y} é convexo.


5. Seja T : Rm → Rn uma transformação linear. Prove que se T 6= 0 então T não
é uma aplicação limitada. Se X ⊂ Rm é um conjunto limitado, prove que a
restrição TX : X → Rn de T ao conjunto X é uma aplicação limitada.
Seção 12 Exercı́cios 37

Seção 3: Conjuntos abertos


1. Para todo conjunto X ⊂ Rm , prove que int.X é um conjunto aberto, isto é,
int.int. X = int.X.
2. Prove que int.X é o maior conjunto aberto contido em X, ou seja, se A é
aberto e A ⊂ X então A ⊂ int.X.
3. Dê exemplo de um conjunto X ⊂ Rn cuja fronteira tem interior não-vazio e
prove que isto não seria possı́vel se X fosse aberto.
4. Seja πi : Rn → R a projeção sobre a i-ésima coordenada, isto é, se
x = (x1 , . . . , xn ) então πi (x) = xi . Prove que se A ⊂ Rn é aberto então
sua projeção πi (A) ⊂ R também é um conjunto aberto.
5. Prove que toda coleção de abertos dois a dois disjuntos e não-vazios em Rn é
enumerável.

Seção 4: Seqüências em Rn
1. Dada a seqüência (xk )k∈N em Rn , sejam N′ e N′′ subconjuntos infinitos de N
tais que N = N′ ∪ N′′ . Se as subseqüências (xk )k∈N′ e (xk )k∈N′′ convergem para
o mesmo limite a, prove que lim xk = a.
k∈N

2. Dada a seqüência (xk )k∈N em Rn , prove que as seguintes afirmações são equi-
valentes:
(a) lim |xk | = +∞
k→∞

(b) (xk )k∈N não possui subseqüências convergentes


(c) Para cada conjunto limitado X ⊂ Rn , o conjunto NX = {k ∈ N; xk ∈ X}
é finito.
3. Sejam A ⊂ Rn aberto e a ∈ A. Prove que se lim xk = a então existe k0 ∈ N
k→∞
tal que k > k0 ⇒ xk ∈ A.
4. Se a ∈ fr.X, prove que existem seqüências de pontos xk ∈ X e yk ∈ Rn − X
tais que lim xk = lim yk = a. Vale a recı́proca?

Seção 5: Conjuntos fechados


1. Para quaisquer X, Y ⊂ Rn , prove que X ∪ Y = X ∪ Y e X ∩ Y ⊂ X ∩ Y . Dê
um exemplo onde não vale X ∩ Y = X ∩ Y .
2. Diz-se que o ponto a ∈ Rn é valor de aderência da seqüência (xk )k∈N quando
a é limite de alguma subseqüência de (xk ). Prove que o conjunto dos valores
de aderência de qualquer seqüência é fechado.
3. Prove que um conjunto A ⊂ Rn é aberto se, e somente se, A ∩ X ⊂ A ∩ X
para todo X ⊂ Rn .
4. Se X ⊂ Rm e Y ⊂ Rn , prove que se tem X × Y = X × Y em Rm+n .
5. Prove que X ⊂ Rn é fechado se, e somente se X ⊃ f r.X. Por outro lado,
A ⊂ Rn é aberto se, e somente se, A ∩ f r.A = ∅.
38 Topologia do Espaço Euclidiano Cap. 1

6. Sejam A, B ⊂ Rn conjuntos limitados disjuntos e não-vazios. Se d(A, B) = 0,


prove que existe x ∈ f r.A ∩ f r.B.
7. Prove que o fecho de um conjunto convexo é convexo.
8. Prove que se C ⊂ Rn é convexo e fechado então, para todo x ∈ Rn , existe um
único x̄ = f (x) ∈ C tal que d(x, C) = |x − x̄|.

Seção 6: Conjuntos compactos


1. Seja K ⊂ Rn compacto, não-vazio. Prove que existem x, y ∈ K tais que
|x − y| = diam.K.
2. Se toda cobertura aberta de um conjunto X ⊂ Rn admite uma subcobertura
finita, prove que X é compacto.
3. Seja (xk ) uma seqüência limitada em Rn que possui um único valor de ade-
rência. Prove que (xk ) é convergente. Dê exemplo de uma sequência (não-
limitada) não-convergente que tem um único valor de aderência.
4. Se K ⊂ U ⊂ Rn , com K compacto e U aberto, prove que existe ε > 0 tal que
x ∈ K, y ∈ Rn , |x − y| < ε ⇒ [x, y] ⊂ U .
5. Seja X ⊂ Rn tal que, para todo compacto K ⊂ Rn , a interseção X ∩ K é
compacta. Prove que X é fechado.

Seção 7: Aplicações contı́nuas


1. Seja f : Rm → Rn contı́nua. Prove que as seguintes condições são equivalentes:
(a) Para todo compacto K ⊂ Rn , a imagem inversa f −1 (K) ⊂ Rm é com-
pacta.
(b) Se (xk ) é uma seqüência em Rm sem subseqüências convergentes, o
mesmo se dá com a seqüência (f (xk )) em Rn . (Ou seja, lim xk = ∞ ⇒
lim f (xk ) = ∞.)
2. Prove que um polinômio complexo não-constante p(z) = a0 + a1 z + · · · + an z n ,
considerado como uma aplicação p : R2 → R2 , cumpre uma das (portanto
ambas) condições do exercı́cio anterior.
3. Sejam X ⊂ Rm , K ⊂ Rn compacto e f : X × K → Rp contı́nua. Suponha que,
para cada x ∈ X, exista um único y ∈ K tal que f (x, y) = 0. Prove que y
depende continuamente de x.
4. Seja K ⊂ Rn compacto. Prove que a projeção π : Rm ×Rn → Rm , π(x, y) = x,
transforma todo subconjunto fechado F ⊂ Rm × K num conjunto fechado
π(F ) ⊂ Rm . Dê exemplo de F ⊂ Rm × Rn fechado tal que π(F ) ⊂ Rm não
seja fechado.

Seção 8: Continuidade uniforme


1. Sejam F, G ⊂ Rn fechados disjuntos não-vazios. A função contı́nua f : Rn →
d(x, F )
[0, 1], definida por f (x) = cumpre f (x) = 0 para todo x ∈ F
d(x, F ) + d(x, G)
e f (x) = 1 para todo x ∈ G. Ela se chama a função de Urysohn do par (F, G).
Prove que se ela é uniformemente contı́nua, então d(F, G) > 0.
Seção 12 Exercı́cios 39

2. Seja Y ⊂ X ⊂ Rm com Y denso em X. Se a aplicação contı́nua f : X → Rn é


tal que sua restrição f |Y é uniformemente contı́nua, prove que f é uniforme-
mente contı́nua.
3. Seja X ⊂ Rm um conjunto limitado. Se f : X → Rn é uniformemente contı́nua,
prove que f (X) ⊂ Rn também é limitado.
4. Sejam f, g : X → R uniformemente contı́nuas no conjunto X ⊂ Rm . Prove
que a soma f + g : X → R é uniformemente contı́nua e o mesmo se dá com o
produto f · g : X → R caso f e g sejam limitadas.
5. Seja C ⊂ Rn convexo. Se x ∈ Rn e x̄ ∈ C são tais que |x − x̄| = d(x, C), prove
que hx − x̄, y − x̄i ≤ 0 para todo y ∈ C.
6. Dado C ⊂ Rn convexo e fechado, seja f : Rn → C definida por f (x) = x̄, onde x̄
é o único ponto de C tal que |x− x̄| = d(x, C). Prove que |f (x)−f (y)| ≤ |x−y|
para quaisquer x, y ∈ Rn , logo f é uniformemente contı́nua.

Seção 9: Homeomorfismos
1. Chama-se semi-reta de origem 0 em Rn a um conjunto do tipo
σ = {tv; t ≥ 0, 0 6= v ∈ Rn }. Seja X ⊂ Rn − {0} um conjunto compacto que
tem um (único) ponto em comum com cada semi-reta com origem 0. Prove
que X é homeomorfo à esfera S n−1 .
2. Estabeleça um homeomorfismo entre Rn − {0} e o produto cartesiano S n−1 ×
R ⊂ Rn+1 .
3. Mostre que existe um homeomorfismo do produto cartesiano S m × S n sobre
um subconjunto de Rm+n+1 .
4. Dê exemplo de conjuntos X, Y ⊂ Rn e pontos a ∈ X, b ∈ Y tais que X − {a}
e Y − {b} são homeomorfos mas X não é homeomorfo a Y .
5. Sejam X ⊂ Rm , Y ⊂ Rn compactos, a ∈ X e b ∈ Y . Se X − {a} é homeomorfo
a Y − {b}, prove que X e Y são homeomorfos.

Seção 10: Conjuntos conexos


1. Prove que um conjunto X ⊂ Rn é conexo se, e somente se, para cada par de
pontos a, b ∈ X existe um conjunto conexo Cab ⊂ X tal que a ∈ Cab e b ∈ Cab .
2. Seja Z ⊂ Rn (n ≥ 2) um conjunto enumerável. Dados arbitrariamente os
pontos a, b ∈ Rn − Z, prove que existe c ∈ Rn tal que os segmentos de reta
[a, c] e [c, b] estão ambos contidos em Rn − Z. Conclua que o complementar de
um conjunto enumerável em Rn é conexo.
3. Prove que S 1 e S 2 não são homeomorfos.
4. Prove que S 1 não é homeomorfo a um subconjunto de R.
5. Quantas componentes conexas tem o conjunto X = {(x, y) ∈ R2 ; (x · y)2 =
x · y}? Especifique-as.

Seção 11: Limites


1. Se f : X → Rn é uniformemente contı́nua no conjunto X ⊂ Rm , prove que,
para todo a, ponto de acumulação de X, existe lim f (x).
x→a
40 Topologia do Espaço Euclidiano Cap. 1

2. Seja Y ⊂ X ⊂ Rm , com Y denso em X. Para toda aplicação uniformemente


contı́nua f : Y → Rn , prove que existe uma única aplicação F : X → Rn ,
uniformemente contı́nua, tal que F (y) = f (y) para todo y ∈ Y .
3. Dada f : Rm → Rn , diz-se que se tem lim f (x) = ∞ quando para todo B > 0
x→∞
existe A > 0 tal que |x| > A ⇒ |f (x)| > B. Se p : R2 → R2 é um polinômio
complexo não-constante, prove que lim p(z) = ∞.
z→∞
n
4. Seja X = {x = (x1 , . . . , xn ) ∈ R ; x1 · x2 · · · xn 6= 0}. Defina f : X → R pondo
sen(x1 · x2 · · · xn )
f (x) = · Prove que lim f (x) = 1.
x1 · x2 · · · xn x→0

5. Sejam a um ponto de acumulação do domı́nio da função f : X → R, com


X ⊂ Rm , e v ∈ Rn um vetor não-nulo. Se lim f (x) · v = v0 então existe
x→a
lim f (x) = α e v0 = α · v.
x→a
2

Caminhos em Rn

1 Caminhos diferenciáveis

Seja f : I → Rn um caminho, isto é, uma aplicação contı́nua cujo


domı́nio é um intervalo da reta. Para todo t ∈ I, tem-se f (t) =
(f1 (t), . . . , fn (t)), onde f1 , . . . , fn : I → R, as funções-coordenada de f ,
são contı́nuas.
Diz-se que o caminho f : I → Rn é diferenciável no ponto t0 ∈ I
quando existe o limite

f (t0 + h) − f (t0 )
f ′ (t0 ) = lim ,
h→0 h

chamado a derivada , ou o vetor-velocidade de f no ponto t0 .


Para todo h 6= 0, as coordenadas do vetor [f (t0 + h) − f (t0 )]/h
são os números [fi (t0 + h) − fi (t0 )]/h (i = 1, . . . , n). Pelo Teorema
28 do Capı́tulo 1, o caminho f é diferenciável no ponto t0 se, e so-
mente se, suas funções-coordenada o são. No caso afirmativo, tem-se
df
f ′ (t0 ) = (f1′ (t0 ), . . . , fn′ (t0 )). Às vezes se usa também a notação (t0 )
dt
em vez de f ′ (t0 ).
Quando o caminho f : I → Rn é diferenciável em todos os pontos
de I, diz-se que ele é diferenciável em I. Neste caso, a correspondência
t 7→ f ′ (t) define uma aplicação f ′ : I → Rn . Quando f ′ é contı́nua, o
caminho f chama-se de classe C 1 . Mais geralmente, para todo inteiro
k > 1, diz-se que f : I → Rn é um caminho de classe C k quando ele
é diferenciável e f ′ é de classe C k−1 . Para que f seja de classe C k é
42 Caminhos em Rn Cap. 2

f ′ (t0 )
f (t)

f (t0 )

Figura 2.1

necessário e suficiente que cada uma de suas funções-coordenada o seja.


Escreve-se então f ∈ C k .
No caso em que f ′ (t0 ) 6= 0, a definição acima significa que a reta que
passa pelo ponto f (t0 ) e tem a direção dada pelo vetor f ′ (t0 ), isto é, o
conjunto {f (t0 ) + α · f ′ (t0 ); α ∈ R}, é o limite quando h → 0 da secante
que passa pelos pontos f (t0 ) e f (t0 + h). Logo é natural chamá-la de
reta tangente ao caminho f no ponto t0 . Quando f ′ (t0 ) = 0 pode não
haver reta alguma que se possa chamar de tangente no ponto f (t0 ).
Exemplo 1. Dados a 6= b em Rn , seja f : R → Rn o caminho retilı́neo
que passa pelos pontos a e b: f (t) = (1 − t)a + t · b. Para todo t ∈ R,
f é diferenciável no ponto t, com f ′ (t) = b − a, como se vê diretamente
a partir da definição.
Se t0 não é o extremo superior do intervalo I, tem sentido considerar
a derivada à direita do caminho f : I → Rn no ponto t0 , a qual é definida
por
f (t0 + h) − f (t0 )
f+′ (t0 ) = lim ,
h→0+ h
e, de modo análogo, a derivada à esquerda f−′ (t0 ), caso t0 não seja o
extremo inferior de I. Quando t0 é um ponto interior de I então f
é diferenciável no ponto t0 se, e somente se, existem e são iguais as
derivadas laterais f+′ (t0 ) e f−′ (t0 ). ⊳
Exemplo 2. Seja f : R → R2 o caminho definido por f (t) = (t, |t|).
Para t > 0 tem-se f (t) = (t, t) e, para t < 0, f (t) = (t, −t). Logo, para
todo t 6= 0 existe f ′ (t), sendo f ′ (t) = (1, 1) se t > 0 e f ′ (t) = (1, −1)
se t < 0. No ponto t = 0 existem as derivadas laterais f+′ (0) = (1, 1)
e f−′ (0) = (1, −1), que são diferentes, logo f não é diferenciável no
ponto t = 0. Por outro lado, o caminho g : R → R2 , definido por
Seção 2 Cálculo diferencial de caminhos 43

x
y

Figura 2.2

g(t) = (t|t|, t2 ), tem a mesma imagem que f porém é derivável em todos


os pontos, inclusive para t = 0, valendo g ′ (0) = (0, 0). Com efeito, se
t ≤ 0 então g(t) = (−t2 , t2 ) e se t ≥ 0 vale g(t) = (t2 , t2 ). Portanto
g ′ (t) = (−2t, 2t) quando t < 0 e g ′ (t) = (2t, 2t) se t > 0. No ponto t = 0,
temos g+ ′ (0) = g ′ (0) = (0, 0).

Exemplo 3. Sejam f : R → R2 e g : R → R3 os caminhos definidos
por f (t) = (cos t, sen t) e g(t) = (cos t, sen t, t). A imagem de f é a
circunferência unitária S 1 e a imagem de g é a hélice H, cuja projeção
sobre o plano z = 0 é S 1 . Ambos, f e g, são de classe C k para todo
k ∈ N, por isso se dizem de classe C ∞ . Para todo t ∈ R tem-se f ′ (t) =
(− sen t, cos t) e g ′ (t) = (− sen t, cos t, 1).

2 Cálculo diferencial de caminhos


Sejam f, g : I → Rn caminhos e α : I → R uma função real. Se f , g e α
são diferenciáveis no ponto t0 ∈ I então são também diferenciáveis
p nesse
ponto os caminhos f + g, αf e as funções hf, gi e |f | = hf, f i, esta
última sob a condição de ser f (t0 ) 6= 0.
Valem então as regras abaixo:
1. (f + g)′ (t0 ) = f ′ (t0 ) + g ′ (t0 ),
2. (αf )′ (t0 ) = α′ (t0 ) · f (t0 ) + α(t0 ) · f ′ (t0 ),
3. hf, gi′ (t0 ) = hf ′ (t0 ), g(t0 )i + hf (t0 ), g ′ (t0 )i,
hf (t0 ),f ′ (t0 )i
4. |f |′ (t0 ) = |f (t0 )| ,
as quais se provam simplesmente calculando em termos das coordenadas
de f e g.
44 Caminhos em Rn Cap. 2

Vimos no Exemplo 3 que, em cada ponto, o vetor-velocidade f ′ (t) =


(− sen t, cos t) é perpendicular a f (t) = (cos t, sen t). A última das re-
gras de derivação acima, segundo a qual |f |′ = hf, f ′ i/|f |, mostra que,
mais geralmente, se f : I → Rn é um caminho diferenciável com |f |
constante (isto é, f (t) pertence a uma esfera de centro 0) então o vetor-
velocidade f ′ (t) é perpendicular a f (t), para todo t ∈ I. Reciproca-
mente, se hf (t), f ′ (t)i = 0 para todo t ∈ I então |f |′ = 0, logo a função
real |f | : I → R é constante.
Vale também para caminhos diferenciáveis f : I → Rn o fato de que
derivada identicamente nula implica f constante. Isto pode ser visto
diretamente ou a partir do Teorema do Valor Médio, o qual assume,
para caminhos, a forma de uma desigualdade.
O Teorema do Valor Médio para uma função diferenciável
f : [a, b] → R diz que existe c, com a < c < b, tal que f (b) − f (a) =
f ′ (c)(b − a). Tal igualdade não vale sempre para caminhos f : I →
Rn . Por exemplo, se considerarmos f : [0, 2π] → R2 , dado por f (t) =
(cos t, sen t), temos f (2π) − f (0) = 0 mas, como |f ′ (t)| = 1 para todo t ∈
[0, 2π] não pode existir c ∈ [0, 2π] tal que f (2π) − f (0) = f ′ (c) · (2π − 0).
Tem-se entretanto o seguinte importante resultado:

Teorema 1 (Desigualdade do Valor Médio). Seja f : [a, b] → Rn


um caminho, diferenciável no intervalo aberto (a, b), com |f ′ (t)| ≤ M
para todo t ∈ (a, b). Então |f (b) − f (a)| ≤ M · (b − a).

Demonstração. Definamos ϕ : [a, b] → R pondo ϕ(t) = hf (t),


f (b) − f (a)i. Então, pelo Teorema do Valor Médio (Vol. 1, pág.
96), existe c ∈ (a, b) tal que ϕ(b) − ϕ(a) = ϕ′ (c) · (b − a), pois ϕ é
contı́nua, derivável em (a, b), com ϕ′ (t) = hf ′ (t), f (b) − f (a)i. Mas
ϕ(b) − ϕ(a) = |f (b) − f (a)|2 . Logo, usando a desigualdade de Schwarz,
temos:

|f (b) − f (a)|2 = hf ′ (c), f (b) − f (a)i · (b − a)


≤ |f ′ (c)| |f (b) − f (a)| · (b − a)
≤ M · |f (b) − f (a)| · (b − a).

Cancelando o fator |f (b) − f (a)|, vem |f (b) − f (a)| ≤ M · (b − a).

Corolário 1. Se o caminho f : [a, b] → Rn tem derivada nula em todos


os pontos de (a, b) então é constante.
Seção 3 A integral de um caminho 45

Teorema 2 (Regra da Cadeia). Sejam ϕ : I → J diferenciável no


ponto a ∈ I e f : J → Rn um caminho diferenciável no ponto b =
ϕ(a). Então o caminho f ◦ ϕ : I → Rn é diferenciável no ponto a, com
(f ◦ ϕ)′ (a) = ϕ′ (a) · f ′ (b).
Demonstração. Aplicar a Regra da Cadeia às funções-coordenada fi ◦ϕ
do caminho f ◦ ϕ.
Exemplo 4. Sejam f : R → R2 e ϕ : R → R, com f (t) = (cos t, sen t)
e ϕ(t) = t2 . Então o caminho f ◦ ϕ : R → R2 , dado por (f ◦ ϕ)(t) =
(cos t2 , sen t2 ), tem vetor-velocidade (f ◦ ϕ)′ (t) = (−2t sen t2 , 2t cos t2 ) =
2t · (− sen t2 , cos t2 ), múltiplo escalar do vetor-velocidade de f no ponto
ϕ(t).
De um modo geral, a Regra da Cadeia diz que o caminho t 7→ f (ϕ(t)),
cuja imagem está contida na imagem de f , tem, para cada t ∈ I, vetor-
velocidade igual a um múltiplo escalar do vetor-velocidade de f em ϕ(t).

3 A integral de um caminho

Lembramos que uma partição do intervalo [a, b] é um conjunto finito


P = {t0 < t1 < · · · < tk } com t0 = a e tk = b. A norma de P é o
número |P | = max{ti − ti−1 ; i = 1, . . . , k}. Diz-se que outra partição Q
refina P quando P ⊂ Q. Uma partição pontilhada de [a, b] é um par
P ∗ = (P, ξ) onde ξ = {ξ1 , . . . , ξk } com ti−1 ≤ ξi < ti , 1 ≤ i ≤ k.
Dados o caminho f : [a, b] → Rn e uma partição pontilhada P ∗ =
(P, ξ) de [a, b], a soma de Riemann de f associada a P ∗ é definida como
X k
X
(f ; P ∗ ) = f (ξi )(ti − ti−1 ).
i=1
P
Diz-se que o vetor v ∈ Rn é o limite da soma de Riemann P (f ; P ∗ )
quando a norma de P tende a zero, e escreve-se v = lim (f ; P ∗ ),
|P |→0
para significar que,
P dado arbitrariamente ε > 0, existe δ > 0 tal que
|P | < δ ⇒ |v − (f ; P ∗ )| < ε, seja qual for a maneira de pontilhar P .
Vimos no Volume 1 (págs. 127 e 137) que se f : [a, b] → R é contı́nua
P Rb
então existe lim (f ; P ∗ ) = a f (t) dt. Daı́ resulta que, se f : [a, b] →
|P |→0
Rn é um caminho, existe o limite
X Z b Z b 

lim (f ; P ) = f1 (t)dt, . . . , fn (t) dt .
|P |→0 a a
46 Caminhos em Rn Cap. 2

Pomos, por definição,


Z b X Z b Z b 

f (t) dt = lim (f ; P ) = f1 (t) dt, . . . , fn (t) dt .
a |P |→0 a a

Segue-se da propriedade correspondente para funções reais que


Z b Z b Z b
[αf (t) + βg(t)] dt = α f (t) dt + β g(t) dt,
a a a

se α, β ∈ R. Além disso, tem-se a importante desigualdade


Z b Z b

f (t) dt ≤ |f (t)| dt,

a a

a qual decorre do fato de que, para toda partição pontilhada P ∗ , tem-se


X X

(f ; P ) ≤ (|f |; P ∗ )

pois a norma de uma soma é menor do que ou igual à soma das normas
das parcelas.
Em particular, se |f (t)| ≤ M para todo t ∈ [a, b] então
Z b

f (t) dt ≤ M · (b − a).

a

Exemplo 5. Se f : [0, 2π] → R2 e gR: [0, 1] → R2 são dadosR por f (t) =


2π 1
(cos t, sen t) e g(t) = (t, t2 ) então 0 f (t) dt = (0, 0) e 0 g(t) dt =
(1/2, 1/3). ⊳
Aplicando o Teorema Fundamental do Cálculo a cada uma das co-
ordenadas do caminho f : [a, b] → Rn , de classe C 1 , obtemos o seguinte
Teorema 3 (Teorema Fundamental do Cálculo para Caminhos).
Se f : [a, b] → Rn é um caminho de classe C 1 então
Z b
f ′ (t) dt = f (b) − f (a).
a

Daı́ resulta outra prova da Desigualdade do Valor Médio (no caso


particular de f ∈ C 1 ), pois se |f ′ (t)| ≤ M para todo t ∈ [a, b] então
Z b


|f (b) − f (a)| = f (t) dt ≤ M · (b − a).

a
Seção 3 A integral de um caminho 47

Exprimindo novamente a integral de um caminho em termos das


integrais de suas funções-coordenada, resulta o Teorema de Mudança de
Variável seguinte
Se ϕ : [c, d]→[a, b] é de classe C 1 e f : [a, b]→Rn é um caminho então
Z ϕ(d) Z d
f (t) dt = f (ϕ(t))ϕ′ (t) dt.
ϕ(c) c

Uma simples aplicação desta fórmula nos permite enunciar o Teo-


rema Fundamental do Cálculo assim: se f R: [a, a+h] → Rn é um caminho
1
de classe C 1 então f (a + h) − f (a) = h · 0 f ′ (a + th) dt.
Basta considerar ϕ : [0, 1]→[a, a+h] onde ϕ(t)=a+th e notar que
ϕ′ (t)=h.
Um caminho f : I → Rn diz-se uniformemente diferenciável quando,
para todo t ∈ I existe um vetor f ′ (t) ∈ Rn com a seguinte propriedade:
Dado qualquer ε > 0, pode-se obter δ > 0 tal que 0 < |h| < δ e
t + h ∈ I implicam |f (t + h) − f (t) − f ′ (t) · h| < ε|h| para qualquer t ∈ I.
A diferença entre a diferenciabilidade uniforme e a diferenciabilidade
pura e simples situa-se no fato de que o número δ > 0 depende apenas
do ε > 0 dado, mas não do ponto t ∈ I onde se toma a derivada f ′ (t).
Teorema 4 (Diferenciabilidade Uniforme). Todo caminho f: [a, b] →
Rn , de classe C 1 no intervalo compacto [a, b], é uniformemente dife-
renciável.
Demonstração. Pela continuidade uniforme da derivada f ′ : [a, b] →
Rn , dado ε > 0 existe δ > 0 tal que |h| < δ e t + h ∈ [a, b] implicam
|f ′ (t + h) − f ′ (t)| < ε seja qual for t ∈ [a, b]. Observando que, para
R t+h
t ∈ [a, b] fixo vale t f ′ (t) ds = f ′ (t) · h, o Teorema Fundamental do
Cálculo nos diz que 0 < |h| < δ e t + h ∈ [a, b] implicam
Z t+h


|f (t + h) − f (t) − f (t) · h| =

[f (s) − f (t)] ds ≤ ε · |h|
′ ′
t

para qualquer t ∈ [a, b], o que demonstra o teorema.

Observação. Vale a recı́proca: todo caminho f : [a, b] → Rn uniforme-


mente diferenciável é de classe C 1 . (Vide “Curso de Análise”, vol. 1,
pág. 218 e vol. 2, pág. 88.)
48 Caminhos em Rn Cap. 2

4 Caminhos retificáveis

O comprimento de um caminho f : [a, b] → Rn , que definiremos a seguir,


é a medida da trajetória percorrida pelo ponto f (t) quando t varia de a
até b. Não é o comprimento da curva imagem de f , pois o ponto f (t)
pode percorrer essa mesma curva de vários modos diferentes, dando
origem a caminhos de comprimentos diversos. Por exemplo, o segmento
de reta que vai da origem ao ponto P = (1, 1) do plano tem comprimento

2. O caminho f : [0, 2] → R2 , definido por f (t) = (2t − t2 , 2t − t2 )
tem por imagem esse segmento, porém o percorre duas vezes, saindo de
f (0) = (0, 0), indo até f (1) = (1, 1) e voltando
√ até f (2) = (0, 0). Seu
comprimento é, como veremos, igual a 2 2.
Dado um caminho f : [a, b] → Rn , cada partição P =
{a = t0 < · · · < tk = b} de [a, b] determina uma poligonal inscrita na
imagem de f , cujos vértices são os pontos f (a),f (t1 ),. . . ,f (tk−1 ),f (b). O
comprimento dessa poligonal é o número

k
X
l(f ; P ) = |f (ti ) − f (ti−1 )|.
i=1

Quando não houver perigo de confusão, escreveremos apenas l(P ), em


vez de l(f ; P ).
Diz-se que o caminho f : [a, b] → Rn é retificável quando o conjunto
dos números l(P ), obtidos considerando-se todas as partições P do in-
tervalo [a, b], for limitado. Então o supremo desse conjunto chama-se o
comprimento do caminho f , o qual é representado por l(f ). Assim

l(f ) = sup l(f ; P ) = sup l(P ).


P P

Exemplo 6. Seja f : [0, 1] → Rn o caminho retilı́neo f (t) =


(1 − t)A + tB. Para toda partição P = {0 < t1 < · · · < tk−1 < 1}
de [0, 1] tem-se
X X
l(P ) = |f (ti ) − f (ti−1 )| = (ti − ti−1 )|B − A| = |B − A|.

Assim, obviamente vale l(f ) = |B − A|. ⊳


Seção 4 Caminhos retificáveis 49

Exemplo 7. Um caminho não-retificável f : [a, b] → Rn é aquele em que


o ponto f (t) descreve uma trajetória infinitamente longa no tempo finito
b − a. Um exemplo de tal situação é o caminho f : [0, 1] → R2 , dado por
f (t) = (t, ϕ(t)) o qual percorre o gráfico da função ϕ : [0, 1] → R. Esta
função tem, em cada intervalo
 
n n+1
,
n+1 n+2
1
o gráfico na forma de um triângulo isósceles de altura · Além disso,
n+1
ϕ(1) = 0. Se considerarmos, para cada n ∈ N, a partição
 
n+1
Pn = 0, 1/2, 2/3, . . . , ,1
n+2

do intervalo [0, 1], veremos que l(Pn ) é a soma dos comprimentos dos
lados inclinados dos n + 1 primeiros triângulos isósceles que formam
o gráfico de ϕ. Logo l(Pn ) é maior do que a soma das alturas desses
triângulos, ou seja,
1 1 1
l(Pn ) > + + ··· + ·
2 3 n+1
Como a série harmônica é divergente, segue-se que o conjunto dos
números l(P ) associados ao caminho f é ilimitado, portanto f não é
retificável. O caminho f tem comprimento infinito.
Uma observação simples, porém útil, é a seguinte: se a partição Q do
intervalo [a, b] refina a partição P então, dado o caminho f : [a, b] → Rn ,
tem-se l(P ) ≤ l(Q). Para ver isto, basta considerar o caso em que se
obtém Q a partir de P acrescentando-lhe um só ponto q, pois cada
refinamento de P pode ser pensado como a repetição de um número
finito desses acréscimos. Ora, se Q difere de P pela adição do único
ponto q, digamos com pj−1 < q < pj , então

l(Q) − l(P ) = |f (q) − f (pj−1 )| + |f (pj ) − f (q)| − |f (pj ) − f (pj−1 )| ≥ 0

pois

|f (pj ) − f (pj−1 )| = |f (pj ) − f (q) + f (q) − f (pj−1 )|


≤ |f (pj ) − f (q)| + |f (q) − f (pj−1 )|.
50 Caminhos em Rn Cap. 2

f (pj )

f (q)
f (pj−1 )

Figura 2.3

Como no caso da integral, dado um caminho f : [a, b] → Rn diremos


que o número real A é o limite de l(P ) quando |P | tende a zero, e
escreveremos lim l(P ) = A, para significar que, para todo ε > 0 dado,
|P |→0
é possı́vel obter δ > 0 tal que |P | < δ implica |l(P ) − A| < ε.

Teorema 5. Se lim l(P ) = A então A = sup l(P ), ou seja, o caminho


|P |→0 P
f : [a, b] → Rn é retificável e l(f ) = A.

Demonstração. Se lim l(P ) = A, é claro que A ≤ sup l(P ). Supo-


|P |→0 P
nhamos, por absurdo, que seja A < sup l(P ). Então existe uma partição
P
Q0 tal que A < l(Q0 ). Seja ε = l(Q0 ) − A. Pela definição do limite,
podemos obter δ > 0 tal que |P | < δ ⇒ A − ε < l(P ) < A + ε =
l(Q0 ). Tomemos uma partição qualquer P0 tal que |P0 | < δ. A partição
P = P0 ∪ Q0 , por um lado cumpre |P | < δ, logo l(P ) < l(Q0 ) e, por
outro lado, refina Q0 , logo l(Q0 ) ≤ l(P ). Esta contradição prova o
teorema.

Observação. Vale a recı́proca: se f é retificável, então l(f ) = lim l(P ).


|P |→0
(Vide “Curso de Análise”, vol. 2, pág. 99.) Mas somente o teorema
acima será usado a seguir.

Teorema 6. Todo caminho f : [a, b] → Rn de classe C 1 é retificável e


Z b
l(f ) = |f ′ (t)| dt.
a

Demonstração. Para toda partição P = {t0 < t1 < · · · < tk } de


Seção 4 Caminhos retificáveis 51

P P k Pk
[a, b], sejam
(P ) = |f ′ (ti−1 )|(ti − ti−1 ) e l(P ) = |f (ti ) − f (ti−1 )|.
i=1 i=1
Z b
P
Sabemos que lim (P ) = |f ′ (t)| dt. E, pelo Teorema 4, para todo
|P |→0 a
ε > 0 dado arbitrariamente, existe δ > 0 tal que |P | < δ implica f (ti ) −
ε
f (ti−1 ) = (f ′ (ti−1 ) + ρi )(ti − ti−1 ) com |ρi | < para i = 1, . . . , k.
b−a
P k P
k
Logo l(P ) = |f (ti ) − f (ti−1 )| = |f ′ (ti−1 ) + ρi |(ti − ti−1 ), portanto
i=1 i=1
P P
k
| (P ) − l(P )| ≤ |ρi |(ti − ti−1 ) < ε sempre que |P | < δ. Como
Z b i=1 Z b
P ′
lim (P ) = |f (t)| dt, resulta daı́ que lim l(P ) = |f ′ (t)|dt.
|P |→0 a |P |→0 a
Z b

Pelo Teorema 5, concluı́mos que l(f ) = |f (t)| dt.
a

Uma reparametrização do caminho f : [a, b] → Rn é um caminho da


forma f ◦ ϕ : [c, d] → Rn , onde ϕ : [c, d] → [a, b] é uma função de classe
C 1 tal que ϕ(c) = a, ϕ(d) = b e ϕ′ (u) ≥ 0 para todo u ∈ [c, d]. O
teorema acima tem, como conseqüência imediata, o seguinte
Corolário 2. Um caminho de classe C 1 , f : [a, b] → Rn , e qualquer sua
reparametrização f ◦ ϕ : [c, d] → Rn têm o mesmo comprimento.
Com efeito, pelo Teorema,
Z b Z d

l(f ) = |f (t)| dt = ϕ′ (u) · |f ′ (ϕ(u))| du
a c
Z d Z d
= |ϕ′ (u) · f ′ (ϕ(u))| du = |(f ◦ ϕ)′ (u)| du = l(f ◦ ϕ).
c c

Para caminhos f : [a, b] → Rn


de classe C 1 com a propriedade adi-

cional de que f (t) 6= 0 para todo t ∈ [a, b] (chamados caminhos re-
gulares), existe uma reparametrização especial, “por comprimento de
arco”, que apresentamos agora. Dado um tal caminho f , digamos com
l(f ) = L, definimos a função ϕ : [a, b] → [0, L] pondo, para todo t ∈ [a, b],
Z t
ϕ(t) = |f ′ (u)| du = l(f |[a, t]), comprimento do caminho f |[a, t], res-
a
trição de f ao intervalo [a, t].
A função ϕ : [a, b] → [0, L], assim definida, é de classe C 1 , com
ϕ (t) = |f ′ (t)| > 0 para todo t ∈ [a, b], e ϕ(a) = 0, ϕ(b) = L. Logo

52 Caminhos em Rn Cap. 2

é uma bijeção de [a, b] sobre [0, L], cuja inversa ϕ−1 : [0, L] → [a, b] é
também de classe C 1 , valendo, para todo s = ϕ(t) ∈ [0, L], a fórmula
1 1
(ϕ−1 )′ (s) = ′ = ′ > 0. (Cfr. Vol. 1, pág. 92.)
ϕ (t) |f (t)|
Consideremos a reparametrização g = f ◦ ϕ−1 : [0, L] → Rn do ca-
minho f . Para todo s = ϕ(t) ∈ [0, L] temos

f ′ (t)
g ′ (s) = (ϕ−1 )′ (s) · f ′ (t) = ,
|f ′ (t)|

portanto |g ′ (s)| = 1.
Então, para todo s ∈ [0, L], o comprimento do caminho restrito
g|[0, s] tem o valor
Z s Z s

l(g|[0, s]) = |g (u)| du = du = s.
0 0

Por este motivo, g = f ◦ ϕ−1 chama-se a reparametrização de f por


comprimento de arco.
Z b
Observação. A fórmula l(f ) = |f ′ (t)| dt é importante teoricamente
a
mas, em geral, é impraticável procurar calcular essa integral, a não ser
numericamente ou então em raros casos especialmente escolhidos, como
f (t) = (1 − t)A + tb, f (t) = (cos t, sen t) e outros.

5 Exercı́cios
Seção 1: Caminhos diferenciáveis
1. Seja f : I → Rn um caminho diferenciável. Se existirem a ∈ I e b ∈ Rn tais
que a é ponto de acumulação do conjunto f −1 (b), prove que f ′ (a) = 0.
2. Seja f : I → R2 um caminho diferenciável cuja imagem coincide com o gráfico
da função g : [−1, 1] → R , g(t) = |t|. Se a é um ponto interior de I tal que
f (a) = (0, 0), prove que f ′ (a) = 0.
3. Seja f : R → R3 a hélice cilı́ndrica, definida no Exemplo 3 por f (t) =
(cos t, sen t, t). Prove que, para todo t ∈ R, a reta que liga os pontos f (t)
e f (t) + f ′′ (t) intersecta o eixo vertical de R3 .
4. O caminho g : R → R3 , definido por g(t) = (a cos bt, a sen bt, ct), é também
chamado de hélice. Determine a relação entre as constantes a, b, c a fim de
que o caminho g esteja parametrizado pelo comprimento de arco.
Seção 5 Exercı́cios 53

Seção 2: Cálculo diferencial de caminhos


1. Seja f : [a, b] → Rn um caminho diferenciável tal que f (a) = f (b) = 0. Prove
que existe c ∈ (a, b) tal que hf (c), f ′ (c)i = 0.
2. Sejam f1 , f2 : I → Rm caminhos diferenciáveis e ϕ : Rm × Rm → Rn uma
aplicação bilinear. Prove que o caminho g : I → Rn , dado por g(t) =
ϕ(f1 (t), f2 (t)), é diferenciável e g ′ (t) = ϕ(f1′ (t), f2 (t)) + ϕ(f1 (t), f2′ (t)) para
todo t ∈ I. Estenda este resultado para aplicações p-lineares ϕ : Rm × · · · ×
2
Rm → Rn e conclua daı́ que se f : (−ε, ε) → Rm é um caminho diferenciável
de matrizes m × m com f (0) = Im e g : I → R é a função definida por
g(t) = det ·f (t) então g ′ (0) = tr ·a (traço de matriz a), onde a = f ′ (0).
2
3. Seja f : I → Rn um caminho diferenciável cujos valores são matrizes n × n.
2
Prove que g : I → Rn , dado por g(t) = f (t)k , é diferenciável e calcule g ′ (t).
Seção 3: A integral de um caminho
1. Sejam f : [a, b] → Rn e ϕ : [a, b] → R de classe C 1 . Se |f ′ (t)| ≤ ϕ′ (t) para todo
t ∈ (a, b), prove que |f (b) − f (a)| ≤ ϕ(b) − ϕ(a).
2. Seja f : [a, a + h] → Rn um caminho de classe C k . Prove que

hk−1 (k−1)
f (a + h) = f (a) + h · f ′ (a) + · · · + f (a) + rk
(k − 1)!

onde Z 1
hk
rk = (1 − t)k−1 f (k) (a + th) dt.
(k − 1)! 0

3. Sejam f, g : [a, b] → Rn caminhos de classe C 1 . Prove que


Z b Z b
hf (t), g ′ (t)idt = hf (b), g(b)i − hf (a), g(a)i − hf ′ (t), g(t)i dt.
a a

4. Seja × o produto vetorial em R3 . Para todo v ∈ R3 e todo caminho f : [a, b] →


Z b Z b
R3 , prove que [v × f (t)]dt = v × f (t)dt.
a a

5. Seja A ⊂ Rn convexo. Se o caminho f : [a, b] → Rn cumpre f (t) ∈ A para todo


Z b
1
t ∈ [a, b], prove que f (t)dt ∈ A.
b−a a

Seção 4: Caminhos retificáveis


1. Seja f : [a, b] → Rn um caminho de classe C 1 , com f (a) = A e f (b) = B. Se
seu comprimento é l(f ) = |B − A|, prove que f é uma reparametrização do
caminho retilı́neo [A, B].
2. Seja f : [0, L] → S 1 ⊂ R2 um caminho de classe C 1 (com |f (t)| = 1 para todo
Z
1 L
t ∈ [0, L]). Se seu valor médio m = f (t)dt pertence a S 1 , prove que f é
L 0
constante.
54 Caminhos em Rn Cap. 2

3. Seja U ⊂ Rn aberto e conexo. Dados a, b ∈ U , prove que existe um caminho


retificável f : I → U começando em a e terminando em b.
4. Dado U ⊂ Rn aberto e conexo, defina a distância intrı́nseca entre os pontos
a, b ∈ U como o ı́nfimo dU (a, b) dos comprimentos dos caminhos retificáveis
f : I → U , que ligam a e b. Prove que se (xk ) é uma seqüência de pontos em
U e a ∈ U , tem-se lim xk = a se, e somente se, lim dU (xk , a) = 0.
3

Funções Reais de n Variáveis

1 Derivadas parciais

Seja f : U → R uma função definida no aberto U ⊂ Rn . Para cada i =


1, . . . , n, a i-ésima derivada parcial de f no ponto a = (a1 , . . . , an ) ∈ U
é o número
∂f f (a + tei ) − f (a) f (a1 , . . . , ai + t, . . . , an ) − f (a)
(a) = lim = lim ,
∂xi t→0 t t→0 t
caso este limite exista. Como U é aberto, podemos achar δ > 0 tal
que a + tei ∈ U para todo t ∈ (−δ, δ). Então está bem definido o
caminho retilı́neo λ : (−δ, δ) → U , λ(t) = a + tei . A definição acima
∂f
diz que (a) = (f ◦ λ)′ (0) = derivada, no ponto t = 0, da função real
∂xi
f ◦ λ : (−δ, δ) → R.
Observemos que ∂f /∂xi significa a derivada de f em relação a sua
i-ésima variável, seja qual for o nome que se atribua a ela. Assim
∂f ∂f ∂f
= = , etc.
∂xi ∂yi ∂zi
Uma notação alternativa, que evitaria mal-entendidos, seria ∂i f . Prefe-
rimos a notação tradicional ∂f /∂xi porque ela é conveniente quando se
usa a regra da cadeia.
Quanto n = 2 ou n = 3, escrevemos (x, y) em vez de (x1 , x2 ) e
(x, y, z) em vez de (x1 , x2 , x3 ). Assim, ∂f /∂x, ∂f /∂y e ∂f /∂z são as
derivadas parciais de f em relação à primeira, a segunda e a terceira
variáveis respectivamente.
56 Funções Reais de n Variáveis Cap. 3

Exemplo 1. Seja f : R2 → R definida por f (x, y) = xy/(x2 + y 2 ) se


x2 + y 2 6= 0 e f (0, 0) = 0. Como f (0, y) = 0 para todo y e f (x, 0) = 0
∂f ∂f
para todo x, segue-se que (0, 0) = 0 e (0, 0) = 0. Entretanto a
∂x ∂y
função f é descontı́nua na origem (0, 0). Com efeito, se chamarmos de θ
o ângulo que o vetor não-nulo v = (x, y) forma com o eixo das abcissas,
veremos que
x y
f (x, y) = p ·p = cos θ · sen θ.
2
x +y 2 x + y2
2

Logo, atribuindo diferentes valores a θ, podemos fazer com que f (x, y)


tenha limites diferentes quando (x, y) tende para (0, 0) ao longo do seg-
mento x = t cos θ, y = t sen θ, ou seja, quando t → 0. ⊳
O exemplo acima mostra que a existência das n derivadas parciais
no ponto a não assegura a continuidade da função f nesse ponto. Para
cada i = 1, . . . , n, a função λ(t) = f (a + tei ) é essencialmente a restrição
de f ao segmento (a − δei , a + δei ) da reta que passa pelo ponto a e é
∂f
paralela ao i-ésimo eixo coordenado de Rn . A derivada parcial (a) =
∂xi
(f ◦ λ)′ (0) dá informação apenas sobre o comportamento de f ao longo
desse segmento. Em particular, a existência das n derivadas parciais de
f no ponto a implica que a restrição de f a cada um dos n segmentos
paralelos aos eixos, que se cortam no ponto a, é contı́nua, embora não
garanta a continuidade de f : U → R em a.
Se ∂f /∂xi existe e é positiva em todos os pontos do segmento de reta
[a−δei , a+δei ], paralelo ao i-ésimo eixo coordenado, então f é crescente
ao longo desse segmento: s < t ⇒ f (a + sei ) < f (a + tei ), desde que
|s| ≤ δ e |t| ≤ δ. Isto resulta imediatamente do resultado análogo para
funções de uma variável.
A noção de derivada parcial também faz sentido para aplicações
f : U → Rn , com U ⊂ Rm aberto. Se a ∈ U , põe-se, para cada
i = 1, . . . , m:
∂f f (a + tei ) − f (a)
(a) = lim ·
∂xi t→0 t
Evidentemente, ∂f /∂xi é um vetor de Rn . Se f = (f1 , . . . , fn ) então
 
∂f ∂f1 ∂fn
(a) = (a), . . . , (a) .
∂xi ∂xi ∂xi
Seção 2 Funções de classe C 1 57

Neste capı́tulo, porém, daremos prioridade às funções com valores


numéricos. Para elas tem sentido o vetor gradiente, conceito de forte
apelo intuitivo, que contribui para entendermos como cresce (ou de-
cresce) f (x).

2 Funções de classe C 1

Seja f : U → R uma função que possui as n derivadas parciais em todos


os pontos do aberto U ⊂ Rn . Ficam então definidas n funções
∂f ∂f ∂f ∂f
,..., : U → R, onde : x 7→ (x).
∂x1 ∂xn ∂xi ∂xi
Se estas funções forem contı́nuas em U , diremos que f é uma função de
classe C 1 e escreveremos f ∈ C 1 .
Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se de
classe C 1 quando cada uma de suas funções-coordenada f1 , . . . , fn : U →
R é de classe C 1 .
Muitas propriedades importantes das funções de classe C 1 resultam
de serem elas diferenciáveis no sentido seguinte.
Uma função f : U → R, definida no aberto U ⊂ Rn , diz-se dife-
renciável no ponto a ∈ U quando cumpre as seguintes condições:
∂f ∂f
1. Existem as derivadas parciais (a), . . . , (a).
∂x1 ∂xn
2. Para todo v = (α1 , . . . , αn ) tal que a + v ∈ U , tem-se
n
X ∂f r(v)
f (a + v) − f (a) = · αi + r(v), onde lim = 0.
∂xi |v|→0 |v|
i=1
Observações. 1. Acima, e sempre que fizermos considerações em torno
∂f
de um ponto especı́fico a, escreveremos, por simplicidade, em vez
∂xi
∂f
de (a).
∂xi
2. A essência da definição da diferenciabilidade está na condição
lim (r(v)/|v|) = 0, pois a igualdade que define o “resto”r(v) pode ser
v→0
escrita para qualquer função que possua as n derivadas parciais.
 
r(v) r(v)
De lim = 0 resulta que lim r(v) = 0 pois r(v) = · |v|.
v→0 |v| v→0 |v|
Segue-se que lim [f (a + v) − f (a)] = 0. Portanto, toda função dife-
v→0
renciável no ponto a é contı́nua nesse ponto.
58 Funções Reais de n Variáveis Cap. 3

Diremos que f : U → R é diferenciável quando f for diferenciável


em todos os pontos de U .
Quando n = 1, a função f : U → R é diferenciável no ponto a se,
e somente se, possui derivada neste ponto pois, como podemos agora
dividir por v ∈ R, de f (a + v) − f (a) = (df /dx) · v + r(v) resulta
 
r(v) f (a + v) − f (a) df
=± − (a) ,
|v| v dx

r(v) f (a + v) − f (a) df
portanto lim = 0 ⇔ lim = (a).
v→0 |v| v→0 v dx
Teorema 1. Toda função f : U → R de classe C 1 é diferenciável.
Demonstração. Por simplicidade, suporemos U ⊂ R2 . O caso geral se
trata analogamente, apenas com uma notação mais elaborada. Fixemos
c = (a, b) ∈ U e tomemos v = (h, k) tal que c + v ∈ B ⊂ U , onde B é
uma bola de centro c. Seja
∂f ∂f
r(v) = r(h, k) = f (a + h, b + k) − f (a, b) − ·h− · k,
∂x ∂y
onde as derivadas são calculadas no ponto c = (a, b). Podemos escrever

r(v) = f (a + h, b + k) − f (a, b + k) + f (a, b + k) − f (a, b)


∂f ∂f
− ·h− · k.
∂x ∂x
Pelo Teorema do Valor Médio para funções de uma variável real, existem
θ1 , θ2 ∈ (0, 1) tais que
∂f ∂f ∂f ∂f
r(v) = (a + θ1 h, b + k) · h + (a, b + θ2 k) · k − ·h− · k,
∂x ∂y ∂x ∂y
logo
 
r(v) ∂f ∂f h
= (a + θ1 h, b + k) − (a, b) √
|v| ∂x ∂x h + k2
2
 
∂f ∂f k
+ (a, b + θ2 k) − (a, b) √ ·
∂y ∂y h + k2
2

Quando v → 0 os termos dentro dos colchetes acima tendem a zero, pela


continuidade das derivadas ∂f /∂x e ∂f /∂y. Além disso, os termos fora
Seção 2 Funções de classe C 1 59

dos colchetes têm valor absoluto ≤ 1. Portanto lim r(v)/|v| = 0 e então


v→0
f é diferenciável.
Corolário 1. Toda função de classe C 1 é contı́nua.
Às vezes, como na demonstração a seguir, é mais conveniente tomar
ρ = ρ(v) = r(v)/|v| e escrever ρ|v| em vez de r(v). Então a diferencia-
bilidade de f se exprime como
n
X ∂f
f (a + v) − f (a) = · αi + ρ|v|, com lim ρ = 0.
∂xi v→0
i=1

Teorema 2. Sejam U ⊂ Rm , V ⊂ Rn abertos, f : U → V uma


aplicação cujas funções-coordenada f1 , . . . , fn possuem derivadas parci-
ais no ponto a ∈ U e g : V → R uma função diferenciável no ponto
b = f (a). Então g ◦ f : U → R possui derivadas parciais no ponto a e
vale
n
∂(g ◦ f ) X ∂g ∂fk
= · , i = 1, . . . , m,
∂xi ∂yk ∂xi
k=1
onde as derivadas parciais relativas aos xi são calculadas no ponto a e
as relativas a yk são calculadas no ponto b = f (a).
Além disso, se f e g são ambas de classe C 1 então g ◦ f ∈ C 1 .
Observação. No Capı́tulo 5 provaremos, mais geralmente, que se f e g
forem diferenciáveis então g ◦ f é diferenciável.

Demonstração. Podemos escrever


n
X ∂g
g(f (a + tei )) − g(f (a)) = · [fk (a + tei ) − fk (a)]
∂yk
k=1
+ ρ(t) · |f (a + tei ) − f (a)|

onde, por simplicidade, escrevemos ρ(t) em vez de ρ(v) com v =


f (a + tei ) − f (a). A diferenciabilidade de g nos dá lim ρ(t) = 0. Então
t→0

n
g(f (a + tei )) − g(f (a)) X ∂g fk (a + tei ) − fk (a)
= ·
t ∂yk t
k=1

f (a + tei ) − f (a)
± ρ(t) .

t
60 Funções Reais de n Variáveis Cap. 3

Logo
n
∂(g ◦ f ) g(f (a + tei )) − g(f (a)) X ∂g ∂fk
= lim = ·
∂xi t→0 t ∂yk ∂xi
k=1

pois

f (a + tei ) − f (a) ∂f

lim ρ(t) = 0 e lim
= (a) .
t→0 t→0 t ∂xi

O fato de que g ◦ f ∈ C 1 decorre da expressão de ∂(g ◦ f )/∂xi em


termos das derivadas parciais de g e das fk , que são contı́nuas.

O gradiente de uma função diferenciável f : U → R no ponto a ∈ U


é o vetor  
∂f ∂f
grad f (a) = (a), . . . , (a) .
∂x1 ∂xn
Se v é qualquer vetor de Rn , a derivada direcional de f no ponto a,
na direção de v é, por definição,

∂f f (a + tv) − f (a)
(a) = lim ·
∂v t→0 t
Estas definições permitem enunciar os seguintes corolários da Regra
da Cadeia. O primeiro deles mostra que, quando f é diferenciável no
∂f
ponto a, a derivada direcional (a) existe em relação a qualquer vetor
∂v
v, dá uma expressão para essa derivada em termos das derivadas parciais
de f e das coordenadas de v e, finalmente, mostra que, na definição de
∂f
(a), em vez do caminho retilı́neo t 7→ a + tv, pode-se usar qualquer
∂v
caminho λ : (−δ, δ) → U desde que se tenha λ(0) = a e λ′ (0) = v. O
Corolário 3 é, na realidade, um importante teorema.
Corolário 2. Seja f : U → R diferenciável no aberto U ⊂ Rn , com
a ∈ U . Dado o vetor v = (α1 , . . . , αn ), se λ : (−δ, δ) → U é qualquer
caminho diferenciável tal que λ(0) = a e λ′ (0) = v, tem-se

X ∂f n
′ ∂f
(f ◦ λ) (0) = h grad f (a), vi = (a) = (a) · αi .
∂v ∂xi
i=1
Seção 2 Funções de classe C 1 61

Basta aplicar diretamente a fórmula


n
X
′ ∂f dλi
(f ◦ λ) = · ,
∂xi dt
i=1

dλi
observando que, para λ(t) = (λ1 (t), . . . , λn (t)), tem-se αi = (0).
dt
∂f
Notar ainda que (a) = (f ◦ λ)′ (0) com λ(t) = a + tv, pois λ′ (0) = v.
∂v
Corolário 3 (Teorema do Valor Médio). Dada f : U → R dife-
renciável no aberto U ⊂ Rn , se o segmento de reta [a, a + v] estiver
contido em U então existe θ ∈ (0, 1) tal que
∂f
f (a + v) − f (a) = (a + θv) = h grad f (a + θv), vi
∂v
Xn
∂f
= (a + θv) · αi
∂xi
i=1

onde v = (α1 , . . . , αn ).
Com efeito, considerando o caminho retilı́neo λ : [0, 1] → U , dado
por λ(t) = a + tv, vemos que f (a + v) − f (a) = (f ◦ λ)(1) − (f ◦ λ)(0).
Pelo Teorema do Valor Médio para funções de uma variável real, existe
θ ∈ (0, 1) tal que (f ◦ λ)(1) − (f ◦ λ)(0) = (f ◦ λ)′ (θ). Pela Regra da
Cadeia,
n
X ∂f ∂f
(f ◦ λ)′ (θ) = (a + θv) · αi = (a + θv) = h grad f (a + θv), vi.
∂xi ∂v
i=1

Corolário 4. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se o


segmento de reta [a, a + v] estiver contido em U e existir M > 0 tal que
| grad f (a+tv)| ≤ M para todo t ∈ [0, 1] então |f (a+v)−f (a)| ≤ M ·|v|.
Com efeito, pela desigualdade de Schwarz,

|f (a + v) − f (a)| = |h grad f (a + θv), vi| ≤ | grad f (a + θv)| |v| ≤ M · |v|.

Em particular, se U é convexo, se f é diferenciável e se | grad f (x)| ≤


M para todo x ∈ U então |f (y) − f (x)| ≤ M |x − y| quaisquer que sejam
x, y ∈ U .
Corolário 5. Seja f : U → R diferenciável no aberto U ⊂ Rn . Se U é
conexo e grad f (x) = 0 para todo x ∈ U então f é constante.
62 Funções Reais de n Variáveis Cap. 3

Com efeito, pelo Teorema do Valor Médio (Corolário 3), f é cons-


tante ao longo de todo segmento de reta contido em U . Ora, sendo
o aberto U conexo, dois quaisquer de seus pontos podem ser ligados
por um caminho poligonal (justaposição de segmentos de reta) contido
em U .
Dada f : U → R de classe C 1 , o conjunto f −1 (c) = {x ∈ U ; f (x) = c}
é, para todo c ∈ R, chamado o conjunto de nı́vel c da função f . Quando
U ⊂ Rn e n = 2 esse conjunto é geralmente chamado a curva ou linha de
nı́vel c de f , a qual é definida pela equação f (x, y) = c. Analogamente,
quando n = 3, o conjunto f −1 (c), definido pela equação f (x, y, z) =
c costuma ser chamado a superfı́cie de nı́vel c da função f . Deve-se
observar porém que, para certas funções especialmente escolhidas, tais
conjuntos podem ser bem diferentes daquilo que se imagina como uma
curva ou uma superfı́cie.
Mencionaremos a seguir algumas propriedades do gradiente. Elas
justificam a importância desse vetor, o qual dá interessantes informações
sobre o comportamento da função.
Para isto, fixaremos a∈U , suporemos que f ∈C 1 e que grad f (a) 6= 0.
Então:

1) O gradiente aponta para uma direção segundo a qual a função é


crescente;
2) Dentre todas as direções ao longo das quais f cresce, a direção do
gradiente é a de crescimento mais rápido;
3) O gradiente de f no ponto a é ortogonal ao conjunto de nı́vel de
f que passa por a.

Vejamos o que significam estas afirmações.


Em primeiro lugar, pondo w = grad f (a) temos
∂f
(a) = h grad f (a), wi = | grad f (a)|2 > 0
∂w
Isto quer dizer que se λ : (−ε, ε) → U é tal que λ ∈ C 1 , λ(0) = a e
λ′ (0)
= grad f (a) então a função t 7→ f (λ(t)) tem derivada positiva no
ponto t = 0. Logo, diminuindo ε se necessário, f ◦ λ : (−ε, ε) → R será
uma função crescente. É este o significado de “f cresce na direção do
gradiente.”
Seção 2 Funções de classe C 1 63

grad f (x)

f −1 (c)

Figura 3.1

Como ∂f /∂v = h grad f, vi, os vetores v que apontam para as direções


ao longo das quais f cresce são aqueles para os quais se tem
h grad f, vi > 0, isto é, aqueles que formam um ângulo agudo com
grad f (a). Dizer que o crescimento de f é mais rápido na direção do
gradiente significa o seguinte: se v ∈ Rn é tal que |v| = | grad f (a)| então

∂f ∂f
(a) ≤ .
∂v ∂(grad f (a))

Com efeito, pela desigualdade de Schwarz:

∂f
(a) = h grad f (a), vi ≤ | grad f (a)| · |v|
∂v
∂f
= | grad f (a)|2 = ·
∂(grad f (a))

Esclareçamos agora a terceira das afirmações acima.


Dizer que w ∈ Rn é ortogonal ao conjunto de nı́vel f −1 (c) significa
que, dado qualquer caminho λ : (−ε, ε) → f −1 (c), diferenciável no ponto
t = 0, com λ(0) = a, tem-se hw, λ′ (0)i = 0. Ora, λ(t) ∈ f −1 (c) significa
que f (λ(t)) = c para todo t ∈ (−ε, ε), portanto f ◦ λ : (−ε, ε) → R é
constante, igual a c, logo (f ◦ λ)′ (0) = 0, ou seja h grad f (a), λ′ (0)i = 0.
Assim, grad f (a) é ortogonal ao vetor velocidade no ponto a = λ(0)
de qualquer caminho diferenciável λ contido no conjunto de nı́vel f −1 (c).
Ficam portanto constatadas as três propriedades do gradiente acima
enunciadas. Vejamos agora alguns exemplos simples.
Exemplo 2. Sejam f, g, h : R2 → R definidas por f (x, y) = ax + by
(com a2 + b2 6= 0), g(x, y) = x2 + y 2 e h(x, y) = x2 − y 2 . A linha
de nı́vel c de f é a reta definida pela equação ax + by = c. O vetor
grad f (x, y) é constante: grad f = (a, b) em qualquer ponto (x, y) ∈ R2 .
64 Funções Reais de n Variáveis Cap. 3

Assim as linhas de nı́vel de f são retas paralelas umas às outras, todas
perpendiculares ao vetor v = (a, b).
O conjunto de nı́vel c da função g(x, y) = x2 + y 2 é vazio se c < 0 e
reduz-se ao ponto 0 ∈ R2 quando c = 0. Para c > 0, a linha de nı́vel c
é a circunferência de equação x2 + y 2 = c, cujo centro é a origem e cujo

raio é c. O gradiente de g é grad g(x, y) = (2x, 2y), um vetor colinear
com o raio, o que era de esperar pois a tangente da circunferência é
perpendicular ao raio no ponto de contacto.
A linha de nı́vel 0 da função h(x, y) = x2 − y 2 é o par de retas
perpendiculares definidas pela equação x2 − y 2 = 0, que equivale a
“x+y = 0 ou x−y = 0”. Se c > 0, x2 −y 2 = c define uma hipérbole cujo
eixo é o eixo das abcissas; se c < 0 a hipérbole x2 −y 2 = c tem como eixo o
eixo das ordenadas. O gradiente de h é o vetor grad h(x, y) = (2x, −2y).
Atribuindo valores particulares a x e y, vemos que este vetor é perpen-
dicular à curva de nı́vel que passa em (x, y) e aponta na direção de
crescimento de h. ⊳

(2x, 2y)
(a, b)

(x, y)

ax + by = c x2 + y 2 = c

x2 − y 2 = c

(x, y)

(2x, −2y)

Figura 3.2

Chama-se ponto crı́tico de uma função diferenciável f : U → R um


ponto a ∈ U tal que grad f (a) = 0.
Seção 3 O Teorema de Schwarz 65

A função f do Exemplo 2 não possui ponto crı́tico. As funções g e h


do mesmo exemplo têm a origem como ponto crı́tico. Nota-se em ambos
os casos uma quebra de regularidade na disposição das curvas de nı́vel
quando se atinge um nı́vel em que há ponto crı́tico.

3 O Teorema de Schwarz
∂f
Seja f : U → R uma função que possui as derivadas parciais (x), . . . ,
∂x1
∂f
(x) em todo ponto x do aberto U ⊂ Rn . A j-ésima derivada parcial
∂xn
∂f
da função : U → R no ponto x ∈ U será indicada por
∂xi
 
∂2f ∂ ∂f
(x) = (x), i, j = 1, . . . , n.
∂xj ∂xi ∂xj ∂xi

Se essas derivadas parciais de segunda ordem existirem em cada


∂2f
ponto x ∈ U , teremos n2 funções : U → R. Quando tais funções
∂xj ∂xi
forem contı́nuas, diremos que f é de classe C 2 e escreveremos f ∈ C 2 .
Em geral, a mera existência das derivadas parciais de segunda ordem
em todos os pontos onde f está definida não assegura que se tenha

∂2f ∂2f
= ,
∂xj ∂xi ∂xi ∂xj

como se vê no exemplo abaixo.


xy(x2 − y 2 )
Exemplo 3. Seja f : R2 → R definida por f (x, y) =
x2 + y 2
quando x2 + y 2 =
6 0 e f (0, 0) = 0. Para todo y = 6 0 tem-se f (0, y) = 0,
logo
∂f f (x, y) y(x2 − y 2 )
(0, y) = lim = lim = −y,
∂x x→0 x x→0 x2 + y 2

Portanto  
∂2f ∂ ∂f
(0, 0) = (0, y) = −1.
∂y∂x ∂y ∂x
66 Funções Reais de n Variáveis Cap. 3

∂2f
Um cálculo análogo mostra que (0, 0) = 1. Logo
∂x∂y

∂2f ∂2f
(0, 0) 6= (0, 0).
∂x∂y ∂y∂x

Em todo ponto x ∈ U onde existem as derivadas parciais de segunda
∂2f
ordem da função f : U → R, os números hij (x) = (x) formam
∂xi ∂xj
uma matriz h (x) = [hij (x)], chamada a matriz hessiana da função f .
O Teorema de Schwarz afirma que se f é de classe C 2 então a matriz
hessiana de f é simétrica.
A demonstração que daremos para o Teorema de Schwarz se baseia
num resultado, atribuı́do a Leibniz, segundo o qual é permitido derivar
sob o sinal de integral, desde que o resultado da derivação seja uma
função contı́nua. Por sua vez, a demonstração do Teorema de Leibniz
utiliza o lema abaixo, que poderia estar no Capı́tulo 1 mas é colocado
aqui para deixar claro como cada proposição depende da anterior.
Lema 1. Sejam X ⊂ Rm um conjunto arbitrário e K ⊂ Rn compacto.
Fixemos x0 ∈ X. Se f : X × K → Rp é contı́nua então, para todo
ε > 0 dado, pode-se obter δ > 0 tal que x ∈ X e |x − x0 | < δ implicam
|f (x, t) − f (x0 , t)| < ε, seja qual for t ∈ K.
Demonstração. Do contrário existiriam ε > 0 e seqüências de pontos
xk ∈ X e tk ∈ K tais que |xk − x0 | < 1/k e |f (xk , tk )−f (x0 , tk )| ≥
ε. Passando a uma subseqüência, se necessário, podemos admitir que
lim tk = t0 ∈ K. Como, evidentemente, lim xk = x0 , a continuidade de
f nos daria ε ≤ lim |f (xk , tk ) − f (x0 , tk )| = |f (x0 , t0 ) − f (x0 , t0 )| = 0,
uma contradição.
Teorema 3 (Derivação sob o sinal de integral). Dado U ⊂ Rn
aberto, seja f : U × [a, b] → R contı́nua, tal que a i-ésima derivada
∂f
parcial (x, t) existe para todo ponto (x, t) ∈ U × [a, b] e a função
∂xi
∂f /∂xi : U × [a, b] → R, assim definida, é contı́nua. Então a função
Z b
ϕ : U → R, dada por ϕ(x) = f (x, t)dt, possui a i-ésima derivada
a Z b
∂ϕ ∂f
parcial em cada ponto x ∈ U , sendo (x) = (x, t)dt. Em
∂xi a ∂xi
Seção 3 O Teorema de Schwarz 67

suma: pode-se derivar sob o sinal de integral, desde que o integrando


resultante seja uma função contı́nua.
Demonstração. Para todo s suficientemente pequeno, o segmento de
reta [x, x + sei ] está contido em U . Temos
Z b
ϕ(x + sei ) − ϕ(x) ∂f
− (x, t) dt =
s a ∂xi
Z b 
f (x + sei , t) − f (x, t) ∂f
= − (x, t) dt.
a s ∂xi

Mostremos que, dado arbitrariamente ε > 0, existe δ > 0 tal que, para
todo |s| < δ e todo t ∈ [a, b], a expressão sob o último sinal de integral
acima é, em valor absoluto, inferior a ε/(b − a). Isto demonstrará o
teorema. Ora, pelo Teorema do Valor Médio, para cada t ∈ [a, b] existe
θ = θt ∈ (0, 1) tal que

f (x + sei , t) − f (x, t) ∂f
= (x + θsei , t).
s ∂xi

∂f
Como : U × [a, b] → R é contı́nua, o Lema 1 fornece, a partir do ε
∂xi
dado, um δ > 0 tal que se tem

∂f ∂f ε

∂xi (x + θsei , t) − ∂xi (x, t) < b − a

para todo t ∈ [a, b], desde que seja |s| < δ (e conseqüentemente |θs| < δ).
Isto completa a demonstração.
Teorema 4 (Schwarz). Se f : U → R é de classe C 2 no aberto U ⊂ Rn
então, para quaisquer i, j = 1, . . . , n e x ∈ U , tem-se

∂2f ∂2f
(x) = (x).
∂xi ∂xj ∂xj ∂xi

Demonstração. Sem perda de generalidade, podemos supor que U =


I × J é um retângulo em R2 . Fixando b ∈ J, o Teorema Fundamental
do Cálculo nos diz que, para todo (x, y) ∈ U , tem-se
Z y
∂f
f (x, y) = f (x, b) + (x, t)dt.
b ∂y
68 Funções Reais de n Variáveis Cap. 3

Como ∂ 2 f /∂x∂y é contı́nua, podemos derivar sob o sinal de integral,


logo Z y 2
∂f ∂f ∂ f
(x, y) = (x, b) + (x, t)dt.
∂x ∂x b ∂x∂y
Em seguida, derivamos em relação a y e obtemos
∂2f ∂2f
(x, y) = (x, y).
∂y∂x ∂x∂y
Mais geralmente, para cada inteiro k ≥ 1, podemos considerar as
derivadas parciais de ordem k de uma função f : U → R, definida no
aberto U ⊂ Rn . Por exemplo, para 1 ≤ i, j, k ≤ n,
 2 
∂3f ∂ ∂ f
(a) significa (a).
∂xi ∂xj ∂xk ∂xi ∂xj ∂xk
Como toda permutação dos ı́ndices i1 , . . . , ik pode ser obtida por meio
de repetidas inversões de ı́ndices adjacentes, segue-se do Teorema de
Schwarz que a derivada de ordem k
∂kf
(a)
∂xi1 ∂xi2 . . . ∂xik
não depende da ordem em que são feitas as derivações, desde que todas
as derivadas de ordem k de f existam e sejam contı́nuas.
Uma função f : U → R que possui, em cada ponto de U , todas
as derivadas parciais de ordem k, as quais são funções contı́nuas em
U , chama-se uma função de classe C k . Escreve-se então f ∈ C k .
Quando f ∈ C k para todo k = 1, 2, 3, . . . , diz-se que f é uma função de
classe C ∞ .

4 A fórmula de Taylor

A fórmula de Taylor, que estabeleceremos aqui em sua versão restrita


aos termos de até segunda ordem, é fundamental para o estudo do com-
portamento de uma função de classe C 2 na proximidade de um ponto
crı́tico. Ela se baseia no lema abaixo.
Lema 2. Seja r : B → R de classe C 2 na bola aberta B ⊂ Rn , de centro
∂r ∂2r
0. Se r(0) = (0) = (0) = 0 para quaisquer i, j = 1, . . . , n,
∂xi ∂xi ∂xj
r(v)
então lim = 0.
v→0 |v|2
Seção 4 A fórmula de Taylor 69

Demonstração. Sendo r : B → R uma função de classe C 1 (portanto


diferenciável) que se anula, juntamente com todas as suas derivadas
∂r/∂xi , no ponto v = 0, segue-se da definição de função diferenciável
que lim r(v)/|v| = 0. Pelo Teorema do Valor Médio (Corolário 3 do
v→0
Teorema 2), para cada v=(α1 , . . . , αn )∈B existe θ tal que 0 < θ < 1 e
n
X n ∂r
∂r r(v) X ∂xi (θv) θαi
r(v) = (θv) · αi , logo = · ·
∂xi |v|2 |θv| |v|
i=1 i=1

Como cada derivada parcial ∂r/∂xi se anula, juntamente com todas as


suas derivadas ∂ 2 r/∂xj ∂xi , no ponto 0, resulta da nossa observação
inicial que
 
∂r
lim (θv)/|θv| = 0 para todo i = 1, . . . , n.
v→0 ∂xi

Além disso, cada quociente θαi /|v| tem valor absoluto ≤ 1. Por conse-
r(v)
guinte lim = 0.
v→0 |v|2

Teorema 5 (Fórmula de Taylor). Seja f : U → R de classe C 2 no


aberto U ⊂ Rn . Fixado a ∈ U , para todo v = (α1 , . . . , αn ) ∈ Rn tal que
a + v ∈ U , escrevamos
n
X n
∂f 1 X ∂2f
f (a + v) − f (a) = · αi + · αi αj + r(v),
∂xi 2 ∂xi ∂xj
i=1 i,j=1

r(v)
as derivadas sendo calculadas no ponto a. Então lim = 0.
v→0 |v|2
Demonstração. De acordo com o Lema 2 devemos demonstrar que
n
X n
∂f 1 X ∂2f
r(v) = f (a + v) − f (a) − · αi − · αi αj
∂xi 2 ∂xi ∂xj
i=1 i,j=1

se anula, juntamente com suas derivadas parciais de primeira e segunda


ordem, no ponto v = 0.
Para fazer o cálculo, começamos lembrando que, na expressão de
r(v), as variáveis independentes são as coordenadas α1 , . . . , αn de v.
É em relação a elas que as derivadas parciais de r devem ser toma-
das, embora continuemos escrevendo ∂r/∂xi e ∂ 2 r/∂xi ∂xj . Observe-
mos também que, no somatório duplo que ocorre na definição de r(v),
70 Funções Reais de n Variáveis Cap. 3

cada par de variáveis αi , αj aparece em duas parcelas iguais, a saber,


∂2f ∂2f
· αj αi e · αi αj . Levando isto em conta, temos:
∂xj ∂xi ∂xi ∂xj
X ∂2f n
∂r ∂f ∂f
(v) = (a + v) − (a) − (a) · αi .
∂xj ∂xj ∂xj ∂xi ∂xj
i=1

Derivando outra vez, vem:


∂2r ∂2f ∂2f
(v) = (a + v) − (a).
∂xi ∂xj ∂xi ∂xj ∂xi ∂xj

∂r ∂2r
Conseqüentemente r(0) = 0, (0) = 0 e (0) = 0 para
∂xi ∂xi ∂xj
quaisquer i, j = 1, . . . , n.
r(v)
Observação. Se pusermos ρ(v) = quando v 6= 0 e ρ(0) = 0, a
|v|2
fórmula de Taylor se escreve assim:
Xn n
∂f 1 X ∂2f
f (a + v) − f (a) = αi + · αi αj + ρ(v) · |v|2 ,
∂xi 2 ∂xi ∂xj
i=1 i,j=1
onde lim ρ(v) = 0.
v→0

5 Pontos crı́ticos

Uma forma quadrática H : Rn → R é uma função cujo valor no vetor


P
n
v = (α1 , . . . , αn ) é hij αi αj , onde [hij ] é uma matriz simétrica n × n.
i,j=1
O valor da forma quadrática H no vetor v será indicado com a notação
H · v 2 . Portanto
n
X
H · v2 = hij αi αj quando v = (α1 , . . . , αn ).
i,j=1

Se t ∈ R então H · (tv)2 = t2 · (H · v 2 ).
A forma quadrática H chama-se não-negativa quando H · v 2 ≥ 0
para todo v ∈ Rn , positiva quando H · v 2 > 0 para todo v 6= 0 em Rn e
indefinida quando existem v, w ∈ Rn tais que H · v 2 > 0 e H · w2 < 0.
De modo análogo se definem forma quadrática negativa e não-positiva.
Quando H é positiva ou negativa, diz-se que ela é definida.
Seção 5 Pontos crı́ticos 71

Exemplo 4. A forma quadrática H : Rn → R, onde H · v 2 = hv, vi,


é positiva. Como hv, vi = α12 + · · · + αn2 , a matriz de H é a identi-
dade. Para todo k ∈ [1, n], H · v 2 = α12 + · · · + αk2 é uma forma
quadrática não-negativa em Rn . Por outro lado, se pusermos H · v 2 =
α12 + · · · + αk2 − αk+1
2 − · · · − αn2 com 0 < k < n, teremos uma forma
quadrática indefinida. Evidentemente, se H é positiva (respect. não-
negativa) então −H é negativa (respect. não-positiva).
Seja H : Rn → R uma forma quadrática cuja matriz é [hij ].
Se chamarmos de H0 : Rn → Rn o operador linear cuja matriz na
base canônica de Rn é também [hij ], vemos imediatamente que H · v 2 =
hH0 ·v, vi para todo v ∈ Rn . Como a matriz [hij ] do operador H0 na base
canônica é simétrica, H0 é auto-adjunto. Reciprocamente, para qualquer
operador auto-adjunto H0 : Rn → Rn , a função H : Rn → R, dada por
H · v 2 = hH0 · v, vi, é uma forma quadrática. Quando H é definida, o
operador H0 é invertı́vel pois hH0 ·v, vi = 6 0 para todo v 6= 0 ⇒ H0 ·v 6= 0
para todo v 6= 0.
Dada a função f : U → R, de classe C 2 no aberto U ⊂ Rn , a forma
quadrática hessiana
 H(x) = (Hf )(x) de f no ponto x ∈ U é aquela cuja
∂2f
matriz é [hij ] = (x) . Assim, para todo v = (α1 , . . . , αn ) ∈ Rn ,
∂xi ∂xj
tem-se
X n
2 ∂2f
H(x) · v = (x) · αi αj .
∂xi ∂xj
i,j=1

A forma hessiana é usada para determinar a natureza dos pontos crı́ticos


da função f .
Diz-se que a ∈ U é um ponto de máximo local da função f : U → R
quando existe δ > 0 tal que f (x) ≤ f (a) para todo x ∈ U ∩B(a; δ). Ana-
logamente se define um ponto de mı́nimo local . Um ponto a, de máximo
(ou de mı́nimo) local de uma função diferenciável f , é um ponto crı́tico
de f . Com efeito, para todo i = 1, . . . , n, se δ > 0 é suficientemente
pequeno então a função ϕ : (−δ, δ) → R, dada por ϕ(t) = f (a + tei ), está
bem definida e possui um máximo (ou mı́nimo) local no ponto t = 0.
∂f
Logo 0 = ϕ′ (0) = (a), i = 1, . . . , n.
∂xi
Exemplo 5. A origem 0 ∈ R2 é ponto crı́tico das três funções f, g, h :
R2 → R, definidas por f (x, y) = x2 + y 2 , g(x, y) = −x2 − y 2 e h(x, y) =
x2 − y 2 . Para f a origem é um ponto de mı́nimo, para g de máximo e
72 Funções Reais de n Variáveis Cap. 3

para h não é máximo nem mı́nimo pois em qualquer disco de centro 0 a


função h assume valores maiores e menores do que 0 = h(0, 0). ⊳
Teorema 6. Seja a ∈ U um ponto crı́tico da função f : U → R, de
classe C 2 .

a) Se a forma quadrática hessiana H(a) for positiva então a é um


ponto de mı́nimo local de f .

b) Se H(a) for negativa então a é um ponto de máximo local.

c) Se H(a) for indefinida, então a não é ponto de máximo nem de


mı́nimo local de f .

Demonstração. a) Por simplicidade, escrevamos H em vez de H(a).


Pelo Teorema de Weierstrass, a função contı́nua positiva H assume um
valor mı́nimo 2c > 0 no conjunto compacto S n−1 . Noutras palavras,
existe c > 0 tal que H · u2 ≥ 2c para todo vetor u ∈ Rn com |u| = 1.
Como a é um ponto crı́tico de f , a fórmula de Taylor se resume a
1
f (a + v) − f (a) = H · v 2 + ρ(v)|v|2 com lim ρ(v) = 0.
2 v→0

Como v/|v| é um vetor unitário (pertencente a S n−1 ), temos

1 |v|2  v 2 |v|2
H · v2 = H· ≥ · 2c = |v|2 · c.
2 2 |v| 2

Portanto f (a + v) − f (a) ≥ |v|2 (c + ρ(v)).


Pela definição de limite, existe δ > 0 tal que a + v ∈ U e 0 <
|v| < δ implicam |ρ(v)| < c e conseqüentemente c + ρ(v) > 0. Logo
f (a + v) − f (a) > 0, isto é, f (a) < f (a + v) para todo v tal que a + v ∈ U
e 0 < |v| < δ. Assim, a é um ponto de mı́nimo local para f .
b) Segue as mesmas linhas do caso anterior.
c) Dado v ∈ Rn , tem-se a + tv ∈ U para todo t suficientemente
pequeno. Então, lembrando que H · (tv)2 = t2 · (H · v 2 ), temos

|v|2 h  v 2 i
f (a + tv) − f (a) = t2 · · H· + ρ(tv) , com lim ρ(tv) = 0.
2 |v| t→0

Segue-se, como acima, que para todo t suficientemente pequeno,


f (a + tv) − f (a) tem o mesmo sinal que H · v 2 . Assim, se H é indefinida,
Seção 5 Pontos crı́ticos 73

com H · v 2 > 0 e H · w2 < 0, em qualquer bola de centro a existem


pontos a + tv e a + tw tais que f (a + tv) > f (a) e f (a + tw) < f (a).
Portanto f não tem máximo nem mı́nimo local no ponto a.

Corolário 6. Se a função f : U → R, de classe C 2 , possui um mı́nimo


(respect. máximo) local no ponto a ∈ U então a forma quadrática hes-
siana de f é não-negativa (respect. não-positiva) nesse ponto.
Com efeito, se fosse H · v02 < 0 para algum v0 ∈ Rn , terı́amos
f (a + tv0 ) < f (a) para todo t suficientemente pequeno, e então a
não seria um ponto de mı́nimo local. Mesmo argumento para máximo
local.

Exemplo 6. Pela demonstração acima, vê-se que quando a forma


quadrática hessiana é positiva (respect. negativa) no ponto a então
a é um ponto de mı́nimo (respect. máximo) local estrito, isto é, numa
pequena bola de centro a não há outros pontos x com f (x) = f (a). Por
exemplo, a origem é um ponto de mı́nimo estrito da função f (x, y) =
x2 + y 2 mas todos os pontos (x, 0) do eixo das abcissas são pontos
de mı́nimo não-estritos da função g(x, y) = y 2 . (O domı́nio de am-
bas as funções f, g é R2 .) A forma hessiana de f na origem de R2 é
H · v 2 = 2α2 + 2β 2 se v = (α, β) enquanto a de g é K · v 2 = 2β 2 . Vemos
que H é positiva e K é apenas não-negativa. Já a forma hessiana da
função h(x, y) = x2 − y 2 na origem é L · v 2 = 2α2 − 2β 2 , que é indefinida.
Por isso a origem é um ponto crı́tico que não é máximo nem mı́nimo
local (ponto de sela). ⊳

Exemplo 7. Poder-se-ia indagar se vale a recı́proca do corolário acima.


A resposta é negativa. A função f : R2 → R, dada por f (x, y) = x2 + y 3
tem a origem de R2 como ponto crı́tico, no qual a forma hessiana é
H · v 2 = 2α2 , para v = (α, β). A forma H é não-negativa porém a
origem não é um ponto de mı́nimo local de f . ⊳

Neste ponto, cabe a pergunta: de que modo podemos determinar


se uma dada forma quadrática é positiva, negativa, etc? O método
de completar o quadrado, devido a Lagrange, responde a questão. Este
método, que se baseia na observação óbvia de que a2 +2ab = (a+b)2 −b2 ,
consiste em efetuar sucessivas mudanças de variáveis, visando eliminar,
na expressão da forma quadrática H, os termos como xy, xz, yz, etc,
deixando apenas parcelas do tipo x2 , y 2 , z 2 etc.
Os exemplos a seguir ilustram o método de completar os quadrados.
74 Funções Reais de n Variáveis Cap. 3

Exemplo 8. Seja a forma quadrática H(x, y) = x2 − xy + y 2 em R2 .


Completando o quadrado, temos
y  y 2 y 2
x2 − xy = x2 − 2x · = x − − ·
2 2 4
Logo
 y 2 y 2  y 2 3 2
H(x, y) = x − − + y2 = x − + y .
2 4 2 4
2 2

Portanto H(x, y) = s + t com s = x − y/2 e t = ( 3/2) · y. Assim,
a forma H é positiva. O mesmo processo, aplicado à forma K, onde
K(x, y) = x2 + 3xy + y 2 nos dá
 2
3 9
K(x, y) = x + y − y 2 + y 2 ,
2 4
ou seja,
 2 √
3 5 2 2 2 3 5
K(x, y) = x + y − y = s − t com s = x + y e t = y.
2 4 2 2
Portanto a forma K é indefinida. ⊳
Exemplo 9. Seja em R3 a forma quadrática H(x, y, z) = x2 + y 2 + z 2 +
3xy + 3xz + 4yz. Agrupando os termos que contêm x, temos:
 2
3 3 9
2 2
x + 3xy + 3xz = x + 2x · (y + z) = x + (y + z) − (y + z)2
2 2 4
9 9 9 3
= s2 − y 2 − z 2 − yz, com s = x + (y + z).
4 4 2 2
Logo
9 2 9 2 9
H(x, y, z) = s2 + y 2 + z 2 −
y − z − yz + 4yz
4 4 2
2 5 2 5 2 1
= s − y − z − yz.
4 4 2
Agrupando os termos que contêm y:
   2
5 2 1 5 2 2 5 1 1 2
− y − yz = − y + yz = − y+ z + z
4 2 4 5 4 5 20
5 1 2 1
= − t2 + z com t = y + z.
4 20 5
Seção 6 Funções convexas 75

Portanto:
5 2 1 2 5 2 5 6
H(x, y, z) = s2 − t + z − z = s2 − t2 − z 2 .
4 20 4 4 5
Concluı́mos então que a forma quadrática H é indefinida. Com efeito,
para z = 0 temos
 2
5 3 5
H(x, y, 0) = s − t2 =
2
x + y − y2.
4 2 4

Logo H(x, 0, 0) = x2 e, em particular, H(1, 0, 0) = 1, enquanto


H(−3/2, 1, 0) = −5/4. ⊳

6 Funções convexas

Seja C ⊂ Rn um conjunto convexo. Uma função f : C → R chama-se


convexa quando, para quaisquer x, y ∈ C e t ∈ [0, 1], tem-se

f ((1 − t)x + ty) ≤ (1 − t)f (x) + tf (y).

Alternativamente: f é convexa quando, para quaisquer x, y ∈ C e


α, β ∈ [0, 1] com α + β = 1, tem-se f (αx + βy) ≤ α · f (x) + β · f (y).
Diz-se que f : C → R é côncava quando −f é convexa. Isto equivale
a dizer que, para quaisquer x, y ∈ C e t ∈ [0, 1] tem-se f ((1 − t)x +
ty) ≥ (1 − t)f (x) + tf (y). Todos os resultados a seguir estabelecidos
para funções convexas valem, com as óbvias modificações, para funções
côncavas.
A combinação linear α1 v1 + · · · + αk vk chama-se uma combinação
convexa de v1 , . . . , vk ∈ Rn quando α1 + · · · + αk = 1 e αi ≥ 0 para
i = 1, . . . , k.
Teorema 7. Se C ⊂ Rn é convexo e v1 , . . . , vk ∈ C então toda com-
binação convexa α1 v1 +· · ·+αk vk pertence a C. Além disso, se f : C → R
é uma função convexa, tem-se
k
! k
X X
f αi vi ≤ αi · f (vi ).
i=1 i=1

Demonstração. Para k = 1 isto é óbvio e para k = 2 é a definição


de conjunto convexo. Mostraremos por indução em k que a combinação
76 Funções Reais de n Variáveis Cap. 3

convexa de k elementos de C ainda pertence a C. Supondo este fato


verdadeiro para um certo k, escrevamos uma combinação convexa dos
elementos v1 , . . . , vk+1 ∈ C sob a forma

k+1
X k
X
αi vi = αi vi + αk+1 vk+1 .
i=1 i=1

Sem perda de generalidade, podemos admitir que αk+1 6= 1. Então,


Pk
pondo α = αi , temos αk+1 = 1 − α e α 6= 0. Pela hipótese de
i=1
Pk α
i Pk α
i
indução, levando em conta que = 1, vemos que v = vi
i=1 α i=1 α
pertence a C. Logo

k+1
X
αi vi = αv + (1 − α)vk+1 ∈ C, pois C é convexo.
i=1

A segunda parte também se prova por indução, pois

k+1
! k
!
X X
f αi vi =f αi vi + αk+1 vk+1
i=1 i=1
k
!
X αi
=f α· vi + (1 − α)vk+1
α
i=1
k
!
X αi
≤α·f vi + (1 − α)f (vk+1 )
α
i=1
k
X k+1
X
αi
≤α· f (vi ) + (1 − α)f (vk+1 ) = αi f (vi ).
α
i=1 i=1

Teorema 8. Seja C ⊂ Rn convexo. A fim de que a função f : C → R


seja convexa, é necessário e suficiente que, para quaisquer a, b ∈ C, a
função ϕ : [0, 1] → R, definida por ϕ(t) = f (a + tv), v = b − a, seja
convexa.
Equivalentemente: f : C → R é convexa se, e somente se, sua res-
trição a qualquer segmento de reta [a, b] ⊂ C é convexa.
Seção 6 Funções convexas 77

Demonstração. Se f é convexa então, para s, t, α ∈ [0, 1] temos



ϕ (1 − α)s + αt = f (a + [(1 − α)s + αt]v)
= f [(1 − α) · (a + sv) + α · (a + tv)]
≤ (1 − α)f (a + sv) + αf (a + tv)
= (1 − α)ϕ(s) + αϕ(t)
logo ϕ é convexa.
Reciprocamente, se todas as funções ϕ, definidas do modo acima, são
convexas então, dados x, y ∈ C e α ∈ [0, 1], pomos ϕ(t) = f (x + t(y − x))
e temos:
  
f (1 − α)x + αy = f x + α(y − x) = ϕ(α) = ϕ (1 − α) · 0 + α · 1
≤ (1 − α) · ϕ(0) + α · ϕ(1) = (1 − α) · f (x) + α · f (y),
portanto f é convexa.
Como aplicação do Teorema 8, mostremos que se f : U → R é uma
função convexa e o conjunto convexo U ⊂ Rn é aberto então, para cada
a ∈ U , existe a derivada de Gâteux
∂f f (a + tv) − f (a)
+
(a) = lim ·
∂v t→0 + t
Com efeito, a função ϕ : [0, 1] → R definida por ϕ(t) = f (a + tv)
é convexa, portanto existe a derivada à direita ϕ′+ (0) (veja Vol. 1,
∂f
pág. 108). Mas, como se vê facilmente, ϕ′+ (0) = + (a).
∂v
Daı́ se conclui, como no Vol. 1, que toda função convexa definida
num subconjunto aberto de R é contı́nua. Este resultado continua válido
em Rn com n > 1 (ver Apêndice deste capı́tulo) porém não decorre da
existência da derivada de Gâteaux, pois uma função em Rn pode ser
contı́nua ao longo de cada reta que passa por um ponto a sem que seja
necessariamente contı́nua nesse ponto.
Teorema 9. Seja f : U → R definida no aberto convexo U ⊂ Rn . Então:
a) O conjunto E(f ) = {(x, y) ∈ U × R; y ≥ f (x)} ⊂ Rn+1 , chamado
o epigráfico de f , é convexo se, e somente se, f é convexa.
b) Supondo-a de classe C 1 , a função f é convexa se, e somente se,
para a, a + v ∈ U quaisquer, tem-se
f (a + v) ≥ f (a) + h grad f (a), vi.
78 Funções Reais de n Variáveis Cap. 3

c) Quando é de classe C 2 , a função f é convexa se, e somente se,


sua forma quadrática hessiana é não-negativa em todos os pontos
de U .

Demonstração. (a) Seja E(f ) convexo. Para mostrar que f é convexa,


tomamos x, x′ ∈ U e α ∈ [0, 1]. Então (x, f (x)) e (x′ , f (x′ )) pertencem

a E(f ), portanto (1 − α)x + αx′ , (1 − α) · f (x) + α · f (x′ ) ∈ E(f ).
Isto significa que (1 − α) · f (x) + α · f (x′ ) ≥ f [(1 − α)x + αx′ ], logo
f é convexa. Reciprocamente, supondo f convexa, sejam z = (x, y),
z ′ = (x′ , y ′ ) pontos em E(f ) e α ∈ [0, 1]. Então y ≥ f (x) e y ′ ≥ f (x′ ) e
daı́ (1−α)y +αy ′ ≥ (1−α)·f (x)+α·f (x′ ) ≥ f (1−α)x+αx′ , a última
desigualdade devendo-se à convexidade de f . Logo (1 − α)z + αz ′ =
′ ′
(1 − α)x + αx , (1 − α)y + αy pertence a E(f ), ou seja, E(f ) é um
conjunto convexo.
(b) Suponhamos f : U → R convexa, de classe C 1 . Pelo Teorema 8,
se a e a + v pertencem a U então a função ϕ : [0, 1] → R, definida por
ϕ(t) = f (a + tv), é convexa. Portanto (v. Teorema 4, pág 109, vol. 1)
tem-se ϕ(1) ≥ ϕ(0)+ϕ′ (0). Mas ϕ(1) = f (a+v), ϕ(0) = f (a) e ϕ′ (0) =
h grad f (a), vi. Logo f (a + v) ≥ f (a) + h grad f (a), vi. Reciprocamente,
suponhamos que esta desigualdade valha para quaisquer a, a + v ∈ U .
Então, pondo ϕ(t) = f (a + tv), temos uma função ϕ : [0, 1] → R tal que
ϕ′ (t) = h grad f (a + tv), vi para todo t ∈ [0, 1]. Ora, para quaisquer
t, t0 ∈ [0, 1], tem-se f (a + tv) = f (a + t0 v + (t − t0 )v) = f (a + t0 v + sv),
com s = t − t0 logo, pela hipótese admitida sobre f ,

f (a + tv) ≥ f (a + t0 v) + h grad f (a + t0 v), svi


= f (a + t0 v) + h grad f (a + t0 v), vi(t − t0 ),

o que pode ser lido como ϕ(t) ≥ ϕ(t0 ) + ϕ′ (t0 )(t − t0 ). Pelo Teorema 4,
pág. 109, Volume 1, a função ϕ é convexa. O Teorema 8, acima, assegura
então que f é convexa.
(c) Novamente, usamos o Teorema 8 acima, o qual permite reduzir
a questão ao caso de uma função de uma variável, e então recaı́mos no
Corolário 2, pag. 110 do Volume 1. Com efeito, pondo ϕ(t) = f (x + tv),
com v = (α1 , . . . , αn ), temos
P
ϕ′ (t) = ni=1 ∂x ∂f
i
(x + tv)αi e
Pn ∂2f
ϕ′′ (t) = i,j=1 ∂xi ∂xj (x + tv)αi αj = H(x + tv) · v 2 .
Seção 6 Funções convexas 79

Temos portanto as seguintes equivalências: H(x) é não-negativa para


todo x ∈ U ⇔ ϕ′′ (t) ≥ 0 para quaisquer x, x + v ∈ U e t ∈ [0, 1] ⇔ todas
as funções ϕ do tipo ϕ(t) = f (x + tv) são convexas ⇔ f : U → R é
convexa.
Corolário 7. Todo ponto crı́tico a de uma função convexa f : U → R
de classe C 1 é um ponto de mı́nimo global, isto é, f (x) ≥ f (a) para todo
x ∈ U.

Apêndice: Continuidade das funções convexas


Teorema 10. Seja U ⊂ Rn um aberto convexo. Toda função convexa
f : U → R é contı́nua.
A demonstração do Teorema 10 se baseia nos dois lemas abaixo.
Qn
Lema 3. Todo ponto de um bloco retangular B = [ai , bi ] é uma
i=1
combinação convexa dos vértices desse bloco.
Demonstração. (Por indução.) Isto é óbvio para n = 1. Seja n > 1.
Q
n
Os vértices do bloco B são os 2n elementos do conjunto {ai , bi }, os
i=1
quais denotaremos por vj ou vj conforme sua última coordenada seja da
forma ak ou bk . Um ponto arbitrário do bloco B pode ser escrito como
Q
n−1
p = (x, y), onde y ∈ [an , bn ] e x pertence ao bloco B ′ = [ai , bi ], de
P i=1
dimensão n − 1. Pela hipótese de indução, x = αj uj é combinação
convexa dos vértices uj ∈ B ′ . Os vértices de B são vj = (u Pj , an ) e
vj = P (uj , bn ). Pondo Pp0 = (x, an ) e p1 = (x, bn ), temos p0 = αj vj e
p1 = αj vj (já que αj = 1). Além disso, y = (1 − t)an + tbn , com
y − an P P
t= , logo p = (1 − t)p0 + tp1 = (1 − t)αj vj + tαj vj , o que
bn − an
exprime o ponto arbitrário p do bloco B como combinação convexa dos
vértices de B.
Lema 4. Toda função convexa f : U → R, definida num aberto convexo
U ⊂ Rn , é localmente majorada por uma constante.
Qn
Demonstração. Seja A = (ai , bi ) o interior de um bloco retangular
i=1
contido em U . Se indicarmos comPwj , j = 1, . . . , 2n , os vértices de A
teremos,Ppara cada x ∈ A, x = αj wj logo, pela convexidade de f ,
f (x) ≤ αj · f (wj ) ≤ M , onde M = max {f (wj )}.
j
80 Funções Reais de n Variáveis Cap. 3

Demonstração do Teorema 10. Para simplificar a escrita, a fim de


provar a continuidade de f no ponto arbitrário a ∈ U , podemos admitir
que a = 0 e que f (0) = 0, pois o conjunto U0 = {x ∈ Rn ; a − x ∈ U } é
convexo, aberto, contém 0 e a função g : U0 → R, definida por g(x) =
f (a − x) − f (a), cumpre g(0) = 0, é convexa e é contı́nua no ponto 0
se, e somente se, f é contı́nua no ponto a. Pelo Lema 4, existem c > 0
e M > 0 tais que |x| ≤ c ⇒ f (x) ≤ M . Seja dado ε > 0. Sem perda
de generalidade, podemos supor que ε < M . A convexidade de f nos
permite afirmar que
 ε   ε  ε  ε
f x =f 1− ·0+ x ≤ · f (x)
M M M M

logo
 
ε M
f (x) ≤ ·f x .
M ε

εc
Tomando δ = , vemos que
M
 
εc M M
|x| < ⇒ x < c ⇒ f x ≤ M ⇒ f (x) ≤ ε.
M ε ε

Além disso,
  
M ε M
0 = f (0) = f x+ − x
M +ε M +ε ε
 
M ε M
≤ f (x) + ·f − x .
M +ε M +ε ε

Simplificando, vem M · f (x) + ε · f (−M x/ε) ≥ 0, donde:

ε ε
f (x) ≥ · (−f (−M x/ε)) ≥ · (−M ) = −ε.
M M

Em resumo: |x| < cε/M ⇒ −ε ≤ f (x) ≤ ε, logo f é contı́nua no


ponto 0.
Seção 7 Exercı́cios 81

7 Exercı́cios
Seção 1. Derivadas parciais
1. Um conjunto X ⊂ Rn chama-se i-convexo (1 ≤ i ≤ n) quando para quaisquer
a, b ∈ X tais que b = a + tei , tem-se [a, b] ⊂ X. (Se X ⊂ R2 , diz-se então que
X é horizontalmente convexo ou verticalmente convexo, conforme seja i = 1
ou i = 2.) Prove que se o aberto U ⊂ Rn é i-convexo e a função f : U → R
∂f
cumpre (x) = 0 para todo x ∈ U então f não depende da i-ésima variável,
∂xi
isto é, x, x + tei ∈ U ⇒ f (x + tei ) = f (x).
2. Sejam X = {(x, 0); x ≥ 0)} e U = R2 −X. Defina f : U → R pondo f (x, y) = x2
quando x > 0, y > 0 e f (x, y) = 0 quando x ≤ 0 ou y < 0. Mostre que se tem
∂f
= 0 em todos os pontos de U mas f depende de y.
∂y
3. Diz-se que um caminho retilı́neo f : I → Rn é paralelo ao i-ésimo eixo quando
ele é da forma f (t) = a+tei , t ∈ I. Se U ⊂ Rn é um aberto conexo, prove que
dois pontos a, b ∈ U quaisquer podem ser ligados por um caminho poligonal
contido em U , cujos trechos retilı́neos são paralelos aos eixos. Conclua que se
∂f
U ⊂ Rn é conexo e f : U → R cumpre (x) = 0 para todo x ∈ U e qualquer
∂xi
i com 1 ≤ i ≤ n, então f é constante.
∂f
4. Seja U ⊂ Rn aberto. Se f : U → R possui derivadas parciais :U → R
∂xi
(i = 1, . . . , n) limitadas, prove que f é contı́nua.
Seção 2. Funções de classe C 1
x2 y
1. Seja f : R2 → R definida por f (x, y) = se (x, y) 6= (0, 0) e f (0, 0) = 0.
x2+ y2
∂f
Mostre que, para todo v = (α, β) ∈ R2 , existe a derivada direcional (0, 0)
∂v
mas f não é diferenciável no ponto (0, 0).
2. Seja f : Rn → R uma função contı́nua que possui todas as derivadas direcionais
∂f
em qualquer ponto de Rn . Se (u) > 0 para todo u ∈ S n−1 , prove que existe
∂u
∂f
a ∈ Rn tal que (a) = 0, seja qual for v ∈ Rn .
∂v
3. Seja f : Rn → R diferenciável no ponto 0. Se f (tx) = t · f (x) para todo t > 0
e todo x ∈ Rn , prove que f é linear. Conclua que a função ϕ : R2 → R, dada
por ϕ(x, y) = x3 /(x2 + y 2 ) se (x, y) 6= (0, 0) e ϕ(0, 0) = 0, não é diferenciável
na origem.
4. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Prove que, dados a ∈ U e
ε > 0, existe δ > 0 tal que x, y ∈ U , |x − a| < δ, |y − a| < δ ⇒ f (x) − f (y) =
h grad f (a), x − yi + r(x, y), onde |r(x, y)| < ε|x − y|.
Seção 3. O Teorema de Schwarz
∂2f
1. Seja f : I × J → R de classe C 2 no retângulo aberto I × J ⊂ R2 . Se é
∂x∂y
2
identicamente nula, prove que existem ϕ : I → R, ψ = J → R de classe C
tais que f (x, y) = ϕ(x) + ψ(y) para todo (x, y) ∈ I × J.
82 Funções Reais de n Variáveis Cap. 3

2. Use o exercı́cio anterior para provar que se g : R × R → R é de classe C 2 , com


∂2g ∂2g
2
= , então existem ϕ : R → R e ψ : R → R de classe C 2 , tais que
∂x ∂y 2
g(x, y) = ϕ(x + y) + ψ(x − y) para todo (x, y).
3. Seja f : Rn → R de classe C 2 , tal que f (tx) = t2 ·f (x) para todo t > 0 e todo x ∈
P
n
Rn . Prove que existem aij ∈ R (i, j = 1, . . . , n) tais que f (x) = aij xi xj
i,j=1
x4 + y 4
para todo x = (x1 , . . . , xn ) ∈ Rn . Como explicar f (x, y) = 2 ?
x + y2
n+1 2 n
4. Sejam f, ϕ : U → R de classe C no aberto U ⊂ R . (Isto é, as funções-
∂ϕ
coordenada de f e ϕ são de classe C 2 .) Suponha que hf (x), (x)i = 0
∂xi
para todo x ∈ U e todo i = 1, . . . , n. Prove que a matriz [aij (x)], onde
∂f ∂ϕ
aij (x) = h (x), (x)i, é simétrica, seja qual for x ∈ U .
∂xi ∂xj
Seção 4. A fórmula de Taylor
1. Seja r : U → R uma função de classe C k , definida num aberto U ⊂ Rn que
contém a origem 0. Se r, juntamente com todas as suas derivadas parciais até
r(v)
as de ordem k, se anulam no ponto 0, prove que lim = 0.
v→0 |v|k

2. Seja f : U → R de classe C 3 no aberto U ⊂ Rn , o qual contém a e a + v, com


P ∂f P ∂2f
v = (α1 , . . . , αn ). Escreva df (a)·v = ·αi , d2 f (a)·v 2 = ·αi ·αj
i ∂xi i,j ∂xi ∂xj
P 3
∂ f
e d3 f (a)·v 3 = ·αi ·αj ·αk , as derivadas parciais sendo calculadas
i,j,k ∂xi ∂x j ∂xk
no ponto x = a e os ı́ndices i, j, k variando de 1 a n. Ponha
1 2 1
f (a + v) − f (a) = df (a) · v + d f (a) · v 2 + d3 f (a) · v 3 + r3 (v)
2 3!
r3 (v)
e prove que lim = 0.
|v|3
v→0

Estenda o resultado para funções de classe C k , 1 ≤ k < +∞.


Seção 5. Pontos crı́ticos
1. Uma função f : U → R, de classe C 2 no aberto U ⊂ Rn , chama-se harmônica
Pn ∂2f
quando (x) = 0 para todo x ∈ U . Prove que a matriz hessiana de
i=1 ∂xi ∂xi
uma função harmônica não pode ser definida (nem positiva nem negativa).
2. Seja f : U → R uma função arbitrária, definida num aberto U ⊂ Rn . Prove
que o conjunto dos pontos de máximo (ou de mı́nimo) local estrito de f é
enumerável.
3. Determine os pontos crı́ticos da função f : R2 → R, f (x, y) = cos(x2 + y 2 ).
Idem para g(x, y) = x3 − y 3 − x + y.
4. Seja f : U → R diferenciável no aberto limitado U ⊂ Rn . Se, para todo
a ∈ fr.U , tem-se lim f (x) = 0, prove que existe em U pelo menos um ponto
x→a
crı́tico de f .
Seção 7 Exercı́cios 83

5. Determine os pontos crı́ticos da função f : R2 → R dada por f (x, y) = x2 +


y 2 + (x2 − y 2 − 1)2 e calcule as matrizes hessianas correspondentes.
6. Dados a1 , . . . , ak em Rn , determine o ponto em que a função f : Rn → R, dada
P k
por f (x) = |x − ai |2 , assume o valor mı́nimo.
i=1

Seção 6. Funções convexas


1. Seja A ⊂ Rn um conjunto convexo. Prove que a função f : Rn → R, definida
por f (x) = d(x, A), é convexa.
2. Prove que todo ponto de mı́nimo local de uma função convexa é um ponto de
mı́nimo global. Além disso, o conjunto dos pontos de mı́nimo é convexo.
3. Prove que uma função convexa, f : U → R, com U aberto, (mesmo não-
diferenciável) não possui pontos de máximo local estrito.
4. Prove que o conjunto dos pontos crı́ticos (todos necessariamente mı́nimos glo-
bais) de uma função convexa diferenciável é um conjunto convexo, no qual f
é constante.
5. Se f : X → R é convexa, prove que, para todo c ∈ R, o conjunto dos pontos
x ∈ X tais que f (x) ≤ c é convexo. Dê exemplo mostrando que a recı́proca é
falsa.
6. Uma função f : X → R, definida num conjunto convexo X ⊂ Rn , chama-se
quase-convexa quando, para todo c ∈ R, o conjunto Xc = {x ∈ X; f (x) ≤ c}
é convexo. Prove que f é quase-convexa se, e somente se, f (1 − t)x + ty ≤
max{f (x), f (y)} para x, y ∈ X e t ∈ [0, 1] quaisquer.
4

Funções Implı́citas

1 Uma função implı́cita

Os pontos de Rn+1 serão escritos sob a forma (x, y), onde temos
x = (x1 , . . . , xn ) ∈ Rn e y ∈ R. O teorema abaixo dá significado pre-
ciso à afirmação de que “a equação f (x, y) = c define implicitamente y
como função de x”e estabelece uma condição suficiente para que ela seja
verdadeira.
Teorema 1 (Teorema da Função Implı́cita). Dada a função f : U →
R, de classe C k (k ≥ 1) no aberto U ⊂ Rn+1 , seja (x0 , y0 ) ∈ U tal que
∂f
f (x0 , y0 ) = c e (x0 , y0 ) 6= 0. Existem uma bola B = B(x0 ; δ) ⊂ Rn e
∂y
um intervalo J = (y0 − ε, y0 + ε) com as seguintes propriedades:
∂f
1) B × J¯ ⊂ U e ¯
(x, y) 6= 0 para todo (x, y) ∈ B × J;
∂y
2) Para todo x ∈ B existe um único y = ξ(x) ∈ J tal que f (x, y) =
f (x, ξ(x)) = c.
A função ξ : B → J, assim definida, é de classe C k e suas derivadas
parciais em cada ponto x ∈ B são dadas por
∂f
∂ξ ∂x (x, ξ(x))
(x) = − ∂fi ·
∂xi (x, ξ(x))
∂y

∂f
Demonstração. Para fixar as idéias, admitiremos que (x0 , y0 ) > 0.
∂y
Pela continuidade de ∂f /∂y, existem δ > 0 e ε > 0 tais que, pondo
Seção 1 Uma função implı́cita 85

R U f −1 (c) R

J
y0
f
c

f −1 (c)

x0 B Rn
Figura 4.1

B = B(x0 , δ) ⊂ Rn e J = (y0 − ε, y0 + ε) ⊂ R, temos B × J¯ ⊂ U e


∂f ¯ Então, para todo x ∈ B, a função
(x, y) > 0 para todo (x, y) ∈ B × J.
∂y
¯ Como f (x0 , y0 ) =
y 7→ f (x, y) é crescente no intervalo [y0 −ε, y0 +ε] = J.
c, segue-se que f (x0 , y0 − ε) < c e f (x0 , y0 + ε) > c. Sendo f contı́nua,
podemos supor δ tão pequeno que f (x, y0 − ε) < c e f (x, y0 + ε) > c
para todo x ∈ B. Pelo Teorema do Valor Intermediário, para cada
x ∈ B, existe um único y = ξ(x) ∈ J¯ tal que f (x, y) = c. Tem-se
necessariamente y ∈ J. Mostremos que a função ξ : B → J possui
derivadas parciais em todo ponto x ∈ B.
Com efeito, pondo k = k(t) = ξ(x + tei ) − ξ(x), vem ξ(x + tei ) =
ξ(x) + k, logo f (x + tei , ξ(x) + k) = f (x, ξ(x)) = c.
Pelo Teorema do Valor Médio, para todo t existe θ = θ(t) ∈ (0, 1)
tal que
0 = f (x + tei , ξ(x) + k) − f (x, ξ(x))
∂f ∂f
= (x + θtei , ξ(x) + θk) · t + (x + θtei , ξ(x) + θk) · k.
∂xi ∂y
Logo
∂f
ξ(x + tei ) − ξ(x) k ∂x (x + θtei , ξ(x) + θk)
= = − ∂fi ·
t t (x + θtei , ξ(x) + θk)
∂y
Neste ponto, admitamos a continuidade de ξ, que será provada abaixo.
Então lim k(t) = 0. A continuidade das derivadas parciais de f nos dá
t→0
então
∂f
∂ξ ξ(x + tei ) − ξ(x) ∂xi (x, ξ(x))
(x) = lim = − ∂f , (1 ≤ i ≤ n).
∂xi t→0 t (x, ξ(x))
∂y
86 Funções Implı́citas Cap. 4

A expressão de ∂ξ/∂xi mostra que se f ∈ C k então ∂ξ/∂xi ∈ C k−1


para i = 1, . . . , n, portanto ξ ∈ C k .
Demonstração da continuidade de ξ
Pelo Teorema 19 do Capı́tulo 1 (v. observação que o segue), basta
mostrar que, para todo conjunto fechado F ⊂ J, ¯ a imagem inversa
−1
ξ (F ) é fechada em B. Ou seja: se a seqüência de pontos xk ∈ B é
tal que ξ(xk ) ∈ F para todo k ∈ N e lim xk = x̄ ∈ B, então ξ(x̄) ∈ F .
Ora, F é compacto, logo uma subseqüência de pontos x′k ∈ B é tal
que lim ξ(x′k ) = a ∈ F . Logo f (x̄, a) = lim f (x′k , ξ(x′k )) = c. Mas
f (x̄, ξ(x̄))=c. Pela unicidade de ξ(x) em J, segue-se que ξ(x̄)=a∈F .
Considerando o aberto V = B × J ⊂ Rn+1 , o teorema acima diz que,
nas condições das hipóteses, tem-se

f −1 (c) ∩ V = {(x, ξ(x)) ∈ Rn+1 ; x ∈ B}.

Noutras palavras, f −1 (c) ∩ V é o gráfico da função ξ : B → J.


Observação. Evidentemente, não há nada de especial quanto à última
coordenada, exceto simplificar a escrita na demonstração. Se, para al-
∂f
gum inteiro i ∈ [1, n + 1], tivermos (z0 ) 6= 0 onde z0 ∈ U e f (z0 ) = c,
∂xi
existirá um aberto V ∋ z0 , tal que, para z ∈ V , a equação f (z) = c
definirá xi = ξ(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ) como função das outras n
coordenadas e f −1 (c) ∩ V será o gráfico dessa função ξ, de classe C k .
De um modo geral, se grad f (z0 ) 6= 0 e f (z0 ) = c então existe V ∋ z0
aberto tal que f −1 (c) ∩ V é o gráfico de uma função real de n variáveis,
de classe C k .
Exemplo 1. Seja f : R2 → R definida por f (x, y) = x2 + y 2 . Para
∂f ∂f
todo (x, y) ∈ R2 , temos (x, y) = 2x e (x, y) = 2y. A equação
∂x ∂y
x2 + y 2 = c define o conjunto vazio quando c < 0. (O Teorema 1 não se
aplica, pois não existe o ponto (x0 , y0 ) tal que f (x0 , y0 ) = c.) Quando
c = 0, a equação x2 + y 2 = 0 é satisfeita apenas quando x = y = 0.
∂f ∂f
(Agora existe (x0 , y0 ) mas (0, 0) = (0, 0) = 0.) Quando c > 0, a
∂x ∂y √
equação x2 +y 2 = c define a circunferência de centro na origem e raio c,
a qual não é gráfico de função alguma do tipo y = ξ(x) nem x = ζ(y),
pois há retas verticais e horizontais que a cortam em dois pontos. Mas,
Seção 2 Hiperfı́cies 87

se considerarmos os abertos
V1 = {(x, y) ∈ R2 ; y > 0}, V2 = {(x, y) ∈ R2 ; y < 0},
V3 = {(x, y) ∈ R2 ; x > 0}, V4 = {(x, y) ∈ R2 ; x < 0},
veremos que f −1 (c) ∩ V1 e f −1 (c) ∩ √ V2 são gráficos das √funções
ξ1 , ξ2 : (−1, 1) → R, dadas por ξ1 (x) = c − x2 , ξ2 (x) = − c − x2 ,
enquanto f −1 (c) ∩ Vp
3 ef
−1 (c) ∩ V são os gráficos de ξ , ξ : (−1, 1) → R,
4 p 3 4
dadas por ξ3 (y) = c − y 2 e ξ4 (y) = − c − y 2 . Assim, em V1 e V2 a
equação x2 + y 2 = c (com c > 0) define implicitamente y como função
de x enquanto em V3 e V4 define x como função de y. Evidentemente,
√ √
salvo na vizinhança dos 4 pontos (± c, 0), (0, ± c), tem-se a opção de
tomar y como função de x ou x como função de y.

2 Hiperfı́cies

Um conjunto M ⊂ Rn+1 chama-se uma hiperfı́cie de classe C k quando


é localmente o gráfico de uma função real de n variáveis de classe C k .
Mais precisamente, para cada p ∈ M deve existir um aberto V ⊂ Rn+1
e uma função ξ : U → R, de classe C k num aberto U ⊂ Rn , tais que
p ∈ V e V ∩ M = gráfico de ξ.
A afirmação “V ∩ M = gráfico de ξ”significa que, para um certo
inteiro i ∈ [1, n], tem-se
V ∩ M = {(x1 , . . . , xn+1 ) ∈ Rn+1 ; xi = ξ(x1 , . . . , x
bi , . . . , xn+1 )},
onde x
bi significa “omitir xi ”.
Evidentemente, dada qualquer função f : U → R de classe C k no
aberto U ⊂ Rn , seu gráfico é uma hiperfı́cie M = {(x, f (x)) ∈ Rn+1 ;
x ∈ U } de classe C k .
Quando n = 1, uma hiperfı́cie em R2 chama-se uma curva e, quando
n = 2, tem-se uma superfı́cie em R3 .
Exemplo 2. A esfera S n = {x ∈ Rn+1 ; hx, xi = 1} é uma hiperfı́cie
C ∞ em Rn+1 . Com efeito, chamando de U a bola aberta de cen-
tro 0 e raio 1 em Rn , pondo, para cada i = 1, . . . , n + 1, Vi =
{x ∈ Rn+1 ; xi > 0}, Wi = {x ∈ Rn+1 ; xi < 0} e escrevendo x∗ =
(x1 , . . . , xi−1 , xi+1 , . . . , xn+1 ), temos:
p
x ∈ S n ∩ Vi ⇔ |x∗ | < 1 e xi = 1 − hx∗ , x∗ i;
p
x ∈ S n ∩ Wi ⇔ |x∗ | < 1 e xi = − 1 − hx∗ , x∗ i.
88 Funções Implı́citas Cap. 4

Logo, considerando
p a função ξ : U → R, de classe C ∞ , definida por
ξ(u) = 1 − hu, ui, vemos que, para cada i = 1, . . . , n + 1, S n ∩ Vi
é o gráfico da função xi = ξ(x∗ ) enquanto que S n ∩ Wi é o gráfico de
xi = −ξ(x∗ ). Como todo ponto p ∈ S n pertence a algum Vi ou a algum
Wi , concluı́mos que S n é uma hiperfı́cie de classe C ∞ em Rn+1 . ⊳
Seja M ⊂ Rn+1 uma hiperfı́cie de classe C k (k ≥ 1). A cada ponto
p ∈ M associaremos o conjunto Tp M , formado por todos os vetores-
velocidade v = λ′ (0) dos caminhos λ : (−δ, δ) → M que são diferenciáveis
no ponto 0 e cumprem a condição λ(0) = p. O conjunto Tp M é chamado
o espaço vetorial tangente de M no ponto p. Esta denominação se
justifica pelo
Teorema 2. Tp M é um subespaço vetorial de dimensão n em Rn+1 .
Na demonstração abaixo, para simplificar a escrita, escrevemos em
último lugar a coordenada do ponto de V ∩ M que é função das outras.
Demonstração. Seja ξ : U → R uma função de classe C k no aberto
U ⊂ Rn , cujo gráfico, formado pelos pontos (x, ξ(x)) ∈ Rn+1 , x ∈ U ,
é a interseção M ∩ V , onde V ⊂ Rn+1 é um aberto que contém p =
(p0 , ξ(p0 )), p0 ∈ U . Para todo caminho λ : (−δ, δ) → M , com λ(0) = p,
tem-se λ(t) = (x1 (t), , . . . , xn (t), ξ(x(t)), onde x(t) = (x1 (t), . . . , xn (t)).
Portanto
 dx dxn X ∂ξ dxi 
n
1
λ′ (0) = ,..., , · ,
dt dt ∂xi dt
i=1

as derivadas dxi /dt sendo calculadas no ponto t = 0 e ∂ξ/∂xi no ponto


p0 . Isto mostra que todo v = λ′ (0) em Tp M é uma combinação linear
dos vetores v1 = (1, 0, . . . , 0, ∂ξ/∂x1 ), . . . , vn = (0, . . . , 0, 1, ∂ξ/∂xn ).
(Derivadas no ponto p0 .) Reciprocamente, toda combinação linear
Pn
v = αi vi é o vetor-velocidade λ′ (0) do caminho λ : (−δ, δ) → M
i=1
assim definido: tomamos v0 = (α1 , . . . , αn ) ∈ Rn e pomos λ(t) =
(p0 + tv0 , ξ(p0 + tv0 )), sendo δ > 0 escolhido de modo que o segmento
de reta (p0 − δv0 , p0 + δv0 ) esteja contido em U .
Observação. Como subespaço vetorial de Rn+1 , o espaço vetorial tan-
gente Tp M contém a origem 0 ∈ Rn+1 e não contém necessariamente o
ponto p, embora nas figuras ele apareça passando por p. Nas ilustrações,
o que se vê é a variedade afim p + Tp M , paralela a Tp M por p.
Seção 2 Hiperfı́cies 89

Exemplo 3. O espaço vetorial tangente Tp S n é, para todo p ∈ S n , o


complemento ortogonal de p, isto é, o conjunto [p]⊥ de todos os vetores
v ∈ Rn+1 tais que hv, pi = 0. Com efeito, sendo Tp S n e [p]⊥ ambos
subespaços vetoriais de dimensão n em Rn+1 , para mostrar que eles
coincidem, basta provar que Tp S n ⊂ [p]⊥ . Ora, se v ∈ Tp S n então
v = λ′ (0), onde λ : (−δ, δ) → S n é um caminho diferenciável no ponto 0,
d
com λ(0) = p. Neste caso, 0 = hλ(t), λ(t)i = 2hλ′ (0), λ(0)i = 2hv, pi.
dt

p
n
S
Tp S n

Figura 4.2

A seguir, apresentaremos um critério bastante útil para dar exemplos


de hiperfı́cies.
Um número c ∈ R chama-se um valor regular de uma função f : U →
R, de classe C 1 , quando não há pontos crı́ticos de f no nı́vel c, isto é,
quando f (x) = c ⇒ grad f (x) 6= 0. Diz-se também que c é um nı́vel
regular de f . Quando existe x ∈ U tal que f (x) = c e grad f (x) = 0,
diz-se que c é um nı́vel crı́tico de f .
Teorema 3. Se c é um valor regular da função f : U → R, de classe
C k no aberto U ⊂ Rn+1 , então M = f −1 (c) é uma hiperfı́cie de classe
C k , cujo espaço vetorial tangente Tp M é, em cada ponto p ∈ M , o
complemento ortogonal de grad f (p).
Demonstração. O fato de que f −1 (c) é uma hiperfı́cie é apenas uma
reformulação verbal do Teorema da Função Implı́cita. (Ver comentário
após a prova do Teorema 1.) Quanto ao espaço vetorial tangente Tp M ,
como M é uma superfı́cie de nı́vel da função f , vemos que todo vetor
v ∈ Tp M é ortogonal a grad f (p), logo Tp M ⊂ [grad f (p)]⊥ . Sendo
ambos subespaços de dimensão n em Rn+1 , conclui-se que Tp M =
[grad f (p)]⊥ .
90 Funções Implı́citas Cap. 4

Exemplo 4. (Mais uma vez a esfera). À luz do Teorema 3, a esfera


unitária S n é a superfı́cie de nı́vel 1 da função f : Rn+1 → R, dada
por f (x) = hx, xi. Como grad f (x) = 2x, vemos que zero é o único
nı́vel crı́tico de f . Em particular, 1 é valor regular, S n = f −1 (1) é uma
hiperfı́cie C ∞ e, para todo p ∈ S n , tem-se Tp S n = [grad f (p)]⊥ = [p]⊥ .

Exemplo 5. Seja A : Rn → Rn um operador linear auto-adjunto. A
função f : Rn → R, definida por f (x) = hA · x, xi é o que se chama
uma forma quadrática. Se [aij ] é a matriz (simétrica) de A na base
P
n P
n
canônica de Rn então f (x) = aij xi xj . Logo ∂f /∂xi = 2 aij xj e
i,j=1 j=1
conseqüentemente grad f (x) = 2A · x. Supondo agora que o operador A
seja invertı́vel, o único ponto crı́tico da função f é a origem 0, onde f
assume o valor zero. Então, para todo c 6= 0, a equação f (x) = c define
uma hiperfı́cie. Costuma-se tomar c = 1 e a hiperfı́cie definida pela
Pn
equação f (x) = 1, ou seja, aij xi xj = 1, chama-se uma quádrica.
i,j=1
Em particular, se o operador A é positivo, isto é, se f (x) > 0 para todo
x 6= 0, a quádrica f −1 (1) chama-se um elipsóide. ⊳
2
Exemplo 6. Seja f : Rn → R a função que associa a cada matriz
x = [xij ] de n linhas e n colunas seu determinante f (x x) = det x . O
desenvolvimento de Laplace relativo à i-ésima linha é
n
X
x) =
f (x (−1)i+k xik · Xik ,
k=1

onde o ik-ésimo menor Xik é o determinante da matriz (n − 1) × (n − 1)


que se obtém de x omitindo a i-ésima linha e a k-ésima coluna. Segue-
∂f
se daı́ que x) = (−1)i+j Xij . Em particular, se x = I = matriz
(x
∂xij
∂f
identidade n × n, temos (II ) = δij (delta de Kronecker , igual a
∂xij
1 quando i = j e 0 quando i 6= j). Portanto grad f (II ) = I . Seja
2
U ⊂ Rn o conjunto aberto formado pelas matrizes (invertı́veis) x tais
que det x 6= 0. Para toda x ∈ U , o desenvolvimento de Laplace nos
mostra que algum menor Xij é 6= 0, logo grad f (x x) 6= 0. Portanto a
função f : U → R não possui pontos crı́ticos: todo número real c é um
valor regular de f . Logo M = f −1 (1) = conjunto das matrizes reais n×n
Seção 3 Multiplicador de Lagrange 91

com determinante 1 é uma hiperfı́cie C ∞ . M é um grupo em relação


à multiplicação de matrizes, conhecido como o grupo unimodular . O
espaço vetorial TI (M ), tangente a M na matriz identidade I , é formado
pelas matrizes x que são perpendiculares (em termos do produto interno
2
de Rn ) ao gradiente grad f (II ) = I . Ora,
n
X n
X
x, I i =
hx xij δij = xii = traço de x .
i,j=1 i=1

Assim, o espaço vetorial tangente a M no ponto I é o conjunto das


matrizes de traço nulo. ⊳
Observação. O Teorema 3 é uma boa fonte de exemplos de hiperfı́cies.
Mas nem toda hiperfı́cie M ⊂ Rn+1 pode ser obtida como imagem in-
versa M = f −1 (c) do valor regular c de uma função f : U → R. Com
efeito, as hiperfı́cies desse tipo admitem um campo contı́nuo de veto-
res não-nulos v = grad f : M → Rn+1 , tais que, para todo x ∈ M ,
hv(x), wi = 0 qualquer que seja w ∈ Tx M . (Diz-se então que v = grad f
é um campo de vetores normais a M .) Tais hiperfı́cies são chamadas de
orientáveis. Esta noção será retomada, mais amplamente, no Cap. 7.
Um exemplo bem conhecido de superfı́cie não-orientável é a faixa de
Moebius. Logo, a faixa de Moebius não é imagem inversa de um valor
regular de uma função de classe C 1 definida num aberto de R3 .

3 Multiplicador de Lagrange

O método de multiplicador de Lagrange se aplica na seguinte situação:


tem-se uma função f : U → R, de classe C 1 no aberto U ⊂ Rn+1 (função-
objetivo), uma hiperfı́cie M = ϕ−1 (c), imagem inversa do valor regular
c da função ϕ : U → R, de classe C 1 , e procura-se determinar quais são
os pontos crı́ticos da restrição f |M , ou seja, os pontos crı́ticos x de f
sujeitos à condição ϕ(x) = c.
Não se trata de determinar os pontos crı́ticos de f : U → R que estão
localizados sobre a hiperfı́cie M mas sim os pontos crı́ticos da função
f |M : M → R. É preciso definir o que se entende por isto.
Um ponto x ∈ M chama-se um ponto crı́tico da restrição f |M
quando, para todo caminho diferenciável λ : (−δ, δ) → M com λ(0) =
x tem-se (f ◦ λ)′ (0) = 0. Pondo v = λ′ (0), esta condição significa
h grad f (x), vi = 0. Como v é um vetor arbitrário pertencente ao espaço
92 Funções Implı́citas Cap. 4

vetorial tangente Tx M , vemos que x ∈ M é um ponto crı́tico de f |M se,


e somente se, grad f (x) é ortogonal ao espaço vetorial tangente Tx M .
Ora, grad ϕ(x) é um vetor (não-nulo) ortogonal a Tx M . Como o
complemento ortogonal de Tx M em Rn+1 tem dimensão 1, segue-se que
grad f (x) ⊥ Tx M se, e somente se, grad f (x) é um múltiplo de grad ϕ(x).
Portanto, podemos enunciar:
O ponto x ∈ U é um ponto crı́tico da restrição f |M de f à hiperfı́cie
M = ϕ−1 (c) se, e somente se:

1) ϕ(x) = c;
2) grad f (x) = λ · grad ϕ(x) para algum λ ∈ R.

As condições acima representam um sistema de n+2 equações (pois a


igualdade vetorial 2) acima significa n+1 igualdades numéricas) nas n+2
incógnitas x1 , . . . , xn+1 (coordenadas de x) e λ. O fator λ é chamado o
multiplicador de Lagrange. Sua presença torna o número de incógnitas
igual ao número de equações, o que viabiliza a solução na prática.
Deve-se notar que se x ∈ M é um ponto de mı́nimo ou de máximo
local de f |M então, para todo caminho diferenciável λ : (−δ, δ) → M
com λ(0) = x, a função f ◦ λ : (−δ, δ) → R tem um mı́nimo ou um
máximo local no ponto 0, logo (f ◦ λ)′ (0) = 0. Portanto os mı́nimos
e máximos locais de f |M estão incluı́dos na definição de ponto crı́tico
dada acima.
É também evidente que todo ponto crı́tico x ∈ M da função
f : U → R é, com maior razão, ponto crı́tico da restrição f |M pois,
sendo grad f (x) =0, tem-se h grad f (x), vi = 0 para todo v ∈ Rn+1 .
Muitas vezes, a condição adicional ϕ(x) = c é posta sob a forma
ϕ(x) = 0. Isto não representa perda de generalidade. Basta usar, em
vez de ϕ, a função ψ(x) = ϕ(x) − c. Então ψ(x) = 0 ⇔ ϕ(x) = c e c é
valor regular de ϕ se, e somente se, 0 é valor regular de ψ.

Exemplo 7. Seja f : R2 → R definida por f (x, y) = ax + by, com


a2 + b2 6= 0. O gradiente de f é, em todo ponto (x, y), o vetor constante
não-nulo v = (a, b), ortogonal às linhas de nı́vel ax + by = c, que são
retas, duas a duas paralelas. A função f não tem pontos crı́ticos. Mas se
ϕ : R2 → R for dada por ϕ(x, y) = x2 + y 2 então grad ϕ(x, y) = (2x, 2y),
1 é valor regular de ϕ e M = ϕ−1 (1) é a circunferência unitária x2 +y 2 =
1. Como M é compacta, a restrição f |M possui pelo menos dois pontos
crı́ticos, nos quais assume seus valores mı́nimo e máximo. Os pontos
Seção 3 Multiplicador de Lagrange 93

crı́ticos de f |M são as soluções (x, y) do sistema

grad f (x, y) = λ · grad ϕ(x, y), ϕ(x, y) = 1,

ou seja:
2λx = a, 2λy = b, x2 + y 2 = 1.

grad f (x, y)

grad f (−x, −y)

Figura 4.3

Portanto (x, y) é um ponto crı́tico de f |M se, e somente se, o vetor


unitário z = (x, y) é um múltiplo do vetor v = (a, b). Isto nos dá
   
a b −a −b
(x, y) = √ , √ ou (x, y) = √ , √ .
a2 + b2 a2 + b2 a2 + b2 a2 + b2
Estes são os pontos nos quais f (x, y) assume seus valores máximo e
mı́nimo em M = S 1 . ⊳
Exemplo 8. Seja f : Rn → R uma forma quadrática. Para todo
P
n
x = (x1 , . . . , xn ), tem-se f (x) = aij xi xj , onde a = [aij ] é uma ma-
i,j=1
triz simétrica n × n. Alternativamente, tem-se f (x) = hAx, xi, onde
A : Rn → Rn é o operador linear auto-adjunto cuja matriz na base
canônica de Rn é a . Quais são os pontos crı́ticos da restrição f |S n−1 ,
onde S n−1 é a esfera unitária de Rn ? Temos S n−1 = ϕ−1 (1), onde
ϕ : Rn → R é definida por ϕ(x) = hx, xi e, como grad ϕ(x) = 2x, 1
∂f Pn
é valor regular de ϕ. Por sua vez, (x) = 2 · aij xj , portanto
∂xi j=1
grad f (x) = 2A · x. Portanto os pontos crı́ticos da restrição f |S n−1 são
94 Funções Implı́citas Cap. 4

as soluções do sistema Ax = λx, hx, xi = 1, isto é, são os autovetores


do operador A que têm comprimento 1. Como S n−1 é compacta, f ad-
mite pelo menos 2 pontos crı́ticos em S n−1 , a saber, os pontos em que
assume seus valores mı́nimo e máximo. Isto fornece uma prova de que
todo operador auto-adjunto em Rn possui autovetores, o que é o passo
fundamental para a demonstração do Teorema Espectral. ⊳

Exemplo 9. Seja U ⊂ Rn o conjunto dos pontos cujas coordenadas são


positivas. Consideremos as funções f, ϕ : U → R definidas, para todo
x = (x1 , . . . , xn ) ∈ U , como f (x) = x1 · x2 · · · xn e ϕ(x) = x1 + x2 +
· · · + xn . Fixando s > 0, procuremos os pontos crı́ticos de f |M onde
M = ϕ−1 (s). Observemos que grad ϕ(x) = (1, 1, . . . , 1) para qualquer
x ∈ U , de modo que M Q é uma hiperfı́cie. Por sua vez, temos grad f (x) =
(α1 , . . . , αn ) com αi = xj . Assim, x ∈ M é ponto crı́tico de f |M se,
j6=i Q
e somente se, para algum λ, tem-se xj = λ (i = 1, . . . , n). Dividindo
j6=i
a i-ésima dessas equações pela k-ésima, obtemos xk /xi = 1. Assim, o
único ponto crı́tico de f |M é aquele que tem suas coordenadas iguais, ou
seja, é p = (s/n, s/n, . . . , s/n). Afirmamos que f (p) = (s/n)n é o maior
valor de f |M . Com efeito, a fórmula de f define uma função contı́nua no
compacto M̄ , onde possui um ponto de máximo, o qual não pode estar
em M̄ − M pois x1 · x2 · · · xn = 0 se x ∈ M̄ − M . Logo esse máximo
está em M , portanto é um ponto crı́tico, mas p é o único ponto crı́tico
de f |M . Conclusão: quando n números positivos têm soma constante
s, seu produto é máximo, igual a (s/n)n , quando eles são iguais. Ou
ainda, se x1 , . . . , xn são positivos então
 n
x1 + x2 + · · · + xn
x1 · x2 · · · xn ≤ .
n

A desigualdade acima, posta sob a forma

√ x1 + x2 + · · · + xn
n
x1 · x2 · · · xn ≤ ,
n

diz que a média geométrica de números positivos é menor do que ou


igual à média aritmética. Além disso, elas coincidem somente quando
os números dados são iguais. ⊳
Seção 3 Multiplicador de Lagrange 95

M
p

Figura 4.4

Exemplo 10. Dadas a função f : U → R, de classe C k no aberto


U ⊂ Rn+1 , e a hiperfı́cie M ⊂ U , os pontos crı́ticos da restrição f |M
são os pontos x ∈ M para os quais grad f (x) é ortogonal ao espaço
vetorial tangente Tx M , mesmo quando M não é obtida como imagem
inversa ϕ−1 (c) de um valor regular de uma função ϕ : U → R de classe
C k . Isto ficou claro na discussão feita no inı́cio desta seção. Como
exemplo, consideremos uma hiperfı́cie M ⊂ Rn+1 , um ponto a ∈ Rn+1
não pertencente a M e indaguemos quais são os pontos p ∈ M situa-
dos à distância mı́nima de a. Trata-se de obter os pontos que tornam
mı́nima a restrição f |M , onde f : U → R, dada por f (x) = |x − a|,
tem U p =PRn+1 − {a} por domı́nio, por isso é de classe C ∞ . Temos
f (x) = (xi − ai )2 , logo ∂f /∂xi = (xi − ai )/|x − a| e daı́ grad f (x) =
(x − a)/|x − a|. Assim, os pontos crı́ticos de f , entre os quais estão os
pontos de M situados à distância mı́nima de a, são os pontos x ∈ M
tais que x − a é um vetor normal a M no ponto x, isto é, hx − a, vi = 0
para todo v ∈ Tx M . Em particular, se M = S n , x − a ⊥ Tx S n significa
x − a = α · x isto é, x = a/(1 − α). Portanto, neste caso, os únicos pontos
crı́ticos de f |S n são os pontos x ∈ S n pertencentes à reta 0a, os quais
são ±a/|a|. Um deles minimiza |x − a| e o outro maximiza f . ⊳

Observação. Os pontos crı́ticos da restrição f |M da função f : U → R


à hiperfı́cie ϕ−1 (0), onde ϕ : U → R tem 0 como valor regular, são,
como vimos, as soluções x do sistema de equações grad f (x) = λ ·
grad ϕ(x), ϕ(x) = 0. Se considerarmos a função L : U × R → R, definida
por L(x, λ) = f (x) − λϕ(x), veremos que grad L(x, λ) = grad f (x) −
λ grad ϕ(x) − ϕ(x), portanto os pontos crı́ticos da restrição f |M são
simplesmente os pontos crı́ticos (livres) da função L que pertençam a
M . A função L é chamada a Lagrangiana do problema.
96 Funções Impı́citas Cap. 4

4 Exercı́cios

Seção 1. Uma função implı́cita


1. Seja f : R2 → R de classe C k (k ≥ 1). Suponha que existam um ponto
∂f
(x0 , y0 ) ∈ R2 e uma constante M tais que f (x0 , y0 ) = 0, (x, y) 6= 0 e
 ∂y
∂f
(x, y) ∂f (x, y) ≤ M para todo (x, y) ∈ R2 . Prove que, para todo x ∈ R,
∂x ∂y
existe um único y = ξ(x) ∈ R tal que f (x, ξ(x)) = 0 e que a função ξ : R → R,
assim definida, é de classe C k .
2. Seja f : U → R de classe C 1 no aberto U ⊂ Rn . Se f não possui pontos crı́ticos,
prove que a imagem f (A) de todo aberto A ⊂ U é um conjunto aberto em R.
3. Seja f : R3 → R dada por f (x, y, z) = x4 + 2x · cos y + sen z. Prove que, numa
vizinhança de 0, a equação f (x, y, z) = 0 define z como função de classe C ∞
∂z ∂z
das variáveis x, y. Calcule e ·
∂x ∂y
4. Seja f : R × [0, 1) → R a função contı́nua definida por f (x, y) = (x2 + y 2 ) ·
(ye|x| − 1). Prove que, para cada x ∈ R, existe um único y = ξ(x) ∈ [0, 1) tal
que f (x, ξ(x)) = 0 mas a função ξ : R → [0, 1) não é contı́nua.
5. Sejam f, g : Rn → R tais que, para todo x ∈ Rn , vale g(x) = f (x)(1 + f (x)4 ).
Se g ∈ C k , k ≥ 1, prove que f também é de classe C k .
Seção 2. Hiperfı́cies
2
1. Prove que o conjunto M ⊂ Rn das matrizes n × n de posto n − 1 é uma
hiperfı́cie orientável. Determine Tp M , onde p é a matriz n × n cujos elementos
são todos nulos exceto os n − 1 primeiros da diagonal, que são iguais a 1.
p 2
2. Prove que o conjunto dos pontos (x, y, z) ∈ R3 tais que z 2 + x2 + y 2 −2 = 1

é uma superfı́cie C . Que forma tem essa superfı́cie?
3. Prove que toda hiperfı́cie M ⊂ Rn+1 é localmente orientável no seguinte sen-
tido: cada ponto p ∈ M possui uma vizinhança V em M na qual está definido
um campo contı́nuo v : V → Rn+1 de vetores não-nulos normais a M (ou seja
v(x) ⊥ Tx M para todo x ∈ V ).
Seção 3. Multiplicadores de Lagrange
1. Seja hAx, xi = 1 a equação de um elipsóide M em Rn+1 . Prove que a maior

distância de um ponto de M à origem é 1/ µ, onde µ é o menor autovalor do
operador positivo A. Ela é atingida num ponto x ∈ M que é autovetor de A,
correspondente ao autovalor µ.
2. Seja H o hiperplano de Rn+1 definido pela equação hb, xi = c. Use o método
do multiplicador de Lagrange para mostrar que o ponto H mais próximo do
c − hb, ai
ponto a ∈ Rn+1 é x = a + · b.
|b|2
3. Determine os pontos crı́ticos da função f : R2n → R, dada por f (x, y) = hx, yi,
restrita à esfera unitária |x|2 + |y|2 = 1, e conclua daı́ a desigualdade de
Schwarz.
Seção 4 Exercı́cios 97

2 2
4. Seja M (n × n) = Rn . Prove que n
P o2máximo da função f : R → R, dada por
x) = det x , restrita à esfera
f (x xij = n, é atingido numa matriz ortogonal,
i,j
logo é igual a 1. Notando que, se as linhas de x são v1 , . . . , vn então x =
|v1 | . . . |vn | · w onde todas as linhas de w têm comprimento 1, conclua daı́ a
desigualdade de Hadamard: | det x | ≤ |v1 | . . . |vn |.
5. Prove que o menor valor da soma s = x1 + · · · + xn de n números positivos
cujo produto p = x1 · x2 · x2 · · · xn é constante é atingido quando esses números

são iguais, logo valem n p.
5

Aplicações Diferenciáveis

1 A derivada como transformação linear

Uma aplicação f : U → Rn , definida no aberto U ⊂ Rm , diz-se dife-


renciável no ponto a ∈ U quando cada uma das suas funções-coordenada
f1 , . . . , fn : U → R é diferenciável nesse ponto.
Se este é o caso então, para todo v = (α1 . . . , αm ) tal que a + v ∈ U
e para cada i = 1, . . . , n, tem-se
Xm
∂fi ri (v)
fi (a + v) − fi (a) = (a) · αj + ri (v) com lim = 0.
∂xj v→0 |v|
j=1
 
∂fi
A matriz Jf (a) = (a) ∈ M (n × m) chama-se a matriz jacobi-
∂xj
ana de f no ponto a.
A transformação linear f ′ (a) : Rm → Rn , cuja matriz em relação às
bases canônicas de Rm e Rn é Jf (a), chama-se a derivada da aplicação
f no ponto a.
De acordo com a definição de matriz de uma transformação linear,
para todo v = (α1 , . . . , αm ) ∈ Rm temos
m
X
′ ∂fi ∂fi
f (a) · v = (β1 , . . . , βn ) onde βi = (a) · αj = (a).
∂xj ∂v
j=1

Assim, se definirmos, como é natural, a derivada direcional da aplicação


f , no ponto a, na direção do vetor v, como
∂f f (a + tv) − f (a)
(a) = lim ,
∂v t→0 t
Seção 1 A derivada como transformação linear 99

temos imediatamente
 
∂f ∂f1 ∂fn
(a) = (a), . . . , (a) = f ′ (a) · v.
∂v ∂v ∂v

Resulta da Regra da Cadeia para funções (Teorema 2 do Capı́tulo 3),


em conformidade com a observação feita logo após sua demonstração,
∂f ∂f
que embora a definição de (a) tenha sido dada acima como (a) =
∂v ∂v
∂f
(f ◦λ)′ (0), onde λ(t) = a+tv, vale, mais geralmente, a igualdade (a) =

∂v
(f ◦ λ) (0) para qualquer caminho diferenciável λ : (−δ, δ) → U , com
λ(0) = a e λ′ (0) = v.
As n igualdades numéricas que exprimem a diferenciabilidade das
funções-coordenada fi se resumem na igualdade abaixo, entre vetores de
Rn :
r(v)
f (a + v) − f (a) = f ′ (a) · v + r(v), com lim = 0.
v→0 |v|
Algumas vezes, é mais conveniente escrever esta condição sob a forma

f (a + v) − f (a) = f ′ (a) · v + ρ(v) · |v| com lim ρ(v) = 0.


v→0

Aqui, ρ(v) = r(v)/|v| para todo v 6= 0 tal que a + v ∈ U .


A relação acima caracteriza univocamente a derivada da aplicação
f no sentido seguinte: se uma transformação linear T : Rm → Rn é tal
que, para a, a + v ∈ U tem-se
r(v)
f (a + v) − f (a) = T · v + r(v), com lim = 0,
v→0 |v|

então T = f ′ (a).
Com efeito, daı́ resulta, tomando tv em vez de v, que:
f (a + tv) − f (a) r(tv)
=T ·v± · |v|,
t |tv|
logo
[f (a + tv) − f (a)] ∂f
T · v = lim = (a) = f ′ (a) · v.
t→0 t ∂v
Quando f : U → Rn é diferenciável em todos os pontos de U , dizemos que
f é diferenciável em U . Neste caso, fica definida uma aplicação f ′ : U →
100 Aplicações Diferenciáveis Cap. 5

L(Rm ; Rn ) que faz corresponder a cada x ∈ U a transformação linear


f ′ (x) : Rm → Rn . Quando for conveniente, identificaremos o conjunto
L(Rm ; Rn ) das transformações lineares de Rm em Rn com o conjunto
M (n × m) das matrizes n × m ou com o espaço Rnm .
Dizer que a aplicação derivada f ′ : U → L(Rm ; Rn ) (ou seja f ′ : U →
nm
R ) é contı́nua equivale a afirmar a continuidade de cada uma de suas
nm funções-coordenada ∂fi /∂xj : U → R, isto é, a dizer que f é uma
aplicação de classe C 1 conforme a definição dada no Capı́tulo 3. Como
foi demonstrado no Teorema 1 daquele capı́tulo, a continuidade das de-
rivadas parciais ∂fi /∂xj : U → R implica a diferenciabilidade de f .
Como no caso de funções, aplicações f : U → Rn de classe C k são
definidas por indução: diz-se que f ∈ C k quando f é diferenciável e sua
derivada f ′ : U → Rnm é de classe C k−1 . Se f ∈ C k para todo k ∈ N
diz-se que f é de classe C ∞ : f ∈ C ∞ . Então f ′ ∈ C ∞ também.
Observação. Na maioria das vezes, a maneira mais simples de verificar
que uma aplicação f é diferenciável consiste em calcular diretamente as
∂fi
derivadas parciais (x), mostrar que elas dependem continuamente de
∂xj
x e usar o Teorema 1 do Capı́tulo 3, segundo o qual toda função de classe
C 1 é diferenciável. Praticamente todas as aplicações diferenciáveis são
de classe C 1 . Ocorre, entretanto, que as propriedades mais relevantes das
aplicações C 1 resultam da relação que caracteriza sua diferenciabilidade.
Daı́ a importância deste conceito.

2 Exemplos de derivadas

Exemplo 1. Sejam I ⊂ R um intervalo aberto e f : I → Rn um caminho


diferenciável no ponto a ∈ I. Considerando f como uma aplicação, sua
derivada no ponto a é a transformação linear f ′ (a) : R → Rn cuja matriz
jacobiana tem por única coluna o vetor
 
df1 dfn
v= (a), . . . , (a) ,
dt dt

a qual vem a ser o vetor-velocidade do caminho f no ponto a, já indicado


com a mesma notação f ′ (a) no Capı́tulo 2. Como transformação linear,
f ′ (a) : R → Rn faz corresponder a cada “vetor”t ∈ R o vetor t · v ∈ Rn .
Noutros termos: f ′ (a) · t = t · f ′ (a). ⊳
Seção 2 Exemplos de derivadas 101

Exemplo 2. Seja f : U → R uma função definida no aberto U ⊂ Rm ,


diferenciável no ponto a ∈ U . Sua derivada é uma transformação linear
f ′ (a) : Rm → R, portanto um funcional linear, que associa a cada vetor
v = (α1 , α2 , . . . , αm ) ∈ Rm o número

∂f ∂f ∂f
f ′ (a) · v = (a) · α1 + · · · + (a) · αm = (a) = h grad f (a), vi.
∂x1 ∂xm ∂v

Às vezes se escreve df (a) e chama-se diferencial de f à derivada f ′ (a).


Em particular, se usarmos a notação tradicional xi : Rm → R para indi-
car a função que associa a cada ponto x ∈ Rm sua i-ésima coordenada
xi , a diferencial dxi desta função é o funcional linear que faz correspon-
der a cada vetor v = (α1 , . . . , αm ) sua i-ésima coordenada dxi · v = αi .
(Mesmo porque, sendo linear, a função xi tem derivada constante, igual
a si própria. Vide Exemplo 4, abaixo.) Então
m
X m
X
∂f ∂f
df (a) · v = (a) · αi = (a) · dxi · v.
∂xi ∂xi
i=1 i=1

Isto atribui um significado à expressão clássica


m
X ∂f
df = dxi . ⊳
∂xi
i=1

Exemplo 3. Se f : U → Rn é constante então f ′ (x) = 0 para todo


x ∈ U . Reciprocamente, se o aberto U ⊂ Rm é conexo e f : U →
Rn possui derivada 0 em todos os pontos x ∈ U então f é constante.
(Conforme o Corolário 5 do Teorema 2, Capı́tulo 3.)

Exemplo 4. Se T : Rm → Rn é uma transformação linear então T


é diferenciável e T ′ (x) = T para todo x ∈ Rm . Noutras palavras,
T ′ (x) · v = T · v quaisquer que sejam x, v ∈ Rm . Isto resulta imediata-
mente da igualdade T (x + v) − T · x = T · v + r, onde r = 0, ou então do
fato óbvio de que a matriz jacobiana de T é a própria matriz de T . Um
caso muito particular: a soma S : Rm × Rm → Rm , S(x, y) = x + y é
linear, logo S ′ (x, y) · (u, v) = u + v quaisquer que sejam x, y, u, v ∈ Rm .

Exemplo 5. Seja B : Rm × Rn → Rp uma aplicação bilinear, isto é,


linear em cada uma de suas duas variáveis. Se escrevermos, para cada
102 Aplicações Diferenciáveis Cap. 5

par de vetores (ei , ej ) das bases canônicas de Rm e Rn respectivamente,


B(ei , ej ) = vij , então, para x = (x1 , . . . , xm ) e y = (y1 , . . . , yn ) teremos
X
B(x, y) = xi yj vij .
i,j

Isto mostra que B é contı́nua, logo assume seu valor máximo |B| no
compacto S m−1 × S n−1 . Daı́ resulta que, para quaisquer x ∈ Rm e
y ∈ Rn não-nulos, vale |B(x, y)| = |B(x/|x|, y/|y|)| · |x| · |y| ≤ |B| · |x| · |y|.
Para x = 0 ou y = 0, a desigualdade |B(x, y)| ≤ |B| · |x| · |y| é imediata
pois B(0, y) = B(x, 0) = 0. Mostremos agora que toda aplicação bilinear
B é diferenciável, com B ′ (x, y) · (u, v) = B(u, y) + B(x, v). Com efeito,
se x, u ∈ Rm e y, v ∈ Rn , temos pela bilinearidade de B:

B(x + u, y + v) − B(x, y) = B(u, y) + B(x, v) + B(u, v).


p
Observando que |(u, v)| = |u|2 + |v|2 ≥ |v|, temos
|B(u, v)| |B| · |u| · |v|
≤p ≤ |B| |u|,
|(u, v)| |u|2 + |v|2
B(u, v)
logo lim = 0, comprovando assim a diferenciabilidade de B. ⊳
u,v→0 |(u, v)|
Nos Exemplos 4 e 5 acima (e, obviamente, no Exemplo 3), as aplica-
ções consideradas são de classe C ∞ . De fato, a derivada T ′ = T : Rm →
L(Rm ; Rn ) de uma transformação linear T , sendo constante, possui de-
rivada nula e todas as derivadas seguintes também serão nulas. Quanto
à aplicação bilinear B, sua derivada B ′ : Rm × Rn → L(Rm × Rn ; Rp )
é a transformação linear (x, y) 7→ B(•, y) + B(x, •), recaindo assim no
Exemplo 4.
Exemplo 6 (Derivada complexa). Uma função de variável complexa
f : U → C, definida no aberto U ⊂ C, pode ser vista como uma aplicação
f : U → R2 , definida no aberto U ⊂ R2 . A derivada da função complexa
f no ponto z ∈ U é o número complexo f ′ (z), definido como o limite
f (z + H) − f (z)
f ′ (z) = lim ,
H→0 H
quando tal limite existe. Isto equivale a dizer que
r(H)
f (z + H) − f (z) = f ′ (z) · H + r(H), onde lim = 0.
H→0 |H|
Seção 3 Cálculo diferencial de aplicações 103

Acima, f ′ (z) · H é uma multiplicação de números complexos. Portanto,


a função complexa f : U → C é derivável no ponto z ∈ U se, e somente
se, a aplicação f : U → R2 é diferenciável nesse ponto e, além disso,
sua derivada f ′ (z) : R2 → R2 é uma transformação linear do plano que
consiste em multiplicar por um número complexo fixo. Ora, se T : R2 →
R2 é uma tal transformação, da forma T · z = (a + bi) · z, sua matriz na
base canônica tem as colunas
 T · 1 = a + bi e T · i = −b + ai, ou seja, sua
a −b
matriz é do tipo . Se, para z = x+yi, f (z) = u(x, y)+i·v(x, y),
b a
a matriz jacobiana de f é
 ∂u ∂u 
 ∂x ∂y 
 
 .
 ∂v ∂v 
∂x ∂y
Segue-se então que a função complexa f é derivável em U se, e somente
se, valem as relações ∂u/∂x = ∂v/∂y e ∂u/∂y = −∂v/∂x em todo ponto
z = x + yi ∈ U . Estas igualdades são conhecidas como as equações de
Cauchy-Riemann.
A derivada de f , considerada como função de uma variável complexa

∂u ∂v ∂v ∂u
f ′ (z) = +i = −i · ⊳
∂x ∂x ∂y ∂y
Exemplo 7. Se f, g : U → Rn são diferenciáveis no ponto a ∈ U ⊂
Rm então a aplicação (f, g) : U → Rn × Rn , definida por (f, g)(x) =
(f (x), g(x)), é diferenciável no ponto a e sua derivada é (f, g)′ (a) · v =
(f ′ (a) · v, g ′ (a) · v). Se f, g ∈ C k então (f, g) também é de classe C k . ⊳

3 Cálculo diferencial de aplicações

Teorema 1 (Regra da Cadeia). Sejam U ⊂ Rm , V ⊂ Rn abertos e


f : U → Rn , g : V → Rp diferenciáveis nos pontos a ∈ U , b = f (a) ∈ V ,
com f (U ) ⊂ V . Então g ◦ f : U → Rp é diferenciável no ponto a e
(g ◦ f )′ (a) = g ′ (b) · f ′ (a) : Rm → Rp .
Resumidamente: a derivada da aplicação composta é a composta das
derivadas.
104 Aplicações Diferenciáveis Cap. 5

Demonstração. Podemos escrever

f (a + v) = f (a) + f ′ (a) · v + ρ(v) · |v|, com lim ρ(v) = 0 e


v→0
g(b + w) = g(b) + g ′ (b) · w + σ(w) · |w|, com lim σ(w) = 0.
w→0

Então
(g ◦ f )(a + v) = g(f (a) + f ′ (a) · v + ρ(v) · |v|).
Pondo w = f ′ (a) · v + ρ(v) · |v|, obtemos:

(g ◦ f )(a + v) = g(b + w)
= g(b) + g ′ (b) · (f ′ (a) · v) + g ′ (b) · ρ(v)|v| + σ(w) · |w|
= (g ◦ f )(a) + [g ′ (b) · f ′ (a)] · v + C(v) · |v|,

onde
′ v
C(v) = g (b) · ρ(v) + σ(w) · f (a) ·

+ ρ(v) .
|v|
v
Se v → 0 então w → 0 e f ′ (a) · é limitada. Portanto lim C(v) = 0,
|v| v→0
provando o teorema.
Corolário 1. Se f : U → Rn e g : V → Rp (com U ⊂ Rm e f (U ) ⊂ V ⊂
Rn ) são de classe C k então g ◦ f : U → Rp é de classe C k .
Com efeito, a Regra da Cadeia aplicada num ponto genérico x ∈ U ,
fornece (g ◦ f )′ (x) = g ′ (f (x)) · f ′ (x). Em termos funcionais, temos

(g ◦ f )′ = (g ′ ◦ f ) · f ′ : U → L(Rm ; Rp ),

onde ◦ é a composição de aplicações e · é a multiplicação de trans-


formações lineares, a qual é bilinear, logo C ∞ . Se f e g são de classe C 1 ,
esta última igualdade mostra que (g ◦ f )′ é contı́nua, logo g ◦ f ∈ C 1 .
Por indução, supondo f e g de classe C k , a mesma igualdade mostra
que (g ◦ f )′ ∈ C k−1 , logo g ◦ f ∈ C k .
Corolário 2. Nas condições do Teorema 1, a matriz jacobiana de g ◦ f
no ponto a é o produto da matriz jacobiana de g no ponto f (a) pela
matriz jacobiana de f no ponto a : J(g ◦ f )(a) = Jg(f (a)) · Jf (a).
Em termos de derivadas parciais, a igualdade acima lê-se
n
X ∂gi ∂yk
∂gi
= · ·
∂xj ∂yk ∂xj
k=1
Seção 3 Cálculo diferencial de aplicações 105

Nesta fórmula, escrita da maneira tradicional, os xj são coordenadas


de um ponto em U , os yk em V , ∂gi /∂xj é derivada parcial de gi ◦ f
enquanto ∂gi /∂yk é derivada parcial de gi e, finalmente, ∂yk /∂xj signi-
fica, em nossa notação costumeira, ∂fk /∂xj . Com tais entendimentos
tácitos, essa fórmula tem sobrevivido e sido útil através dos anos.
Corolário 3 (As regras de derivação). Sejam f, g : U → Rn dife-
renciáveis no ponto a ∈ U ⊂ Rm , α um número real e B : Rn ×Rn → Rp
bilinear. Então:

1) f + g : U → Rn é diferenciável no ponto a, com (f + g)′ (a) =


f ′ (a) + g ′ (a).

2) α · f : U → Rn é diferenciável no ponto a, com (αf )′ (a) = α · f ′ (a).

3) B(f, g) : U → Rp , definida por B(f, g)(x) = B(f (x), g(x)), é dife-


renciável no ponto a, com

[B(f, g)]′ (a) · v = B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v).

Os itens 1) e 2) podem ser provados diretamente a partir da definição


de aplicação diferenciável ou então considerando as transformações li-
neares S : Rn × Rn → Rn , α∗ : Rn → Rn , definidas por S(x, y) = x + y
e α∗ (x) = α · x. Então é só observar que f + g = S ◦ (f, g) e α · f = α∗ ◦ f
e usar a Regra da Cadeia, lembrando que S ′ = S e (α∗ )′ = α∗ , logo

(f + g)′ = S ◦ (f ′ , g ′ ) = f ′ + g ′ e (α · f )′ = (α∗ ◦ f )′ = α∗ ◦ f ′ = α · f ′ .

Quanto ao item 3), basta usar a Regra da Cadeia e os Exemplos 5, 7.


Então, como B(f, g) = B ◦ (f, g), temos, para cada v ∈ Rm :

[B(f, g)]′ (a) · v = [B ◦ (f, g)]′ (a) · v = B ′ (f (a), g(a)) · (f ′ (a) · v, g ′ (a) · v)
= B(f ′ (a) · v, g(a)) + B(f (a), g ′ (a) · v).

Observação. Uma aplicação bilinear B : Rn × Rn → Rp pode (e deve)


ser considerada como uma forma de multiplicar um elemento de Rn por
outro obtendo um produto em Rp . Usando a notação multiplicativa
x • y em vez de B(x, y), a regra de derivação do item 3) do Corolário 3
lê-se (f • g)′ = f ′ • g + f • g ′ , isto é, para todo x ∈ U e todo v ∈ Rn ,
(f • g)′ (x) · v = (f ′ (x) · v) • g(x) + f (x) • (g ′ (x) · v). (O ponto maior •
106 Aplicações Diferenciáveis Cap. 5

é o produto que substitui B e o ponto menor · é a aplicação de uma


transformação linear sobre um vetor.)
Exemplo 8. Um exemplo freqüente de aplicação bilinear é o produto
interno de vetores. Se tivermos ϕ(x) = hf (x), g(x)i, com f, g : U → Rn
diferenciáveis em U ⊂ Rm então, para todo v ∈ Rm , vale ϕ′ (x) · v =
hf ′ (x)·v, g(x)i+hf (x), g ′ (x)·vi. Em particular, se ϕ(x) = hf (x), f (x)i =
|f (x)|2 então ϕ′ (x) · v = 2hf (x), f ′ (x) · vi. Levando em conta a fórmula
√ √
( u)′ = u′ /2 u para a derivada da raiz quadrada de uma função real
positiva u, daı́ resulta que, pondo
p
ξ(x) = hf (x), f (x)i = |f (x)|, tem-se ξ ′ (x) · v = hf ′ (x) · v, f (x)i/|f (x)|
sempre que f (x) 6= 0. ⊳
Exemplo 9. Outro exemplo comum de aplicação bilinear é a multi-
plicação de matrizes (ou de transformações lineares). Vejamos um caso
particular desta situação. Se A : Rm → Rm é um operador auto-adjunto
então resulta do exemplo anterior que a derivada da forma quadrática
ϕ(x) = hAx, xi atua assim: ϕ′ (x) · v = hAv, xi + hAx, vi = 2hAx, vi,
levando em conta que hAv, xi = hv, Axi, pela definição de operador
auto-adjunto. Algumas pessoas preferem considerar A como uma ma-
triz simétrica a do tipo m×m e x ∈ Rm como uma matriz x do tipo m×1
(matriz-coluna) cuja transposta xT é uma matriz-linha 1 × m. Então a
forma quadrática ϕ se escreve como ϕ(x x) = xT axax. Desta maneira, para
m
cada vetor v ∈ R (ou seja, para cada matriz v do tipo m × 1) tem-se
ϕ′ (x
x) · v = v T ax + xT av = xT av + xT av = 2xT avav, que corresponde a
2hAx, vi na notação de operadores. ⊳
Exemplo 10. Seja U ⊂ M (n × n) o conjunto das matrizes invertı́veis
n × n, isto é, das matrizes que têm determinante 6= 0. Como o deter-
minante é uma função contı́nua, U é aberto. Seja f : U → M (n × n)
a aplicação que associa a cada x ∈ U sua inversa f (x x) = x −1 . Afirma-
mos que f é diferenciável e que, em cada ponto x ∈ U , sua derivada
f ′ (x
x) : M (n × n) → M (n × n) é a transformação linear definida por
f ′ (x
x) · v = −x x−1 · v · x −1 , v ∈ M (n × n). Para provar isto, atribuiremos
a cada matriz x ∈ M (n × n) a norma |x x|, igual à norma da trans-
formação linear X : Rn → Rn que tem x como matriz na base canônica.
(Veja Exemplo 12, Capı́tulo 1.) Mais explicitamente: |x x| = sup{|X · u|;
u∈S n−1 }. Como se vê facilmente, se x , y ∈ M (n × n) então |x x · y| ≤
x| · |yy |. Provemos agora a diferenciabilidade de f . Escrevemos
|x
x + v )−1 − x −1 = −x
(x x−1vx −1 + r(vv )
Seção 3 Cálculo diferencial de aplicações 107

e mostramos que lim r(vv )/|vv | = 0. Com este objetivo, multiplicamos


v→0
ambos os membros da igualdade acima, à direita, por x + v . Após uma
simplificação óbvia, obtemos
x−1 · v )2 (x
r(vv ) = (x x + v )−1 ,
donde
|r(vv )|
x−1 |2 |vv |2 |(x
|r(vv )| ≤ |x x + v )−1 |, x−1 |2 |(x
≤ |x x + v )−1 | |vv |
|vv |
x + v )−1 se justifica pelo fato de
e daı́ lim r(vv )/|vv | = 0. (O uso de (x
v→0
que, sendo U aberto, x ∈ U ⇒ x + v ∈ U para toda v suficientemente
pequena.) ⊳
Observação. Na verdade a inversão de matrizes f : U → U , considerada
no Exemplo 10, é uma aplicação C ∞ . Isto pode ser verificado direta-
mente, a partir da fórmula que exprime x −1 em função de x , utilizando
a chamada “adjunta clássica”de uma matriz. (Ver também “Análise no
Espaço Rn ”, página 26.)
Lembremos que a norma de uma transformação linear T : Rm → Rn
é o número |T | = sup{|T · u|; u ∈ S n−1 }. Desta definição resulta que,
para todo v ∈ Rm , tem-se |T · v| ≤ |T | · |v| e que, se S : Rn → Rp é outra
transformação linear então |S · T | ≤ |S| · |T |.
Teorema 2 (Desigualdade do Valor Médio). Seja f : U → Rn
diferenciável em todos os pontos do segmento de reta [a, a + v] ⊂ U . Se,
para todo t ∈ [0, 1], tem-se |f ′ (a + tv)| ≤ M então |f (a + v) − f (a)| ≤
M · |v|.
Demonstração. O caminho λ : [0, 1] → Rn , definido por λ(t) =
f (a + tv), é diferenciável, com λ′ (t) = f ′ (a + tv) · v, portanto |λ′ (t)| ≤
|f ′ (a + tv)| · |v| ≤ M · |v| para todo t ∈ [0, 1]. Segue-se então da Desi-
gualdade do Valor Médio para caminhos (Teorema 1 do Capı́tulo 2) que
|λ(1) − λ(0)| ≤ M · |v| · (1 − 0), isto é, |f (a + v) − f (a)| ≤ M · |v|.
Corolário 4. Se o aberto U ⊂ Rm é convexo e M > 0 é tal que a
aplicação diferenciável f : U → Rn cumpre |f ′ (x)| ≤ M para todo x ∈ U
então f satisfaz a condição de Lipschitz |f (x) − f (y)| ≤ M |x − y| para
quaisquer x, y ∈ U .
Teorema 3 (Diferenciabilidade Uniforme). Seja f : U → Rn de
classe C 1 no aberto U ⊂ Rm . Se K ⊂ U é compacto então f é unifor-
memente diferenciável em K.
108 Aplicações Diferenciáveis Cap. 5

Demonstração. Isto significa que, para todo ε > 0 dado, pode-se obter
δ > 0 tal que |v| < δ implica

|f (x + v) − f (x) − f ′ (x) · v| < ε · |v|

qualquer que seja x ∈ K. Para estabelecer este resultado, uma vez dado
ε > 0, devemos inicialmente encontrar δ > 0 com a seguinte propriedade:
para todo x ∈ K e todo v ∈ Rm com |v| ≤ δ tem-se x + v ∈ U e
|f ′ (x + v) − f ′ (x)| < ε. Ora, pelo Corolário 2 do Teorema 11, Capı́tulo 1,
existe δ > 0 tal que toda bola de centro num ponto x ∈ K e raio 2δ está
contida em U . Seja
[
L= B[x; δ] = {y ∈ Rm ; d(y, K) ≤ δ}.
x∈K

Então L é um compacto, com K ⊂ L ⊂ U . Se x ∈ K e |v| ≤ δ então


x + v ∈ L. A aplicação f ′ : L → L(Rm , Rn ) é uniformemente contı́nua.
Logo, diminuindo δ se necessário, podemos admitir que |f ′ (x + v) −
f ′ (x)| < ε para todo x ∈ K e todo v ∈ Rn com |v| < δ. Evidentemente,
isto acarreta que |f ′ (x + tv) − f ′ (x)| < ε para todo t ∈ [0, 1], pois
|tv| ≤ |v| quando 0 ≤ t ≤ 1. Cumprida esta etapa, consideremos o
caminho λ : [0, 1] → Rn , definido por λ(t) = f (x + tv), com x ∈ K e
|v| < δ. Então λ′ (t) = f ′ (x + tv) · v. Pelo Teorema Fundamental do
Cálculo para caminhos,
Z 1 Z 1

f (x + v) − f (x) = λ(1) − λ(0) = λ (t)dt = f ′ (x + tv) · v · dt.
0 0

Logo
Z 1

|f (x + v) − f (x) − f (x) · v| = [f (x + tv) − f (x)] · v · dt
′ ′ ′
0
′ ′
≤ sup |f (x + tv) − f (x)| |v| ≤ ε · |v|.
0≤t≤1

provando assim que f é uniformemente diferenciável em K.


Seção 4 Exercı́cios 109

4 Exercı́cios

Seção 1. A derivada como transformação linear

1. Seja f : Rm → Rm diferenciável, com f (0) = 0. Se a transformação linear f ′ (0)


não admite o autovalor 1, prove que existe uma vizinhança V de 0 em Rm tal
que f (x) 6= x para todo x ∈ V − {0}.

: S m→ Rn , defina sua extensão radial F : Rm+1 → Rn


2. Dada a aplicação f 
x
pondo F (x) = |x|·f se x 6= 0 e F (0) = 0. Prove que F é diferenciável no
|x|
ponto 0 ∈ Rm+1 se, e somente se, f é (a restrição a S m de) uma transformação
linear.

3. Sejam U ⊂ Rm aberto, a ∈ U e f : U → Rn uma aplicação de classe C 2 . A


′′ m m
derivada segunda de f é, por definição,
  a aplicação bilinear f (x) : R ×R →
∂ ∂f
Rn , dada por f ′′ (a) · u · v = (a). Prove que f ′′ (a) · u · v = f ′′ (a) · v · u.
∂v ∂u

4. Dado U ⊂ Rm aberto e conexo, seja f : U → Rn − {0} diferenciável. A fim


de que |f (x)| seja constante, prove que é necessário e suficiente que, para todo
x ∈ U e todo v ∈ Rm , o vetor f ′ (x) · v seja ortogonal a f (x).

Seção 2. Exemplos de derivadas

1. Seja A : U → L(Rm ; Rn ) diferenciável no aberto U ⊂ Rp . Defina f : U × Rm →


Rn pondo f (x, v) = A(x) · v. Prove que f é diferenciável, com f ′ (x, v) · (h, k) =
(A′ (x) · h) · v + A(x) · k.

2. Seja f : U → R2 definida no aberto U ⊂ R2 . Suponha que, considerada como


função complexa, f seja derivável, com f ′ (z0 ) 6= 0 para um certo z0 ∈ U .
Considere caminhos α, β : (−ε, ε) → U tais que α(0) = β(0) = z0 e α′ (0) 6= 0,
β ′ (0) 6= 0. Prove que o ângulo entre α′ (0) e β ′ (0) é igual ao ângulo entre
f ′ (z0 ) · α′ (0) e f ′ (z0 ) · β ′ (0). Noutras palavras: f preserva os ângulos entre
curvas.

3. Seja f : R2 → R3 definida por f (x, y) = (x2 , y 2 , (x + y)2 ). Mostre que f ′ (x, y) :


R2 → R3 tem posto 2 ⇔ (x, y) 6= (0, 0).

4. Seja f : R3 → R4 , f (x, y, z) = (x2 − y 2 , xy, xz, zy). Mostre que f ′ (x, y, z)


é uma transformação linear injetiva, salvo quando x = y = 0. Determine a
imagem de f ′ (0, 0, z) : R3 → R4 .

5. Mostre que o posto da derivada da aplicação f : R3 → R3 , dada por

f (x, y, z) = (x + y + z, x2 + y 2 + z 2 , x3 + y 3 + z 3 ),

tem posto p nos pontos de R3 que têm p coordenadas diferentes.


110 Aplicações Diferenciáveis Cap. 5

Seção 3. Cálculo diferencial de aplicações


1. Seja f : U → Rn diferenciável no aberto U ⊂ Rm . Se |f (x) − f (y)| ≤ M · |x − y|
para quaisquer x, y ∈ U (onde M > 0 é uma constante) então |f ′ (x)| ≤ M
para todo x ∈ U .
2. Seja U ⊂ Rm aberto. Dadas f : U → Rn g : U → Rp e T : U → L(Rn ; Rp ),
defina ϕ : U → R pondo ϕ(x) = hT (x) · f (x), g(x)i. Para x ∈ U e h ∈ Rm
quaisquer, determine ϕ′ (x) · h.
3. Sejam U ⊂ Rm , V ⊂ Rn abertos e f : U → V , g : V → Rp aplicações duas vezes
diferenciáveis. Para x ∈ U e y = f (x) ∈ V , interprete e prove a igualdade

(g ◦ f )′′ (x) = g ′′ (y) · f ′ (x) · f ′ (x) + g ′ (y) · f ′′ (x).

4. Seja U uma bola aberta de centro 0 em Rm . Dada A : U → L(Rm ; Rn ) dife-


renciável, tome x ∈ U e defina o caminho ϕ : (0, 1) → L(Rm ; Rn ) pondo ϕ(t) =
A(tx). Uma das interpretações seguintes para a fórmula ϕ′ (t) = A′ (tx) · x é
verdadeira: ϕ′ (t) · v = (A′ (tx) · x) · v ou ϕ′ (t) · v = (A′ (tx) · v) · x. Decida e
prove.
5. Seja f : U → Rn contı́nua no aberto U ⊂ Rm com [a, a + v] ⊂ U . Se f é
diferenciável em todos os pontos de (a, a + v) então, para toda T ∈ L(Rm ; Rn ),
prove que

|f (a + v) − f (a) − T · v| ≤ sup |f ′ (a + tv) − T | · |v|.


0<t<1

6. Dada f : U → R, diferenciável no aberto U ⊂ Rn , fixe a ∈ Rm e defina ϕ : U →


Rm pondo ϕ(x) = f (x) · a. Para cada x ∈ U , determine ϕ′ (x) : Rn → Rm .
6

Aplicações Inversas
e Implı́citas

1 O Teorema da Aplicação Inversa

Na página 97 do Volume 1 foi estabelecido que se f : I → R é derivável


no intervalo I ⊂ R, com f ′ (x) > 0 para todo x ∈ I, então f é uma bijeção
crescente sobre o intervalo J = f (I) e a função inversa g = f −1 : J → I
também é derivável, com g ′ (f (x)) = 1/f ′ (x). Evidentemente, resultado
análogo vale com f ′ (x) < 0, só que agora f é decrescente. Na ver-
dade, pelo Teorema de Darboux (pág. 95 do Volume 1), bastaria supor
f ′ (x) 6= 0 para todo x ∈ I para garantir que f é uma bijeção monótona
(crescente ou decrescente) de I sobre J = f (I), com f −1 : J → I de-
rivável. Nos termos da definição que será dada a seguir, isto significa que
a função diferenciável sobrejetiva f : I → J, entre intervalos I, J ⊂ R,
é um difeomorfismo se, e somente se, f ′ (x) 6= 0 para todo x ∈ I. Em
dimensões superiores esta condição significaria que f ′ (x) é um isomor-
fismo, mas seria apenas necessária para que f possuı́sse uma inversa
diferenciável.
Sejam U ⊂ Rm , V ⊂ Rn abertos. Uma aplicação f : U → V chama-
se um difeomorfismo entre U e V quando é uma bijeção diferenciável,
cuja inversa g = f −1 : V → U também é diferenciável.
Se f : U → V é um difeomorfismo, com g = f −1 : V → U , então de
g ◦ f = idU e f ◦ g = idV resulta, pela Regra da Cadeia, que g ′ (f (x)) ·
f ′ (x) = idRm e f ′ (x) · g ′ (f (x)) = idRn para todo x ∈ U , portanto
f ′ (x) : Rm → Rn é um isomorfismo cujo inverso é g ′ (f (x)) : Rn → Rm .
112 Aplicações Inversas e Implı́citas Cap. 6

Em particular, m = n, ou seja, dois abertos em espaços euclidianos de


dimensões diferentes não podem ser difeomorfos.
Exemplo 1. Resulta do Exemplop15, Capı́tulo 1, que a aplicação
f : Rm → B, definida por f (x) = x/ 1 + |x|2 , é um homeomorfismo de
Rm sobre apbola aberta B ⊂ Rm , de centro 0 e raio 1, sendo g : B → Rm ,
g(y) = y/ 1 − |y|2 o homeomorfismo inverso de f . Na verdade, como
f e g são ambas aplicações diferenciáveis, as duas são difeomorfismos,
um inverso do outro. Deve-se observar, entretanto, que nem todo ho-
meomorfismo diferenciável é um difeomorfismo, isto é, tem inverso dife-
renciável. O exemplo mais simples disto é f : R → R, com f (x) = x3 .

Como f ′ (0) = 0, a função inversa de f (que é g(x) = 3 x) não é dife-
renciável no ponto 0 = f (0).
Uma aplicação diferenciável f : U → Rm , definida no aberto U ⊂
m
R , chama-se um difeomorfismo local quando, para cada x ∈ U existe
uma bola aberta B = B(x; δ) ⊂ U tal que f aplica B difeomorficamente
sobre um aberto V contendo f (x). Segue-se daı́ que se f : U → Rm é
um difeomorfismo local então f ′ (x) : Rm → Rm é um isomorfismo, para
todo x ∈ U . O Teorema da Aplicação Inversa, que provaremos a seguir,
diz que quando f ∈ C 1 vale a recı́proca: se f ′ (x) é um isomorfismo para
todo x ∈ U então f é um difeomorfismo local.
Decorre da definição acima que um difeomorfismo local f : U → Rm
é uma aplicação aberta, isto é, a imagem f (A) de qualquer aberto A ⊂ U
é um subconjunto aberto de Rm . Com efeito, se tomarmos para cada
x ∈ A uma bola aberta Bx ⊂ A, com centro x, tal que f seja S um
m
difeomorfismo de Bx sobre um aberto Vx ⊂ R , então A = Bx e
x∈A
f (A) = f (∪Bx ) = ∪f (Bx ) = ∪Vx é uma reunião de abertos, logo é um
aberto.
Observemos ainda que o difeomorfismo local f : U → Rm é um dife-
omorfismo (global) de U sobre o aberto V = f (U ) ⊂ Rm se, e somente
se, é uma aplicação injetiva. ⊳
Exemplo 2. Seja f : R2 → R2 definida por f (x, y) = (ex cos y, ex sen y).
Evidentemente, f ∈ C ∞ . Cada reta vertical x = a é transformada por
f , com perı́odo 2π (isto é, f (a, y) = f (a, y ′ ) ⇔ y ′ − y = 2kπ, k ∈ Z),
sobre a circunferência de centro 0 e raio ea . Cada reta horizontal y = b é
levada por f , bijetivamente, sobre a semi-reta aberta que parte da origem
e passa pelo ponto (cos b, sen b) ∈ S 1 . A imagem de f é R2 − {0}. Em
termos da variável complexa z = x + iy, tem-se f (z) = ez . A aplicação
Seção 1 O Teorema da Aplicação Inversa 113

f é um difeomorfismo local (mas não global pois f (x, y + 2π) = f (x, y)).
Isto decorre do Teorema da Aplicação Inversa (Teorema 4, a seguir),
pois a matriz jacobiana
 x 
e cos y −ex sen y
Jf (x, y) = x
e sen y ex cos y

tem determinante ex , portanto 6= 0, logo f ′ (x, y) : R2 → R2 é um iso-


morfismo, para todo (x, y) ∈ R2 . Podemos também chegar à mesma
conclusão observando que se w0 = f (z0 ) então o ramo da função com-
plexa log w tal que log w0 = z0 é uma aplicação inversa local de f no
ponto w0 = f (z0 ).
Se I ⊂ R é um intervalo aberto então todo difeomorfismo local
f : I → R é um difeomorfismo (global) de I sobre J = f (I). ⊳
Teorema 1. Se o difeomorfismo f : U → V é de classe C k (k ≥ 1)
então seu inverso g = f −1 : V → U também é de classe C k .
Demonstração. (Indução em k.) Para todo y = f (x) ∈ V , temos
g ′ (y)=[f ′ (x)]−1 = [f ′ (f −1 (y))]−1 , portanto a aplicação g ′ : V →L(Rm ) =
2
Rm se exprime como a composta

g ′ = (Inv) ◦ f ′ ◦ f −1

onde Inv leva todo operador invertı́vel X : Rm → Rm no seu inverso


X −1 , f ′ : U → L(Rm ), leva todo ponto x ∈ U na derivada (invertı́vel)
f ′ (x) : Rm → Rm e f −1 : V → U é a aplicação inversa de f . Sabemos
que Inv ∈ C ∞ . Portanto, se f ∈ C k então f ′ ∈ C k−1 e, pela hipótese de
indução, f −1 ∈ C k−1 , logo g ′ ∈ C k−1 , como composta de três aplicações
de classe C k−1 . Por definição, isto significa que g ∈ C k .
Teorema 2. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rm . Se, para
algum a ∈ U , a derivada f ′ (a) : Rm → Rn é injetiva então existem δ > 0
e c > 0 tais que B = B(a; δ) ⊂ U e, para quaisquer x, y ∈ B tem-se
|f (x) − f (y)| ≥ c|x − y|. Em particular, a restrição f |B é injetiva.
Demonstração. A função u 7→ |f ′ (a) · u| é positiva em todos os pon-
tos u da esfera unitária S m−1 , a qual é compacta. Pelo Teorema de
Weierstrass, existe c > 0 tal que |f ′ (a) · u| ≥ 2c para todo u ∈ S m−1 .
Por linearidade, segue-se que |f ′ (a) · v| ≥ 2c · |v| para todo v ∈ Rm . Para
todo x ∈ U , escrevamos

r(x) = f (x) − f (a) − f ′ (a)(x − a).


114 Aplicações Inversas e Implı́citas Cap. 6

Então, para x, y ∈ U quaisquer, temos

f (x) − f (y) = f ′ (a) · (x − y) + r(x) − r(y).

Levando em conta que |u + v| ≥ |u| − |v|, segue-se que

|f (x) − f (y)| ≥ |f ′ (a) · (x − y)| − |r(x) − r(y)|


≥ 2c · |x − y| − |r(x) − r(y)|.

Observemos que a aplicação r, acima definida, é de classe C 1 , com r(a) =


0 e r′ (a) = 0. Pela continuidade de r′ , existe δ > 0 tal que |x − a| <
δ ⇒ x ∈ U e |r′ (x)| < c. A Desigualdade do Valor Médio, aplicada a
r no conjunto convexo B = B(a; δ) nos assegura que se x, y ∈ B então
|r(x) − r(y)| ≤ c|x − y|. Conseqüentemente, x, y ∈ B ⇒ |f (x) − f (y)| ≥
2c|x − y| − c|x − y|, ou seja, |f (x) − f (y)| ≥ c|x − y|, como querı́amos
demonstrar.
Teorema 3 (Diferenciabilidade do Homeomorfismo Inverso).
Seja f : U → V um homeomorfismo de classe C 1 entre os abertos U, V ⊂
Rm . Se, para algum x ∈ U , a derivada f ′ (x) : Rm → Rm é um operador
invertı́vel então o homeomorfismo inverso g = f −1 : V → U é dife-
renciável no ponto f (x), com g ′ (f (x)) = [f ′ (x)]−1 .
Demonstração. Se x, x+v ∈ U , escrevamos f (x) = y e f (x+v) = y+w.
Então
r(v)
w = f (x + v) − f (x) = f ′ (x) · v + r(v) onde lim =0 e
v→0 |v|

v = g(f (x + v)) − g(f (x)) = g(y + w) − g(y).

Para provar que f ′ (x)−1 é a derivada de g no ponto y, escrevamos

g(y + w) − g(y) = f ′ (x)−1 · w + s(w) (*)

s(w)
e mostremos que lim = 0. Entrando na igualdade (*) com as
w→0|w|
expressões de v e w acima obtidas, vem:

v = f ′ (x)−1 [f ′ (x) · v + r(v)] + s(w),

ou seja:
v = v + f ′ (x)−1 · r(v) + s(w),
Seção 1 O Teorema da Aplicação Inversa 115

donde
s(w) r(v) |v|
s(w) = −f (x)−1 · r(v), logo = −f ′ (x)−1 · · ,
|w| |v| |w|

isto é:
s(w) r(v) |v|
= −f ′ (x)−1 · · ·
|w| |v| |f (x + v) − f (x)|
r(v)
Quando w → 0, tem-se v → 0 pela continuidade de g, logo → 0.
|v|
Além disso, pelo Teorema 2, existem δ > 0 e c > 0 tais que |v| < δ
implica

|v| 1
|f (x + v) − f (x)| ≥ c|v|, portanto ≤ ·
|f (x + v) − f (x)| c
s(w)
Assim, lim = 0.
w→0 |w|

Corolário 1. Se f : U → V é um homeomorfismo de classe C k cuja


derivada f ′ (x) : Rm → Rm é invertı́vel para todo x ∈ U então seu inverso
g = f −1 : V → U é de classe C k .
Com efeito, a derivada g ′ : V → L(Rm ), dada por g ′ (y) = f ′ (g(y))−1
para cada y ∈ V , pode ser escrita como g ′ = Inv ◦ f ′ ◦ g, onde a
aplicação Inv, de classe C ∞ , é a inversão de transformações lineares
bijetivas e f ′ ∈ C k−1 . Admitindo, por indução, que g ∈ C k−1 , resulta
que g ′ ∈ C k−1 , logo g ∈ C k .
Teorema 4 (Teorema da Aplicação Inversa). Seja f : U → Rm de
classe C k (k ≥ 1) no aberto U ⊂ Rm . Se a ∈ U é tal que f ′ (a) : Rm →
Rm é invertı́vel então existe uma bola aberta B = B(a; δ) ⊂ U tal que a
restrição f |B é um difeomorfismo sobre um aberto V ∋ f (a).
Demonstração. Diminuindo δ, se necessário, no Teorema 2 podemos
admitir que B̄ = B[a; δ] ⊂ U e que f é injetiva no conjunto compacto
B̄, logo é um homeomorfismo de B sobre f (B). Além disso, como
f ′ (x) depende continuamente de x e todo operador linear suficiente-
mente próximo de um invertı́vel é também invertı́vel, podemos supor
que, para todo x ∈ B, a derivada f ′ (x) : Rm → Rm é um isomorfismo.
Pelo Teorema 3, basta então mostrar que f (B) ⊂ Rm é aberto. Seja
então q = f (p), p ∈ B. Chamando de S = S[a, δ] a esfera que é a
fronteira de B̄, a injetividade de f |B̄ assegura que q ∈
/ f (S), logo existe
116 Aplicações Inversas e Implı́citas Cap. 6

ε > 0 tal que |f (x) − q| ≥ 2ε para todo x ∈ S, pois f (S) é compacto.


Afirmamos que B(q; ε) ⊂ f (B). Com efeito, se y ∈ B(q; ε), então, pondo
g(x) = f (x) − y, o mı́nimo de |g(x)|, quando x varia no compacto B̄,
não é atingido num ponto x ∈ S pois x ∈ S ⇒ |f (x) − y| ≥ ε enquanto
|f (p) − y| = |q − y| < ε, com p ∈ B. Assim, o mı́nimo de |f (x) − y|,
x ∈ B̄ é atingido num ponto x0 ∈ B. Pelo lema a seguir, isto implica
que esse mı́nimo é zero, portanto y = f (x0 ), donde y ∈ f (B), ou seja,
B(q; ε) ⊂ f (B).
Lema 1. Sejam U ⊂ Rm aberto e g : U → Rn diferenciável no ponto
a ∈ U , com g ′ (a) : Rm → Rn sobrejetiva. Se a é um ponto de mı́nimo
local de |g(x)|, x ∈ U , então g(a) = 0.
Demonstração. Se a é um ponto de mı́nimo local para |g(x)|, será
também um ponto de mı́nimo local para a função ϕ : U → R, definida
por ϕ(x) = |g(x)|2 = hg(x), g(x)i, logo ϕ′ (a) = 0. Mas, como ϕ′ (a) · v =
2hg ′ (a) · v, g(a)i, isto significa que g(a) é ortogonal à imagem de g ′ (a), a
qual é Rn . Logo g(a) = 0.
Exemplo 3. Dadas as matrizes x , m ∈ M (n × n), diz-se que x é
uma raiz quadrada de m quando x 2 = m . Nem toda matriz m pos-
sui raiz quadrada: como det(x x2 ) = (det x )2 , uma condição necessária é
que det m ≥ 0 . Mas esta condição
 não é suficiente pois é fácil ver que,
−1 0
embora a matriz m = tenha determinante positivo, não existe
1 −1
x ∈ M (2 × 2) tal que x 2 = m . O Teorema 4 pode ser usado para mos-
trar que toda matriz próxima da identidade I n tem raiz quadrada. Com
efeito, consideremos a aplicação f : M (n × n) → M (n × n), f (x x) = x 2 ,

de classe C . Sua derivada num ponto x ∈ M (n × n) é a transformação
2 2
linear f ′ (x
x) : Rn → Rn , dada por f ′ (x x) · m = m · x + x · m . Em par-
′ 2 2
ticular, para x = I n , tem-se f (II n ) · m = 2m2m, logo f ′ (II n ) : Rn → Rn
é um isomorfismo. Segue-se do Teorema 4 que existe um aberto U em
M (n × n), contendo a matriz identidade, restrita ao qual f é um dife-
omorfismo sobre o aberto V = f (U ). Assim, para toda matriz y ∈ V ,

existe uma única matriz x = y ∈ U tal que x 2 = y . Além disso, a

aplicação f −1 : V → U , y 7→ y , é de classe C ∞ . ⊳
Corolário 2 (do Teorema 4). Seja a ∈ U um ponto crı́tico da função
f : U → R, de classe C 2 no aberto U ⊂ Rn . Se a matriz hessiana
 2 
∂ f
Hf (a) = (a)
∂xi ∂xj
Seção 2 Várias Funções Implı́citas 117

é invertı́vel então existe um aberto V , com a ∈ V ⊂ U , no qual não há


outros pontos crı́ticos de f .
Com efeito, a matriz hessiana Hf (x) é, para todo x ∈ U , a matriz
jacobiana da aplicação
 
∂f ∂f
F : U → Rn , F (x) = grad f (x) = (x), . . . , (x) .
∂x1 ∂xn

Como Hf (a) é invertı́vel, F é injetiva numa vizinhança V ∋ a, logo


F (x) 6= F (a), isto é, grad f (x) 6= 0 para todo x ∈ V − {a}.
Quando grad f (a) = 0 e Hf (a) é invertı́vel, a chama-se um ponto
crı́tico não-degenerado da função f . O corolário acima diz que os pontos
crı́ticos não-degenerados são pontos crı́ticos isolados.

2 Várias Funções Implı́citas

Os pontos do espaço Rm+n serão representados sob a forma z = (x, y),


onde x = (x1 , . . . , xm ) ∈ Rm e y = (y1 , . . . , yn ) ∈ Rn . Um difeomorfismo
h : U → V , entre abertos U, V ⊂ Rm+n , será chamado de vertical quando
for do tipo h(x, y) = (x, h2 (x, y)), ou seja, quando deixar invariante a
coordenada x. O inverso de um difeomorfismo vertical é ainda vertical.
Um difeomorfismo ϕ : U → V é usualmente interpretado como uma
transformação geométrica que aplica diferenciavelmente o conjunto U
sobre o conjunto V , de forma invertı́vel. Às vezes, porém, é conveniente
olhar para ϕ como uma mudança de coordenadas, em que as coordenadas
do ponto x ∈ U passam a ser aquelas da sua imagem y = ϕ(x) ∈
V . Sob este ponto de vista, o teorema a seguir diz que se a derivada
de uma aplicação f , de classe C k , é sobrejetiva num ponto p então é
possı́vel obter (de modo bastante simples) um sistema de coordenadas,
válido numa vizinhança aberta Z de p, tal que, em termos dessas novas
coordenadas, a aplicação f assume a expressão

(x1 , . . . , xm , w1 , . . . , wn ) 7→ (w1 , . . . , wn ).

Teorema 5 (Forma Local das Submersões). Seja f = (f1 , . . . , fn )


uma aplicação de classe C k (k ≥ 1) de um aberto U ⊂ Rm+n em Rn .
Se, num ponto p = (a, b) ∈ U , a matriz
 
∂fi
(p) (i, j = 1, . . . , n)
∂yj
118 Aplicações Inversas e Implı́citas Cap. 6

é invertı́vel então existem abertos Z ∋ p em Rm+n , V ∋ a em Rm ,


W ∋ c = f (p) em Rn e um difeomorfismo vertical h : V × W → Z, de
classe C k , tal que f (h(x, w)) = w para todo x ∈ V e todo w ∈ W .
U Rn
Z
p

f
ϕ h

V ×W W
f ◦ h : (x, w) 7→ w
c = f (p)
(a, c)

Rm
V a

Figura 6.1

Demonstração. Seja ϕ : U → Rm ×Rn a aplicação de classe C k definida


por ϕ(x, y) = (x, f (x, y)). A matriz jacobiana de ϕ tem a forma
 
I 0
Jϕ = ,
a b

onde I é a matriz identidade m × m e a matriz n × n


 
∂fi
b = b (z) = (z)
∂yj

é, no ponto p = (a, b), invertı́vel.


Pelo Teorema da Aplicação Inversa, ϕ é um difeomorfismo de um
aberto Z ∋ p sobre um aberto de Rm × Rn , o qual podemos supor da
forma V ×W , onde V ⊂ Rm e W ⊂ Rn , com a ∈ V e c = f (a, b) ∈ W . O
difeomorfismo inverso h : V ×W → Z é da forma h(x, w) = (x, h2 (x, w)).
Então, para qualquer (x, w) ∈ V × W , tem-se
(x, w)=ϕ(h(x, w))=ϕ(x, h2 (x, w))=(x, f (x, h2 (x, w)))=(x, f (h(x, w))),
logo f (h(x, w)) = w para qualquer (x, w) ∈ V × W .
Seção 2 Várias Funções Implı́citas 119

Dada f : U → Rn , de classe C k no aberto U ⊂ Rm+n , a matriz de


sua derivada f ′ (p) : Rm+n → Rn tem n linhas e m + n colunas. Ela
é a matriz jacobiana Jf (p). Dizer que a transformação linear f ′ (p) é
sobrejetiva significa afirmar que é possı́vel escolher n dessas colunas de
modo que a matriz n × n resultante seja invertı́vel. No enunciado do
teorema acima, as colunas escolhidas são as n últimas porém isto nada
tem de essencial; trata-se apenas de simplificar a notação.
Quando a aplicação f : U → Rn , com U ⊂ Rm+n , possui derivada
sobrejetiva f ′ (z) : Rm+n → Rn em todo ponto z ∈ U , diz-se que f é
uma submersão. No Teorema 5, a restrição de f ao aberto Z é uma
submersão.
Com esta terminologia, podemos enunciar o
Corolário 3. Seja f : U → Rn uma submersão de classe C k , definida
no aberto U ⊂ Rm+n . Para cada ponto z ∈ U existem abertos Z ⊂ U ,
contendo z, W ⊂ Rn contendo c = f (z), V ⊂ Rm e um difeomorfismo
h : V × W → Z de classe C k , tais que f (h(x, w)) = w para todo x ∈ V
e todo w ∈ W .
Como f ′ (z) : Rm+n → Rn é sobrejetiva, n das m + n colunas da ma-
triz jacobiana Jf (z) são linearmente independentes, logo formam uma
matriz invertı́vel n × n. Se essas forem as últimas colunas, o corolário
é meramente o Teorema 5. Se não forem, modificamos ligeiramente a
demonstração daquele teorema, permutando inicialmente as coordena-
das em Rm+n de modo que as n colunas linearmente independentes de
Jf (z) sejam agora as últimas.
Teorema 6 (Teorema das Funções Implı́citas). Seja f =
(f1 , . . . , fn ) : U → Rn de classe C k (k ≥ 1) no aberto U ⊂ Rm+n .
Suponhamos que, no ponto p = (a, b) ∈ U , com f (p) = c, a matriz
n×n  
∂fi
(p) (i, j = 1, . . . , n)
∂yj
seja invertı́vel. Então existem Z ⊂ U , aberto contendo p, V ⊂ Rm ,
aberto contendo a, e ξ : V → Rn de classe C k , com ξ(a) = b, com a
seguinte propriedade:
[(x, y) ∈ Z e f (x, y) = c] ⇔ [x ∈ V e y = ξ(x)].
A equivalência acima significa que f −1 (c)∩Z é o gráfico de ξ, isto é,
f −1 (c) ∩ Z = {(x, ξ(x)); x ∈ V }.
120 Aplicações Inversas e Implı́citas Cap. 6

Demonstração. Sejam Z, V , W e h como no Teorema 5. Definamos


ξ : V → Rn pondo ξ(x) = h2 (x, c), onde h2 : V × W → Rn é a segunda
coordenada de h, ou seja, h(x, w) = (x, h2 (x, w)). Assim, (x, y) ∈ Z ⇒
x ∈ V e (x, y) = h(x, w), w ∈ W . Se, além disso, tem-se f (x, y) = c
então c = f (x, y) = f (x, ξ(x)) e y = ξ(x). Resumindo: (x, y) ∈ Z e
f (x, y) = c implicam x ∈ V e y = ξ(x). Reciprocamente, se x ∈ V e y =
ξ(x) então y = h2 (x, c) e f (x, y) = f (x, h2 (x, c)) = f (h(x, c)) = c.
O corolário abaixo é uma reformulação mais intrı́nseca do Teorema 6.
Corolário 4. Seja f : U → Rn de classe C k no aberto U ⊂ Rm+n .
Se, no ponto p ∈ U , com f (p) = c, a derivada f ′ (p) : Rm+n → Rn é
sobrejetiva então existe um aberto Z ⊂ U , com p ∈ Z, tal que f −1 (c) ∩ Z
é o gráfico de uma aplicação ξ : V → Rn , de classe C k num aberto
V ⊂ Rm .
A abordagem clássica do Teorema das Funções Implı́citas era a se-
guinte: “Se f1 , . . . , fn são funções reais de m + n variáveis, k vezes con-
tinuamente diferenciáveis, e p = (a1 , . . . , am , b1 , . . . , bn ) é uma solução
particular do sistema de equações
f1 (x1 , . . . , xm , y1 , . . . , yn ) = c1
f2 (x1 , . . . , xm , y1 , . . . , yn ) = c2
..
.
fn (x1 , . . . , xm , y1 , . . . , yn ) = cn ,
sendo a matriz n × n  
∂fi
(p)
∂yj
invertı́vel, então as equações acima definem, de modo único, na vizi-
nhança do ponto p em Rm+n , as variáveis y1 , . . . , yn como funções de
classe C k das variáveis x1 , . . . , xm : y1 = ξ1 (x1 , . . . , xm ), . . . , yn =
ξn (x1 , . . . , xm )”.
Escrevendo x = (x1 , . . . , xm ) e ξ(x) = (ξ1 (x), . . . , ξn (x)) tem-se, para
cada i = 1, . . . , n, com x numa vizinhança de a = (a1 , . . . , am ):
fi (x, ξ1 (x), . . . , ξn (x)) = ci , ou fi (x, ξ(x)) = ci .
Derivando cada uma dessas n identidades em relação a xj , vem:
n
∂fi X ∂fi ∂ξk
+ · = 0, j = 1, . . . , m.
∂xj ∂yk ∂xj
k=1
Seção 2 Várias Funções Implı́citas 121

Em termos matriciais, isto significa que


 ∂f     ∂ξ 
1 ∂f1 ∂f1 1
...
 ∂xj   ∂y1 ∂yn   ∂xj 
 .   ..   . 
 .  = −  .. ..   
 .   . . .   .. 
 ∂fn   ∂fn ∂fn   ∂ξn 
...
∂xj ∂y1 ∂yn ∂xj
ou seja:
 ∂ξ     
1 ∂f1 ∂f1 −1 ∂f1
...
 ∂xj   ∂y1 ∂yn   ∂xj 
 .   ..   
 .  = −  .. ..
.   .. 
 .   . .   . 
 ∂ξn   ∂fn ∂fn   ∂fn 
...
∂xj ∂y1 ∂yn ∂xj
∂ξi
Isto exibe as derivadas parciais a partir de f1 , . . . , fn , sem ser
∂xj
necessário conhecer explicitamente as funções ξ1 , . . . , ξn .
Sob o ponto de vista da Álgebra Linear intrı́nseca, a fim de mostrar
como a derivada ξ ′ (x) : Rm → Rn pode ser calculada quando se conhece
f mas não ξ explicitamente, é preciso estender o conceito de derivada
parcial.
As transformações lineares
∂f ∂f
(z) : Rm → Rn e (z) : Rn → Rn ,
∂x ∂y
cujas matrizes nas bases canônicas dos espaços euclidianos em questão
são    
∂fi ∂fi
(z) ∈ M (n × m) e (z) ∈ M (n × n),
∂xj ∂yj
são chamadas as derivadas parciais de f no ponto z, relativamente à
decomposição Rm+n = Rm ⊕ Rn , obtida ao se escrever cada z ∈ Rm+n
∂f
sob a forma z = (x1 , . . . , xm , y1 , . . . , yn ). Assim, (z) é a restrição
∂x
da transformação linear f ′ (z) : Rm+n → Rn ao subespaço Rm ⊂ Rm+n
∂f
formado pelos vetores (x, 0) e (z) é a restrição de f ′ (z) ao subespaço
∂y
Rn que consiste nos vetores da forma (0, y). Para todo vetor w = (u, v) ∈
Rm+n , tem-se
∂f ∂f
f ′ (z) · w = (z) · u + (z) · v.
∂x ∂y
122 Aplicações Inversas e Implı́citas Cap. 6

Usando estas derivadas parciais, a Regra da Cadeia nos permite con-


cluir, a partir da identidade f (x, ξ(x)) = c para todo x ∈ V , que
∂f ∂f
(z) + (z) · ξ ′ (x) = 0, com z = (x, ξ(x)).
∂x ∂y
Logo
 −1
′ ∂f ∂f
ξ (x) = − (z) · (z),
∂y ∂x
ainda com z = (x, ξ(x)). Note que a hipótese do Teorema das Funções
∂f
Implı́citas assegura que a transformação linear (z) : Rn → Rn é in-
∂y
vertı́vel para todo z na vizinhança de p.
Exemplo 4. Diz-se que o número complexo c é uma raiz simples do
polinômio p quando se tem p(z) = (z − c)q(z) com q(c) 6= 0. O Teorema
6 pode ser usado para mostrar que as raı́zes simples de um polinômio
dependem diferenciavelmente dos coeficientes desse polinômio. A fim de
provar isto escrevemos, para cada a = (a0 , . . . , an ) ∈ Cn+1 = R2n+2 e
cada z ∈ C = R2 ,

pa (z) = p(a0 , . . . , an , z) = a0 + a1 z + · · · + an z n .
∂p
Então, de pa (z) = (z − c)q(z) resulta (c) = p′a (c) = q(c), logo a
∂z
∂p
matriz jacobiana (real) 2 × 2, (c), é invertı́vel, por ser a matriz da
∂z
2
transformação linear de R que consiste na multiplicação pelo número
complexo não-nulo q(c). Portanto, em virtude do Teorema 6, existem
bolas abertas B = B(a; ε) em Cn+1 e B ′ = B(c; δ) em C tais que, para
todo b ∈ B, o polinômio pb possui uma única raiz ξ(b) ∈ B ′ , a qual é
simples, e a aplicação ξ : B → R2 , assim definida, é de classe C ∞ . ⊳

3 Exercı́cios

Seção 1. O Teorema da Aplicação Inversa


1. Sejam ϕ : U → Rm de classe C 1 no aberto U ⊂ Rm e c ∈ [0, 1) tais que
|ϕ(x) − ϕ(y)| ≤ c|x − y| para quaisquer x, y ∈ U . Prove que f : U → Rm , dada
por f (x) = x+ϕ(x), é um difeomorfismo de U sobre o aberto V = f (U ) ⊂ Rm .
Se U = Rm , prove que f (U ) = Rm .
2
2. Para todo k ∈ N, prove que existem abertos U, V ⊂ M (n × n) = Rn tais que
toda matriz y ∈ V possui uma única raiz k-ésima x ∈ U , isto é, tal que x k = y .
Seção 3 Exercı́cios 123

n(n+1)
3. Seja U ⊂ R 2 o conjunto dos operadores positivos A : Rn → Rn (repre-
sentados por suas matrizes). Use o Teorema Espectral e prove que a aplicação
x) = x 2 , é um difeomorfismo C ∞ .
f : U → U , dada por f (x
4. Seja f : U → Rn de classe C 1 no aberto U ⊂ Rn , com n > 1. Se o determi-
nante jacobiano de f se anula apenas num conjunto de pontos isolados, prove
que f transforma todo aberto A ⊂ U num aberto f (A). Use este fato para
demonstrar que todo polinômio complexo não-constante p : R2 → R2 é uma
aplicação sobrejetiva, provando assim o Teorema Fundamental da Álgebra.
5. A seqüência de passos deste exercı́cio leva à conclusão de que, dados quaisquer
dois pontos a, b no aberto conexo U ⊂ Rn , existe um difeomorfismo h : U → U ,
de classe C ∞ , tal que h(a) = b. Os passos são:
 
1
5a. A função α : Rn → R, dada por α(x) = exp − se |x| < 1 e α(x) = 0
1 − |x|2
se |x| ≥ 1, é de classe C e, pondo ϕ(x) = e · α(x), tem-se ϕ : Rn → R de

classe C ∞ , com 0 < ϕ(x) ≤ 1 se |x| < 1, ϕ(0) = 1 e ϕ(x) = 0 se |x| ≥ 1.


5b. Seja c > 0 tal que c · sup · |ϕ′ (y)| · |b − a| < 1. A aplicação g : Rn → Rn ,
y∈Rn
definida por g(x) = x + ϕ(c(x − a)) · (b − a) é um difeomorfismo C ∞ tal que
g(a) = b e g(x) = x se |x − a| ≥ 1/c.
5c. Usando o Exemplo 1, vê-se que, para quaisquer pontos a, b numa bola aberta
B ⊂ Rn , existe um difeomorfismo k : B → B, de classe C ∞ tal que k(a) = b e
k(x) = x fora de um compacto K ⊂ B.
5d. Dados U ⊂ Rn aberto, conexo, e a, b ∈ U , o conjunto A dos pontos x ∈ U tais
que existe um difeomorfismo h : U → U , de classe C ∞ , com h(a) = x, é aberto
e seu complementar U − A também. Logo A = U e portanto b ∈ A.
5e. O difeomorfismo h : U → U , acima obtido, é tal que existe K ⊂ U compacto,
com h(x) = x se x ∈ U − K.
Seção 2. Várias funções implı́citas
1. Prove que toda submersão f : U → Rn de classe C 1 é uma aplicação aberta,
isto é, A ⊂ U aberto ⇒ f (A) ⊂ Rn aberto.
2. Seja f = (f1 , . . . , fn ) : U → Rn diferenciável. Prove que f é uma submersão
se, e somente se, em cada ponto x ∈ U os vetores grad f1 (x), . . . , grad fn (x)
são linearmente independentes.
2
3. Seja U ⊂ Rn um conjunto aberto de matrizes n × n. Prove que a função
det : U → R é uma submersão se, e somente se, nenhuma matriz em U tem
posto ≤ n − 2.
4. Sejam U ⊂ Rm × Rn , V ⊂ Rm abertos, f : U → Rn de classe C k (k ≥ 1),
cumprindo as condições do Teorema 6, ξ : V → Rn contı́nua e c ∈ Rn tais que,
para todo x ∈ V , tem-se (x, ξ(x)) ∈ U e f (x, ξ(x)) = c. Prove que ξ é de classe
C k . Use este resultado para provar que se ξ : V → R é contı́nua no aberto
V ⊂ R2 e, para todo (x, y) ∈ V vale (x2 + y 4 ) · ξ(x, y) + ξ(x, y)3 = 1 então
ξ ∈ C∞.
7

Superfı́cies Diferenciáveis

1 Parametrizações

Uma imersão do aberto U ⊂ Rm no espaço Rn é uma aplicação dife-


renciável f : U → Rn tal que, para todo x ∈ U , a derivada f ′ (x) : Rm →
Rn é uma transformação linear injetiva. Isto, naturalmente, só pode
ocorrer quando m ≤ n.
Quando m = n, toda imersão de classe C 1 de U ⊂ Rm em Rn é
um difeomorfismo local. Em geral, para m ≤ n quaisquer, o Teorema 2
do Capı́tulo 6 assegura que toda imersão de classe C 1 é uma aplicação
localmente injetiva.
Exemplo 1. Se I ⊂ R é um intervalo aberto, as imersões f : I → Rn
são o que chamamos no Capı́tulo 2 de caminhos regulares. Assim, por
exemplo, f : R → R2 , definida por f (t) = (t3 − t, t2 ) é uma imersão de
R no plano, a qual não é injetiva, pois f (−1) = f (1) = (0, 1). ⊳

(t3 − t, t2 )
t∈R

Figura 7.1
Seção 1 Parametrizações 125

Uma parametrização de classe C k e dimensão m de um conjunto


V ⊂ Rn é uma imersão ϕ : V0 → V de classe C k que é, ao mesmo tempo,
um homeomorfismo do aberto V0 ⊂ Rm sobre V .
Exemplo 2. Dada uma aplicação f : V0 → Rn , de classe C k no aberto
V0 ⊂ Rm , seja V = {(x, f (x)); x ∈ V0 } ⊂ Rm+n o gráfico de f . A
aplicação ϕ : V0 → V , dada por ϕ(x) = (x, f (x)), é uma parametrização
de dimensão m e classe C k do conjunto V ⊂ Rm+n . Com efeito, se
chamarmos de π : Rm+n → Rm a projeção sobre as m primeiras coor-
denadas, a igualdade π ◦ ϕ = idV0 mostra que ϕ é um homeomorfismo,
cujo inverso é a restrição π|V e, em virtude da Regra da Cadeia, que
π · ϕ′ (x) = idRm , logo ϕ′ (x) : Rm → Rm+n é injetiva, para todo x ∈ V0 ,
portanto ϕ é uma imersão. ⊳
Exemplo 3. Uma imersão ϕ : V0 → V pode muito bem ser bijetiva
sem ser um homeomorfismo, logo não é uma parametrização de V .
Um exemplo disso pode ser obtido tomando a restrição do caminho
f , visto no Exemplo 1 acima, ao intervalo (−1, +∞) ⊂ R. O caminho
ϕ : (−1, +∞) → R2 , dado por ϕ(t) = (t3 − t, t2 ), é uma imersão C ∞
bijetiva do intervalo (−1, +∞) em R2 mas não é uma parametrização da
sua imagem V pois a função inversa ϕ−1 : V → (−1, +∞) é descontı́nua
no ponto (0, 1) ∈ V . Com efeito, se (tn ) é uma seqüência decrescente
de números reais com lim tn = −1, vemos que lim ϕ(tn ) = (0, 1) = ϕ(1)
sem que se tenha lim tn = 1.

(t3 − t, t2 )
t > −1

Figura 7.2

Exemplo 4. Seja N = (0, . . . , 0, 1) o pólo norte da esfera unitária


S n = {x ∈ Rn+1 ; hx, xi = 1}. Pondo V = S n − {N } e V0 = Rn , o
homeomorfismo ϕ : V0 → V , inverso da projeção estereográfica ξ, (vide
Exemplo 16, Capı́tulo 1), é uma parametrização. Evidentemente, ϕ é
126 Superfı́cies Diferenciáveis Cap. 7

de classe C ∞ e sua inversa ξ : S n − {N } → Rn é a restrição de uma


aplicação C ∞ (cujo domı́nio é o aberto U = {x ∈ Rn+1 ; xn+1 6= 1}).
A igualdade ξ ◦ ϕ = idRn mostra, via Regra da Cadeia, que ϕ é uma
imersão, o que completa a verificação. ⊳

2 Superfı́cies diferenciáveis

Um conjunto M ⊂ Rn chama-se uma superfı́cie de dimensão m e classe


C k quando todo ponto p ∈ M está contido em algum aberto U ⊂ Rn
tal que V = U ∩ M é a imagem de uma parametrização ϕ : V0 → V , de
dimensão m e classe C k . O conjunto V é um aberto em M , chamado
uma vizinhança parametrizada do ponto p. Escreve-se m = dim ·M .
Observação. Na definição acima, supõe-se tacitamente k ≥ 1. Mas
teria sentido considerar superfı́cies de classe C 0 . Bastaria admitir “para-
metrizações de classe C 0 ”, que são meramente homeomorfismos ϕ : V0 →
V de abertos V0 ⊂ Rm sobre abertos V ⊂ M . As superfı́cies de classe
C 0 são estudadas na Topologia. Seu interesse em Análise é reduzido,
principalmente porque não possuem espaços tangentes.
Quando dim ·M = 1, a superfı́cie M chama-se uma curva.
Exemplo 5. Como R0 = {0} reduz-se a um ponto, uma superfı́cie de
dimensão 0 em Rn é simplesmente um conjunto discreto. No extremo
oposto, as superfı́cies de dimensão n em Rn são os subconjuntos abertos,
pois a imagem de uma parametrização de dimensão n em Rn é aberta,
em virtude do Teorema da Aplicação Inversa. ⊳
Exemplo 6. A esfera S n é uma superfı́cie de dimensão n e classe
C ∞ em Rn+1 . Com efeito, a inversa da projeção estereográfica é uma
parametrização ϕ : Rn → S n −{N }. Para obter uma vizinhança parame-
trizada do pólo norte N , basta considerar −ϕ : Rn → S n − {N ∗ }, onde
N ∗ = −N é o pólo sul. ⊳
Exemplo 7. O produto cartesiano M × N de duas superfı́cies M ⊂ Rn
e N ⊂ Rk é uma superfı́cie em Rn+k pois se ϕ : V0 → V ⊂ M e ψ : W0 →
W ⊂ N são parametrizações então ξ : V0 × W0 → V × W ⊂ M × N ,
dada por ξ(x, y) = (ϕ(x), ψ(y)), é uma parametrização. Evidentemente,
dim(M × N ) = dim M + dim N . Em particular, o toro m-dimensional
T m = S 1 × · · · × S 1 , produto cartesiano de m cı́rculos, é uma superfı́cie
de dimensão m e classe C ∞ em R2m . ⊳
Seção 2 Superfı́cies diferenciáveis 127

Exemplo 8. O gráfico de uma aplicação f : U → Rn , de classe C k no


aberto U ⊂ Rm , é uma superfı́cie M = {(x, f (x)) ∈ Rm+n ; x ∈ U }, de
dimensão m e classe C k em Rm+n . Com efeito, M é a imagem da única
parametrização ϕ : U → M , ϕ(x) = (x, f (x)). ⊳
Ser uma superfı́cie é uma propriedade local: se todo ponto p ∈ M
está contido num conjunto V ⊂ M , aberto em M , o qual é uma superfı́cie
de classe C k e dimensão m, então o conjunto M ⊂ Rn é uma superfı́cie
de dimensão m e classe C k .
Em particular, se M é localmente o gráfico de uma aplicação f : V0 →
Rn , de classe C k num aberto V0 ⊂Rm , então M ⊂Rm+n é uma superfı́cie
de classe C k e dimensão m. Assim, por exemplo, as hiperfı́cies, conforme
definidas no Capı́tulo 4, são superfı́cies de dimensão n − 1 em Rn .
Quando M ⊂ Rn é uma superfı́cie de dimensão m, costuma-se dizer
que M tem co-dimensão n − m. Portanto, hiperfı́cies são superfı́cies de
co-dimensão 1.
No teorema abaixo, M é uma superfı́cie de dimensão m e classe C k
em Rn . Por “uma projeção π : Rn → Rm ”entendemos uma aplicação
dada por π(x1 , . . . , xn ) = (xi1 , . . . , xim ), definida a partir da escolha de
m ı́ndices i1 < · · · < im , compreendidos entre 1 e n.
Teorema 1. Seja ϕ : V0 → V uma parametrização em M . Para cada
p = ϕ(x0 ) ∈ V existe uma projeção π : Rn → Rm tal que π ◦ ϕ aplica
um aberto Z0 , com x0 ∈ Z0 ⊂ V0 , difeomorficamente sobre um aberto
W0 ⊂ Rm .

V
M
W

ϕ
π
Rm
π ◦ϕ
x0
Z0
V0 W0

Figura 7.3
128 Superfı́cies Diferenciáveis Cap. 7

 
∂ϕi
Demonstração. A matriz jacobiana (x0 ) ∈ M (n × m) tem m
∂xj
linhas linearmente independentes, de ı́ndices i1 < i2 < ·· · < im . Essas
∂ϕik
linhas formam a matriz m × m invertı́vel J = (x0 ) e os ı́ndices ik
∂xj
definem uma projeção π : Rn → Rm . Observando que J é a matriz jaco-
biana da aplicação π ◦ ϕ : V0 → Rm , o Teorema 1 resulta imediatamente
do Teorema da Aplicação Inversa.
Corolário 1. Toda superfı́cie de classe C k é localmente o gráfico de
uma aplicação de classe C k .
Com efeito, usando a notação do Teorema 1, escrevamos os elementos
de Rn sob a forma z = (y, y ′ ), onde y = π(z). Ponhamos também
W = ϕ(Z0 ). Então a aplicação ψ = ϕ ◦ (π ◦ ϕ)−1 : W0 → W é uma
parametrização. Além disso, para todo y ∈ W0 , tem-se
π(ψ(y)) = (π ◦ ϕ) ◦ (π ◦ ϕ)−1 (y) = y, logo ψ(y) = (y, y ′ ).
Assim, W é o gráfico da aplicação de classe C k , f : W0 → Rn−m , dada
por f (y) = y ′ .
Corolário 2. Seja M ⊂ Rn uma superfı́cie de classe C k e dimensão m.
Se uma aplicação f : V0 → Rn , de classe C k no aberto V0 ⊂ Rp , tiver
sua imagem f (V0 ) contida na vizinhança W ⊂ M , parametrizada por
ψ : W0 → W , então ψ −1 ◦ f : V0 → Rm é uma aplicação de classe C k .
Com efeito, para cada ponto x0 ∈ V0 , com f (x0 ) = ψ(y0 ), existe,
pelo Teorema 1, uma projeção π : Rn → Rm tal que π ◦ ψ é um difeomor-
fismo de uma vizinhança de y0 sobre um aberto de Rm . Então, numa
vizinhança de x0 , podemos escrever
ψ −1 ◦ f = (π ◦ ψ)−1 ◦ π ◦ f,
logo ψ −1 ◦ f é de classe C k .

Sejam ϕ : V0 → V e ψ : W0 → W parametrizações numa superfı́cie


M , de classe C k e dimensão m. Suponhamos que V ∩ W 6= ∅. Então
todo ponto p ∈ V ∩ W pode escrever-se como p = ϕ(x), x ∈ V0 e, como
p = ψ(y), y ∈ W0 , pode ser representado pelos m parâmetros que são
as coordenadas de x e pelas m coordenadas de y. A correspondência
x 7→ y, definida pela relação ϕ(x) = ψ(y), é a aplicação
ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ),
chamada mudança de parametrização.
Seção 3 O espaço vetorial tangente 129

W
V

ψ
M ϕ

W0
V0
ψ −1 ◦ϕ

Rm

Figura 7.4

Corolário 3. Numa superfı́cie de classe C k , toda mudança de parame-


trização ψ −1 ◦ ϕ é um difeomorfismo de classe C k .
Com efeito, pelo Corolário 2, ψ −1 ◦ ϕ é uma aplicação de classe C k .
Pelo mesmo motivo, sua inversa ϕ−1 ◦ ψ também é de classe C k . Logo
ψ −1 ◦ ϕ é um difeomorfismo.

Exemplo 9. O conjunto M = {(x, x4/3 ); x ∈ R}, gráfico da função


f : R → R, f (x) = x4/3 , é uma curva de classe C 1 em R2 : a aplicação
ϕ : R → R2 , dada por ϕ(x) = (x, x4/3 ), é uma parametrização (global)
de M . Cabe observar, porém, que se V ⊂ M contém o ponto (0, 0), não
pode existir uma parametrização ψ : V0 → V de classe C k com k > 1.
Com efeito, se uma tal ψ existisse então o próprio conjunto V seria uma
curva de classe C k logo, pelo Corolário 1, uma vizinhança W do ponto
(0, 0), com W ⊂ V , seria o gráfico de uma função g : W0 → R, de classe
C k . Neste caso, para todo x ∈ W0 terı́amos (x, g(x)) ∈ W ⊂ M , logo
g(x) = x4/3 , mas x4/3 é apenas de classe C 1 . Assim, M não é uma curva
de classe C 2 .

3 O espaço vetorial tangente

Seja p um ponto da superfı́cie M , de dimensão m e classe C k em Rn .


O espaço vetorial tangente a M no ponto p é um subespaço vetorial
Tp M ⊂ Rn que pode ser visto sob dois aspectos:
130 Superfı́cies Diferenciáveis Cap. 7

1) Tp M é o conjunto dos vetores-velocidade v = λ′ (0) dos caminhos


diferenciáveis λ : (−ε, ε) → M , tais que λ(0) = p.

2) Tp M = ϕ′ (x0 ) · Rm é a imagem da derivada ϕ′ (x0 ) : Rm → Rn ,


onde ϕ : V0 → V é uma parametrização em M , com ϕ(x0 ) = p.
A primeira descrição de Tp M é intrı́nseca (não depende de escolhas
arbitrárias) mas não deixa claro que se trata de um subespaço vetorial de
Rn . Pela segunda descrição, Tp M é obviamente um subespaço vetorial
de Rn mas não é evidente que para outra parametrização ψ : W0 → W ,
com ψ(y0 ) = p, se tenha ψ ′ (y0 ) · Rm = ϕ′ (x0 ) · Rm .
As dúvidas ficarão sanadas se mostrarmos que os conjuntos defini-
dos em 1) e 2) são o mesmo. Para ver isto, comecemos com o vetor-
velocidade v = λ′ (0) de um caminho diferenciável λ : (−ε, ε) → M , com
λ(0) = p. Restringindo ε, se necessário, podemos admitir que a imagem
de λ esteja contida na imagem V de uma parametrização ϕ : V0 → V ⊂
M , com ϕ(x0 ) = p. Então, pelo Corolário 2, µ = ϕ−1 ◦ λ : (−ε, ε) → V0
é um caminho diferenciável em Rm , com µ(0) = x0 . Pondo u = µ′ (0),
temos

ϕ′ (x0 ) · u = ϕ′ (x0 ) · (ϕ−1 ◦ λ)′ (0) = (ϕ ◦ ϕ−1 ◦ λ)′ (0) = λ′ (0) = v.

Portanto todo vetor v = λ′ (0) pertence à imagem ϕ′ (x0 ) · Rm de Rm


pela derivada de alguma parametrização ϕ : V0 → V , com p ∈ V .
Reciprocamente, se v = ϕ′ (x0 ) · u então, como u = µ′ (0), onde
µ : (−ε, ε) → V0 é dado por µ(t) = x0 + t · u, temos v = λ′ (0) com
λ : (−ε, ε) → V , λ(t) = ϕ(µ(t)), logo v está no conjunto definido em 1).
Como toda parametrização ϕ é uma imersão, a derivada ϕ′ (x0 ) :
R → Rn é uma transformação linear injetiva, logo sua imagem ϕ′ (x0 ) ·
m

Rm = Tp M é um subespaço vetorial m-dimensional de Rn .


Os vetores
∂ϕ ∂ϕ
(x0 ) = ϕ′ (x0 ) · e1 , . . . , (x0 ) = ϕ′ (x0 ) · em
∂x1 ∂xm
formam uma base de Tp M , chamada a base associada à parametrização
ϕ.
A seguir estenderemos, para superfı́cies quaisquer, o Teorema 3 do
Capı́tulo 4, provado para o caso de co-dimensão 1.
Seja f : U → Rn uma aplicação diferenciável, definida no aberto
U ⊂ Rm+n . Um ponto c ∈ Rn chama-se um valor regular de f quando,
Seção 3 O espaço vetorial tangente 131

para todo x ∈ U tal que f (x) = c, a derivada f ′ (x) : Rm+n → Rn é uma


transformação linear sobrejetiva.
Observe-se que, para n = 1, a transformação linear f ′ (x) : Rm+1 → R
é sobrejetiva se, e somente se, é diferente de zero, ou seja, grad f (x) 6= 0.
(Vide Exemplo 2, Capı́tulo 5.) Portanto esta definição de valor regular
estende a que foi dada anteriormente.

Teorema 2. Seja c ∈ Rn um valor regular da aplicação f : U → Rn ,


de classe C k no aberto U ⊂ Rm+n . A imagem inversa M = f −1 (c) =
{x ∈ U ; f (x) = c} é uma superfı́cie de classe C k e dimensão m em
Rm+n . O espaço vetorial tangente Tp M , em cada ponto p ∈ M , é o
núcleo da derivada f ′ (p) : Rm+n → Rn .
Demonstração. Pelo Corolário 4, Capı́tulo 6, M = f −1 (c) é local-
mente o gráfico de uma aplicação de classe C k , logo é uma superfı́cie.
Além disso, para p ∈ M , todo vetor v ∈ Tp M é da forma v = λ′ (0),
onde λ : (−ε, ε) → M é um caminho diferenciável, com λ(0) = p. Logo
f ′ (p) · v = (f ◦ λ)′ (0) = 0 pois f ◦ λ : (−ε, ε) → Rn é constante, igual a c.
Portanto Tp M está contido no núcleo de f ′ (p). Como f ′ (p) é sobrejetiva,
esse núcleo tem dimensão m e então é igual a Tp M .

Exemplo 10. Seja O(Rn ) o grupo ortogonal, formado pelas matrizes


x ∈ M (n × n), tais que x · x T = I n (matrizes ortogonais). Usaremos
o Teorema 2 para mostrar que O(Rn ) é uma superfı́cie (compacta), de
2
classe C ∞ e dimensão n(n − 1)/2 em Rn . Seja então f : M (n × n) →
S(Rn ) a aplicação definida no conjunto das matrizes n × n, com valores
no conjunto S(Rn ) das matrizes simétricas n × n, pela fórmula f (x x) =
T n2
x · x . Já costumamos fazer a identificação M (n × n) = R . Agora
identificaremos S(Rn ) com Rn(n+1)/2 pois uma matriz simétrica n × n
fica determinada pelos seus elementos da diagonal e acima dela, em
número de n + (n − 1) + · · · + 2 + 1 = n(n + 1)/2. Assim, escrevemos
2
f : Rn → Rn(n+1)/2 e temos O(Rn ) = f −1 (II n ). Resta apenas verificar
que a matriz identidade I n é um valor regular de f . Tomando um ponto
arbitrário de f −1 (II n ), isto é, uma matriz ortogonal x , sabemos que a
2
derivada f ′ (x
x) : Rn → Rn(n+1)/2 é a transformação linear que a toda
2
v ∈ Rn faz corresponder f ′ (x x) · v = v · x T + x · v T . Para provar que

f (xx) é sobrejetiva, seja dada s ∈ Rn(n+1)/2 . Tomando v = sx sx/2 temos

f (xx) · v = sx · x /2 + xx · s /2 = s /2 + s /2 = s . (Lembre que s T = s .)
T T

Vale dim O(Rn ) = n2 − n(n + 1)/2 = n(n − 1)/2.


132 Superfı́cies Diferenciáveis Cap. 7

Observemos, em relação ao Exemplo 10, que o espaço vetorial tan-


gente a O(Rn ) no ponto I n é o conjunto das matrizes anti-simétricas
n × n, isto é, matrizes v tais que v + v T = 0. Com efeito, sendo a deri-
2
vada f ′ (II n ) : Rn → Rn(n+1)/2 dada por v 7→ v · I Tn + I n · v T , vemos que
o núcleo de f ′ (II n ), ou seja, o espaço vetorial tangente a O(Rn ) no ponto
I n , é o conjunto das matrizes anti-simétricas.

4 Superfı́cies orientáveis

Como no caso de hiperfı́cies (co-dimensão 1), tratado no Capı́tulo 4, cabe


observar que nem toda superfı́cie em Rn pode ser obtida como imagem
inversa de um valor regular.
Com efeito, se M = f −1 (c) 6= ∅ é a imagem inversa do valor regular
c ∈ Rn pela aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n
então, chamando de f1 , . . . , fn : U → R as funções-coordenada de f ,
vemos que grad f1 , . . . , grad fn : U → Rm+n são campos de vetores de
classe C k−1 , com as seguintes propriedades:
1) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são ortogo-
nais ao espaço vetorial tangente Tx M . (Diz-se então que os grad fi
são campos de vetores normais a M .)

2) Para todo x ∈ M , os vetores grad f1 (x), . . . , grad fn (x) são linear-


mente independentes.
A afirmação 1) resulta do fato de que, para cada i = 1, . . . , n,
a função fi : U → R é constante ao longo de M . Todo vetor v ∈
Tx M , para x ∈ M qualquer, é o vetor-velocidade v = λ′ (0) de um
caminho λ : (−ε, ε) → M , logo fi ◦ λ : (−ε, ε) → R é constante. Daı́,
h grad fi (x), vi = (fi ◦ λ)′ (0) = 0.
Por sua vez, a afirmação 2) é equivalente a dizer que c é um valor re-
gular de f , pois grad
 f1 (x), . . . , grad fn (x) são os vetores-linha da matriz
∂fi
jacobiana (x) ∈ M (n×(m+n)). Sua independência linear significa
∂xj
que esta matriz, para todo x ∈ M , tem posto n, logo f ′ (x) : Rm+n → Rn
é sobrejetiva.
Mas nem toda superfı́cie M ⊂ Rm+n , de co-dimensão n, admite n
campos contı́nuos linearmente independentes de vetores normais. Uma
condição necessária para isto é que M seja orientável, conforme mos-
traremos agora.
Seção 4 Superfı́cies orientáveis 133

Um atlas numa superfı́cie M é um conjunto de parametrizações


ϕ : V0 → V cujas imagens V cobrem M . Duas parametrizações ϕ : V0 →
V e ψ : W0 → W dizem-se compatı́veis quando V ∩ W = ∅ ou então
V ∩ W 6= ∅ e ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ) tem determinante
jacobiano positivo em todos os pontos x ∈ ϕ−1 (V ∩ W ). Um atlas A
na superfı́cie M chama-se coerente quando duas parametrizações quais-
quer ϕ, ψ ∈ A são compatı́veis. Uma superfı́cie M chama-se orientável
quando admite um atlas coerente.
Teorema 3. Se uma superfı́cie M ⊂ Rm+n , de co-dimensão n,
admite n campos contı́nuos linearmente independentes de vetores nor-
mais v1 , . . . , vn : M → Rm+n então M é orientável.
Demonstração. Seja A o conjunto das parametrizações ϕ : V0 → V em
M tais que V0 é conexo e, para todo x ∈ V0 , a matriz
 
∂ϕ ∂ϕ
Φ (x) = (x), . . . , (x), v1 (ϕ(x)), . . . , vn (ϕ(x)) ,
∂x1 ∂xm

cujas m + n colunas são os vetores de Rm+n aı́ indicados, tem determi-


nante positivo. Como V0 é conexo e os campos vi são contı́nuos, para ser
ϕ ∈ A basta que det Φ(x) > 0 para algum x ∈ V0 . Se for det Φ(x) < 0,
escrevemos x∗ = (−x1 , x2 , . . . , xm ) quando x = (x1 , x2 , . . . , xm ) e pomos
V0∗ = {x∗ ; x ∈ V0 }. Então ϕ∗ : V0∗ → V , dada por ϕ∗ (x) = ϕ(x∗ ), é uma
parametrização cuja imagem ainda é V mas det Φ ∗ (x) > 0. Isto mostra
que A é um atlas em M . Sejam ϕ, ψ ∈ A, com ϕ : V0 → V , ψ : W0 → W
e V ∩ W 6= ∅. Pondo ξ = ψ −1 ◦ ϕ : ϕ−1 (V ∩ W ) → ψ −1 (V ∩ W ), temos
ϕ = ψ ◦ ξ. A Regra da Cadeia nos dá, para x ∈ ϕ−1 (V ∩ W ), y = ξ(x)
e 1 ≤ i, j ≤ m:
m
X
∂ϕi ∂ψi
(x) = (y) · akj (x) ,
∂xj ∂yk
k=1

onde a (x) = [akj (x)] é a matriz jacobiana de ξ no ponto x. Portanto se,


para cada x ∈ ϕ−1 (V ∩ W ) e y = ξ(x), escrevermos
 
∂ψ ∂ψ
Ψ (y) = (y), . . . , (y), v1 (ψ(y)), . . . , vm (ψ(y)) ,
∂y1 ∂ym
 
a (x) 0
teremos Φ (x) = Ψ (y) · A (x), onde A (x) = é a matriz (m +
0 I
n) × (m + n) formada a partir dos blocos a (x) ∈ M (m × m) e I = matriz
134 Superfı́cies Diferenciáveis Cap. 7

identidade n×n. Então det Φ (x) = det Ψ (y)·det a (x) e daı́ det a (x) > 0.
Logo as parametrizações ϕ, ψ ∈ A são compatı́veis. O atlas A é coerente
e a superfı́cie M é orientável.
Corolário 4. Se M = f −1 (c) é a imagem inversa de um valor regular
da aplicação f : U → Rn , de classe C k no aberto U ⊂ Rm+n , então M
é uma superfı́cie m-dimensional orientável.
Assim, por exemplo, o grupo ortogonal O(Rn ) é uma superfı́cie ori-
entável.
Para co-dimensão 1, vale a recı́proca do Teorema 3. Ela resulta da
existência do produto vetorial w = v1 × · · · × vn de n vetores em Rn+1 ,
que descreveremos agora.
O produto w = v1 ×· · ·×vn é igual a zero quando os vetores v1 , . . . , vn
são linearmente dependentes. Caso contrário, w é o vetor que é orto-
gonal ao subespaço gerado por esses n vetores, tem comprimento igual
ao volume do paralelepı́pedo n-dimensional por eles determinado e seu
sentido é dado pela condição det[v1 , . . . , vn , w] > 0.
Em termos formais, seja m = [v1 , . . . , vn ] a matriz (n + 1) × n cujas
colunas são os vetores dados. Para cada i = 1, . . . , n + 1, indiquemos
com m i a matriz n × n obtida de m omitindo a i-ésima linha. Então o
produto vetorial w = v1 × · · · × vn é definido por
n+1
X
w = v1 × · · · × vn = (−1)n+i+1 det m i · ei .
i=1

O desenvolvimento de Laplace de um determinante em relação à sua


última coluna mostra que, para todo vetor z ∈ Rn+1 , tem-se

hv1 × · · · × vn , zi = det[v1 , . . . , vn , z].

Esta última igualdade mostra que, de fato, v1 × · · · × vn = w é orto-


gonal a v1 , . . . , vn , que é zero quando esses vetores são linearmente de-
pendentes e que det[v1 , . . . , vn , w] ≥ 0. Além disso, sabe-se que o volume
(n + 1)-dimensional do paralelepı́pedo cujas arestas são v1 , . . . , vn , w é o
produto do volume n-dimensional Vn de sua base (a qual tem v1 , . . . , vn
como arestas) pelo comprimento de sua altura, que é |w|, pois w é orto-
gonal a essa base. Logo

|w| · Vn = vol[v1 , . . . , vn , w] = | det[v1 , . . . , vn , w]|


= hv1 × · · · × vn , wi = |w|2 .
Seção 4 Superfı́cies orientáveis 135

Simplificando, vem |w| = Vn , ou seja, o comprimento do produto vetorial


v1 × · · · × vn é o volume n-dimensional do paralelepı́pedo cujas arestas
são os vetores v1 , . . . , vn . (Para maiores detalhes sobre o volume de um
paralelepı́pedo, ver o Apêndice a este capı́tulo.)
Concluindo estas considerações sobre o produto vetorial, mostrare-
mos agora que se {u1 , . . . , un } e {v1 , . . . , vn } são bases do subespaço
vetorial E ⊂ Rn+1 e se a = [aij ] é a matriz de passagem da primeira
Pn
para a segunda, isto é, vj = aij ui (j = 1, . . . , n), então
i=1

v1 × · · · × vn = det a · u1 × · · · × un .

Com efeito, como ambos estes produtos vetoriais são ortogonais ao


subespaço E ⊂ Rn+1 , que tem co-dimensão 1, eles são múltiplos um
do outro. Então, fixando os vetores u1 , . . . , un , definimos duas formas
n-lineares alternadas f , ∆ em E, pelas condições

v1 × · · · × vn = f (v1 , . . . , vn ) · u1 × · · · × un
Xn
e ∆(v1 , . . . , vn ) = det[aij ] se vj = aij ui , j = 1, . . . , n.
i=1

Sabe-se (v. “Álgebra Linear”, pág. 261) que as formas n-lineares


alternadas num espaço vetorial de dimensão n constituem um espaço
vetorial de dimensão 1. Logo existe c ∈ R tal que f = c · ∆, ou seja,
f (v1 , . . . , vn ) = c · det[aij ] para quaisquer v1 , . . . , vn ∈ E. Tomando
v1 = u1 , . . . , vn = un , temos f (u1 , . . . , un ) = 1 e ∆(u1 , . . . , un ) = 1, logo
c = 1 e daı́ f = ∆, isto é,

v1 × · · · × vn = det a · u1 × · · · × un ,
Xn
onde a = [aij ] e vj = aij ui , j = 1, . . . , n.
i=1

Teorema 4. Toda superfı́cie orientável de co-dimensão 1 admite um


campo contı́nuo de vetores normais não-nulos.
Demonstração. Seja M ⊂ Rn+1 orientável de dimensão n. Para toda
parametrização ϕ : V0 → V pertencente ao atlas coerente A, o qual ca-
racteriza a orientabilidade de M , definamos o campo contı́nuo de vetores
136 Superfı́cies Diferenciáveis Cap. 7

normais unitários u : V → Rn+1 pondo, em cada ponto p ∈ V , u(p) =


w(p)/|w(p)|, onde
∂ϕ ∂ϕ
w(p) = (x) × · · · × (x), x = ϕ−1 (p) ∈ V0 .
∂x1 ∂xn
Se ψ : W0 → W for outra parametrização pertencente a A então ϕ e ψ
são compatı́veis. Assim, se V ∩ W 6= ∅, para todo p ∈ V ∩ W , com
∂ψ ∂ψ
z(p) = (y) × · · · × (y), y = ψ −1 (p) ∈ W0 ,
∂y1 ∂yn
como vimos acima, temos w(p) = det a ·z(p) onde a é a matriz jacobiana,
no ponto x, da mudança de parametrização ψ −1 ◦ ϕ. Logo det a > 0 e,
conseqüentemente,
w(p) z(p)
= = u(p).
|w(p)| |z(p)|
Deste modo, o campo unitário normal u : M → Rn+1 está bem definido
e é, evidentemente, contı́nuo.
O Teorema 4 mostra que a definição de hiperfı́cie orientável dada no
Capı́tulo 4 é compatı́vel com a definição geral dada aqui.
Exemplo 11. Todo subconjunto aberto A de uma superfı́cie orientável
M é ainda uma superfı́cie orientável. Com efeito, se A é um atlas coe-
rente em M então as restrições ϕ|(V0 ∩ϕ−1 (A)) → V ∩A das parametriza-
ções ϕ : V0 → V pertencentes a A, com V ∩ A 6= ∅, formam um atlas
coerente em A. Portanto se uma superfı́cie bidimensional M contém
uma faixa de Moebius então M não é orientável. ⊳
Exemplo 12. O produto M × N de duas superfı́cies orientáveis M e N
é uma superfı́cie orientável. Com efeito, se A e B são atlas coerentes em
M e N respectivamente então as parametrizações do tipo ϕ × ξ : V0 ×
W0 → V × W , definidas por (ϕ × ξ)(x, y) = (ϕ(x), ξ(y)), onde ϕ ∈ A e
ξ ∈ B, formam um atlas em M × N , o qual é coerente pois (ψ × ζ)−1 ◦
(ϕ × ξ) = (ψ −1 ◦ ϕ) × (ζ −1 ◦ ξ) e o determinante jacobiano de (ψ −1 ◦ ϕ) ×
(ζ −1 ◦ ξ) é o produto dos determinantes jacobianos de ψ −1 ◦ ϕ e ζ −1 ◦ ξ.
Exemplo 13. Em virtude do Teorema 3, a esfera S n é uma hiperfı́cie
orientável em Rn+1 , pois admite o óbvio campo contı́nuo de vetores
normais unitários u : S n → Rn+1 , u(p) = p. Em particular, o cı́rculo
S 1 ⊂ R2 é orientável logo, pelo Exemplo 12, o toro n-dimensional T n =
S 1 × · · · × S 1 (n fatores) é uma superfı́cie orientável em R2n . ⊳
Seção 4 Superfı́cies orientáveis 137

Seja A um atlas coerente sobre a superfı́cie M . O par (M, A) chama-


se uma superfı́cie orientada. Uma parametrização ϕ : V0 → V diz-se
positiva quando é compatı́vel com todas as parametrizações ψ ∈ A.
Diz-se que ϕ é negativa quando, para toda ψ : W0 → W pertencente a
A e todo x ∈ ϕ−1 (V ∩ W ), o determinante jacobiano det J(ψ −1 ◦ ϕ)(x)
é negativo.
Numa superfı́cie orientada (M, A), duas parametrizações negativas
ϕ : V0 → V , ψ : W0 → W são sempre compatı́veis. Com efeito, dado
p = ϕ(x) ∈ V ∩ W , seja ξ : Z0 → Z pertencente a A tal que ξ(z) = p.
Então os determinantes jacobianos det J(ξ −1 ◦ ϕ)(x) e det J(ψ −1 ◦ ξ)(z)
são ambos negativos logo é positivo o seu produto

det J(ψ −1 ◦ ξ)(z) · det J(ξ −1 ◦ ϕ)(x) = det J(ψ −1 ◦ ϕ)(x).

Teorema 5. Seja (M, A) uma superfı́cie orientada. Se V ⊂ M é


conexo, toda parametrização ϕ : V0 → V é positiva ou negativa.
Demonstração: Sejam A o conjunto dos pontos p = ϕ(x) ∈ V tais
que existe ξ : W0 → W em A, com p ∈ W e det J(ξ −1 ◦ ϕ)(x) < 0,
e B o conjunto dos pontos q ∈ V para os quais existe ζ : Z0 → Z,
ζ ∈ A, com ζ(z) = q = ϕ(y) e det J(ζ −1 ◦ ϕ)(y) > 0. A e B são
abertos em V e A ∪ B = V . Além disso, A ∩ B = ∅ pois se existisse
p = ϕ(x) ∈ A∩B, terı́amos as parametrizações ξ : W0 → W , ζ : Z0 → Z,
com ξ(w) = ζ(z) = p, ambas em A e, como (ξ −1 ◦ϕ)◦(ζ −1 ◦ϕ)−1 = ξ −1 ◦ζ,
viria

det J(ξ −1 ◦ ζ)(z) = det J(ξ −1 ◦ ϕ)(x) · [det J(ζ −1 ◦ ϕ)(x)]−1 < 0

e o atlas A não seria coerente. Como V é conexo, tem-se A = ∅ (e então


ϕ é positiva) ou B = ∅ (e então ϕ é negativa).
Corolário. Se na superfı́cie M há duas parametrizações ϕ : V0 → V ,
ψ : W0 → W , com V, W conexas, tais que o determinante jacobiano
det J(ψ −1 ◦ ϕ)(x) muda de sinal quando x varia em ϕ−1 (V ∩ W ), então
M não é orientável .
Supondo, por absurdo, que existisse um atlas coerente A sobre M
então ϕ e ψ não poderiam ser ambas positivas nem ambas negativas, pois
são incompatı́veis. Tampouco pode ser uma delas, digamos ϕ, positiva
e a outra, ψ, negativa. Com efeito, se tal ocorresse, A ∪ {ϕ} seria ainda
138 Superfı́cies Diferenciáveis Cap. 7

um atlas coerente, em relação ao qual ψ não seria positiva nem negativa,


como se vê pelos sinais do determinante jacobiano de ψ −1 ◦ ϕ.
Exemplo 14. Seja M ⊂ R6 o conjunto das matrizes 2 × 3 de posto
1. Cada elemento m ∈ M será escrito sob a forma m = [u, v], onde
os vetores u, v ∈ R3 são as suas linhas. Temos M = U ∪ V , onde
U é o conjunto das matrizes m = [u, v] de posto 1 tais que u 6= 0,
enquanto V ⊂ M é definido pela condição v 6= 0. Pondo U0 = R × (R3 −
{0}) as aplicações ϕ : U0 → U e ψ : U0 → V , definidas por ϕ(t, u) =
[u, tu] e ψ(t, v) = [tv, v], são parametrizações C ∞ . A interseção U ∩ V
é o conjunto das matrizes de posto 1 com ambas as linhas não-nulas,
logo ϕ−1 (U ∩ V ) = ψ −1 (U ∩ V ) = (R − {0}) × (R3 − {0}) tem duas
componentes conexas R+ × (R3 − {0}) e R− × (R3 − {0}). A mudança
de parametrização ξ = ψ −1 ◦ ϕ : ϕ−1 (U ∩ V ) → ψ −1 (U ∩ V ) é dada
por ξ(t, x, y, z) = (1/t, tx, ty, tz). Sua matriz jacobiana em cada ponto
(t, x, y, z) ∈ ϕ−1 (U ∩ V ) é
 1 
− 2 0 0 0
 t 
 t 0 0
Jξ(t, x, y, z) =  x 
 y 0 t 0
z 0 0 t

e seu determinante é igual a −t. A mudança de parametrização ξ =


ψ −1 ◦ ϕ tem, portanto, jacobiano negativo em R+ × (R3 − {0}) e positivo
em R− × (R3 − {0}). Segue-se do Teorema 5 que M é uma superfı́cie
C ∞ , não-orientável, de dimensão 4 em R6 . ⊳
Exemplo 12a. Vale a recı́proca do que foi visto no Exemplo 12: se
M × N é orientável, então M e N são ambas superfı́cies orientáveis.
Com efeito, seja A um atlas coerente em M × N . Fixemos, de uma vez
por todas, uma parametrização ξ : Z0 → Z ⊂ N , com Z conexo. Seja
B o conjunto das parametrizações ϕ : V0 → V ⊂ M tais que V é conexo
e ϕ × ξ : V0 × Z0 → V × Z ⊂ M × N é uma parametrização positiva.
Afirmamos que B é um atlas em M . Com efeito, dado qualquer ponto
p ∈ M , seja ϕ : V0 → V uma parametrização com V conexo e p ∈ V . Se
ϕ×ξ : V0 ×Z0 → V ×Z for positiva, temos ϕ ∈ B. Se, entretanto, ϕ×ξ for
negativa então, como na demonstração do Teorema 3, consideramos a pa-
rametrização ϕ∗ : V0∗ → V , dada por ϕ∗ (x1 , . . . , xm ) = ϕ(−x1 , . . . , xm )
e vemos que ϕ∗ × ξ : V0∗ × Z0 → V × Z é positiva, logo ϕ ∈ B. Além
disso, o atlas B é coerente pois se ϕ : V0 → V e ψ : W0 → W pertencem
Seção 5 Multiplicadores de Lagrange 139

a B, com V ∩ W 6= ∅, então, pondo α = (ψ × ξ)−1 ◦ (ϕ × ξ), temos


α = (ψ −1 ◦ ϕ) × id. Então o determinante jacobiano de ψ −1 ◦ ϕ é igual
ao de α, que é positivo. Portanto o atlas B é coerente e M é orientável.
Analogamente para N .

5 Multiplicadores de Lagrange

Estenderemos agora, para co-dimensão n qualquer, o método dos mul-


tiplicadores de Lagrange, apresentado no Capı́tulo 4 no caso em que a
superfı́cie ϕ−1 (c) tem co-dimensão 1, logo há apenas um multiplicador.
São dadas uma superfı́cie M , de dimensão m e classe C k , e uma
função f : U → R, de classe C k no aberto U , com M ⊂ U ⊂ Rm+n .
Quer-se determinar o conjunto dos pontos crı́ticos da restrição f |M .
Diz-se que p ∈ M é um ponto crı́tico da restrição f |M quando,
para todo caminho diferenciável λ : (−ε, ε) → M , com λ(0) = p, tem-se
(f ◦ λ)′ (0) = 0.
Como λ′ (0) = v ∈ Tp M e portanto

∂f
(f ◦ λ)′ (0) = (p) = h grad f (p), vi,
∂v

concluı́mos que p ∈ M é ponto crı́tico de f |M se, e somente se, grad f (p)


é ortogonal a todos os vetores v ∈ Tp M , tangentes a M no ponto p, ou
seja, grad f (p) ∈ [Tp M ]⊥ .
Se p ∈ M é um ponto de mı́nimo (ou máximo) local da restrição
f |M e λ : (−ε, ε) → M é um caminho diferenciável com λ(0) = p então
0 é um ponto de mı́nimo (ou máximo) local de f ◦ λ : (−ε, ε) → R, logo
(f ◦ λ)′ (0) = 0 e então p é um ponto crı́tico de f |M .
Exemplo 15. Dada a superfı́cie M ⊂ Rm+n e fixado um ponto a ∈
Rm+n , suponhamos que exista, entre os pontos de M , (pelo menos) um
ponto p situado a uma distância mı́nima de a. Considerando a função
f : Rm+n → R, dada por f (x) = |x − a|2 , vemos que p é um ponto
de mı́nimo da restrição f |M . Logo grad f (p) é um vetor ortogonal a
Tp M . Mas grad f (p) = 2 · (p − a). Portanto os pontos p ∈ M situados
à distância mı́nima do ponto a são aqueles tais que o vetor p − a é
ortogonal a Tp M . Evidentemente, vale o mesmo para os pontos de M
mais afastados de a, caso existam (como ocorre quando M é compacta).

140 Superfı́cies Diferenciáveis Cap. 7

Suponhamos agora que a superfı́cie M = ϕ−1 (c) seja obtida como


imagem inversa do valor regular c da aplicação ϕ : U → Rn , de classe
C k no aberto U ⊂ Rm+n . Se escrevermos ϕ(x) = (ϕ1 (x), . . . , ϕn (x)),
a afirmação de que c é um valor regular de ϕ significa que os veto-
res grad ϕ1 (x), . . . , grad ϕn (x) são linearmente independentes para todo
x ∈ U tal que ϕ(x) = c.
Com efeito, esses n vetores são as linhas da matriz jacobiana Jϕ(x) ∈
M (n × (m + n)), a qual tem posto n por ser a matriz da transformação
linear sobrejetiva ϕ′ (x) : Rm+n → Rn .
Além disso, conforme já vimos no inı́cio da Seção 4, em todo ponto
x ∈ M = ϕ−1 (c), os vetores grad ϕ1 (x), . . . , grad ϕn (x) são ortogonais a
Tx M , portanto formam uma base do complemento ortogonal [Tx M ]⊥ .
Podemos então enunciar o
Método dos multiplicadores de Lagrange. Sejam f : U → R uma
função de classe C k no aberto U ⊂ Rm+n e M = ϕ−1 (c) a imagem
inversa do valor regular c pela aplicação ϕ : U → Rn , de classe C k . A
fim de que p ∈ M seja um ponto crı́tico da restrição f |M é necessário
e suficiente que existam números λ1 , . . . , λn tais que

grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p).

Os números λ1 , . . . , λn são chamados multiplicadores de Lagrange.


De fato, p é ponto crı́tico de f |M se, e somente se, grad f (p) é orto-
gonal a Tp M . Como {grad ϕ1 (p), . . . , grad ϕn (p)} é uma base do com-
plemento ortogonal de Tp M em Rm+n , dizer que grad f (p) ∈ [Tp M ]⊥
equivale a afirmar que grad f (p) é combinação linear dos gradientes
grad ϕ1 (p), . . . , grad ϕn (p).
Seja c = (c1 , . . . , cn ). Para encontrar os pontos crı́ticos p da restrição
f |M , devemos resolver o sistema abaixo, de m+2n equações com m+2n
incógnitas. (As incógnitas são as m + n coordenadas de p mais os n
multiplicadores λi .):
(
ϕ1 (p) = c1 , . . . , ϕn (p) = cn
grad f (p) = λ1 · grad ϕ1 (p) + · · · + λn · grad ϕn (p).

A última equação acima é vetorial. Ela equivale às m + n equações


numéricas
∂f ∂ϕ1 ∂ϕn
(p) = λ1 · (p) + · · · + λn · (p), j = 1, . . . , m + n.
∂xj ∂xj ∂xj
Seção 5 Multiplicadores de Lagrange 141

Exemplo 16. Seja A : Rm → Rn uma transformação linear. P Defina


m n ∗
f : R × R → R pondo f (x, y) = hA · x, yi = hx, A · yi = aij xj yi
(1 ≤ i ≤ n, 1 ≤ j ≤ m). Considerando o valor regular (1,1) da aplicação
ϕ : Rm × Rn → R2 , dada por ϕ(x, y) = (|x|2 , |y|2 ), seja M = S m−1 ×
S n−1 = ϕ−1 (1, 1). Vejamos quais são os pontos crı́ticos da restrição
f |M .
Para todo (x, y) ∈ Rm × Rn , temos grad f (x, y) = (A∗ · y, A · x) ∈
R × Rn . Além disso, ϕ = (ϕ1 , ϕ2 ), com grad ϕ1 (x, y) = (2x, 0) e
m

grad ϕ2 (x, y) = (0, 2y). Por conveniência, tomemos λ/2 e µ/2 como
multiplicadores de Lagrange. Um ponto p = (x, y) ∈ M é crı́tico para
f |M se, e somente se,

λ µ
grad f (x, y) = · grad ϕ1 (x, y) + · grad ϕ2 (x, y),
2 2

ou seja, (A∗ y, Ax) = (λx, µy). Isto nos dá A · x = µ · y e A∗ y = λ · x,


donde µ = hµ · y, yi = hAx, yi = hx, A∗ yi = hx, λ · xi = λ.
Portanto, os pontos crı́ticos de f |M são os pontos (x, y) ∈ S m−1 ×
S n−1 tais que Ax = λy e A∗ y = λx para um certo λ ∈ R. Notemos
que então λ = f (x, y) e que z ⊥ x ⇒ Az ⊥ y. Assim, se escrevermos
E = {z ∈ Rm ; hz, xi = 0} = complemento ortogonal de x em Rm , e F =
complemento ortogonal de y em Rn , a transformação linear A : Rm → Rn
aplica E em F .
Seja então p1 = (u1 , v1 ) ∈ S m−1 × S n−1 o ponto em que a função
f assume seu valor máximo em S m−1 × S n−1 : f (u1 , v1 ) = λ1 . Então
p1 é ponto crı́tico de f |M . Temos Au1 = λ1 · v1 e A∗ v1 = λ1 · u1 .
Como f (x, −y) = −f (x, y), vemos que λ1 ≥ 0. Se A 6= 0 então f não é
identicamente nula em M , logo λ1 > 0.
Em seguida consideremos A como uma transformação linear A : E →
F , agora com dim E = m−1 e dim F = n−1. Prosseguindo por indução,
chegaremos ao seguinte resultado:

Teorema dos Valores Singulares. Seja A : Rm → Rn uma trans-


formação linear de posto r. Existem bases ortonormais {u1 , . . . , um } ⊂
Rm e {v1 , . . . , vn } ⊂ Rn tais que Aui = λi vi e A∗ vi = λi ui , onde λi > 0
para i = 1, . . . , r e λi = 0 para i ≥ r + 1.

Os números λ1 > 0, . . . , λr > 0 são chamados os valores singulares


de A.
142 Superfı́cies Diferenciáveis Cap. 7

6 Aplicações diferenciáveis entre superfı́cies

Seja M ⊂ Rn uma superfı́cie de dimensão m e classe C k . Uma aplicação


f : M → Rs diz-se de classe C r (r ≤ k) quando, para toda parame-
trização ϕ : V0 → V , de classe C k em M , a composta f ◦ ϕ : V0 → Rs é
de classe C r no aberto V0 ⊂ Rm .
Se ϕ : V0 → V e ψ : W0 → W são parametrizações de classe C k
em M , com V ∩ W 6= ∅, então segue-se do Corolário 2 que f ◦ ϕ =
(f ◦ ψ) ◦ (ψ −1 ◦ ϕ) é de classe C r se, e somente se, f ◦ ψ o é. Daı́ resulta
que a definição acima dada é consistente.
Dada outra superfı́cie N ⊂ Rs , diremos que a aplicação f : M → N
é de classe C r quando, considerada como aplicação de M em Rs , f for
de classe C r conforme a definição. A fim de que tal ocorra é necessário
e suficiente que, para todo p ∈ M e toda parametrização ψ : W0 → W
em N , com q = f (p) ∈ W , exista uma parametrização ϕ : V0 → V , com
p ∈ V , f (V ) ⊂ M e ψ −1 ◦ f ◦ ϕ : V0 → W0 ⊂ Rm seja de classe C r .
Novamente, admitindo que M e N são de classe C k com k ≥ r, esta
definição independe das escolhas de ϕ e ψ.
Seja f : M → N de classe C 1 . A derivada de f no ponto p é a
transformação linear

f ′ (p) : Tp M → Tq N, q = f (p),

assim definida: todo vetor v ∈ Tp M é o vetor velocidade v = λ′ (0) de


um caminho λ : (−ε, ε) → V , com λ(0) = p. Então pomos f ′ (p) · v =
(f ◦ λ)′ (0).

v w
λ
N f ◦λ
p q
f
M

w = f ′ (p) · v

Figura 7.5

Se ϕ : V0 → V ⊂ M é uma parametrização C 1 com ϕ(x0 ) = p então


v = ϕ′ (x0 ) · v0 , v0 ∈ Rm , e f ′ (p) · v = (f ◦ ϕ)′ (x0 ) · v0 . Isto mostra que
f ′ (p) é linear.
Seção 6 Aplicações diferenciáeis entre superfı́cies 143

Vale a Regra da Cadeia: se f : M → N e g : N → P são de classe C r


então g ◦ f : M → P é de classe C r , com (g ◦ f )′ (p) = g ′ (f (p)) · f ′ (p).
Diz-se que f : M → N é um difeomorfismo de classe C r quando f
possui uma inversa g : N → M que também é de classe C r . Neste caso,
para cada ponto p ∈ M , a derivada f ′ (p) : Tp M → Tq N , q = f (p), é
um isomorfismo, cujo inverso é g ′ (q) : Tq N → Tp M .
Se, para um certo p ∈ M , a derivada f ′ (p) : Tp M → Tq N é um
isomorfismo então resulta facilmente do Teorema da Aplicação Inversa
que f aplica difeomorficamente uma vizinhança aberta U de p em M
sobre uma vizinhança aberta V = f (U ) de q = f (p) em N .
Se f ′ (p) é um isomorfismo para todo p ∈ M , diz-se que f : M → N
é um difeomorfismo local. Então a aplicação f leva abertos de M em
abertos de N e, se for bijetiva, é um difeomorfismo entre M e N . A
função de Euler f : R → S 1 , definida por E(t) = (cost, sent), é um
difeomorfismo local. Sua restrição a qualquer intervalo aberto (a, a+2π)
de comprimento 2π é um difeomorfismo desse intervalo sobre S 1 − {p},
p = E(a).
Exemplo 17. O exemplo mais óbvio de uma aplicação diferenciável (de
classe C k ) f : M → Rs é a restrição a M de uma aplicação F : U → Rs
de classe C k num aberto U , com M ⊂ U ⊂ Rn .
Exemplo 18. Seja M ⊂ Rn+1 uma hiperfı́cie orientável de classe C k
(k ≥ 2). Se u : M → Rn+1 é um campo contı́nuo de vetores unitários
normais a M , então u é uma aplicação de classe C k−1 . (Vide Teo-
rema 4.) Com efeito, para cada parametrização ϕ : V0 → V ⊂ M , de
∂ϕ ∂ϕ
classe C k , pondo v(ϕ(x)) = (x) × · · · × (x), temos u(ϕ(x)) =
∂x1 ∂xn
±v(ϕ(x))/|v(ϕ(x))| para cada x ∈ V0 pois u e v, sendo ambos ortogo-
nais a Tϕ(x) M , são colineares. Se V0 (e portanto V ) for conexo, teremos
u = v/|v| ou u = −v/|v| em todos os pontos de V , logo u ∈ C k−1 .
Exemplo 19. Seja M = R2 − {0}. A aplicação f : M → R3 , definida
por f (z) = z |z|, log |z| , é um difeomorfismo C ∞ sobre o cilindro
S 1 × R ⊂ R3 . Seu inverso é g : S 1 × R → R2 − {0}, onde g(w, t) = et · w.
De modo análogo se tem um difeomorfismo C ∞ entre Rn+1 − {0} e
S n × R.
Exemplo 20. (Aplicação normal de Gauss.) Um campo contı́nuo de
vetores unitários normais numa hiperfı́cie orientável M ⊂ Rn+1 , de
classe C k (k ≥ 2) é uma aplicação de classe C k−1 , u : M → S n , cha-
mada a aplicação normal de Gauss. Em cada ponto p ∈ M , tem-se
144 Superfı́cies Diferenciáveis Cap. 7

Tp M = Tu(p) S n pois estes espaços vetoriais são o complemento ortogo-


nal do vetor u(p) em Rn+1 . Portanto a derivada u′ (p) é um operador
linear em Tp M , o qual é auto-adjunto. Para provar isto, tomamos uma
parametrização ϕ : V0 → V ⊂ M , com ϕ(x) = p, consideramos a base
∂ϕ ∂ϕ
{ ∂x 1
(x), . . . , ∂x n
(x)} ⊂ Tp M , e mostramos que

∂ϕ ∂ϕ ∂ϕ ∂ϕ
hu′ (p) · (x), (x)i = h (x), u′ (p) · (x)i, i, j = 1, . . . , n (*)
∂xi ∂xj ∂xi ∂xj

Com efeito, para todo x ∈ V0 e todo j = 1, . . . , n, vale a igualdade


∂ϕ
hu(ϕ(x)), (x)i = 0.
∂xj

Derivando ambos os membros em relação a xi vem:

∂ϕ ∂ϕ ∂2ϕ
hu′ (p) · (x), (x)i + hu(p), (x)i = 0
∂xi ∂xj ∂xi ∂xj

(onde p = ϕ(x)). Trocando os papéis de i e j, resulta então do Teorema


de Schwarz que valem as igualdades (*) e u′ (p) é auto-adjunto. Os auto-
valores k1 , . . . , kn do operador u′ (p) chamam-se as curvaturas principais
da hiperfı́cie M no ponto p e o produto k1 · k2 · · · kn = det ·u′ (p) = K(p)
é chamado a curvatura gaussiana de M nesse ponto.

APÊNDICE

O volume de um paralelepı́pedo

Sejam v1 , . . . , vr vetores linearmente independentes em Rn . O pa-


ralelepı́pedo (r-dimensional) P = P (v1 , . . . , vr ) que tem esses vetores
Pr
como arestas é o conjunto das combinações lineares ti vi , com 0 ≤
i=1
ti ≤ 1.
O volume r-dimensional do paralelepı́pedo P = P (v1 , . . . , vr ) é defi-
nido por indução sobre r. Se r = 1, pomos vol P (v1 ) = |v1 |. Supondo
definido o volume (r − 1)-dimensional, pomos

vol P (v1 , . . . , vr ) = |h| · vol P (v2 , . . . , vr ),


Seção 6 Aplicações diferenciáeis entre superfı́cies 145

onde h ∈ Rn é o vetor-altura de P , ou seja, h = v1 − pr.v1 , sendo


pr.v1 a projeção ortogonal de v1 sobre o subespaço E ⊂ Rn gerado por
v2 , . . . , vr .
O vetor-altura h é ortogonal a v2 , . . . , vr , a diferença v1 − h pertence
ao subespaço E que tem v2 , . . . , vr como base e estas duas propriedades
caracterizam h.
Provaremos, a seguir, que o volume do paralelepı́pedo P é a raiz
quadrada do determinante da matriz de Gram

g = g (v1 , . . . , vr ) = [hvi , vj i] ∈ M (r × r).

Começaremos observando que, se fixarmos arbitrariamente uma base


ortonormal no subespaço de Rn gerado por e1 , . . . , er e considerarmos
a matriz m ∈ M (r × r) cujas colunas são as coordenadas dos vetores
v1 , . . . , vr relativas a essa base, então tem-se

det[hvi , vj i] = (det m )2 .

Esta igualdade é imediata se notarmos que, segundo a definição de


produto de matrizes, tem-se g (v1 , . . . , vr ) = m ⊤ · m , onde m ⊤ é a trans-
posta de m . Portanto det[hvi , vj i] = det g = det m ⊤ · det m = (det m )2 .
Daı́ resultam dois fatos. O primeiro é que det m não depende da
base ortonormal que foi arbitrariamente escolhida no subespaço gerado
por v1 , . . . , vr . O segundo é que det g (v1 , . . . , vr ) = det g (h, v2 . . . , vr )
pois h = v1 −pr.v1 e o determinante de m não se altera quando se subtrai
da coluna v1 uma combinação linear das demais colunas. Deste modo,
temos (por indução):

[vol P (v1 , . . . , vr )]2 = |h|2 · [vol P (v2 , . . . , vr )]2 =


= hh, hi · det g (v2 , . . . , vr ) = det g (h, v2 , . . . , vr ) =
= det g (v1 , . . . , vr ),

sendo a penúltima igualdade devida ao fato de que a primeira linha


e a primeira coluna da matriz g (h, v2 , . . . , vr ) têm hh, hi como único
elemento não-nulo.
Portanto, se v1 , . . . , vn ∈ Rn e indicamos com a notação [v1 , . . . , vn ]
a matriz n × n cujo j-ésimo vetor-coluna é vj então o volume do pa-
ralelepı́pedo cujas arestas são v1 , . . . , vn é igual a | det[v1 , . . . , vn ]|.
Além disso, o quadrado desse volume é igual ao determinante da
matriz de Gram g (v1 , . . . , vn ), cujo ij-ésimo elemento é hvi , vj i.
146 Superfı́cies Diferenciáveis Cap. 7

7 Exercı́cios
Seção 2. Superfı́cies diferenciáveis
1. Prove que toda superfı́cie M ⊂ Rm+n de classe C k é localmente a imagem
inversa de um valor regular de uma aplicação f : U → Rn , de classe C k num
aberto U ⊂ Rm+n . Conclua que todo ponto p ∈ M pertence a um aberto V ⊂
M , imagem de uma parametrização ϕ : V0 → V , de classe C k , no qual estão
definidos n campos vetoriais v1 , . . . , vn : V → Rm+n tais que v1 ◦ ϕ, . . . , vn ◦ ϕ :
V0 → Rm+n são de classe C k−1 e, para cada q ∈ V , v1 (q), . . . , vn (q) são
linearmente independentes e ortogonais a Tq M .
2. Seja M ⊂ Rn de classe C k e dimensão m. Prove que o conjunto T M =
{(p, v) ∈ Rn ×Rn ; p ∈ M, v ∈ Tp M } é uma superfı́cie de classe C k−1 e dimensão
2m, chamada o fibrado tangente de M .
3. Com a notação do exercı́cio anterior, seja νM = {(p, v) ∈ Rn × Rn ; p ∈ M,
v ∈ Tp M ⊥ }. Prove que νM é uma superfı́cie de classe C k−1 e dimensão n,
chamada o fibrado normal de M em Rn .
4. Mostre que o conjunto M das matrizes 4 × 4 de posto 2 é uma superfı́cie C ∞
de dimensão 12 em R16 . Generalize para matrizes m × n de posto k.
Seção 3. O espaço vetorial tangente
1. Dada uma superfı́cie M ⊂Rn , de classe C k e dimensão m, considere um ponto
p∈M e duas parametrizações ϕ : V0 →V , ψ : W0 →W em M , com p∈V ∩W .
Seja [aij ] a matriz jacobiana, no ponto x0 = ϕ−1P (p), do difeomorfismo ψ −1 ◦
−1 −1 m ∂ψ ∂ϕ
ϕ : ϕ (V ∩ W ) → ψ (V ∩ W ). Mostre que i=1 aij ∂yi (y0 ) = ∂xj (x0 ),
onde ψ(y0 ) = p. [Noutras palavras: [aij ] é a matriz de passagem da base
∂ψ ∂ψ ∂ϕ ∂ϕ
{ ∂y1
(y0 ), . . . , ∂ym
(y0 )} para a base { ∂x 1
(x0 ), . . . , ∂x m
(x0 )} em Tp M .]
2. Seja λ : [a, b] → M um caminho na superfı́cie M ⊂ Rn , com λ(a) = p.
Dada uma base ortonormal {u1 , . . . , um } ⊂ Tp M , prove que existem aplicações
contı́nuas v1 , . . . , vm : [a, b] → Rn tais que v1 (a) = u1 , . . . , vm (a) = um e, para
cada t ∈ [a, b], {v1 (t), . . . , vm (t)} é uma base ortonormal em Tλ(t) M .
3. Dado um caminho λ : [a, b] → M na superfı́cie M ⊂ Rm+n , seja {u1 , . . . , un } ⊂
Tp M ⊥ , com p = λ(a), uma base ortonormal do complemento ortogonal de Tp M
em Rm+n . Prove que existem v1 , . . . , vn : [a, b] → Rm+n contı́nuas, tais que,
para todo t ∈ [a, b], {v1 (t), . . . , vn (t)} é uma base ortonormal de [Tλ(t) M ]⊥ .
4. Use o Exercı́cio 2 e indução para provar que, dadas duas bases ortonormais
{u1 , . . . , un } e {w1 , . . . , wn } em Rn , se as matrizes n × n cujas colunas são
esses vetores têm determinantes de mesmo sinal, então existem n aplicações
contı́nuas v1 , . . . , vn : [0, 2] → Rn tais que vi (0) = ui , vi (2) = wi (i = 1, 2, . . . , n)
e, para cada t ∈ [0, 2], {v1 (t), . . . , vn (t)} ⊂ Rn é uma base ortonormal. Conclua
daı́ que o conjunto SO(Rn ) das matrizes ortogonais n × n com determinante
igual a 1 é conexo.

Seção 4. Superfı́cies orientáveis


1. Sejam ϕ : U0 → U , ψ : V0 → V , ξ : W0 → W parametrizações na superfı́cie M .
Suponha que M = U ∪ V ∪ W , que U ∩ V ∩ W 6= ∅ e que o determinante
Seção 7 Exercı́cios 147

jacobiano de cada uma das mudanças de coordenadas ψ −1 ◦ ϕ, ξ −1 ◦ ϕ e ξ −1 ◦ ψ


tem sinal constante. Prove que M é orientável.
2. Use o exercı́cio anterior para provar que o conjunto M das matrizes 3 × 3 de
posto 1 é uma superfı́cie orientável de dimensão 5 em R9 .
3. Prove que o fibrado tangente T M e o fibrado normal νM de qualquer superfı́cie
são sempre orientáveis. (V. Exercı́cios 2 e 3, Seção 2.)
4. Seja f : R3 → R4 definida por f (x, y, z) = (x2 − y 2 , xy, xz, yz). Prove que
P = f (S 2 ) é uma superfı́cie C ∞ de dimensão 2, compacta e não-orientável em
R4 . (P é conhecida como o plano projetivo.)

Seção 6. Aplicações diferenciáveis entre superfı́cies


1. Prove que o homeomorfismo h : S 1 × R → R2 − {0}, dado por h(z, t) = et · z,
é um difeomorfismo.
2. Use o difeomorfismo do exercı́cio anterior para provar que o toro n-dimensional
T = S 1 × · · · × S 1 = (S 1 )n é difeomorfo a uma hiperfı́cie em Rn+1 .
3. Seja f : M → N um difeomorfismo local. Se N é orientável, prove que M
também é.
2 2
4. Sejam G ⊂ Rm e H ⊂ Rn superfı́cies que são grupos em relação à multi-
plicação de matrizes. Se f : G → H é um homomorfismo diferenciável, prove
que o posto da derivada f ′ (x) : Tx G → Tf (x) H não depende do ponto x ∈ G.
8

Integrais Múltiplas

1 A definição de integral

Um bloco n-dimensional A ⊂ Rn é um produto cartesiano


n
Y
A= [ai , bi ] = [a1 , b1 ] × · · · × [an , bn ]
i=1

de n intervalos compactos [ai , bi ], chamados suas arestas. O produto


Qn
cartesiano (ai , bi ) dos intervalos abertos (ai , bi ) chama-se bloco n-
i=1
dimensional aberto. Quando todas as arestas do bloco A têm o mesmo
comprimento a = bi −ai , diz-se que A é um cubo n-dimensional . Quando
n = 1, os blocos são simplesmente intervalos. Se n = 2, o bloco reduz-se
a um retângulo e o cubo a um quadrado.
Q Q
n
Uma face do bloco A = [ai , bi ] é um conjunto do tipo F = Li
i=1
onde, para cada i = 1, . . . , n, tem-se Li = {ai }, Li = {bi } ou Li = [ai , bi ].
Diz-se que a face F tem dimensão r quando exatamente r dos fatores
Li são iguais a [ai , bi ]. As faces de dimensão zero, isto é, os pontos da
forma v = (c1 , . . . , cn ), onde ci = ai ou ci = bi para cada i = 1, . . . , n,
são chamadas os vértices do bloco.
Q
n
O volume n-dimensional do bloco A = [ai , bi ] é, por definição, o
i=1
Q
n
produto (bi − ai ) dos comprimentos de suas arestas. Este é também
i=1
Q
n
o volume do bloco aberto (ai , bi ).
i=1
Seção 1 A definição de integral 149

Q
n
Uma partição do bloco A = [ai , bi ] é um produto cartesiano
i=1
P = P1 × · · · × Pn , onde cada Pi é uma partição do intervalo [ai , bi ]
(cfr. Vol. 1, Cap. 10, §2). Diz-se que a partição Q = Q1 × · · · × Qn
refina a partição P quando se tem P ⊂ Q. Isto equivale a dizer que
P1 ⊂ Q1 , . . . , Pn ⊂ Qn .
A partição P decompõe o bloco A numa reunião de sub-blocos
B = I1 × · · · × In , onde cada Ij é um intervalo da partição Pj de
[aj , bj ]. Estes sub-blocos B ⊂ A chamam-se os blocos da partição P .
Escreve-se então B ∈ P . Se a partição Q refina P então cada bloco de
P é a reunião dos blocos de Q nele contidos.
Se B, B ′ são blocos da partição P , a interseção B ∩ B ′ é uma face
comum a B e B ′ ou é vazia.
Dada a partição P = P1 × · · · × Pn do bloco A, como o comprimento
bi − ai de cada aresta de A é a soma dos comprimentos dos intervalos da
partição Pi , segue-se da propriedade distributiva da multiplicação que
o volume do bloco A é a soma dos volumes dos blocos B da partição P .
Logo, quando Q refina P , o volume de cada bloco de P é a soma dos
volumes dos blocos de Q nele contidos.
Se P = P1 × · · · × Pn e Q = Q1 × · · · × Qn são partições do bloco A,
existem partições de A que refinam ao mesmo tempo P e Q. Uma delas
Q
n
é R = (Pi ∪ Qi ).
i=1
Seja f : A → R uma função real limitada no bloco n-dimensional A,
digamos com m ≤ f (x) ≤ M para todo x ∈ A. Dada uma partição P
do bloco A, para cada bloco B ∈ P , indiquemos com mB o ı́nfimo e
com MB o supremo dos valores f (x) quando x varia em B. Definimos
então a soma inferior s(f ; P ) e a soma superior S(f ; P ) da função f
relativamente à partição P pondo
X X
s(f ; P ) = mB · vol B e S(f ; P ) = MB · vol B,
B∈P B∈P

estas somas estendendo-se a todos os blocos B da partição P . Eviden-


temente mB ≤ MB para todo B ∈ P , logo s(f ; P ) ≤ S(f ; P ).
Mais do que isto é verdade: para quaisquer partições P e Q do bloco
A, tem-se s(f ; P ) ≤ S(f ; Q).
Para comprovar esta afirmação, observamos primeiro que se uma
partição P ′ refina a partição P então s(f ; P ) ≤ s(f ; P ′ ) e S(f ; P ′ ) ≤
S(f ; P ).
150 Integrais Múltiplas Cap. 8

Com efeito, se o bloco B ′ da partição P ′ está contido no bloco B


da partição P então mB ≤ mB ′ . Lembrando que cada blocoPB ∈ P é
a reunião dos blocos B ′ ∈ P ′ nele contidos, e que vol B = vol B ′ ,
B ′ ⊂B
segue-se que
!
X X X

s(f ; P ) = mB · vol B = mB · vol B
B∈P B∈P B ′ ⊂B
X
≤ mB ′ · vol B = s(f ; P ′ ).

B ′ ∈P ′

Analogamente se vê que S(f ; P ′ ) ≤ S(f ; P ) quando P ′ refina P . Assim,


quando se refina uma partição, a soma inferior não diminui e a soma
superior não aumenta.
Sejam P e Q duas partições quaisquer do bloco A. Tomemos uma
partição R de A que refine P e Q simultaneamente. Temos:

s(f ; P ) ≤ s(f ; R) ≤ S(f ; R) ≤ S(f ; Q),

mostrando portanto que s(f ; P ) ≤ S(f ; Q), ou seja, toda soma inferior
de f é menor do que ou igual a qualquer soma superior.
R
Definimos a seguir a integral inferior f (x)dx e a integral superior
−A
R−
A f (x)dx da função limitada f : A → R, pondo

Z Z−
f (x)dx = sup s(f ; P ) e f (x)dx = inf S(f ; P ),
P A P
−A

o supremo e o ı́nfimo acima sendo tomados em relação a todas as partições


P do bloco A.
A desigualdade s(f ; P ) ≤ S(f ; Q) implica que

Z Z−
m · vol A ≤ f (x)dx ≤ f (x)dx ≤ M · vol A
A
−A

se m ≤ f (x) ≤ M para todo x ∈ A.


Seção 1 A definição de integral 151

Diz-se que a função limitada f : A → R é integrável no bloco n-


dimensional A quando suas integrais inferior e superior coincidem. Es-
creve-se então

Z Z Z−
f (x)dx = f (x)dx = f (x)dx
A A
−A

e este número é chamado a integral de f no bloco A.


No caso n = 1, o bloco n-dimensional A reduz-se a um segmento de
reta e a definição de integral acima dada coincide com aquela apresen-
tada no Capı́tulo 10 do Volume 1.
Dada a função f : A → R, limitada no bloco A ⊂ Rn , o con-
junto σ das somas inferiores e o conjunto Σ das somas superiores de
f relativamente às partições P de A são subconjuntos do intervalo
[m · vol A, M · vol A], onde m ≤ f (x) ≤ M para todo x ∈ A. Sabe-
mos que, para quaisquer s ∈ σ e S ∈ Σ, tem-se s ≤ S. A fim de que seja
sup σ = inf Σ, isto é, que f seja integrável, é necessário e suficiente que,
dado arbitrariamente ε > 0, existam s ∈ σ e S ∈ Σ tais que S − s < ε.
Mais explicitamente: f é integrável se, e somente se, para todo ε > 0
dado, existem partições R e Q de A tais que S(f ; R) − s(f ; Q) < ε. Esta
condição pode ser aperfeiçoada assim:

Teorema 1 (Condição imediata de integrabilidade). A fim de


que a função limitada f : A → R seja integrável no bloco A ⊂ Rn é
necessário e suficiente que, para todo ε > 0 dado, exista uma partição
P de A tal que S(f ; P ) − s(f ; P ) < ε.
Demonstração. A suficiência é óbvia pois a condição acima claramente
assegura que sup σ = inf Σ. Quanto à necessidade, supondo f integrável,
ou seja, admitindo que sup σ = inf Σ, dado ε > 0, existem partições Q e
R do bloco A tais que S(f ; R) − s(f ; Q) < ε. Seja P uma partição de A
que refine Q e R ao mesmo tempo. Então s(f ; Q) ≤ s(f ; P ) ≤ S(f ; P ) ≤
S(f ; R), portanto S(f ; P ) − s(f ; P ) ≤ S(f ; R) − s(f ; Q) < ε.

Para todo subconjunto X ⊂ A, sejam MX o supremo e mX o ı́nfimo


dos valores f (x), com x ∈ X. Escreveremos ωX = MX − mX e chama-
remos ωX de oscilação de f no conjunto X.
Às vezes, quando houver necessidade, usaremos a notação mais pre-
cisa ω(f ; X) = MX − mX em vez de ωX .
152 Integrais Múltiplas Cap. 8

Para toda partição P do bloco A, temos


X X
S(f ; P ) − s(f ; P ) = (MB − mB ) vol B = ωB · vol B.
B∈P B∈P

Portanto f : A → R é integrável se, e somente se, para todo ε > 0


dado, existe uma partição P de A tal que
X
ωB · vol B < ε.
B∈P

Uma conseqüência imediata desta observação é que toda função


contı́nua f : A → R é integrável. Com efeito, sendo o bloco A um con-
junto compacto, a função contı́nua f é uniformemente contı́nua. Por-
tanto, dado qualquer ε > 0, existe δ > 0 tal que x, y ∈ A, |x − y| < δ ⇒
|f (x) − f (y)| < ε/ vol A.
Se tomarmos, em cada aresta [ai , bi ] do bloco A = Π[ai , bi ], uma
partição Pi cujos intervalos tenham todos comprimento < δ, e adotarmos
em Rn a norma do máximo, então todos os blocos da partição P =
P1 × · · · × Pn de A terão diâmetro menor do que δ. A função f sendo
contı́nua, em cada bloco B da partição P existem pontos a, b tais que
mB = f (a) e MB = f (b), pois B é compacto. Então ωB = MB − mB =
f (b) − f (a) < ε/ vol A e daı́
X ε X ε
ωB · vol B < · vol B = · vol A = ε.
vol A vol A
B∈P B∈P

Assim f é integrável.
O fato de que toda função contı́nua f : A → R é integrável é muito
importante mas não é suficiente para nossos propósitos. A fim de defi-
nir a integral de funções cujos domı́nios são mais gerais do que blocos,
precisamos integrar alguns tipos de funções descontı́nuas. Isto nos leva
ao critério de integrabilidade de Lebesgue, o qual se baseia na noção de
conjunto de medida nula, que abordaremos no parágrafo seguinte.

2 Conjuntos de medida nula

Diz-se que o conjunto X ⊂ Rn tem medida n-dimensional nula (segundo


Lebesgue), e escreve-se med.X = 0, quando, para todo ε > 0 dado, é
possı́vel obter uma cobertura enumerável X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por
P

meio de blocos abertos Bk ⊂ Rn tais que vol Bk < ε.
k=1
Seção 2 Conjuntos de medida nula 153

Evidentemente, se med.X = 0 e Y ⊂ X então med.Y = 0.


Teorema 2. Uma reunião enumerável de conjuntos de medida nula é
ainda um conjunto de medida nula.
Demonstração. Sejam X1 , . . . , Xk , . . . subconjuntos de Rn com
S

med.Xk = 0 para todo k ∈ N. A fim de provar que X = Xk
k=1
tem medida nula, seja dado ε > 0. Para cada k ∈ N podemos obter
S

uma seqüência de blocos Bk1 , Bk2 , . . . , Bki , . . . tais que Xk ⊂ Bki e
i=1
P

vol Bki < ε/2k . Então X está contido na reunião (enumerável) de
i=1
todos os Bki . Dado qualquer subconjunto finito F ⊂ N×N, existe j ∈ N
tal que (k, i) ∈ F ⇒ k ≤ j e i ≤ j. Logo
j
" j # j
X X X X
vol Bki ≤ vol Bki < ε/2k < ε.
(k,i)∈F k=1 i=1 k=1

Portanto,Pseja qual for a maneira de enumerar os Bki numa seqüência,


teremos vol Bki ≤ ε. Assim, med.X = 0.
k,i

Corolário 1. Todo conjunto enumerável tem medida nula.


Com efeito, todo conjunto enumerável é reunião dos seus pontos,
cada um dos quais tem medida nula.
A definição de med.X = 0, dada acima com blocos abertos, é conve-
niente quando se pretende usar o Teorema de Borel-Lebesgue. Noutras
ocasiões, pode ser mais adequado empregar blocos fechados. E ainda
em certos casos impõe-se o uso de cubos (abertos ou fechados). Essas
alternativas são equivalentes, conforme veremos agora.
Teorema 3. As seguintes afirmações a respeito de um conjunto X ⊂ Rn
são equivalentes:

(a) Para todo ε > 0 dado, pode-se obter uma cobertura enumerável
X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por meio de blocos abertos Bk ⊂ Rn tais
P

que vol Bk < ε.
k=1
(b) Vale a afirmação (a), com blocos fechados em vez de abertos.
(c) Vale a afirmação (a), com cubos abertos em vez de blocos.
(d) Vale a afirmação (a), com cubos fechados em vez de blocos abertos.
154 Integrais Múltiplas Cap. 8

Demonstração. Mostremos, inicialmente, que (a) ⇔ (b). A implicação


(a) ⇒ (b) é imediata, pois X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . implica X ⊂ B 1 ∪
· · · ∪ B k ∪ . . . e vol B k = vol Bk , logo Σ vol Bk < ε ⇒ Σ vol B k <
ε. Quanto a (b) ⇒ (a): dado ε > 0, (b) nos autoriza a obter uma
cobertura X ⊂ D1 ∪ · · · ∪ Dk ∪ . . . por meio de blocos fechados Dk
Q
n
com Σ vol Dk < ε/2. Ora, para cada k ∈ N, o bloco Dk = [aki , bki ]
i=1
Q
n
está contido no bloco aberto Ak = (aki − δ, bki + δ) onde δ > 0 pode
i=1
ser escolhido de modo que vol Ak − vol Dk < ε/2k+1 . (Basta notar que
Qn
vol Ak = (bki − aki + 2δ) é uma função contı́nua de δ, igual a vol Dk
i=1
quando δ = 0.) Então X ⊂ A1 ∪ · · · ∪ Ak ∪ . . . , com

X ∞
X ∞
X ε ε ε
vol Ak < vol Dk + < + = ε.
2k+1 2 2
k=1 k=1 k=1

A equivalência (c) ⇔ (d) se prova exatamente do mesmo modo, bas-


tando observar que, no argumento acima, se Dk é um cubo então Ak
também é.
Resta portanto, provar que (a) ⇔ (c) ou, o que dá no mesmo, que
(b) ⇔ (d). Ora, é óbvio que (d) ⇒ (b). Para demonstrar a implicação
(b) ⇒ (d), começamos provando que, dados um bloco B e um número
δ > 0, existe um bloco C que é uma reunião finita de cubos, contém
B e, além disso, vol C − vol B < δ. Isto é imediato quando as arestas
do bloco B = Π[ai , bi ] têm medidas racionais bi − ai = pi /qi . Neste
caso, o próprio bloco B é uma reunião finita de cubos: basta consi-
derar o mı́nimo múltiplo comum m dos denominadores qi e tomar em
mpi
cada aresta [ai , bi ] de B a partição Pi com intervalos, todos de
qi
comprimento 1/m. Os blocos da partição P = P1 × · · · × Pn do bloco B
são cubos de arestas medindo 1/m e B é a reunião deles. No caso geral,
observamos que, para i = 1, . . . , m, existem números positivos ηi tão
pequenos quanto se queira, tais que bi − ai + ηi é racional. Então o bloco
Q
n
C = [ai , bi + ηi ] tem arestas com medidas racionais, logo é reunião
i=1
finita de cubos. Além disso, C contém B e a diferença vol C − vol B =
Π(bi − ai + ηi ) − Π(bi − ai ) pode ser tornada tão pequena quanto se
deseje, desde que os ηi sejam suficientemente pequenos.
Para completar a prova de que (b) ⇒ (d), seja dado ε > 0. Por
Seção 2 Conjuntos de medida nula 155

(b), existe uma cobertura X ⊂ B1 ∪ · · · ∪ Bk ∪ . . . por blocos Bk tais


P∞
que vol Bk < ε/2. Como acabamos de ver, cada Bk está contido
k=1
numa reunião finita de cubos cuja soma dos volumes é menor do que
vol Bk + ε/2k+1 . Numerando consecutivamente esses cubos para k =
1, 2, . . . , chegamos a uma cobertura S ⊂ C1 ∪ · · · ∪ Cr ∪ . . . , onde os
cubos Cr são tais que

X ∞
X ∞
X ε ε ε
vol Cr < vol Bk + < + = ε.
2k+1 2 2
r=1 k=1 k=1

Isto completa a demonstração do teorema.


Teorema 4. Seja f : X → Rn uma aplicação lipschitziana no conjunto
X ⊂ Rn . Se medX = 0 então medf (X) = 0.
Demonstração. Adotemos em Rn a norma do máximo. Seja
c > 0 tal que |f (x)−f (y)| ≤ c|x−y| para quaisquer x, y ∈ X. Dado arbi-
trariamente ε > 0, existe uma cobertura X ⊂ C1 ∪· · ·∪Ck ∪. . . onde cada
P
∞ P

Ck é um cubo cuja aresta mede ak , com vol Ck = (ak )n < ε/cn .
k=1 k=1
Se x, y ∈ Ck ∩X então |x−y| ≤ ak , logo |f (x)−f (y)| ≤ c·ak . Isto signi-
fica que, para todo i = 1, . . . , n, as i-ésimas coordenadas de f (x) e f (y)
pertencem a um intervalo Ji de comprimento c · ak . Portanto f (Ck ∩ X)
Q
n
está contido no cubo Ji = Ck′ , de aresta c·ak , logo vol Ck′ = cn ·(ak )n .
i=1
S

Segue-se que f (X) = f (Ck ∩ X) ⊂ C1′ ∪ · · · ∪ Ck′ ∪ . . . , onde
k=1

X ∞
X ε
vol Ck′ = cn · (ak )n < cn · = ε.
cn
k=1 k=1

Logo medf (X) = 0.


A aplicação mais freqüente do Teorema 4 ocorre quando f : U → Rn
é diferenciável, com derivada limitada no aberto convexo U ⊂ Rn . Se
|f ′ (x)| ≤ c para todo x ∈ U então a Desigualdade do Valor Médio nos
dá |f (x) − f (y)| ≤ c · |x − y| para quaisquer x, y ∈ U , logo f transforma
todo conjunto de medida nula X ⊂ U num conjunto de medida nula
f (X) ⊂ Rn . A fim de estender este resultado para funções de classe
C 1 em abertos não necessariamente convexos, com derivada limitada ou
não, será necessário usar o
156 Integrais Múltiplas Cap. 8

S
Teorema 5 (Lindelöf ). Toda cobertura aberta X ⊂ Uλ de um
λ∈L
conjunto arbitrário X ⊂ Rn admite uma subcobertura enumerável X ⊂
Uλ1 ∪ · · · ∪ Uλk ∪ . . . .
Demonstração. Seja B o conjunto dos blocos abertos em Rn cujos
vértices têm coordenadas racionais e cada um deles está contido em
algum aberto Uλ da cobertura dada. O conjunto B é enumerável, logo
podemos escrever B = {B1 , B2 , . . . , Bk , . . . }. Para cada k ∈ N, esco-
S

lhamos um ı́ndice λk ∈ L tal que Bk ⊂ Uλk . Afirmamos que Uλk =
S k=1
Uλ . Com efeito, se x ∈ Uλ então, como Uλ é aberto, existe uma
λ∈L
bola aberta de centro x, contida em Uλ . Se tomarmos em Rn a norma
do máximo, essa bola é um cubo, cuja aresta podemos supor racional,
logo é um Bk . Assim, x ∈ Bk ⊂ Uλk , portanto todo Uλ , λ ∈ L, está
S S
∞ S
contido na reunião dos Uλk , k ∈ N, ou seja Uλ ⊂ Uλk ⊂ Uλ .
λ∈L k=1 λ∈L
Segue-se que X ⊂ Uλ1 ∪ · · · ∪ Uλk ∪ . . . .
Teorema 6. Seja f : U → Rn uma aplicação de classe C 1 no aberto
U ⊂ Rn . Se X ⊂ U tem medida nula então f (X) ⊂ Rn também tem
medida nula.
Demonstração. Para cada x ∈ X existe um aberto convexo Ux , com
x ∈ Ux ⊂ U , tal que f tem derivada limitada
S em Ux , logo f (X ∩Ux ) tem
medida nula. A cobertura aberta X ⊂ Ux admite uma subcobertura
x∈X
S

enumerável X ⊂ Uk . Como f (X ∩ Uk ) tem medida nula para cada
k=1 ∞ 
S S

k ∈ N, segue-se que f (X) = f (X ∩ Uk ) = f (X ∩ Uk ) tem
k=1 k=1
medida nula.
Corolário 2. Seja f : U → Rn uma aplicação de classe C 1 no aberto
U ⊂ Rm . Se m < n então f (U ) ⊂ Rn tem medida nula.
Com efeito, se considerarmos Rm como o conjunto dos pontos de
n
R cujas últimas n − m coordenadas são nulas, veremos que todo bloco
m-dimensional B ⊂ Rm ⊂ Rn tem volume n-dimensional nulo, pois po-
demos cobrir B com um único bloco n-dimensional D = B × [0, η]n−m ,
cujo volume n-dimensional pode ser tomado tão pequeno quanto se de-
seje. Daı́ resulta que Rm , visto como subconjunto de Rn , tem medida
n-dimensional nula, pois é reunião enumerável de blocos m-dimensionais.
Seção 2 Conjuntos de medida nula 157

Em particular, o conjunto U ⊂ Rm tem medida n-dimensional nula. Isto


posto, a partir da aplicação f : U → Rn , definamos F : U × Rn−m → Rn
pondo F (x, y) = f (x). O conjunto U × 0 ⊂ U × Rn−m tem medida
n-dimensional nula, logo med.F (U × 0) = 0, pelo Teorema 6. Mas
F (U × 0) = f (U ), o que prova o corolário.
Corolário 3. Seja M ⊂ Rn uma superfı́cie m-dimensional de classe
C 1 . Se m < n então M tem medida n-dimensional nula.
Com efeito, para todo x ∈ M existe um aberto Ux em Rn tal que
Vx = Ux ∩ M é uma vizinhança parametrizada de x,Slogo um conjunto
de medida nula em Rn . A cobertura aberta M ⊂ Ux admite, por
x∈M
S
∞ S

Lindelöf, uma subcobertura enumerável M ⊂ Uk , logo M = (Uk ∩
k=1 k=1
M ) é reunião enumerável de conjuntos Vk = Uk ∩ M , de medida nula.
Assim, med.M = 0.
O teorema seguinte, devido a H. Lebesgue, estabelece o critério geral
de integrabilidade em termos da noção de conjunto de medida nula. Em
sua demonstração, faremos uso do conceito de oscilação de uma função
num ponto, que introduziremos agora.
Seja f : X → R uma função limitada no conjunto X ⊂ Rn . Fixemos
x ∈ X e, para cada δ > 0, ponhamos Ω(δ) = ω(f ; X ∩ B(x; δ)) =
oscilação de f no conjunto dos pontos de X que distam menos de δ do
ponto x. Fica assim definida uma função não-negativa Ω : (0, +∞) → R,
a qual é limitada pois f também é. Além disso, Ω é não-decrescente.
Logo existe o limite

ω(f ; x) = lim Ω(δ) = lim ω(f ; X ∩ B(x; δ)) = inf ω(f ; X ∩ B(x; δ)),
δ→0 δ→0 δ>0

que chamaremos a oscilação da função f no ponto x.


Tem-se ω(f ; x) = 0 se, e somente se, f é contı́nua no ponto x. É
claro que se x ∈ int.Y e Y ⊂ X então ω(f ; x) ≤ ω(f ; Y ).
Teorema 7 (Lebesgue). A função f : A → R, limitada no bloco
A ⊂ Rn , é integrável se, e somente se, o conjunto Df dos seus pon-
tos de descontinuidade tem medida nula.
Demonstração. Suponhamos inicialmente que med.Df = 0. Dado
arbitrariamente ε > 0, seja Df ⊂ C1′ ∪ · · · ∪ CP ′
k ∪ · · · uma cobertura
enumerável de Df por blocos abertos tais que vol Ck′ < ε/2K, onde
K = M −m é a diferença entre o sup e o inf de f em A. Para cada ponto
158 Integrais Múltiplas Cap. 8

x ∈ A − Df seja Cx′′ um bloco aberto contendo x, tal que a oscilação de


f no fecho de Cx′′ ∩ A seja inferior a ε/(2 · vol A). Sendo A compacto, a
cobertura aberta A ⊂ (∪Ck′ ) ∪ (∪Cx′′ ) admite uma subcobertura finita

A ⊂ C1′ ∪ · · · ∪ Cr′ ∪ C1′′ ∪ · · · ∪ Cs′′ .

Seja P uma partição de A tal que cada bloco aberto B ∈ P esteja contido
Q
n
num dos blocos Ck′ ou num Cj′′ . (Se A = [ai , bi ] então podemos tomar
i=1
P = P1 × · · · × Pn onde, para cada i = 1, . . . , n, Pi é formada pelos
pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Ck′
ou Cj′′ que pertençam ao intervalo [ai , bi ].) Os blocos de P contidos em
algum Ck′ serão genericamente designados por B ′ e os demais blocos
de P (necessariamente contidos em algum Cj′′ ) serão chamados B ′′ . A
soma dos volumes dos B ′ é menor do que ε/2K e, em cada bloco B ′′ , a
oscilação de f não excede ε/(2 · vol A). Portanto
X X X
ωB · vol B = ωB ′ · vol B ′ + ωB ′′ · vol B ′′
B∈P B′ B ′′
X ε X
≤K· vol B ′ + vol B ′′
2 · vol A
ε ε
<K· + · vol A = ε.
2·K 2 · vol A
Segue-se que f é integrável.
Reciprocamente, suponhamos f integrável. Para cada k ∈ N, po-
nhamos Dk = {x ∈ A; ω(f ; x) ≥ 1/k}, logo Df = D1 ∪ · · · ∪ Dk ∪ · · · .
Para mostrar que Df tem medida nula, basta provar que med.Dk = 0
para cada k ∈ N. Seja, então, dado
P ε > 0. Como f é integrável, existe
uma partição P de A tal que ωB · vol B < ε/k. Indiquemos gene-
B∈P
ricamente com B ′ os blocos da partição P que contêm algum ponto de
Dk em seu interior. Para cada um desses blocos B ′ , vale ωB ′ ≥ 1/k.
Portanto
1X X X ε
vol B ′ ≤ ωB ′ · vol B ′ ≤ ωB · vol B < ·
k k
B∈P

Multiplicando por k, obtemos Σ vol B ′ < ε. Ora, é claro que Dk ⊂


(∪B ′ ) ∪ X, onde X é a reunião das faces próprias dos blocos B ∈ P nos
quais há algum ponto de Dk . Sabemos que med.X = 0. Segue-se daı́
que med.Dk = 0. (Ver Observação a seguir.)
Seção 3 Cálculo com integrais 159

Observação: Seja Z ⊂ Rn um conjunto tal que, para todo ε > 0 dado,


existem blocos B1 , . . . , Bk , . . . e um conjunto X ⊂ Rn com
Z ⊂ (∪Bk ) ∪ X, Σvol Bk < ε e med. X = 0. Então med. Z = 0.
Com efeito, tomando blocos C1 , . . . , Ck , . . . com X ⊂ ∪Ck e
Σ med. Ck < ε, tem-se Z ⊂ (∪Bk ) ∪ (∪Ck ) onde Σ vol Bk +
Σ vol Ck < 2ε.

3 Cálculo com integrais

Teorema 8. Sejam f, g : A → R funções integráveis no bloco A ⊂ Rn e


c um número real. Então;
R R
(1) fR + g : A → R é integrável e A [f (x) + g(x)]dx = A f (x)dx +
A g(x)dx.
R R
(2) c · f : A → R é integrável e A c · f (x)dx = c · A f (x)dx.

(3) O produto f · g : A → R é uma função integrável.

(4) Se |g(x)| ≥ k > 0 para todo x ∈ A então f /g : A → R é integrável.


R R
(5) Se f (x) ≤ g(x) para todo x ∈ A então A f (x)dx ≤ A g(x)dx.
R R
(6) |f | : A → R é uma função integrável e | A f (x)dx| ≤ A |f (x)|dx.

(7) Se A′ Ré um bloco contido


R em A e f (x) = 0 para todo x ∈ A − A′
então A f (x)dx = A′ f (x)dx.

Demonstração. A integrabilidade das funções f + g, c · f , f · g, f /g e


|f | resulta do Teorema 7, pois Df +g ⊂ Df ∪ Dg , Dc·f = Df (se c 6= 0),
Df ·g ⊂ Df ∪ Dg e D|f | ⊂ Df . Além disso, se |g(x)| ≥ k > 0 para
todo x ∈ A então f /g : A → R é limitada e, como Df /g ⊂ Df ∪ Dg ,
o quociente f /g é integrável. As demais afirmações do Teorema 8 se
provam exatamente como no caso de funções de uma única variável.
(Ver Capı́tulo 10 do Volume 1.)
O cálculo efetivo da integral de uma função f : A → R, definida num
bloco n-dimensional, se faz integrando f sucessivamente em relação a
cada uma das suas n variáveis. Basta aplicar diversas vezes o Teorema 9
abaixo, no qual adotamos as seguintes notações:
Dados os blocos A1 ⊂ Rm e A2 ⊂ Rn , os pontos do bloco A1 × A2 ⊂
R m+n escrevem-se como (x, y), com x ∈ A1 e y ∈ A2 . Se f : A1 ×A2 → R
160 Integrais Múltiplas Cap. 8
Z
é integrável, sua integral é indicada com f (x, y)dxdy. Para cada
A1 ×A2
x ∈ A1 , definiremos a função fx : A2 → R pondo fx (y) = f (x, y) para
todo y ∈ A2 , portanto fx é essencialmente a restrição de f ao bloco
n-dimensional x × A2 . Mesmo que f seja integrável, pode ocorrer que,
para alguns valores de x ∈ A1 , a função fx : A1 → R não o seja. Com
efeito, os pontos em que f é descontı́nua formam um conjunto D de
medida nula em Rm+n mas pode existir x ∈ A1 tal que D ∩ (x × A2 ) não
tenha medida n-dimensional nula.
Exemplo 1. Sejam A1 = A2 = [0, 1] e f : [0, 1] × [0, 1] → R dada por
f (x, y) = 0 se x 6= 1/2, f (1/2, y) = 0 se y é racional, f (1/2, y) = 1 se
y é irracional. O conjunto dos pontos de descontinuidade de f é Df =
1/2 × [0, 1], que tem medida nula em [0, 1] × [0, 1], logo f é integrável.
(De fato, sua integral é zero.) Mas f1/2 : [0, 1] → R é a função igual a
zero nos pontos racionais e igual a 1 nos irracionais, logo fx : [0, 1] → R
não é integrável quando x = 1/2. ⊳
Teorema 9 (Integração repetida). Seja f : A1 × A2 → R integrável
no produto dos blocos A1 ⊂ Rm e A2 ⊂ Rn . Para todo x ∈ A1 , seja
fx : A2 → R definida por fx (y) = f (x, y). Ponhamos
Z Z−
ϕ(x) = fx (y)dy e ψ(x) = fx (y)dy.
A2
− A2

As funções ϕ, ψ : A1 → R, assim definidas, são integráveis, com


Z Z Z
ϕ(x)dx = ψ(x)dx = f (x, y)dxdy,
A1 A1 A1 ×A2

isto é:
   
Z Z Z Z Z

 
f (x, y)dxdy = dx  fx (y)dy  = dx  fx (y)dy  .
A1 ×A2 A1 A1 A2
− A2

Demonstração. As partições do bloco A1 × A2 são da forma P =


P1 × P2 , onde P1 e P2 são partições dos blocos A1 e A2 respectivamente.
Os blocos de P são os produtos B1 × B2 com B1 ∈ P1 e B2 ∈ P2 .
Mostraremos que

s(f ; P ) ≤ s(ϕ; P1 ) ≤ S(ϕ; P1 ) ≤ S(f ; P ).


Seção 3 Cálculo com integrais 161
Z Z
Daı́ resultará que ϕ é integrável e que ϕ(x)dx = f (x, y)dxdy.
A1 A1 ×A2
Na verdade, basta provar a primeira das desigualdades acima, pois a
segunda é óbvia e a terceira
Z é análoga.
Z Também por analogia, não
precisamos provar que ψ(x)dx = f (x, y)dxdy.
A1 A1 ×A2
Começamos lembrando que se X ⊂ Y ⊂ R então inf .Y ≤ inf .X.
Segue-se que, para todo bloco B1 × B2 ∈ P , tem-se m(f ; B1 × B2 ) ≤
m(fx ; B2 ), seja qual for x ∈ B1 . Portanto
X X
m(f ; B1 ×B2 )·vol B2 ≤ m(fx ; B2 )·vol B2 = s(fx ; P2 ) ≤ ϕ(x).
B2 ∈P2 B2 ∈P2

Como isto vale para todo x ∈ B1 , concluı́mos que:


X
m(f ; B1 × B2 ) · vol B2 ≤ m(ϕ; B1 ).
B2 ∈P2

Portanto
X
s(f ; P ) = m(f ; B1 × B2 ) · vol B1 ·vol B2
B1 ×B2 ∈P
 
X X
=  m(f ; B1 × B2 ) · vol B2  · vol B1
B1 ∈P1 B2 ∈P2
X
≤ m(ϕ; B1 ) · vol B1 = s(ϕ; P1 ).
B1 ∈P1

Corolário 4. Seja f : A1 × A2 × A3 → R integrável no produto dos


blocos A1 ⊂ Rm , A2 ⊂ Rn e A3 ⊂ Rp . Então
Z Z Z Z
f (x, y, z)dxdydz = dx dy f (x, y, z)dz
A1 ×A2 ×A3 A1
− A2 − A3
Z Z− Z−
= dx dy f (x, y, z)dz.
A1 A2 A3
162 Integrais Múltiplas Cap. 8

Com efeito,
 
Z Z Z−
f (x, y, z)dxdydz = dxdy  f (x, y, z)dz 
A1 ×A2 ×A3 A1 ×A2 A3
  
Z Z− Z−
= dx  dy  f (x, y, z)dz 
A1 A2 A3

Z Z− Z−
= dx dy f (x, y, z)dz.
A1 A2 A3

A seguir, vamos estender o conceito de integral para funções definidas


em certos subconjuntos X ⊂ Rn que não são necessariamente blocos n-
dimensionais.

4 Conjuntos J-mensuráveis

Dado o conjunto limitado X ⊂ Rn , seja A um bloco n-dimensional


contendo X. A função caracterı́stica de X é a função ξX : A → R,
definida por ξX (x) = 1 se x ∈ X e ξX (x) = 0 se x ∈
/ X.
Se X e Y são subconjuntos do bloco A, as seguintes propriedades da
função caracterı́stica são evidentes:
1. ξX∪Y = ξX + ξY − ξX∩Y ;
2. ξX∩Y = ξX · ξY ;
3. Tem-se X ⊂ Y se, e somente se, ξX ≤ ξY ; neste caso, vale ξY −X =
ξY − ξX .
Segue-se de 1. que ξX∪Y = ξX + ξY quando X e Y são disjuntos.
Se X estiver contido no interior de A (o que poderemos supor, sempre
que for conveniente) então fr .X é o conjunto dos pontos de descontinui-
dade da função ξX : A → R.
O volume interno e o volume externo do conjunto limitado X ⊂ Rn
são definidos, respectivamente, pondo:

Z Z−
vol . int .X = ξX (x)dx e vol .ext.X = ξX (x)dx.
A
−A
Seção 4 Conjuntos J-mensuráveis 163

Quando a função caracterı́stica ξX : A → R é integrável, dizemos que


X é J-mensurável (mensurável segundo Jordan) e que seu volume n-
dimensional é Z
vol X = ξX (x)dx.
A

O item (7) do Teorema 8 assegura que os conceitos acima introduzi-


dos não dependem da escolha do bloco A contendo X.
Se X ⊂ A e P é uma partição do bloco A, as somas inferior e superior
da função ξX : A → R relativas à partição P são
s(ξX ; P ) = soma dos volumes dos blocos de P contidos em X;
S(ξX ; P ) = soma dos volumes dos blocos de P que intersectam X.
Portanto, se escrevermos v = vol . int .X e V = vol .ext.X, veremos
que, para todo ε > 0 dado, existe uma partição P do bloco A (o qual
contém X) tal que a soma dos volumes dos blocos de P contidos em X
é superior a v − ε e a soma dos volumes dos blocos de P que intersectam
X é inferior a V + ε.
Teorema 10. (1) O conjunto limitado X ⊂ Rn é J-mensurável se, e
somente se, sua fronteira tem medida nula.
(2) Se X, Y ⊂ Rn são J-mensuráveis então X ∪ Y , X ∩ Y e X − Y
são J-mensuráveis, com

vol(X ∪ Y ) = vol X + vol Y − vol(X ∩ Y )


e vol(X − Y ) = vol X − vol Y quando Y ⊂ X.

Demonstração. (1) Tomando um bloco n-dimensional A que contenha


X em seu interior e considerando a função caracterı́stica ξX : A → R,
temos as equivalências:
X é J-mensurável ⇔ ξX é integrável ⇔ med. DξX = 0 ⇔ med. fr X=0,
pois o conjunto DξX das descontinuidades de ξX coincide com a fronteira
de X.
(2) Basta observar que ξX∪Y = ξX +ξY −ξX∩Y e que, quando Y ⊂ X,
vale ainda ξX−Y = ξX − ξY .
Exemplo 2. Todo conjunto limitado X ⊂ Rn , cuja fronteira é uma su-
perfı́cie, ou a reunião de um número finito (ou mesmo enumerável) de su-
perfı́cies de dimensão n−1 é J-mensurável. Isto inclui uma bola fechada
164 Integrais Múltiplas Cap. 8

e a região compreendida entre duas bolas fechadas concêntricas. Resulta


ainda do item (1) acima que um bloco n-dimensional é J-mensurável. ⊳
Exemplo 3. Seja X ⊂ R o conjunto formado pelo intervalo [0, 1] mais
os números racionais do intervalo [1, 2]. O “volume”externo é 2 mas
o interno é 1. Portanto X não é J-mensurável. Tomando o produto
cartesiano de n cópias de X, obtém-se um subconjunto limitado de Rn
que não é J-mensurável. ⊳
Exemplo 4. Se X ⊂ Rn é J-mensurável e int .X = ∅ então vol .X =
0 pois s(ξX ; P ) = 0 para toda partição P de um bloco que conte-
nha X. Resulta daı́ que se X e Y são conjuntos J-mensuráveis sem
pontos interiores em comum então vol(X ∪ Y ) = vol X + vol Y , pois
vol(X ∩ Y ) = 0. ⊳
Z
Definiremos agora a integral f (x)dx de uma função limitada
X
f : X → R, cujo domı́nio é um conjunto J-mensurável X ⊂ Rn . Para
isto, consideramos um bloco n-dimensional A contendo X em seu inte-
rior e a função
f¯: A → R,
definida por f¯(x) = f (x) se x ∈ X e f (x) = 0 se x ∈ A − X. Pomos
então, por definição
Z Z Z− Z

f (x)dx = f¯(x)dx e f (x)dx = f¯(x)dx.


X A
−X −A

Diremos que f : X → R é integrável quando tivermos


Z Z

f (x)dx = f (x)dx
X
−X

ou seja, quando f¯: A → R for integrável.


Se f¯: A → R é descontı́nua num ponto x ∈ A, ou f é descontı́nua no
ponto x ou x pertence à fronteira de X. Noutros termos, Df¯ ⊂ Df ∪fr .X.
Como fr .X tem medida nula e Df ⊂ Df¯, segue-se que f é integrável (ou
seja, f¯ é integrável) se, e somente se o conjunto Df dos seus pontos de
descontinuidade tem medida nula. Z
Valem, evidentemente, para a integral f (x)dx as mesmas regras
X
operatórias estabelecidas no Teorema 8 para o caso em que X é um
bloco retangular.
Seção 5 A integral como limite de somas de Riemann 165

Exemplo 5. É claro que um conjunto de volume zero tem medida


nula. Se o conjunto dado é J-mensurável, vale a recı́proca (em virtude
do Exemplo 4) pois medida nula implica interior vazio. A hipótese de
J-mensurabilidade não pode ser omitida pois o conjunto enumerável
Q∩[0, 1] tem medida nula mas seu “volume” externo é igual a 1 enquanto
o interno é igual a zero.
Observação: O item (1) do Teorema 10 pode ser tornado mais preciso:
a fronteira de um conjunto J-mensurável tem volume zero. Com efeito,
todo conjunto limitado tem fronteira compacta e vale o seguinte
Complemento ao Teorema 10. Se X ⊂ Rn é compacto e med.X = 0
então vol X = 0.
Demonstração: Seja dado ε > 0. Como são abertos os blocos que
ocorrem na definição de med.X = 0, segue-se do Teorema de Borel-
Lebesgue que existem blocos abertos B1 , . . . , Bk tais que X ⊂ B1 ∪ · · · ∪
P
k
Bk e vol Bj < ε. Para cada i = 1, . . . , k, as i-ésimas coordenadas
j=1
dos vértices desses blocos formam um conjunto Pi , cujo menor elemento
chamaremos de ai e, o maior, de bi . Cada Pi é, portanto, uma partição
do intervalo [ai , bi ] e o conjunto Pn = P1 × · · · × Pn é uma partição do
Q
n
bloco A = [ai , bi ]. Temos X ⊂ A e o fecho B j de cada um dos blocos
i=1
iniciais é a reunião dos blocos B ′ ∈ P nele contidos. Segue-se daı́ que
se um bloco B ′ ∈ P contém algum ponto de X então B ′ está contido
num B j . Assim, a soma dos volumes dos blocos B ′ da partição P que
intersectam X é menor do que ou igual à soma dos volume dos Bj , logo
é menor do que ε. Portanto vol X = 0.

5 A integral como limite de somas de Riemann


Z
Mostraremos agora (veja o Teorema 12) que a integral f (x)dx é
X
o número real cujos valores aproximados são as “somas de Riemann”
Σf (ξi ) vol Xi , obtidas quando se faz uma decomposição do tipo X =
X1 ∪ · · · ∪ Xk , onde os Xi são conjuntos J-mensuráveis, tais que o inte-
rior de cada Xi é disjunto dos demais Xj , tomando-se arbitrariamente
ξi ∈ Xi para cada i = 1, . . . , k. Esta é a forma mais comum, e a mais
intuitiva, de se pensar na integral. Passemos às definições precisas.
166 Integrais Múltiplas Cap. 8

Seja X ⊂ Rn um conjunto J-mensurável. Diz-se que D = (X1 ,. . . ,Xk )


é uma decomposição de X quando os conjuntos X1 , . . . , Xk são J-mensu-
ráveis, tais que o interior de cada Xi é disjunto dos demais Xj (isto é,
Xi ∩Xj ⊂ fr .Xi ∩fr .Xj quando i 6= j), com X = X1 ∪· · ·∪Xk . A norma
da decomposição D é o número |D| = max.diam.Xi = maior diâmetro
dos conjuntos X1 , . . . , Xk .
Por exemplo, se X ⊂ Rn é um bloco n-dimensional, toda partição
P determina uma decomposição X = B1 ∪ · · · ∪ Bk , onde os Bi são os
blocos da partição P .
Seja f : X → R uma função limitada no conjunto J-mensurável
X ⊂ Rn . Dada a decomposição D = (X1 , . . . , Xk ) de X escreveremos,
para cada i = 1, . . . , k, mi = inf .{f (x); x ∈ Xi } e Mi = sup .{f (x); x ∈
Xi }. Definiremos então a soma inferior s(f ; D) e a soma superior
S(f ; D) pondo

k
X k
X
s(f ; D) = mi · vol Xi e S(f ; D) = Mi · vol Xi .
i=1 i=1

Diz-se que o número real J é o limite de S(f ; D) quando |D| tende


a zero, e escreve-se
J = lim S(f ; D)
|D|→0

para significar que, para todo ε > 0 dado, existe δ > 0 tal que |D| < δ ⇒
|J − S(f ; D)| < ε. Analogamente se define o significado da afirmação
I = lim s(f ; D).
|D|→0

Teorema 11. Para toda função f : X → R, limitada no conjunto


J-mensurável X ⊂ Rn , tem-se

Z Z

f (x)dx = lim s(f ; D) e f (x)dx = lim S(f ; D).


|D|→0 X |D|→0
−X

Na demonstração do Teorema 11 usaremos o lema abaixo, cujo enun-


ciado contém a desigualdade d(Xi , Y ) < δ.
Se A e B são subconjuntos não-vazios de Rn , costuma-se escrever
d(A, B) = inf .{|x − y|; x ∈ A, y ∈ B}. Por conseguinte, a desigualdade
d(A, B) < δ significa que existem x ∈ A e y ∈ B com |x − y| < δ.
Seção 5 A integral como limite de somas de Riemann 167

Lema 1. Sejam Y ⊂ X ⊂ Rn J-mensuráveis, com vol Y = 0. Para


todo ε > 0 dado, existe δ > 0 tal que, se D é uma decomposição de X
com |D| < δ então a soma dos volumes dos conjuntos Xi ∈ D tais que
d(Xi , Y ) < δ é menor do que ε.
Demonstração. Dado ε > 0, podemos cobrir Y com uma coleção finita
de blocos B cuja soma dos volumes é < ε. Tomando arbitrariamente
δ > 0, ponhamos cada um desses blocos B = Π[ai , bi ] dentro do bloco
B ′ = Π[ai − 2δ, bi + 2δ]. Como lim vol B ′ = vol B, existe δ > 0 tal que a
δ→0
soma dos volumes dos blocos B ′ é ainda menor do que ε. Usando a norma
do máximo, podemos assegurar que se Z é um conjunto de diâmetro < δ
tal que d(Z, B) < δ então Z ⊂ B ′ . Portanto, se D = (X1 , . . . , Xk ) é
uma decomposição de X com |D| < δ, vemos que

d(Xi , Y ) < δ ⇒ d(Xi , B) < δ para algum B ⇒ Xi ⊂ B ′ .

Assim, a soma dos volumes dos conjuntos Xi ∈ D tais que d(Xi , Y ) < δ
não excede a soma dos volumes dos blocos B ′ , logo é menor do que ε.
Demonstração do Teorema 11. Basta provar a segunda afirmação.
Sem perda de generalidade, podemos admitir que 0 ≤ f (x) ≤ K para
todo x ∈ X. Com efeito, se somarmos uma constante c à função f , tanto
a integral superior como o limite acima serão aumentados de c · vol X.
Seja f¯: A → R a extensão de f a um bloco n-dimensional A ⊃ X, com
f¯(x) = 0 se x ∈ A − X. Dado ε > 0, queremos achar δ > 0 tal que
R−
|S(f ; D)− X f (x)dx| < ε para toda decomposição D de X com |D| < δ.
Ora, dado ε > 0, existe uma partição P0 de A tal que

Z−
S(f¯; P0 ) < f (x)dx + ε/2.
X

Seja Y a reunião das faces próprias dos blocos de P0 . Como vol Y = 0, o


Lema 1 assegura a existência de δ > 0 tal que, para toda decomposição
D de X com |D| < δ, a soma dos volumes dos conjuntos Xi ∈ D com
d(Xi , Y ) < δ é menor do que ε/2K.
Seja então D uma decomposição de X com norma |D| < δ. Chame-
mos de Xα os conjuntos de D tais que d(Xα , Y ) < δ. Os demais con-
juntos de D serão chamados de Xβ . Notemos que cada Xβ deve estar
contido em algum bloco da partição P0 pois, do contrário, existiriam
168 Integrais Múltiplas Cap. 8

x, y ∈ Xβ em blocos distintos de P0 , logo o segmento de reta [x, y] conte-


ria algum ponto de Y . Como |x − y| < δ, isto daria d(Xβ , Y ) < δ um ab-
surdo. Escrevendo Mα = sup{f (x); x ∈ Xα } e Mβ = sup{f (x); x ∈ Xβ },
vem
X X
S(f ; D) = Mα · vol Xα + Mβ · vol Xβ , onde
X X
Mα · vol Xα ≤ K · vol Xα < ε/2 e
 
X X X X
Mβ · vol Xβ =  Mβ · vol Xβ  ≤ MB · vol B
B∈P0 Xβ ⊂B B∈P0
Z−
= S(f¯; P0 ) < f (x)dx + ε/2.
X

R−
Assim |D| < δ ⇒ S(f ; D) < X f (x)dx + ε.
R−
Mostraremos agora que S(f ; D) ≥ X f (x)dx para toda decom-
posição D de X. Com efeito, seja Z a reunião das fronteiras dos con-
juntos Xi da decomposição D. Como vol Z = 0, o Lema nos dá δ ′ > 0
tal que, para toda partição P do bloco A com |P | < δ ′ , a soma dos volu-
mes dos blocos de P que intersectam Z é menor do que ε/K. Tomando
|P | < δ ′ , temos
X X
S(f¯; P ) = MB · vol B + MC · vol C,

onde chamamos de B os blocos de P que intersectam Z e de C os que


estão contidos no interior de algum Xi ∈ D. (Observe que, pelo Teorema
da Alfândega, um bloco que não esteja contido no interior de algum Xi
deve intersectar Z, pois todo bloco é conexo.) Ora, temos
X X
MB · vol B ≤ K · vol B < ε e
   
X X X X X
MC · vol C =  MC · vol C  ≤ Mi  vol C 
i C⊂Xi i C⊂Xi
X
≤ Mi · vol Xi = S(f ; D).
i

Vemos assim que, para toda decomposição D do conjunto X ⊂ A e


todo ε > 0, pode-se achar uma partição P de bloco A tal que S(f ; P ) ≤
Seção 5 A integral como limite de somas de Riemann 169

Z−
S(f ; D)+ε. Sendo f (x)dx o ı́nfimo do conjunto das somas S(f ; P ),
X
Z−
segue-se que f (x)dx ≤ S(f ; D) + ε.
X
Z

Como ε > 0 é arbitrário, concluı́mos que f (x)dx ≤ S(f ; D) para


X
toda decomposição de X. Isto conclui a demonstração.
Corolário 5 (da demonstração). Para toda função limitada f : X →
R no conjunto J-mensurável X ⊂ Rn , tem-se
Z Z−
f (x)dx = sup s(f.D) e f (x)dx = inf S(f ; D),
D X D
−X

onde o inf e o sup acima se referem a todas as decomposições D de X.


Uma decomposição pontilhada do conjunto J-mensurável X ⊂ Rn é
um par D∗ = (D, ξ), onde D = (X1 , . . . , Xk ) é uma decomposição de X
e ξ = (ξ1 , . . . , ξk ), com ξ1 ∈ X1 , . . . , ξk ∈ Xk . Em termos menos formais,
pontilhar a decomposição D = (X1 , . . . , Xk ) é escolher um ponto ξi em
cada conjunto Xi , i = 1, . . . , k.
A toda partição pontilhada D∗ fica associada a soma de Riemann
Σ(f ; D∗ ), definida por

X k
X
(f ; D∗ ) = f (ξi ) · vol Xi .
i=1

Diz-se que o número I é o limite das somas de Riemann Σ(f ; D∗ )


quando a norma |D| tende a zero, e escreve-se
X
I = lim (f ; D∗ ),
|D|→0

quando, para todo ε > 0 dado, pode-se obter δ > 0 tal que, para toda
decomposição D do conjunto X com norma |D| < δ tem-se |Σ(f ; D∗ ) −
I| < ε, seja qual for a maneira D∗ de se pontilhar D.
Teorema 12. Se f : X → R é integrável no conjunto J-mensurável
X ⊂ Rn então Z
f (x)dx = lim Σ(f ; D∗ ).
X |D|→0
170 Integrais Múltiplas Cap. 8

Demonstração. Para toda decomposição D de X tem-se


X
s(f ; D) ≤ (f ; D∗ ) ≤ S(f ; D),

seja qual for o modo D∗ de pontilhar


Z D. Pelo Teorema 11, temos
lim S(f ; D) = lim s(f ; D) = f (x)dx.
|D|→0 |D|→0 X Z

Segue-se imediatamente que lim Σ(f ; D ) = f (x)dx.
|D|→0 X

6 Exercı́cios

Seção 1. A definição de integral


1. Sejam f : A → R uma função limitada no bloco n-dimensional A e J um
número real com a seguinte propriedade: para todo ε > 0 dado, existe uma
partição P0 de A tal que |S(f ; P ) − J| < ε, qualquer que seja a partição P de
R−
A que refine P0 . Prove que J = A
f (x)dx. (Um resultado análogo vale para
a integral inferior.)
2. Dada uma partição P0 do bloco A, prove que as integrais inferior e superior de
uma função limitada f : A → R podem ser calculadas considerando-se apenas
as partições de A que refinam P0 .
3. Sejam C ⊂ A blocos n-dimensionais. Se a função f : A → R é integrável, prove
que sua restrição fC = f |C é integrável no bloco C.
4. Se a função f : A → R é contı́nua em todos os pontos do bloco A que têm a
primeira coordenada diferente de um certo número c, prove que f é integrável.

Seção 2. Conjuntos de medida nula


1. Prove que o gráfico de uma função integrável f : A → R, definida num bloco
n-dimensional, tem medida nula em Rn+1 .
2. Prove que um bloco n-dimensional não tem medida n-dimensional nula. Daı́
todo conjunto de medida nula tem interior vazio.
3. Se X ⊂ Rp e v ∈ Rp , escreve-se X + v = {x + v; x ∈ X}. Dadas M, N ⊂ Rp ,
superfı́cies de classe C 1 tais que dim M + dim N < p, prove que é denso em Rp
o conjunto V dos vetores v tais que M + v e N são disjuntos. Se M e N são
compactas, além de denso, V é aberto em Rp .
4. Prove que toda função integrável f : A → R é a diferença entre duas funções
integráveis não-negativas.

Seção 3. Cálculo com integrais


1. Sejam A, B blocos n-dimensionais, com B contido no interior de A. Se f : A →
R é a funçãoR igual a 1 nos pontos de B e igual a 0 fora de B, prove que f é
integrável e A f (x)dx = vol ·B.
Seção 6 Exercı́cios 171

P

2. Seja a um número positivo menor do que 1/2, logo an = 1 − δ, com
n=1
0 < δ < 1. Retire do intervalo [0, 1] um intervalo aberto J1 , de comprimento
a e centro no ponto 1/2. Em seguida, com centros nos pontos médios dos
intervalos restantes, retire os intervalos abertos J2 e J3 , ambos de comprimento
a2 /2. Repetindo o processo n vezes, restam 2n intervalos fechados, dois a dois
disjuntos, de iguais comprimentos. A (n+1)-ésima etapa consiste em retirar do
centro de cada um deles um intervalo aberto de comprimento an+1 /2n . Seja
S∞
X = [0, 1] − Jk o que restou depois de efetuadas todas essas operações.
k=1
Prove que o conjunto X tem as seguintes propriedades: é compacto, tem inte-
rior vazio, não possui pontos isolados e, principalmente, não tem medida nula.
Ele é chamado um “conjunto de Cantor com medida positiva”.
3. Se a função f : A1 × A2 → R é integrável, prove que existe um conjunto de
medida nula X ⊂ A1 tal que fx : A2 → R é integrável para todo x ∈ A1 − X.
4. Se uma função integrável
R f : A → R é igual a zero salvo num conjunto de
medida nula, prove que A f (x)dx = 0.

Seção 4. Conjuntos J-mensuráveis

1. Prove que o volume de um bloco B, definido por meio de uma integral, coin-
cide com aquele definido anteriormente como produto dos comprimentos das
arestas.
2. Justifique por que a bola B[a; r] é um conjunto J-mensurável.
3. Prove que o interior de um conjunto J-mensurável X ⊂ Rn também é
J-mensurável e vol ·X = vol(int ·X). Prove uma afirmação análoga para o
fecho X.
4. Seja f : A → R uma função limitada no bloco A ⊂ Rn , com f (x) ≥ 0 para
todo x ∈ A. Prove que se f é integrável então o conjuntoR C(f ) = {(x, y) ∈
Rn+1 ; x ∈ A, 0 ≤ y ≤ f (x)} é J-mensurável e vol C(f ) = A f (x)dx.
9

Mudança de Variáveis

Demonstraremos neste capı́tulo o importante Teorema da Mudança de


Variáveis em integrais múltiplas.
Começaremos estabelecendo as notações.
U e V são abertos do espaço euclidiano Rn ; h : U → V é um
difeomorfismo de classe C 1 .
X é um subconjunto compacto J-mensurável de U . A fronteira de
X, que tem medida nula, está contida em X (logo em U ) e sua imagem
por h, que é a fronteira do compacto h(X), tem medida nula (Teorema 6,
Capı́tulo 8). Portanto h(X) também é um conjunto J-mensurável.
Finalmente, f : h(X) → R é uma função integrável.
O Teorema da Mudança de Variáveis diz que a seguinte igualdade é
verdadeira:
Z Z
f (y)dy = f (h(x)) · | det h′ (x)|dx.
h(X) X

Ela é análoga para n variáveis daquela estabelecida no Vol. 1. (Vide


Teorema 2, Capı́tulo 11.) Notam-se, porém, algumas diferenças.
A função que, no caso de uma só variável, desempenhava o papel
de h não precisava ser um difeomorfismo. Para n > 1, entretanto, pelo
menos injetividade de h (ou algo equivalente) se faz necessário, sem o
que a fórmula não vale. (O estudo dessas situações gerais leva à noção
de grau, que é analisada em detalhe no livro “Curso de Análise”, Vol. 2.)
Outra diferença é o valor absoluto em | det h′ (x)|. É natural que o
determinante substitua a derivada h′ (x) pois, quando n > 1, esta não
é um número; mas o valor absoluto que ocorre na fórmula acima não
Seção 1 O caso unidimensional 173

parece estar presente quando n = 1. Na verdade, porém, ele está oculto


na igualdade
Z h(b) Z b
f (y)dy = f (h(x)) · h′ (x)dx.
h(a) a

De fato, se chamarmos de I o intervalo [a, b] e J = h(I) o intervalo


cujos extremos são h(a) e h(b), temos h(a) > h(b) quando h′ < 0, logo
a fórmula acima significa, em qualquer caso, que
Z Z
f (y)dy = f (h(x)) · |h′ (x)|dx,
J I

pois
Z Z h(b)
f (y)dy = f (y)dy se h(a) < h(b), isto é, se h′ (x) > 0,
J h(a)

e
Z Z h(b)
f (y)dy = − f (y)dy se h(b) < h(a), isto é, se h′ (x) < 0.
J h(a)

O Teorema de Mudança de Variáveis será provado por etapas.

1 O caso unidimensional

Dado o intervalo I = [a, b], escreveremos |I| = b − a.


Teorema 1. Sejam U, V ⊂ R abertos, h : U → V um difeomorfismo
C 1 , I ⊂ U um intervalo compacto, J = h(I) e f : J → R uma função
limitada. Então
Z
− Z

f (y)dy = f (h(x)) · |h′ (x)|dx.


J I

Demonstração. Sem perda de generalidade, podemos admitir que


f (y) ≥ 0 para todo y ∈ J pois, se somarmos a mesma constante positiva
a f , o lado esquerdo sofrerá o acréscimo
Z de c · |J| enquanto o acréscimo
sofrido pelo lado direito será de c · |h′ (x)|ds. Como h′ (x) não muda de
I
sinal para x ∈ I, o valor desta integral é c · |h(b) − h(a)| = c · |J| também.
Esta observação nos deixa livres para manipular desigualdades.
174 Mudança de Variáveis Cap. 9

As partições de J = h(I) são do tipo h(P ), dadas por intervalos da


forma Jr = h(Ir ), onde os Ir (r = 1, . . . , k) são os intervalos de uma
partição P de I. Para cada r, ponhamos Mr = sup f (y) = sup f (h(x))
y∈Jr x∈Ir
e cr = sup |h′ (x)|. Evidentemente, |P | → 0 ⇔ |h(P )| → 0.
x∈Ir

Pelo Teorema do Valor Médio, para cada r = 1, . . . , k existe ξr ∈ Ir


tal que |Jr | = |h′ (ξr )| · |Ir |. Pondo ηr = cr − |h′ (ξr )|, temos ηr ≥ 0 e,
em virtude da continuidade uniforme de h′ no intervalo I, lim ηr = 0.
|P |→0
P
k
Segue-se que lim ηr |Ir | = 0 pois
|P |→0 r=1

k
X k
X
0≤ ηr |Ir | ≤ (max ηr ) · |Ir | = (max ηr ) · |I|.
r r
r=1 r=1

Então
k
X k
X k
X
S(f ; h(P )) = Mr · |Jr | = Mr cr |Ir | − Mr ηr |Ir | e
r=1 r=1 r=1
k
X
S((f ◦ h) · |h′ |; P ) = Nr |Ir |,
r=1
onde Nr = sup (f (h(x)) · |h′ (x)|) ≤ Mr · cr
x∈Ir

pois se ϕ, φ : A → R são duas funções não-negativas limitadas quaisquer


então sup(ϕ(x) · ψ(x)) ≤ sup ϕ(x) · sup ψ(x). Logo, para toda partição
x∈A x∈A x∈A
P do intervalo I, vale:
k
X
S((f ◦ h) · |h′ |; P ) ≤ S(f ; h(P )) + M · ηr · |Ir |, onde M = sup f (y).
r=1 y∈J

Segue-se que
Z−
f (h(x)) · |h′ (x)| · dx = lim S((f ◦ h) · |h′ |; P )
I |P |→0
Z−
≤ lim S(f ; h(P )) = f (y)dy.
|P |→0 J
Seção 2 Difeomorfismos primitivos 175

Z− Z−
A desigualdade oposta, f (y)dy≤ f (h(x)) · |h′ (x)|dx, resulta da que
J I
vem de ser provada, usando-se h−1 : J→I em vez de h, (f ◦ h) · |h′ | : I→R
em vez de f e levando em conta que, para todo y = h(x), x ∈ I, tem-se
(h−1 )′ (y) = 1/h′ (x).
Então concluı́mos que

Z
− Z

f (y)dy = f (h(x)) · |h′ (x)|dx.


J I

2 Difeomorfismos primitivos

O próximo caso particular que consideraremos é aquele em que h é um


difeomorfismo primitivo.
Chamam-se primitivos os difeomorfismos h de um dos dois tipos
seguintes:
Tipo 1. São fixados os ı́ndices i, j, com 1 ≤ i < j ≤ n e h : Rn → Rn
é dado por

h(x) = h(x1 , . . . , xi , . . . , xj , . . . , xn ) = (x1 , · · · , xj , . . . , xi , . . . , xn ).

Tipo 2. Tem-se uma função ϕ : U → R, de classe C 1 , e para todo


x ∈ U vale
h(x) = (ϕ(x), x2 , . . . , xn ).
Teorema 2. Seja h : Rn → Rn um difeomorfismo primitivo do Tipo
1. Para todo conjunto J-mensurável X ⊂ Rn e toda função integrável
f : h(X) → R tem-se
Z Z
f (y)dy = f (h(x)) · | det h′ (x)| dx.
h(X) X

Demonstração. O difeomorfismo h é um operador linear, com


det h′ (x) = −1 paraZ todo x ∈ Rn , Zlogo | det h′ (x)| = 1. Devemos, por-
tanto, mostrar que f (y)dy = f (h(x))dx. Ora, para todo bloco
h(X) X
B ⊂ Rn , sua imagem h(B) é também um bloco, com arestas de mesmo
comprimento que as de B, logo vol h(B) = vol B. Como o volume de um
conjunto J-mensurável Z ⊂ Rn é o ı́nfimo dos números Σ vol Bi , onde
176 Mudança de Variáveis Cap. 9

os Bi são blocos, com Z ⊂ B1 ∪ · · · ∪ Bk , segue-se que vol ·h(Z) = vol Z.


Toda decomposição h(X) = Y1 ∪ · · · ∪ Yk é tal que Yi = h(Xi ), onde
X = X1 ∪ · · · ∪ Xk é uma decomposição de X. Todo ponto de Yi é da
forma h(ξi ), com ξi ∈ Xi . Logo
Z X
f (y)dy = lim f (h(ξi )) · vol Yi
h(X) |D|→0
X Z
= lim f (h(ξi )) · vol Xi = f (h(x))dx.
|D|→0 X

Teorema 3. O Teorema de Mudança de Variáveis em Integrais Múlti-


plas é válido quando X ⊂ Rn é um bloco retangular e h : U → V é um
difeomorfsmo primitivo do Tipo 2.
Demonstração. Por conveniência, escreveremos os pontos de Rn sob
a forma x = (s, w), com s ∈ R e w ∈ Rn−1 , e consideraremos o bloco
X = I × A como produto cartesiano do intervalo I = [a, b] pelo bloco
A ⊂ Rn−1 . Note-se que, para todo w ∈ A fixado, a função ϕw : s 7→
ϕ(s, w) = t é um difeomorfismo do intervalo I sobre o intervalo Jw =
ϕw (I) = ϕ(I × w). Observemos ainda que a matriz jacobiana de h
tem a primeira linha igual ao gradiente de ϕ e, a partir da segunda
linha, coincide com a matriz identidade (n − 1) × (n − 1). Portanto
∂ϕ
det h′ (x) = (s, w) = ϕ′w (s). Seja J ⊂ R um intervalo compacto
∂s
contendo Jw para todo w ∈ A. Então h(X) ⊂ J × A. Como de praxe,
f¯: J × A → R é a função integrável, igual a f nos pontos de h(X) e
igual a zero nos demais pontos de J ×A. Então o Teorema 1 nos permite
escrever:
Z Z Z
f (y)dy = f (t, w)dt dw = f¯(t, w)dt dw
h(X) h(X) J×A
   
Z Z
− Z Z

=  f¯w (t)dt dw =  fw (t)dt dw


A J A Jw
 
Z Z

=  fw (ϕ(s, w))|ϕ′w (s)|ds dw


A I
Z
= f (ϕ(s, w), w) · | det h′ (s, w)|ds dw
I×A
Z
= f (h(x)) · | det h′ (x)|dx.
X
Seção 3 Todo difeomorfismo C 1 é localmente admissı́vel 177

3 Todo difeomorfismo C 1 é localmente admissı́vel

Seja D o conjunto dos difeomorfismos de classe C 1 para os quais é válido


o Teorema de Mudança de Variáveis. Os elementos de D serão chamados
difeomorfismos admissı́veis.
Como sabemos, o objetivo deste capı́tulo é provar que todo difeomor-
fismo de classe C 1 é admissı́vel. Acabamos de ver que os difeomorfismos
primitivos pertencem a D. Além disso, como

det((h1 ◦ h2 )′ (x)) = det h′1 (h2 (x)) · det h′2 (x),

vê-se imediatamente que h1 ◦ h2 ∈ D quando h1 ∈ D e h2 ∈ D.


Por exemplo, todo difeomorfismo da forma

h(x) = (x1 , . . . , xj−1 , ϕ(x), xj+1 , . . . , xn )

é admissı́vel pois é composto de três difeomorfismos primitivos.


Nesta seção, provaremos que todo difeomorfismo de classe C 1 é lo-
calmente admissı́vel. Este é o conteúdo do teorema seguinte, o qual,
evidentemente, é um resultado provisório.
Teorema 4. Seja h : U → V um difeomorfismo de classe C 1 entre
abertos de Rn . Todo ponto de U possui uma vizinhança, restrita à qual
h é admisı́vel.
Demonstração. Basta provar que, dado x0 ∈ U , se h é definido numa
vizinhança de x0 e tem a forma

h(x) = (ϕ1 (x), . . . , ϕj (x), xj+1 , . . . , xn ), com j > 1,

então existe um difeomorfismo k, de classe C 1 , composto de difeomor-


fismos primitivos, cuja imagem é uma vizinhança de x0 , tal que

h(k(w)) = (ψ1 (w), . . . , ψj−1 (w), wj . . . , wn ).

Ora, as j primeiras linhas da matriz jacobiana de h são os vetores


grad ϕ1 , . . . , grad ϕj e as demais linhas coincidem com as da matriz
identidade n × n. Compondo h, se necessário, com um difeomorfismo
∂ϕj
do Tipo 1, podemos admitir que (x0 ) 6= 0. Pelo Teorema 5 do
∂xj
Capı́tulo 6 (aplicado à função ϕj ) existe um difeomorfismo admissı́vel

k : w 7→ (w1 , . . . , kj (w), wj+1 , . . . , wn )


178 Mudança de Variáveis Cap. 9

cuja imagem é uma vizinhança de x0 tal que ϕj (k(w)) = wj para todo


w no domı́nio de k. Então

h(k(w)) = (ϕ1 (k(w)), . . . , ϕj−1 (k(w)), wj , . . . , wn ),

completando assim a demonstração.

4 Conclusão: todo difeomorfismo de classe C 1 é admissı́vel

Para terminar a demonstração do Teorema de Mudança de Variáveis, va-


mos usar um resultado topológico elementar que estabeleceremos agora.
S
Seja X ⊂ Cλ uma cobertura do conjunto X ⊂ Rn . Diz-se que
λ∈L
δ > 0 é um número de Lebesgue dessa cobertura quando todo subcon-
junto Y ⊂ X com diâmetro < δ está contido em algum Cλ .
S
Teorema 5. Toda cobertura aberta X ⊂ Aλ de um conjunto com-
λ∈L
pacto X ⊂ Rn possui número de Lebesgue.

Demonstração. Se supusermos, por absurdo, que nenhum δ > 0 é


número de Lebesgue da cobertura dada, obteremos, para cada k ∈ N,
um conjunto Yk ⊂ X, com diam Yk < 1/k mas nenhum Aλ contém Yk .
Escolhemos um ponto yk em cada Yk . Passando a uma subseqüência,
se necessário, a compacidade de X assegura a existência de a ∈ X tal
que lim yk = a. Existe λ0 tal que a ∈ Aλ0 . Existe ainda ε > 0 com
B(a; ε) ⊂ Aλ0 , pois Aλ0 é aberto. Tomemos k ∈ N tão grande que
1/k < ε/2 e |a − yk | < ε/2. Então, lembrando que diam Yk < 1/k, para
todo y ∈ Yk temos

1 ε
|y − a| ≤ |y − yk | + |yk − a| < + < ε.
k 2

Segue-se que Yk ⊂ B(a, ε) ⊂ Aλ0 , uma contradição.

Exemplo 1. Sejam A1 = {(x, y) ∈ R2 ; x > 0, y > 1/x} e A2 = {(x, y) ∈


R2 ; y < 0}. A cobertura aberta X = A1 ∪ A2 não possui número de
Lebesgue. Com efeito, dado qualquer δ > 0, seja p = (x, 0), com 0 <
1 δ
< . Então X ∩ B(p; δ/2) é um subconjunto de X com diâmetro < δ,
x 2
o qual não está contido em A1 nem A2 .
Seção 5 Exercı́cios 179

Teorema 6. Sejam X ⊂ Rn um conjunto compacto J-mensurável,


h : U → V um difeomorfismo de classe C 1 entre abertos U, V ⊂ Rn e
f : h(X) → R uma função integrável. Então
Z Z
f (y)dy = f (h(x)) · | det h′ (x)|dx.
h(X) X

S
Demonstração. Existe uma cobertura aberta X ⊂ Wx ⊂ U tal que
x∈X
a restrição de h a cada Wx é um difeomorfismo admissı́vel. Seja δ > 0 um
número de Lebesgue dessa cobertura. Tomamos uma decomposição D =
(X1 , . . . , Xk ) de X tal que cada conjunto Xi tenha diâmetro inferior a δ.
(Para obter D, basta tomar uma partição P de um bloco A contendo X
de modo que os blocos Bi de P tenham arestas < δ na norma do máximo,

ou δ/ n na norma euclidiana. Em seguida, ponha Xi = Bi ∩ X.) Então
Z XZ XZ
f (y)dy = f (y)dy = f (h(x)) · | det h′ (x)|dx
h(X) h(Xi ) Xi
Zi i

= f (h(x)) · | det h′ (x)|dx.


X

Corolário 1. Seja T : Rn → Rn um operador linear. Para todo conjunto


compacto J-mensurável X ⊂ Rn tem-se vol T (X) = | det T | · vol X.

Basta aplicar o Teorema 6 à função caracterı́stica ξX em lugar de f ,


observando que é suficiente considerar o caso em que T é invertı́vel.

5 Exercı́cios

1. Seja f : U → Rm de classe C 1 no aberto U ⊂ Rm . Se, no ponto a ∈ U , a


derivada f ′ (a) : Rm → Rm é um isomorfismo, prove que

vol ·f (B(a; r))


lim = | det ·f ′ (a)|.
r→0 vol ·B(a; r)

2. Sejam M ⊂ Rn+1 uma hiperfı́cie orientável, ϕ : V0 → V uma parametrização


compatı́vel com a orientação de M e X ⊂ V um compacto tal que X0 =
ϕ−1 (X) ⊂ V0 é J-mensurável. Seja ainda v : M → Rn+1 um campo de vetores
180 Integrais Múltiplas Cap. 9

(não necessariamente tangentes ou normais a M ). O fluxo de v através do


conjunto X é, por definição, dado pela integral
Z
f (v, X) = hv(ϕ(x)), w(ϕ(x))idx
X0

∂ϕ ∂ϕ
onde w(ϕ(x)) = (x) × · · · × (x) (produto vetorial) para todo x ∈ V0 .
∂x1 ∂xn
Prove que f (v, X) não depende da parametrização ϕ.
10

Soluções dos exercı́cios

Cada uma das nove seções deste capı́tulo tem o mesmo tı́tulo de um dos nove capı́tulos
anteriores e contém soluções para exercı́cios propostos naquele capı́tulo. Em cada uma
delas, a notação p·q significa o q-ésimo exercı́cio da seção p do capı́tulo correspondente.

1 Topologia do Espaço Euclidiano


1.1. Se |u+v| = |u|+|v| então |u+v|2 = (|u|+|v|)2 , ou seja, |u|2 +2hu, vi+|v|2 =
|u| + 2|u| |v| + |v|2 , logo hu, vi = |u| |v| e daı́ v = α · u, com α ≥ 0.
2

1.2. Podemos supor que um dos vetores u = x − y e v = y − z, digamos v, é


diferente de zero. Então, de |u + v| = |x − z| = |x − y| + |y − z| = |u| + |v| segue-se
que v = αu, com α ≥ 0. Logo y − z = αx − αy e daı́ (1 + α)y = z + αx, ou seja
y = (1 − t)x + tz, com t = α/(1 + α); portanto 0 ≤ t ≤ 1.
hx, yi
1.3. Seja z = · x. Como hy − z, xi = 0, segue-se que hy − z, yi = 0, o que
|x|2
nos dá |y|2 = hz, yi e daı́ |x|2 |y|2 = hx, yi2 , logo x e y são colineares.
1.4. Um cálculo imediato mostra que, como |x| = |y|, vale hz, xi = hz, yi, por-
tanto hz, y − xi = 0.
2.1. Devemos ter c = a + t(b − a), onde t é tal que hc, bi = hc, ai. Isto nos dá
ha, b − ai
t=− . O Teorema de Pitágoras assegura que |c| < |x| para todo x 6= c na
|b − a|2
reta ab.
2.2. Vale |(1 − t)x + ty| < (1 − t)r + tr = r se 0 < t < 1 em virtude de 1.1.
2.3. Dados a, b ∈ B(X; r), existem A, B ∈ X tais que |a − A| < r e |b − B| < r.
Então, para todo t ∈ [0, 1], tem-se (1 − t)A + tB = C ∈ X e |(1 − t)a + tb − C| ≤
(1 − t)|a − A| + t|b − B| < (1 − t)r + tr = r, logo (1 − t)a + tb ∈ B(X; r).
2.4. Isto pode ser provado usando o fato de que a função y = x2 é convexa
(cfr. vol. 1, pag. 108) ou, diretamente, assim: dados (a, m) e (b, n) em X, para
mostrar que ((1 − t)a + tb, (1 − t)m + tn) ∈ X, basta provar que (1 − t)2 a2 + t2 b2 +
2t(1−t)ab ≤ (1−t)a2 +tb2 pois a2 ≤ m e b2 ≤ n. Levando em conta que 1−t−(1−t)2 =
182 Soluções dos exercı́cios Cap. 10

t(1 − t), isto equivale a provar que 2t(1 − t)ab ≤ t(1 − t)(a2 + b2 ), o que é claro pois
a2 + b2 ≥ 2ab.
2.5. Se |T · v| = a > 0 então |T · nv| = n · a logo T não é limitada. Seja
c = max{|T e1 |, . . . , |T em |}. Se o conjunto X ⊂ Rm é limitado então existe k > 0 tal
Pm P
que, para todo x = (x1 , . . . , xm ) ∈ X, tem-se |xi | ≤ k, logo |T · x| = | xi · T ei | ≤
P P i=1
|xi | |T ei | ≤ c · |xi | ≤ c · k.
3.1. Se x ∈ int ·X então existe r > 0 com B(x; r) ⊂ X. Para todo y ∈ B(x; r),
o argumento do texto mostra que, pondo s = r − |y − x|, tem-se B(y; s) ⊂ B(x; r),
donde B(y; s) ⊂ X e daı́ y ∈ int .X. Portanto x ∈ int .X ⇒ x ∈ int . int .X, ou seja,
int .X ⊂ int . int .X. A inclusão contrária é óbvia.
3.2. Se A é um aberto contido em X então todo ponto x ∈ A é centro de uma
bola contida em A, logo contida em X. Assim A ⊂ int .X.
3.3. A fronteira do conjunto Qn , formado pelos pontos de Rn cujas coordenadas
são números racionais, é todo o Rn . Se X ⊂ Rn é aberto então X ∩ fr .X = ∅.
Qualquer bola com centro num ponto x ∈ fr .X contém pontos de X portanto pontos
fora de fr .X. Assim nenhum ponto x ∈ fr .X é um ponto interior.
3.4. Basta observar que todo aberto A ⊂ Rn é a reunião das bolas abertas nele
contidas e que a projeção de uma bola aberta é um intervalo aberto (fato que fica
mais evidente quando se usa em Rn a norma do máximo).
3.5. Tome em cada aberto A dessa coleção um ponto pertencente ao conjunto
não-vazio A ∩ Qn . Como Qn é enumerável o mesmo ocorre com o conjunto dos pontos
escolhidos, a cada um dos quais corresponde um único aberto da coleção pois estes
são disjuntos.
4.1. Para todo ε > 0 dado, existem k1 , k2 ∈ N tais que k > k1 , k ∈ N′ implicam
|xk − a| < ε e k > k2 , k ∈ N′′ ⇒ |xk − a| < ε. Seja k0 = max{k1 , k2 }. Como
N = N′ ∪ N′′ , segue-se que k > k0 ⇒ |xk − a| < ε. Logo lim xk = a.
4.2. Se existissem um subconjunto infinito N′ ⊂ N e um ponto a ∈ Rn tais
que lim′ xk = a então existiria k1 ∈ N tal que k ∈ N′ , k > k1 ⇒ |xk − a| < 1 ⇒
n∈N
|xk | < |a| + 1. Ao mesmo tempo, se for lim |xk | = +∞, existirá k2 ∈ N tal que
k > k2 ⇒ |xk | > |a| + 1. Tomando k0 = max{k1 , k2 }, para todo k > k0 terı́amos
|xk | < |a| + 1 e |xk | > |a| + 1, um absurdo. Logo (a) ⇒ (b). Em seguida, se o
conjunto NX do item (c) fosse infinito então os termos xk com k ∈ NX formariam
uma seqüência limitada, a qual possuiria uma subseqüência convergente. Logo (b) ⇒
(c). Finalmente, admitindo (c), para todo A > 0 o conjunto dos ı́ndices k ∈ N tais
que |xk | ≤ A possui um elemento máximo k0 logo k > k0 ⇒ |xk | > A, o que prova a
implicação (c) ⇒ (a).
4.3. Tome B(a; ε) ⊂ A.
4.4. Como a ∈ X ∩ (Rn − X), para todo k ∈ N existem xk ∈ X e yk ∈ Rn − X
tais que |xk − a| < 1/k e |yk − a| < 1/k, logo lim xk = lim yk = a. A recı́proca é
óbvia.
5.1 De X ⊂ X e Y ⊂ Y , segue-se que X ∪ Y ⊂ X ∪ Y . Como X ∪ Y é fechado,
resulta daı́ que X ∪ Y ⊂ X ∪ Y . Por outro lado, de X ⊂ X ∪ Y e Y ⊂ X ∪ Y segue-se
que X ⊂ X ∪ Y e Y ⊂ X ∪ Y , logo X ∪ Y ⊂ X ∪ Y . Analogamente, X ⊂ X e Y ⊂ Y
implicam X ∩ Y ⊂ X ∩ Y logo X ∩ Y ⊂ X ∩ Y porque X ∩ Y é fechado. Tomando
X = (a, b) e Y = (b, c) temos X ∩ Y = ∅ e X ∩ Y = {b}.
Seção 1 Topologia do Espaço Euclidiano 183

5.2. Para todo k ∈ N, sejam Xk = {xr ; r ≥ k} e F o conjunto dos valores de


T de (xk ). Segue-se da definição que a ∈ F ⇔ a ∈ X k para todo k ∈ N. Logo
aderência
F = X k .̇ portanto F é fechado.
k∈N
5.3. Se A é aberto e a ∈ A ∩ X então a = lim xk , xk ∈ X. Para todo k
suficientemente grande, tem-se xk ∈ A, isto é, xk ∈ A ∩ X, portanto a ∈ A ∩ X.
Para a recı́proca, se A não fosse aberto, existiria um ponto a ∈ A não-interior, logo
a ∈ A ∩ X, onde X = Rn − A. Mas, neste caso, A ∩ X = ∅, logo não se teria
A ∩ X ⊂ A ∩ X.
5.4. Escrevendo os pontos de Rm+n sob a forma (x, y), com x ∈ Rm e y ∈ Rn , a
igualdade X × Y = X × Y resulta do fato de que (a, b) = lim(xk , yk ) ⇔ a = lim xk e
b = lim yk .
5.5. As duas afirmações decorrem do seguinte: para todo conjunto X ⊂ Rn ,
tem-se a reunião disjunta Rn = int .X ∪ fr .X ∪ int .(Rn − X), sendo X fechado se, e
somente se, Rn − X é aberto.
5.6. Se d(A, B) = 0 então existem seqüências de pontos xk ∈ A e yk ∈ B
tais que lim |xk − yk | = 0. Passando a uma subseqüência, se necessário, podemos
admitir que existe a = lim xk , pois A é limitado. Então vale também lim yk = a, logo
a ∈ A ∩ B. Como A e B são disjuntos não se pode ter a ∈ int .A nem a ∈ int .B.
Logo a ∈ fr .A ∩ fr .B.
5.7. Seja C ⊂ Rn convexo. Se a, b ∈ C e 0 ≤ t ≤ 1 então a = lim ak e b = lim bk
com ak , bk ∈ C logo (1 − t)ak + tbk ∈ C. Daı́ (1 − t)a + tb = lim[(1 − t)ak + tbk ] ∈ C,
portanto C é convexo.
5.8. Sabemos que existe x̄ ∈ C tal que d(x, C) = |x − x̄|. Se existisse outro ponto
ȳ ∈ C com |x − x̄| = |y − ȳ| então, pelo Exercı́cio 2.2 terı́amos |x − z| < |x − x̄| para
todo ponto z ∈ [x̄, ȳ] ⊂ C e então não seria |x − x̄| = d(x, C).
6.1. O supremo de um conjunto de números reais pertence ao fecho desse
conjunto. Logo diam .K = lim |xk − yk | com xk , yk ∈ K. Passando a uma sub-
seqüência, se necessário, temos lim′ xk = a ∈ K. Analogamente, existe N′′ ⊂ N′ com
k∈N
lim′′ yk = b ∈ K. Então |a − b| = lim′′ |xk − yk | = diam .K.
k∈N k∈N
6.2. Se X não fosse limitado então, para todo k ∈ N, X não estaria contido na
bola Bk = B(0; k). Então a cobertura aberta X ⊂ ∪Bk não admitiria subcobertura
finita. Portanto X é limitado. Se X não fosse fechado, existiria uma seqüência de
pontos xk ∈ X com lim xk = a ∈ / X. Então os abertos Ak = Rn −B[a; 1/k] formariam
n
uma cobertura de R − {a}, portanto de X, sem subcobertura finita.
6.3. Seja a um valor de aderência de (xk ). Se não fosse a = lim xk , existiriam
ε > 0 e uma infinidade de ı́ndices k tais que |xk − a| ≥ ε. Passando a uma sub-
seqüência, se necessário, terı́amos lim′ xk = b, com |b − a| ≥ ε, logo b 6= a seria outro
k∈N
valor de aderência. Quanto ao exemplo, basta tomar xk = 0 para k ı́mpar e xk = k ·e1
se k é par.
6.4. Como o compacto K e o fechado Rn − U são disjuntos, existem a ∈ K,
b ∈ Rn − U tais que x ∈ K, y ∈ Rn − U ⇒ |x − y| ≥ |a − b| = ε > 0. Portanto, para
todo x ∈ K, tem-se B(x; ε) ⊂ U . Se x ∈ K e |y − x| < ε então [x, y] ⊂ B(x, ε) logo
[x, y] ⊂ U .
6.5. Se a = lim xk com xk ∈ X para todo k ∈ N então o conjunto K, formado
pelos pontos xk mais o ponto a, é compacto, logo X ∩K é fechado, portanto a ∈ X ∩K.
184 Soluções dos exercı́cios Cap. 10

Em particular, a ∈ X. Portanto X é fechado.


7.1. Se (f (xk )) possuisse uma subseqüência convergindo para o ponto b, des-
prezando os termos a ela não pertencentes, o conjunto K = {f (xk ); k ∈ N} ∪ {b}
seria compacto logo f −1 (K) seria um compacto contendo todos os xk e então (xk )
possuiria uma subseqüência convergente. Portanto (a) ⇒ (b). Reciprocamente, su-
pondo (b), sejam K ⊂ Rn compacto e (xk ) uma seqüência em f −1 (K). Então a
seqüência (f (xk )), contida no compacto K, possui uma subseqüência convergente,
com lim′ f (xk ) = b ∈ K. Pela hipótese (b), (xk )k∈N′ tem uma subseqüência conver-
k∈N
gente, com lim′′ xk = a. Pela continuidade de f , tem-se f (a) = b, logo a ∈ f −1 (K).
k∈N
Assim f −1 (K) é compacto.
7.2. Podemos escrever, para todo z 6= 0 em R2 :
a a1 an−1 
0
p(z) = z n + + ··· + + an .
zn z n−1 z

Daı́ resulta que |zk | → +∞ ⇒ |p(zk )| → +∞.


7.3. Para cada x ∈ X, seja ξ(x) ∈ K o único ponto tal que f (x, ξ(x)) = 0.
Se lim xk = x0 em X, admitamos que a = lim′ ξ(xk ) e b = lim′′ ξ(xk ) sejam va-
k∈N k∈N
lores de aderência da seqüência (ξ(xk )). Pela continuidade de f tem-se f (x0 , a) =
lim′ f (xk , ξ(xk )) = 0 e, analogamente, f (x0 , b) = 0. Logo a = b. A seqüência
k∈N
de pontos ξ(xk ) no compacto K tem portanto um único valor de aderência, logo
converge para o ponto c = lim ξ(xk ) ∈ K, com f (x0 , c) = lim f (xk , ξ(xk )) = 0. Assim
c = ξ(x0 ) e ξ é contı́nua.
7.4. Para toda seqüência de pontos xk = π(xk , yk ) ∈ π(F ) com lim xk = a, de
(xk , yk ) ∈ F segue-se que yk ∈ K. Passando a uma subseqüência: lim′ yk = b, logo
k∈N
lim′ (xk , yk ) = (a, b) ∈ F , pois F é fechado. Então a = π(a, b) ∈ π(F ), portanto π(F )
k∈N
é fechado.
8.1. Com efeito, se d(F, G) = 0 então existem seqüências de pontos xk ∈ F e
yk ∈ G tais que |xk − yk | < 1/k, logo lim |xk − yk | = 0 mas, como f (xk ) = 0 e
f (yk ) = 1, tem-se |f (xk ) − f (yk )| = 1 e assim f não é uniformemente contı́nua.
8.2. Dado ε > 0, existe δ > 0 tal que y, y ′ ∈ Y , |y−y ′ | < δ ⇒ |f (y)−f (y ′ )| < ε/2.
Sejam agora x, x′ ∈ X com |x − x′ | < δ. Existem seqüências de pontos yk , yk′ ∈ Y tais
que lim yk = x e lim yk′ = x′ . Para todo k suficientemente grande, tem-se |yk −yk′ | < δ,
portanto |f (yk ) − f (yk′ )| < ε/2. Então |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε.
Portanto f : X → Rn é uniformemente contı́nua.
8.3. Se f (X) fosse ilimitado, para cada k ∈ N existiria xk ∈ X tal que |f (xk )| > k.
A seqüência (f (xk )) assim obtida não possuiria subseqüência convergente. Mas como
X é limitado, a seqüência de pontos xk ∈ X teria uma subseqüência convergente, por-
tanto de Cauchy. E sendo f uniformemente contı́nua, a subseqüência correspondente
(f (xk ))k∈N′ seria de Cauchy, logo convergente. Esta contradição mostra que f (X)
deve ser limitado.
8.4. Se xk , yk ∈ X são tais que lim |xk − yk | = 0 então lim |f (xk ) − f (yk )| = 0 e
lim |g(xk ) − g(yk )| = 0. Como |f (xk ) + g(xk ) − (f (yk ) + g(yk ))| ≤ |f (xk ) − f (yk )| +
|g(xk ) − g(yk )|, segue-se que f + g é uniformemente contı́nua. Analogamente, se
Seção 1 Topologia do Espaço Euclidiano 185

|f (x)| ≤ A e |g(x)| ≤ B para todo x ∈ X, então

|f (xk ) · g(xk ) − f (yk ) · g(yk )| =


= |(f (xk ) − f (yk )) · g(xk ) + f (yk )(g(xk ) − g(yk ))| ≤
≤ |f (xk ) − f (yk )| · B + A · |g(xk ) − g(yk )|

donde lim(f (xk ) · g(xk ) − f (yk ) · g(yk )) = 0, logo f · g é uniformemente contı́nua.


8.5. Sejam v = x̄ − x e w = y − x̄. Devemos provar que hv, wi ≥ 0. Para todo
t ∈ [0, 1], temos |v| ≤ |v + tw| pois v + tw ∈ C. Elevando ao quadrado, obtemos
|v|2 ≤ |v|2 + 2thv, wi + t2 · |w|2 . Simplificando concluı́mos que t[t|w|2 + 2hv, wi] ≥ 0
para todo t ∈ [0, 1]. Daı́ resulta que hv, wi ≥ 0 pois se fosse hv, wi < 0 então terı́amos
t[t|w|2 + 2hv, wi] < 0 para todo t positivo, menor do que −2hv, wi/|w|2 .
8.6. Por 8.5, temos hȳ − x̄, x− x̄i ≤ 0 e hx̄− ȳ, y − ȳi ≤ 0. A segunda desigualdade
escreve-se hȳ − x̄, ȳ −yi ≤ 0. Somando-a com a primeira, vem hȳ − x̄, x− x̄+ ȳ −yi ≤ 0,
donde hȳ − x̄, ȳ − x̄i ≤ hȳ − x̄, y − xi. Por Schwarz: |ȳ − x̄|2 ≤ |ȳ − x̄| |y − x|, logo
|ȳ − x̄| ≤ |y − x|.
9.1. A aplicação f : X → S n−1 , definida por f (x) = x/|x|, é contı́nua e bijetiva,
logo é um homeomorfismo, pois X é compacto.
9.2. Defina f : S n−1 × R → Rn − {0} t
 pondo f(x, t) = e · x e observe que
y
g : Rn − {0} → S n−1 × R, dada por g(y) = , ℓn|y| é a inversa de f .
|y|
9.3. Considere a composição das aplicações abaixo indicadas:

S m × S n → S m × Rn+1 → S m × R × Rn → (Rm+1 − {0}) × Rn → Rm+n+1 ,

onde a terceira é dada pelo exercı́cio anterior e as demais são inteiramente óbvias.
Todas são homeomorfismos sobre suas imagens.
9.4. X é a reunião de duas circunferências com o ponto a em comum e Y é um
intervalo aberto da reta cujo ponto médio é b.
9.5. Seja f : X − {a} → Y − {b} um homeomorfismo. Defina F : X → Y pondo
F (x) = f (x) se x 6= a e F (a) = b. Como X é compacto e F é uma bijeção, basta
provar que F é contı́nua, ou seja, que lim xk = a ⇒ lim f (xk ) = b (onde xk ∈ X −{a}).
Como Y é compacto, basta mostrar que b é o único valor de aderência da seqüência
(f (xk )). Ora, se fosse lim′ f (xk ) = d 6= b terı́amos d = f (c), c ∈ X − {a} e lim′ xk = c
k∈N k∈N
pois f −1 : Y − {b} → X − {a} é contı́nua. Mas devia ser lim′ xk = a. Final.
k∈N
S
10.1. Fixando a ∈ X, temos X = Cax , uma reunião de conjuntos conexos
x∈X
com o ponto a em comum, logo X é conexo. Recı́proca óbvia.
10.2. Considere em Rn uma reta r que intersecte o segmento [a, b] em seu ponto
médio. Dados x, y ∈ r, os conjuntos [a, x] ∪ [x, b] = Ax e Ay = [a, y] ∪ [y, b] têm
apenas os pontos a, b em comum. Supondo, por absurdo, que nenhum dos Ax , x ∈ r,
estivesse contido em Rn − Z escolherı́amos, para cada x ∈ r, um ponto f (x) ∈ Ax ∩ Z.
Isto definiria uma aplicação injetiva f : r → Z, o que não existe pois Z é enumerável
e r não é.
10.3. Sejam a 6= b em S 1 e a′ 6= b′ em S 2 . Então S 1 − {a, b} é desconexo mas
S − {a′ , b′ } é conexo, homeomorfo a S 1 × R.
2
186 Soluções dos exercı́cios Cap. 10

10.4. Um subconjunto de R, para ser homeomorfo a S 1 deveria ser compacto e


conexo, logo seria um intervalo [a, b], o qual fica desconexo pela remoção de um ponto
interior, mas a remoção de qualquer um dos seus pontos não desconecta S 1 .
10.5. X é a reunião dos dois eixos coordenados mais a hipérbole xy = 1, logo
tem 3 componentes conexas.
11.1. O ponto essencial é observar que se f : X → Rn é uniformemente contı́nua
então toda seqüência de Cauchy (xk ) em X é transformada por f numa seqüência
de Cauchy (f (xk )). Portanto, se lim xk = a então existe lim f (xk ) = b pois toda
seqüência de Cauchy em Rn é convergente. O limite b não depende da seqüência (xk )
escolhida pois se lim yk = a, ainda com yk ∈ X, a seqüência (x1 , y1 , x2 , y2 , . . . ) ainda
converge para a, logo é de Cauchy, e sua imagem (f (x1 ), f (y1 ), f (x2 ), f (y2 ), . . . ) é
de Cauchy, e tem a subseqüência (f (xk )) convergindo para b, logo lim f (yk ) = b.
Portanto xk → a ⇒ f (xk ) → b e daı́ lim f (x) = b.
x→a
11.2. Pelo exercı́cio anterior, para todo x = X existe lim f (y) = F (x). Isto
y→x
define F : X → Rn . Para todo ε > 0 dado, tome-se δ > 0 tal que y, y ′ ∈ Y ,
|y − y ′ | < δ ⇒ |f (y) − f (y ′ )| < ε/2. Agora, se x, x′ ∈ X e |x − x′ | < δ, tomamos
seqüências (yk ) e (yk′ ) em Y , com lim yk = x e lim yk′ = x′ . Desprezando alguns
termos iniciais, podemos supor que |yk − yk′ | < δ, onde |f (yk ) − f (yk′ )| < ε/2 para
todo k ∈ N, logo |f (x) − f (x′ )| = lim |f (yk ) − f (yk′ )| ≤ ε/2 < ε.
k
 11.3. Seja p(z) = a0 + a1 z+ · · · + ak z , com ak 6= 0. Então p(z) =
a 0 a 1 a k−1
z k k + k−1 + · · · + + ak = z k (ϕ(z) + ak ), onde lim ϕ(z) = 0. Logo
z z z z→∞
lim p(z) = ∞.
z→∞

11.4. Sabemos que, para todo ε > 0 existe δ > 0 tal que t ∈ R, 0 < |t| < δ ⇒
sen t
n
t − 1 < ε. Tomando em R a norma do máximo, e supondo δ < 1, vemos que

sen(x1 · x2 · · · xn )
0 < |x| < δ ⇒ |x1 · x2 · · · xn | < δ ⇒ − 1 < ε.
x1 · x2 · · · xn
11.5. Sejam αi uma coordenada não-nula de v e βi a coordenada correspondente
βi
de v0 . Então lim f (x) · αi = βi , donde lim f (x) = · Tome α = αi /βi .
x→a x→a αi

2 Caminhos diferenciáveis
1.1. Temos a = lim tk , com tk 6= a e f (tk ) = b para todo k ∈ N. Portanto
f (tk ) − f (a) b−b
f (a) = lim f (tk ) = b e f ′ (a) = lim = lim = 0.
k→∞ tk − a k→∞ tk − a
1.2. Para todo t ∈ I, temos f (t) = (x(t), |x(t)|), com f (a) = (0, 0). Portanto
a é um ponto no qual |x(t)| assume seu valor mı́nimo, logo a derivada da função
t 7→ |x(t)| é zero para t = a. Como −|x(t)| ≤ x(t) ≤ |x(t)| para todo t, segue-se que
x′ (a) = 0. Logo f ′ (a) = (x′ (a), |x|′ (a)) = (0, 0).
1.3. Na verdade, como f (t) + f ′′ (t) = (0, 0, t), este ponto já pertence ao eixo
vertical de R3 .

1.4. Temos g ′ (t) = (−ab sen bt, ab cos bt, c), logo |g ′ (t)| = a2 b2 + c2 . Assim, a
relação pedida é a2 b2 + c2 = 1.
Seção 2 Caminhos diferenciáveis 187

2.1. Aplique o Teorema de Rolle à função ϕ : [a, b] → R, definida por ϕ(t) =


|f (t)|2 .
2.2. Simplificamos a notação, escrevendo x • y em vez de ϕ(x, y). Então podemos
ver que

f1 (t + h) • f2 (t + h) − f1 (t) • f2 (t) =
=f1 (t + h) • [f2 (t + h) − f2 (t)] + [f1 (t + h) − f1 (t)] • f2 (t).

Dividindo por h e fazendo h → 0 vem g ′ (t) = f1′ (t) • f2 (t) + f1 (t) • f2′ (t). O caso
de aplicações p-lineares segue as mesmas linhas: se g(t) = f1 (t) • · · · • fp (t) então
P
p
g ′ (t) = f1 (t) • · · · • fi′ (t) • · · · • fp (t). Quanto ao determinante de uma matriz
i=1
m × m, basta notar que ele é uma função m-linear das linhas dessa matriz, a qual
assume o valor 1 na matriz identidade m × m.
2.3. A aplicação g é diferenciável (de fato, C ∞ ) porque é a composta t 7→ f (t) 7→
ϕ 2 2
(f (t), . . . , f (t)) −→ f (t)k , onde ϕ : Rn × · · · × Rn é a aplicação k-linear dada pelo
produto de matrizes.
Rb Rb Rb
3.1. Temos |f (b) − f (a)| = | a f ′ (t)dt| ≤ a |f ′ (t)|dt ≤ a ϕ′ (t)dt = ϕ(b) − ϕ(a).
3.2. Aplique a cada uma das funções-coordenada do caminho f o resultado
correspondente já provado no Volume 1 (pag. 135).
3.3. Note que
Z b
hf (b), g(b)i − hf (a), g(a)i = ϕ′ (t)dt,
a

onde ϕ(t) = hf (t), g(t)i. Observe ainda que ϕ′ (t) = hf ′ (t), g(t)i + hf (t), g ′ (t)i.
3.4. De um modo geral, se A : Rm → Rn é uma transformação
Rb linear e f :R I → Rm
n b
é um caminho então t 7→ A·f (t) é um caminho em R com a A·f (t)dt = A· a f (t)dt.
Isto se vê diretamente a partir da definição de integral de um caminho. Em seguida,
note que w 7→ v × w é um operador linear em R3 .
3.5. Aqui usaremos um resultado elementar sobre conjuntos convexos, a ser
demonstrado no Capı́tulo 3 (Teorema 7): se A ⊂ Rn é convexo e α1 + · · · + αk = 1
P
k
com α1 ≥ 0, . . . , αk ≥ 0 então x1 , . . . , xk ∈ A ⇒ αi xi ∈ A. Daı́ resulta que
i=1
se (Pk∗ ) é uma seqüência de partições pontilhadas de [a, b] com lim |Pk | = 0 então
  Z b
1 P P 1 1
(f, Pk∗ )= · f ; Pk∗ ∈A para todo k∈N, portanto f (t)dt =
b−a b−a b−a a
1 X
lim (f ; Pk ) ∈ A.
k→∞ b − a

4.1. Para toda partição P = {a = t0 < t1 < · · · < tk = b} tem-se |B − A| ≤


ℓ(f ; P ) ≤ ℓ(f ). Como ℓ(f ) = |B − A|, segue-se que ℓ(f ; P ) = |B − A|. Resulta
então do Exercı́cio 1.2 do Capı́tulo 1 que os pontos A = f (t0 ), f (t1 ), . . . , f (tk ) = B
estão dispostos ordenadamente sobre o segmento de reta AB. Então, para todo
t ∈ [a, b], tem-se f (t) = A + ϕ(t) · v, com v = B − A, e a função ϕ : [a, b] → [0, b]
é não-decrescente. Como f ∈ C 1 , segue-se do Exercı́cio 11.5 que ϕ ∈ C 1 e, como
é não-decrescente, ϕ′ ≥ 0. Logo f é uma reparametrização do caminho retilı́neo
f (t) = A + t · v.
188 Soluções dos exercı́cios Cap. 10

4.2. Seja g : [0, L] → R2 tal que g ′ (t) = f (t) para todo t. (As funções-coordenada
RL RL RL
de g são primitivas das de f .) Então ℓ(g) = 0 |g ′ (t)|dt = 0 |f (t)|dt = 0 dt = L. Por
RL RL
outro lado, observando que | 0 f (t)dt| = L, vemos que |g(L) − g(0)| = | 0 g ′ (t)dt| =
RL
| 0 f (t)dt| = L. Pelo exercı́cio anterior, temos g(t) = g(0) + ϕ(t) · v, com v =
g(L) − g(0). Logo 1 = |f (t)| = |g ′ (t)| = |ϕ′ (t)| · |v| = ϕ′ (t) · |v| pois ϕ′ ≥ 0, já que ϕ
não muda de sinal, ϕ(0) = 0 e ϕ(L) = 1. Assim, ϕ′ (t) = 1/|v| é constante e o mesmo
se dá com f (t) = ϕ′ (t) · v.
4.3. Fixando a ∈ U , seja A o conjunto dos pontos de U que podem ser ligados a
a por um caminho poligonal contido em U . É fácil ver que A é aberto e que também
é aberto o conjunto B dos pontos que não podem ser ligados a a por um caminho
poligonal contido em U . Então U = A ∪ B é uma cisão. Como U é conexo e A 6= ∅,
segue-se que U = A. Evidentemente todo caminho poligonal é retificável.
4.4. É claro que |x − a| ≤ dU (x, a) logo lim dU (xk , a) = 0 ⇒ lim xk = a. Para
provar a recı́proca, basta observar que se B = B(a; r) é uma bola aberta contida em
U então, para pontos xk ∈ B, tem-se dU (xk , a) = |xk − a|, portanto lim xk = a ⇒
lim |xk − a| = 0 ⇒ lim dU (xk , a) = 0 pois xk ∈ B para todo k suficientemente grande.

3 Funções reais de n variáveis


1.1. Se x e x + tei pertencem a U então [x, x + tei ] ⊂ U e f (x + tei ) − f (x) =
∂f
(x + θtei ) · t = 0, onde 0 < θ < 1.
∂xi
1.3. Dois pontos quaisquer de uma bola podem ser ligados por um caminho po-
ligonal contido nela, o qual tem seus lados paralelos aos eixos. Segue-se daı́, pelo
argumento usado no Exercı́cio 4.3 do Capı́tulo 2, que o mesmo ocorre em qual-
quer aberto conexo. Fixando a ∈ U , para todo ponto x ∈ U , unindo-o ao ponto
a por um caminho desse tipo, em cada segmento retilı́neo do caminho varia apenas a
∂f
i-ésima coordenada e, como = 0, a função f se mantém constante ao longo desse
∂xi
segmento. Então f (x) = f (a) para todo x ∈ U e f é constante.

∂f
1.4. Seja M ≥ (x) para todo x ∈ U e todo i = 1, 2, . . . , n. Dados x, x +
∂xi
v ∈ U , com v = (α1 , . . . , αn ), definamos v0 , v1 , . . . , vn ∈ Rn pondo v0 = 0 e vi =
vi−1 + αi ei para i = 1, . . . , n, de modo que vn = v. Então f (x + v) − f (x) =
Pn
f (x + vi ) − f (x + vi−1 ). Pelo Teorema do Valor Médio de uma só variável, temos
i=1
∂f
|f (x + vi ) − f (x + vi−1 )| = (z) · αi , onde z ∈ [vi−1 , vi ]. Logo |f (x + v) − f (x)| ≤
∂xi
Pn
M· |αi | e daı́ resulta a continuidade de f .
i=1

∂f 1 (tα)2 tβ α2 β
2.1. Se v = (α, β) então (0, 0) = lim · 2 2
= 2 para todo
∂v t→0 t (tα) + (tβ) α + β2
∂f ∂f
v 6= 0. Em particular, (0, 0) = 0 e (0, 0) = 0, logo grad f (0, 0) = 0. Se f fosse
∂x ∂y
∂f
diferenciável no ponto (0, 0), terı́amos (0, 0) = h grad f (0, 0), vi, o que não ocorre.
∂v
Seção 3 Funções reais de n variáveis 189

∂f
2.2. A condição (u) > 0 se u ∈ S n−1 implica que f (tu) < f (u) para 1 − ε <
∂u
t < 1 e ε > 0 suficientemente pequeno. (Cfr. Teorema 4 do Cap. 8, vol. 1.) Portanto
o mı́nimo de f (x) para |x| ≤ 1 é atingido num ponto a tal que |a| < 1. Então
ϕ(t) = f (a + tv) tem, para todo v ∈ Rn , um mı́nimo local quando t = 0, logo
∂f
(a) = ϕ′ (0) = 0.
∂v
2.3. Tem-se f (0) = lim f (tx) = lim t · f (x) = 0. Logo, para todo v ∈ Rn ,
t→0+ t→0+
∂f f (tv) tf (v)
(0) = lim = lim = f (v), ou seja, h grad f (0), vi = f (v). Mudando
∂v t→0+ t t→0+ t
a notação, temos f (x) = h grad f (0), xi portanto f é uma função linear de x. A
função ϕ cumpre ϕ(tx, ty) = t · ϕ(x, y) para todo t > 0 mas não é linear, logo não é
diferenciável no ponto (0, 0). (Observação: quando sabemos que um caminho possui
limite num ponto, podemos calculá-lo como um limite lateral.)
P ∂f
2.4. A igualdade f (x) = f (a) + (a) · (xi − ai ) + r(x) mostra que r é uma
∂xi
∂r
função de classe C 1 , com (a) = 0 para i = 1, . . . , n. A continuidade das derivadas
∂xi
∂r
no ponto a e o Teorema do Valor Médio nos asseguram então que, para todo ε > 0
∂xi
dado, existe δ > 0 tal que |x − a| < δ e |y − a| < δ implicam |r(x) − r(y)| < ε|x − y|.
Subtraindo membro a membro as desigualdades f (x) = f (a)+h grad f (a), x−ai+r(x)
e f (y) = f (a)+h grad f (a), y −ai+r(y) vem f (x)−f (y) = h grad f (a), x−yi+r(x, y),
onde, escrevendo r(x, y) = r(x) − r(y), temos |x − a| < δ, |y − a| < δ ⇒ |r(x, y)| <
ε|x − y|.
   
∂ ∂f ∂ ∂f ∂f
3.1. Como e são identicamente nulas, não depende de
∂x ∂y ∂y ∂x ∂y
∂f
xe não depende de y. Fixando (x0 , y0 ) ∈ I × J podemos então definir as funções
∂x
∂f ∂f
ϕ̄ : I → R e ψ̄ : J → R pondo ϕ̄(x) = (x, y0 ) e ψ̄(y) = (x0 , y), as quais são de
∂x ∂y
∂f ∂f
classe C 1 e cumprem ϕ̄(x) = (x, y), ψ̄(y) = (x, y) para todo (x, y) ∈ I × J.
∂x ∂y
Então

f (x, y) = f (x, y) − f (x0 , y) + f (x0 , y) − f (x0 , y0 ) + f (x0 , y0 ) =


Z x Z y
∂f ∂f
= (s, y)ds + (x0 , t)dt + f (x0 , y0 ) =
x0 ∂x y0 ∂y
Z x Z y
= ϕ̄(s)ds + ψ̄(t)dt + f (x0 , y0 ) = ϕ(x) + ψ(y).
x0 y0

∂2f
3.2. Defina f : R × R → R, pondo f (x, y) = g(x + y, x − y). Verifique que
∂x∂y
é identicamente nula e aplique o exercı́cio anterior.
3.3. Derivando duas vezes em relação a t, a igualdade f (tx) = t2 · f (x) nos dá
1 P ∂2f
f (x) = (tx)xi xj . Tomando o limite quando t → 0 por valores positivos
2 i,j ∂xi ∂xj
P 1 ∂2f
chegamos a f (x) = aij xi xj , onde aij = (0).
2 ∂xi ∂xj
190 Soluções dos exercı́cios Cap. 10

∂ϕ ∂ϕ
3.4. Tome as igualdades hf (x), (x)i = 0, hf (x), (x)i = 0, derive a pri-
∂xi ∂xj
meira em relação a xj e a segunda em relação a xi . Use Schwarz.
4.1. Isto é óbvio para k = 1, pela própria definição de diferenciabilidade e, para
k = 2, foi provado no texto. No caso geral, pela hipótese de indução, considerando
∂r
que as derivadas parciais se anulam, junto com todas as suas derivadas até a
∂xi
| grad r(x)|
ordem k − 1, no ponto 0, conclui-se que lim = 0. Ora, pelo Teorema do
x→0 |x|k−1
Valor Médio, para todo x numa bola de centro 0 contida em U , existe θ ∈ (0, 1) tal
que r(x) = r(x) − r(0) = h grad r(θx), xi, logo

|r(x)| |h grad r(θx), xi| | grad r(θx)|


= ≤ ,
|x|k |x|k |x|k−1

|r(x)|
portanto lim = 0.
x→0 |x|k
4.2. Siga as mesmas linhas da demonstração do Teorema 5 (Cap. 3), fazendo uso
1 P ∂3f
do exercı́cio anterior e observando que, na expressão (a)αi αj αk a
3! i,j,k ∂xi ∂xj ∂xk
i-ésima variável αi ocorre em 3 parcelas (como 1o¯ , 2o¯ ou 3o¯ fator), logo a derivada
1P ∂3f
dessa expressão relativamente à sua i-ésima variável é igual a (a)αj αk .
2 j,k ∂xi ∂xj ∂xk
O caso geral é análogo.
5.1. Se [hij ] é a matriz da forma quadrática H então hii = H · v 2 , com v =
ei = (0, . . . , 1, . . . , 0). Portanto os elementos da diagonal da matriz de uma forma
quadrática positiva (ou negativa) são todos números positivos (ou negativos) e assim
sua soma não pode ser igual a zero.
5.2. Seja X o conjunto dos pontos de máximo local estrito de f . Dado x ∈ X,
existe uma bola B(x; 2δ), contida em U , tal que y ∈ B(x; 2δ), y 6= x ⇒ f (y) < f (x).
Escolhamos, para cada x ∈ X, um ponto qx ∈ Qn ∩ B(x; δ) e um número racional
rx > 0 tal que |x − qx | < rx < δ, portanto B(qx ; rx ) ⊂ B(x; 2δ) e daı́ y ∈ B(qx ; rx ),
y 6= x ⇒ f (y) < f (x). A correspondência x 7→ (qx , rx ) é injetiva pois se qx = qx′ e
rx = rx′ então x′ ∈ B(qx ; rx ) e x ∈ B(qx′ ; rx′ ). Se fosse x 6= x′ terı́amos f (x)′ < f (x)
e f (x) < f (x′ ).
5.3. Como grad f (x, y) = −2 sen(x2 + y 2 ) · (x, y), os pontos crı́ticos de f são a
origem
√ x = y = 0 e os pontos das circunferências com centro na origem e raios iguais
a kπ, k ∈ N. Quanto à função g(x, y) = x3 − y 3 − x + y, cujo gradiente  é o vetor
2 2 6x 0
grad g(x, y) = (3x − 1, −3y + 1), sua matriz hessiana é Hg(x, y) = . Os
0 −6y
√ √ √ √ √ √
√ de g√são A = ( 3/3, 3/3), B = (− 3/3. 3/3), C = ( 3/3, − 3/3)
pontos crı́ticos
e D = (− 3/3,  −√ 3/3). Nesses  pontos, a matriz hessiana de g assume cada um
±2 3 0√
dos 4 valores , os sinais correspondendo aos das coordenadas de A,
0 ±2 3
B, C e D. Logo Hg, é positiva no ponto C, que é portanto um ponto de mı́nimo
local, negativa no ponto B de máximo local e, nos pontos crı́ticos A e D, a forma
hessiana Hg é indefinida, logo esses pontos não são máximos nem mı́nimos locais: são
os chamados “pontos de sela”.
Seção 3 Funções reais de n variáveis 191

5.4. A função F : U → R, definida por F (x) = f (x) se x ∈ U e F (x) = 0


se x ∈ fr .U , é contı́nua no compacto U e diferenciável em U . A menos que F seja
identicamente nula (em cujo caso todo ponto de U é crı́tico para f ), seu valor máximo
ou seu valor mı́nimo é atingido num ponto a ∈ U , o qual é um ponto crı́tico de f .
∂f ∂f
5.5. Como = 2x(2x2 − 2y 2 − 1) e = 2y(2y 2 − 2x2 + 3), os pontos crı́ticos
∂x ∂y  

−2 0
de f são (0, 0) e (± 22 , 0), onde as matrizes hessianas são Hf (0, 0) = e
0 6

 
4 0
Hf (± 22 , 0) = . Portanto a origem (0, 0) é um ponto de sela (máximo em
0 4

relação a x e mı́nimo em relação a y) enquanto os pontos (± 22 , 0) são de mı́nimo
local.
P
k P
k,n
5.6. Temos f (x) = hx − ai , x − ai i = (xj − aij )2 onde x = (x1 , . . . , xn )
i=1 i,j=1
∂f P
e ai = (ai1 , . . . , ain ). Então, para j = 1, . . . , n, temos (x) = 2(kxj − aij ).
∂xj i
1P
Portanto, o ponto x é crı́tico para f se, e somente se, xj = aij para todo j, ou
k i
1 Pk
seja, x = ai . (Baricentro do sistema formado pelos pontos a1 , . . . , ak .) Temos
k i=1
∂2f ∂2f
ainda (x) = 0 se m 6= j e (x) = 2k, portanto a matriz hessiana é diagonal
∂xm ∂xj ∂x2j
1 P k
e positiva, logo o ponto crı́tico x = ai é de mı́nimo. (Note que f é convexa.)
k i=1
6.1. Para x, y ∈ Rn e t ∈ [0, 1], sejam x̄, ȳ ∈ A tais que d(x, A) = |x − x̄|
e d(y, A) = |y − ȳ|. Então (1 − t)x̄ + tȳ ∈ A (pois o fecho de um conjunto con-
vexo é também convexo). E como d(x, A) = d(x, A), temos: f ((1 − t)x + ty) =
d((1 − t)x + ty, A) ≤ |[(1 − t)x + ty] − [(1 − t)x̄ + tȳ]| = |(1 − t)(x − x̄) + t(y − ȳ)| ≤
(1 − t)|x − x̄| + t|y − ȳ| = (1 − t)f (x) + tf (y).
6.2. Seja a ∈ X um ponto de mı́nimo local da função convexa f : X → R. Se exis-
tisse x ∈ X tal que f (x) < f (a) então, para todo t ∈ [0, 1], terı́amos
f ((1 − t)a + tx) ≤ (1 − t)f (a) + tf (x) < (1 − t)f (a) + tf (a) = f (a). Tomando
t > 0 pequeno, obterı́amos pontos y = (1 − t)a + tx tão próximos de a quanto se
deseje, com f (y) < f (a), logo a não seria um ponto de mı́nimo local.
6.3. Todo ponto a ∈ U é ponto médio de segmentos de reta [b, c] ⊂ U tão
1
pequenos quanto se queira, logo f (a) ≤ [f (b) + f (c)] e então não se pode ter f (a) >
2
f (b) e f (a) > f (c).
6.4. Se a, b ∈ U são pontos crı́ticos da função convexa diferenciável f : U → R
então ambos são pontos de mı́nimo global de f . Em particular, f (a) = f (b). Assim,
t ∈ [0, 1] ⇒ f ((1 − t)a + tb) ≤ (1 − t)f (a) + tf (b) = f (a), donde f ((1 − t)a + tb) = f (a)
pela minimalidade.
6.5. Se f (x) ≤ c e f (y) ≤ c então, para todo t ∈ [0, 1], vale f ((1 − t)x + ty) ≤
(1 − t)f (x) + tf (y) ≤ (1 − t)c + tc = c. Para toda função monótona f : I → R, definida
num intervalo I ⊂ R, o conjunto {x ∈ I; f (x) ≤ c} é um intervalo, mas f pode não
ser convexa.
192 Soluções dos exercı́cios Cap. 10

6.6. Para f : X → R quase-convexa e x, y ∈ X, seja c = max{f (x), f (y)}.


Então f (x) ≤ c e f (y) ≤ c, logo f ((1 − t)x + ty) ≤ c = max{f (x), f (y)} para todo
t ∈ [0, 1]. Reciprocamente, supondo que f ((1 − t)x + ty) ≤ max{f (x), f (y)} para
quaisquer x, y ∈ X e t ∈ [0, 1], sejam x, y ∈ X tais que f (x) ≤ c e f (y) ≤ c. Então
max{f (x), f (y)} ≤ c, portanto t ∈ [0, 1] ⇒ f ((1 − t)x + ty) ≤ max{f (x), f (y)} ≤ c e
f é quase-convexa.

4 Funções implı́citas
1.1. Seja X o conjunto dos pontos x0 ∈ R que têm uma vizinhança V na qual
está definida uma função ξ tal que f (x, ξ(x)) = 0 para todo x ∈ V . Esta função é
∂f
única, pois a condição 6= 0 assegura que f é monótona ao longo de cada reta
∂y
vertical. Logo, podemos considerar ξ : X → R. Pelo Teorema da Função Implı́cita,
X é aberto e ξ é de classe C k . Cada intervalo I, componente de X, é fechado pois
∂f /∂x
se xk ∈ I ⊂ X e lim xk = x0 então, como ξ ′ = − , temos |ξ ′ | ≤ M em I,
∂f /∂y
portanto ξ : I → R é uniformemente contı́nua e, assim, existe y0 = lim ξ(xk ), com
f (x0 , y0 ) = lim(xk , ξ(xk )) = 0. Pelo Teorema da Função Implı́cita, temos x0 ∈ X.
Como R é conexo e X 6= ∅, segue-se que X = R.
∂f
1.2. Em cada ponto x0 ∈ A, uma das derivadas parciais de f , digamos ,
∂xi
é 6= 0. Logo f transforma um segmento de reta paralelo ao i-ésimo eixo, contendo
x0 e pequeno bastante para estar contido em A, injetiva e monotonamente sobre um
intervalo contendo f (x0 ) e contido em f (A), portanto f (A) é aberto.
∂f
1.3. Temos = cos z 6= 0 numa vizinhança da origem, logo perto de 0
∂z
a equação x4 + 2x · cos y + sen z = 0 define z como função de x e y. Tem-se
∂z −∂f /∂x −(4x3 + 2 cos y) ∂z −∂f /∂y 2x sen y
= = e = = ·
∂x ∂f /∂z cos z ∂y ∂f /∂z cos z
1.4. A função ξ : R → [0, 1) é definida por ξ(0) = 0 e ξ(x) = e−|x| se x 6= 0. Ela é
a única função com valores em [0, 1) que cumpre f (x, ξ(x)) = 0 mas não é contı́nua.
∂ϕ
1.5. Seja ϕ : Rn+1 → R definida por ϕ(x, y) = g(x)−y(1+y 4 ). Então (x, y) =
∂y
−1 − 5y 4 6= 0 para todo (x, y) ∈ Rn+1 . Assim, para todo x0 ∈ Rn , pondo y0 = f (x0 )
temos ϕ(x0 , y0 ) = 0. Pelo Teorema da Função Implı́cita, existem uma bola B =
B(x0 , δ) ⊂ Rn , um intervalo J = [y0 − ε, y0 + ε] e uma função ξ : B → J de classe C k
tais que, para todo x ∈ B, ξ(x) é o único ponto em J tal que ϕ(x, ξ(x)) = 0. Como
f é contı́nua (prove isto!), podemos tomar δ > 0 tão pequeno que f (B) ⊂ J. E,
sabendo que ϕ(x, f (x)) = 0 para todo x ∈ B, concluı́mos que f (x) = ξ(x) se x ∈ B,
portanto f é de classe C k .
2
2.1. Seja U ⊂ Rn o conjunto aberto formado pelas matrizes x do tipo n × n para
as quais pelo menos um determinante menor Xij é 6= 0. A ij-ésima derivada parcial
∂f
da função f : U → R, dada por f (x x) = det .x
x é x) = (−1)i+j Xij , portanto todo
(x
∂xij
número c ∈ R é um valor regular de f . Como M = f −1 (0), concluı́mos que M é uma
hiperfı́cie orientável. O espaço tangente Tp M é formado pelas matrizes x ortogonais
a grad f (pp). Ora, as coordenadas de grad f (x x) são (−1)i+j Xij . Logo grad f (pp) é a
Seção 4 Funções implı́citas 193

matriz n × n cujo único elemento não-nulo é igual a 1 e está na n-ésima linha com a
n-ésima coluna. Portanto, uma matriz x = [xij ] é ortogonal a grad f (pp) se, e somente
se, xnn = 0. Tais matrizes formam o espaço Tp M .
2.2 Seja U = {(x, y, z) ∈ R3 ; x2 + y 2 6= 0} o complementar
p do eixo vertical em
R3 . A função f : U → R, definida por f (x, y, z) = z 2 + ( x2 + y 2 − 2)2 , é de classe !
p p
∞ 2x( x2 + y 2 − 2) 2y( x2 + y 2 − 2)
C e seu gradiente é grad f (x, y, z) = p , p , 2z ,
x2 + y 2 x2 + y 2
o qual se anula apenas nos pontos da circunferência x2 + y 2 = 4, z = 0, todos no
nı́vel zero de f . Portanto 1 é valor regular e f −1 (1) = M é uma superfı́cie C ∞ em
R3 . M é o toro obtido pela rotação de uma circunferência vertical de raio 1, cujo
centro descreve a circunferência x2 + y 2 = 4 no plano z = 0.
2.3. Dado p ∈ M , podemos escrever os pontos de Rn+1 sob a forma (x, y), com
x ∈ Rn , y ∈ R e tomar um aberto U ⊂ Rn+1 com p ∈ U , tal que V = M ∩ U seja
o gráfico V = {(x, ξ(x)); x ∈ V0 } de uma função ξ : V0 → R, de classe C k (k ≥ 1).
Então a função f : U → R, definida por f (x, y) = y − ξ(x), não possui pontos crı́ticos
∂f
pois ≡ 1. Além disso, V = f −1 (0), portanto em cada ponto z ∈ V , o vetor
∂y
v(z) = grad f (z) é ortogonal a Tz M , portanto v : V → Rn+1 é um campo de classe
C k−1 de vetores não-nulos normais a M .
3.1. Sejam f, ϕ : Rn+1 → R dadas por f (x) = |x|2 e ϕ(x) = hAx, xi. Então
grad f (x) = 2x e grad ϕ(x) = 2Ax. Os pontos crı́ticos de f |M , onde M = ϕ−1 (1)
são os pontos x ∈ M tais que grad f (x) = λ · grad ϕ(x), ou seja, x = λ · Ax, logo x
é um autovetor de A, correspondente ao autovalor λ−1 . De x = λ · Ax resulta que
|x|2 = hx, xi = λhAx, xi = λ. Portanto, quando x varia em M , o maior valor de |x|2
é o maior λ tal que 1/λ é autovalor de A. Noutras palavras, a maior distância de um

ponto do elipsóide M à origem é 1/ µ, onde µ = 1/λ é o menor autovalor de A.
n+1
3.2. Sejam f, ϕ : R → R, f (x) = |x − a|2 , ϕ(x) = hb, xi, H = ϕ−1 (c),
grad f (x) = 2(x − a), grad ϕ(x) = b. Se x ∈ H é ponto crı́tico de f |H então hb, xi = c
λ
e 2(x − a) = λb, ou seja, x = a + b. O produto interno da última igualdade por b nos
2
λ 2 λ c − hb, ai c − hb, ai
dá c = hb, xi = hb, ai + |b| , donde = , e daı́ x = a + b. Este
2 2 |b|2 |b|2
2
é o único ponto crı́tico de f |H, logo é o ponto em que |x − a| (e portanto |x − a|)
atinge seu menor valor com x ∈ H.
3.3. Consideradas as funções f, ϕ : R2n → R, f (x, y) = hx, yi e ϕ(x, y) =
|(x, y)|2 = |x|2 +|y|2 , temos M = ϕ−1 (1), grad f (x, y) = (y, x) e grad ϕ(x, y) = 2(x, y).
Portanto (x, y) ∈ M é ponto crı́tico de f |M se, e somente se, (y, x) = 2λ(x, y) logo
1
y = 2λx e x = 2λy, o que nos dá λ = ± e y = ±x. Assim, os pontos crı́ticos de f |M
2
1
são os da forma (x, ±x) com |x|2 = · Os pontos (x, x) são de máximo e os (x, −x)
2
1 1
de mı́nimo, logo − ≤ hx, yi ≤ para todo (x, y) ∈ M . Para todo par de vetores
2 √ 2 √  √ √
2 2 2 2 1
não-nulos x, y ∈ Rn , tem-se x, y ∈ M , portanto h x, yi ≤ e daı́
2|x| 2|y| √ 2|x|√ 2|y| 2
2 2
|hx, yi| ≤ |x| |y|, a igualdade valendo apenas quando x=± y, isto é, quando
2|x| 2|y|
x e y são colineares.
194 Soluções dos exercı́cios Cap. 10

2 P
3.4. Seja ϕ : Rn x) =
→ R, ϕ(x x2ij . x) = (−1)i+j Xij e
Como grad f (x
i,j
x) = 2[xij ], onde Xij é o ij-ésimo determinante menor de x , se M = ϕ−1 (n),
grad ϕ(x
o máximo de f |M é atingido na matriz x tal que (*) (−1)i+jP Xij = 2λxij , donde
(−1)i+j Xij xij = 2λx2ij . Somando em i e j: n · det x = 2λ x2ij = 2λ · n, logo
P i,j P
det x = 2λ. Fixando i e somando em j, vem: det x = 2λ · x2ij = det x · x2ij , logo
j j
as linhas de x têm comprimento 1. A igualdade (*) também dáP(−1)i+j Xij xkj =
2λxij xkj . Tomando k 6= i e somando em j, obtemos 0 = det x · xij xkj , portanto
j
as linhas de x são duas a duas ortogonais. Assim, x é uma matriz ortogonal, com
det x = 1. Daı́ resulta a desigualdade de Hadamard.
√ √ √
3.5. Suponhamos que s = n p + · · · + n p = n n p não seja a menor soma de n
números positivos cujo produto é p. Então existiria s̄ = x1 + · · 
· + xn < snas mesmas
s̄ n s n
condições. Ora, pelo Exemplo 9, terı́amos x1 · x2 · · · xn ≤ < < p, uma
n n
contradição.

5 Aplicações diferenciáveis
1.1. Como o operador f ′ (0) não possui ponto fixo no compacto S n−1 , existe ε > 0
tal que |u| = 1 ⇒ |f ′ (0)·u−u| ≥ ε. Sendo f diferenciável,
 com f (0) = 0, temos f (x) =
′ ′ x
f (0) · x + ρ(x) · |x| = |x| f (0) · + ρ(x) e existe δ > 0 tal que 0 < |x| < δ ⇒
|x|  
x x
|ρ(x)| < ε. Portanto, se 0 < |x| < δ então |f (x) − x| ≥ |x| f ′ (0)· − −|ρ(x)| >0
|x| |x|
e daı́ f (x) 6= x.
1.2. Pela definição de F , tem-se F (tx)/t = F (x) se t > 0 e F (tx)/t = −F (−x)
F (tx)
se t < 0. Como F (0) = 0, supondo F diferenciável no ponto 0, existe lim ,
t→0 t
F (tx)
logo F (x) = −F (−x) e F (x) = lim = F ′ (0) · x, portanto F coincide com a
t→0 t
′ m+1 n
transformação linear F (0) : R → R . A recı́proca é óbvia.
1.3. Aplicando oTeorema  de Schwarz  a cada  função-coordenada de f , vemos que
′′ ∂ ∂f ∂ ∂f
f (a) · ei · ej = (a) = (a) = f ′′ (a) · ej · ei e, por bilinearidade,
∂xj ∂xi ∂xi ∂xj
resulta que f ′′ (a) · u · v = f ′′ (a) · v · u para quaisquer u, v.
1.4. Isto se reduz ao Exercı́cio 2.1 do Capı́tulo 2 se observarmos que f ′ (x) · v
é o vetor velocidade do caminho f ◦ λ, onde λ : (−ε, ε) → U é tal que λ(0) = x e
λ′ (0) = v.

2.1. Seja R(h, k) = A(x + h) · (v + k) − A(x) · v − (A′ (x) · h) · v − A(x) · k =


(A(x + h) − A(x) − A′ (x) · h) · v + (A(x + h) − A(x)) · k = r(h) · v + s(h) · k, onde
r(h) |r(h)| |r(h)| |k|
lim = 0 e lim s(h) = 0. Então, como ≤ e ≤ 1, segue-se
h→0 |h| h→0 |h| + |k| |h| |h| + |k|
R(h, k)
que lim = 0.
h,k→0 |h| + |k|
Seção 6 Aplicações Inversas e Implı́citas 195
 
a −b
2.2. A matriz da transformação linear f ′ (z0 ), sendo da forma , pode
b a
 
cos θ − sen θ √ a
ser escrita como ρ com ρ = a2 + b2 , cos θ = √ , sen θ =
sen θ cos θ a2 + b 2
b
√ , logo f ′ (z0 ) é uma rotação de ângulo θ seguida de uma homotetia de razão
a2 + b 2
ρ, portanto preserva ângulos.
2.3. As colunas da matriz jacobiana de f são (2x, 0, 2(x + y)) e (0, 2y, 2(x + y)),
que são L.I. salvo quando x = y = 0;
2.4. As linhas da matriz jacobiana de f são (2x, −2y, 0), (y, x, 0), (z, 0, x) e
(0, z, y). Se x2 + y 2 6= 0, as 3 primeiras são L.I. caso x 6= 0 e a 1a¯ , a 2a¯ e a 4a¯ são L.I.
quando y 6= 0. A imagem de f ′ (0, 0, z) é o plano formado pelos pontos (0, 0, s, t) em
R4 .
2.5. Basta notar que as linhas da matriz jacobiana de f são (1, 1, 1), (2x, 2y, 2z)
e (3x2 , 3y 2 , 3z 2 ), logo o jacobiano de f é igual a 6(z − x)(z − y)(y − x).
3.1. Suponhamos, por absurdo, que |f ′ (x)| > M , ou seja, |f ′ (x)| = M + ε,
ε > 0, para algum x ∈ U . Como |f ′ (x)| é o máximo de |f ′ (x) · u| para |u| = 1 e
S m−1 é compacta, existiria u ∈ Rm com norma 1, tal que |f ′ (x) · u| = M + ε. Pela
definição de diferenciabilidade, a este ε corresponde δ > 0 tal que 0 < t < δ ⇒
|f (x + tu) − f (x)| = |f ′ (x) · tu + r(tu)| ≥ t|f ′ (x) · u| − |r(tu)|, com |r(tu)| < tε. Então
0 < t < δ ⇒ |f (x + tu) − f (x)| > t(M + ε) − tε = t · M . Pondo v = tu, temos |v| = t,
logo |f (x + v) − f (x)| > M · |v|, uma contradição.
3.2. Tem-se ϕ′ (x) · h = h(T ′ (x) · h) · f (x), g(x)i + hT (x) · f (x), g ′ (x) · hi + hT (x) ·

(f (x) · h), g(x)i.
3.3. Levando em conta que (g ◦ f )′ = (g ′ ◦ f ) · f ′ , vale: (g ◦ f )′′ = [(g ′ ◦ f ) · f ′ ]′ =
(g ◦ f )′ · f ′ + (g ′ ◦ f ) · f ′′ = (g ′′ ◦ f ) · f ′ · f ′ + (g ′ ◦ f ) · f ′′ . Isto significa que, para x ∈ U ,

y = f (x) ∈ V e u, v ∈ Rm , tem-se: (g ◦ f )′′ (x) · u · v = g ′′ (y) · (f ′ (x) · u) · (f ′ (x) · v) +


g ′ (y) · f ′′ (x) · u · v ∈ Rp .
3.4. A interpretação correta é ϕ′ (t) · v = [A′ (tx) · x] · v, v ∈ Rm . Para dirimir
a confusão, suponha que U ⊂ Rp e não U ⊂ Rm . Então A′ (tx) ∈ L(Rp ; Rn ), logo
A′ (tx) · v não faz sentido.
3.5. Aplique a Desigualdade do Valor Médio a g : U → Rn , definida por g(x) =
f (x) − T · x.
3.6. Tem-se ϕ′ (x) · v = (f ′ (x) · v) · a = h grad f (x), vi · a.

6 Aplicações Inversas e Implı́citas


1.1. Pelo Exercı́cio 3.1 do Capı́tulo 5, temos |ϕ′ (x) · v| < c|v| < |v| para todo
x ∈ U e todo v ∈ Rm − {0}, logo |f ′ (x) · v| = |v + ϕ′ (x) · v| ≥ |v| − |ϕ′ (x) · v| > 0
se v 6= 0. Assim, f ′ (x) : Rm → Rm é um isomorfismo, para todo x ∈ U . Pelo
Teorema da Aplicação Inversa, f é um difeomorfismo local, portanto transforma cada
aberto A ⊂ U num aberto f (A) ⊂ Rm . Além disso, y ∈ U ⇒ |f (x) − f (y)| =
|x − y + ϕ(x) − ϕ(y)| ≥ |x − y| − c|x − y| = (1 − c)|x − y| portanto f é injetiva, logo
é um difeomorfismo de U sobre o aberto f (U ). Suponhamos agora U = Rm . Para
provar que f (Rm ) é fechado, seja (xk ) uma seqüência tal que lim f (xk ) = y ∈ Rm .
1
Como |xk −xr | ≤ |f (xk )−f (xr )|, vemos que (xk ) é de Cauchy portanto converge:
1−c
196 Soluções dos exercı́cios Cap. 10

lim xk = x. Então f (x) = lim f (xk ) = y ∈ f (Rm ). Assim, f (Rm ) é aberto e fechado.
Como Rm é conexo, tem-se f (Rm ) = Rm .
2 2
1.2. A aplicação f : Rn → Rn , definida por f (x
x) = x k , é de classe C ∞ , com
Pk
f ′ (x
x) · v = x i−1 · v · x k−i . No ponto x = I n (matriz identidade n × n), temos
i=1
f ′ (II n ) · v = kvv , logo f ′ (II n ) é um isomorfismo. Pelo Teorema da Aplicação Inversa,
existem abertos U , V , ambos contendo I n , tais que f é um difeomorfismo de U sobre
V . Eles respondem a questão.
1.3. Em primeiro lugar, note que o conjunto U dos operadores positivos é aberto
no espaço vetorial Rn(n+1)/2 dos operadores auto-adjuntos (matrizes simétricas). Isto
resulta do critério clássico de positividade: os n menores principais da matriz são
positivos. A bijetividade de f é um corolário do Teorema Espectral, segundo o qual
todo operador positivo possui uma única raiz quadrada positiva. Resta apenas provar
que, para todo X ∈ U , a derivada f ′ (X) : Rn(n+1)/2 → Rn(n+1)/2 é um isomorfismo.
Ora, temos f ′ (X) · V = X · V + V · X. Seja {u1 , . . . , un } uma base de Rn formada por
autovetores de X, com X · ui = λi ui . Então f ′ (X) · V = 0 ⇒ XV ui + λi V ui = 0 ⇒
X(V ui ) = −λi · (V ui ). Como X não possui autovalores negativos, tem-se V · ui = 0
(i = 1, . . . , n), logo V = 0 e f ′ (X) é injetiva, logo bijetiva.
1.4. Observação preliminar: se U ⊂ Rn é aberto, com n > 1, e q ∈ Rn é um
ponto isolado da fronteira de U então U ∪ {q} é aberto. Com efeito, seja B uma bola
aberta de centro q, que não contenha outro ponto de fr .U além de q. Como n > 1,
o aberto B − {q} é conexo e certamente contém pontos de U pois q ∈ fr .U , mas não
contém pontos fora de U pois, pelo Teorema da Alfândega, teria de conter pontos de
fr .U . Então B − {q} ⊂ U e daı́ B ⊂ U ∪ {q}, logo q ∈ int .U ∪ {q} e U ∪ {q} é aberto.
Isto posto, notemos que basta considerar o caso em que p ∈ U é o único ponto onde
det .Jf se anula. Então f em U − {p} é um difeomorfismo local, logo transforma
abertos em abertos. É suficiente agora provar que f (U ) é aberto. Isto é claro se
existir x 6= p em U com f (x) = f (p). Suporemos então que, pondo q = f (p), temos
q 6= f (x) para todo x 6= p em U . Sejam B = B(p; r) tal que B ⊂ U e S = S(p; r). A
fronteira do aberto V = f (B − {p}) é {q} ∪ f (S), logo q é um ponto isolado de fr .V
e, pela observação preliminar, f (B) = V ∪ {q} é aberto, logo q = f (p) ∈ int f (U ),
donde se conclui que f (U ) é aberto. Quanto ao Teorema Fundamental da Álgebra,
se p : R2 → R2 é um polinômio complexo não-constante, seu determinante jacobiano
em cada ponto z ∈ R2 é igual a |p′ (z)|, logo se anula apenas num número finito de
pontos, que são as raı́zes de p′ (z). Portanto p(R2 ) é um conjunto aberto. Por outro
lado, como lim p(z) = ∞, p(R2 ) também é fechado. Sendo R2 conexo, segue-se que
z→∞
p(R2 ) = R2 , logo existe z ∈ R2 tal que p(z) = 0.
1.5. Os passos para a conclusão do exercı́cio são bastante claros. Para provar
que a função α é C ∞ , use o Exercı́cio 10, da Seção 4, Cap. 8 do Volume 1 (pag. 100).
Para provar que g é um difeomorfismo, use o Exercı́cio 1, Capı́tulo 6 deste volume.

2.1. Isto resulta imediatamente do Teorema 5 (Forma Local das Submersões)


pois cada ponto p ∈ A pertence a um aberto Z ⊂ A tal que f (Z) = W é um aberto
em Rn (com a notação do enunciado daquele teorema).
2.2. Basta observar que grad f1 (x), . . . , grad fn (x) são as linhas da matriz
jacobiana de f no ponto x, a qual tem posto n se, e somente se, esses vetores são L.I.
Seção 7 Superfı́cies Diferenciáveis 197

2.3. Lembrar que, para cada matriz x ∈ U , as n2 coordenadas do gradiente, no


ponto x , da função det : U → R são os números (−1)i+j Xij , onde Xij é o determi-
nante da matriz (n − 1) × (n − 1) que se obtém de x omitindo sua i-ésima linha e
j-ésima coluna. Portanto x é um ponto crı́tico da função det se, e somente se, todas
as submatrizes (n − 1) × (n − 1) de x tiverem determinante igual a zero e então o
posto de x é ≤ n − 2.
2.4. Num ponto arbitrário a ∈ V , seja b = ξ(a), logo f (a, b) = c. Pelo Teorema
das Funções Implı́citas, existem abertos W, Z, com a ∈ W ⊂ V ⊂ Rm e (a, b) ∈ Z ⊂
U , bem como uma aplicação ξ0 : W → Rn , de classe C k , tais que f −1 (c)∩Z é o gráfico
de ξ0 , ou seja, se (x, y) ∈ Z e f (x, y) = c então x ∈ W e y = ξ0 (x). Em particular,
como (a, b) ∈ Z e f (a, b) = c, segue-se que ξ0 (a) = b = ξ(a). Como ξ é contı́nua e
(a, ξ(a)) ∈ Z, podemos supor W ∋ a tão pequena que x ∈ W ⇒ (x, ξ(x)) ∈ Z, Então
x ∈ W ⇒ (y, ξ(x)) ∈ Z e f (y, ξ(x)) = c ⇒ (x, ξ(x)) ∈ f −1 (c)∩Z ⇒ (x, ξ(x)) ∈ gráfico
de ξ0 ⇒ ξ(x) = ξ0 (x), logo ξ ∈ C k . Quanto à parte final do exercı́cio, basta observar
que, definindo f : R3 → R por f (x, y, z) = (x2 + y 4 )z + z 3 , tem-se ∂f
∂z
= x2 + y 4 + 3z 2 ,
∂f
logo ∂z (x, y, z) 6= 0 sempre que f (x, y, z) = 1.

7 Superfı́cies Diferenciáveis
2.1. Pelo Corolário 1, M é localmente o gráfico de uma aplicação g : V0 → Rn ,
de classe C k . Ou seja, M é coberta por abertos U ⊂ Rm+n tais que V = U ∩ M =
{(x, g(x)); x ∈ V0 }. Definindo f : U → Rn por f (x, y) = y − g(x), vemos que f ∈ C k ,
0 é valor regular de f e V = U ∩ M = f −1 (0). Então ϕ : V0 → V , ϕ(x) = (x, g(x)), é
uma parametrização C k e, pondo f = (f1 , . . . , fn ), os campos de vetores v1 , . . . , vn :
V → Rm+n , dados por v1 (q) = grad f1 (q), . . . , vn (q) = grad fn (q) cumprem o que foi
pedido no exercı́cio.
2.2. Seja ϕ : V0 → V ⊂ M uma parametrização de classe C k . O conjunto
e
V = {(p, v); p ∈ V, v ∈ T p M } é aberto em T M
m e
 e a aplicação Φ : V0 × R → V , dada
Pm ∂ϕ
por Φ(x, α1 , . . . , αm ) = ϕ(x), αi (x) é uma parametrização de classe C k−1
i=1 ∂xi
e dimensão 2m em T M .
2.3. Se ϕ : V0 → V ⊂ M é uma parametrização de classe C k então o conjunto
Vb = {(p, v); p ∈ V, v ∈ Tp M ⊥ } é aberto em νM . Sejam v1 , . . . , vn−m : V → Rn
campos de vetores L.I., com vi ◦ ϕ : V0 → Rn de classe C k−1 e vi (q) ⊥ Tq M para i =
1, . . . , n−m
P e todo q∈ V . Então Φ : V0 ×Rn−m → Vb , dada por Φ(x, α1 , . . . , αn−m ) =
ϕ(x), αi vi (ϕ(x)) , é uma parametrização de dimensão n e classe C k−1 em νM .
Observação: Nos Exercı́cios 2.2 e 2.3, a verificação de que Ve e Vb são abertos é
imediata se notarmos que (p, v) 7→ v é contı́nua, logo a imagem inversa de uma aberto
é aberta.
2.4. Escrevendo as matrizes 4 × 4 sob a forma m = [x, y, u, v], onde x, y,
u, v ∈ R4 são suas colunas então M é o conjunto dessas matrizes para as quais
2 desses vetores são L.I. mas 3 quaisquer não são. Fixando as idéias, seja V =
{[x, y, u, v] ∈ M ; x, y são L.I.}. Então [x, y, u, v] ∈ V ⇒ u = αx + βy, v = γx + δy.
Seja W = {(x, y) ∈ R4 × R4 ; x, y L.I.}. Pondo V0 = W × R4 , a aplicação ϕ : V0 → V ,
dada por ϕ(x, y, α, β, γ, δ) = [x, y, u, v], onde u = αx + βy, v = γx + δy, é uma para-
metrização C ∞ . (Verifique!) É claro que M é coberta por 6 abertos do tipo V , logo
198 Soluções dos exercı́cios Cap. 10

é uma superfı́cie C ∞ de dimensão 12 em R16 . O mesmo argumento vale em geral: as


matrizes m × n de posto k formam uma superfı́cie de dimensão (m + n − k)k em Rmn .
P
3.1. Pelo enunciado, temos aij ei = (ψ −1 ◦ ϕ)′ (x0 ) · ej = [ψ ′ (y0 )]−1 · ϕ′ (x0 ) · ej ,
i
∂ϕ P P P ∂ψ
portanto (x0 ) = ϕ′ (x0 ) · ej = ψ ′ (y0 ) · aij ei = aij ψ̇ ′ (y0 ) · ei = aij (y0 ),
∂xj i i i ∂yi
todos os somatórios sendo com i variando de 1 a m.
3.2. Segue-se da compacidade de [a, b] que o caminho λ pode ser expresso como
justaposto de caminhos, cada um dos quais tem sua imagem contida numa vizinhança
parametrizada. Portanto não há perda de generalidade em admitir que λ([a, b]) ⊂ V ,
onde V é a imagem de uma parametrização ψ : W0 → V ⊂ M , com ψ(y0 ) = p.
Seja {w1 , . . . , wm } ⊂ Rm uma base tal que ψ ′ (x0 ) · wi = ui (i = 1, . . . , m). Con-
sidere a transformação linear T : Rm → Rm tal que T e1 = w1 , . . . , T em = wm .
Sejam V0 = T −1 (W0 ), ϕ = ψ ◦ T : V0 → V e x0 = T −1 (y0 ). Então ϕ : V0 →
∂ϕ
V é uma parametrização tal que ϕ(x0 ) = p e (x0 ) = ϕ′ (x0 ) · ei = ui , i =
∂xi
1, . . . , m. Para
 cada t ∈ [a, b], a base ortonormal  {v1 (t), . . . , vm (t)} ⊂ Tλ(t) M é aquela
∂ϕ ∂ϕ
obtida de (λ0 (t)), . . . , (λ0 (t)) pelo processo de Gram-Schmidt, onde
∂x1 ∂xm
ϕ(λ0 (t)) = λ(t).
3.3. Como no exercı́cio anterior, podemos admitir que os valores λ(t), t ∈ [a, b],
pertencem a um aberto V ⊂ M , no qual estão definidos n campos vetoriais contı́nuos
w1′ , . . . , wn′ : V → Rm+n , com w1′ (q), . . . , wn′ (q) L.I. e ortogonais a Tq M , para todo
Pn
q ∈ V . No ponto p = λ(a), temos uj = aij wi′ (p), j = 1, . . . , n. Os campos
P i=1
wj : V → Rm+n , dados por wj (q) = aij wi′ (q), são ainda L.I. e ortogonais a Tq M ,
i
agora com wj (p) = uj (j = 1, . . . , n). Usando o processo de ortonormalização de
Gram-Schmidt, obtemos os campos v1 , . . . , vn : V → Rm+n tais que
t 7→ {v1 (λ(t)), . . . , vn (λ(t))} cumpre as condições estipuladas no exercı́cio.
Observação: O processo de ortonormalização de Gram-Schmidt faz passar de
um conjunto {w1 , . . . , wn } de vetores L.I. para um conjunto ortonormal {v1 , . . . , vn }
que gera o mesmo subespaço, de tal modo que cada vetor vj depende continuamente
(e mesmo em classe C ∞ ) de w1 , . . . , wn .
3.4. A matriz de passagem da base {u1 , . . . , un } para a base {w1 , . . . , wn } tem
determinante > 0. Como S n−1 é conexo, existe um caminho λ : [0, 1] → S n−1 , com
λ(0) = un e λ(1) = wn . Sendo {u1 , . . . , un−1 } ⊂ Tun S n−1 uma base ortonormal, o
Exercı́cio 2 garante que existe uma aplicação contı́nua t 7→ (v1 (t), . . . , vn−1 (t)) tal que,
para todo t ∈ [0, 1] os vj (t) formam uma base ortonormal de Tλ(t) S n−1 , com vj (0) =
uj , j = 1, . . . , n − 1. O determinante da matriz de passagem de {v1 (t), . . . , vn−1 (t)}
para {w1 , . . . , wn−1 } é 1 quando t = 0 e é 6= 0 para todo t ∈ [0, 1], logo é > 0 para
t = 1. Pela hipótese de indução, existe uma aplicação contı́nua t 7→ {v1 (t),· · · ,vn−1 (t)},
definida para 1 ≤ t ≤ 2, tal que os vj (t), t ∈ [1, 2], formam um conjunto ortonormal
e v1 (2) = w1 , . . . , vn−1 (2) = wn−1 . Mantendo λ(t) = vn (t) = wn constante para
1 ≤ t ≤ 2, chegamos ao fim da 1a¯ parte do exercı́cio. Quando à conclusão, basta ob-
servar que os elementos de SO(Rn ) são matrizes de determinante > 0 cujas colunas
formam uma base ortonormal de Rn .
Seção 7 Superfı́cies Diferenciáveis 199

4.1. A observação crucial é que se ϕ : V0 → V é uma parametrização, com


V0 ⊂ Rm , e T : Rm → Rm é dada por T (x1 , . . . , xm ) = (−x1 , x2 , . . . , xm ) então,
pondo V1 = T −1 (V0 ) e ϕ1 = ϕ ◦ T : V1 → V , obtém-se uma parametrização ϕ1 com
a seguinte propriedade: para toda parametrização ψ : W0 → W com V ∩ W 6= ∅,
os determinantes jacobianos de ψ −1 ◦ ϕ1 e ψ −1 ◦ ϕ nos pontos x ∈ V1 e T (x) ∈ V0
têm sinais opostos. Diz-se então que ϕ1 é obtida invertendo a orientação de ϕ. Isto
posto, notemos ainda que, em ϕ−1 (U ∩ V ∩ W ) vale ξ −1 ◦ ϕ = (ξ −1 ◦ ψ) ◦ (ψ −1 ◦ ϕ),
portanto, ao analisar o sinal do determinante jacobiano, basta considerar ξ −1 ◦ ψ e
ψ −1 ◦ ϕ. Ora, os sinais dos determinantes jacobianos de ξ −1 ◦ ψ e ψ −1 ◦ ϕ, nesta
ordem, podem ocorrer de quatro formas: + +, +−, −+ e − −. No primeiro caso,
{ϕ, ψ, ξ} é um atlas coerente. No segundo caso, invertemos a orientação de ϕ, no
terceiro a de ξ e, no quarto, a de ψ, para termos um atlas coerente em M , a qual é
portanto uma superfı́cie orientável.
4.2. Seja [u, v, w] ∈ M representada por seus vetores-coluna u, v, w ∈ R3 .Temos
M = U ∪ V ∪ W , onde [u, v, w] pertence a U , a V ou a W conforme sua primeira,
segunda ou terceira coluna seja 6= 0. Pondo U0 = {(u, s, t) ∈ R5 ; u = (x, y, z) 6=
0, s, t ∈ R}, definamos as parametrizações ϕ : U0 → U , ψ : U0 → V e ξ : U0 → W por
ϕ(u, s, t) = (u, su, tu), ψ(u, s, t) = (su, u, tu) e ξ(u, s, t) = (su, tu, u). As mudanças
de parametrização são dadas por (ψ −1 ◦ ϕ)(u, s, t) = (su, 1/s, t/s), (ξ −1 ◦ ϕ)(u, s, t) =
(tu, 1/t, s/t) e (ξ −1 ◦ ψ)(u, s, t) = (tu, s/t, 1/t). Um cálculo simples mostra que os
determinantes jacobianos desses difeomorfismos são respectivamente iguais a −1, 1,
e −1. Pelo exercı́cio anterior, concluı́mos que M é orientável.
4.3. Sejam Φ : V0 × Rm → Ve e Ψ : W0 × Rm → W f as parametrizações em
T M definidas, como na solução do Exercı́cio 2.2, pag. 143, a partir das para-
metrizações ϕ : V0 → V , ψ : W0 → W em M , onde V ∩ W 6= ∅. Pondo ξe =
ψ −1 ◦ Φ, temos, para cada x ∈ ϕ−1 (V ∩ W ) e cada u = (α1 , . . . , αm ) ∈ Rm :
e u) = (ϕ−1 ◦ ϕ)(x), (ψ −1 ◦ ϕ)′ (x) · u) = (ξ(x), ξ ′ (x) · u), onde ξ = ψ −1 ◦ ϕ. Ou
ξ(x,

e α1 , . . . , αm ) = ξ(x), P αk ∂ξ (x) . Daı́ resulta que as colunas da ma-
m
seja: ξ(x,
k=1 ∂x k

e ∂ ξe ∂ξ P m ∂2ξ 
triz jacobiana J ξ(x) ∈ M (2m × 2m) são os vetores = , αk
∂xj ∂xj k=1 ∂xj ∂xk
∂ ξe ∂ξ 
e = 0, . Como as colunas da matriz jacobiana Jξ são os m vetores
∂αj ∂xj  
e Jξ 0
∂ξ/∂xj , segue-se que J ξ = , onde os 4 blocos são matrizes m × m. Portanto
∗ Jξ
det . J ξe = (det Jξ) > 0 e a superfı́cie T M é orientável.
2

Quanto ao fibrado normal νM , sua orientabilidade se prova considerando o a-


tlas A, formado pelas parametrizações Φ : V0 × Rn−m → Ve ⊂ νM , associadas a
parametrizações ϕ : V0 → V ⊂ M para as quais existem n − m campos de ve-
tores v1 , . . . , vn−m : V → Rn , de classe C k−1 e linearmente independentes. (M é
de classe C k .) A parametrização Φ é definida como na solução do Exercı́cio 2.3,
pag. 143. Para que se tenha Φ ∈ A, exigiremos que, para todo x ∈ V0 , os vetores
∂ϕ ∂ϕ
(x), . . . , (x), v1 (ϕ(x)), . . . , vn−m (ϕ(x)) formem uma base positiva do espaço
∂x1 ∂xm
n
R , isto é, que a matriz n × n que os tem como colunas tenha determinante positivo.
Então o atlas A é coerente e νM é orientável.
Observação. Os leitores familiares com a vizinhança tubular de uma superfı́cie
200 Soluções dos exercı́cios Cap. 10

reconhecerão que νM é orientável porque é difeomorfo a um aberto de Rn .

4.4. As colunas da matriz jacobiana de f são (2x, y, z, 0), (−2y, x, 0, z) e (0, 0, x, y).
Dois subdeterminantes 3 × 3 são 2x(x2 + y 2 ) e 2y(x2 + y 2 ). Logo f ′ (p) : R3 → R3
é injetiva para todo p ∈ S 2 , exceto p0 = ±(0, 0, 1). Nestes dois pontos, tem-se
f ′ (p0 ) · e1 = ±e3 e f ′ (p0 ) · e2 = ±e4 . Assim, f ′ (p0 ) é injetiva no plano gerado por
e1 e e2 , que é o plano tangente a S 2 no ponto p0 , logo é a imagem ϕ′ (x0 ) · R2 ,
onde ϕ é qualquer parametrização de uma vizinhança de p0 em S 2 , com ϕ(x0 ) = p0 .
Portanto, se ϕ : V0 → V é uma parametrização arbitrária de V ⊂ S 2 , a composta
f ◦ ϕ : V0 → P = f (S 2 ) é uma imersão. Além disso, como f (p) = f (q), com p, q ∈ S 2 ,
só ocorre quando q = ±p, se V não contém pontos antı́podas, a imersão f ◦ ϕ é
injetiva. Para concluir que f ◦ ϕ é uma parametrização (e portanto que P é uma
superfı́cie), resta apenas provar que a imagem f (A) de todo aberto A ⊂ S 2 é um
aberto em P , ou seja, que F = P − f (A) é fechado (em P ou em R4 , tanto faz, pois P
é compacto, logo fechado). Por simplicidade (e conveniência), passaremos a escrever
f significando f |S 2 , isto é, o domı́nio de f agora é S 2 . Então, como A ∪ (−A), onde
−A = {−x; x ∈ A} é aberto em S 2 , temos f −1 (F ) = S 2 −f −1 (f (A)) = S 2 −[A∪(−A)],
logo f −1 (F ) é fechado em S 2 , portanto compacto. Como f : S 2 → P é sobrejetiva,
vale f f −1 (F ) = F . Então F é compacto, logo fechado, como imagem por f do
compacto f −1 (F ). Isto conclui a verificação de que P é uma superfı́cie C ∞ . Resta
mostrar que P não é orientável. Isto pode ser feito observando que todo aberto numa
superfı́cie orientável é também uma superfı́cie orientável mas P contém uma faixa de
Moebius, imagem por f do conjunto X = {(x, y, z) ∈ S 2 ; −1/2 < z < 1/2, y ≥ 0}.

6.1. Basta observar


 queh ∈ C ∞ e que a aplicação inversa, g : R2 − {0} → S 1 × R,
z
dada por g(z) = , ℓn|z| , também é de classe C ∞ .
|z|

6.2. Para obter um difeomorfismo de S 1 × S 1 sobre uma superfı́cie em R3 , tome


a composta S 1 × S 1 → S 1 × R2 → (S 1 × R) × R → (R2 − {0}) × R → R2 × R = R3 . No
caso geral, admita por indução que exista um difeomorfismo (S 1 )n−1 → Rn do toro
(n − 1)-dimensional sobre uma hiperfı́cie em Rn . Então tome a composta (S 1 )n =
S 1 × (S 1 )n−1 → S 1 × Rn → (S 1 × R) × Rn−1 → R2 × Rn−1 → Rn+1 onde as setas
têm significados óbvios.

6.3. Seja B um atlas coerente em N . Considere o conjunto A das parametrizações


ϕ : V0 → V ⊂ M tais que V é conexo, f |V é um difeomorfismo de V sobre um aberto
W ⊂ N e a parametrização f ◦ϕ : V0 → W é compatı́vel com todas as parametrizações
ξ ∈ B. Então A é um atlas em M . (Se f ◦ϕ não for compatı́vel com toda ξ ∈ B, inverta
a orientação de ϕ.) O atlas A é coerente porque ψ, ϕ ∈ A ⇒ ψ −1 ◦ϕ = (f ◦ψ)−1 ◦(f ◦ϕ).

6.4. Dados x, y ∈ G arbitrários, temos f (x · y) = f (x) · f (y). Isto pode ser escrito
como f ◦λx = λf (x) ◦f , usando as translações à esquerda λx : G → G e λf (x) : H → H,
definidas por λx (g) = xg e λf (x) (h) = f (x)·h. Note que λx e λf (x) são difeomorfismos,
cujos inversos são λx−1 e λf (x)−1 . Para quaisquer p, q ∈ G, pondo x = q ·p−1 , a Regra
da Cadeia, aplicada a f ◦ λx = λf (x) ◦ f , nos dá f ′ (q) · λ′x = λ′f (x) · f ′ (p). Como λ′x e
λ′f (x) são, em cada ponto, isomorfismos lineares, concluı́mos que f ′ (p) : Tp G → Tf (p) H
e f ′ (q) : Tq G → Tf (q) H têm o mesmo posto.
Seção 8 Integrais múltiplas 201

8 Integrais múltiplas
R

1.1. Seja I = A f (x)dx. Não se pode ter J < I, pois, como I ≤ S(f ; P ), isto
implicaria que S(f ; P ) − J ≥ I − J para toda partição P do bloco A. Tampouco pode
ser I < J pois, fixando um número L com I < L < J, existiria uma partição Q do
bloco A tal que I ≤ S(f ; Q) < L < J. Então, para qualquer P0 , a partição P = P0 ∪Q
refinaria Q, logo S(f ; P ) ≤ S(f ; Q) e daı́ J − S(f ; P ) ≥ J − S(f ; Q) ≥ J − L, embora
P refinasse P0 . Segue-se que I = J.
1.2. Sejam Σ o conjunto das somas superiores S(f ; P ), relativas a todas as
partições P do bloco A e Σ0 ⊂ Σ o conjunto das somas superiores relativas às partições
que refinam P0 . Para toda P tem-se S(f ; P ∪ P0 ) ∈ Σ0 e S(f ; P ∪ P0 ) ≤ S(f ; P ).
−R
Logo inf Σ0 = inf Σ = A f (x)dx. Analogamente para a integral inferior.
P 1.3. Dado ε > 0, existe uma partição P = P1 × · · · × Pn do bloco A tal que
wB · vol B < ε. O valor do somatório à esquerda não aumenta quando se refina
B∈P
a partição P . Seja C = Π[ci , di ] ⊂ A. Para cada i = 1, . . . , n escrevamos Qi =
Pi ∪ {ci , di }. Isto nos dá uma partição Q = Q1 × · · · × Qn de A que refina P e,
além
P disso, os blocos Pde Q contidos em C constituem uma partição Q′ de C. Então

ωB ′ · vol B ≤ ωB · vol B < ε pois as parcelas de ambos somatórios são ≥ 0
B ′ ∈Q′ B∈Q
e as da esquerda estão incluı́das entre as da direita. Segue-se que fC é integrável.
Q
n
1.4. Seja A = [a1 , b1 ] × A′ , com c ∈ [a1 , b1 ] e A′ = [ai , bi ]. Dado ε > 0, seja
i=2
I ⊂ [a1 , b1 ] um intervalo contendo c, tal que vol(I × A′ ) < ε/2K, onde K = M − m
e m ≤ f (x) ≤ M para todo x ∈ A e, além disso, c ∈ int .I se c ∈ (a1 , b1 ). Vemos que
I × A′ é bloco de uma partição P0 de A. Seja P uma partição de A que refina P0 .
Designaremos por B ′ os blocos de P contidos em I × A′ . Nos demais blocos de P ,
que chamaremos de B ′′ , a função f é contı́nua, logo podemos tomar P de modo que
ωB ′′ < ε/2 vol A para todo B ′′ . Então
X X X
ωB · vol B = ωB ′ · vol B ′ + ωB ′′ · vol B ′′
B∈P B′ B ′′
′ ε ε
< K · vol(I × A ) + (ε/2 vol(A)) · vol A < + = ε.
2 2
2.1 Para toda partição P do bloco A, o gráfico de f está contido na reunião dos
blocos (n + 1)-dimensionais B × [mB , MB ], B ∈ P . O volume de cada um desses
blocos é igual a ωB · vol B . A P
integrabilidade de f assegura que, para todo ε > 0,
existe uma partição P tal que ωB · vol B < ε. Isto nos diz que o gráfico de f tem
B∈P
medida nula.
Q
n
2.2. Seja A = [ai , bi ]. Dada uma cobertura A ⊂ ∪Bk por blocos fechados, pelo
i=1
Teorema 3, podemos supor que os interiores dos Bk cobrem A e, por Borel-Lebesgue,
que a cobertura é finita. Para cada i = 1, . . . , n, seja Pi a partição do intervalo [ai , bi ]
formada pelos pontos ai , bi mais as i-ésimas coordenadas dos vértices dos blocos Bk
que estejam contidas em [ai , bi ]. A partição P = P1 ×P · · · × Pn tem cada um dos seus
blocos contido em algum Bk , portanto Σ vol Bk ≥ vol B = vol A. Logo não se
B∈P
tem med.A = 0. Segue-se daı́ que todo conjunto de medida nula tem interior vazio.
202 Soluções dos exercı́cios Cap. 10

2.3. Considere a aplicação f : M ×N → Rp , de classe C 1 , dada por f (x, y) = y−x.


A fim de que v ∈ Rp pertença à imagem f (M ×N ) é necessário e suficiente que existam
x ∈ M e y ∈ N tais que v = y − x, ou seja, y = x + v. Isto significa que f (M × N ) =
{v ∈ Rp ; (M + v) ∩ N 6= ∅}. Ora, como dim(M × N ) = dim M + dim N < p, a
imagem f (M × N ) tem medida nula em Rp , portanto tem interior vazio, isto é, seu
complementar é denso em Rp . Se M e N são compactas então f (M × N ) é compacto,
logo seu complementar, além de denso, é aberto.
2.4. Defina a parte positiva f+ : A → R e a parte negativa f− : A → R da função
f pondo, para cada x ∈ A, f+ (x) = max{f (x), 0} e f− (x) = − min{f (x), 0}. Assim,
f+ (x) = f (x) quando f (x) ≥ 0 e f+ (x) = 0 quando f (x) < 0. Por sua vez, f− (x) =
−f (x) quando f (x) ≤ 0 e f− (x) = 0 se f (x) > 0. Então f+ (x) = (f (x) + |f (x)|)/2 e
f− (x) = (|f (x)| − f (x))/2. Estas igualdades mostram que f+ e f− são contı́nuas em
todos os pontos em que f é contı́nua, portanto f integrável implica f+ e f− integráveis.
Além disso, é claro que f = f+ − f− e que f+ e f− são ambas não-negativas.
3.1. O conjunto dos pontos de descontinuidade de f é a reunião das faces próprias
de B, portanto tem medida nula e f é integrável. Além disso, se considerarmos uma
partição P0 de A que contenha B então, para toda partição P do bloco
R A que refine P0 ,
tem-se s(f ; P ) = vol B = S(f ; P ). Segue-se do exercı́cio 1.2 que A f (x)dx = vol B.
3.2. X é a interseção do compacto [0, 1] como complementar do aberto ∪Jk ,
logo é compacto. Após cada etapa da construção de X, cada intervalo que resta tem
comprimento menor do que a metade do comprimento dos intervalos que restaram
da etapa anterior, logo X não contém intervalos, ou seja, int .X = ∅. Os extremos
dos intervalos omitidos pertencem a X e todo ponto x0 ∈ X, na n-ésima etapa do
processo, pertencia ao interior de um intervalo cujo comprimento tendia a zero quando
n → ∞, os extremos do qual pertencem a X, logo x0 é ponto de acumulação de X, ou
seja, X não possui pontos isolados. Finalmente, se |Jk | é o comprimento do intervalo
Jk então Σ|Jk | = Σan = 1 − δ. Dada qualquer cobertura enumerável X ⊂ ∪Ir por
intervalos abertos Ir , temos [0, 1] ⊂ (∪Ir ) ∪ (∪Jk ). A solução do exercı́cio 2.2 acima
nos dá Σ|Ir | + Σ|Jk | ≥ 1, donde Σ|Ir | ≥ δ. Logo X não tem medida nula.
3.3. Com aR notação do Teorema 9, seja ξ = ψ − ϕ : A1 → R. A função ξ é
integrável, com A1 ξ(x)dx = 0 e ξ(x) ≥ 0. Para todo k ∈ N, mostremos que Xk =
S
{x ∈ A1 ; ξ(x) ≥ 1/k} tem medida nula. Daı́ resultará que X = Xk tem medida
k∈N
nula, com fx : A2 → R integrável para todo x ∈ A1P− X. Ora, dado arbitrariamente
ε > 0, existe uma partição P do bloco A1 tal que MB · vol B < ε/k. Indiquemos
B∈P
com B ′ os blocos de P tais que MB ′ ≥ 1/k. Então Xk está contido na reunião dos
blocos B ′ e
1 1 X
Σ vol B ′ = Σ · vol B ′ ≤ ΣMB ′ · vol B ′ ≤ MB · vol B < ε/k.
k k B∈P

Multiplicando por k, vem Σ vol B ′ < ε, logo med.Xk = 0


3.4. O complementar de um conjunto de medida nula, sendo denso, possui pontos
em todo intervalo.
P Logo, se f (x) ≥ 0 para todo x ∈ A, tem-se mB = R 0, donde
s(f ; P ) = mB ·vol B = 0 seja qual for a partição P do bloco A. Então f (x)dx =
B∈P −A
R
0 e, como f é integrável, A f (x)dx = 0. No caso geral, f é a diferença de
R duas funções
integráveis não-negativas, cada uma das quais tem integral nula, logo A f (x)dx = 0.
Seção 9 Mudança de variáveis 203

4.1 Isto resulta diretamente do exercı́cio 3.1.


4.2. Porque sua fronteira S(a; r) é uma superfı́cie C ∞ de dimensão n − 1 no
espaço Rn , logo tem medida nula.
4.3. O interior U de um conjunto J-mensurável X é também J-mensurável em
virtude do Teorema 10, pois fr .U ⊂ fr .X. Além disso, como fr .X tem volume nulo e
a reunião X = U ∪ (X ∩ fr .X) é disjunta, tem-se vol .X = vol .U + vol .(X ∩ fr .X) =
vol .U . P
4.4. Para toda partição P do bloco A, tem-se s(f ; P ) = mB · vol B =
P P B∈P P
vol B ′ , onde B ′ = B × [0, mB ], e S(f ; P ) = MB · vol B = vol B ′′ ,
B∈P S B∈P S B∈P
onde B ′′ = B × [0, MB ]. Evidentemente, B ′ ⊂ C(f ) ⊂ B ′′ , s(f ; P ) ≤
B∈P B∈P
vol . int .C(f ) ≤ volR.ext C(f )≤S(f ; P ). Portanto f integrável implica C(f ) J-mensu-
rável e vol C(f ) = A f (x)dx.

9 Mudança de variáveis
1. Uma observação preliminar: se f : B(a; r) → R é contı́nua, com m(r) =
inf{f (x); x ∈ B(a; r)} e M (r) = sup{f (x); x ∈ B(a; r)} então f (a) = lim m(r) =
r→0
lim M (r) e m(r) ≤ f (x) ≤ M (r) para todo x ∈ B(a; r). Segue-se daı́ que
r→0
Z
1
m(r) ≤ f (x)dx ≤ M (r),
vol B(a; r) B(a;r)

portanto Z
1
lim f (x)dx = f (a).
r→0 vol B(a; r) B(a;r)
R R
Dito isto, vemos que vol ·f (B(a; r)) = f (B(a;r)) 1·dy = B(a;r) | det ·f ′ (x)|dx, portanto

vol .f (B(a; r))


lim = | det .f ′ (a)|.
r→0 vol .B(a; r)
2. A solução deste exercı́cio se faz com o uso imediato do Teorema da Mudança
de Variáveis, juntamente com a observação que precede o Teorema 4 do Capı́tulo 7,
sobre o produto vetorial.
Referências Bibliográficas

[1] E.L. Lima. Análise Real, vol. 1. (Sétima edição.) Coleção Ma-
temática Universitária, IMPA, 2004.
[2] E.L. Lima. Curso de Análise, vol. 1. (Décima primeira edição.)
Projeto Euclides, IMPA, 2004.
[3] E.L. Lima. Curso de Análise, vol. 2. (Sexta edição.) Projeto
Euclides, IMPA, 2000.
[4] E.L. Lima. Álgebra Linear. (Sexta edição.) Coleção Matemática
Universitária, IMPA, 2003.
[5] E.L. Lima. Análise no Espaço Rn . Coleção Matemática Univer-
sitária, IMPA, 2001.
[6] S. Lang. Undergraduate Analysis. Springer Verlag, N. York, 1983.
(Em inglês.)
[7] Th. Bröcker. Analysis II. BI-Wiss.-Verlag. Mannheim, 1992. (Em
alemão.)

As cinco primeiras referências são citadas no texto, especialmente a


primeira, da qual este livro é o prosseguimento. As duas últimas são
obras que se destacam entre as congêneres: o livro de Lang, por sua
caracterı́stica objetividade; o de Bröcker por ter sabido, com êxito, con-
ciliar elegância, clareza e concisão. Os capı́tulos IV e VII da referência
3, que tratam do que se poderia chamar uma versão moderna da Análise
Vetorial clássica, podem formar uma continuação natural dos temas aqui
tratados.
Índice Remissivo
Índice Remissivo

i-ésima coordenada, 1 Campo de vetores normais, 91,


i-ésima derivada parcial, 55 132
i-ésima variável, 55 Cisão, 27
i-convexo, 81 Classe C k , 41, 43, 57, 100
Co-dimensão, 127
Aplicação Cobertura, 18
aberta, 112 Combinação convexa, 75
contı́nua, 20 Componente conexa, 32
lipschitziana, 24 Comprimento, 3, 48
uniformente contı́nua, 24 Conjunto
Arestas, 148 aberto, 8
Atlas, 133 compacto, 16
coerente, 133 conexo, 28
conexo por caminhos, 31
Base associada a uma parame- convexo, 7
trização, 130 de nı́vel, 62
Bloco n-dimensional, 148 denso, 14
Blocos de uma partição, 149 discreto, 14
Bola fechado, 12
aberta, 5 horizontalmente convexo, 81
fechada, 5 limitado, 6
verticalmente convexo, 81
Caminho, 30 Constante de Lipschitz, 24
justaposto, 31 Contração, 25
poligonal, 32 Critério de Cauchy, 12
regular, 51 Cubo, 18
retificável, 48 n-dimensional, 148
retilı́neo, 30 Curva, 62, 87, 126
uniformemente diferenciável,
47 Decomposição, 166

207
208 Índice Remissivo

pontilhada, 169 Fluxo, 180


Delta de Kronecker, 90 Forma local das submersões, 117
Derivada, 41, 142 Forma quadrática, 70, 90
à direita, 42 hessiana, 71
à esquerda, 42 não-negativa, 70
de Gâteux, 77 não-positiva, 70
de uma aplicação, 98 negativa, 70
direcional, 60, 98 positiva, 70
parcial, 121 Fronteira, 9
segunda, 109 Função
Desigualdade côncava, 75
de Hadamard, 97 caracterı́stica, 162
do valor médio, 44, 107 convexa, 75
Diâmetro, 18 de Urysohn, 38
Difeomorfismo, 111, 143 harmônica, 82
admissı́vel, 177 integrável, 151, 164
local, 112 limitada, 6, 10
primitivo, 175 quase-convexa, 83
difeomorfismo local, 143 Função-coordenada, 19
Diferenciável, 41, 98
Diferencial, 101 Gradiente, 60
Disco, 5 Grau, 172
Distância, 5, 16 Grupo unimodular, 91
intrı́nseca, 54
Hélice, 52
Elipsóide, 90 Hiperfı́cie, 87
Equações de Cauchy-Riemann, 103 Homeomorfismo, 26
Esfera, 5
Espaço Imersão, 124
euclidiano n-dimensional, 1 Integral, 151
vetorial tangente, 88, 129 inferior, 150
Extensão radial, 109 superior, 150
Interior, 7
Fórmula de Taylor, 69 Invertendo a orientação, 199
Face, 148
Fecho, 12 Lagrangiana, 95
Fibrado Limite, 10, 45, 169
normal, 146 lateral, 34
tangente, 146 Linha de nı́vel, 62
Índice Remissivo 209

Máximo local, 71 Raiz


Máximo ou mı́nimo estrito, 73 quadrada de uma matriz, 116
Mı́nimo local, 71 simples, 122
Matriz Refinamento, 45, 149
hessiana, 66 Regra da Cadeia, 45, 103
jacobiana, 98 Reparametrização, 51
Medida n-dimensional nula, 152 Reta tangente, 42
Mudança de parametrização, 128
Multiplicador de Lagrange, 92 Seqüência, 10
Multiplicadores de Lagrange, 140 convergente, 10
de Cauchy, 12
Número de Lebesgue, 178
Soma
Nı́vel
de Riemann, 45, 169
crı́tico, 89
inferior, 149, 166
regular, 89
Norma, 3, 4, 25, 45, 107, 166 superior, 166
euclidiana, 4 superior, 149
Subcobertura, 18
Oscilação, 151 Submersão, 119
num ponto, 157 Subseqüência, 10
Superfı́cie, 87, 126
Parametrização, 125 de nı́vel, 62
Parametrizações compatı́veis, 133 orientável, 91, 133
Parte
negativa, 202
Teorema
positiva, 202
da Alfândega, 30
Partição, 45, 149
da aplicação inversa, 115
pontilhada, 45
da derivação sob o sinal de
Plano projetivo, 147
integral, 66
Ponto
da diferenciabilidade uniforme,
aderente, 12
47, 107
crı́tico, 64, 139
da função implı́cita, 84
da restrição, 91
da integração repetida, 160
não-degenerado, 117
da permanência
de acumulação, 14
isolado, 14 da desigualdade, 36
Produto vetorial, 134 da permanência do sinal, 34
Projeção estereográfica, 26 das funções implı́citas, 119
de Bolzano-Weierstrass, 11
Quádrica, 90 de Borel-Lebesgue, 18
210 Índice Remissivo

de Lebesgue (condição de in-


tegrabilidade), 157
de Lindelöf, 156
de Pitágoras, 3
de Schwarz, 67
de Weierstrass, 21
do valor médio, 61
fundamental do cálculo, 46
Toro m-dimensional, 126

Vértices, 148
Valor
de aderência, 37
médio, 53
regular, 89, 130
Valores singulares, 141
Vertical, 117
Vetor-velocidade, 41
Vizinhança, 7
parametrizada, 126
Volume
n-dimensional, 148, 163
externo, 162
interno, 162