Você está na página 1de 132

Instituto Superior Técnico

Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

CDI-II

Limites. Continuidade

1 Introdução
O assunto central do Cálculo em Rn é o estudo de funções cujos domı́nios são subconjun-
tos de Rn , ou seja, funções de várias variáveis (c.f. [2, 3, 1]). Nas aplicações, estas funções
desempenham papéis muito importantes no estabelecimento de modelos matemáticos de
fenómenos fı́sicos, quı́micos, económicos, financeiros e outros.
As grandezas fı́sicas tais como a densidade de massa, a temperatura, a pressão e o
volume, também designadas por grandezas escalares, são matematicamente traduzidas em
funções que dependem de várias outras grandezas, por exemplo, as coordenadas que in-
dicam a posição dos objectos em estudo e o instante de observação ou medição. Neste
caso temos funções cujos domı́nios são subconjuntos de Rn e contradomı́nios em R a que
chamaremos funções escalares.
As grandezas tais como a velocidade e a aceleração do movimento de uma partı́cula,
a força de interacção entre corpos com massa ou carga eléctrica são matematicamente
traduzidas em funções de várias outras variáveis e assumindo valores que são vectores.
Temos assim as chamadas funções vectoriais.
Portanto, em geral estamos interessados em estudar funções definidas em Rn com valores
em Rm .
Tal como para o estudo de funções reais de variável real, é necesário ter presente a estru-
tura algébrica e topológica de Rn . Os conceitos de limite, continuidade, diferenciabilidade
e integrabilidade dependem crucialmente dessas estruturas.
Assim, Rn será o produto cartesiano de n factores todos iguais a R, ou seja,

Rn = R × R × · · · × R,

munido da sua estrutura vectorial usual resultante da soma de vectores e multiplicação por
escalares. Os elementos ou vectores x ∈ Rn serão também identificados pelas respectivas
componentes na base canónica, ou seja,

x = (x1 , x2 , · · · , xn ) ; xk ∈ R ; k = 1, 2, . . . , n.

Os casos muito importantes nas aplicações são R2 e R3 cujos vectores serão designados
por (x, y) e por (x, y, z), respectivamente.
2 Norma. Distância. Bola
Tal como em R, o conceito essencial de limite de uma sucessão depende da noção de
distância entre pontos. Em R esse papel é desempenhado pelo conceito de módulo, isto é,
(
x, se x ≥ 0
|x| =
−x, se x < 0.

Em Rn , o conceito fundamental é o de norma de um vector: kxk.

Definição 1 Dado um vector x ∈ Rn , a respectiva norma é o escalar


q
k x k= x21 + x22 + · · · + x2n .

Para os dois casos importantes R2 e R3 , teremos


p
1. R2 : k (x, y) k= x2 + y 2
p
2. R3 : k (x, y, z) k= x2 + y 2 + z 2

Definição 2 1. Chama-se distância entre dois pontos x e y em Rn ao escalar


p
k x − y k= (x1 − y1 )2 + (x2 − y2 )2 + · · · + (xn − yn )2 .

2. Chama-se bola de centro num ponto a ∈ Rn e raio R ao conjunto dado por

BR (a) = {x ∈ Rn :k x − a k< R}

Na figura(1) está representada uma bola de raio R e centro no ponto (a, b) em R2 .

3 Interior, Exterior e Fronteira


Dado um conjunto D ⊂ Rn e tendo a noção de bola centrada num ponto iremos definir
as noções de interior, exterior e fronteira desse conjunto. Assim, teremos,

2
y

(x, y)

R
(a, b)

0 x

Figura 1: R2 : Bola centrada em (a, b) e raio R

Definição 3 i) Diz-se que a ∈ Rn é um ponto interior a D se ∃R>0 : BR (a) ⊂ D.

ii) Diz-se que a ∈ Rn é um ponto exterior a D se ∃R>0 : BR (a) ⊂ D c .

iii) Um ponto a ∈ Rn diz-se um ponto fronteiro de D se

∀R>0 : BR (a) ∩ D 6= ∅ ∧ BR (a) ∩ D c 6= ∅.

Ao conjunto de pontos interiores chama-se interior de D e será designado pelo sı́mbolo


int(D).
Ao conjunto de pontos exteriores chama-se exterior de D e será designado pelo sı́mbolo
ext(D).
Ao conjunto de pontos fronteiros chama-se fronteira de D e será designado pelos
sı́mbolos front(D) ou ∂(D).

Exemplo 3.1 Consideremos o conjunto D = {(x, y) ∈ R2 : x > 0} (ver figura(2)). Então,

- int(D) = {(x, y) ∈ R2 : x > 0}

- ext(D) = {(x, y) ∈ R2 : x < 0}

- ∂(D) = {(x, y) ∈ R2 : x = 0}

3
y

x>0

0 x

Figura 2: Interior, Exterior e Fronteira de D ⊂ R2

Definição 4 a) Um connunto D ⊂ Rn diz-se aberto se D = int(D).

b) Um connunto D ⊂ Rn diz-se fechado se D = int(D) ∪ ∂D.

c) Ao conjunto D = int(D) ∪ ∂D chama-se fecho ou aderência do conjunto D.

Note-se que se um ponto pertence à fronteira de um conjunto D, por definição, também


pertence à fronteira do complementar de D.
Note-se também que Rn = int(D) ∪ ∂D ∪ ext(D).
Portanto, é claro que um conjunto é aberto se e só se o respectivo complementar for
fechado.

4 Sucessões em Rn
Uma sucessão (xk ) é uma função N ∋ k 7→ xk ∈ Rn , que a cada k ∈ N faz corresponder
um vector xk = (xk1 , xk2 , . . . , xkn ) ∈ Rn .
Diz-se que uma sucessão (xk ) converge para um ponto a se dado δ > 0 existe uma
ordem k0 a partir da qual os termos da sucessão se encontram na bola Bδ (a), ou seja

∀δ>0 ∃k0 k > k0 ⇒k xk − a k< δ

4
Neste caso, escreve-se lim xk = a ou xk → a.
k→∞
Seja (x, y) ∈ R2 . Então,

(| x | + | y |)2 =| x |2 + | y |2 +2 | x || y | ≥ | x |2 + | y |2 ≥ | x |2

e, tomando a raiz quadrada nesta sequência de desigualdades, obtemos,


p
| x | + | y | ≥ | x |2 + | y |2 ≥ | x |,

ou seja,
| x | + | y | ≥ k (x, y) k ≥ | x | .
Do mesmo modo, obtemos

| x | + | y | ≥ k (x, y) k ≥ | y | .

É claro que para x = (x1 , x2 , · · · , xn ) ∈ Rn teremos

| x1 | + | x2 | + · · · + | xn | ≥ k x k ≥ | xj |, ∀j = 1, 2, . . . , n. (1)

Seja (xk ) uma sucessão convergente para a = (a1 , a2 , · · · , an ). Usando a desigualdade


(1), obtemos

| xk1 − a1 | + | xk2 − a2 | + · · · + | xkn − an | ≥ k xk − a k ≥ | xkj − aj |, ∀j = 1, 2, . . . , n.

Assim, concluı́mos que a sucessão (xk ) converge para a se e só se cada uma das sucessões,
ditas componentes ou coordenadas, (xk,j ), converge par aj , em que j = 1, 2, . . . , n. Ou seja

xk → a ⇔ xk,j → aj , j = 1, 2, . . . , n

Note-se que as sucessões componentes são sucessões de termos em R.

 
1 −k
Exemplo 4.1 1. lim ,1+ e = (0, 1)
k→∞ k
 
1 −k 2
2. lim , 1 + e , 3, = (0, 1, 3, 0)
k→∞ k 1 + k2
 
1 k
3. A sucessão lim , 2 não é convergente porque a segunda componente não é uma
k→∞ k
sucessão convergente.

A aderência de um subconjunto de Rn pode ser caracterizada recorrendo a sucessões


convergentes.
Seja D ⊂ Rn e a ∈ int(D). Seja BR1 (a) ⊂ D de acordo com a definição de interior de
D e seja x1 ∈ BR1 (a). Tome-se R2 < R21 . É claro que BR2 (a) ⊂ BR1 (a). Seja x2 ∈ BR2 (a).

5
y

0 x

Figura 3: Construção de uma sucessão convergente

Tome-se R3 < R22 . É claro que BR3 (a) ⊂ BR2 (a). Seja x3 ∈ BR3 (a). Deste modo, podemos
construir uma sucessão (xk ) de termos em D, tal como se ilustra na figura (3).
R1
Note-se que k xk − a k< , ou seja, xk → a.
k
Do mesmo modo se pode construir uma sucessão (xk ) de termos em D tal que xk → a
para o caso em que a ∈ ∂D.
Por outro lado, se (xk ) for uma sucessão convergente, de termos em D, o respectivo
limite não poderá encontrar-se no exterior de D, ou seja, só poderá estar na aderência de
D. Note-se que centrada num ponto exterior existe uma bola que não intersecta D.
Assim, a ∈ D se e só se for limite de uma sucessão de termos em D.
Portanto, um conjunto D será fechado se e só se os limites das suas sucessões
convergentes estiverem em D.

5 Funções em Rn
5.1 Exemplos
Em geral, as funções serão do tipo f : D ⊂ Rn → Rm em que D designa o respectivo
domı́nio. Apresentam-se alguns exemplos ilustrativos dos vários tipos de funções impor-
tantes neste contexto.

i) Campo vectorial: F : R2 \ {(0, 0)} → R2 definido por


 
y x
F (x, y) = − 2 , .
(x + y 2) (x2 + y 2 )

ii) Campo vectorial: F : R3 \ {(0, 0, 0)} → R3 definido por


(x, y, z)
F (x, y, z) = .
(x2 + y 2 + z 2 )3/2

6
iii) Campo escalar: φ : R3 \ {(0, 0, 0)} → R definido por
1
φ(x, y, z) = − p .
x2 + y2 + z2

iv) Campo escalar: φ : R2 \ {(0, 0)} → R dado por


xy
φ(x, y) = .
x2 + y2

v) Trajectória ou caminho: γ : R → R3 dada por

γ(t) = (cos t, sen t, t).

vi) Parametrização de um parabolóide: g : R2 → R3 definida por

g(x, y) = (x, y, x2 + y 2 ).

Para uma função f : Rn → Rm usaremos a notação seguinte:

f (x) = f (x1 , x2 , · · · , xn ) = (f1 (x), f2 (x), · · · , fm (x))

em que cada função componente fj : D ⊂ Rn → R é uma função escalar,

fj (x) = fj (x1 , x2 , · · · , xn ) , j = 1, 2, . . . , m.

5.2 Funções Contı́nuas e Sucessões


A noção de função contı́nua desempenha um papel crucial nas aplicações. Muitas gran-
dezas fı́sicas são traduzidas matematicamente em termos de funções contı́nuas.

Definição 5 Uma função f : D ⊂ Rn → Rm é contı́nua em a ∈ D se

∀ǫ > 0 ∃δ > 0 ∀x ∈ D, k x − a k< δ ⇒k f (x) − f (a) k< ǫ

em que k x − a k é calculada em Rn e k f (x) − f (a) k é calculada em Rm .

Por outras palavras, dada uma bola de Rm , de raio ǫ centrada em f (a), ou seja, Bǫ (f (a)),
existe uma bola, de Rn , de raio δ centrada em a, Bδ (a) tal que se x ∈ Bδ (a) ∩ D então
f (x) ∈ Bǫ (f (a)). (ver figura (4))

7
Rn Rm

f (x)
δ ǫ
x
f f (a)
a

Figura 4: Definição de função contı́nua

Seja (xk ) uma sucessão em D tal que xk → a. Então existe um inteiro positivo k0 tal
que k xk − a k< δ para todo k > k0 . Sendo f contı́nua em a, teremos k f (xk ) − f (a) k< ǫ,
ou seja, f (xk ) → f (a).
Por outro lado, se f não fosse contı́nua em a existiria um ǫ > 0 tal que, para qualquer
δ > 0 haveria um ponto x ∈ D verificando
k x − a k< δ e k f (x) − f (a) k ≥ ǫ
Tomando sucessivamente δ = k1 , k ∈ N, terı́amos uma sucessão (xk ) tal que
1
k xk − a k< e k f (xk ) − f (a) k ≥ ǫ,
k
ou seja, xk → a mas a sucessão (f (xk )) não seria convergente para f (a).
Assim, podemos concluir que uma função f : D ⊂ Rn → Rm é contı́nua em a ∈ D
se e só se dada uma sucessão (xk ) tal que xk → a, então f (xk ) → f (a).
Note-se que, tendo em conta a desigualdade (1), facilmente se conclui que uma função
f : D ⊂ Rn → Rm é contı́nua em a ∈ D se e só se cada uma das funções componentes
fj : D ⊂ Rn → R, ∀j = 1, 2, . . . , m, for contı́nua em a ∈ D.
Portanto, em termos de continuidade, basta estudar as funções escalares.

5.3 Continuidade e Limite


Seja f : D ⊂ Rn → R uma função contı́nua e a ∈ D = int(D) ∪ ∂(D).
Diz-se que f (x) tende para b se e só se para todo ǫ > 0 existe δ > 0 tal que sempre que
x ∈ D e k x − a k < δ se tenha k f (x) − b k < ǫ.
Neste caso escrevemos lim f (x) = b.
x→a
Portanto, a função f é contı́nua no ponto a se e só se lim f (x) = f (a).
x→a
Assim, tendo em conta a noção de limite, facilmente se verificam as propriedades se-
guintes das funções contı́nuas.
Sejam f : D ⊂ Rn → R e g : D ⊂ Rn → R duas funções contı́nuas e α ∈ R. Então,

8
a) A função αf é contı́nua.
b) A função f + g é contı́nua.
c) A função f g é contı́nua.
d) A função f /g, sendo g 6= 0, é contı́nua.
e) Seja f : A ⊂ Rn → Rm uma função contı́nua em a ∈ A e g : B ⊂ Rm → Rp uma função
tal que f (A) ⊂ B, contı́nua em f (a). Então, a função composta g ◦ f : A ⊂ Rn → Rp
é contı́nua em a.

Exemplo 5.1 A função definida por f (x, y) = x é contı́nua em R2 . De facto,


p
| f (x, y) − f (a, b) |=| x − a | ≤ (x − a)2 + (y − b)2 =k (x − a, y − b) k
e, portanto, dado ǫ > 0, com δ = ǫ temos
k (x − a, y − b) k< δ ⇒| f (x, y) − f (a, b) |< ǫ,
ou seja,
lim f (x, y) = f (a, b) = a.
(x,y)→(a,b)

Do mesmo modo se vê que a função f (x, y) = y é contı́nua em R2 .


Em geral, a função f (x) = kk , k = 1, 2, . . . , n é contı́nua em Rn .

xy
Exemplo 5.2 Seja f (x, y) = p .
x2 + y 2
i) Pelas propriedades das funções contı́nuas f é contı́nua no seu domı́nio D = R2 \{(0, 0)}.
ii) A fronteira de D é o conjunto {(0, 0)}. Vamos ver que f pode ser prolongada por
continuidade à origem. De facto, para y = mx, temos
mx2 mx
lim f (x, y) = lim f (x, mx) = lim √ = lim √ = 0, ∀m ∈ R.
(x,y)→(0,0) x→0 x→0 x 1 + m2 x→0 1 + m2

Assim, existe um candidato a limite. Usando a desigualdade (1), temos


xy | x || y | k(x, y)k2
| f (x, y) |=| p |≤ ≤ = k(x, y)k.
x2 + y 2 k(x, y)k k(x, y)k

Portanto,
| f (x, y) | ≤ k(x, y)k,
ou seja,
lim f (x, y) = 0.
(x,y)→(0,0)

9
xy
Exemplo 5.3 Seja f (x, y) = .
x2 + y2
i) Pelas propriedades das funções contı́nuas f é contı́nua no seu domı́nio D = R2 \{(0, 0)}.

ii) A fronteira de D é o conjunto {(0, 0)}. Vamos ver que f não pode ser prolongada por
continuidade à origem. De facto,

x2 1
f (x, x) = 2
=
2x 2
2
x 1
f (x, −x) = − 2 = −
2x 2

e, portanto, para y = x temos


1
lim f (x, y) = lim f (x, x) =
(x,y)→(0,0) x→0 2
e para y = −x,
1
lim f (x, y) = lim f (x, −x) = − ,
(x,y)→(0,0) x→0 2
ou seja, a função f não pode ser prolongada por continuidade à origem.

x2 y
Exemplo 5.4 Seja g(x, y) = .
x2 + y 2
i) Pelas propriedades das funções contı́nuas g é contı́nua no seu domı́nio D = R2 \{(0, 0)}.

ii) A fronteira de D é o conjunto {(0, 0)}. Vamos ver que g pode ser prolongada por
continuidade à origem. De facto, para y = mx, temos
mx
lim g(x, y) = lim g(x, mx) = lim = 0, ∀m ∈ R.
(x,y)→(0,0) x→0 x→0 1 + m2

Portanto, lim g(x, y) = 0 desde que este limite seja calculado segundo qualquer
(x,y)→(0,0)
linha recta que passa pela origem. Este facto não garante que o limite exista mas, se
existir, deverá ser este mesmo.
Vamos ver, recorrendo à definição, que de facto temos lim g(x, y) = 0.
(x,y)→(0,0)
p
Usando a desigualdade (1), ou seja, x2 ≤ x2 + y 2 ; | y |≤ x2 + y 2, temos
p
x2 y x2 | y | (x2 + y 2 ) x2 + y 2 p
| g(x, y) |=| 2 | ≤ ≤ ≤ x2 + y 2 =k (x, y) k .
x + y2 x2 + y 2 x2 + y 2

10
Portanto,
| g(x, y) | ≤ k (x, y) k,
ou seja,
lim g(x, y) = 0.
(x,y)→(0,0)

sen(x2 + y 2 )
Exemplo 5.5 Seja h(x, y) = .
x2 + y 2
i) Pelas propriedades das funções contı́nuas h é contı́nua no seu domı́nio D = R2 \{(0, 0)}.
Note-se que h é a composição de funções contı́nuas

R2 → R → R
sen(x2 + y 2 )
(x, y) 7→ x2 + y 2 7 →
x2 + y 2

sen r
ii) Dado que lim = 1, teremos lim h(x, y) = 1.
r→0 r (x,y)→(0,0)

x3 y
Exemplo 5.6 Seja f (x, y) = .
x6 + y 2
i) Pelas propriedades das funções contı́nuas h é contı́nua no seu domı́nio D = R2 \{(0, 0)}.

ii) Para y = mx temos

mx2
lim f (x, y) = lim f (x, mx) = lim 4 = 0, ∀m ∈ R.
(x,y)→(0,0) x→0 x→0 x + m2

Fazendo x = 0 temos f (0, y) = 0 e, portanto, segundo todas as linhas rectas que


passam pela origem o limite é sempre o mesmo e poderı́amos pensar que o limite
lim f (x, y) existe.
(x,y)→(0,0)

No entanto, fazendo y = x3 obtemos

x6 1
f (x, x3 ) = 6
=
2x 2
e, portanto, o limite não existe.

x3 y
Exemplo 5.7 Seja f (x, y) = .
x2 + y 4

11
i) Pelas propriedades das funções contı́nuas h é contı́nua no seu domı́nio D = R2 \{(0, 0)}.

ii) A fronteira de D é o conjunto {(0, 0)}. Vamos ver que f pode ser prolongada por
continuidade à origem. De facto, para y = mx, temos

mx4 mx2
lim f (x, y) = lim f (x, mx) = lim = lim = 0, ∀m ∈ R.
(x,y)→(0,0) x→0 x→0 x2 + mx4 x→0 1 + mx2

É claro que f (0, y) = 0 e, portanto, lim f (x, y) = 0 desde que este limite seja
(x,y)→(0,0)
calculado segundo qualquer linha recta que passa pela origem. Este facto não garante
que o limite exista mas, se existir, deverá ser este mesmo.
Vamos ver, recorrendo à definição, que de facto temos lim f (x, y) = 0.
(x,y)→(0,0)

Usando a desigualdade (1) e tendo em conta que x2 + y 4 ≥ x2 , temos

x3 y | x |3 | y |
| f (x, y) |=| | ≤ =| x || y | ≤k (x, y) k2 .
x2 + y 4 | x |2

Portanto,
| f (x, y) | ≤ k (x, y) k2 ,
ou seja,
lim f (x, y) = 0.
(x,y)→(0,0)

5.4 Conjuntos Fechados. Exemplos


Seja f : Rn → R um campo escalar contı́nuo, α ∈ R e consideremos o conjunto

Aα = {x ∈ Rn : f (x) ≥ α}.

Seja (xk ) uma sucessão de termos em Aα e convergente para um ponto a. Dado que f
é uma função contı́nua, teremos

lim f (xk ) = f (a)


k→∞

e, sendo f (xk ) ≥ α, necessariamente f (a) ≥ α, ou seja a ∈ Aα .


Portanto, o conjunto Aα é fechado.
Do mesmo modo se mostra que os conjuntos da forma

{x ∈ Rn : f (x) ≤ α}

são também fechados.


Aos conjuntos da forma {x ∈ Rn : f (x) = α} dá-se o nome de conjuntos de nı́vel α da
função escalar f.

12
Assim, os conjuntos de nı́vel de uma função escalar contı́nua são fechados.
Sabendo que o complementar de um aberto é um fechado, concluı́mos que os conjuntos
da forma
{x ∈ Rn : f (x) > α}
ou da forma
{x ∈ Rn : f (x) < α}
são abertos.
O gráfico de uma função contı́nua f : Rn → R é um conjunto fechado em
n+1
R .
De facto, o gráfico da função f é o conjunto

G(f ) = {(x1 , x2 , . . . , xn , xn+1 ) ∈ Rn × R : xn+1 = f (x1 , x2 , . . . , xn )},

e definindo a função F (x1 , x2 , . . . , xn , xn+1 ) = xn+1 − f (x1 , x2 , . . . , xn ), fica claro que G(f )
é o conjunto de nı́vel zero da função contı́nua F : Rn+1 → R e, portanto, é um conjunto
fechado.

***

Exemplo 5.8 Um Cı́rculo em R2 .


Consideremos o conjunto definido por

C = {(x, y) ∈ R2 : x2 + y 2 ≤ 1},

ou seja, o cı́rculo de raio um e centro na origem de R2 , representado na figura 5.


y

x2 + y 2 ≤ 1

0 x

Figura 5: Cı́rculo definido por {(x, y) ∈ R2 : x2 + y 2 ≤ 1}

Dado que a função f (x, y) = x2 + y 2 é contı́nua em R2 , concluı́mos que C é um conjunto


fechado.

13
Exemplo 5.9 Uma Esfera em R3 .
Consideremos a superfı́cie esférica de raio um e centro na origem de R3 , representada
na figura 6, e definida por

S = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}.

z
z

ρ2 + z 2 = 1

ρ
x y

Figura 6: Esfera definida por {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1}

A superfı́cie S pode ser vista de várias formas.

i) S = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 − 1 = 0}, ou seja, é o conjunto de nı́vel zero da função


contı́nua F : R3 → R definida por F (x, y, z) = x2 + y 2 + z 2 − 1. Trata-se, portanto, de
um conjunto fechado.

ii) Dado que x2 + y 2 + z 2 = 1√⇔ x2 + y 2 = 1 − z 2 , então para cada valor de z temos


uma circunferência de raio 1 − z 2 e centro em (0, 0, z), em que 0 ≤ z ≤ 1. Trata-se,
portanto, de uma colecção ou“pilha” de circunferências.

iii) Pode ser vista como o resultado de uma rotação, em torno do eixo Oz, de uma semi-
circunferência tal como se ilustra na figura (6).
p
De facto, definindo ρ = x2 + y 2, temos ρ2 + z 2 = 1.
Note-se que ρ representa a distância de um ponto de coordenadas (x, y, z) ao eixo Oz,
ou seja, ao ponto de coordenadas (0, 0, z). Portanto, fazendo rodar a semi-circunferência
em torno do eixo Oz obtemos a esfera.

Exemplo 5.10 Um Cilindro em R3 .


A superfı́cie cilı́ndrica de raio um e altura dois em R3 , representada na figura 7, e
definida por
C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 ; −1 < z < 1},
pode ser vista de várias maneiras.

14
z z

ρ=1

0 ρ

y
x

Figura 7: Cilindro definido por {(x, y, z) ∈ R3 : x2 + y 2 = 1 ; −1 < z < 1}

i) C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 ; −1 < z < 1}, ou seja, é o conjunto de nı́vel um da


função contı́nua F : R3 → R definida por F (x, y, z) = x2 + y 2 . Trata-se, portanto, de
um conjunto fechado.
ii) É uma colecção ou “pilha” de circunferências de raio um e centro em (0, 0, z) em que
−1 < z < 1.
iii) Pode ser visto como o resultado de uma rotação, em torno do eixo Oz, de um segmento
de recta vertical tal como se ilustra na figura (7).
p
De facto, definindo ρ = x2 + y 2, temos ρ = 1.

Exemplo 5.11 Um Hiperbolóide em R3 .


O hiperbolóide representado na figura 8, e definido por
C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 + z 2 ; −1 < z < 1},

pode ser visto de várias maneiras.

i) C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 + z 2 ; −1 < z < 1}, ou seja, é o conjunto de nı́vel


um da função contı́nua F : R3 → R definida por F (x, y, z) = x2 + y 2 − z 2 . Trata-se,
portanto, de um conjunto fechado.

ii) É uma colecção ou “pilha” de circunferências de raio 1 + z 2 e centro em (0, 0, z) em
que −1 < z < 1.
iii) Pode ser visto como o resultado de uma rotação, em torno do eixo Oz, de um ramo
de hipérbole tal como se ilustra na figura (8).
p
De facto, definindo ρ = x2 + y 2, temos ρ2 − z 2 = 1.

15
z

1
ρ2 − z 2 = 1

1 ρ
y
x
−1

Figura 8: Hiperbolóide definido por {(x, y, z) ∈ R3 : x2 + y 2 = 1 + z 2 ; −1 < z < 1}

Exemplo 5.12 Um Parabolóide em R3 .


Seja S a superfı́cie representada na figura 9 e definida por

P = {(x, y, z) ∈ R3 : z = x2 + y 2 }.

z = ρ2

ρ
x y

Figura 9: Parabolóide definido por {(x, y, z) ∈ R3 : z = x2 + y 2 }

i) P = {(x, y, z) ∈ R3 : z = x2 + y 2}, é o gráfico da função contı́nua f : R2 → R definida


por f (x, y) = x2 + y 2. Trata-se, portanto, de um conjunto fechado.

ii) É uma “pilha” de circunferências de raio z e centro em (0, 0, z).
iii) É o resultado de uma rotação, em torno do eixo Oz, de uma parábola tal como se
ilustra na figura 9.

16
p
De facto, definindo ρ = x2 + y 2, temos z = ρ2 .

Exemplo 5.13 Um Cone em R3 .

z=ρ

y
x 0 ρ
p
Figura 10: Cone definido por {(x, y, z) ∈ R3 : z = x2 + y 2 }

p
i) O cone C = {(x, y, z) ∈pR3 : z = x2 + y 2 }, é gráfico da função contı́nua f : R2 → R
definida por f (x, y) = x2 + y 2. Trata-se, portanto, de um conjunto fechado.

ii) É uma “pilha” de circunferências de raio z e centro em (0, 0, z).


iii) Pode ser visto como o resultado de uma rotação, em torno do eixo Oz, de uma recta
tal como se ilustra na figura (10).
p
De facto, definindo ρ = x2 + y 2, temos z = ρ.

Exemplo 5.14 Um Toro em R3 .


p
i) O toro T = {(x, y, z) ∈ R3 : ( x2 + y 2 − 3)2 + z 2 = 1}, é p
o conjunto de nı́vel zero
da função contı́nua F : R3 → R definida por F (x, y, z) = ( x2 + y 2 − 3)2 + z 2 − 1.
Trata-se, portanto, de um conjunto fechado.
ii) Pode ser visto como o resultado de uma rotação, em torno do eixo Oz, de uma cir-
cunferência tal como se ilustra na figura (11).
De facto, definindo ρ = x2 + y 2, temos (ρ − 3)2 + z 2 = 1.
p

***

17
z
S z

(ρ − 3)2 + z 2 = 1
1

N 3 ρ
x y
p
Figura 11: Toro definido por {(x, y, z) ∈ R3 : ( x2 + y 2 − 3)2 + z 2 = 1}

5.5 Conjuntos Compactos. Teorema de Weierstrass


Um conjunto A ⊂ Rn diz-se limitado se existir uma bola centrada na origem que o
contenha, ou seja,

∃R > 0 : A ⊂ BR (0) ⇔ ∃R > 0 ∀x ∈ A : k x k< R

Um conjunto A ⊂ Rn diz-se compacto se for limitado e fechado.

Exemplo 5.15 i) É claro que uma bola em Rn é um conjunto limitado.

ii) A superfı́cie cilı́ndrica (7) é um conjunto limitado porque, sendo

x2 + y 2 = 1 ; −1 < z < 1,

teremos
x2 + y 2 + z 2 ≤ 2,

ou seja, está contida na bola de raio 2 e centro na origem.

iii) O toro (11) é um conjunto limitado. De facto, sendo


p
( x2 + y 2 − 3)2 + z 2 = 1,

é claro que p
2 ≤ x2 + y 2 ≤ 4 ; z 2 ≤ 1,
e, portanto,
x2 + y 2 + z 2 < 17.

iv) O parabolóide (9) e o cone (10) não são conjuntos limitados.

18
É sabido que em R uma sucessão limitada tem pelo menos uma subsucessão convergente.
Em Rn acontece o mesmo.
Para vermos que assim é, consideremos apenas o caso de R2 . Seja (xk , yk ) uma sucessão
limitada, ou seja,
∃R > 0 ∀k k (xk , yk ) k ≤ R
e, sabendo que
| xk | ≤k (xk , yk ) k,
a sucessão (xk ) é limitada em R e, portanto, tem uma subsucessão convergente. Seja (xk′ )
essa subsucessão.
A sucessão (xk′ , yk′ ) é uma subsucessão de (xk , yk ) e note-se que (yk′ ) é também limitada
em R e tem, portanto, pelo menos uma subsucessão (yk′′ ) convergente.
Assim, a sucessão (xk′′ , yk′′ ) é uma subsucessão convergente da sucessão (xk , yk ).
Recorde-se que uma sucessão convergente, com termos num conjunto fechado, tem
limite nesse conjunto.
Portanto, um conjunto A ⊂ R é compacto se qualquer sucessão com termos em A tem
pelo menos uma subsucessão convergente com limite em A.
Seja f : Rn → Rm uma função contı́nua e D ⊂ Rn um conjunto compacto e considere-
mos o respectivo conjunto imagem f (D).
Seja (yk ) uma sucessão em f (D) e consideremos a sucessão (xk ) de termos em D tal
que yk = f (xk ).
Sendo D um conjunto compacto, a sucessão (xk ) tem uma subsucessão (xk′ ) convergente
com limite a ∈ D e, dado que f é uma função contı́nua, teremos

lim f (xk′ ) = f (a)


xk′ →a

e, portanto,
lim yk′ = f (a) ∈ f (D),
k ′ →∞

ou seja, a sucessão (yk ) tem uma subsucessão (yk′ ) convergente com limite em f (D).
No caso escalar, f (D) será um conjunto compacto em R e, portanto, terá máximo e
mı́nimo.

Teorema 5.1 (Weierstrass) Seja D ⊂ Rn um conjunto compacto e não vazio. Então


qualquer função escalar contı́nua em D tem máximo e mı́nimo nesse conjunto.

***
Por ser útil, daremos outra caracterização dos conjuntos compactos.
Diz-se que uma colecção de conjuntos abertos (Aα ) constitui uma cobertura de D se
[
D⊂ Aα .
α

19
I

1111
0000 D

0000
1111
0000
1111
0000
1111
Figura 12

Teorema 5.2 Seja (Aα ) uma cobertura de um compacto D. Então existe um número finito
de conjuntos Aα1 , Aα2 , . . . , AαN , dessa cobertura, tais que
N
[
D⊂ Aαk .
k=1
n
Diz-se que um conjunto I ⊂ R é um intervalo aberto se for o produto cartesiano de n
intervalos abertos de R, ou seja, se tivermos
I =]a1 , b1 [×]a2 , b2 [× · · · ×]an , bn [.
Em R2 um intervalo é um rectângulo cujas arestas são paralelas aos eixos coordenados.
Em R3 é um paralelipı́pedo com arestas paralelas aos eixos coordenados.
Seja D um conjunto compacto. Então deverá existir um intervalo limitado I tal que
D ⊂ I, como se ilustra na figura 12. Suponhamos que D não verifica a propriedade
enunciada no teorema. Então, por bissecção das arestas de I, para algum dos resultantes
sub-intervalos, designado por I1 , o conjunto I1 ∩ D não verifica aquela propriedade. Seja
x1 ∈ I1 ∩ D um ponto qualquer.
Repetindo este processo, teremos uma sucessão de conjuntos (Ik ∩ D) que não verificam
a propriedade e uma sucessão de pontos (xk ) , tais que xk ∈ Ik ∩ D e I1 ⊃ I2 ⊃ · · · ⊃ Ik ⊃
··· .
Sendo D limitado e fechado, existe uma subsucessão de (xk ) , também designada por
(xk ) , que é convergente e cujo limite, designado por x, pertence a D.
Assim, existe algum Aα tal que x ∈ Aα e, sendo Aα aberto, existe uma bola Bǫ (x) ⊂ Aα .
Dado que xk → x, seja k0 tal que, para k > k0 , se tenha xk ∈ Bǫ (x).
Por construção dos intervalos Ik , então existe um conjunto Aα tal que
xk ∈ Ik ∩ D ⊂ Bǫ (x) ⊂ Aα ,
o que contradiz o facto de que Ik ∩ D não verifica a propriedade. Portanto, D verifica
aquela propriedade.

***

20
Referências
[1] Tom M. Apostol. Calculus II. Editorial Reverté, SA, 1977.

[2] J. Campos Ferreira. Introdução à Análise em Rn . AEIST, 1978.

[3] J. E. Marsden and A. J. Tromba. Vector Calculus. W. H. Freeman and Company, 1998.

21
Instituto Superior Técnico
Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

CDI-II

Funções Diferenciáveis

1 Funções Diferenciáveis. Derivadas Parciais


A noção de derivada é das mais importantes no estabelecimento de modelos matemáticos
de fenómenos fı́sicos, quı́micos, etç. Na prática esses modelos são dados em termos de
equações envolvendo as taxas de variação das grandezas em jogo (c.f. [2, 3, 1]).
Recordemos que, dada uma função f : R → R, diz-se que f é diferenciável num ponto
a se existir o limite seguinte

f (a + h) − f (a)
f ′ (a) = lim ,
h→0 h
a que chamamos derivada de f em a.
Teremos então,
f (a + h) − f (a) − f ′ (a)h
lim = 0,
h→0 h
ou seja,
|f (a + h) − f (a) − f ′ (a)h|
lim = 0.
h→0 |h|
Fazendo x = a + h, dado ǫ > 0 existe δ > 0 tais que, se |x − a| < δ então

|f (x) − f (a) − f ′ (a)(x − a)| < ǫ|x − a|.

Isto quer dizer que, perto do ponto a, o gráfico de f confunde-se com a recta de equação
y = f (a) + f ′ (a)(x − a), cujo declive é precisamente a derivada f ′ (a),tal como se ilustra na
figura 1.
Note-se que a função real de variável real, R ∋ h 7→ f ′ (a)h ∈ R, é linear. Portanto, f
é diferenciável em a se, de certo modo, for possı́vel aproximar a diferença f (a + h) − f (a)
pela função linear h 7→ f ′ (a)h.
Esta forma de descrever a noção de derivada em R pode ser transposta para o caso das
funções de várias variáveis.

Definição 1.1 Uma função f : D ⊂ Rn → Rm diz-se diferenciável num ponto a ∈ int(D)


se existir uma aplicação linear Df (a) : Rn → Rm , denominada derivada de f em a, tal que

f (a + h) − f (a) − Df (a)h = o(h),


y
y = f (x)

y = f (a) + f ′ (a)(x − a)

f (a)

a x

Figura 1: Derivada em R. Tangente ao gráfico

ou seja,
o(h) f (a + h) − f (a) − Df (a)h
lim = lim =0
h→0 khk h→0 khk

***

A transformação linear Df (a) : Rn → Rm deverá ser representada por uma matriz com
m linhas e n colunas.
Para determinar essa matriz, seja {e1 , e2 , · · · , en } a base canónica de Rn . Fazendo h =
tek com t ∈ R, teremos

f (a + tek ) − f (a) = Df (a)(tek ) + o(tek )

e, sabendo que Df (a) é uma aplicação linear, então

f (a + tek ) − f (a) = tDf (a)ek + o(tek ),

ou seja,
f (a + tek ) − f (a) o(tek )
= Df (a)ek + .
t t
Portanto,
f (a + tek ) − f (a)
lim = Df (a)ek .
t→0 t

2
Note-se que

a = (a1 , a2 , . . . , ak , . . . , , an ) ; a + tek = (a1 , a2 , . . . , ak + t, . . . , , an )

e a razão incremental
f (a + tek ) − f (a) f (a1 , a2 , . . . , ak + t, . . . , , an ) − f (a1 , a2 , . . . , ak , . . . , , an )
=
t t
obtem-se, fixando todas as coordenadas excepto a k-ésima.
Sendo f (x) = (f1 (x), f2 (x), . . . , fm (x)), temos

 
f (a + tek ) − f (a) f1 (a + tek ) − f1 (a) fm (a + tek ) − fm (a)
lim = lim , . . . , lim .
t→0 t t→0 t t→0 t
Note-se também que o conjunto de pontos definido por {a + tek : t ∈ R} é a recta que
passa pelo ponto a e com a direcção do vector ek .
fj (a + tek ) − fj (a)
Assim, a razão incremental é a taxa de variação da função escalar
t
fj na direcção ek .

Definição 1.2 Ao limite


∂fj fj (a + tek ) − fj (a)
(a) = lim
∂xk t→0 t
chamamos derivada parcial de fj , com j = 1, 2, . . . , m, no ponto a em ordem à variável
xk , com k = 1, 2, . . . , n.

∂fj
Note-se também que para calcular a derivada parcial (a) devemos fixar todas as
∂xk
variáveis excepto xk . De facto, temos

fj (a + tek ) − fj (a) = fj (a1 , a2 , . . . , ak + t, . . . , an ) − fj (a1 , a2 , . . . , ak , . . . , an ).

Portanto, trata-se de calcular a derivada de uma função de uma variável real xk .


Por outro lado, Df (a)ek é a k-ésima coluna da matriz que representa a derivada Df (a).
Portanto, a matriz que representa a derivada Df (a) será
 ∂f ∂f1 ∂f1

1
∂x1
(a) ∂x 2
(a) · · · ∂x n
(a)
 
 ∂f2 ∂f2 ∂f2
 ∂x (a) ∂x (a) · · · ∂xn (a) 

 1 2 
 
Df (a) =  . . ... .  (1)


 . . ... .  

 . . . . . . 
 
 
∂fm ∂fm ∂fm
∂x1
(a) ∂x2 (a) · · · ∂xn (a)

3
À matriz Df (a) também se dá o nome de matriz Jacobiana de f.
No caso em que m = 1, ou seja, f : D ⊂ Rn → R, então Df (a) terá apenas uma linha
h i
∂f ∂f ∂f
Df (a) = ∂x 1
(a) ∂x2
(a) · · · ∂xn
(a)

e podemos representá-la na forma vectorial


 
∂f ∂f ∂f
Df (a) = (a), (a), · · · , (a) ,
∂x1 ∂x2 ∂xn
a que chamaremos gradiente de f em a.
Passaremos a designar este vector pelo sı́mbolo ∇f (a), ou seja,
 
∂f ∂f ∂f
∇f (a) = (a), (a), · · · , (a) .
∂x1 ∂x2 ∂xn
Devemos notar que, no caso geral, a j-ésima linha da matriz Jacobiana é o gradiente
da função coordenada fj .

z
∂f ∂f
z = f (a, b) + ∂x
(a, b)(x − a) + ∂y
(a, b)(y − b)

(a, b, f (a, b))


z = f (x, y)

y
x
Figura 2: Derivada em R2 . Plano tangente ao gráfico no ponto (a, b, f (a, b))

No caso em que n = 1, a derivada será dada por uma matriz coluna que pode ser escrita
na forma vectorial. Havendo apenas uma variável em jogo, ou seja,
f (t) = (f1 (t), f2 (t), . . . , fm (t)),
com t ∈ R, usaremos a seguinte notação para a respectiva derivada:
f ′ (t) = (f1′ (t), f2′ (t), . . . , fm

(t)).

4
***
No caso em que f : R2 → R é diferenciável no ponto (a, b), temos

∂f ∂f
f (x, y) = f (a, b) + (a, b)(x − a) + (a, b)(y − b) + o(x − a, y − b).
∂x ∂y
Se notarmos que a equação,
∂f ∂f
z = f (a, b) + (a, b)(x − a) + (a, b)(y − b),
∂x ∂y
define um plano que passa pelo ponto (a, b, f (a, b)), dizemos que, suficientemente perto
deste ponto o gráfico da função f se confunde com aquele plano.
Na figura 2 encontra-se representado o gráfico de uma função f : R2 → R e o plano
tangente definido pela respectiva derivada.

***

Exemplo 1.1 A função f (x, y) = x, definida em R2 é diferenciável em qualquer ponto de


R2 .
Seja (a, b) um ponto qualquer de R2 . Fixando y = b e derivando f como função apenas
de x obtemos
∂f
(a, b) = 1.
∂x
Fixando x = a e derivando f como função apenas de y obtemos
∂f
(a, b) = 0.
∂y
Portanto, h i
∂f ∂f
 
Df (a, b) = ∂x
(a, b) ∂y
(a, b) = 1 0
e  
 h

Df (a, b)(h, k) = 1 0 = h.
k
Assim,
f (a + h, b + k) − f (a, b) − Df (a, b)(h, k) a+h−a−h
lim = lim =0
(h,k)→(0,0) k (h, k) k (h,k)→(0,0) k (h, k) k

e, portanto f é diferenciável em (a, b), de acordo com a definição (1.1).

5
Exemplo 1.2 Seja f : Rn → Rm uma aplicação linear e seja A a matriz (com m linhas e
n colunas) que a representa na base canónica de Rn , ou seja, f (x) = Ax.
É claro que, dados x e a em Rn , teremos
f (x) − f (a) = f (x − a) = A(x − a)
e, portanto, a função f é diferenciável em qualquer ponto de Rn e a respectiva derivada é
dada pela matriz A, ou seja Df (a) = A.

Exemplo 1.3 Consideremos a função f (x, y) = (x+2y , 2x+3y). É claro que f : R2 → R2


é uma aplicação linear e, portanto, a respectiva derivada é dada pela matriz
1 2
" #
Df (x, y) = .
2 3

x
Exemplo 1.4 O gradiente da função f (x, y) = no ponto (x, y) do respectivo domı́nio é
y
o vector    
∂f ∂f 1 x
∇f (x, y) = (x, y), (x, y) = ,−
∂x ∂y y y2

x 2 2
Exemplo 1.5 Consideremos a função f (x, y) = ( , sen(xy) , ex +y ).
y
A respectiva Jacobiana será a matriz de três linhas e duas colunas,
1
− yx2
 
y
 
Df (x, y) = y cos(xy) x cos(xy) .
 
 
2 2 2 2
2xex +y 2yex +y

***

Seja f : D ⊂ Rn → Rm uma função diferenciável num ponto a ∈ int(D) e consideremos


a matriz (1) que representa a derivada Df (a).
Note-se que na j-ésima linha de Df (a) se encontra o gradiente da função coordenada fj ,
ou seja, para construir a matriz Df (a) basta considerar cada uma das funções coordenadas
de f. Assim, iremos apenas considerar funções escalares, ou seja, m = 1.
∂f
Recordemos que a derivada parcial (a) é calculada fixando todas as variáveis excepto
∂xk
xk , o que significa calcular a derivada de uma função real de variável real.
Na figura (3) encontra-se uma representação gráfica deste procedimento em R2 .

6
z
z = f (x, y)

x fixo

y fixo
y
x

Figura 3: Procedimento para cálculo de derivadas parciais

Exemplo 1.6 Consideremos a função



 x2xy
+y 2
, se (x, y) 6= (0, 0)
f (x, y) =
0 , se (x, y) = (0, 0)

Para (x, y) 6= (0, 0), fixando y e derivando em ordem a x teremos

∂f y 3 − x2 y
(x, y) = 2 .
∂x (x + y 2)2

Fixando x e derivando em ordem a y

∂f x3 − xy 2
(x, y) = 2 .
∂y (x + y 2)2

Na origem deveremos usar a definição de derivada parcial. Assim, teremos

∂f f (t, 0) − f (0, 0)
(0, 0) = lim =0
∂x t→0 t
porque f (t, 0) = f (0, 0) = 0.
Do mesmo modo
∂f f (0, t) − f (0, 0)
(0, 0) = lim =0
∂y t→0 t
porque f (0, t) = f (0, 0) = 0.

7
Portanto, as derivadas parciais existem em todos os pontos de R2 .
No entanto esta função não é diferenciável na origem. De facto, se tal sucedesse,
terı́amos
f (h, k) − f (0, 0) − ∇f (0, 0)(h, k)
lim = 0.
(h,k)→(0,0) k (h, k) k
Mas, sendo f (0, 0) = 0 e ∇f (0, 0) = (0, 0), o limite

f (h, k) hk
lim √ = lim √
(h,k)→(0,0) 2
h +k 2 (h,k)→(0,0) (h + k ) h2 + k 2
2 2

não existe, como facilmente se verifica fazendo k = h.


Note-se que f não é contı́nua na origem e, portanto, não poderı́amos esperar que fosse
diferenciável nesse ponto. No entanto, as derivadas parciais existem.
Este exemplo leva-nos a pensar que a existência de derivadas parciais não garante a
difereciabilidade da função.
Na figura (4) encontra-se o gráfico desta função.

xy
Figura 4: Gráfico da função f (x, y) = x2 +y 2

Exemplo 1.7 Consideremos a função



xy
 √x2 +y2 , se (x, y) 6= (0, 0)

f (x, y) =
0 , se (x, y) = (0, 0)

Na figura (5) encontra-se o gráfico desta função.


Tendo em conta que

xy x2 + y 2 p
|p |≤ p = x2 + y 2 =k (x, y) k
x2 + y 2 x2 + y 2

é claro que esta função é contı́nua na origem.

8
z

y
x

Figura 5: Gráfico da função f (x, y) = √ xy


2x +y 2

Para (x, y) 6= (0, 0), fixando y e derivando em ordem a x teremos


∂f y3
(x, y) = p .
∂x (x2 + y 2 ) x2 + y 2
Fixando x e derivando em ordem a y
∂f x3
(x, y) = p .
∂y (x2 + y 2 ) x2 + y 2
Na origem deveremos usar a definição de derivada parcial. Assim, teremos
∂f f (t, 0) − f (0, 0)
(0, 0) = lim =0
∂x t→0 t
porque f (t, 0) = f (0, 0) = 0.
Do mesmo modo
∂f f (0, t) − f (0, 0)
(0, 0) = lim =0
∂y t→0 t
porque f (0, t) = f (0, 0) = 0.
Portanto, as derivadas parciais existem em todos os pontos de R2 .
No entanto esta função não é diferenciável na origem. De facto, se tal sucedesse,
terı́amos
f (h, k) − f (0, 0) − ∇f (0, 0)(h, k)
lim = 0.
(h,k)→(0,0) k (h, k) k
Mas, sendo f (0, 0) = 0 e ∇f (0, 0) = (0, 0), teremos
f (h, k) hk
lim √ = lim 6= 0,
(h,k)→(0,0) h2 + k 2 (h,k)→(0,0) h2 + k 2
como facilmente se verifica fazendo k = h.
Portanto, esta função não é diferenciável na origem.
Note-se que as derivadas parciais de f não são contı́nuas na origem. Basta fazer y = mx
∂f ∂f
para verificar que os limites lim (x, y) e lim (x, y) não existem.
(x,y)→(0,0) ∂x (x,y)→(0,0) ∂y

9
Exemplo 1.8 Consideremos a função
 2
x y
 √x2 +y2 , se (x, y) 6= (0, 0)

f (x, y) =
0 , se (x, y) = (0, 0),

cujo gráfico se encontra na figura 6. z

x y

2
Figura 6: Gráfico da função f (x, y) = √ x2 y
x +y 2

Tal como no exemplo anterior, facilmente se verifica que se trata de uma função contı́nua
em R2 e, as respectivas derivadas parciais na origem existem e são dadas por
∂f ∂f
(0, 0) = 0 ; (0, 0) = 0.
∂x ∂y
Portanto,
f (h, k) − f (0, 0) − ∇f (0, 0)(h, k) h2 k
lim = lim = 0,
(h,k)→(0,0) k (h, k) k (h,k)→(0,0) h2 + k 2

ou seja, trata-se de uma função diferenciável na origem.


Em R2 \ {(0, 0)}, teremos
∂f x3 y + 2xy 3 ∂f x4
(x, y) = 2 ; (x, y) = 2 ,
∂x (x + y 2 )3/2 ∂y (x + y 2 )3/2
e é fácil verificar que
∂f ∂f ∂f ∂f
lim (x, y) = (0, 0) = 0 ; lim (x, y) = (0, 0) = 0,
(x,y)→(0,0) ∂x ∂x (x,y)→(0,0) ∂y ∂y
ou seja, as derivadas parciais são contı́nuas em R2 .

***

10
2 Identificação de Funções Diferenciáveis. Proprieda-
des
O uso da definição de função diferenciável pode tornar-se penoso. Esta tarefa pode ser
facilitada recorrendo às propriedades das funções diferenciáveis.
Por definição, se uma função escalar f : Rn → R for diferenciável em a ∈ Rn , teremos
f (x) = f (a) + Df (a)(x − a) + o(x − a).
Notemos que a função x 7→ Df (a)(x − a) é contı́nua em a. De facto, temos
n
X ∂f
|Df (a)(x − a)| = | (a)(xj − aj )| ≤ C||x − a||
j=1
∂xj

n ∂f
em que C = n max | (a)|.
j=1 ∂xj
Notemos também que
|o(x − a)|
|o(x − a)| = ||x − a||,
||x − a||
e podemos concluir que
lim f (x) = f (a),
x→a
ou seja, f é contı́nua em a.
Recordemos que uma função f : Rn → Rm é contı́nua se e só se cada uma das compo-
nentes escalares fj : Rn → R , j = 1, . . . , m, for contı́nua.
Portanto, se uma função for diferenciável num ponto será necessariamente
contı́nua nesse ponto.
Neste contexto, a propriedade mais importante é a que se refere à derivada da com-
posição de funções.
Consideremos a seguinte composição de funções diferenciáveis
g f
Rn −→ Rp −→ Rm

x 7→ g(x) 7→ f (g(x))

a 7→ b = g(a) 7→ f (g(a)) = f (b)


e sejam U ∈ Rn e V ∈ Rp conjuntos abertos tais que f (U) ⊂ V.
Sejam a ∈ U e b = g(a) ∈ V. Sendo g diferenciável em a teremos
g(a + h) − g(a) = Dg(a)h + og (h).
Seja k ∈ Rp tal que g(a + h) = b + k. Sendo f diferenciável em b = g(a) teremos
f (b + k) − f (b) = Df (b)k + of (k)

11
e, portanto,

f (g(a + h)) − f (g(a)) = Df (g(a))k + of (k)

= Df (g(a))(g(a + h) − g(a)) + of (k)

= Df (g(a))(Dg(a)h + og (h)) + of (k)

= Df (g(a))Dg(a)h + Df (g(a))og (h) + of (k).

Assim, a função f ◦ g será diferenciável em a e a respectiva derivada será

D(f ◦ g)(a) = Df (g(a))Dg(a)

desde que se verifique


Df (g(a))og (h) + of (k)
lim = 0.
h→0 khk
Para isso basta notar que, sendo k = g(a + h) − g(a), teremos

of (k) of (k) k k k
=
khk kkkkhk
of (k) k g(a + h) − g(a) k
=
kkk khk
of (k) k Dg(a)h + og (h) k
= ,
kkk khk

Note-se também que, dado um vector qualquer v ∈ Rn e uma matriz A = (aij ) com m
linhas e n colunas, temos
||Av|| ≤ C||v||
em que C = nm maxi,j |aij |.
Podemos, assim, enunciar o célebre teorema da derivada da função composta.

Teorema 2.1 (Função Composta) Se g é diferenciável no ponto a e f é diferenciável


no ponto g(a), então f ◦ g é diferenciável no ponto a e

D(f ◦ g)(a) = Df (g(a))Dg(a).

Note-se que a matriz que representa a derivada Dg(a) tem p linhas e n colunas e a que
representa a derivada Df (g(a)) tem m linhas e p colunas. Assim, a matriz que representa
a derivada da função composta D(f ◦ g)(a) tem m linhas e n colunas por ser o produto
Df (g(a))Dg(a).

12
Sejam f : D ⊂ Rn → R e g : D ⊂ Rn → R duas funções diferenciáveis em a ∈ int(D) e
consideremos a seguinte composição
h s
Rn −→ R2 −→ R
(2)
x 7→ (f (x), g(x)) 7→ f (x) + g(x)

em que h(x) = (f (x), g(x)) e s(u, v) = u + v.


Pelo teorema da função composta temos

D(s ◦ h)(a) = D(s(h(a))Dh(a)

em que
 ∂s ∂s
  
Ds(h(a)) = Ds(f (a), g(a)) = ∂u
(f (a), g(a)) ∂v
(f (a), g(a)) = 1 1

e  ∂f 
∂f ∂f
∂x1
(a) ∂x2
(a) ··· ∂xn
(a)
Dh(a) =  
∂g ∂g ∂g
∂x1
(a) ∂x2
(a) ··· ∂xn
(a)
e, portanto,

D(s ◦ h)(a) = D(s(h(a))Dh(a) =


 ∂f ∂f ∂f

 ∂s ∂x1
(a) ∂x2
(a) ··· ∂xn
(a)
∂s

= ∂u (f (a), g(a)) ∂v (f (a), g(a))  
∂g ∂g ∂g
∂x1
(a) ∂x2
(a) ··· ∂xn
(a)
 ∂f ∂f ∂f

  ∂x1 (a) ∂x2 (a) · · · ∂xn (a)
= 1 1  
∂g ∂g ∂g
∂x1
(a) ∂x2
(a) · · · ∂xn
(a)
h i
∂f ∂g ∂f ∂g ∂f ∂g
= ∂x 1
(a) + ∂x 1
(a) ∂x 2
(a) + ∂x 2
(a) · · · ∂xn
(a) + ∂xn
(a)

= Df (a) + Dg(a)

Se notarmos que s(h(x)) = f (x) + g(x), concluı́mos que a soma de funções dife-
renciáveis é uma função diferenciável e a respectiva derivada é dada por

D(f + g)(a) = Df (a) + Dg(a),

ou seja, a derivada da soma é a soma das derivadas.


Se na composição (2) fizermos s(u, v) = uv facilmente concluı́mos que o produto de
funções diferenciáveis é uma função diferenciável e a respectiva derivada é dada por

D(f g)(a) = f (a)Dg(a) + g(a)Df (a).

13
u
Do mesmo modo, se em (2) fizermos s(u, v) = , com v 6= 0, o quociente de funções
v
diferenciáveis é uma função diferenciável e teremos
 
f g(a)Df (a) − f (a)Dg(a)
D (a) = ,
g g(a)2

desde que g(a) 6= 0.


É também claro que se f for uma função diferenciável e α ∈ R então αf, é diferenciável.

***

Exemplo 2.1 A função (ver a figura (5))



xy
 √x2 +y2 , se (x, y) 6= (0, 0)

f (x, y) =
0 , se (x, y) = (0, 0)

não é diferenciável na origem mas é diferenciável em R2 \ {(0, 0)}.


h(x, y) p
De facto, f é o quociente f (x, y) = em que h(x, y) = xy e g(x, y) = x2 + y 2 .
g(x, y)
A função h é diferenciável por ser o produto de funções diferenciáveis.
A função g é a composição r ◦ s,
s r
R2 −→ R −→ R
p
(x, y) 7→ x2 + y 2 7→ x2 + y 2

em que s(x, y) = x2 + y 2 e r(u) = u , (u 6= 0), são funções diferenciáveis.

***

Exemplo 2.2 A função (ver a figura (4))



 x2xy
+y 2
, se (x, y) 6= (0, 0)
f (x, y) =
0 , se (x, y) = (0, 0)

não é contı́nua na origem e, portanto, não será diferenciável nesse ponto. Em R2 \ {(0, 0)}
é diferenciável por ser o quociente de funções diferenciáveis.

14
Exemplo 2.3 Seja f : R2 → R uma função definida por

f (x, y) = sen(u(x, y)v(x, y))


em que u e v são funções escalares, diferenciáveis em R2 , tais que u(1, 0) = 2 e v(1, 0) = π.
É uma função diferenciável por ser a composição f = g ◦ h de funções diferenciáveis
h g
R2 −→ R2 −→ R

(x, y) 7→ (u(x, y), v(x, y) 7→ sen(u(x, y)v(x, y))


em que
h(x, y) = (u(x, y), v(x, y))
e
g(u, v) = sen(uv).
Assim, dado que h(1, 0) = (2, π), teremos

∇f (1, 0) = Dg(h(1, 0))Dh(1, 0) = Dg(2, π)Dh(1, 0) =


 ∂u ∂u

 ∂g  ∂x (1, 0) ∂y
(1, 0)
= ∂u (2, π) ∂g
∂v
(2, π)  =
∂v ∂v
∂x
(1, 0) ∂y
(1, 0)
 ∂u
(1, 0) ∂u

∂x ∂y
(1, 0)
= ∂u (2, π) ∂g
 ∂g 
∂v
(2, π)  
∂v ∂v
∂x
(1, 0) ∂y (1, 0)

h i
∂g ∂g ∂g ∂g
= ∂u
(2, π) ∂u
∂x
(1, 0) + ∂v
∂v
(2, π) ∂x (1, 0) ∂u
(2, π) ∂u
∂y
(1, 0) + ∂v
(2, π) ∂v
∂y
(1, 0)

h i
∂g ∂g ∂g ∂g
= ∂u
(2, π) ∂u
∂x
(1, 0) + ∂v
∂v
(2, π) ∂x (1, 0) ∂u
(2, π) ∂u
∂y
(1, 0) + ∂v
(2, π) ∂v
∂y
(1, 0)

Sabendo que
∂g
(u, v) = v cos(uv)
∂u

∂g
(u, v) = u cos(uv),
∂v
e, portanto,
∂g
(2, π) = π
∂u

∂g
(2, π) = 2,
∂v
15
teremos
∇f (1, 0) = π ∂u ∂v
(1, 0) π ∂u (1, 0) + 2 ∂v
 
∂x
(1, 0) + 2 ∂x ∂y ∂y
(1, 0) .
Na forma vectorial será
 
∂u ∂v ∂u ∂v
∇f (1, 0) = π (1, 0) + 2 (1, 0) , π (1, 0) + 2 (1, 0) .
∂x ∂x ∂y ∂y

Note-se que, num ponto qualquer (x, y), teremos

∂f ∂g ∂u ∂g ∂v
(x, y) = (u(x, y), v(x, y)) (x, y) + (u(x, y), v(x, y)) (x, y)
∂x ∂u ∂x ∂v ∂x

∂f ∂g ∂u ∂g ∂v
(x, y) = (u(x, y), v(x, y)) (x, y) + (u(x, y), v(x, y)) (x, y)
∂x ∂u ∂x ∂v ∂x
ou duma forma mais concisa,
∂f ∂g ∂u ∂g ∂v
= +
∂x ∂u ∂x ∂v ∂x

∂f ∂g ∂u ∂g ∂v
= +
∂y ∂u ∂y ∂v ∂y

Exemplo 2.4 Diz-se que uma função f : Rn → R é homogénea de grau k se, para
qualquer λ ∈ R, tivermos f (λx) = λk f (x). As funções homogéneas desempenham um
papel importante em Termodinámica.
Para cada x ∈ Rn , sejam g : R → R e h : R → Rn as funções definidas por

g(λ) = f (λx) ; h(λ) = λx.

É claro que a função g é a função composta f ◦ h, ou seja, g(λ) = f (h(λ)),


h f
R −→ Rn −→ R

λ 7→ h(λ) 7→ f (h(λ))

λ 7→ λx 7→ f (λx) .

Assim, teremos
g ′ (λ) = Df (h(λ))h′(λ) = ∇f (λx) · x.
Por outro lado, tendo em conta que g(λ) = f (λx) = λk f (x), teremos

g ′(λ) = kλk−1 f (x)

16
e, portanto,
∇f (λx) · x = kλk−1 f (x).
Dado que λ é arbitrário, fazendo λ = 1, obtemos

∇f (x) · x = kf (x),

ou ainda,
n
X ∂f
(x) xj = kf (x).
j=1
∂xj

***

A função estudada no exemplo (1.7) é contı́nua na origem mas as respectivas derivadas


parciais não são e a função não é diferenciável nesse ponto.
Por sua vez a função estudada no exemplo (1.8) é diferenciável na origem e as respectivas
derivadas parciais são funções contı́nuas na origem.
Estes dois exemplos levam-nos a colocar a questão seguinte: Será que a continuidade
das derivadas parciais de uma função implica que essa função seja diferenciável?
Para vermos que a resposta a esta questão é sim vamos considerar apenas o caso em
que temos uma função escalar f : R2 → R com derivadas parciais contı́nuas numa bola
centrada num ponto (a, b) ∈ R2 .
Tendo em conta a definição de função diferenciável deveremos ter

f (a + h, b + k) − f (a, b) − ∇f (a, b)(h, k) = o((h, k)),

ou seja,
f (a + h, b + k) − f (a, b) − ∂f
∂x
(a, b)h − ∂f
∂y
(a, b)k
lim √ = 0.
(h,k)→(0,0) h2 + k 2
A variação f (a + h, b + k) − f (a, b) pode ser calculada (ver figura (7)) do seguinte modo

f (a + h, b + k) − f (a, b) = [f (a + h, b + k) − f (a + h, b)] + [f (a + h, b) − f (a, b)] .

Note-se que a variação f (a + h, b + k) − f (a + h, b) é calculada ao longo do segmento


de recta vertical em que x = a + h e a variação f (a + h, b) − f (a, b) é calculada ao longo
do segmento de recta horizontal em que y = b. Portanto, em ambos os casos, uma das
variáveis está fixa, ou seja, a função f dependerá apenas de uma das variáveis.
Usando o teorema do valor médio para funções reais de variável real, existirá d ∈]b, b+k[
tal que
∂f
f (a + h, b + k) − f (a + h, b) = (a + h, d)k
∂y

17
e, do mesmo modo, existirá c ∈]a, a + h[ tal que

∂f
f (a + h, b) − f (a, b) = (c, b)h.
∂x
Assim,
∂f ∂f
f (a + h, b + k) − f (a, b) − (a, b)h − (a, b)k =
∂x ∂y
   
∂f ∂f ∂f ∂f
= (c, b) − (a, b) h + (a + h, d) − (a, b) k
∂x ∂x ∂y ∂y

Dado que as derivadas parciais são contı́nuas e que


h k
|√ |≤ 1 ; | √ | ≤ 1,
h2 + k 2 h2 + k 2
teremos
f (a + h, b + k) − f (a, b) − ∂f
∂x
(a, b)h − ∂f
∂y
(a, b)k
lim √ = 0.
(h,k)→(0,0) h2 + k 2

b+k

0 a c a+h x

Figura 7

Definição 2.1 (Funções de classe C 1 ) Diz-se que uma função f : D ⊂ Rn → R, em


∂f
que D é aberto, é de classe C 1 se em cada ponto x ∈ D as derivadas parciais (x) , k =
∂xk
1, 2, . . . , n existirem e forem contı́nuas.

Teorema 2.2 (Condição Suficiente de Diferenciabilidade) Seja D ⊂ Rn um con-


junto aberto e f : D → R, uma função de classe C 1 . Então f é diferenciável.

18
***
A função estudada no exemplo (5)

xy
 √x2 +y2 , se (x, y) 6= (0, 0)

f (x, y) =
0 , se (x, y) = (0, 0)

é contı́nua em R2 , diferenciável em R2 \ {(0, 0)} mas não é diferenciável na origem.


Note-se que
∂f ∂f
(0, 0) = 0 ; (0, 0) = 0
∂x ∂y
É fácil verificar que as derivadas parciais

∂f y3
(x, y) = p
∂x (x2 + y 2) x2 + y 2

∂f x3
(x, y) = p
∂y (x2 + y 2) x2 + y 2

não são contı́nuas na origem.

***
Por outro lado, a função estudada no exemplo (1.8)
 2
x y
 √x2 +y2 , se (x, y) 6= (0, 0)

f (x, y) =
0 , se (x, y) = (0, 0)

tem derivadas parciais contı́nuas e, portanto é diferenciável em R2 .

***

19
3 Derivada Direccional. Gradiente
Seja D ⊂ Rn um conjunto aberto, f : D → R uma função escalar diferenciável em D e
consideremos um vector v ∈ Rn tal que k v k= 1.
Seja a ∈ D e, sendo f diferenciável teremos

f (a + h) − f (a) = ∇f (a)h + o(h).

Fazendo h = tv em que t ∈ R, teremos

f (a + tv) − f (a) = t∇f (a)v + o(tv),

ou seja,
f (a + tv) − f (a) o(tv)
= ∇f (a)v + ,
t t
e, portanto
f (a + tv) − f (a)
lim = ∇f (a)v. (3)
t→0 t
Note-se que o vector v determina a recta ou direcção de pontos da forma a + tv, t ∈ R.
Assim, o limite anterior é calculado tomando apenas pontos sobre a direcção determinada
por v. Trata-se, portanto da taxa de variação de f na direcção de v como se ilustra na
figura (8).

z = f (x, y)
z

x
y

Figura 8: Procedimento para calcular a derivada direccional segundo v

20
Definição 3.1 Ao limite
f (a + tv) − f (a)
Dv f (a) = lim
t→0 t
chamamos derivada direccional de f em a segundo o vector v.

Da equação (3), concluı́mos que

Dv f (a) = ∇f (a)v. (4)

Portanto, para saber do comportamento de f na direcção determinada por v basta


conhecer o respectivo gradiente.
Note-se que
 
v1
 v2 
h i
 .

∂f ∂f ∂f
Dv f (a) = ∇f (a)v = ∂x1 (a) ∂x2 (a) · · · ∂xn (a) 
 .

 
 .
vn
∂f ∂f ∂f
= (a)v1 + (a)v2 + · · · + (a)vn .
∂x1 ∂x2 ∂xn
Portanto, na forma vectorial, a derivada direccional Dv f (a) é o produto interno dos
vectores ∇f (a) e v.
Assim, sendo k v k= 1, temos

Dv f (a) = ∇f (a) · v =k ∇f (a) kk v k cos α =k ∇f (a) k cos α

em que α é o ângulo determinado pelos vectores ∇f (a) e v.


Podemos então concluir que a derivada direccional Dv f (a) será a maior possı́vel no caso
em que cos α = 0, ou seja, quando os vectores ∇f (a) e v são paralelos.
Portanto, o vector gradiente ∇f (a) determina a direcção segundo a qual a
derivada direccional de f em a é a maior possı́vel.

Da equação (3) podemos também concluir que a derivada direccional Dv f (a) será nula
na direcção definida pelo vector v ortogonal ao gradiente ∇f (a).

***

21
Exemplo 3.1 Consideremos a função f (x, y) = x2 + xy e o ponto (1, 1).
Então,  
∂f ∂f
∇f (x, y) = (x, y) , (x, y) = (2x + y , x)
∂x ∂y
e no ponto (1, 1) teremos
∇f (1, 1) = (3, 1).

• Consideremos o vector v = (1, 2). Dado que k (1, 2) k= 5, para calcular a derivada
direccional de f em (1, 1) na direccção determinada por v deveremos usar, de acordo
v
com a definição, o vector . Assim, teremos
kvk
v 1 2 5 √
Dv f (1, 1) = ∇f (1, 1) = (3, 1) · ( √ , √ ) = √ = 5.
kvk 5 5 5

• Podemos também determinar a direcção segundo a qual a derivada de f em (1, 1) é


nula. Essa direcção será determinada por um vector v = (v1 , v2 ) ortogonal a ∇f (1, 1),
ou seja

Dfv (1, 1) = ∇f (1, 1) · (v1 , v2 ) = 0 ⇔ (3, 1) · (v1 , v2 ) = 0 ⇔ v2 = −3v1 .

Fazendo v1 = 1 temos v = (1, −3).

***

4 Linha. Tangente
Exemplo 4.1 Consideremos a recta em R2 dada pela equação x + y = 1. (ver figura 9).
Note-se que
x+y =1 ⇔y = 1−x
e, portanto, esta recta pode ser descrita como sendo o conjunto

{(x, 1 − x) ; x ∈ R}.

Seja g : R → R2 a função contı́nua definida por g(x) = (x, 1 − x).


É claro que a recta é a imagem da fução g.

22
y

1
x+y =1⇔y =1−x

1 x

Figura 9: Recta dada por: x + y = 1

γ(t) = (cos t, sen t) = (x(t), y(t))

0 x

γ ′ (3π/2) = (1, 0)

Figura 10: Uma circunferência em R2

Exemplo 4.2 Consideremos a função γ : R → R2 dada por

γ(t) = (cos t, sen t).

Sendo cos2 t + sen2 t = 1 e fazendo (cos t, sen t) = (x(t), y(t)), fica claro que a imagem
da função γ é a circunferência de raio um e centro na origem de R2 que se encontra
representada na figura (10).

Exemplo 4.3 Consideremos a função γ : R → R3 dada por

γ(t) = (cos t, sen t, t).

Sendo cos2 t + sen2 t = 1 e fazendo (cos t, sen t, t) = (x(t), y(t), z(t)), fica claro que a
imagem da função γ é uma linha assente sobre a superfı́cie cilı́ndrica vertical de raio um e
que se encontra representada na figura (11).

Dos exemplos anteriores fica claro que funções contı́nuas de uma variável real γ : R →
R descrevem linhas em Rn .
n

23
z

γ(t) = (cos t, sen t, t) = (x(t), y(t), z(t))

γ ′ (π/2) = (−1, 0, 1)

x y

Figura 11: Uma hélice cilı́ndrica em R3

Por definição, diz-se que um conjunto Γ ⊂ Rn é uma linha se for a imagem de


uma função contı́nua γ : R → Rn .
No caso em que γ é uma função de classe C 1 a respectiva derivada será dada por
γ(t + h) − γ(t)
γ ′ (t) = lim .
h→0 h
γ(t + h) − γ(t)
Note-se (ver figura (12)) que, pictoricamente, os vectores secantes trans-
h
formam-se, à medida que h → 0, num vector γ (t) que é tangente à linha no ponto γ(t).

Esta ideia leva-nos à definição de vector tangente a uma linha num dado ponto.

Definição 4.1 (Vector Tangente) Seja γ : R → Rn uma função de classe C 1 e consi-


deremos a linha descrita por γ. Ao vector
γ(t + h) − γ(t)
γ ′ (t) = lim
h→0 h
chamamos vector tangente à linha no ponto γ(t).

No exemplo (4.2) temos


γ(t) = (cos t, sen t)
e, portanto,
γ ′ (t) = (− sen t, cos t).
Na figura (10) estão representados os vectores tangentes γ ′ (π) = (0, −1) no ponto
γ(π) = (−1, 0) e γ ′ (3π/2) = (1, 0) no ponto γ(3/2π) = (0, −1).

24
γ ′ (t)
γ(t)

γ(t + h)

Figura 12: Tangente a uma linha

No exemplo (4.3) temos


γ(t) = (cos t, sen t, t)
e, portanto,
γ ′ (t) = (− sen t, cos t, 1).
Na figura (11) está representado o vector tangente no ponto γ(π/2) = (0, 1, π/2) dado
pela derivada γ ′ (π/2) = (−1, 0, 1).
Seja L uma linha descrita por uma função γ e a um ponto de L tal que a = γ(t0 ). Seja
T~ = γ ′ (t0 ) o vector tangente a L em a.
A recta que passa em a e com a direcção de T~ , designada por recta tangente a L no
ponto a, é o conjunto de pontos definido por
{x ∈ Rn : x − a = λ T~ ; λ ∈ R}.
No caso da hélice cilı́ndrica do exemplo (4.3) a recta tangente no ponto (0, 1, π/2) é
dada por
(x, y, z) − (0, 1, π/2) = λ (−1, 0, 1) , λ ∈ R,
ou seja,
π
x = −λ ; y − 1 = 0 ; z − =λ
2
e, portanto, é a recta definida pelas duas equações seguintes
π
y =1; x+z = .
2

***

25
5 Conjunto de Nı́vel. Normal
Dada uma função escalar F : Rn → R de classe C 1 , ao conjunto definido por

Nα = {x ∈ Rn : F (x) = α},

chamamos conjunto de nı́vel α de f.


Note-se que todos os conjuntos definidos por equações do tipo F (x) = α, são conjuntos
de nı́vel zero de F (x) − α.
Os seguintes são exemplos de conjuntos de nı́vel.

• {(x, y) ∈ R2 : x + y = 1} (Linha recta).

• {(x, y) ∈ R2 : x2 + y 2 = 1} (Circunferência).

• {(x, y) ∈ R2 : x2 − y 2 = 1} (Hipérbole).

• {(x, y) ∈ R2 : y = x2 } (Parábola).

• {(x, y, z) ∈ R3 : x + y + z = 1} (Plano).

• {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = 1} (Esfera).

• {(x, y, z) ∈ R3 : x2 + y 2 = 1 + z 2 } (Hiperbolóide).

• {(x, y, z) ∈ R3 : z = 1 − x2 − y 2 } (Parabolóide).
p
• {(x, y, z) ∈ R3 : ( x2 + y 2 − 3)2 + z 2 = 1} (Toro).

Seja a ∈ N0 um ponto qualquer.


Seja L ⊂ N0 uma linha (assente em N0 ) descrita por uma função γ :] − ǫ, ǫ[→ Rn , com
ǫ ∈ R, e tal que
a = γ(0).
Dado que L ⊂ N0 , é claro que γ(t) ∈ N0 e, portanto,

F (γ(t)) = 0 ; −ǫ < t < ǫ

e, pelo teorema da derivada da função composta, teremos

∇F (γ(0))γ ′(0) = 0,

ou seja,
∇F (a)γ ′ (0) = 0.
Assim, os vectores γ ′ (0) e ∇F (a) são ortogonais entre si.
Note-se que o vector γ ′ (0) é, por definição, tangente a L no ponto a. Nesta situação,
diz-se que o vector T~ = γ ′ (0) é tangente a N0 no ponto a.

26
~ um vector ortogonal a T~ , ou seja, um vector que verifica a equação N
Seja N ~ · T~ = 0.
Ao vector N~ chamamos vector normal a N0 no ponto a.
Assim, o vector gradiente, ∇F (a), é um vector normal ao conjunto de nı́vel N0 de F.
Portanto, o gradiente de uma função escalar num ponto é normal ao respec-
tivo conjunto de nı́vel dessa função.

Exemplo 5.1 Consideremos o parabolóide P, definido por

P = {(x, y, z) ∈ R3 : z = 1 − x2 + y 2 },

e que se encontra representado na figura (13).

z
~ = ∇F (a, b, c)
N

F (x, y, z) = 0
Plano tangente

x y

Figura 13: Normal e plano tangente

Seja F : R3 → R a função escalar definida por

F (x, y, z) = z + x2 + y 2 − 1.

Então o parabolóide P é o conjunto de nı́vel zero de F, e em cada ponto (a, b, c) ∈ P


a respectiva normal será dada pelo gradiente de F nesse ponto ∇F (a, b, c) tal como se
representa na figura (13).
O vector normal N ~ = ∇F (a, b, c) determina a recta normal a P que passa pelo ponto
(a, b, c) e será o conjunto

{(x, y, z) ∈ R3 : (x, y, z) = (a, b, c) + λ∇F (a, b, c) ; λ ∈ R}.

~ são tangentes a P no ponto


Por definição de vector normal, os vectores ortogonais a N
(a, b, c) e constituem um espaço linear de dimensão 2.
O plano gerado pelos vectores tangentes e que passa pelo ponto (a, b, c) chama-se plano
tangente a P no ponto (a, b, c) e é dado pela equação

(x − a, y − b, z − c) · ∇f (a, b, c) = 0.

27
~ = ∇F (0, 0, 1) =
Dado que ∇F (x, y, z) = (2x, 2y, 1), no ponto (0, 0, 1) teremos N
(0, 0, 1) e, portanto, a recta normal nesse ponto é dada por
~,
(x, y, z) − (0, 0, 1) = λN

ou seja,
(x, y, z − 1) = λ(0, 0, 1) ⇔ x = 0 ; y = 0 ; z ∈ R
que é o eixo Oz.
O plano tangente será dado por
~ = 0 ⇔ (x, y, z − 1) · (0, 0, 1) = 0 ⇔ z = 1,
(x, y, z − 1) · N

ou seja, é o plano horizontal definido por z = 1.

***

Note-se que o parabolóide P é o gráfico da função diferenciável f : R2 → R definida


por
f (x, y) = 1 − x2 − y 2 .
Sendo f diferenciável, próximo do ponto (a, b) com f (a, b) = c, teremos

f (x, y) = f (a, b) + ∇f (a, b) · (x − a, y − b) + o(x − a, y − b),

ou seja, fazendo z = f (x, y), teremos


∂f ∂f
z =c+ (a, b)(x − a) + (a, b)(y − b) + o(x − a, y − b).
∂x ∂y
O plano definido pela equação
∂f ∂f
z =c+ (a, b)(x − a) + (a, b)(y − b)
∂x ∂y
é de facto o plano tangente ao gráfico de f no ponto (a, b, c) = (a, b, f (a, b)).
Dado que
∂f ∂f
(a, b) = −2a ; (a, b) = −2b,
∂x ∂y
esse plano será dado pela equação

z = c − 2a(x − a) − 2b(y − b).

No caso do ponto (0, 0, 1), será dado pela equação z = 1, tal como obtido acima.

28
***

Neste exemplo temos F (x, y, z) = z − f (x, y) e, portanto,

F (x, y, z) = 0 ⇔ z = f (x, y),

ou seja, o gráfico de f é o conjunto de nı́vel zero de F.


Temos, assim, duas formas diferentes de descrever o mesmo conjunto.

• Como conjunto de nı́vel de F temos,


∂f ∂f
∇F (a, b, c) = (− (a, b) , (a, b) , 1)
∂x ∂y

e, portanto, o plano tangente no ponto (a, b, c) será dado pela equação

∂f ∂f
(z − c) − (a, b)(x − a) − (a, b)(y − b) = 0.
∂x ∂y

• Como gráfico de f temos, pela definição de derivada, que o plano tangente é dado
pela equação
∂f ∂f
z =c+ (a, b)(x − a) + (a, b)(y − b).
∂x ∂y

***

Referências
[1] Tom M. Apostol. Calculus II. Editorial Reverté, SA, 1977.

[2] J. Campos Ferreira. Introdução à Análise em Rn . AEIST, 1978.

[3] J. E. Marsden and A. J. Tromba. Vector Calculus. W. H. Freeman and Company, 1998.

29
Instituto Superior Técnico
Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

CDI-II

Derivadas de Ordem Superior. Extremos

1 Derivadas de Ordem Superior


Seja f : D ⊂ Rn → R, definida num aberto D, uma função de classe C 1 e consideremos as
respectivas derivadas parciais
∂f
; k = 1, 2, . . . , n.
∂xk
Note-se que estas derivadas são também funções escalares definidas em D. Portanto, se
forem diferenciáveis podemos considerar as respectivas derivadas parciais.
Assim, teremos as funções
 
∂ ∂
; j = 1, 2, . . . , n ; k = 1, 2, . . . , n
∂xj ∂xk

que são as derivadas parciais de ordem dois (ou de segunda ordem) de f. Por convenção,
serão designadas por
∂2f
 
∂ ∂
= ; se j 6= k,
∂xj ∂xk ∂xj ∂xk
e por
∂2f
 
∂ ∂
= ; se j 6= k.
∂xk 2 ∂xk ∂xk
Se as derivadas de ordem dois forem funções diferenciáveis, podemos também considerar
as respectivas derivadas parciais

∂2f
 

; i = 1, 2, . . . , n ; j = 1, 2, . . . , n ; k = 1, 2, . . . , n,
∂xi ∂xi ∂xj ∂xk

ou seja, as derivadas parciais de ordem três de f, que serão designadas por

∂3f
.
∂xi ∂xj ∂xk
Exemplo 1.1 Seja f (x, y) = xy 2 + yx3 . Então, as derivadas parciais de ordem um serão
as funções
∂f
(x, y) = y 2 + 3yx2
∂x
∂f
(x, y) = 2xy + x3 .
∂y
As derivadas parciais de ordem dois serão as funções
∂2f
 
∂ ∂f
(x, y) = (x, y) = 6xy
∂x2 ∂x ∂x
∂2f
 
∂ ∂f
(x, y) = (x, y) = 2x
∂y 2 ∂y ∂y
∂2f
 
∂ ∂f
(x, y) = (x, y) = 2y + 3x2
∂y∂x ∂y ∂x
2
 
∂ f ∂ ∂f
(x, y) = (x, y) = 2y + 3x2
∂x∂y ∂x ∂y
e algumas de ordem três serão
∂3f ∂2f
 

3 (x, y) = (x, y) = 6y
∂x ∂x ∂x2
∂3f ∂2f
 

2 (x, y) = (x, y) = 6x
∂y∂x ∂y ∂x2
∂3f ∂2f
 

3
(x, y) = =0
∂y ∂y ∂y 2
∂3f ∂2f
 

2
(x, y) = =2
∂x∂y ∂x ∂y 2
∂3f ∂2f
 

2
(x, y) = = 6x
∂x ∂y ∂x ∂x∂y

Diz-se que uma função f é de classe C k se as derivadas parciais de ordem menor ou


igual a k existirem e forem funções contı́nuas.
Diz-se que f é de classe C ∞ se for de classe C k para qualquer k ∈ N.
∂2f
Note-se que as derivadas parciais de ordem dois da função do exemplo anterior,
∂x∂y
∂2f
e , são iguais.
∂y∂x
Esta coincidência não acontece por acaso. De facto temos

2
Teorema 1.1 (Schwarz) Seja f : D ⊂ Rn → R uma função de classe C 2 no aberto D.
Então
∂2f ∂2f
= .
∂xj ∂xk ∂xk ∂xj

A demonstração deste teorema pode ser vista na bibliografia da disciplina (c.f. [2, 3, 1]).
É claro que basta considerar o caso em R2 e notar que,
f (a+h,b+k)−f (a,b+k) f (a+h,b)−f (a,b) f (a+h,b+k)−f (a+h,b) f (a,b+k)−f (a,b)
h
− h k
− k
= .
k h

2 Extremos de Funções Escalares


Uma forma bastante conveniente de analisar o comportamento de uma função escalar num
ponto é a de a restringir a uma linha recta que passe por esse ponto. Foi deste modo que
se introduziu a noção de derivada direccional segundo um vector.
Seja f : D ⊂ Rn → R uma função de classe C 1 no aberto D.
Consideremos a recta que passa pelo ponto a e tem a direcção do vector h, ou seja a
linha descrita pela função γ : R → Rn definida por

γ(t) = a + th.

Note-se que γ(0) = a e γ(1) = a + h.


Seja x = γ(t) um ponto desta recta e tal que o segmento de recta entre a e x esteja
contido em D..
Então, teremos f (x) = f (γ(t)) e a função f passa a ser analisada apenas na recta que
passa pelo ponto a com a direcção do vector h, recorrendo à função composta
γ f
R −→ Rn −→ R

t 7→ γ(t) 7→ f (γ(t))

que é uma função real de variável real que designaremos por g, ou seja

g(t) = f (γ(t)).

É claro que γ é de classe C 1 e γ ′ (t) = h. Portanto,

g ′ (t) = ∇f (γ(t)) • γ ′ (t) = ∇f (γ(t)) • h,

e para t = 0, teremos
g ′ (0) = ∇f (γ(0)) • γ ′ (0),

3
ou seja,
g ′(0) = ∇f (a) • h.
Sendo g de classe C 1 , pelo teorema de Lagrange para funções reais de variável real,
existirá t0 ∈]0, 1[ tal que
g(1) − g(0) = g ′ (t0 ),
ou seja,
f (a + h) − f (a) = ∇f (c) • h
em que c = γ(t0 ) é um ponto no segmento de recta entre a e a + h.

Teorema 2.1 (Lagrange) Seja f : D ⊂ Rn → R uma função de classe C 1 no aberto D


e sejam a e a + h dois pontos em D tais que o segmento de recta entre eles esteja contido
em D. Então existe um ponto c nesse segmento de recta tal que

f (a + h) − f (a) = ∇f (c) • h,

com c distinto de a e de a + h.

Seja a ∈ D e consideremos uma bola Bǫ (a) ⊂ D tal que ∇f (x) = 0 para qualquer
ponto x ∈ Bǫ (a).
Pelo teorema de Lagrange, teremos f (a + h) = f (a) para qualquer vector h tal que
a + h ∈ Bǫ (a), ou seja, a função f será constante na bola Bǫ (a).
Portanto, uma função de classe C 1 e com gradiente nulo numa bola será
constante nessa bola.

Definição 2.1 (Ponto Crı́tico) Diz-se que a ∈ D é um ponto crı́tico da função f se


∇f (a) = 0.

Seja f : D ∈ Rn → R uma função de classe C 2 e seja a ∈ D um ponto crı́tico de f.


Consideremos a recta que passa em a e com a direcção de um vector h ∈ Rn , ou seja,
o conjunto de pontos da forma a + th com t ∈ R.
Tal como acima, seja γ(t) = a + th e consideremos a função composta
γ f
R −→ Rn −→ R

t 7→ γ(t) 7→ f (γ(t)).

Sendo a um ponto crı́tico, é claro que g ′(o) = ∇f (a) = 0.


Pela fórmula de Taylor para funções reais de variável real teremos
1 ′′ 1
g(t) − g(0) = g ′ (o) + g (0)t2 + o(t2 ) = g ′′ (0)t2 + o(t2 ),
2! 2!

4
ou seja,
g(t) − g(0) 1 ′′ o(t2 )
= g (0) + . (1)
t2 2! t2
o(t2 )
Sabendo que lim = 0, para t suficientemente próximo de zero, a diferença g(t) −
t→0 t2
g(0) tem o mesmo sinal da derivada g ′′ (0).
Note-se que
n

X ∂f
g (t) = ∇f (γ(t)) • h = (γ(t))hk
k=1
∂xk

e, portanto,
n X
n
X ∂2f
g ′′(t) = (γ(t))hj hk ,
k=1 j=1
∂xj ∂xk
ou seja,
n X
n
′′
X ∂2f
g (0) = (a)hj hk .
k=1 j=1
∂xj ∂xk

À matriz com n linhas e n colunas cujas entradas são as derivadas parciais de ordem
dois, designada pelo sı́mbolo D 2 f (a), ou seja,
 2
∂2f ∂2f

∂ f
 ∂x2 (a) (a) ··· (a)
 1 ∂x2 ∂x1 ∂xn ∂x1  
 ∂2f ∂2f ∂2f 
(a) (a) ··· (a)
 
 ∂x1 ∂x2 ∂x22 ∂xn ∂x2 

D 2 f (a) = 
 


 . . ··· . 


 . . ··· . 


 2 . . ··· . 
∂2f 2

 ∂ f ∂ f 
(a) (a) ··· (a)
∂x1 ∂xn ∂x2 ∂xn ∂x2n

chama-se matriz Hessiana de f no ponto a.


Assim, a derivada g ′′(0) poderá ser apresentada na forma matricial

g ′′ (0) = hT D 2 f (a)h

ou na forma vectorial
g ′′ (0) = h • D 2 f (a)h.
Portanto, da fórmula de Taylor (1), obtemos

f (a + th) − f (a) 1 2 o(t2 )


= h • D f (a)h + .
t2 2! t2

5
Seja λ ∈ R um valor próprio da matriz Hessiana D 2 f (a) e h 6= 0 um vector próprio
associado a λ, ou seja,
D 2 f (a)h = λh.
Então, teremos
g ′′ (0) = h • D 2 f (a)h = λh • h = λ k h k2
e, portanto, o sinal de g ′′(0) será o sinal do valor próprio λ.
Portanto, se a for um ponto crı́tico de f, na direcção do vector próprio h associado ao
valor próprio λ da matriz Hessiana D 2 f (a), teremos
f (a + th) − f (a) 1 2 o(t2 )
= λ k h k +
t2 2! t2
Note-se que, pelo teorema de Schwarz, a matriz Hessiana é simétrica e, por isso, é dia-
gonalizável, os respectivos valores próprios são números reais e os correspondentes vectores
próprios constituem uma base ortonormada de Rn .
Assim, para classificar os pontos crı́ticos devemos analisar o comportamento da função
nas linhas rectas determinadas pelos vectores próprios através dos sinais dos correspon-
dentes valores próprios da matriz Hessiana D 2 f (a).
A uma linha recta determinada por um vector próprio chamaremos direcção própria ou
direcção singular.
Podem ocorrer as situações seguintes.
a) Os valores próprios de D 2 f (a) são todos positivos: a é um ponto de mı́nimo de f.
b) Os valores próprios de D 2 f (a) são todos negativos: a é um ponto de máximo de f.

c) A matriz Hessiana D 2 f (a) tem pelo menos um valor próprio positivo e pelo menos um
negativo: a não é um extremo de f. (Por vezes chamado ponto de sela)
d) A matriz Hessiana D 2 f (a) tem pelo menos um valor próprio nulo e os restantes têm o
mesmo sinal. Neste caso, a função f deve ser analisada nas direcções próprias associadas
aos valores próprios nulos recorrendo às derivadas de ordem superior a dois.

No último caso, esta análise pode não ser conclusiva. Então só um estudo directo do
comportamento da função nas vizinhanças de a poderá esclarecer o problema.

3 Exemplos
Nos exemplos seguintes iremos determinar e classificar os pontos crı́ticos de cada uma das
funções.

Exemplo 3.1 Consideremos a função f (x, y) = x2 + y 2. É claro que f é, pelo menos, de
classe C 2 .

6
a) Pontos Crı́ticos: ∇f (x, y) = (0, 0).

∇f (x, y) = (2x, 2y) = (0, 0) ⇔ (x, y) = (0, 0).

A origem é o único ponto crı́tico.

b) Classificação do ponto crı́tico (0, 0).


A matriz Hessiana
∂2f ∂2f
 
2
(0, 0) (0, 0) "
2 0
#
∂x ∂y∂x
D 2 f (0, 0) = 

 ∂2f
 =
∂2f 
0 2
(0, 0) (0, 0)
∂x∂y ∂y 2 (0,0)

apresenta dois valores próprios positivos λ1 = λ2 = 2 e, portanto, o ponto crı́tico (0, 0)


é um ponto de mı́nimo de f.
Note-se que esta análise é desnecessária dado que f (x, y) = x2 + y 2 ≥ 0 e a origem é o
único ponto em que f é nula. Na figura 1 encontra-se o gráfico desta função.

x y

Figura 1: Exemplo de ponto de mı́nimo: f (x, y) = x2 + y 2

Exemplo 3.2 Consideremos a função f (x, y) = x2 − y 2. É claro que f é, pelo menos, de
classe C 2 .

a) Pontos Crı́ticos: ∇f (x, y) = (0, 0).

∇f (x, y) = (2x, −2y) = (0, 0) ⇔ (x, y) = (0, 0).

A origem é o único ponto crı́tico.

7
b) Classificação do ponto crı́tico (0, 0).
A matriz Hessiana
∂2f ∂2f
 
2
(0, 0) (0, 0) "
2 0
#
∂x ∂y∂x
D 2 f (0, 0) = 

 ∂2f
 =
∂2f 
0 −2
(0, 0) (0, 0)
∂x∂y ∂y 2 (0,0)

apresenta um valor próprio positivo λ1 = 2 e um valor próprio negativo λ2 = −2 e,


portanto, o ponto crı́tico (0, 0) não é um extremo de f.
Neste caso dizemos que é um ponto de sela. Na figura 2 encontra-se o gráfico de f que
ilustra e justifica a designação de ponto de sela.

y
x

Figura 2: Exemplo de ponto de sela: f (x, y) = x2 − y 2

Note-se que na direcção em que y = 0 a função apresenta um mı́nimo e na direcção


x = 0 a função apresenta um máximo na origem. Trata-se de um ponto de sela.

Exemplo 3.3 Consideremos a função f (x, y) = (x − y)2 − x4 − y 4 .

a) Pontos Crı́ticos: ∇f (x, y) = (0, 0).



x − y − 2x3 = 0
∇f (x, y) = (2(x − y) − 4x3 , −2(x − y) − 4y 3) = (0, 0) ⇔
 − (x − y) − 2y 3 = 0

ou seja,  
x − y − 2x3 = 0 x − y − 2x3 = 0

x3 + y 3 = 0 y = −x

donde se conclui que os pontos crı́ticos são: (0, 0) , (−1, 1) , (1, −1).

8
Para os classificar recorremos à matriz Hessiana
 2
∂ f ∂2f

2
(x, y) (x, y) "2 − 12x2 −2
#
∂x ∂y∂x
D 2 f (x, y) = 

=
 ∂2f ∂2f −2 2 − 12y 2

(x, y) 2
(x, y)
∂x∂y ∂y

b) Classificação dos pontos crı́ticos (−1, 1) e (1, −1).


As matrizes Hessianas nestes dois pontos são iguais,
−10 −2
" #
D 2 f (−1, 1) = D 2 f (1, −1) =
− 2 −10
e apresentam dois valores próprios negativos, λ1 = −8 e λ2 = −12. Portanto, estes dois
pontos são pontos de máximo de f.
c) Classificação do ponto crı́tico (0, 0).
A matriz Hessiana
2 −2
" #
D 2 f (0, 0) =
−2 2
tem um valor próprio nulo λ1 = 0 e outro positivo λ2 = 4.
Portanto, na direcção definida pelo vector próprio associado a λ2 = 4, a função f tem
um mı́nimo na origem. Isto quer dizer que se a origem for um extremo de f deverá ser
um ponto de mı́nimo.
Na direcção singular correspondente ao valor próprio nulo λ1 = 0 deveremos passar
à análise das derivadas de ordem superior a dois. No entanto, podemos analisar o
comportamento de f directamente em torno da origem.
Note-se que na direcção definida por y = x temos f (x, x) = −2x4 ≤ 0 e, portanto, a
função f tem um ponto de máximo na origem.
Concluı́mos assim que a origem não é um extremo de f.
Na figura 3 encontra-se o gráfico de f onde se pode constatar a natureza dos pontos
crı́ticos.

Exemplo 3.4 Consideremos a função f (x, y) = y 2 − 4x2 y + 3x4 .


a) Pontos crı́ticos: ∇f (x, y) = (0, 0).

x(−2y + 3x2 ) = 0
∇f (x, y) = (−8xy + 12x3 , 2y − 4x2 ) = (0, 0) ⇔
y − 2x2 = 0

donde se conclui que o único ponto crı́tico é a origem.

9
z

x y

Figura 3: Gráfico da função: f (x, y) = (x − y)2 − x4 − y 4

x y

Figura 4: Gráfico da função: f (x, y) = (y − x2 )(y − 3x2 )

b) Classificação do ponto crı́tico (0, 0).


A matriz Hessiana
∂2f ∂2f
 
2
(0, 0) (0, 0) "−8y + 36x2 −8x# "
0 0
#
∂x ∂y∂x
D 2 f (0, 0) = 

= =
 ∂2f ∂2f − 8x 2 0 2

(0, 0) (0, 0) (0,0)
∂x∂y ∂y 2
tem um valor próprio nulo λ1 = 0 e outro positivo λ2 = 2. Portanto, se a origem for
extremo será um mı́nimo.
Note-se que a função f pode ser dada de outra forma

f (x, y) = y 2 − 4x2 y + 3x4 = (y − x2 )(y − 3x2 ).

Em torno da origem teremos:

i) f (x, y) > 0 para y > 3x2 ou para y < x2 .


ii) f (x, y) < 0 para x2 < y < 3x2 .

10
Assim, em torno da origem, a função f toma valores tanto positivos como negativos,
ou seja, a origem não é um extremo de f.
Na figura 4 encontra-se o gráfico de f onde se pode constatar a natureza da origem
como ponto crı́tico.

***

Referências
[1] Tom M. Apostol. Calculus II. Editorial Reverté, SA, 1977.

[2] J. Campos Ferreira. Introdução à Análise em Rn . AEIST, 1978.

[3] J. E. Marsden and A. J. Tromba. Vector Calculus. W. H. Freeman and Company, 1998.

11
Instituto Superior Técnico
Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

CDI-II

Função Implı́cita. Função Inversa

1 Exemplos em R2
Exemplo 1 Consideremos a equação da recta em R2 dada pela equação x + y = 1. (ver
figura 1).

1
x+y =1⇔y =1−x

1 x

Figura 1: Recta dada por: x + y = 1

Note-se que
x+y =1 ⇔y = 1−x
e, portanto, a mesma recta pode ser descrita de duas formas diferentes:

i) Como o conjunto de nı́vel zero da função F : R2 → R definida por F (x, y) = x + y − 1,


ou seja, o subconjunto de R2 em que F (x, y) = 0.

ii) Como o gráfico da função f : R → R dada por f (x) = 1 − x, ou seja, como o


subconjunto de R2 em que y = f (x).

De outra forma, podemos dizer que a equação F (x, y) = 0 define uma das variáveis
como função da outra y = f (x).

Exemplo 2 Consideremos a equação que define a circunferência de raio um e centro na


origem de R2 , ou seja x2 + y 2 = 1. (ver figura 2).
y


x2 + y 2 = 1 ⇔ y = 1 − x2


y = − 1 − x2

Figura 2: Circunferência dada por: x2 + y 2 = 1

É claro que temos



x2 + y 2 = 1 ⇔ y = 1 − x2 , se y > 0,

e, portanto, a parte da circunferência em que y > 0 pode ser descrita de duas formas
diferentes:

i) Como o conjunto de nı́vel zero da função F : R2 → R definida por F (x, y) = x2 +y 2 −1,


ou seja, o subconjunto de R2 em que F (x, y) = 0.

ii) Como o gráfico da função f : ] − 1, 1[ → R, dada por f (x) = 1 − x2 , ou seja, o
subconjunto de R2 em que y = f (x).

Assim, para y > 0, a equação F (x, y) = 0 define uma das variáveis como função da
outra y = f (x).
Note-se que em torno dos pontos (−1, 0), (1, 0) a equação F (x, y) = 0 não define y
como função de x, mas define x como função de y. De facto, para x > 0, temos
p
x2 + y 2 = 1 ⇔ x = 1 − y 2 .

Este exemplo mostra que a equivalência

F (x, y) = 0 ⇔ y = f (x)

não se verifica globalmente em todo o conjunto definido pela equação F (x, y) = 0 mas
apenas localmente em torno de cada um dos pontos desse conjunto.

Exemplo 3 Consideremos o subconjunto de R2 definido pela equação

xy + sin(x + y) + cos(x + y) = 5.

2
y

Figura 3: Conjunto definido por: xy + sin(x + y) + cos(x + y) = 5

Neste caso, não parece fácil concluir que a equação dada defina uma das variáveis como
função da outra, ou seja, descrever localmente este conjunto como o gráfico de alguma
função.
Na figura 3, encontra-se a representação gráfica deste conjunto que permite concluir
que se trata de um conjunto que pode ser descrito, localmente, como gráfico de alguma
função de uma variável.

Do exemplo 3 surge a questão de saber se uma equação do tipo F (x, y) = 0 define


uma das variáveis como função da outra e se é possı́vel obter alguma informação sobre a
natureza dessa função. Note-se que pode não ser possı́vel estabelecer uma das variáveis
como função da outra directamente a partir da equação F (x, y) = 0.

***
Nota 1 Dada uma função f : R → R é claro que o respectivo gráfico pode ser visto como
o conjunto de nı́vel zero de uma função F : R2 → R, ou seja, como o conjunto definido
pela equação F (x, y) = 0.
De facto, fazendo F (x, y) = y − f (x), temos

{(x, f (x)) : x ∈ R} = {(x, y) : y = f (x) ; x ∈ R} = {(x, y) ∈ R2 : F (x, y) = 0}


A questão que se coloca é a de saber se um conjunto definido por uma equação do tipo
F (x, y) = 0 pode ser descrito como o gráfico de alguma função f : R → R. Os exemplos
anteriores mostram que, em geral, isso só poderá acontecer em termos locais, mesmo nos
casos em que é possı́vel efectuar explicitamente os cálculos.

***
Seja F : R2 → R uma função de classe C 1 e (a, b) um ponto tal que F (a, b) = 0.
Suponhamos que, em alguma bola centrada no ponto (a, b) se tem

F (x, y) = 0 ⇔ y = f (x),

3
sendo f uma função real de variável real de classe C 1 e definida em algum intervalo contendo
o ponto a.
Assim, teremos F (x, f (x)) = 0 e derivando obtemos
∂F ∂F
(a, b) + (a, b)f ′ (a) = 0
∂x ∂y
Portanto,
∂F
(a, b)

f (a) = − ∂x
∂F
(a, b)
∂y
desde que se verifique a condição
∂F
(a, b) 6= 0.
∂y
Concluı́mos então que, em certas condições, é possı́vel calcular a derivada f ′ (a) mesmo
não sendo possı́vel determinar f a partir da equação F (x, y) = 0.
Surge, assim, a questão seguinte. Se F : R2 → R for uma função de classe C 1 e (a, b)
um ponto tal que
∂F
F (a, b) = 0 ; (a, b) 6= 0,
∂y
existirá alguma função f, de classe C 1 , tal que, localmente em torno de (a, b), se tenha

F (x, y) = 0 ⇔ y = f (x)?

A resposta afirmativa a esta questão é dada pelo Teorema da Função Implı́cita.

Teorema 1 (Função Implı́cita em R2 ) Seja F : R2 → R uma função de classe C 1 e


(a, b) um ponto tal que
∂F
F (a, b) = 0 ; (a, b) 6= 0.
∂y
Então, existe uma função f, de classe C 1 , tal que, localmente em torno de (a, b), se tem

F (x, y) = 0 ⇔ y = f (x).

A equivalência local deve ser entendida no seguinte sentido. Existe uma bola centrada
no ponto (a, b) em que o conjunto definido pela equação F (x, y) = 0 é o gráfico de uma
função f : ]a − ǫ, a + ǫ[ → R, com ǫ > 0, ou seja y = f (x). (ver figura 4).

Seja G : R2 → R2 a função de classe C 1 dada por

G(x, y) = (x, F (x, y)).

4
y
F (x, y) = 0 ⇔ y = f (x)

a−ǫ a a+ǫ x

Figura 4: Função Implı́cita em R2

Note-se que G(a, b) = (a, 0) e

1 0
 

det DG(a, b) = det  ∂F ∂F  = ∂F (a, b) 6= 0.


(a, b) (a, b) ∂y
∂x ∂y

Se a função G for invertı́vel, localmente en torno do ponto (a, b), teremos

G(x, y) = (x, F (x, y)) = (x, 0) ⇔ (x, y) = G−1 (x, 0),

ou seja, existe uma função f, localmente definida em torno do ponto a, tal que se verifica
a equivalência
F (x, y) = 0 ⇔ y = f (x).
Se a função inversa G−1 for de classe C 1 , então a função f também o será.
Portanto, o Teorema da Função Implı́cita depende do estabelecimento da existência
local e da regularidade da função inversa G−1 . Este é o conteúdo do chamado Teorema da
Função Inversa.

Teorema 2 (Função Inversa) Seja G : Rn → Rn uma função de classe C 1 e a ∈ Rn um


ponto tal que
det DG(a) 6= 0.
Então, G é localmente invertı́vel em torno do ponto a e a respectiva inversa G−1 é uma
função de classe C 1 .

5
A existência e a regularidade locais da função inversa devem ser entendidas da forma
seguinte. Existe uma bola B(a) centrada no ponto a e uma bola B(b) centrada no ponto
b = G(a) tais que a função G : B(a) → B(b) é uma bijecção (injectiva e sobrejectiva) e a
respectiva inversa G−1 : B(b) → B(a) é uma função de classe C 1 . (ver figura 5).
Note-se que, em geral, não é possı́vel resolver directamente as equações do tipo G(x) = b,
ou seja, calcular a função inversa G−1 . O Teorema da Função Inversa estabelece uma
condição suficiente, det DG(a) 6= 0, para que uma função de classe C 1 seja localmente
invertı́vel.

Rn Rn
G

x y
a
b = G(a)
G−1

Figura 5: Função Inversa

Note-se que por definição de função inversa, temos

x = G−1 (G(x)), ∀x ∈ B(a)

e, portanto
DG−1 (b) = [DG(a)]−1 ,
ou seja, a matriz Jacobiana da função inversa G−1 no ponto b = G(a) é a inversa da matriz
Jacobiana de G no ponto a.

Exemplo 4 Consideremos a função G : R2 → R2 definida por

G(x, y) = (ex cos y, ex sen y).

É claro que G é de classe C 1 e a respectiva derivada é dada pela matriz


" x
e cos y −ex sin y
#
DG(x, y) =
ex sen y ex cos y
e, portanto,
det DG(x, y) = e2x 6= 0, ∀(x, y) ∈ R2 .
Assim, a função G tem inversa local em torno de cada um dos pontos de R2 .

6
No entanto, a função G não é invertı́vel (não é injectiva) em R2 . De facto, temos

G(x, 2kπ) = (ex , 0), ∀x ∈ R, ∀k ∈ Z,

ou seja, embora G não seja invertı́vel em R2 possui inversa local em torno de qualquer
ponto de R2 .

Exemplo 5 Seja f : Rn → Rn uma aplicação linear, ou seja, existe uma matriz An×n
tal que f (x) = Ax. Esta função é injectiva desde que det A 6= 0 e a respectiva inversa é
dada por f −1 (y) = A−1 y em que A−1 é a matriz inversa de A.
Note-se que uma aplicação linear é uma função de classe C 1 e a respectiva derivada é
representada pela matriz A , ou seja,

Df (x) = A

Note-se que neste caso se verifica a condição do Teorema da Função Inversa mas não é
necessário usá-lo. Para além disso, a função inversa é global (está definida em Rn ) e não
apenas local.

Exemplo 6 Consideremos o sistema de equações


4 4

u = x + y

x

v = sen x + cos y

Facilmente se conclui que a resolução deste sistema para x e y não é fácil. No entanto,
recorrendo ao Teorema da Função Inversa podemos determinar os pontos (x, y) para cada
um dos quais o sistema é localmente invertı́vel.
Seja  4
x + y4

G(x, y) = , sen x + cos y
x
a função definida para x 6= 0. Trata-se de uma função de classe C 1 no seu domı́nio e a
sua derivada é dada por
∂u ∂u
  
3x4 − y 4 4y 3

 ∂x ∂y  
DG(x, y) =  x2 x
 ∂v ∂v  = 
 

∂x ∂y cos x − sen y

Portanto, para cada ponto (x, y) , com x 6= 0 , tal que


sen y 4 4 4y 3
det DG(x, y) = (y − 3x ) − cos x 6= 0
x2 x
7
existirá uma vizinhança em que o sistema exprime x e y como funções de u e v, ou seja
x = x(u, v) e y = y(u, v).
Consideremos o ponto (π, π) . Então G(π, π) = (π 3 , −1) e
3π 2 4π 2
" #
det DG(π, π) = det = 4π 2
−1 0
e, portanto, a derivada da inversa de G no ponto (π 3 , −1) é dada por
 
−1 3 −1 1 0 −4π 2
DG (π , −1) = [DG(π, π)] = 2 ,
4π 1 3π 2
ou seja,
∂x 3 ∂x 3
 
(π , −1) (π , −1) 0 −4π 2
" #
 ∂u ∂v 1
= 2

∂y 3 ∂y 3 4π 1 3π 2

(π , −1) (π , −1)
∂u ∂v
***
Nota 2 1. Nos casos em que det DG(a) = 0 o teorema não se aplica e tudo pode
acontecer.
Considere-se a função G(x) = x2 definida em R. Então G′ (0) = 0 e G não é
invertı́vel em nenhuma vizinhança da origem, porque se trata de uma função par.
A função G(x) = x3 é crescente e, portanto, injectiva em R apesar de G′ (0) = 0.
2. A demonstração do Teorema da Função Inversa pode ser vista na bibliografia da
disciplina (c.f. [3, 1, 4, 2]).
Note-se que, sendo G : Rn → Rn uma função de classe C 1 , em torno de um ponto
a ∈ Rn será aproximada por uma função linear, ou seja, teremos
G(x) − G(a) ≈ DG(a)(x − a).
Assim, sendo det DG(a) 6= 0, a aplicação linear será invertı́vel e, portanto, a função
G também o será.
***

2 Exemplos em R3
Exemplo 7 Consideremos o plano em R3 definido pela equação x + y + z = 1, (ver figura
6).
É claro que temos
x+y+z = 1⇔z =1−x−y
e, portanto, o mesmo plano pode ser descrito de duas formas diferentes:

8
z

Figura 6: Plano em R3 dado por x + y + z = 1

i) Como o conjunto de nı́vel zero da função F : R3 → R definida por F (x, y, z) =


x + y + z − 1, ou seja, o subconjunto de R3 em que F (x, y, z) = 0.
ii) Como o gráfico da função f : R2 → R dada por f (x, y) = 1 − x − y, ou seja, como o
subconjunto de R3 em que z = f (x, y).
De outra forma, podemos dizer que a equação F (x, y, z) = 0 define uma das variáveis
como função das outras duas z = f (x, y).
É claro que a mesma equação define qualquer uma das variáveis como função das duas
restantes.

Exemplo 8 Consideremos a esfera dada pela equação x2 + y 2 + z 2 = 1. (Ver figura 7).

z
p
z= 1 − x2 − y 2

x y
p
z = − 1 − x2 − y 2

Figura 7: Esfera em R3 dada por x2 + y 2 + z 2 = 1

É claro que para z > 0 temos


p
x2 + y 2 + z 2 = 1 ⇔ z = 1 − x2 − y 2

9
e para z < 0 temos
p
x2 + y 2 + z 2 = 1 ⇔ z = − 1 − x2 − y 2 ,

ou seja, a equação define a variável z como função de x e de y.


Note-se que em torno dos pontos em que z = 0, a equação não define z como função
de x e de y, mas pode definir y como função de x e de z ou x como função de y e de z.
Portanto, contrariamente ao que se passa com o plano do exemplo anterior, a equação
x2 + y 2 + z 2 = 1 define uma das variáveis como função das restantes apenas localmente
em torno de cada um dos pontos da esfera.

Exemplo 9 Consideremos a linha recta definida pelo sistema de equações


(
x+y+z = 1
(1)
y = x,

ou seja, a intersecção do plano em que x + y + z = 1 com o plano dado por y = x. (Ver


figura 8).

x+y+z = 1

y=x

Figura 8: Recta em R3 dada por x + y + z = 1 ; y = x

É claro que temos ( (


x+y+z =1 z = 1 − 2x

y=x y = x,
ou seja, o sistema de duas equações 1 define as variáveis y e z como funções de x.

10
Exemplo 10 Consideremos a circunferência em R3 que resulta da intersecção de uma
esfera com um plano (ver figura 9), ou seja, definida pelo sistema de duas equações
(
x2 + y 2 + z 2 = 1
y = x.

x2 + y 2 + z 2 = 1

x
y=x

Figura 9: Circunferência em R3 dada por x2 + y 2 + z 2 = 1 ; y = x

Para z > 0, temos


( ( √
x2 + y 2 + z 2 = 1 z = 1 − 2x2

y=x y = x,

ou seja, o sistema de equações define, localmente em torno dos pontos em que z > 0, as
variáveis y e z como funções de x.

Estes exemplos ilustram dois tipos de subconjuntos de R3 :

a) Definidos por uma equação F (x, y, z) = 0 em que F : R3 → R é de classe C 1 .


Em que condições esta equação define, localmente, uma das variáveis com função das
restantes, por exemplo z = f (x, y)?
Quando não for possı́vel por cálculo directo explicitar a função f, que informação sobre
f pode ser obtida a partir da equação?
Se, em torno de um ponto (a, b, c) tal que F (a, b, c) = 0, tivermos a equivalência

F (x, y, z) = 0 ⇔ z = f (x, y),

11
então,
F (x, y, f (x, y)) = 0
e, derivando em ordem a x e a y, obteremos

∂F ∂F ∂f
(a, b, c) + (a, b, c) (a, b) = 0


∂x ∂z ∂x

∂F ∂F ∂f
(a, b, c) + (a, b, c) (a, b) = 0


∂y ∂z ∂y

e, portanto,
∂F ∂F
(a, b, c) (a, b, c)
∂f ∂x ∂f ∂y
(a, b) = − ; (a, b) = − ,
∂x ∂F ∂y ∂F
(a, b, c) (a, b, c)
∂z ∂z
desde que se verifique,
∂F
(a, b, c) 6= 0.
∂z
É de realçar que, em certas condições, mesmo não sendo possı́vel explicitar a função
f, poderemos calcular as respectivas derivadas. Isto é particularmente notável porque
podemos calcular as derivadas de uma função desconhecida.

b) Definidos por um sistema de duas equações



F1 (x, y, z) = 0
F (x, y, z) = 0
2

em que as funções F1 : R3 → R e F2 : R3 → R são de classe C 1 . Em que condições este


sistema de equações define duas das variáveis como funções da terceira variável, como
por exemplo y = f (x) e z = g(x)?
Quando não for possı́vel por cálculo directo explicitar as funções f e g que informação
sobre elas pode ser obtida a partir das equações?
Se, em torno de um ponto (a, b, c) tal que F1 (a, b, c) = 0 e F2 (a, b, c) = 0 tivermos a
equivalência  
F1 (x, y, z) = 0 y = f (x)

F (x, y, z) = 0 z = g(x)
2

então, derivando o sistema



F1 (x, f (x), g(x)) = 0
F (x, f (x), g(x)) = 0
2

12
em ordem a x, teremos
∂F1 ∂F1 ∂F1


 (a, b, c) + (a, b, c)f ′ (a) + (a, b, c)g ′(a) = 0
∂x ∂y ∂z

∂F ∂F2 ∂F2
 2 (a, b, c) + (a, b, c)f ′ (a) + (a, b, c)g ′(a) = 0.


∂x ∂y ∂z

Na forma matricial, será


∂F1 ∂F1
 
∂F1
 
 ∂y (a, b, c) (a, b, c)  f (a)
" ′ #
(a, b, c)
∂z  ∂x
= −
  
 ∂F2 ∂F2

∂F2

g ′
(a)

(a, b, c) (a, b, c) (a, b, c)
∂y ∂z ∂x
e poderemos calcular as derivadas f ′ (a) e g ′ (a), desde que se tenha
∂F1 ∂F1
 
 ∂y (a, b, c) ∂z (a, b, c)
det 
 ∂F2
 6= 0.
∂F2 
(a, b, c) (a, b, c)
∂y ∂z

Neste caso teremos


−1 
∂F1 ∂F1

∂F1

f (a)
" ′ #
 ∂y (a, b, c) (a, b, c) (a, b, c)
∂z   ∂x
= −   
∂F2 ∂F2 ∂F2

g ′ (a)
 
(a, b, c) (a, b, c) (a, b, c)
∂y ∂z ∂x

Tal como em R2 a resposta positiva às questões colocadas nos dois casos acima é dada
pelo chamado Teorema da Função Implı́cita que, em Rn , tem a forma seguinte.

Teorema 3 (Função Implı́cita) Seja F : Rn → Rm , com m < n, uma função de classe


C 1 . Seja (a, b) ∈ Rn tal que a ∈ Rn−m , b ∈ Rm e

F (a, b) = 0 ; det DFy (a, b) 6= 0. (2)

Então, existe uma função f, de classe C 1 , tal que, localmente em torno de (a, b), se
tem
F (x, y) = 0 ⇔ y = f (x).

Nota 3 1. No caso geral, temos um sistema de m equações em Rn que nas condições 2


define implicitamente m variáveis, designadas por y, em função das restantes n − m
variáveis, designadas por x.

13
2. A existência local da função f em torno de cada um dos pontos do conjunto definido
pelo referido sistema de equações deve ser entendida no seguinte sentido. Existe uma
bola centrada no ponto (a, b) em que o conjunto definido pela equação F (x, y) = 0
é o gráfico da função f : Bǫ (a) → Rm , em que ǫ > 0 e Bǫ (a) ⊂ Rn−m designa uma
bola centrada em a ∈ Rn−m e raio ǫ.

3. Usamos o sı́mbolo DFy (a, b) para designar a matriz das derivadas parciais da função
F em ordem às variáveis designadas por y, no ponto (a, b).

4. A demonstração do caso geral, com as devidas adaptações, faz-se seguindo a mesma


ideia de R2 , recorrendo ao Teorema da Função Inversa.
Seja G : Rn → Rn a função de classe C 1 dada por

G(x, y) = (x, F (x, y)).

Note-se que G(a, b) = (a, 0) e

I 0
" #
det DG(a, b) = det = det Dy F (a, b) 6= 0,
Dx F (a, b) Dy F (a, b)

em que I designa a matriz identidade com (n − m) linhas e (n − m) colunas.


Pelo Teorema da Função Inversa, G é localmente invertı́vel em torno do ponto (a, b),
e teremos
G(x, y) = (x, F (x, y)) = (x, 0) ⇔ (x, y) = G−1 (x, 0),
ou seja, existe uma função f, localmente definida em torno do ponto a, tal que se
verifica a equivalência
F (x, y) = 0 ⇔ y = f (x).

Dado que G−1 é também de classe C 1 , a função f também o será.

Exemplo 11 Consideremos a equação

x2 y + sen(x + y) = 0 (3)

Note-se que não é fácil decidir sobre se esta equação define uma das variáveis como
função da outra.
Seja F : R2 → R a função de classe C 1 dada por

F (x, y) = x2 y + sen(x + y)

e consideremos o ponto (0, 0). Então F (0, 0) = 0 e


   
DF (0, 0) = 2xy + cos(x + y) x2 + cos(x + y) x=0,y=0 = 1 1

14
Portanto, dado que ∂F ∂y
(0, 0) = 1 , existe uma bola B centrada em (0, 0) e uma função
1
de classe C f : ] − ǫ, ǫ[ → R para algum ǫ > 0, tal que f (0) = 0 e

F (x, y) = 0 ⇐⇒ y = f (x) ; em B

Para além disso, temos


∂F
(0, 0) 1
f ′ (0) = − ∂x = − = −1
∂F 1
(0, 0)
∂y

Figura 10: Parte do subconjunto de R2 dado por x2 y + sen(x + y) = 0

Do mesmo modo, dado que ∂F ∂x


(0, 0) = 1 , a equação 3 define implicitamente, localmente
em torno de (0, 0), a variável x como função de y.
Na figura 10 encontra-se parte do conjunto definido pela equação 3.

Exemplo 12 A equação
x3 z 2 − z 3 yx = 0
define implicitamente z como função de (x, y) localmente em torno do ponto (1, 1, 1).
Seja F : R3 → R a função de classe C 1 definida por

F (x, y, z) = x3 z 2 − z 3 yx

Note-se que F (1, 1, 1) = 0. Sendo


   
DF (1, 1, 1) = 3x2 z 2 − z 3 y −z 3 x 2x3 z − 3z 2 yx x=1,y=1,z=1 = 2 −1 −1

15
e, portanto
∂F
(1, 1, 1) = −1
∂z
concluimos que, localmente em torno do ponto (1, 1, 1), a equação F (x, y, z) = 0 define
implicitamente z como função de (x, y). Designemos por f (x, y) essa função. Então,
F (x, y, f (x, y)) = 0 e derivando em x , obtemos

∂F ∂F ∂f
+ =0
∂x ∂z ∂x
e, portanto
∂f 2
(1, 1) = − =2
∂x −1
Note-se que para o ponto (0, 0, 0) temos
 
DF (0, 0, 0) = 0 0 0

e, portanto nada podemos concluir através do Teorema da Função Implı́cita.

z
x = yz

z=0

x=0 y

Figura 11: Subconjunto de R3 dado por x3 z 2 − z 3 yx = 0

No entanto, analisando a equação, obtemos

x3 z 2 − z 3 yx = 0 ⇐⇒ xz 2 (x − zy) = 0 ⇐⇒ x = 0 ∨ z = 0 ∨ x = zy

e, portanto, em torno da origem não é possı́vel exprimir nenhuma das variáveis como função
das outras porque se intersectam três superfı́cies, como se ilustra na figura 11.

16
Exemplo 13 O sistema de equações
(
xu + yvu2 = 2
xu3 + y 2v 4 = 2

define implicitamente (u, v) como funções de (x, y) em torno do ponto (1, 1, 1, 1).
De facto, consideremos a função F : R4 → R2 definida por

F (x, y, u, v) = (xu + yvu2 , xu3 + y 2v 4 )

Trata-se de uma função de classe C 1 tal que F (1, 1, 1, 1) = (2, 2) e a respectiva derivada
no ponto (1, 1, 1, 1) é dada por
   
u vu2 x + 2yvu yu2 1 1 3 1
DF (1, 1, 1, 1) =  =
   
 
3 4 2 2 3
u 2yv 3xu 4y v x=1,y=1,u=1,v=1
1 2 3 4

e, portanto  
3 1
det Duv F (1, 1, 1, 1) = det =9
3 4
O Teorema da Função Implı́cita garante que localmente em torno do ponto (1, 1, 1, 1)
temos (u, v) = (u(x, y), v(x, y))
Derivando a função F em x , obtemos
∂u ∂v ∂u

x
 + u + y u2 + 2yvu =0
∂x ∂x ∂x
3xu2 ∂u + u3 + 4y 2 v 3 ∂v = 0

∂x ∂x
ou seja, no ponto (1, 1, 1, 1) , temos o sistema
∂u ∂v

3
 + = −1
∂x ∂x
3 ∂u + 4 ∂v = −1

∂x ∂x
de onde concluimos
∂u 1

 (1, 1) = −

∂x 3
∂v
 (1, 1) = 0

∂x

***

17
Referências
[1] J. Campos Ferreira. Introdução à Análise em Rn . AEIST, 1978.

[2] F. R. Dias Agudo. Cálculo Diferencial em Rn . Escolar Editora, 1977.

[3] Luı́s T. Magalhães. Complementos de cálculo diferencial.

[4] W. Rudin. Principles of Mathematical Analysis. McGraw Hill, 1996.

18
Instituto Superior Técnico
Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

CDI-II

Variedades. Extremos Condicionados

Em termos simples, uma variedade será um conjunto definido localmente por um


sistema de equações tais que o teorema da função implı́cita seja aplicável. Veremos que
será possı́vel descrever tais conjuntos de três formas geométricas diferentes.

1 Variedades. Parametrizações
Seja F : R2 → R uma função de classe C 1 e consideremos o respectivo conjunto de nı́vel
zero, ou seja, o conjunto

M = {(x, y) ∈ R2 : F (x, y) = 0}.


∂F
Seja (a, b) ∈ M tal que (a, b) 6= 0.
∂y
Pelo Teorema da Função Implı́cita, localmente em torno do ponto (a, b) temos

F (x, y) = 0 ⇔ y = f (x),

em que f : ]a − ǫ, a + ǫ[ → R, com ǫ > 0, é uma função de classe C 1 .


Seja g : ]a − ǫ, a + ǫ[ → R2 a função definida do seguinte modo

g(x) = (x, f (x)).

É claro que g é de classe C 1 . Note-se que g(a) = (a, f (a)) = (a, b) e g ′(a) = (1, f ′(a)).
Note-se que a função g é injectiva. De facto, se x1 6= x2 então g(x1 ) 6= g(x2 ).
Note-se também que temos

∇F (a, b) 6= (0, 0) ; g ′ (a) 6= (0, 0).

Suponhamos que, localmente em torno do ponto (a, b), um conjunto M ⊂ R2 pode ser
descrito por uma função injectiva g : ]t0 − ǫ, t0 + ǫ[ → R2 , de classe C 1 , tal que

g(t0 ) = (a, b) ; g ′ (t0 ) 6= (0, 0).

Dado que g ′ (t) = (x′ (t), y ′ (t)), sem perda de generalidade, suponhamos que x′ (t0 ) 6= 0.
Pelo Teorema da Função Inversa em R, a função x = x(t) será localmente invertı́vel em
torno de t = t0 , ou seja, t = h(x) para alguma função de classe C 1 designada por h.
Portanto, teremos
y = y(t) = y(h(x)) = f (x).
Fazendo F (x, y) = y − f (x), concluı́mos que, localmente em torno do ponto (a, b), o
conjunto M será definido pela equação F (x, y) = 0.
Assim, temos três formas equivalentes de descrever localmente o mesmo conjunto (c.f.
[2]).

i) Como conjunto de nı́vel zero de uma função F : R2 → R, de classe C 1 e tal que


∇F (x, y) 6= (0, 0).

ii) Como gráfico de uma função f de classe C 1 , ou seja, y = f (x).

iii) Como a imagem de uma função injectiva g, de classe C 1 , tal que (x, y) = g(t) com
t ∈ R e g ′(t) 6= (0, 0).

Um conjunto descrito desta forma designa-se por variedade de dimensão um e dizemos


que a função g é uma parametrização desse conjunto.
Normalmente chamamos variedade-1 a esse conjunto.

Localmente, em torno do ponto (a, b), teremos

F (x, y) = 0 ⇔ y = f (x) ⇔ (x, y) = g(t),

e, portanto
F (g(t)) = 0
e pelo Teorema da Função Composta, obtemos

∇F (g(t0)) · g ′ (t0 ) = 0,

ou seja,
∇F (a, b) · g ′(t0 ) = 0,
 
∂F ∂F
Geometricamente, o vector gradiente ∇F (a, b) = (a, b), (a, b) é um vector
∂x ∂y
normal ao conjunto M no ponto (a, b) e, portanto, o vector g ′ (t0 ) = (x′ (t0 ), y ′(t0 )) é um
vector tangente a M no mesmo ponto.
Portanto, as diferentes formas de descrever uma variedade fornecem informações geo-
métricas distintas.
Ao espaço linear gerado pelo vector N = ∇F (a, b) chamamos espaço normal a M no
ponto (a, b).
Ao espaço linear gerado pelo vector T = g ′ (t0 ) chamamos espaço tangente a M no
ponto (a, b).
É claro que a recta tangente a M no ponto P = (a, b) é dada pela equação pa-
ramétrica:
X − P = λT, λ ∈ R,
em que X = (x, y). (Ver figura 1).

2
y
T

Figura 1: Recta tangente e recta normal em R2

Do mesmo modo, a recta normal a M no ponto P = (a, b) é dada pela equação


paramétrica:
X − P = λN, λ ∈ R.
Note-se que os vectores T e N são ortogonais, ou seja, N · T = 0 e, portanto, a recta
tangente no ponto P = (a, b) será dada pela equação cartesiana

(X − P) · N = 0

e a recta normal será dada pela equação cartesiana

(X − P) · T = 0.

Em Rn com n ≥ 2, estamos interessados em considerar conjuntos definidos por sistemas


de m equações, ou seja, conjuntos M ⊂ Rn da forma

M = {x ∈ Rn : F (x) = 0}

em que F : Rn → Rm , com m < n, é uma função de classe C 1 .


Se o Teorema da Função Implı́cita for aplicável em M então dizemos que se trata de
uma variedade. Quer isto dizer que, localmente em torno de cada um dos seus pontos,
m variáveis serão expressas implicitamente como funções das restantes (n − m) variáveis,
também designadas por variáveis livres. A tal conjunto chamaremos variedade de
dimensão n − m.
Seja F (x) = (F1 (x), F2 (x), . . . , Fm (x)). Então o conjunto M será definido pelo sistema


 F1 (x1 , x2 , . . . , xn ) = 0

F (x , x , . . . , x ) = 0
2 1 2 n


 ...
Fm (x1 , x2 , . . . , xn ) = 0.

3
Note-se que o Teorema da Função Implı́cita é aplicável se as linhas da matriz que
representa a derivada de F,
 ∂F ∂F1 ∂F1 
1
(x) (x) ··· (x)
 ∂x1 ∂x2 ∂xn 
 ∂F2 ∂F2 ∂F2
 

 (x) (x) ··· (x) 
DF (x) =  ∂x1 ∂x2 ∂xn
 

 

 . . ··· . 

 ∂F ∂Fm ∂Fm 
m
(x) (x) ··· (x)
∂x1 ∂x2 ∂xn
forem linearmente independentes em cada um dos pontos de M.
Note-se também que as linhas da matriz DF (x) são os m vectores

∇F1 (x), ∇F2 (x), . . . , ∇Fm (x).

Sabendo que o gradiente de uma função escalar é perpendicular ao respectivo conjunto


de nivel no ponto considerado, as linhas da matriz DF (x) são vectores normais de M.
Ao espaço linear gerado por este conjunto de vectores chamamos espaço normal a M
no ponto considerado.
Suponhamos que as (n − m) variáveis livres são (x1 , x2 , . . . , xn−m ).
Seja u = (x1 , x2 , . . . , xn−m ) e v = (xn−m+1 , . . . , xn ).
Então, localmente teremos

F (u, v) = 0 ⇔ v = f (u) = (f1 (u), f2 (u), . . . , fm (u))

em que f = (f1 , f2 , . . . , fm ) é de classe C 1 .


A função g(u) = (u, v) = (u, f (u)) é de classe C 1 , injectiva e a respectiva derivada
 
1 0 ··· 0
 
 0 1 ··· 0
 

 . . ··· .
 

 . . ··· .
 

 . . ··· .
 

 0 0 ··· 1
 

Dg(u) =   
∂f 1 ∂f1 ∂f 1


 ∂u (u) (u) · · · (u) 
 1 ∂u 2 ∂u n−m


 .
 . ··· . 

 .
 . · · · . 

 .
 . ··· . 

 ∂fm ∂fm ∂fm 
(u) (u) · · · (u)
∂u1 ∂u2 ∂un−m
tem (n − m) colunas linearmente independentes.

4
À função g chamamos parametrização de M.
Note-se que, por definição de g, temos F (g(u)) = 0 e, portanto,

DF (g(u))Dg(u) = 0

o que quer dizer que as colunas de Dg(u) são ortogonais às linhas de DF (g(u)).
Assim, o espaço gerado pelas colunas de Dg(u) é ortogonal ao espaço normal e será
chamado espaço tangente a M no ponto considerado.
Assim, temos três formas equivalentes de descrever localmente o mesmo conjunto em
torno de cada um dos seus pontos x ∈ M ⊂ Rn .

i) Como conjunto de nı́vel zero de uma função F : Rn → Rm , com m < n, de classe C 1


e tal que as linhas da matriz DF (x) são linearmente independentes, ou seja, a matriz
DF (x) tem caracterı́stica m.

ii) Como gráfico de uma função f de classe C 1 , ou seja, v = f (u).

iii) Como a imagem de uma função injectiva g, de classe C 1 , tal que x = g(t) com t ∈ Rn−m
e as colunas da matriz Dg(t) são linearmente independentes, ou seja, a matriz Dg(t)
tem caracterı́stica (n − m).

Diz-se que M é uma variedade de dimensão (n − m) e usamos a notação variedade-


(n − m).

Exemplo 1.1 Consideremos a circunferência em C ⊂ R2 dada pela equação

x2 + y 2 = 1

e que se encontra representada na figura 2.


É claro que se trata do conjunto de nı́vel zero da função F (x, y) = x2 + y 2 − 1. Esta
função é de classe C 1 em R2 e a respectiva derivada
 
∇F (x, y) = 2x 2y

é nula apenas na origem (x, y) = (0, 0). No entanto, a origem não pertence à circunferência.
Portanto, esta circunferência é uma variedade-1.
Consideremos o ponto P = (0, 1). Dado que o vector N = ∇F (0, 1) = (0, 2) é um vector
normal em P, a recta normal à circunferência nesse ponto será dada na forma paramétrica
por (
x=0
(x, y) − (0, 1) = λ(0, 2) ⇔
y − 1 = 2λ
e, portanto será dada pela equação x = 0. (Ver figura 2).

5
y

T P

Figura 2: Circunferência C = {(x, y) ∈ R2 : x2 + y 2 = 1}

A recta tangente em P será dada por

(x, y − 1) · (0, 2) = 0,

ou seja, pela equação y = 1. (Ver figura 2).


Note-se que para y > 0 temos

x2 + y 2 = 1 ⇔ y = 1 − x2

e definindo g(x) = (x, 1 − x2 ) obtemos uma parametrização da parte da circunferência
em que y > 0.
É claro que esta parametrização descreve apenas metade da circunferência.
Tendo em conta a simetria da circunferência podemos descrevê-la de outra forma. Note-
se que os pontos de uma circunferência estão todos à mesma distância do centro. Se à
distância ao centro associarmos o ângulo θ tal como se ilustra na figura 3, obtemos novas
coordenadas (r, θ) que se relacionam com (x, y) da forma seguinte
(
x = r cos θ
y = r sen θ.
p
em que r = x2 + y 2 .
Nestas novas coordenadas, denominadas coordenadas polares, a circunferência dada
por x2 + y 2 = 1 passa a ser descrita pela equação r = 1 e, portanto podemos usar a variável
θ para descrever parametricamente a circunferência.
De facto, seja
g(θ) = (cos θ, sen θ) 0 < θ < 2π.
Então, esta função é de classe C 1 , injectiva e a respectiva derivada
 
′ − sen θ
g (t) =
cos θ

6
y

θ
x

Figura 3: Coordenadas Polares (r, θ)

tem caracterı́stica um. Para além disso a sua imagem é a circunferência sem o ponto (1, 0),
ou seja g(]0, 2π[) = C \ {(1, 0)}.
Note-se também que o vector g ′ ( π2 ) = (−1, 0) é o vector tangente T no ponto (0, 1) tal
como se ilustra na figura 2.
Trata-se, portanto, de uma parametrização da circunferência. Note-se que esta para-
metrização descreve a circunferência excluindo um ponto apenas, ou seja, as coordenadas
polares (r, θ) são mais adequadas do que as coordenadas cartesianas (x, y).
Para descrever completamente a circunferência deveremos ter outra parametrização que
poderá ser dada pela função

h(θ) = (cos θ, sen θ) −π <θ < π

que exclui apenas o ponto (−1, 0).


Assim, as duas funções g e h descrevem completamente a circunferência C.

Exemplo 1.2 Consideremos a esfera S ⊂ R3 definida pela equação

x2 + y 2 + z 2 = 1

que se encontra representada na figura 4.


Trata-se do conjunto de nı́vel zero da função de classe C 1 definida por

F (x, y, z) = x2 + y 2 + z 2 − 1.

A derivada  
∇F (x, y, z) = 2x 2y 2z
tem caracterı́stica um em todos os pontos de S, porque o caso contrário ocorre apenas na
origem que não se encontra em S. Portanto, S é uma variedade-2.
O vector ∇F (0, 1, 0) = (0, 2, 0) é normal a S no ponto (0, 1, 0).

7
z

T2

N
y
x
T1

Figura 4: Esfera definida pela equação: x2 + y 2 + z 2 = 1

Os vectores tangentes a S no mesmo ponto resultam da resolução da equação

T · N = 0.

Fazendo T = (α, β, γ), obtemos β = 0 e, portanto,

T = (α, 0, γ) = α(1, 0, 0) + γ(0, 0, 1).

Assim, os vectores T1 = (1, 0, 0) e T2 = (0, 0, 1) geram o espaço tangente a S no ponto


(0, 1, 0).
Na figura 4 encontram-se representados os vectores N, T1 , T2 .
Fazendo X = (x, y, z) e P = (0, 1, 0), o plano tangente a S no ponto (0, 1, 0), será dado
por
(X − P ) · N = 0,
ou seja,
(x, y − 1, z) · (0, 2, 0) = 0 ⇔ y = 1,
e encontra-se representado na figura 4.
A recta normal a S no ponto P = (0, 1, 0), será dada pelas equações
( (
(X − P ) · T1 = 0 x=0

(X − P ) · T2 = 0 z = 0,

ou seja, será o eixo Oy.


Note-se que para z > 0 temos
p
x2 + y 2 + z 2 = 1 ⇔ z = 1 − x2 − y 2
p
e definindo g(x, y) = (x, y, 1 − x2 − y 2 ) obtemos uma parametrização da parte da esfera
em que z > 0.

8
z

φ (x, y, z)

x θ y

Figura 5: Coordenadas esféricas (r, θ, φ)

É claro que esta parametrização descreve apenas metade da esfera.


Tendo em conta a simetria da esfera podemos descrevê-la de outra forma. Note-se que
os pontos de uma esfera estão todos à mesma distância do centro. Se à distância ao centro
associarmos os ângulos θ e φ, tal como se ilustra na figura 5, obtemos novas coordenadas
(r, θ, φ) que se relacionam com (x, y, z) da forma seguinte

x = r sen φ cos θ

y = r sen φ sen θ

z = r cos φ

p
em que r = x2 + y 2 + z 2 .
Nestas novas coordenadas, denominadas coordenadas esféricas, a esfera dada por
x + y 2 + z 2 = 1 passa a ser descrita pela equação r = 1 e, portanto podemos usar as
2

variáveis θ, φ para descrever parametricamente a esfera S.


De facto, seja

g(θ, φ) = (sen φ cos θ, sen φ sen θ, cos φ) 0 < θ < 2π; 0 < φ < π

Então, esta função é de classe C 1 , injectiva e a respectiva derivada


 
− sen φ sen θ cos φ cos θ
Dg(θ, φ) =  sen φ cos θ cos φ sen θ
0 − sen φ

tem caracterı́stica dois. Para além disso a sua imagem é a esfera sem a linha em que
x ≥ 0, y = 0, ou seja

g(]0, 2π[×]0, π[) = S \ {(x, y, z) : x ≥ 0; y = 0}.

9
Esta linha está representada a vermelho na figura 4.
Note-se também que as colunas da matriz
 
−1 0
π π
Dg( , ) =  0 0
2 2
0 −1
são os vectores tangentes −T1 e −T2 no ponto (0, 1, 0). (Ver figura 4).
Trata-se, portanto, de uma parametrização da esfera. Note-se que esta parametrização
descreve a esfera excluindo uma linha apenas, ou seja, as coordenadas esféricas (r, θ, φ) são
mais adequadas do que as coordenadas cartesianas (x, y, z).
Para descrever completamente a esfera devemos considerar mais duas parametrizações.
Consideremos o subconjunto de R2 definido por
T =]0, 2π[×]0, π[
e as funções h, k : T → R3 definidas por
h(θ, φ) = (cos φ, sen φ cos θ, sen φ sen θ)
k(θ, φ) = (sen φ sen θ, cos φ, sen φ cos θ)
Então, as funções g, h, k são de classe C 1 , injectivas e se definirmos
G = {(x, y, z) : x ≥ 0 ; y = 0}
H = {(x, y, z) : y ≥ 0 ; z = 0}
K = {(x, y, z) : z ≥ 0 ; x = 0}
cada uma das funções g , h , k estabelece uma bijecção entre o conjunto T ⊂ R2 e as partes
da esfera S \ G , S \ H , S \ K, respectivamente. As linhas G, H, K estão representadas
na figura 6.
z

G K

x H
y

Figura 6: Parametrização da esfera

É fácil verificar que, tal como Dg(θ, φ), as derivadas Dh(θ, φ) e de Dk(θ, φ) são matrizes
com caracterı́stica igual a dois.
Portanto, as funções g , h , k parametrizam a esfera S.

10
Exemplo 1.3 Consideremos o cilindro C ⊂ R3 definido por

C = {(x, y, z) ∈ R3 : x2 + y 2 = 1 ; −1 < z < 1

que se encontra representado na figura 7.

T2

N
T1 y
x

Figura 7: Cilindro definido por: x2 + y 2 = 1 ; −1 < z < 1

Trata-se do conjunto de nı́vel zero da função de classe C 1 definida por

F (x, y, z) = x2 + y 2 − 1.

A derivada  
∇F (x, y, z) = 2x 2y 0
tem caracterı́stica um em todos os pontos de S, porque o caso contrário ocorre apenas nos
pontos da forma (0, 0, z) que não se encontram em C. Portanto, C é uma variedade-2.
O vector ∇F (0, 1, 0) = (0, 2, 0) é normal a S no ponto (0, 1, 0).
Os vectores tangentes a S no mesmo ponto resultam da resolução da equação

T · N = 0.

Fazendo T = (α, β, γ), obtemos β = 0 e, portanto,

T = (α, 0, γ) = α(1, 0, 0) + γ(0, 0, 1).

Assim, os vectores T1 = (1, 0, 0) e T2 = (0, 0, 1) geram o espaço tangente a S no ponto


(0, 1, 0).
Na figura 7 encontram-se representados os vectores N, T1 , T2 .
Fazendo X = (x, y, z) e P = (0, 1, 0), o plano tangente a S no ponto (0, 1, 0), será dado
por
(X − P ) · N = 0,
ou seja,
(x, y − 1, z) · (0, 2, 0) = 0 ⇔ y = 1,

11
e encontra-se representado na figura 7.
A recta normal a S no ponto P = (0, 1, 0), será dada pelas equações
( (
(X − P ) · T1 = 0 x=0

(X − P ) · T2 = 0 z = 0,

ou seja, será o eixo Oy.


Note-se que para y > 0 temos

x2 + y 2 = 1 ⇔ y = 1 − x2

e definindo g(x, z) = (x, 1 − x2 , z) obtemos uma parametrização da parte do cilindro em
que y > 0.
É claro que esta parametrização descreve apenas metade do cilindro.

(x, y, z)

y
θ ρ
x

Figura 8: Coordenadas cilı́ndricas (ρ, θ, z)

Tendo em conta a simetria do cilindro podemos descrevê-lo de outra forma. Note-se


que os pontos do cilindro C estão todos à mesma distância do eixo Oz. Se à distância ao
eixo Oz associarmos o ângulo θ e a variável z, tal como se ilustra na figura 8, obtemos
novas coordenadas (ρ, θ, z) que se relacionam com (x, y, z) da forma seguinte

x = ρ cos θ

y = ρ sen θ

z=z

p
em que ρ = x2 + y 2.
Nestas novas coordenadas, denominadas coordenadas cilı́ndricas, o cilindro dado
por x2 + y 2 = 1 passa a ser descrito pela equação ρ = 1 e, portanto podemos usar as
variáveis θ, z para o descrever parametricamente.

12
De facto, seja

g(θ, z) = (cos θ, sen θ, z) 0 < θ < 2π; −1 < z < −1

Então, esta função é de classe C 1 , injectiva e a respectiva derivada


 
− sen θ 0
Dg(θ, φ) =  cos θ 0
0 1

tem caracterı́stica dois. Para além disso a sua imagem é o cilindro sem a linha em que
x = 1, y = 0, ou seja

g(]0, 2π[×] − 1, 1[) = C \ {(x, y, z) : x = 1; y = 0}.

Esta linha está representada a vermelho na figura 7.


Note-se também que as colunas da matriz
 
−1 0
π
Dg( , 0) =  0 0
2
0 1

são os vectores tangentes −T1 e T2 no ponto (0, 1, 0). (Ver figura 7).
Trata-se, portanto, de uma parametrização do cilindro. Note-se que esta parame-
trização descreve o cilindro excluindo uma linha apenas, ou seja, as coordenadas cilı́ndricas
(ρ, θ, z) são mais adequadas do que as coordenadas cartesianas (x, y, z).
Para descrever completamente o cilindro devemos considerar mais uma parametrização.
Consideremos a função h : ] − π, π[×] − 1, 1[→ R3 definida por

h(θ, z) = (cos θ, sen θ, z).

Então, a função h é de classe C 1 , injectiva, a respectiva derivada é igual à derivada de


g e, portanto, tem caracterı́stica igual a dois.
Note-se que a imagem de h é o cilindro sem a linha vertical dada por x = −1 ; y = 0.
Portanto, as funções g e h parametrizam o cilindro C.

2 Extremos Condicionados
Consideremos a função f (x, y) = x2 + y 2 e a elipse definida pela equação

y2
x2 + =1
4
e que se encontra representada na figura 9.
Dado que f (x, y) representa o quadrado da distância de um ponto (x, y) à origem, é
claro que os pontos (0, 2) e (0, −2) são os máximos de f na elipse. Os pontos (1, 0) e

13
y

1 x

y2
Figura 9: Elipse em R2 dada por x2 + 4 =1

(−1, 0) são os mı́nimos de f sobre a elipse. Ou seja, se restringirmos a função f à elipse


estes pontos são os respectivos extremos.
Note-se que a origem é o único ponto de estacionaridade da função f em R2 . De facto,
temos
∇f (x, y) = (2x, 2y) = (0, 0) ⇔ (x, y) = (0, 0).
Portanto os extremos de f, quando restringida à elipse, não se encontram no conjunto
de pontos crı́ticos de f. Assim, deveremos adoptar uma estratégia diferente para determinar
os extremos de f sobre a elipse.
Seja γ(t) = (cos t, 2 sen t) = (x(t), y(t)), com − π6 < t < 11π 6
, uma parametrização da
elipse.
A função composta f ◦ γ é a restrição de f à elipse retirando o ponto (1, 0). Trata-se
de uma função real de variável real. De facto temos
γ f
R −→ R2 −→ R

t 7→ γ(t) 7→ f (γ(t)).

Um extremo da função composta f ◦ γ é um zero da respectiva derivada,


d
f (γ(t)) = 0 ⇔ ∇f (γ(t)) · γ ′ (t) = 0,
dt
ou seja,

(2 cos t, 4 sen t) · (− sen t, 2 cos t) = 0 ⇔ 6 sen t cos t = 0 ⇔ sen t = 0 ∨ cos t = 0

e, portanto, teremos
π 3π
t=0∨t= ∨t=π∨t= .
2 2

14
Assim, os pontos crı́ticos de f restringida à elipse serão
π 3π
γ(0) = (1, 0) ; γ( ) = (0, 2) ; γ(π) = (−1, 0) ; γ( ) = (0, −2),
2 2
ou seja, exactamente os pontos determinados acima.
Note-se que γ ′ (t) é um vector tangente à elipse no ponto γ(t). Dado que, num extremo,
deveremos ter
∇f (γ(t)) · γ ′ (t) = 0
concluı́mos que o vector ∇f (γ(t)) é ortogonal ao vector tangente γ ′ (t).
Portanto, o vector ∇f (x, y) pertence ao espaço normal à elipse no ponto (x, y).
Consideremos a função
y2
F (x, y) = x2 + − 1.
4
Então a elipse é o conjunto de nı́vel zero de F e o vector ∇F (x, y) gera o espaço normal à
elipse no ponto (x, y).
Assim, o vector ∇f (x, y) é um múltiplo do vector ∇F (x, y), ou seja,

∇f (x, y) = λ∇F (x, y),

em que λ ∈ R.
Deste modo, temos uma estratégia para determinar os extremos de f quando sujeitos
à condição F = 0, que consiste em resolver o sistema
(
∇f (x, y) = λ∇F (x, y)
F (x, y) = 0

Este raciocı́nio pode ser aplicado à resolução de um problema mais geral que pode ser
formulado do seguinte modo (c.f. [2, 3, 1]).
Seja f : Rn → R uma função de classe C 1 e F : Rn → Rm , com m < n, uma função
também de classe C 1 . Pretendemos determinar os extremos de f sujeitos ao sistema de
equações (ou condições), F (x) = 0, ou seja,


F1 (x1 , x2 , · · · , xn ) = 0

F (x , x , · · · , x ) = 0
2 1 2 n


...
Fm (x1 , x2 , · · · , xn ) = 0.

em que F1 , F2 , . . . , Fm são as componentes de F.


Dito de outro modo, trata-se de determinar os extremos de f restringida à variedade
definida pelo sistema de equações F (x) = 0.
Este é o chamado problema dos extremos condicionados.

15
Tal como para a elipse, o vector ∇f (x) deverá ser normal à variedade definida por
M = {x ∈ Rn : F (x) = 0}, ou seja, deverá ser uma combinação linear dos vectores que
geram o espaço normal à variedade.
De facto, seja γ : R → Rn um caminho ou trajectória de classe C 1 tal que

γ(0) = a ; F (γ(t)) = 0 ∀t ∈ R,

ou seja, γ define uma linha de pontos da variedade que passa no ponto a.


Então, a função composta f ◦ γ : R → R deverá apresentar um extremo em a, ou seja,
d
f (γ(t))|t=0 = 0 ⇔ ∇f (a) · γ ′ (0) = 0.
dt
Dado que o vector γ ′ (0) é tangente a M no ponto a, concluı́mos que ∇f (a) é um vector
normal à variedade M nesse ponto e, portanto, será uma combinação linear dos vectores
∇F1 (a), ∇F2 (a), . . . , ∇Fm (a).
Assim, teremos
(
∇f (x) = λ1 ∇F1 (x) + λ2 ∇F2 (x) + · · · + λm ∇Fm (x) = 0
(1)
F (x) = 0.
Note-se que este sistema apresenta (n + m) equações e (n + m) incógnitas e, em geral,
não é linear.
Os escalares λ1 , λ2 , . . . , λm são os chamados multiplicadores de Lagrange e ao sis-
tema 1 chamamos método dos multiplicadores de Lagrange.

Exemplo 2.1 Para o caso considerado acima, temos

y2
f (x, y) = x2 + y 2 ; F (x, y) = x2 + −1
4
e, portanto,
  
2x = 2λx x(1 − λ) = 0 x = 0 ∨ λ = 1
(   
∇f (x, y) = λ∇F (x, y)
⇔ 2y = λy
2
⇔ y(4 − λ) = 0 ⇔ y=0 ∨ λ=4
F (x, y) = 0  2 y2
  2 y2
  2 y2

x + 4 =1 x + 4 =1 x + 4 =1

de onde obtemos os pontos (0, −2), (0, 2), (−1, 0), (1, 0). Os dois primeiros são os mais
afastados da origem e os outros dois são os mais próximos.
Note-se que o cálculo do escalar λ é irrelevante para o problema.

16
y
R

Figura 10: Rectângulo de comprimento x e largura y

1
4
xy = 10

1
xy = 10 xy = 1
4

1 x

1
Figura 11: O rectângulo de perı́metro 2 com área máxima é o quadrado de lado 2

Exemplo 2.2 Consideremos o conjunto dos rectângulos em R2 com perı́metro igual a dois.
Qual deles apresenta maior área?
Note-se que o perı́metro fixo é uma condição ou restrição e pretendemos maximizar a
área.
Podemos formular este problema, (ver figura 10), em termos do método dos multipli-
cadores de Lagrange fazendo f (x, y) = xy e F (x, y) = 2x + 2y − 2, ou seja, pretendemos
determinar os extremos de f sujeitos à condição F (x, y) = 0 ⇔ x + y = 1.
Então teremos,
 
(  y=λ y = x

∇f (x, y) = λ∇F (x, y) 
⇔ x=λ ⇔ x=λ
F (x, y) = 0  
x+y =1 2x = 1
 

17
e, portanto, y = x = 21 .
Trata-se de um quadrado de lado 12 , ou seja, um quadrado de área xy = 41 .
Na figura 11 estão representados o conjunto em que x + y = 1, ou seja, o conjunto dos
rectângulos de perı́metro 2 e linhas em que xy = c ; c > 0, ou seja, área constante. Note-se
que a área é máxima para c = 41 .

Exemplo 2.3 Consideremos o conjunto L definido pelo sistema


(
x2 + y 2 + z 2 = 2
y = x.

Quais os pontos de L mais próximos do ponto (0, 0, 1)? √


O conjunto L resulta da intersecção da esfera de raio 2 e centro na origem com o
plano vertical y = x e, portanto, é uma circunferência tal como se ilustra na figura 12.

x2 + y 2 + z 2 = 2

x
y=x

Figura 12: Circunferência em R3 dada por x2 + y 2 + z 2 = 2 ; y = x

Seja f (x, y, z) = x2 + y 2 + (z − 1)2 . Esta é a função a minimizar em L. Note-se que L


é um conjunto compacto em R3 e, sendo f de classepC 1 , terá mı́nimo nesse conjunto.
Note-se também que poderı́amos usar a função x2 + y 2 + (z − 1)2 que é a distância
de um ponto (x, y, z) ao ponto (0, 0, 1). No entanto, no método dos multiplicadores de
Lagrange temos de calcular as derivadas das funções envolvidas. É claro que essa tarefa é
mais simples considerando o quadrado da distância em vez da distância propriamente dita.
Note-se que a função distância, definida pela norma, não é diferenciável na origem porque
se trata de uma raı́z quadrada.
Assim, sejam F1 (x, y, z) = x2 + y 2 + z 2 − 2 e F2 (x, y, z) = y − x.

18
Portanto,


 2x = 2λ1 x − λ2
 
∇f (x, y, z) = λ1 ∇F1 (x, y, z) + λ2 ∇F2 (x, y, z) 2y = 2λ1 y + λ2


 
F1 (x, y, z) = 0 ⇔ 2(z − 1) = 2λ1 z
 
F2 (x, y, z) = 0 x2 + y 2 + z 2 = 2
 




y = x

donde deduzimos 

 2x(1 − λ1 ) = −λ2

2y(1 − λ1 ) = λ2



z(1 − λ1 ) = 1

x2 + y 2 + z 2 = 2





y = x.

Tendo em conta que y = x, da primeira e segunda equações concluı́mos que λ2 = 0. Da


primeira equação teremos

x(1 − λ1 ) = 0 ⇔ x = 0 ∨ λ1 = 1.

Se λ1 = 1 então da √ terceira equação


√ obtemos 0 = 1. Assim, y = x = 0 e da quarta
equação teremos z = 2 ou z = − 2. √ √
Portanto, os pontos a considerar
√ são (0, 0, − 2) e (0, 0, 2). É claro que o mais próximo
de (0, 0, 1) é o ponto (0, 0, 2).

Exemplo 2.4 Consideremos a linha definida pelo sistema de equações


(
z = x2 + y 2
x + y + z = 1.

e que se representa na figura 13. Trata-se da intersecção do plano definido por x+ y + z = 1


com o parabolóide dado por z = x2 + y 2 .
Pretendemos determinar o ponto desta linha que apresenta maior cota, ou seja, coor-
denada z mais elevada.
É fácil verificar que se trata de uma variedade de dimensão um, ou seja, uma linha em
3
R.
Pretendemos determinar os extremos da função f (x, y, z) = z, sujeitos à condição
F (x, y, z) = (0, 0).

19
z

z = x2 + y 2

x+y+z =1

Figura 13: Linha em R3 dada por z = x2 + y 2 ; x + y + z = 1

Aplicando o método dos multiplicadores de Lagrange, obtemos


  

 0 = −2λ 1 x + λ 2 
 2λ 1 x = λ 2 
 2λ1 (x − y) = 0
  
0 = −2λ1 y + λ2 2λ1 y = λ2 2λ1 y = λ2

 
 

  
1 = λ1 + λ2 ⇔ 1 = λ1 + λ2 ⇔ 1 = λ1 + λ2
 2 2
 2 2

z =x +y z =x +y z = x2 + y 2

 
 


 
 


x + y + z = 1 
x + y + z = 1 
x + y + z = 1

Da primeira equação teremos λ1 = 0 ou x = y.


No caso de λ1 = 0, da segunda equação teremos λ2 = 0. Substituindo estes valores na
terceira equação, concluı́mos que este caso não pode ocorrer.
Para o caso em que x = y, da quarta e quinta equações, obtemos

2x2 + 2x − 1 = 0

e, portanto, √ √
−1 − 3 −1 + 3
x= ∨x= .
2 2
Dado que y = x e z = 1 − x − y, teremos os pontos
√ √ ! √ √ !
−1 − 3 −1 − 3 √ −1 + 3 −1 + 3 √
, ,3 + 3 ; , ,3 − 3 .
2 2 2 2

Assim, o ponto de cota mais elevada é o primeiro destes dois. O outro será o de cota
menos elevada.

20
Exemplo 2.5 Quais os pontos da elipse definida pela equação x2 + y 2 − xy = 3 que se
encontram mais afastados do eixo Ox?
Facilmente se verifica que esta linha é uma variedade de dimensão um em R2 .
y
2

2 x

Figura 14: Linha em R2 dada por x2 + y 2 − xy = 3

A distância de um ponto do plano de coordenadas (x, y) ao eixo Ox é dada por |y|.


Consideremos então a função f (x, y) = y.
Aplicando o método dos multiplicadores de Lagrange, obtemos

0 = λ(2x − y)

1 = λ(2y − x)

 2
x + y 2 − xy = 3.
Da primeira equação teremos λ = 0 ou y = 2x. Fazendo λ = 0 e substituindo na
segunda equação terı́amos 1 = 0. Portanto, deveremos ter y = 2x e, da terceira equação
obteremos x2 = 1, ou seja, os pontos que resolvem o sistema são (−1, −2) , (1, 2).
Note-se que estes pontos estão ambos à distância dois do eixo Ox. Na figura 14 encontra-
se representada esta elipse onde se pode constatar que os pontos mais afastados tanto do
eixo Ox como do eixo Oy se encontram à distância dois.

***

Referências
[1] Tom M. Apostol. Calculus II. Editorial Reverté, SA, 1977.
[2] Luı́s T. Magalhães. Integrais em Variedades e Aplicações. Texto Editora, 1993.
[3] J. E. Marsden and A. J. Tromba. Vector Calculus. W. H. Freeman and Company, 1998.

21
Instituto Superior Técnico
Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

Teorema da Função Inversa

1 Introdução
Uma função f : A → B diz-se injectiva se

x1 , x2 ∈ A ; x1 6= x2 =⇒ f (x1 ) 6= f (x2 )

Se f for injectiva então existe uma função inversa de f , designada por f −1 : f (A) → A dada
por
f −1 (y) = x se f (x) = y

Note-se que determinar a função inversa corresponde a resolver a equação f (x) = y que nem
sempre é fácil.
O Teorema da Função Inversa garante, a injectividade local de funções de classe C 1 recorrendo
apenas à análise da respectiva derivada. Para além disso, fica também garantido que a função
inversa é de classe C 1 .
Antes de passar ao enunciado do Teorema da Função Inversa, analisemos alguns casos de
equações que podem ser resolvidas sem dificuldade.

1. Consideremos a equação linear ax = y. Desde que a 6= 0 , a solução de tal equação existe e


é dada por x = y/a. Assim, a função f : R → R dada por f (x) = ax é injectiva desde que
a 6= 0 e a respectiva inversa f −1 : R → R é dada por f −1 (y) = y/a.
2. Seja f : Rn → Rn uma aplicação linear, ou seja, existe uma matriz An×n tal que f (x) = Ax.
Esta função é injectiva desde que det A 6= 0 e a respectiva inversa é dada por f −1 (y) = A−1 y
em que A−1 é a matriz inversa de A.
Note-se que uma aplicação linear é uma função de classe C 1 e a respectiva derivada é
representada pela matriz A , ou seja,

Df (x) = A

3. Seja f : R → R dada por f (x) = x2 . Trata-se de uma função não injectiva, por ser par:
f (−x) = f (x). No entanto, a restrição de f ao conjunto em que x > 0 é invertı́vel e temos

f −1 (y) = y.
Note-se que a derivada f ′ (x) = 2x anula-se apenas em x = 0 e que a função f não é
invertı́vel em torno da origem.
4. Consideremos a função f : R → R dada por f (x) = x3 . Facilmente se verifica que f é
injectiva em R e que a derivada f ′ (x) = 3x2 anula-se apenas em x = 0.
5. Coordenadas polares: Consideremos a função g : R2 → R2 dada por

g(r, θ) = (r cos θ, r sen θ)

Dado que as funções trigonométricas são periódicas, a função g não é injectiva em R2 . No


entanto, a restrição de g ao conjunto

T = {(r, θ) : r > 0 ; 0 < θ < 2π}

é injectiva e, portanto, a equação g(r, θ) = (x, y) pode ser resolvida e obtemos,


p y
r = x2 + y 2 ; θ = arctan
x

1
desde que x 6= 0.
Note-se que, sendo g de classe C 1 , para r =
6 0 temos
cos θ −r sen θ
" #
det Dg(r, θ) = det = r 6= 0
sen θ r cos θ

6. Seja g : R2 → R2 a função dada por


g(x, y) = (2xy , x2 + y 2 )

Note-se que g(1, 1) = g(−1, −1) = (2, 2) e, portanto, g não é injectiva em R2 . No entanto,
podemos determinar um subconjunto de R2 em que g é invertı́vel. Para isso consideremos
a equação g(x, y) = (u, v) , ou seja
u = 2xy
(

v = x2 + y 2
de onde obtemos √
x+y = v+u
(

x−y = v−u
desde que se tenha x + y ≥ 0 ; x − y ≥ 0. Portanto, a restrição de g ao conjunto
X = {(x, y) ∈ R2 : x + y ≥ 0 ; x − y ≥ 0}
é invertı́vel e a respectiva inversa, definida no conjunto
W = {(u, v) ∈ R2 : v + u ≥ 0 ; v − u ≥ 0}
é dada por
1 √ √ 1 √ √
 
−1
g (u, v) = (x, y) = ( v + u + v − u) , ( v + u − v − u)
2 2

***

Recorde-se que para funções reais de variável real se tem


i) Uma função real de variável real, definida num intervalo aberto, é injectiva se e só se for
estritamente monótona.
ii) Seja f : R → R uma função de classe C 1 e seja a um ponto tal que f ′ (a) 6= 0. Então,
existe uma vizinhança Va de a em que f é injectiva. Para além disso, a função inversa
f −1 é também de classe C 1 e
1
(f −1 )′ (y) = ′
f (x)
em que y = f (x) e x ∈ Va .
Portanto, é possı́vel determinar se uma função real de variável real e de classe C 1 é injectiva,
em alguma vizinhança de um ponto, analisando o sinal da derivada nesse ponto.

2 Teorema da Função Inversa

2
Teorema 2.1 Seja F : S → Rn uma função de classe C 1 , definida num aberto S ⊂ Rn tal que

det DF (a) 6= 0

em algum ponto a ∈ S. Então,


a) Existem dois abertos U e V , com a ∈ U e b = F (a) ∈ V , e tais que F é injectiva em U
e F (U ) = V .
b) A função inversa F −1 : V → U é de classe C 1 .

A demonstração deste teorema pode ser vista em [1, 2].

Nota 2.1 Sendo a inversa de classe C 1 , derivando a equação

F −1 (F (x)) = x ; x∈U

obtemos, para y = F (x) ,


−1
DF −1 (y) = [DF (x)] (1)
Portanto, nas condições do teorema da função inversa, a derivada da função inversa F −1 pode
ser obtida, localmente, conhecendo apenas a função F .

Nota 2.2 É de salientar que a função F deve ser de classe C 1 .


Considere-se a função F :] − 1, 1[→ R dada por

0, se x = 0
F (x) =
x + 2x2 sen x1 ,

se x 6= 0

Então,
1
x + 2x2 sen


F (0) = lim x
=1
x→0 x
Mas, para x 6= 0 temos
   
1 1
F ′ (x) = 1 + 4x sen − 2 cos
x x

e, portanto, F ′ não é contı́nua na origem embora seja limitada no intervalo ] − 1, 1[.


Apesar de termos F ′ (0) 6= 0 , a função F não é injectiva em nenhuma vizinhança da origem.

Nota 2.3 Nos casos em que det DF (a) = 0 o teorema não se aplica e tudo pode acontecer.
Considere-se a função F (x) = x2 definida em R. Então F ′ (0) = 0 e F não é invertı́vel em
nenhuma vizinhança da origem.
A função F (x) = x3 é injectiva em R apesar de termos F ′ (0) = 0.

3
3 Exemplos
Exemplo 3.1 Consideremos o sistema de equações
x4 + y 4
=u; sen x + cos y = v
x
Facilmente se conclui que a resolução deste sistema para x e y não é fácil. No entanto,
recorrendo ao Teorema da Função Inversa podemos determinar os pontos (x, y) para cada um dos
quais existe uma vizinhança em que o sistema é invertı́vel.
Seja  4
x + y4

F (x, y) = , sen x + cos y
x
a função definida para x 6= 0. Trata-se de uma função de classe C 1 no seu domı́nio e a sua
derivada é dada por  4 4 
3
3x −y 4y
x2 x
DF (x, y) =  
cos x − sen y
Portanto, para cada ponto (x, y) , com x 6= 0 , tal que
seny 4 4 4y 3
det DF (x, y) = (y − 3x ) − cos x 6= 0
x2 x
existirá uma vizinhança em que o sistema pode ser resolvido para x e y como funções de u e v.
Consideremos o ponto (π, π) . Então F (π, π) = (π 3 , −1) e
3π 2 4π 2
" #
det DF (π, π) = det = 4π 2
−1 0

e, portanto, de acordo com a fórmula (1) a derivada da inversa de F no ponto (π 3 , −1) é dada
por
0 −4π 2
" #
−1 3 −1 1
DF (π , −1) = [DF (π, π)] = 2
4π 1 3π 2

Exemplo 3.2 Seja f : R → R uma função de classe C 1 e consideremos o sistema de equações


u = f (x)
(

v = −y + xf (x)
Suponhamos que f ′ (x0 ) 6= 0. Então, existe uma vizinhança do ponto (x0 , y0 ) em que o sistema
pode ser resolvido para x, y.
Seja F : R2 → R2 a função de classe C 1 definida por
F (x, y) = (f (x), −y + xf (x))
Dado que f ′ (x0 ) 6= 0 , obtemos
f ′ (x0 ) 0
" #
det DF (x0 , y0 ) = det = f ′ (x0 ) 6= 0

f (x0 ) + x0 f (x0 ) −1
e, portanto, pelo Teorema da Função Inversa, existe uma vizinhança de (x0 , y0 ) em que F é
invertı́vel e a respectiva inversa é dada por
F −1 (u, v) = (x, y) = (f −1 (u), −v + uf −1 (u))

4
Exemplo 3.3 A função F : R3 → R3 definida por

F (x, y, z) = (x + xyz, y + xy, z + 2x + 3z 2 )

é invertı́vel numa vizinhança do ponto (0, 0, 0) . De facto, F é de classe C 1 e


 
1 0 0
 
det DF (0, 0, 0) = det  0 1 0 =1
 
 
2 0 1

A derivada da função inversa no ponto F (0, 0, 0) = (0, 0, 0) é dada por


 
1 0 0
 
DF −1 (0, 0, 0) = [DF (0, 0, 0)]−1 =  0 1 0 
 
 
−2 0 1

Exemplo 3.4 Seja T ⊂ Rn um conjunto aberto e g : T → Rn uma tranformação de coordenadas,


ou seja, g é de classe C 1 , injectiva e para cada t ∈ T temos det Dg(t) 6= 0.
Pelo Teorema da Função Inversa, concluimos que a inversa de g é de classe C 1 e se X = g(T ) ,
então g −1 : X → T é também uma transformação de coordenadas.

Referências
[1] Luı́s T. Magalhães. Complementos de cálculo diferencial.
[2] W. Rudin. Principles of Mathematical Analysis. McGraw Hill, 1996.

5
Instituto Superior Técnico
Departamento de Matemática
Secção de Álgebra e Análise
Prof. Gabriel Pires

Variedades. Linhas e Supefı́cies

1 Exemplos
Exemplo 1.1 - Uma Linha Recta em R2
Consideremos a linha recta em R2 definida por
M = {(x, y) ∈ R2 : y = x + 1}
Esta linha pode ser descrita de três formas distintas.
i) Conjunto de nı́vel - Consideremos a função F : R2 → R dada por
F (x, y) = x − y + 1
É uma função de classe C 1 que se anula precisamente sobre o conjunto M , ou seja
M = {(x, y) ∈ R2 : F (x, y) = 0}

A derivada de F , dada pela matriz


h i
∂F ∂F
 
DF (x, y) = ∂x ∂y = 1 −1

apresenta caracterı́stica igual a um em qualquer ponto (x, y) ∈ M .


Assim, dizemos que o conjunto M é o conjunto de nı́vel zero da função F .
Note-se que o vector n = (1, −1) gera o subespaço linear de R2 descrito por
P = {(x, −x) : x ∈ R} = {(x, y) ∈ R2 : y = −x}

É uma linha recta em R2 perpendicular a M tal como se mostra na figura 1.

y =x+1
y
y = −x

y=x
PSfrag replacements
t

x
n
M

Figura 1: A recta y = x + 1

ii) Gráfico - Consideremos a função f : R → R definida por


f (x) = x + 1
Facilmente se conclui que f é de classe C 1 e que M é o gráfico de f . De facto,
M = {(x, x + 1) : x ∈ R} = {(x, f (x)) : x ∈ R}

Sendo M o gráfico de f , em cada ponto (x, f (x)) o declive da tangente a M é dado pela
derivada f 0 (x) = 1. Portanto, a cada ponto (x, f (x)) ∈ M podemos associar o vector
t = (1, f 0 (x)) = (1, 1) que determina a direcção tangente a M nesse ponto, tal como se
mostra na figura 1.

1
iii) Parametrização - Seja g : R → R2 dada por
g(x) = (x, x + 1)
Trata-se de uma função de classe C 1 . Facilmente se verifica que g é injectiva e que o conjunto
M é a imagem da função g, ou seja,
M = {(x, x + 1) : x ∈ R} = {g(x) : x ∈ R} = g(R)

Assim, g estabelece uma bijecção entre M e R.


A derivada de g, dada pela matriz
   
1 1
Dg(x) = =
f 0 (x) 1
apresenta caracterı́stica igual a um.
Diz-se que a função g é uma parametrização de M com parâmetro x e que M tem dimensão
um.
Note-se que o vector t = Dg(x) = (1, 1) é ortogonal ao vector DF (x, y) = (1, −1) definido
acima. Para além disso, o subespaço linear gerado pelo vector t = Dg(x) = (1, 1) é a linha
recta dada pela equação y = x que é paralela (tangente) à linha M tal como se mostra na
figura 1.
Exemplo 1.2 - Uma circunferência em R2
Consideremos a circunferência de raio um e centro na origem de R2
M = {(x, y) ∈ R2 : x2 + y 2 = 1}
i) Conjunto de nı́vel - A circunferência M pode ser descrita como o conjunto de nı́vel zero
de uma função de classe C 1 . De facto, seja F : R2 → R dada por
F (x, y) = x2 + y 2 − 1

Trata-se de uma função de classe C 1 em R2 e tal que


M = {(x, y) : F (x, y) = 0}

Sendo F de classe C 1 , a sua derivada


h i
∂F ∂F
 
DF (x, y) = ∂x ∂y = 2x 2y

apresenta caracterı́stica igual a um em M . Note-se que o ponto (0, 0) não pertence à cir-
cunferência M .
√ √ √ √ √ √
Consideremos o ponto ( 22 , 22 ) ∈ M . Então o vector n = DF ( 22 , 22 ) = ( 2, 2) gera o
subespaço linear de R2 dado por
{λ(1, 1) : λ ∈ R}
que coincide com a linha recta dada pela equação y = x tal como se mostra na figura 2.
ii) Gráfico - Podemos também descrever a circunferência M como a união de gráficos de
funções de classe C 1 . Consideremos as funções fi :] − 1, 1[→ R ; i = 1, 2, 3, 4, definidas da
forma seguinte
p
f1 (x) = 1 − x2
p
f2 (x) = − 1 − x2
p
f3 (y) = 1 − y2
p
f4 (y) = − 1 − y 2

2
y y=x
y = −x
n

t
PSfrag replacements
M
1 x

Figura 2: A circunferência x2 + y 2 = 1

Estas funções são de classe C 1 e, se definirmos os conjuntos Mi , i = 1, 2, 3, 4, da forma


seguinte
p
M1 = M ∩ {(x, y) ∈ R2 : y > 0} = {(x, 1 − x2 ) : x ∈] − 1, 1[}
p
M2 = M ∩ {(x, y) ∈ R2 : y < 0} = {(x, − 1 − x2 ) : x ∈] − 1, 1[}
p
M3 = M ∩ {(x, y) ∈ R2 : x > 0} = {( 1 − y 2 , y) : y ∈] − 1, 1[}
p
M4 = M ∩ {(x, y) ∈ R2 : x < 0} = {(− 1 − y 2 , y) : y ∈] − 1, 1[}
então, a circunferência M é a união dos gráficos das funções f i , i = 1, 2, 3, 4, ou seja
M = M 1 ∪ M2 ∪ M3 ∪ M4

iii) Parametrização - Sejam gi :] − 1, 1[→ R2 as funções dadas por


p
g1 (x) = (x, 1 − x2 ) = (x, f1 (x))
p
g2 (x) = (x, − 1 − x2 ) = (x, f2 (x))
p
g3 (y) = ( 1 − y 2 , y) = (f3 (y), y)
p
g4 (y) = (− 1 − y 2 , y) = (f4 (y), y)

Estas funções são de classe C 1 , injectivas e tais que


M1 = M ∩ {(x, y) ∈ R2 : y > 0} = g1 (] − 1, 1[)
M2 = M ∩ {(x, y) ∈ R2 : y < 0} = g2 (] − 1, 1[)
M3 = M ∩ {(x, y) ∈ R2 : x > 0} = g3 (] − 1, 1[)
M4 = M ∩ {(x, y) ∈ R2 : x < 0} = g4 (] − 1, 1[)
o que significa que cada uma das semicircunferências Mi , i = 1, 2, 3, 4, é a imagem de
cada uma das funções gi , i = 1, 2, 3, 4, respectivamente. Portanto, cada uma das funções
gi , i = 1, 2, 3, 4, estabelece uma bijecção entre cada um dos pedaços Mi , i = 1, 2, 3, 4, e o
intervalo aberto ]−1, 1[. A cada um dos conjuntos Mi chamamos vizinhança de coordenadas.
Facilmente se verifica que cada matriz Dgi tem caracterı́stica igual a um. Assim, as funções
gi parametrizam M .
√ √
2 2
Como exemplo, consideremos o ponto ( 2 , 2 ) ∈ M1 e a parametrização g1 . Note-se que
√ √ √
( 22 , 22 ) = g1 ( 22 ). A derivada
√  
2 1
Dg1 ( )=
2 −1

3
apresenta caracterı́stica igual a um.

2
Designemos por T o espaço gerado pelo vector t = Dg1 ( 2 ) = (1, −1), ou seja,

T = {(x, −x) : x ∈ R}
√ √
2 2
e consideremos a linha recta paralela a T e que passa pelo ponto ( 2 , 2 ).
Da observação
√ √
da figura 2, constatamos que esta linha recta é tangente à circunferência no
ponto ( 22 , 22 ).
√ √ √ √ √
Note-se também que o vector t = Dg1 ( 22 ) = (1, −1) e o vector n = DF ( 22 , 22 ) = ( 2, 2)
são ortogonais.

***
A simetria apresentada pela circunferência M leva-nos a considerar coordenadas polares (r, θ)
em R2 .
Sendo r2 = x2 + y 2 , a circunferência M pode ser descrita pela equação r = 1.
Consideremos as funções γ1 :]0, 2π[→ R2 e γ2 :] − π, π[→ R2 definidas por

γ1 (θ) = (cos θ, sen θ)


γ2 (θ) = (cos θ, sen θ)

São funções de classe C 1 , injectivas e tais que a união das respectivas imagens é a circunferência
M

M \ {(1, 0)} = γ1 (]0, 2π[)


M \ {(−1, 0)} = γ1 (] − π, π[)

Note-se que a derivada de qualquer uma destas duas funções é dada pelo vector (− sen θ, cos θ)
que não se anula porque
√ √
sen2 θ + cos2 θ = 1, ou seja, as funções γ1 , γ2 parametrizam M .
2 2
Para o ponto ( 2 , 2 ), temos θ = π/4 e
√ √
π 2 2
Dγ1 ( ) = (− , )
4 2 2
√ √
2 2
que gera o subespaço de R2 dado pela equação y = −x e que é tangente a M no ponto ( 2 , 2 ).

Exemplo 1.3 - Uma Parábola em R2


Seja M a parábola em R2 dada por

M = {(x, y) ∈ R2 : y = x2 }

i) Conjunto de nı́vel - Seja F :] − 1, 1[×R → R a função definida por

F (x, y) = y − x2

Trata-se de uma função de classe C 1 tal que

M = {(x, y) ∈ R2 : y = f (x)} = {(x, x2 ) : x ∈] − 1, 1[}


= {(x, y) : F (x, y) = 0}

A derivada de F h i
∂F ∂F
 
DF (x, y) = ∂x ∂y = −2x 1
apresenta caracterı́stica um, ou seja, M é o conjunto de nı́vel zero de F .
Por exemplo, no ponto (0, 0) a derivada n = DF (0, 0) = (0, 1) gera o subespaço que coincide
com o eixo y tal como se mostra na figura 3.

4
y

PSfrag replacements n

M
t
−1 1 x

Figura 3: A parábola y = x2

ii) Gráfico - Consideremos a função de classe C 1 , f : ] − 1, 1[→ R dada por

f (x) = x2

Então M é o gráfico de f

M = {(x, y) ∈ R2 : y = f (x)} = {(x, x2 ) : x ∈] − 1, 1[}

Sendo f de classe C 1 , a sua derivada f 0 (x) dá o declive da recta tangente ao gráfico de f
em x, ou seja, a recta tangente a M no ponto (x, f (x)) é paralela à linha recta gerada pelo
vector (1, f 0 (x)).
Por exemplo, no ponto (0, 0) o vector t = (1, f 0 (x)) = (1, 0) gera o eixo x que, de facto, é
tangente a M no ponto (0, 0) como se pode constatar da observação da figura 3.
iii) Parametrização - Consideremos a função g : ] − 1, 1[→ R dada por

g(x) = (x, x2 ) = (x, f (x))

Trata-se de uma função de classe C 1 e tal que

M = {(x, x2 ) : x ∈] − 1, 1[ } = g (] − 1, 1[)

Por outro lado, se x1 6= x2 então g(x1 ) 6= g(x2 ). Portanto g é injectiva, ou seja, a função g
estabelece uma bijecção entre M e o intervalo ] − 1, 1[ em R.
A derivada    
1 1
Dg(x) = =
f 0 (x) 2x
tem caracterı́stica um, ou seja, g é uma parametrização de M .
Note-se que
Dg(x) = (1, f 0 (x))
e, portanto, o vector Dg(x) tem a direcção da tangente a M no ponto (x, f (x)) = g(x).
Por exemplo, para x = 0, a derivada

t = Dg(0) = (1, 0)

gera o eixo x que é tangente a M no ponto (0, 0) = g(0) tal como se constata na figura 3.

5
Exemplo 1.4 - Uma Linha Recta em R3
Consideremos a linha recta M em R3 definida pelas equações

x = y
z = 1

i) Conjunto de nı́vel - Seja F : R3 → R2 dada por

F (x, y, z) = (x − y, z − 1)

Trata-se de uma função de classe C 1 e tal que

M = {(x, y, z) : F (x, y, z) = (0, 0)}

A derivada
∂F1 ∂F1 ∂F1
 
 
∂x ∂y ∂z 1 −1 0
DF (x, y, z) =  =
∂F2 ∂F2 ∂F2 0 0 1
∂x ∂y ∂z

é uma matriz com caracterı́stica igual a dois porque os vectores n1 = (1, −1, 0) , n2 = (0, 0, 1)
que constituem as suas duas linhas são linearmente independentes, ou seja, M é o conjunto
de nı́vel (0, 0) de F .
Note-se que
M = {(x, y, z) = (x, x, 1) = x(1, 1, 0) + (0, 0, 1) : x ∈ R}
e, portanto, os vectores n1 = (1, −1, 0) , n2 = (0, 0, 1) são perpendiculares ao vector (1, 1, 0),
ou seja, perpendiculares a M como se mostra na figura 4.

PSfrag replacements
z=1
y=x 1
0
n2

−1
n1 1 y
1 t
x

Figura 4: A recta y = x , z = 1

ii) Gráfico - Seja f : R → R2 definida por

f (x) = (x, 1)

Trata-se de uma função de classe C 1 e tal que

M = {(x, x, 1) = (x, f (x)) : x ∈ R}

ou seja, M é o gráfico de f .
O vector t = (1, f 0 (x)) = (1, 1, 0) apresenta a direcção da tangente a M tal como se
apresenta na figura 4.

6
iii) Parametrização - Consideremos a função g : R → R3 dada por
g(x) = (x, x, 1)

Esta função é de classe C 1 , injectiva e


M = {(x, y, z) = (x, x, 1) = g(x) : x ∈ R} = g(R)
Portanto, g estabelece uma bijecção entre R e M .
A derivada  
1
Dg(x) =  1 
0
tem caracterı́stica igual a um. O vector t = (1, 1, 0) gera um subespaço de dimensão um em
R3 dado pelas equações x = y ; z = 0 e que é tangente a M como se mostra na figura 4.
Exemplo 1.5 Um Plano em R3
Seja P o plano em R3 definido pela equação
x+y+z =3
e representado na figura 5.
i) Conjunto de nı́vel - Consideremos a função F : R3 → R dada por
F (x, y, z) = x + y + z − 3

Então F é de classe C 1 e
P = {(x, y, z) ∈ R3 : F (x, y, z) = 0}
ou seja, P é o conjunto de nı́vel zero da função F .
A derivada h i
∂F ∂F ∂F
 
DF (x, y, z) = ∂x ∂y ∂z = 1 1 1
tem caracterı́stica igual a um.

z
n
3

t2
t1
PSfrag replacements
P

3 y

x 3

Figura 5: O plano x + y + z = 3

Note-se que o vector n = DF (x, y, z) = (1, 1, 1) é ortogonal ao plano P . De facto, o plano


P pode ser descrito da forma seguinte
P = {(x, y, 3 − x − y) : x, y ∈ R}

= {(0, 0, 3) + x(1, 0, −1) + y(0, 1, −1) : x, y ∈ R}

7
e os vectores t1 = (1, 0, −1) ; t2 = (0, 1, −1) são ortogonais ao vector DF (x, y, z) = (1, 1, 1)
como se mostra na figura 5.
ii) Gráfico - Da equação x + y + z = 3 e resolvendo em ordem a z obtemos z = 3 − x − y.
Então consideremos a função f : R2 → R definida por

f (x, y) = 3 − x − y

Trata-se de uma função de classe C 1 e o respectivo gráfico é o conjunto P

P = {(x, y, z) : z = 3 − x − y} = {(x, y, f (x, y)) : x, y ∈ R}

Da interpretação geométrica da noção de derivada sabemos que os vectores


∂f ∂f
t1 = (1, 0, ) = (1, 0, −1) ; t2 = (0, 1, ) = (0, 1, −1)
∂x ∂y
determinam o plano tangente a P em qualquer um dos seus pontos.
iii) Parametrização - Seja g : R2 → R3 a função dada por

g(x, y) = (x, y, 3 − x − y) = (x, y, f (x, y))

Esta função é de classe C 1 , injectiva e tal que g(R2 ) = P . Portanto, a função g estabelece
uma bijecção entre R2 e P .
A derivada  
1 0
Dg(x, y) =  0 1 
−1 −1
tem duas colunas linearmente independentes, ou seja, tem caracterı́stica igual a dois.
Note-se que estes dois vectores são ortogonais ao vector DF (x, y, z) = (1, 1, 1).

Exemplo 1.6 - Uma circunferência em R3


Consideremos a circunferência M em R3 definida pelas equações

z = 0
x + y2
2
= 1

e apresentada na figura 6.

i) Conjunto de nı́vel - Seja F : R3 → R2 dada por

F (x, y, z) = (z, x2 + y 2 − 1)

Trata-se de uma função de classe C 1 e tal que

M = {(x, y, z) : F (x, y, z) = (0, 0)}

o que significa que M é o conjunto de nı́vel (0, 0) de F .


A derivada  
0 0 1
DF (x, y, z) =
2x 2y 0
tem caracterı́stica igual a dois porque x e y não podem ser simultaneamente nulos. Note-se
que em M se tem x2 + y 2 = 1.
No ponto (0, 1, 0) as linhas da matriz DF (0, 1, 0) são os vectores n1 = (0, 0, 1) e n2 =
(0, 2, 0) que são normais à circunferência, como se mostra na figura 6.

8
z

n1

PSfrag replacements
0 n2
y

M
x

Figura 6: A Circunferência z = 0 ; x2 + y 2 = 1


ii) Gráfico -√ Notemos que da equação x2 + y 2 = 1 obtemos yp= 1 − x2 desde que y > 0
ou y =p− 1 − x2 desde que y < 0. Do mesmo modo, x = 1 − y 2 desde que x > 0 ou
x = − 1 − y 2 desde que x < 0. Assim, a circunferência M é descrita pela união

M = M 1 ∪ M2 ∪ M3 ∪ M4

em que
p
M1 = {(x, y, z) : y = 1 − x2 ; z = 0 ; −1 < x < 1} = M ∩ {y > 0}
p
M2 = {(x, y, z) : y = − 1 − x2 ; z = 0 ; −1 < x < 1} = M ∩ {y < 0}
p
M3 = {(x, y, z) : x = 1 − y 2 ; z = 0 ; −1 < y < 1} = M ∩ {x > 0}
p
M4 = {(x, y, z) : x = − 1 − y 2 ; z = 0 ; −1 < y < 1} = M ∩ {x < 0}

ou seja, M é a união de quatro gráficos de funções de classe C 1 .


iii) Parametrização - Notemos que
p 
M1 = { x, 1 − x2 , 0 : −1 < x < 1}
p 
M2 = { x, − 1 − x2 , 0 : −1 < x < 1}
p 
M3 = { 1 − y 2 , y, 0 : −1 < y < 1}
p 
M4 = { − 1 − y 2 , y, 0 : −1 < y < 1}

Assim, sejam as funções


p 
g1 (x) = x, 1 − x2 , 1 ; −1 < x < 1
p 
g2 (x) = x, − 1 − x2 , 1 ; −1 < x < 1
p 
g3 (y) = 1 − y 2 , y, 1 ; −1 < y < 1
p 
g4 (y) = − 1 − y 2 , y, 1 ; −1 < y < 1

São funções de classe C 1 , injectivas e tais que

Mi = gi (] − 1, 1[) ; i = 1, 2, 3, 4

Portanto, cada função gi estabelece uma bijecção entre o intervalo aberto ] − 1, 1[ e cada Mi
com i = 1, 2, 3, 4.

9
Cada uma das derivadas
1 1
   

Dg1 (x) =  √ −x  ; Dg2 (x) =  √ x 


1−x2 1−x2
0 0

√−y √y
   
1−y 2 1−y 2
Dg3 (y) =   ; Dg4 (y) = 
   
1 1 
0 0
tem caracterı́stica igual a um, ou seja, as funções gi parametrizam M .

Exemplo 1.7 - Uma esfera em R3


Consideremos a superfı́cie esférica em R3 centrada na origem e de raio um dada por

S 2 = {(x, y, z) : x2 + y 2 + z 2 = 1}

e que se representa na figura 7.

t2
PSfrag replacements t1 y

S2

Figura 7: A esfera x2 + y 2 + z 2 = 1

i) Conjunto de nı́vel - Seja F : R2 → R definida por

F (x, y, z) = x2 + y 2 + z 2 − 1

Esta função é de classe C 1 e tal que

S 2 = {(x, y, z) : F (x, y, z) = 0}

ou seja, a esfera S 2 é o conjunto de nı́vel zero de F .


A derivada  
DF (x, y, z) = 2x 2y 2z
tem caracterı́stica igual a um porque o vector (2x, 2y, 2z) não pode ser nulo. De facto, em
S 2 temos x2 + y 2 + z 2 = 1.
Note-se também que o vector (2x, 2y, 2z) tem direcção radial, ou seja, é ortogonal a S 2 no
ponto (x, y, z) ∈ S 2 .

10
ii) Gráfico - A equação x2 + y 2 + z 2 = 1 pode ser resolvida em ordem a qualquer uma
das
p variáveis como função das outras duas.p Por exemplo, desde que x > 0, temos x =
1 − y 2 − z 2 e para x < 0 obtemos x = − 1 − y 2 − z 2 . Assim, consideremos as funções
p
f1 (x, y) = 1 − x 2 − y 2 ; x2 + y 2 < 1
p
f2 (x, y) = − 1 − x2 − y 2 ; x2 + y 2 < 1
p
f3 (x, z) = 1 − x 2 − z 2 ; x2 + z 2 < 1
p
f4 (x, z) = − 1 − x2 − z 2 ; x2 + z 2 < 1
p
f5 (y, z) = 1 − y2 − z 2 ; y2 + z 2 < 1
p
f6 (y, z) = − 1 − y 2 − z 2 ; y 2 + z 2 < 1

e os respectivos gráficos
p
G1 = S 2 ∩ {z > 0} = {(x, y, 1 − x2 − y 2 ) ; x2 + y 2 < 1}
p
G2 = S 2 ∩ {z < 0} = {(x, y, − 1 − x2 − y 2 ) ; x2 + y 2 < 1}
p
G3 = S 2 ∩ {y > 0} = {(x, 1 − x2 − z 2 , z) ; x2 + z 2 < 1}
p
G4 = S 2 ∩ {y < 0} = {(x, − 1 − x2 − z 2 , z) ; x2 + z 2 < 1}
p
G5 = S 2 ∩ {x > 0} = {( 1 − y 2 − z 2 , y, z) ; y 2 + z 2 < 1}
p
G6 = S 2 ∩ {x < 0} = {(− 1 − y 2 − z 2 , y, z) ; y 2 + z 2 < 1}

Então, a esfera S 2 á união de seis gráficos de funções de classe C 1 .


iii) Parametrização - Sejam as funções
p
g1 (x, y) = (x, y, 1 − x 2 − y 2 ) ; x2 + y 2 < 1
p
g2 (x, y) = (x, y, − 1 − x2 − y 2 ) ; x2 + y 2 < 1
p
g3 (x, z) = (x, 1 − x2 − z 2 , z) ; x2 + z 2 < 1
p
g4 (x, z) = (x, − 1 − x2 − z 2 , z) ; x2 + z 2 < 1
p
g5 (y, z) = ( 1 − y 2 − z 2 , y, z) ; y 2 + z 2 < 1
p
g6 (y, z) = (− 1 − y 2 − z 2 , y, z) ; y 2 + z 2 < 1

Estas funções são de classe C 1 , injectivas e as suas imagens coincidem, respectivamente,


com os conjuntos Gi , i = 1, 2, 3, 4, 5, 6. Portanto, cada uma das funções gi , i = 1, 2, 3, 4, 5, 6
estabelece uma bijecção (identificação) entre estes conjuntos e o disco de raio um e centro
na origem de R2 .
A derivada de cada uma das funções gi é uma matriz com três linhas e duas colunas e com
caracterı́stica igual a dois, ou seja, as duas colunas são vectores linearmente independentes.
Por exemplo, se considerarmos o ponto (0, 0, 1), então, g1 (0, 0) = (0, 0, 1) e a respectiva
derivada  
1 0
Dg1 (0, 0) =  0 1 
0 0
tem duas colunas t1 = (1, 0, 0) e t2 = (0, 1, 0) linearmente independentes e que são ortogo-
nais ao vector DF (0, 0, 1) = (0, 0, 2) (ver figura 7).
Note-se que o plano gerado pelos vectores t1 e t2 e que passa pelo ponto (0, 0, 1) é dado
pela equação z = 1 e é tangente a S 2 no ponto (0, 0, 1).

***

11
Devido à sua simetria, a esfera S 2 pode ser descrita em coordenadas esféricas (r, θ, φ) através
da equação
r=1
Consideremos o conjunto
T =]0, 2π[×]0, π[
3
e as funções g1 , g2 : T → R definidas por

g1 (θ, φ) = (sen φ cos θ, sen φ sen θ, cos φ)


g2 (θ, φ) = (cos φ, sen φ cos θ, sen φ sen θ)
g3 (θ, φ) = (sen φ sen θ, cos φ, sen φ cos θ)

Então, as funções g1 , g2 são de classe C 1 , injectivas e se definirmos

G1 = S 2 \ {(x, y, z) : x ≥ 0 ; y = 0} = g1 (T )
G2 = S 2 \ {(x, y, z) : y ≥ 0 ; z = 0} = g2 (T )
G3 = S 2 \ {(x, y, z) : z ≥ 0 ; x = 0} = g3 (T )

cada uma das funções g1 , g2 , g3 estabelece uma bijecção entre o conjunto T ⊂ R2 e G1 , G2 , G3 ,


respectivamente.
A derivada
 ∂g1 ∂g1 
∂θ ∂φ  
  − sen φ sen θ cos φ cos θ
 ∂g2 ∂g2  
Dg1 (θ, φ) =  ∂θ ∂φ  = sen φ cos θ cos φ sen θ 
  0 − sen φ
∂g3 ∂g3
∂θ ∂φ

tem caracterı́stica igual a dois, ou seja as colunas da matriz Dg são linearmente independentes
porque no intervalo ]0, π[ temos sen φ 6= 0. Do mesmo modo se conclui para g2 e g3 ou seja,
g1 , g2 , g3 parametrizam S 2 .

Exemplo 1.8 - Um Parabolóide em R3


Consideremos o parabolóide dado por

P = {(x, y, z) ∈ R3 : z = x2 + y 2 ; z < 1}

e que se representa na figura 8.

1
n
P
PSfrag replacements

Figura 8: O parabolóide z = x2 + y 2 ; z < 1

12
i) Conjunto de nı́vel - A equação z = x2 + y 2 sugere que podemos considerar a função

F (x, y, z) = z − x2 − y 2

definida no subconjunto aberto de R3

S = {(x, y, z) ∈ R3 : x2 + y 2 < 1 ; z < 1}

Então, a função F : S → R é de classe C 1 e P é o conjunto de nı́vel zero de F :

P = {(x, y, z) ∈ R3 : F (x, y, z) = 0}

A derivada  
DF (x, y, z) = −2x −2y 1
tem caracterı́stica igual a um.
Na figura 8 representa-se o vector n = DF (0, 0, 0) = (0, 0, 1) .
ii) Gráfico - O conjunto P pode também ser descrito como o gráfico de uma função de classe
C 1 . De facto, seja f : T → R em que

T = {(x, y) ∈ R2 : x2 + y 2 < 1}

e definida por
f (x, y) = x2 + y 2

Portanto
P = {(x, y, x2 + y 2 ) : (x, y) ∈ T } = {(x, y, f (x, y)) : (x, y) ∈ T }

Da interpretação geométrica da derivada, concluimos que os vectores (1, 0, ∂f ∂f


∂x ) ; (0, 1, ∂y )
determinam o plano tangente a P que passa pelo ponto (x, y, f (x, y)) ∈ P .
iii) Parametrização - Consideremos a função g : T → R3 dada por

g(x, y) = (x, y, x2 + y 2 ) = (x, y, f (x, y))

É uma função de classe C 1 , injectiva e tal que

g(T ) = P

ou seja, a função g estabelece uma bijecção entre T ⊂ R2 e P .


A derivada  
1 0
Dg(x, y) =  0 1 
2x 2y
é uma matriz com duas colunas linearmente independentes.
Note-se que as colunas desta matriz são ortogonais à linha da matriz DF (x, y, z).

13
2 Teorema da Função Implı́cita
No que se segue, dados dois números inteiros n, p ∈ N com p < n, usaremos a seguinte decom-
posição de Rn
Rn = Rp × Rn−p
e cada vector em Rn será representado na forma (x, y) em que x = (x1 , x2 , . . . , xp ) ∈ Rp e
y = (y1 , y2 , . . . , yn−p ) ∈ Rn−p .
Tal como nos exemplos anteriores, consideremos subconjuntos de Rn definidos de uma das
três formas seguintes:

i) Conjunto de nı́vel - Seja M ⊂ Rn um conjunto e suponhamos que para cada um dos seus
pontos existe uma vizinhança V ⊂ Rn e uma função F : S → Rn−p de classe C 1 definida
num aberto S ⊂ Rn tais que

M ∩ V = {(x, y) ∈ Rn : F (x, y) = 0}

Para além disso, para cada ponto (x, y) ∈ M ∩ V , a derivada DF (x, y) é uma matriz com
(n − p) linhas linearmente independentes, ou seja a sua caracterı́stica é igual a (n − p).
Ao conjunto M ∩ V definido desta forma chamamos conjunto de nı́vel zero da função F e o
conjunto M é uma união de conjuntos de nı́vel.
Trata-se de um conjunto definido por (n − p) equações em Rn .
Em R2 temos apenas um caso, em que p = 1, ou seja, M ∩ V é definido por uma equação
apenas, F (x, y) = 0.
Em R3 há dois casos a considerar:
a) n − p = 1 e M ∩ V é definido por uma equação, F (x, y, z) = 0.
b) n − p = 2 e M ∩ V é definido por duas equações

F (x, y, z) = (F1 (x, y, z), F2 (x, y, z)) = (0, 0)

ii) Gráfico - Suponhamos que para cada ponto de M existe uma vizinhança V ⊂ Rn e uma
função f : D → Rn−p de classe C 1 definida num aberto D ⊂ Rp tais que

M ∩ V = {(x, y) ∈ Rn : y = f (x) ; x ∈ D} = {(x, f (x)) : x ∈ D}

Assim, o conjunto M ∩ V é o gráfico da função f e M é uma união de gráficos.


iii) Parametrização - Suponhamos que para cada ponto de M existe uma vizinhança V ⊂ R n
e uma função g : T → Rn de classe C 1 definida num aberto T ⊂ Rp tais que

M ∩ V = {(x, y) ∈ Rn : (x, y) = g(t) ; t ∈ T } = {g(t) : t ∈ T }

Suponhamos também que a derivada Dg(t) tem caracterı́stica igual a p , ou seja, as p


colunas da matriz Dg(t) são linearmente independentes.
À função g chamamos parametrização de M ∩ V com p parâmetros t ∈ T . A M ∩ V
chamamos vizinhança de coordenadas e M é uma união de vizinhanças de coordenadas.

***
Em todos os exemplos analisados foi possı́vel relacionar estas três descrições de M através da
resolução directa das equações envolvidas em cada caso. Da equação

F (x, y) = 0

14
resolvendo em ordem a y, obtemos
y = f (x)
e, conhecendo a função f , define-se a parametrização g da forma seguinte

g(x) = (x, f (x))

No entanto, a resolução de equações nem sempre é fácil e não existem métodos gerais de
resolução de equações não lineares. O Teorema da Função Implı́cita garante, sob certas condições,
a existência e a regularidade das soluções de tais equações.

Teorema 2.1 Seja S ⊂ Rn um aberto e F : S → Rn−p uma função de classe C 1 e seja (a, b) ∈ S
um ponto tal que F (a, b) = 0 e

det [Dy F (a, b)] 6= 0


Então, existe uma vizinhança V de (a, b) em R n , uma vizinhança D de a em Rp e uma função
f : D → Rn−p de classe C 1 com b = f (a) e tal que

F (x, y) = 0 ⇐⇒ y = f (x) ; em V

***
A demonstração deste teorema pode ser vista em [1, 2].

***
Nota 2.1 Da equivalência

F (x, y) = 0 ⇐⇒ y = f (x) ; em V

obtemos a equação
F (x, f (x)) = 0
que permite calcular a derivada da funccão f . De facto, derivando em x obtemos

Dx F (x, f (x)) + Dy F (x, f (x))Df (x) = 0

e, portanto
−1
Df (x) = − [Dy F (x, f (x))] Dx F (x, f (x))
Note-se que o Teorema da Função Implı́cita não oferece um método para a determinação da
função f a partir da equação F (x, y) = 0. No entanto, a garantia de existência de tal função,
bem como a sua regularidade, bastam para calcular a respectiva derivada.

Nota 2.2 É de salientar que a condição det Dy F (a, b) 6= 0 significa que as linhas da matriz
DF (a, b) são linearmente independentes.
Portanto, um conjunto definido por um sistema de (n−p) equações pode ser visto, localmente,
como o gráfico de uma função.

Nota 2.3 Suponhamos que g : T → Rn é uma parametrização de uma vizinhança de coordenadas


M ∩ V com T ⊂ Rp , sendo g(t0 ) = (a, b). Sabendo que a caracterı́stica da matriz derivada Dg(t0 )
é igual a p, sem perda de generalidade, suponhamos que g(t) = (h(t), k(t)), em que h : T → R p
e k : T → Rn−p , é tal que a caraterı́stica da matriz Dh(t0 ) é igual a p. Assim, pelo Teorema

15
da Função Inversa, existe uma vizinhança U de t0 e uma vizinhança D de a tais que a equação
x = h(t) tem solução única t = h−1 (x). Portanto, da equação y = k(t) concluimos que

y = k(h−1 (x))

e definindo f (x) = k(h−1 (x)) obtemos

(x, y) = g(t) ⇐⇒ y = f (x) , em M ∩ V

Portanto, as descrições de M ∩ V como conjunto de nı́vel zero da função F ou como gráfico da


função f ou através da parametrização g são equivalentes.
A um conjunto M ⊂ Rn descrito de uma destas três formas chamamos variedade de dimensão
p.
Note-se que a dimensão é igual ao número de parâmetros necessários para descrever M .

2.1 Exemplos
a) Consideremos a equação
x2 y + sen(x + y) = 0

Note-se que não é fácil decidir sobre se esta equação define uma das variáveis como função
da outra.
Seja F : R2 → R a função de classe C 1 dada por

F (x, y) = x2 y + sen(x + y)

e consideremos o ponto (0, π). Então F (0, π) = 0 e

DF (0, π) = 2xy + cos(x + y) x2 + cos(x + y) x=0,y=π = −1 −1


   

Portanto, dado que ∂F


∂y (0, π) = −1 , existe uma vizinhança V de (0, π) , uma vizinhança U
da origem em R e uma função f : U → R de classe C 1 tal que f (0) = π e

F (x, y) = 0 ⇐⇒ y = f (x) ; em V

Para além disso, temos


∂F
(0, π) −1
f 0 (0) = − ∂F
∂x
=− = −1
∂y (0, π) −1

b) A equação
x3 z 2 − z 3 yx = 0
define implicitamente z como função de (x, y) em alguma vizinhança do ponto (1, 1, 1).
Seja F : R3 → R a função de classe C 1 definida por

F (x, y, z) = x3 z 2 − z 3 yx

Note-se que F (1, 1, 1) = 0. Sendo

DF (1, 1, 1) = 3x2 z 2 − z 3 y −z 3 x 2x3 z − 3z 2 yx x=1,y=1,z=1 = 2 −1 −1


   

e, portanto
∂F
(1, 1, 1) = −1
∂z

16
concluimos que existe uma vizinhança do ponto (1, 1, 1) em que a equação F (x, y, z) = 0
define implicitamente z como função de (x, y). Designemos por f (x, y) essa função. Então,
nessa vizinhança temos F (x, y, f (x, y)) = 0 e derivando em x , obtemos
∂F ∂F ∂f
+ =0
∂x ∂z ∂x
e, portanto
∂f 2
(1, 1) = − =2
∂x −1
Note-se que para o ponto (0, 0, 0) temos
 
DF (0, 0, 0) = 0 0 0
e, portanto nada podemos concluir através do teorema da função implı́cita.
No entanto, analisando a equação, obtemos
xz 2 (x − zy) = 0 ⇐⇒ x = 0 ∨ z = 0 ∨ x = zy
e, portanto, em torno da origem não é possı́vel exprimir nenhuma das variáveis como função
das outras.
c) O sistema de equações
xu + yvu2 = 2
xu3 + y 2 v 4 = 2
define implicitamente (u, v) como funções de (x, y) em torno do ponto (1, 1, 1, 1).
Consideremos a função F : R4 → R2 definida por
F (x, y, u, v) = (xu + yvu2 , xu3 + y 2 v 4 )

É uma função de classe C 1 tal que F (1, 1, 1, 1) = (2, 2) e a respectiva derivada no ponto
(1, 1, 1, 1) é dada por
u vu2 x + 2yvu yu2 1 1 3 1
" # " #
DF (1, 1, 1, 1) = =
u3 2yv 4 3xu2 4y 2 v 3 x=1,y=1,u=1,v=1 1 2 3 4
e, portanto  
3 1
det Duv F (1, 1, 1, 1) = det =9
3 4
O teorema da função implı́cita garante que localmente em torno do ponto (1, 1, 1, 1) temos
(u, v) = (u(x, y), v(x, y))
Derivando a função F em x , obtemos
∂u ∂v ∂u
x + u + y u2 + 2yvu = 0
∂x ∂x ∂x
∂u ∂v
3xu2 + u3 + 4y 2 v 3 = 0
∂x ∂x
ou seja, no ponto (1, 1, 1, 1) , temos o sistema
∂u ∂v
3 + = −1
∂x ∂x
∂u ∂v
3 +4 = −1
∂x ∂x
de onde concluimos
∂u 1
(1, 1) = −
∂x 3

17
3 Espaço Tangente e Espaço Normal
Seja M ∩ V uma vizinhança de coordenadas e seja (x, y) ∈ M ∩ V . Então, temos

F (x, y) = 0

e
(x, y) = g(t)
Portanto,
F (g(t)) = 0
e, por derivação
DF (g(t))Dg(t) = 0
o que significa que as linhas da matriz DF (x, y) são ortogonais às colunas da matriz Dg(t).
De seguida, veremos que as derivadas DF (x, y) e Dg(t) fornecem informação geométrica im-
portante sobre a variedade M , como sugerem os exemplos apresentados acima.
Seja z um ponto em M , v 6= 0 um vector em Rn e γ :] − , [→ Rn uma função de classe C 1 tal
que γ(t) ∈ M , ∀t ∈] − , [ e

γ(0) = z
γ 0 (0) = v

A um vector v ∈ Rn nestas condições chamamos vector tangente a M no ponto z. Note-se


que γ é um caminho regular e a respectiva imagem é uma linha sobre M .
Ao conjunto dos vectores tangentes a M no ponto z chamamos espaço tangente a M no
ponto z e passaremos a designá-lo pelo sı́mbolo Tz M .
Seja v um vector tangente a M no ponto z ∈ M . Então

F (γ(t)) = 0

e derivando obtemos
DF (γ(t))γ 0 (t) = 0
e para t = 0
DF (z)v = 0
que significa que o vector v é ortogonal ao espaço gerado pelas linhas da matriz DF (z).
Seja g : T → Rn , em que T ⊂ Rp , uma parametrização de uma vizinhança de coordenadas
M ∩ V do ponto z ∈ M , sendo z = g(t). Consideremos cada uma das p colunas da derivada Dg(t)
e que designaremos por D1 g(t), D2 g(t), . . . , Dp g(t), respectivamente.
Seja v = Di g(t) e consideremos a função definida num intervalo aberto de R contendo s = 0 e
dada por γ(s) = g(t + s~ ei ), em que e~i é o i-ésimo vector unitário da base canónica de Rn .
Então, γ é de classe C 1 e

γ(0) = g(t) = z ; γ 0 (0) = Di g(t) = v

o que significa que a coluna Di g(t) é um vector tangente a M no ponto z.

O espaço tangente a M no ponto z = g(t) é gerado pelas colunas da matriz Dg(t).

Por outro lado, o espaço gerado pelas colunas da matriz Dg(t) é ortogonal ao espaço gerado
pelas linhas da matriz DF (z).
Ao espaço dos vectores ortogonais ao espaço tangente a M no ponto z chamamos espaço
normal a M no ponto z e passaremos a designá-lo pelo sı́mbolo Tz M ⊥ . Sendo ortogonal ao
espaço tangente, tem dimensão (n − p).

18
O espaço normal a M no ponto z é gerado pelas linhas da matriz DF (z).

4 Aplicações
4.1 Extremos Condicionados. Exemplos
Consideremos, como exemplo, o problema de determinar o ponto pertencente à circunferência
de raio igual a um e centro na origem de R2 e que se encontra mais próximo do ponto (1, 1).
A circunferência é uma variedade de dimensão um, descrita pela equação x 2 + y 2 = 1 , ou seja
é o nı́vel zero da função F : R2 → R definida por

F (x, y) = x2 + y 2 − 1

O ponto de coordenadas (x, y) mais próximo de (1, 1) é certamente o que minimiza a distância
mútua, ou seja, minimiza a função f : R2 → R dada por

f (x, y) = (x − 1)2 + (y − 1)2

Portanto, o problema consiste em determinar os mı́nimos da função f (x, y) sujeitos à condição


de pertencerem à circunferência descrita pela equação F (x, y) = 0.
Note-se que f é de classe C 1 e que o seu único ponto de estacionaridade é o ponto (1, 1) que
não pertence à circunferência. Portanto, a determinação dos pontos de estacionaridade de f não
permite chegar à solução do problema.
Seja (a, b) o ponto de mı́nimo da função f e seja γ :] − , [→ R2 uma parametrização de um
arco da circunferência tal que
γ(0) = (a, b)
Assim, a função composta f ◦ γ :] − , [→ R2 deverá apresentar um mı́nimo em t = 0, ou
seja, teremos
Df (γ(0))γ 0 (0) = 0
Portanto, o vector Df (a, b) deve ser ortogonal ao vector γ 0 (0) que é tangente à circunferência
no ponto (a, b), ou, equivalentemente, o vector Df (a, b) deve pertencer ao espaço normal à
circunferência no ponto (a, b). Sabendo que o espaço normal à circunferência no ponto (a, b) é
gerado pelas linhas da matriz DF (a, b) , deve existir um escalar (multiplicador de Lagrange) λ
tal que
Df (a, b) = −λDF (a, b)
ou seja
D(f + λF )(a, b) = 0
Concluimos então que o ponto (a, b) com F (a, b) = 0 deve ser um ponto de estacionaridade
da função
g = f + λF

Portanto, para determinar o ponto (a, b) devemos resolver o sistema

Dg(a, b) = 0
(

F (a, b) = 0

A este procedimento chamamos método dos multiplicadores de Lagrange.

Para o nosso exemplo temos

g(x, y) = (x − 1)2 + (y − 1)2 + λ(x2 + y 2 − 1)

19
e, portanto
2(x − 1) + 2λx = 0
2(y − 1) + 2λy = 0
x2 + y 2 − 1 = 0
Para λ 6= 0 , x 6= 0 , y 6= 0 obtemos, das duas primeiras equações,
x−1 y−1
=
x y
ou seja x = y e, da terceira concluimos que
√ √
2 2
(a, b) = ( , )
2 2
Note-se que para λ = 0 obtemos (a, b) = (1, 1) que não pertence à circunferência.
***
Seja f (x, y) = y + x − 1 e consideremos o problema da determinação do máximo e mı́nimo
absolutos de f sobre o conjunto definido por x2 + y 2 ≤ 2.
Seja
D = {(x, y) ∈ R2 : x2 + y 2 ≤ 2}
Sendo D compacto e f contı́nua, sabemos que f tem máximo e mı́nimo absolutos em D .
Sobre o interior de D , os extremos de f podem ser determinados recorrendo aos pontos de
estacionaridade de f . Sobre a fronteira de D , ou seja, sobre a circunferência dada por F (x, y) =
x2 + y 2 − 2 = 0 devemos recorrer ao método dos multiplicadores de Lagrange.
Sendo
∂f
= 1
∂x
∂f
= −1
∂y
concluimos que f não tem pontos de estacionaridade.
Sobre a fronteira de D , consideremos o sistema
Dg(x, y) = 0
(

F (x, y) = 0
em que g(x, y) = f (x, y) + λF (x, y) e, portanto, temos
∂g
= 1 + 2λx = 0
∂x
∂g
= −1 + 2λy = 0
∂y
x2 + y 2 − 2 = 0
e, portanto
2λ(x − y) = 0 ⇐⇒ λ = 0 ∨ y = x
Da primeira equação concluimos que λ 6= 0 , ou seja, devemos ter y = x e, da terceira equação
obtemos os pontos
(−1, −1) , (1, 1)
e, portanto, um deles é o máximo absoluto e o outro é o mı́nimo absoluto de f em D.
Mas, f (−1, −1) = −3 ; f (1, 1) = 1 , ou seja, (−1, −1) é o mı́nimo absoluto e (1, 1) é o
máximo absoluto de f em D.

20
***
Consideremos o conjunto definido pelas equações
z = 1
2
y
x2 + = 1
4
e determinemos os pontos deste conjunto que se encontram mais próximos do ponto (0, 1, 0).
Assim, pretendemos minimizar a função
f (x, y, z) = x2 + (y − 1)2 + z 2
sujeita à condição
y2
F (x, y, z) = (z − 1, x2 + − 1) = (0, 0)
4
Como vimos acima, no ponto de mı́nimo, o vector Df (x, y, z) pertence ao espaço normal
à variedade definida por F (x, y, z) = (0, 0) . Sendo esse espaço gerado pelas linhas da matriz
DF (x, y, z) , devemos considerar o seguinte sistema
Dg(x, y, z) = 0
z−1 = 0
2y2
x + −1 = 0
4
em que
g(x, y, z) = f (x, y, z) + αF1 (x, y, z) + βF2 (x, y, z)
Então temos
2x + 2βx = 0
1
2(y − 1) + βy = 0
2
2z + α = 0
z−1 = 0
2
y
x2 + −1 = 0
4
Da primeira equação obtemos
x(1 + β) = 0 ⇐⇒ x = 0 ∨ β = −1
Para x = 0 , da quarta e da quinta equações obtemos os pontos (0, −2, 1) e (0, 2, 1).
Para β = −1 , da segunda equação obtemos
4 4
y= =
4+β 3
e da quinta equação √ √
5 4 5 4
( , , 1) ; (− , , 1)
3 3 3 3
Por outro lado
f (0, −2, 1) = 10
f (0, 2, 1) = 2

5 4 15
f( , , 1) =
√3 3 9
5 4 15
f (− , , 1) =
3 3 9

21
e, portanto, os pontos mais próximos são
√ √
5 4 5 4
( , , 1) ; (− , , 1)
3 3 3 3

4.2 Área de uma superfı́cie


Seja {e1 , e2 } uma base ortonormada em R2 e consideremos o paralelogramo determinado por
dois vectores {t1 , t2 }. É sabido, da Álgebra Linear, que a área do paralelogramo é dada pelo
determinante da matriz cujas colunas são os vectores t1 , t2 escritos na base {e1 , e2 } .
Por exemplo, considerando a base canónica em R2 , a área do paralelogramo definido pelos
vectores t1 = (2, 0) e t2 = (1, 1) é dada por
 
2 1
det =2
0 1

Consideremos dois vectores linearmente independentes {t1 , t2 } em R3 e o paralelogramo por


eles determinado. Note-se que este paralelogramo é um subconjunto do plano gerado pelos dois
vectores t1 e t2 . Seja P esse plano.
Pelo processo de ortogonalização de Gram-Schmidt aplicado a {t1 , t2 } obtemos uma base
ortonormada {e1 , e2 } de P da seguinte maneira:
t1
e1 =
|t1 |
v2
e2 =
|v2 |
em que

v2 = t2 − ht2 , e1 ie1

Note-se que hv2 , e1 i = 0 e, portanto

|v2 |2 = hv2 , t2 i = ht2 , t2 i − ht2 , e1 i2 = |t2 |2 − ht2 , e1 i2

Assim, podemos exprimir t1 e t2 na base ortonormada {e1 , e2 } , da seguinte forma

t1 = |t1 | e1
p
t2 = ht2 , e1 i e1 + |t2 |2 − ht2 , e1 i2 e2

ou seja,

t1 = |t1 | e1
s
ht2 , t1 i ht2 , t1 i2
t2 = e1 + |t2 |2 − e2
|t1 | |t1 |2

e, portanto, a área do paralelogramo definido por t1 e t2 é o determinante


 ht2 ,t1 i 
|t1 | |t1 | p
det  q  = |t1 |2 |t2 |2 − ht2 , t1 i2
|t2 |2 − ht|t2 ,t1 |12i
2
0

Por outro lado, seja ∆ a matriz cujas colunas são os vectores t1 e t2 . Então

ht1 , t1 i ht1 , t2 i
" #
t
det ∆ ∆ = = |t1 |2 |t2 |2 − ht2 , t1 i2
ht2 , t1 i ht2 , t2 i

22
√ Assim, concluimos que a área do paralelogramo determinado pelos vectores t 1 e t2 é dada por
det ∆t ∆.
Estas observações motivam a seguinte definição de área de uma variedade de dimensão 2
(superfı́cie) em R3 .

Seja M ⊂ R3 uma variedade de dimensão 2 e consideremos uma vizinhança de coordenadas M ∩ V


e seja g : T → R3 a respectiva parametrização. Então
Z p
vol2 (M ∩ V ) = det Dg(t)t Dg(t)dt
T

4.3 Integral de um Campo Escalar sobre uma Variedade


Seja S ⊂ Rn um aberto, M ⊂ S uma variedade de dimensão p e φ : S → R um campo
escalar. Seja M ∩ V uma vizinhança de coordenadas e g : T → Rn uma parametrização.

Define-se o integral do campo escalar φ sobre a vizinhança de coordenadas M ∩ V como sendo


o integral Z Z p
φ= φ(g(t)) det Dg(t)t Dg(t)dt
M ∩V T

De seguida apresentam-se casos de campos escalares com interesse nas aplicações em que M ⊂
R3 é uma superfı́cie dada por uma vizinhança de coordenadas com parametrização g : T → R 3
sendo g = (g1 , g2 , g3 ) .

a) Área: Seja φ = 1. Então, o integral de φ é a área de M


Z Z p
vol2 (M ) = φ= det Dg(t)t Dg(t)dt
M T

b) Massa: Suponhamos que M representa uma folha de um material com densidade de


massa por unidade de área φ. Então, o integral de φ é a massa de M
Z Z p
M= φ= φ(g(t)) det Dg(t)t Dg(t)dt
M T

c) Centro de Massa: Seja M uma folha de um material com densidade de massa α. Então,
o centro de massa de M é o ponto de coordenadas (x, y, z) determinadas por

1 1
Z Z p
x = xα = g1 (t)α(g(t)) det Dg(t)t Dg(t)dt
M M M T
1 1
Z Z p
y = yα = g2 (t)α(g(t)) det Dg(t)t Dg(t)dt
M M M T
1 1
Z Z p
z = zα = g3 (t)α(g(t)) det Dg(t)t Dg(t)dt
M M M T

d) Momento de Inércia relativo a uma linha recta: Seja L uma linha recta e M uma
folha de um material com densidade α. Então, o momento de inércia de M relativo a L é
o integral Z Z p
IL = αd2L = α(g(t))d2L (g(t)) det Dg(t)t Dg(t)dt
M T
em que dL designa a distância à linha L.

23
4.4 Exemplos
i) Consideremos a superfı́cie esférica de raio R e centrada na origem que designaremos por S 2 .

S 2 = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 = R2 }

Seja g : T → R3 a função dada por

g(θ, φ) = (R sen φ cos θ, R sen φ sen θ, R cos φ)

em que
T =]0, 2π[×]0, π[⊂ R2

Então g é uma função de classe C 1 , injectiva, cuja derivada


 
−R sen φ sen θ R cos φ cos θ
Dg(θ, φ) =  R sen φ cos θ R cos φ sen θ 
0 −R sen φ

tem caracterı́stica igual a dois e

g(T ) = S 2 \ {(x, y, z) ∈ S 2 : y = 0 ; x ≥ 0} = S 2 \ N

ou seja, g é uma parametrização de S 2 \ N .


Note-se que
R2 sen2 φ
 
0
Dg(θ, φ)t Dg(θ, φ) =
0 R2
e, portanto p
det Dg(θ, φ)t Dg(θ, φ) = R2 sen φ

Sendo N uma semicircunferência sobre S 2 , temos


Z p
vol2 (S 2 ) = vol2 (S 2 \ N ) = det Dg(θ, φ)t Dg(θ, φ)dθdφ
T
Z 2π Z π 
= R2 sen φdφ dθ
0
Z 0π
= 2πR2 sen φdφ
0
= 4πR2

ii) Consideremos a superfı́cie definida por

M = {(x, y, z) ∈ R3 : x2 + y 2 = z < 1}

Em coordenadas cilı́ndricas, M é descrita pela equação z = ρ2 .


Portanto, consideremos a função g : T → R3 definida por

g(ρ, θ) = (ρ cos θ, ρ sen θ, ρ2 )

em que
T =]0, 1[×]0, 2π[⊂ R2

Esta função é de classe C 1 , injectiva e a sua derivada


 
cos θ −ρ sen θ
Dg(ρ, θ) =  sen θ ρ cos θ 
2ρ 0

24
tem caracterı́stica igual a dois. Para além disso,
g(T ) = M \ {(x, y, z) ∈ M : x ≥ 0 ; y = 0} = M \ N

Portanto, a função g é uma parametrização de M \ N .


Note-se que
1 + 4ρ2
 
t 0
Dg(ρ, θ) Dg(ρ, θ) =
0 ρ2
e, portanto, p p
det Dg(ρ, θ)t Dg(ρ, θ) = ρ 1 + 4ρ2
Sendo N uma linha sobre M , temos,
Z p
vol2 (M ) = vol2 (M \ N ) = det Dg(ρ, θ)t Dg(ρ, θ)dρdθ
T
Z 2π Z 1 p 
= 2
ρ 1 + 4ρ dρ dθ
0 0
1
π
Z p
= 12ρ 1 + 4ρ2 dρ
6 0
π 3/2
= (5 − 1)
6
iii) Seja C a superfı́cie cónica definida por
p
C = {(x, y, z) ∈ R3 : 0 < x2 + y 2 = z < 1}

Em coordenadas cilı́ndricas C é descrita pela equação z = ρ e, portanto, tal como no


exemplo anterior, consideremos a função g : T → R3 definida por
g(ρ, θ) = (ρ cos θ, ρ sen θ, ρ)
em que
T =]0, 1[×]0, 2π[⊂ R2
Esta função é de classe C 1 , injectiva e a sua derivada
 
cos θ −ρ sen θ
Dg(ρ, θ) =  sen θ ρ cos θ 
1 0
tem caracterı́stica igual a dois. Para além disso,
g(T ) = M \ {(x, y, z) ∈ M : x ≥ 0 ; y = 0} = M \ N

Portanto, a função g é uma parametrização de M \ N .


Note-se que √
det Dg(ρ, θ)t Dg(ρ, θ) = 2ρ
Sendo N um segmento de recta sobre M , temos,
Z p
vol2 (M ) = vol2 (M \ N ) = det Dg(ρ, θ)t Dg(ρ, θ)dρdθ
T
Z 2π Z 1 √ 
= 2 ρdρ dθ
0 0
√ Z 1
= 2π 2ρdρ
0

= 2π

25
iv) Consideremos a porção do plano definido por
P = {(x, y, z) ∈ R3 : x + y + z = 1 ; x > 0 ; y > 0 ; z > 0}
e a respectiva parametrização g : T → R3 dada por
g(x, y) = (x, y, 1 − x − y)
em que
T = {(x, y) ∈ R2 : 0 < x < 1 ; 0 < y < 1 − x}
Sendo  
1 0
Dg(x, y) =  0 1 
−1 −1
obtemos
Z √
vol2 (P ) = 3dxdy
T
Z 1 Z 1−x √

= 3dy dx
0 0
√ Z 1
= 3 (1 − x)dx
0

3
=
2
v) Consideremos o toro com raios R e r definido por
p
T 2 = {(x, y, z) ∈ R3 : ( x2 + y 2 − R)2 + z 2 = r2 }
ou seja, a superfı́cie que se obtém fazendo rodar em torno do eixo z a circunferência no
plano xz com centro em (R, 0) e raio r e descrita pelo ângulo φ , contado a partir do plano
z = 0 no sentido positivo. Designemos por θ o ângulo de rotação em torno do eixo z e
medido a partir do eixo x no sentido positivo.
Seja
D = {(θ, φ) ∈ R2 : 0 < θ < 2π , 0 < φ < 2π}
e g : D → R3 definida por
g(θ, φ) = ((R + r cos φ) cos θ , (R + r cos φ) sen θ , r sen φ)

Facilmente se verifica que g é de classe C 1 e injectiva e a respectiva derivada


 
−(R + r cos φ) sen θ −r sen φ cos θ
Dg(θ, φ) =  (R + r cos φ) cos θ −r sen φ sen θ 
0 r cos φ
tem caracterı́stica igual a dois. Portanto, g é uma parametrização de
T2 \ N
em que
N = {(x, y, z) : z = 0} ∪ {(x, y, z) : y = 0}
Sendo N a união de duas linhas em T 2 , temos
Z p
vol2 (T 2 ) = vol2 (T 2 \ N ) = det Dg(θ, φ)t Dg(θ, φ)dθdφ
D
Z 2π Z 2π 
= r(R + r cos φ)dθ dφ
0 0
2
= 4π Rr

26
vi) Consideremos a superfı́cie dada por
C = {(x, y, z) ∈ R3 : x2 + y 2 = z 2 + 1 , 0 < z < 1}
e que representa uma folha de um material com densidade de massa dada por
1
α(x, y, z) = √
2z 2 + 1
Em coordenadas cilı́ndricas (ρ, θ, z) esta superfı́cie é descrita pela equação ρ 2 = z 2 + 1 e,
portanto, consideremos a função g : T → R3 definida por
p p
g(θ, z) = (( z 2 + 1) sen θ , ( z 2 + 1) cos θ , z)
em que
T = {(θ, z) ∈ R2 : 0 < θ < 2π ; 0 < z < 1}
Então, g é de classe C 1 , injectiva e a respectiva derivada
 √ 
−( z 2 + 1) sen θ √zz2 +1 cos θ
 √ √ z
Dg(θ, z) =  ( z 2 + 1) cos θ sen θ 

z 2 +1
0 1
tem caracterı́stica igual a dois, ou seja é uma parametrização de C \ N em que
N = {(x, y, z) : y = 0 , x ≥ 0}

A massa de C é dada por


Z Z 2π Z 1 p

M= α = α(g(θ, z)) det Dg(θ, z)t Dg(θ, z)dz dθ
C 0 0
2π Z 1 
1
Z p
= √ 2
2z + 1 dz dθ
0 0 2z 2 + 1
= 2π

A coordenada z do centro de massa de C é dada por


Z 2π Z 1 
1 1
Z p
z= zα = t
g3 (θ, z)α(g(θ, z)) det Dg(θ, z) Dg(θ, z)dz dθ
M C 2π 0 0
Z 2π Z 1 
1
= zdz dθ
2π 0 0
1
=
2
p
Seja dz (x, y, z) = x2 + y 2 a distância ao eixo z . O momento de inércia de C relativo ao
eixo z é dado por
Z Z p
2
Iz = αdz = α(g(θ, z))d2L (g(θ, z)) det Dg(θ, z)t Dg(θ, z)dθdz
C T
Z 2π Z 1 
2
= (z + 1)dz dθ
0 0

=
3

Referências
[1] Luı́s T. Magalhães. Complementos de cálculo diferencial.
[2] W. Rudin. Principles of Mathematical Analysis. MGraw Hill, 1976.

27