Você está na página 1de 88

Análise Matemática II

e
Cálculo Diferencial e Integral II

Resumo teórico
2019/2020

Ana Rute Domingos e Ana Cristina Barroso

Cursos: Matemática
Matemática Aplicada
Engenharia Biomédica e Biofı́sica
Engenharia Fı́sica
Fı́sica

Conteúdo

Introdução
1. Funções vectoriais de uma variável
2. Cálculo Diferencial em Rn
3. Cálculo Integral em Rn
4. Análise Vectorial

1
Introdução

Este é o segundo curso de Análise/Cálculo para os cursos do DM e do DF da FCUL, onde traba-


lhamos com funções de várias variáveis.
Os pré-requisitos para esta disciplina são as funções reais de variável real (conteúdos da Análise
Matemática I/Cálculo Diferencial e Integral I), com particular destaque para o cálculo de derivadas e
de primitivas/integrais, e as noções básicas de Álgebra Linear.
No primeiro curso tudo se passa em R, um espaço vectorial de dimensão um. Agora vamos trabalhar
em Rn , com n > 1, onde há mudanças significativas. Por exemplo, não temos uma relação de ordem
total. Há duas diferenças essenciais quando se passa da Análise/Cálculo a uma variável para várias
variáveis, uma é o facto da topologia dos subconjuntos de Rn ser mais complexa quando n > 1 e a
outra é necessidade de se usar a álgebra linear para definir alguns conceitos e para demonstrar alguns
resultados. Por exemplo, em dimensão um, uma aplicação linear confunde-se com um número real,
daı́ que em R se considere que a derivada de uma função num ponto é um número real, enquanto que
a derivada de uma função com mais do que uma variável, como veremos, é uma aplicação linear.
Vamos ver extensões dos conceitos estudados em Análise Matemática I/Cálculo Diferencial e In-
tegral I, agora para as funções de várias variáveis, estudaremos propriedades associadas e veremos
algumas das importantes aplicações destes conteúdos.

Introdução Ana Rute Domingos e Ana Cristina Barroso

2
1 Funções vectoriais de uma variável
Motivação
Podemos descrever o movimento de uma partı́cula no espaço associando a cada instante de um certo
intervalo de tempo o ponto do espaço que a referida partı́cula ocupa no referido instante. Esta descrição
constitui uma função vectorial (a imagem de cada objecto é um vector) de variável real (o tempo). No
seu movimento a partı́cula traça um objecto geométrico que corresponde à ideia intuitiva de curva.
Neste capı́tulo estamos interessados neste tipo de funções que nos ajudam, como na situação
anterior, a descrever situações fı́sicas e a estudar alguns objectos geométricos - as curvas. Vamos
formular estes conceitos matemáticos e estudar algumas das suas propriedades.

1.1 Funções vectoriais de uma variável: limites, continuidade, derivadas e inte-


grais
Uma função vectorial de variável real é uma função definida num subconjunto de R e com imagem
em Rn , com n > 1. Seja D um subconjunto de R. Dada uma função vectorial de variável real

r : D ⊆ R → Rn , t 7→ r(t) = (r1 (t), r2 (t), . . . , rn (t)),

ficam definidas n funções reais de variável real ri : D ⊆ R → R, t 7→ ri (t), com i = 1, . . . , n, a que


chamamos funções componentes de r.
O domı́nio da função r é a intersecção dos domı́nios de cada uma das suas funções componentes e
é o maior conjunto onde a expressão que define r faz sentido, a não ser que se explicite uma restrição
deste.

Exemplo. Seja r(t) = (t3√ , log(2 − t), 4 t + 5). As funções componentes de r são r1 (t) = t3 ,
r2 (t) = log(2 − t) e r3 (t) = 4 t + 5, cujos domı́nios são, respectivamente, R, ] − ∞, 2[ e [−5, +∞[.
Assim, o domı́nio de r é [−5, 2[.
Neste parágrafo vamos estabelecer o conceito de limite para este tipo de funções, e com ele estender
as noções de continuidade, de derivada e de integral que já conhecemos para as funções reais de variável
real.
Definição 1.1 Sejam r : D ⊆ R → Rn uma função vectorial de variável real, t0 ∈ D0 e L um vector de
Rn . Dizemos que o limite de r, quando t converge para t0 , é L ∈ Rn , e escrevemos limt→t0 r(t) = L
se, e só se, lim kr(t) − Lk = 0, ou seja, se, e só se,
t→t0

∀δ > 0 ∃ ε > 0 : 0 < |t − t0 | < ε ⇒ kr(t) − Lk < δ.


n . Nesta disciplina consideramos, salvo menção
Observamos que k · k denota uma norma em Rq
contrária, a norma euclidiana, i.e., k(x1 , . . . , xn )k = x21 + . . . + x2n .
Assim, dizer que o limite, quando t → t0 , da função vectorial r(t) é o vector L é equivalente a afirmar
que o limite da função real kr(t) − Lk, quando t → t0 , é 0.

Proposição 1.2 Se lim r(t) = L, então lim kr(t)k = kLk.


t→t0 t→t0

Demonstração. Começamos por observar que se tem 0 ≤ | kr(t)k − kLk | ≤ kr(t) − Lk, para todo o
t ∈ D.
Por definição, dizer que limt→t0 r(t) = L é equivalente a dizer que limt→t0 kr(t)−Lk = 0. Atendendo
à observação efectuada e ao Teorema do enquadramento, obtemos

lim |kr(t)k − kLk| = 0,


t→t0

logo limt→t0 (kr(t)k − kLk) = 0, ou seja limt→t0 kr(t)k = kLk, o que termina a prova da proposição. 
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

3
O próximo resultado reveste-se de uma grande importância prática e diz-nos que os limites das
funções vectoriais se calculam componente a componente, reduzindo-se ao cálculo de n limites de
funções reais de variável real.
Teorema 1.3 Sejam r : D ⊆ R → Rn uma função vectorial de variável real, t0 ∈ D0 e
L = (L1 , . . . , Ln ) ∈ Rn . Então
lim r(t) = L ⇔ lim ri (t) = Li , ∀i = 1, . . . , n.
t→t0 t→t0

!
e2t − 1 t2 + 6 sin t t
Exemplo. Seja r(t) = , 2 , . Temos que
3t t − πt log(1 + 5t)
!
e2t − 1 t2 + 6 sin t t
lim r(t) = lim , lim 2 , lim
t→0 t→0 3t t→0 t − πt t→0 log(1 + 5t)

2t 2t + 6 cos t t 2 6 1
   
= lim , lim , lim = ,− , .
t→0 3t t→0 2t − π t→0 5t 3 π 5

No resultado anterior podemos considerar t0 = ±∞, se t0 ∈ D0 (em R), estendendo-se desta forma
o conceito de limite de uma função vectorial de variável real ao caso em que o ponto é o infinito. Deste
teorema conclui-se também que as propriedades algébricas dos limites de funções de R em R também
são válidas para funções de R em Rn , como se enuncia seguidamente.
Teorema 1.4 Sejam u, v : D ⊆ R → Rn funções vectoriais de variável real, f : D → R uma função
real de variável real e t0 ∈ D0 . Suponhamos que existem os limites lim u(t), lim v(t) em Rn , e
t→t0 t→t0
limt→t0 f (t) em R. Então tem-se:
i) lim (u(t) + v(t)) = lim u(t) + lim v(t);
t→t0 t→t0 t→t0

ii) lim (cu(t)) = c lim u(t), ∀c ∈ R;


t→t0 t→t0

iii) lim f (t)u(t) = lim f (t) lim u(t);


t→t0 t→t0 t→t0

iv) lim u(t) · v(t) = lim u(t) · lim v(t), onde · representa um produto interno em Rn .
t→t0 t→t0 t→t0

Definição 1.5 Seja r : D ⊆ R → Rn e t0 ∈ D. A função r diz-se contı́nua em t0 se, e só se,


∀δ > 0 ∃ ε > 0 : |t − t0 | < ε ⇒ kr(t) − r(t0 )k < δ.
Em particular, se t0 ∈ D ∩ D0 , r diz-se contı́nua em t0 se, e só se, limt→t0 r(t) = r(t0 ).

A definição anterior conjugada com o Teorema 2.11 permite trabalhar a continuidade componente
a componente.
Teorema 1.6 Seja r : D ⊆ R → Rn e t0 ∈ D ∩ D0 . Então r é contı́nua em t0 se, e só se, as suas
funções componentes ri forem contı́nuas em t0 , ∀i = 1, . . . , n.

A continuidade das funções que resultam de operações algébricas e da composição entre funções
contı́nuas é descrita no próximo resultado.
Teorema 1.7 Sejam u, v : D ⊆ R → Rn , f : D ⊆ R → R e g : E ⊆ R → R tal que g(E) ⊆ D. Então:
i) se u, v e f são contı́nuas em a ∈ D, o mesmo sucede a kuk, u + v, f u e u · v, onde · representa
um produto interno;
ii) se g é contı́nua em a ∈ E e u é contı́nua em g(a) ∈ D, então u ◦ g é contı́nua em a.

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

4
Definição 1.8 Dada uma função vectorial de variável real r : I = ]a, b[ → Rn a derivada de r no
ponto t ∈ I é dada por
dr r(t + h) − r(t)
(t) = r0 (t) = lim
dt h→0 h
se este limite existir. Neste caso dizemos que a função r é diferenciável em t.

Analogamente define-se a derivada lateral à direita em a, e representa-se por r+ 0 (a), e a derivada la-

teral à esquerda em b, e representa-se por r− (b), tomando no limite h → 0 e h → 0− , respectivamente.


0 +

É fácil ver que se r é diferenciável em t, então r é contı́nua em t (exercı́cio).


Atendendo ao Teorema 2.11 é válido o seguinte teorema:

Teorema 1.9 Seja r : ]a, b[ → Rn uma função vectorial de variável real, seja t0 ∈ ]a, b[ e suponhamos
que todas as funções componentes de r, ri : ]a, b[ → R, i = 1, . . . , n, são diferenciáveis em t0 . Então r
é diferenciável em t0 e tem-se

r0 (t0 ) = (r10 (t0 ), r20 (t0 ), . . . , rn0 (t0 )).

Este teorema diz-nos que r0 (t) é o vector cujas componentes são as derivadas das funções ri ,
i = 1, . . . , n. Consequentemente todas as fórmulas e métodos usados para calcular derivadas de funções
reais de variável real podem ser usados para calcular derivadas de funções vectoriais de variável real,
aplicados componente a componente, como se ilustra no exemplo que se segue.

Exemplo. Seja r(t) = (t2 + 2 arctan(3t), cos(sin(3t7 ))), com t ∈ R. Então


6
 
0
r (t) = 2t + , −21t6 sin(sin(3t7 )) cos(3t7 ) .
1 + 9t2

r(t0 + h) − r(t0 )
Demonstração do Teorema 1.9. Por definição temos r0 (t0 ) = lim . Vem então
h→0 h
1
r0 (t0 ) = lim (r1 (t0 + h) − r1 (t0 ), . . . , rn (t0 + h) − rn (t0 ))
h→0 h
r1 (t0 + h) − r1 (t0 ) rn (t0 + h) − rn (t0 )
 
= lim , . . . , lim = (r10 (t0 ), . . . , rn0 (t0 )).
h→0 h h→0 h

As propriedades algébricas da derivação das funções vectoriais de variável real estão reunidas no
próximo teorema.

Teorema 1.10 Sejam u, v : ]a, b[ → Rn , f : ]a, b[ → R e c ∈ R. Se u, v e f forem diferenciáveis em


]a, b[ tem-se, para cada t ∈ ]a, b[,
d
i) (u(t) + v(t)) = u0 (t) + v 0 (t);
dt
d
ii) (cu(t)) = cu0 (t);
dt
d
iii) (f (t)u(t)) = f 0 (t)u(t) + f (t)u0 (t);
dt
d
iv) (u(t) · v(t)) = u0 (t) · v(t) + u(t) · v 0 (t), onde · representa um produto interno em Rn ;
dt
d
v) (u(f (t))) = f 0 (t)u0 (f (t)) (derivação da função composta).
dt

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

5
Também para as funções em estudo neste capı́tulo podemos definir derivadas de ordem superior a
um. Veja-se a definição que se segue.

Definição 1.11 Seja r : [a, b] → Rn , com r(t) = (r1 (t), . . . , rn (t)), uma função vectorial de variável
real. Dizemos que r é de classe C k , com k ≥ 1, em [a, b], se todas as suas componentes são funções
reais de variável real de classe C k em [a, b].

Definição 1.12 Seja r : [a, b] ⊆ R → Rn , t 7→ (r1 (t), r2 (t), . . . , rn (t)) uma função vectorial de variável
real contı́nua. Para cada t ∈ [a, b] definimos
Z t Z t Z t Z t 
r(s) ds = r1 (s) ds, r2 (s) ds, . . . , rn (s) ds .
a a a a

Dizemos que a relação


Z Z Z 
t 7→ r1 (t) dt, r2 (t) dt, . . . , rn (t) dt , t ∈ [a, b]
Z
é a famı́lia das primitivas de r e denotamos por r(t) dt.

Z 0
Da definição anterior resulta imediatamente que r(t) dt = r(t). Além disso, se R é uma
primitiva de r, então R + C, com C ∈ Rn , também é uma primitiva de r.
Temos também que o integral duma função vectorial de variável real r é o vector cujas componentes
são os integrais das funções componentes de r. Assim, a linearidade do integral de funções vectori-
ais de variável real é uma das suas propriedades naturais e que está listada no próximo teorema,
conjuntamente com outras.

Teorema 1.13 Sejam u, v : [a, b] ⊆ R → Rn funções contı́nuas, α ∈ R e c ∈ Rn um vector constante.


Então tem-se:
Z b Z b Z b
i) u(t) + v(t) dt = u(t) dt + v(t) dt;
a a a
Z b Z b
ii) α u(t) dt = α u(t) dt;
a a
Z b Z b !
iii) c · u(t) dt = c · u(t) dt , onde · representa um produto interno em Rn ;
a a
Z Z
b b
iv) u(t) dt ≤ ku(t)k dt.

a a

Exemplo. Seja r(t) = (t cos t2 , e5t ). Temos então


Z √π Z √π Z √π √ π  √ π !
1 1 5√ π
!
1 1
  
2 2 2 2 2
2 5t
r(t) dt = t cos t dt, e dt = sin t2 , e5t = , (e 2 − 1) .
0 0 0 2 0 5 0 2 5

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

6
Demonstração do Teorema 1.13. A prova das propriedades de i) a iii) é um exercı́cio simples.
Vejamos a prova de iv).
Z b
Seja U = u(t) dt ∈ Rn . Se U = 0Rn , o resultado é trivialmente verificado. Vejamos o caso em
a
que U não é o vector nulo. Atendendo à definição de norma e às propriedades dos integrais vem
Z b Z b Z Z
iii)
b b
2
kU k = U · U = U · u(t) dt = U · u(t) dt ≤ U · u(t) dt ≤ |U · u(t)| dt,

a a a a

usando agora a desigualdade de Cauchy-Schwarz no último integral obtemos


Z b Z b
2
kU k ≤ kU k ku(t)k dt = kU k ku(t)k dt,
a a

logo Z Z
Z b b b
kU k ≤ ku(t)k dt ⇐⇒ u(t) dt ≤ ku(t)k dt. 

a a a

1.2 Curvas no plano e no espaço


Todos temos uma ideia intuitiva de curva, ideia essa que informalmente corresponde a um objecto
geométrico de dimensão um. Por exemplo, considerando Γ := {(x, y) ∈ R2 : x2 + y 2 = 1}, a
circunferência do plano, de centro na origem e raio 1, é usual dizer que Γ é uma curva. Podemos
descrevê-la através de um parâmetro, da forma seguinte:

Γ = {(cos t, sin t) : t ∈ [0, 2π[}.

Dizemos que descrição anterior é uma parametrização de Γ e temos então uma função vectorial de
variável real, t 7→ (cos t, sin t), a que chamamos linha parametrizada.
Seja n ∈ N2 . No que se segue vamos considerar funções vectoriais de variável real γ : I ⊆ R → Rn
definidas e contı́nuas num intervalo real I, que consideramos sempre não degenerado (com mais do
que um ponto).

Definição 1.14 Chamamos linha parametrizada ou trajectória parametrizada a qualquer fun-


ção vectorial contı́nua γ : I ⊆ R → Rn . À imagem de I por meio de γ, γ(I), chamamos curva ou
traço da linha γ (também se usam as designações traçado e órbita).
A uma linha parametrizada definida num intervalo compacto I = [a, b] damos o nome de caminho.
Neste caso γ(a) e γ(b) dizem-se as extremidades do caminho, sendo γ(a) o ponto inicial e γ(b) o
ponto final do caminho. Se γ(a) = γ(b), o caminho diz-se fechado.
Chamamos arco ou porção da curva γ(I) de extremos γ(α) e γ(β), com α, β ∈ I e α < β, à
curva γ([α, β]).

Por uma questão de simplificação de linguagem é frequente usarmos apenas os vocábulos linha ou
trajectória, omitido-se a designação parametrizada. Observamos que as designações para os conceitos
anteriores (linha, trajectória, curva, caminho) podem variar de autor para autor.

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

7
Exemplos. 1) γ : R → R3 , γ(t) = (t5 , 8t, et ) é uma linha parametrizada e γ(R) uma curva.
2) γ : [0, 5] → R2 , γ(t) = (cos t, log(t2 + 1)) é um caminho; γ(0) = (1, 0) é o ponto inicial e
γ(5) = (cos 5, log 26) o ponto final.
Definição 1.15 Uma curva C, traço de uma linha γ, diz-se uma curva simples se não se intersec-
tar. No caso de C ser o traço de um caminho, a curva diz-se simples se não se intersectar excepto
possivelmente nos seus extremos.

Curva fechada e não simples Curva fechada e simples Curva simples Curva não simples

Estamos particularmente interessados nos casos em que n = 2 e n = 3 correspondentes às chamadas


curvas no plano e curvas no espaço, respectivamente. Observe-se, no entanto, que chamamos curva
plana a uma curva que seja traço de uma linha parametrizada γ : I → R3 que esteja contida num
plano de R3 .
Exemplo. γ : [0, 2π] → R3 , γ(t) = (−1, 5 cos t, 5 sin t). γ([0, 2π]) está contida no plano x = −1, logo
é uma curva plana.
Como já referimos, as funções vectoriais surgem em inúmeras aplicações, nomeadamente para
descrever o movimento de partı́culas no plano e no espaço. Assim, é frequente usar para a variável
independente a letra t que representa o tempo, interpretando-se γ(t) como o vector posição da partı́cula
no instante t.
Associado a uma linha parametrizada γ : I ⊆ R → Rn , t 7→ γ(t), com γ(t) = (γ1 (t), . . . , γn (t)),
temos um sistema de n equações que descreve a linha (e consequentemente a curva γ(I))


 x1 = γ1 (t)

 x2 = γ2 (t)

..


 .

 xn = γn (t), t∈I
a que chamamos equações paramétricas da curva. À variável independente t chamamos o parâme-
tro. Uma curva pode ser descrita por diferentes sistemas de equações paramétricas. Ao definirmos
uma linha parametrizada estamos a considerar uma parametrização do seu traço, daı́ a designação
de linha/trajectória parametrizada.
Dada uma curva C interessa-nos determinar uma linha parametrizada cujo traço seja C. Por
exemplo, considerando C a parábola y = 3x2 + 1 (C = {(x, y) : y = 3x2 + 1}), temos que
γ(x) = (x, 3x2 + 1), x ∈ R é uma parametrização de C, ou dito de outra forma, γ é uma linha
parametrizada cujo traço é C. Vejamos outros exemplos.
Exemplos de linhas parametrizadas e identificação da curva
1) Recta
Uma parametrização da recta, em Rn , n ∈ N2 , que passa no ponto P e tem a direcção do vector ~u é
γ : R → Rn , γ(t) = P + t~u.
2) Segmento de recta
Uma parametrização do segmento de recta, em Rn , n ∈ N2 , com origem no ponto A e final no ponto
B é
γ : [0, 1] → Rn , γ(t) = A + t(B − A).
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

8
3) Gráfico de uma função r.v.r. contı́nua
Seja f : [a, b] → R uma função contı́nua. Uma parametrização do gráfico de f é
γ : [a, b] → R2 ,
γ(t) = (t, f (t)).

4) Considere-se o caminho γ : [−2, 2] → R2 , dado por γ(t) = (t, 4 − t2 ). As equações paramétricas
associadas são: (
x=√ t
y = 4 − t2 , t ∈ [−2, 2].

De y = 4 − x2 , vem y 2 + x2 = 4, com x ∈ [−2, 2] e y ≥ 0, ou seja, o traço deste caminho é a
semi-circunferência de centro na origem, raio 2, com inı́cio no ponto (−2, 0) e final no ponto (2, 0),
percorrida no sentido dos ponteiros do relógio.
5) Uma parametrização da circunferência em R2 , com centro em (a, b), raio R, descrita no
sentido directo (sentido contrário ao dos ponteiros do relógio), uma única vez é
γ : [0, 2π] → R2 , γ(θ) = (a + R cos θ, b + R sin θ).
6) O traço do caminho
γ : [0, 2π] → R3 , γ(θ) = (1 + 7 cos θ, 5, −7 sin θ).
é a circunferência do plano y = 5, centrada no ponto (1, 5, 0) e de raio 7.
7) O traço da linha γ(t) = (3 cos t, 3 sin t, t), t ∈ [0, +∞[ é uma hélice circular, que não é uma curva
plana (encontra-se sobre um cilindro).
É importante perceber que os conceitos de linha parametrizada (função vectorial) e de traço da
linha (curva) são distintos. A linha parametrizada contém informação que o seu traço não tem. Por
exemplo, sejam γ1 (t) = (cos t, sin t) e γ2 (t) = (cos(10t), sin(10t)), com t ∈ [0, 2π]. O traço de ambas
as linhas γ1 e γ2 é a circunferência de centro na origem e raio 1. No entanto, enquanto que a linha γ1
apenas traça a circunferência uma só vez, a linha γ2 passa 10 vezes em cada ponto da circunferência, e
como o faz no mesmo intervalo, significa que o seu “movimento” é dez vezes mais rápido. Este exemplo
ilustra o facto da linha parametrizada conter informação sobre a forma como a curva é traçada.
Definição 1.16 Chama-se mudança de parâmetro a uma aplicação bijectiva α : J → I, de classe
C 1 , com inversa também C 1 , onde J e I são intervalos de R.
Dadas γ : I → Rn uma linha parametrizada e α : J → I uma mudança de parâmetro, à linha
parametrizada γ ◦ α chama-se uma reparametrização de γ (por meio de α). Também se diz uma
reparametrização da curva γ(I).
Observação. Dada γ : [a, b] → Rn uma linha parametrizada, é sempre possı́vel definir uma parametri-
zação γ̃ com o mesmo  traço de γ, definida num intervalo dado [c, d], considerando
t−c
γ̃(t) = γ a + d−c (b − a) . Assim, γ̃ é uma reparametrização de γ.

Proposição 1.17 Sejam I e J intervalos de R. Uma aplicação bijectiva α : J → I, de classe C 1 é


uma mudança de parâmetro se, e só se, α0 nunca se anula.

Exemplo. Sejam J = [1, 2], I = [0, log 2] e α : J → I, dada por α(t) = log t. Como α é bijectiva, de
classe C 1 e α0 (t) = 1t > 0, para todo o t ∈ J, então α é uma mudança de parâmetro.
As mudanças de parâmetro de uma mesma linha agrupam-se em dois conjuntos, aquelas cuja
derivada é positiva e aquelas em que a derivada é negativa. Dizemos que a mudança de parâmetro,
no primeiro caso preserva a orientação da linha, e no segundo caso que inverte a orientação da
linha.
Ao conjunto de todas as reparametrizações de uma linha obtidas por uma mudança de parâmetro que
preserva a orientação da linha inicial chama-se uma linha ou trajectória orientada.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

9
Definição 1.18 (Caminho inverso) Seja γ : [a, b] → Rn um caminho. Define-se o caminho in-
verso ou oposto, e representa-se por (−γ) o caminho definido por (−γ)(t) = γ(a + b − t), com
t ∈ [a, b].
O ponto inicial de (−γ) é o ponto final de γ e vice-versa. Geometricamente não há distinção entre o
traço dos dois caminhos. Intuitivamente, (−γ) interpreta-se como sendo o caminho γ percorrido no
sentido inverso.
Exemplo. Seja γ1 : [0, π] → R2 , γ1 (t) = (1 + 2 cos t, −1 + 2 sin t). Atendendo à definição, o caminho
inverso da linha anterior é o caminho dado por (−γ1 ) : [0, π] → R2 ,
(−γ1 )(t) = γ1 (0 + π − t) = (1 + 2 cos(π − t), −1 + 2 sin(π − t)) = (1 − 2 cos t, −1 + 2 sin t).

O traço de uma linha parametrizada pode ser um objecto geométrico que nada tem a ver com
a ideia intuitiva que temos de curva. Peano, em 1890, construiu uma linha parametrizada, definida
no intervalo [0, 1] e cujo traço é todo o quadrado [0, 1] × [0, 1]! Há muitos outros exemplos de linhas
parametrizadas cujo traço não coincide com a noção intuitiva de curva. Quando se impõe mais
regularidade a uma linha parametrizada pedindo, por exemplo, que seja pelo menos de classe C 2 (é
natural supor que a “operação” de traçar uma curva num papel possa ser modelada por uma função
vectorial contı́nua que represente a força que a mão exerce sobre a caneta e é razoável supor que o
movimento da ponta da caneta obedeça à 2.a lei de Newton (F = m · a), descrevendo, portanto, uma
trajectória cuja segunda derivada (aceleração) é proporcional à força) e que a primeira derivada não
se anule, então pode provar-se que o seu traço corresponde localmente à ideia intuitiva que temos de
curva. A discussão formal e rigorosa destas ideias sai fora do âmbito do nosso curso.
Em geral, vamos trabalhar com linhas que tenham alguma regularidade e cujo traço se insere na
noção intuitiva que temos de curva.
Definição 1.19 Uma linha parametrizada γ : [a, b] → Rn diz-se seccionalmente de classe C 1
(abreviadamente secc. C 1 ) ou de classe C 1 por troços se γ é contı́nua em [a, b] e existe um número
finito de pontos a = t0 < t1 < t2 < . . . < tp < tp+1 = b tais que γ|[ti ,ti+1 ] é de classe C 1 , para
i = 0, . . . , p.
Observação. É importante não confundir a regularidade de uma linha parametrizada com a regula-
ridade do seu traço. A primeira diz respeito à regularidade de uma função (a linha parametrizada) e
a segunda ao objecto geométrico que é a imagem da função. Observe-se que o traço de uma linha não
é o seu gráfico. Se γ é uma linha parametrizada com valores em Rn , o seu gráfico é um conjunto de
Rn+1 , enquanto que o seu traço é um objecto de Rn . O exercı́cio 18 da Ficha 1 põe em evidência a
distinção entre a regularidade dos dois objectos matemáticos – a linha e a curva, através do exemplo
que trabalha.

Vector tangente, recta tangente


r(t + h) − r(t)
Seja r : I ⊆ R → Rn uma linha parametrizada. O vector é paralelo à corda que liga
h
os pontos r(t + h) e r(t).

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

10
À medida que h converge para zero a corda associada ao vector anterior torna-se paralela à recta que
corresponde à noção intuitiva que temos de recta tangente a uma curva, neste caso à curva r(I) no
ponto r(t). Assim, a recta tangente à curva terá a direcção do vector
r(t + h) − r(t)
lim = r0 (t). (1)
h→0 h
Esta interpretação geométrica está na base das próximas definições.
Definição 1.20 Seja r : I ⊆ R → Rn uma linha parametrizada. Se r é diferenciável em t0 ∈ I e
r0 (t0 ) 6= 0, a r0 (t0 ) chamamos vector tangente à curva r(I) no ponto r(t0 ).
A recta tangente à curva definida pela linha parametrizada r, diferenciável em t0 , com r0 (t0 ) 6= 0,
no ponto P = r(t0 ), é a recta que passa pelo ponto P e tem a direcção do vector r0 (t0 ).

Exemplos. 1) Determinar uma equação da recta tangente à curva descrita por r(t) = (t, t2 , t3 ) no
ponto (2, 4, 8) implica, neste caso, determinar em primeiro lugar qual é o instante no qual a linha
assume o valor (2, 4, 8) (a curva em causa é simples, pelo que neste caso há um único instante nestas
condições) e o cálculo da derivada de r nesse instante. É fácil ver temos r(2) = (2, 4, 8). Como
r0 (2) = (1, 4, 12), uma equação da recta referida é
(x, y, z) = (2, 4, 8) + λ(1, 4, 12), λ ∈ R.
2) Considere-se a curva C descrita
√ pela parametrização
√ r(t) = (t2 , t3 − 3t), com t ∈ R. Esta curva não
é simples, observe-se que r( 3) = (3, 0) = r(− 3). Neste exemplo há duas rectas tangentes a C no
ponto (3, 0), que diferenciamos referindo
√ qual
√ é o instante
√ em que√a linha passa naquele ponto. Como
0 2
r (t) = (2t, 3t − 3), temos √ 0 0
r (− 3) = (−2 3, 6) e r ( 3) = (2 3, 6), donde uma equação da recta
tangente a C no ponto r(− 3) = (3, 0) é

(x, y) = (3, 0) + λ(−2 3, 6), λ ∈ R

e uma equação da recta tangente a C no ponto r( 3) = (3, 0) é

(x, y) = (3, 0) + λ(2 3, 6), λ ∈ R.
Observamos que há casos de curvas que não são simples e em que há apenas uma recta tangente em
pontos por onde a linha passa mais do que uma vez. Fica como exercı́cio encontrar um exemplo.

Considerando agora a interpretação cinemática das linhas parametrizadas, tomando r(t) o vector
posição do ponto P e h > 0 no limite (1), observe-se que o vector r(t + h) − r(t) tem o mesmo sentido
do movimento; tomando h < 0, o vector r(t + h) − r(t) tem sentido contrário ao do movimento, mas
dividido por h, passa a ter o sentido do movimento.

Então, em qualquer dos casos, r0 (t) aponta na direcção e sentido em que t aumenta.
Se γ é uma linha parametrizada definida num intervalo I, tal que existe γ 0 (t) e γ 00 (t), num certo
t ∈ I, é usual usar a seguinte terminologia que vem da Mecânica: a γ 0 (t) chama-se vector velocidade
ou simplesmente velocidade em t, a kγ 0 (t)k chama-se velocidade escalar em t, a γ 00 (t) chama-se
vector aceleração ou simplesmente aceleração em t. Usam-se as notações
v(t) := γ 0 (t), a(t) := v 0 (t) = γ 00 (t).

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

11
Os próximos exercı́cios exemplificam situações relativas à terminologia referida.
Exercı́cio 1.21 Sejam c > 0 e ω ∈ ]0, π2 [. Um projéctil é lançado da posição (0, 0) e tem um traçado
parabólico descrito por
γ(t) = ((cos ω)t, (sin ω)t − ct2 ), t ≥ 0.
1. Verifique que o traço da linha é uma porção de parábola e que ω é o ângulo de lançamento do
projéctil com o solo.
(O ângulo de lançamento é o arco-tangente do declive da recta tangente à curva no ponto em
questão.)
2. Qual o ângulo de lançamento que maximiza o alcance do projéctil?
1 π
3. Para c = 2 eω= 4 determine uma equação da recta tangente à curva no instante t = 1.

Exercı́cio 1.22 Um ponto move-se no plano de  tal modo que a sua velocidade (vectorial) é dada em
log(t − 1)

função do tempo por v(t) = 3e3(t−2) , , com t ∈ [2, +∞[. Sabendo que a sua posição no
t−1
instante t = 2 é (0, 2), determine a trajectória r(t) da partı́cula.

Definição 1.23 Dizemos que uma linha parametrizada γ : I → Rn diferenciável em I é regular se


kγ 0 (t)k =
6 0 para todo t ∈ I.

Seja γ : I → R3 uma linha parametrizada regular. Podemos considerar o vector


γ 0 (t)
T (t) = Tγ (t) =
kγ 0 (t)k
que é um vector unitário tangente à curva no ponto γ(t) e que se designa por vector unitário
tangente.

Comprimento de arco
Consideremos agora uma linha parametrizada definida num intervalo I. Vejamos como calcular o
comprimento da porção C = γ([a, b]), da curva γ(I), com [a, b] ⊂ I.

Para esse efeito consideramos uma partição do intervalo [a, b], isto é, consideramos pontos ti tais
que

a = t0 < t1 < t2 < . . . < tn−1 < tn = b.

Para cada ponto ti da partição calculamos γ(ti ) e determinamos Pi , o ponto correspondente na curva.

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

12
Seguidamente consideramos os segmentos de recta que unem os pontos Pi−1 a Pi , i = 1, . . . , n.
Adicionando os comprimentos de todos estes segmentos obtemos o comprimento de uma linha poligonal
dado por
n
X
kγ(ti ) − γ(ti−1 )k.
i=1

Define-se o comprimento da curva C, e representa-se por L(C), como sendo o supremo dos com-
primentos de todas as linhas poligonais assim obtidas. É intuitivo perceber que quanto mais pontos
tiver a linha poligonal melhor o seu comprimento aproxima o comprimento da curva, pelo que a
definição anterior é natural, embora não nos dê uma forma expedita de calcular comprimentos de
Z b
curvas. Prova-se que a soma anterior se relaciona com o valor kγ 0 (t)k dt, como veremos adiante.
a
A próxima proposição diz-nos que o integral da norma da derivada de uma linha é invariante por
reparametrização.

Proposição 1.24 Seja γ1 uma linha de classe C 1 em [a, b] e γ2 : [c, d] → Rn uma reparametrização
de γ1 . Então
Z b Z d
kγ10 (t)k dt = kγ20 (t)k dt.
a c

Demonstração. Como γ2 é uma reparametrização de γ1 , existe uma mudança de parâmetro


α : [c, d] → [a, b] tal que γ2 = γ1 ◦ α. Assim, considerando a mudança de variável t = α(u), no
primeiro integral, e supondo que α0 > 0, obtemos
Z b Z α(d) Z d
kγ10 (t)k dt = kγ10 (t)k dt = kγ10 (α(u))kα0 (u) du.
a α(c) c

γ20 (u)
Como γ20 (u) = γ10 (α(u))α0 (u), então γ10 (α(u)) = . Dos cálculos anteriores resulta que
α0 (u)
Z d 0
kγ20 (u)k 0
Z b Z d Z d
γ2 (u) 0
kγ10 (t)k dt = α (u) du =
α0 (u) α (u) du = kγ20 (t)k dt.
a c c α0 (u) c

O caso em que α0 < 0 é análogo.

Quando a linha é de classe C 1 o resultado anterior permite-nos ter uma forma “simples” (tão
simples quão simples for primitivar kγ 0 (t)k) de calcular o comprimento da curva respectiva, como está
enunciado no próximo teorema.

Teorema 1.25 Seja γ uma linha de classe C 1 em [a, b]. O comprimento da curva C = γ([a, b]) é
dado por
Z b
L(C) = kγ 0 (t)k dt.
a

Nos casos particulares n = 2 com γ(t) = (x(t), y(t)) e n = 3 com γ(t) = (x(t), y(t), z(t)), o
comprimento da linha é dado, respectivamente, por
Z bq Z bq
[x0 (t)]2 + [y 0 (t)]2 dt e [x0 (t)]2 + [y 0 (t)]2 + [z 0 (t)]2 dt.
a a

Em R2 , a fórmula para o cálculo do comprimento do gráfico C de uma função f : [a, b] → R de classe


C 1 é Z q b
L(C) = 1 + [f 0 (x)]2 dx.
a

Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

13
2

Exemplo. Vamos calcular o comprimento do gráfico da função f (x) = x3 , com x ∈ [0, 3]. Como
√ 3
f 0 (x) = x, vem
Z 3q Z 3q
√ Z 3√ 
2
3
14
L= 1 + [f 0 (x)]2 dx = 1 + ( x)2 dx = 1 + x dx = (1 + x)3/2 = .
0 0 0 3 0 3

Definição 1.26 Seja γ uma linha parametrizada e de classe C 1 num intervalo I. Dado a ∈ I, define-
se a função comprimento de arco da forma seguinte
Z t
s(t) = kγ 0 (u)k du, a ≤ t, t ∈ I.
a

Esta função dá-nos o comprimento do arco de γ entre os pontos γ(a) e γ(t).

Sejam γ : [a, b] → Rn uma linha parametrizada, de classe C 1 , regular, e C = γ([a, b]). De acordo
com o teorema fundamental do cálculo tem-se

s0 (t) = kγ 0 (t)k.

Como γ é regular, então s é invertı́vel (s0 > 0). À parametrização

r : [0, L(C)] → Rn , r(t) = γ ◦ s−1 (t)

chamamos parametrização de C (ou de γ) pelo comprimento de arco.

Proposição 1.27 Nas condições anteriores tem-se kr0 (t)k = 1, para todo o t ∈ I.

Proposição 1.28 Se γ : [0, b] → Rn é uma parametrização, de classe C 1 , de uma curva C com


kγ 0 (t)k = 1, para todo o t ∈ [0, b], então γ é a parametrização de C pelo comprimento de arco e
b = L(C).

Proposição 1.29 Seja γ uma linha parametrizada de classe C 1 e regular num intervalo I. Se kγ(t)k
é constante em I, então
γ(t) · γ 0 (t) = 0, ∀t ∈ I.

Proposição 1.30 Seja γ : I → Rn uma linha, de classe C 2 , parametrizada pelo comprimento de arco.
Então γ 0 (t) · γ 00 (t) = 0, para todo t ∈ I. Assim, γ 00 (t) é ortogonal a γ 0 (t).

Os resultados anteriores ilustram as propriedades geométricas que a parametrização pelo compri-


mento de arco tem.

Analogamente define-se a função comprimento de arco para uma linha seccionalmente C 1 , sendo
os resultados anteriores válidos também para estas curvas, com as adaptações óbvias. Também a
Proposição 1.24 e o Teorema 1.25 são válidos para linhas secc. C 1 .
Podemos ainda determinar o comprimento √do traço  de linhas parametrizadas definidas em inter-
1
valos ilimitados. Por exemplo, seja r(t) = t, 2 log t, , com t ∈ [1, +∞[ e C = r([1, +∞[). Temos
t
que
1 +∞
Z +∞ Z +∞ r
2 1
 
0
L(C) = kr (t)k dt = 1 + 2 + 4 dt = t − = +∞.
1 1 t t t 1
Genericamente, se a linha parametrizada r, secc. C 1 , está definida num intervalo I =]a, b[, com
−∞ ≤ a < b ≤ +∞, então tem-se
Z b
L(r(I)) = kr0 (t)k dt.
a
Existirão linhas parametrizadas definidas em intervalos ilimitados cujo traço tem comprimento
finito? (cf. Exercı́cio 29 da Ficha 1.)
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso

14
2 Cálculo Diferencial em Rn
2.1 Domı́nios, limites e continuidade de funções vectoriais de n variáveis
Sejam m, n ∈ N. Neste capı́tulo trabalharemos com funções

f : D ⊆ Rn → Rm

que a cada x = (x1 , x2 , . . . , xn ) ∈ Rn fazem corresponder o elemento de Rm dado por

(f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fm (x1 , x2 , . . . , xn )),

que se designa por imagem de x por meio de f .


Quando m = 1 estas funções designam-se por funções ou campos escalares (ou reais), se m ≥ 2
dizem-se funções ou campos vectoriais. Analogamente ao caso n = 1, estudado no Capı́tulo 1, às
funções reais

fi : D ⊆ Rn → R (2)
(x1 , x2 , . . . , xn ) 7→ fi (x1 , x2 , . . . , xn ),

para i = 1, . . . , m, chamamos funções componentes de f .


O nosso objectivo é estender as noções do cálculo diferencial em R a este tipo de funções que,
quando n > 1, dependem de mais de uma variável e, se m > 1, têm mais de uma função componente.
O conjunto D é o domı́nio da função f e é o maior conjunto onde a expressão que define f faz
sentido, a não ser que se explicite uma restrição deste. Assim, D é a intersecção dos maiores conjuntos
onde podem estar definidas cada uma das suas funções componentes. O contradomı́nio de f é o
conjunto de todas as imagens f (x) para x ∈ D e representa-se por f (D), ou seja,
n o
f (D) = f (x1 , x2 , . . . , xn ) : (x1 , x2 , . . . , xn ) ∈ D .

Dado um subconjunto A ⊆ D, chama-se imagem de A por meio de f ao conjunto


n o
f (A) = f (x1 , x2 , . . . , xn ) : (x1 , x2 , . . . , xn ) ∈ A .

Exemplo. Considerando a função f : R2 → R2 definida por f (x, y) = (ey cos x, ey sin x), é fácil
verificar que a imagem, por meio de f , da recta de equação y = 1 é a circunferência de centro (0, 0) e
raio e.

Definição 2.1 Se f é uma função real de duas variáveis com domı́nio D, o gráfico de f é o conjunto
n o
S = (x, y, z) ∈ R3 : z = f (x, y), (x, y) ∈ D .

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

15
Exemplos. Se f (x, y) = 6 − 3x − 2y, (x, y) ∈ R2 , o gráfico de f é o plano que passa nos pontos
(0, 0, 6), (0, 3, 0) e (2, 0, 0). Para a função definida em R2 por g(x, y) = x2 + y 2 o gráfico é o parabolóide
n o
S = (x, y, z) ∈ R3 : z = x2 + y 2 .
q
Finalmente, para a função h : D ⊂ R2 → R dada por h(x, y) = 9 − (x2 + y 2 ), onde
D = (x, y) ∈ R2 : x2 + y 2 ≤ 9 , o gráfico é o hemisfério

n o
S = (x, y, z) ∈ R3 : x2 + y 2 + z 2 = 9, z ≥ 0 .
Na figura abaixo encontram-se representados, da esquerda para a direita, os gráficos das funções f , g
e h, respectivamente.

Para a maior parte das funções reais de duas variáveis é muito complicado esboçar o respectivo
gráfico, nesses casos um processo que pode ajudar a visualizar a superfı́cie z = f (x, y) é considerar as
suas chamadas curvas de nı́vel.
Definição 2.2 Dados uma função f : D ⊆ Rn → R e um número real k, chamamos conjunto de
nı́vel k ao conjunto, eventualmente vazio,
Ck = {x ∈ D : f (x) = k} .
No caso n = 2, aos conjuntos de nı́vel é usual dar-se o nome de curvas de nı́vel. Com efeito,
se k ∈ f (D) e (a, b) ∈ D é tal que f (a, b) = k, se f não é constante numa vizinhança de (a, b), e
admitindo mais umas condições de regularidade, prova-se que o conjunto de nı́vel k é o gráfico de uma
função real de variável real, ou é uma união de gráficos de funções reais de variável real, pelo que é
uma curva (imagem de uma linha parametrizada), ou uma união de curvas.

Neste caso, a curva de nı́vel de equação f (x, y) = k obtém-se fazendo a projecção no plano Oxy
do corte do gráfico de f pelo plano horizontal z = k. Assim, se desenharmos algumas curvas de nı́vel
duma função e imaginarmos que as levantamos até à altura indicada, ficamos com uma ideia do gráfico
da função. Supondo que a diferença entre os valores de k de dois cortes consecutivos é constante, a
superfı́cie será inclinada onde as curvas de nı́vel estão mais próximas e será mais plana onde estas
estão mais afastadas.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

16
Exemplos. Para f (x, y) = 4 − x − y, (x, y) ∈ R2 , as curvas de nı́vel c ∈ R são rectas de equação
4 − x − y = c, já para a função definida em R2 por g(x, y) = xy, as curvas de nı́vel c 6= 0 são hipérboles,
sendo a curva de nı́vel c = 0 uma união de duas rectas.

2 −y 2
A figura que se segue mostra parte do gráfico da função f (x, y) = −xye−x , bem como algumas
curvas de nı́vel.

Para além das curvas de nı́vel, veremos na próxima secção que outras curvas relevantes para o
estudo da função f são as que se obtêm intersectando o gráfico de f com planos da forma x = k ou
y = k, com k ∈ R.
Veremos agora algumas noções topológicas em Rn que nos serão úteis para o que se segue,
permitindo-nos enunciar muitos resultados e definições, em particular, o conceito de limite de funções
cujo domı́nio é um subconjunto de Rn .
Dados n ∈ N e dois pontos P = (x1 , x2 , . . . , xn ) e Q = (y1 , y2 , . . . , yn ), recordemos que a distância
euclidiana, em Rn , entre P e Q é dada por
q
d(P, Q) = k(y1 − x1 , y2 − x2 , . . . , yn − xn )k = (y1 − x1 )2 + (y2 − x2 )2 + . . . + (yn − xn )2 .
Definição 2.3 Dado um ponto a ∈ Rn e um número real δ > 0, chama-se bola aberta de centro em
a e raio δ ao conjunto
n o n o
Bδ (a) = x ∈ Rn : kx − ak < δ = x ∈ Rn : d(x, a) < δ ;
chama-se bola fechada de centro em a e raio δ ao conjunto
n o n o
B δ (a) = x ∈ Rn : kx − ak ≤ δ = x ∈ Rn : d(x, a) ≤ δ .
Uma vizinhança do ponto a ∈ Rn é qualquer conjunto que contenha uma bola aberta de centro em a.
Um conjunto Ω ⊆ Rn diz-se limitado se existir uma bola que o contenha.
Assim, se n = 1 a bola aberta de centro em a e raio δ é o intervalo aberto ]a − δ, a + δ[, se n = 2
a bola aberta de centro em a e raio δ é o cı́rculo (ou disco) aberto de centro em a = (a1 , a2 ) e raio δ
dado por n o
Bδ (a) = (x, y) ∈ R2 : (x − a1 )2 + (y − a2 )2 < δ 2 ,
se n = 3 obtemos a esfera aberta de centro em a = (a1 , a2 , a3 ) e raio δ dada por
n o
Bδ (a) = (x, y, z) ∈ R3 : (x − a1 )2 + (y − a2 )2 + (z − a3 )2 < δ 2 .

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

17
disco aberto e esfera aberta de centro x0 e raio δ

Definição 2.4 Dado um conjunto Ω ⊆ Rn , um ponto x0 ∈ Rn diz-se interior a Ω se existe um


número real δ > 0 tal que Bδ (x0 ) ⊂ Ω, ou seja, se existe uma vizinhança de x0 contida em Ω. Um
ponto x0 ∈ Rn diz-se um ponto fronteiro a Ω se qualquer vizinhança de x0 contém pontos de Ω e do
seu complementar. Um ponto x0 ∈ Rn diz-se exterior a Ω se existe um número real δ > 0 tal que
Bδ (x0 ) ∩ Ω = ∅, ou seja, se existe uma vizinhança de x0 contida no complementar de Ω.
Ao conjunto dos pontos interiores (respectivamente, exteriores) a Ω chamamos interior (respecti-
vamente, exterior) de Ω e escrevemos int Ω (respectivamente, ext Ω). A fronteira de Ω, denotada
por fr Ω ou ∂Ω, é o conjunto dos pontos fronteiros a Ω. Chamamos fecho ou aderência de Ω ao
conjunto Ω = int Ω ∪ ∂Ω, os elementos deste conjunto dizem-se pontos aderentes a Ω.

x0 é ponto interior a Ω x0 é ponto fronteiro a Ω

É claro que int Ω ∪ ext Ω ∪ fr Ω = Rn e estes conjuntos são disjuntos dois a dois.
Um conjunto diz-se aberto se todos os seus pontos forem pontos interiores, um conjunto diz-se
fechado se contiver todos os seus pontos fronteiros. Por exemplo, as bolas abertas são conjuntos
abertos e as bolas fechadas são conjuntos fechados. Note-se que muitos conjuntos não são abertos nem
fechados. Um subconjunto de Rn é compacto se for limitado e fechado.

Na figura acima, o conjunto mais à esquerda definido por


n o
Ω1 = (x, y) ∈ R2 : 1 < x < 2, 1 < y < 2

é aberto, o do meio dado por


n o
Ω2 = (x, y) ∈ R2 : 3 ≤ x ≤ 4, 1 ≤ y ≤ 2

é fechado (e compacto) e o conjunto mais à direita


n o
Ω3 = (x, y) ∈ R2 : 5 ≤ x ≤ 6, 1 < y < 2

não é aberto nem fechado.


Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

18
Definição 2.5 Seja Ω ⊆ Rn . Um ponto x0 ∈ Rn , diz-se um ponto de acumulação de Ω se, e só se,
qualquer vizinhança de x0 contiver infinitos pontos de Ω. O conjunto dos pontos de acumulação de Ω
representa-se por Ω0 e diz-se o derivado de Ω. Os pontos de Ω que não são pontos de acumulação
dizem-se pontos isolados; assim, se x0 ∈ Ω é um ponto isolado de Ω, então existe δ > 0 tal que
Bδ (x0 ) ∩ Ω = {x0 }.

Definição 2.6 Uma sucessão em Rm é uma função cujo domı́nio é N, u : N → Rm , e que denotamos
por (un )n∈N ou simplesmente por (un ). Denotamos por un = u(n) a imagem do valor n, a que
chamamos o termo de ordem n ou enésimo termo da sucessão, note-se que cada termo da sucessão
é um vector de Rm : un = (u1n , u2n , . . . , um i
n ). Às sucessões (un )n∈N , i = 1, . . . , m, chamamos sucessões
componentes de (un ).

5
 
Por exemplo, un = , (−1)n , 3 cos(nπ) é uma sucessão em R3 cujos quatro primeiros termos
n
são (5, −1, −3), (5/2, 1, 3), (5/3, −1, −3) e (5/4, 1, 3).
Uma sucessão em Rm diz-se limitada se o conjunto dos√ seus termos S = {un : n ∈ N} for limitado.
Assim, a sucessão acima é limitada uma vez que kun k ≤ 25 + 1 + 9, donde S ⊆ B √35 (0).

Definição 2.7 Uma sucessão (un ) em Rm diz-se convergente para u ∈ Rm , e escrevemos lim un = u
ou un → u, se, e só se, a sucessão de números reais kun − uk convergir para zero, ou seja, se, e só se,

∀δ > 0 ∃ k ∈ N : n ≥ k ⇒ kun − uk < δ.

Teorema 2.8 Seja (un ) = (u1n , u2n , . . . , um m



n ) uma sucessão em R .

1. Se lim un = a e lim un = b, então a = b.

2. Se (un ) é uma sucessão convergente, então (un ) é limitada.

3. A sucessão (un ) converge para u = (u1 , u2 , . . . , um ) se, e só se, uin → ui , i = 1, . . . , m, isto é,
se, e só se, cada uma das suas sucessões componentes (uin )n∈N convergir para a correspondente
componente do vector u.
5
 
A sucessão em R3 , un = , (−1)n , 3 cos(nπ) , é um exemplo duma sucessão limitada que não
n
é convergente nem ((−1)n ), nem (3 cos(nπ)) são convergentes em R. A sucessão, em R2 ,
pois 
2n + 1 cos n

vn = , é convergente para (2, 0).
n n

Definição 2.9 (Cauchy) Seja f : D ⊆ Rn → Rm e seja a ∈ D0 . Dizemos que o limite de f (x),


quando x tende para a, é b, e escrevemos

lim f (x) = b ∈ Rm
x→a

se, e só se,


∀δ > 0 ∃ ε > 0 : x ∈ D ∧ 0 < kx − ak < ε ⇒ kf (x) − bk < δ.

A definição anterior é exactamente igual à já conhecida para as funções reais de variável real
mas com normas a substituir módulos. Assim, dizer que lim f (x) = b é equivalente a afirmar que
x→a
lim kf (x) − bk = 0. Isto significa que a distância entre f (x) e b pode ser arbitrariamente pequena
x→a
desde que se tome a distância entre x e a suficientemente pequena (mas não nula). Note-se que, na
definição anterior, o ponto a pode não pertencer ao domı́nio D de f mas tem que ser um ponto de
acumulação de D para que nos possamos aproximar de a por pontos em D \ {a}. Fazendo a mudança
de variável x = a + h, é claro que lim f (x) = b ⇔ lim f (a + h) = b.
x→a h→0
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

19
A noção de limite de uma função vectorial de variável vectorial num ponto também pode ser dada
em termos de sucessões, tendo-se a seguinte definição equivalente.
Definição 2.10 (Heine) Sejam f : D ⊆ Rn → Rm , a ∈ D0 e b ∈ Rm . Então lim f (x) = b se, e só
x→a
se, para toda a sucessão (xk )k∈N de pontos de D \ {a} tal que lim xk = a, se tiver lim f (xk ) = b.
O teorema que se segue diz-nos que, tal como para as funções vectoriais de variável real estuda-
das do Capı́tulo 1, os limites das funções vectoriais de variável vectorial se calculam componente a
componente, reduzindo-se ao cálculo de m limites de funções reais.
Teorema 2.11 Sejam f : D ⊆ Rn → Rm , a ∈ D0 e b = (b1 , . . . , bm ) ∈ Rm . Então
lim f (x) = b ⇔ lim fi (x) = bi , ∀i = 1, . . . , m.
x→a x→a

Recordemos que, para funções de variável real, se lim f (x) 6= lim f (x), então não existe
x→a− x→a+
lim f (x). Para funções de mais de uma variável a análise da existência, ou não, de limite é mais
x→a
complicada uma vez que há uma infinidade de caminhos através dos quais x se pode aproximar de a
e o limite, a existir, tem que ser independente do modo como x → a. Portanto, se f (x) → L1 quando
x → a ao longo de uma curva C1 e f (x) → L2 quando x → a ao longo de uma curva C2 , com L1 6= L2 ,
então lim f (x) não existe. Tornamos esta ideia mais precisa com as seguintes definições.
x→a

Definição 2.12 Seja f : D ⊆ Rn → Rm e seja A ⊆ D. A restrição de f ao conjunto A é a função


f|A : A → Rm definida por f|A (x) = f (x), ∀x ∈ A.
Definição 2.13 Sejam f : D ⊆ Rn → Rm , A ⊆ D e a ∈ A0 . Dizemos que o limite de f no ponto
a, relativo ao conjunto A, é b, e escrevemos
lim f (x) = b ∈ Rm ,
x→a
x∈A

se, e só se, lim f|A (x) = b. Se A é a intersecção de D com uma recta passando por a, ao limite
x→a
relativo a A chamamos limite direccional de f em a.
Note-se que quando A = D as definições de limite e de limite relativo coincidem. Além disso, se f
tiver limite em a, todos os limites relativos de f em a existem e são iguais. Isto mostra que no caso
em que existem dois limites relativos distintos de f em a, então não existe lim f (x).
x→a
7x2 − y 3
Exemplos. 1) A função (x, y) 7→ 2 não tem limite quando (x, y) → (0, 0) uma vez que os
x + y2
limites relativos às rectas x = 0 e y = 0 são, respectivamente, 0 e 7.
x2 y
2) Mostremos, recorrendo à definição segundo Cauchy, que lim = 0. Para esse efeito
(x,y)→(0,0) x2 + y 2
x2
iremos fazer uso das desigualdades |y| ≤ k(x, y)k, ∀(x, y) ∈ R2 e 2 ≤ 1, ∀(x, y) ∈ R2 \ {(0, 0)}.
x + y2
x2 y
Dado δ > 0 queremos determinar ε > 0 tal que, se 0 < k(x, y)k < ε, então 2 < δ. Ora pelas

x + y2
desigualdades anteriores temos

x2 y x2
= |y| ≤ |y| ≤ k(x, y)k,

2
x + y2 x2 + y 2

pelo que basta tomar ε = δ.

Teorema 2.14 (Enquadramento) Sejam f, g, h : D ⊆ Rn → R funções escalares definidas num


subconjunto D de Rn e seja a ∈ D0 . Suponhamos que f (x) ≤ g(x) ≤ h(x), ∀x ∈ D e que lim f (x) =
x→a
lim h(x) = b ∈ R, então lim g(x) = b.
x→a x→a

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

20
Dizemos que uma função f : D ⊆ Rn → Rm é limitada se o conjunto f (D) for limitado, ou seja,
se existe M > 0 tal que kf (x)k ≤ M , ∀x ∈ D. O corolário que se segue é muito útil no cálculo de
limites.

Corolário 2.15 Sejam f, g : D ⊆ Rn → R funções escalares e seja a ∈ D0 . Se lim f (x) = 0 e g é


x→a
limitada, então lim f (x)g(x) = 0.
x→a

x+1
 
Aplicando o corolário anterior podemos concluir que lim xy sin = 0 uma vez que a
(x,y)→(0,0) y2
x+1
 
função (x, y) 7→ sin é limitada e lim xy = 0.
y2 (x,y)→(0,0)

São válidas as seguintes propriedades algébricas dos limites, que generalizam as já conhecidas para
funções reais de variável real.

Teorema 2.16 Sejam D um subconjunto de Rn , f, g : D ⊆ Rn → Rm funções vectoriais, λ : D → R


uma função real e a ∈ D0 . Suponhamos que lim f (x) = b, lim g(x) = c, onde b, c ∈ Rm , e que
x→a x→a
lim λ(x) = α ∈ R. Então tem-se:
x→a

i) lim (f (x) + g(x)) = b + c;


x→a

ii) lim f (x) · g(x) = b · c, onde · representa um produto interno;


x→a

iii) lim λ(x)f (x) = αb;


x→a

iv) lim kf (x)k = kbk.


x→a

Definição 2.17 Seja f : D ⊆ Rn → Rm e seja a ∈ D. A função f diz-se contı́nua em a se, e só se,

∀δ > 0 ∃ ε > 0 : x ∈ D ∧ kx − ak < ε ⇒ kf (x) − f (a)k < δ.

Se a for um ponto de acumulação de D, então f é contı́nua em a se, e só se,

lim f (x) = f (a) (∈ Rm ).


x→a

f diz-se contı́nua num conjunto S ⊆ D se for contı́nua em todos os pontos de S, f diz-se contı́nua
se é contı́nua em todos os pontos de D.

Atendendo à Definição 2.10, conclui-se que f : D ⊆ Rn → Rm é contı́nua em a ∈ D se, e só se,


para toda a sucessão (xk )k∈N em D tal que xk → a se tiver f (xk ) → f (a). Note-se ainda que qualquer
função é contı́nua num ponto isolado do seu domı́nio.
Resulta imediatamente do Teorema 2.11 o seguinte.

Teorema 2.18 Seja f : D ⊆ Rn → Rm e seja a ∈ D. Então f é contı́nua em a se, e só se, fi é


contı́nua em a, ∀i = 1, . . . , m.

O próximo resultado dá-nos algumas propriedades das funções contı́nuas, análogos aos já conheci-
dos para funções de variável real.

Teorema 2.19 Sejam f, g : D ⊆ Rn → Rm , ϕ : E ⊆ Rp → Rn tal que ϕ(E) ⊆ D e λ : D ⊆ Rn → R.


Então:
f
i) se f , g e λ são contı́nuas em a ∈ D, o mesmo sucede a kf k, f + g, λf , f · g, e ainda a se
λ
λ(a) 6= 0;
ii) se ϕ é contı́nua em a ∈ E e f é contı́nua em b = ϕ(a), então f ◦ ϕ é contı́nua em a.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

21
Do teorema anterior resulta, por indução, que somas, produtos e compostas de um número finito
de funções contı́nuas são funções contı́nuas. Assim, temos como exemplos de funções contı́nuas (nos
respectivos domı́nios) funções cujas componentes sejam funções polinomiais, racionais e funções que
resultem de somas, produtos e compostas de um número finito de funções polinomiais, racionais,
trigonométricas, exponenciais, logarı́tmicas, etc.

/ D. Se existir lim f (x) ∈ Rm podemos definir


Definição 2.20 Sejam f : D ⊂ Rn → Rm , a ∈ D0 e a ∈
x→a
uma nova função f˜ : D ∪ {a} → Rm dada por
(
f (x), se x ∈ D
f˜(x) = lim f (x), se x = a.
x→a

A função f˜ assim construı́da é contı́nua em a. Diz-se, por isso, o prolongamento por continuidade
de f ao ponto a.

sin(x2 + y 2 )
A função f (x, y) = pode ser prolongada por continuidade ao ponto (0, 0) uma vez
x2 + y 2
que lim f (x, y) = 1.
(x,y)→(0,0)

Definição 2.21 Um conjunto S ⊆ Rn diz-se conexo por arcos se quaisquer dois pontos de S podem
ser ligados por uma curva contida em S, isto é, dados x, y ∈ S existe uma linha parametrizada
γ : [a, b] → Rn tal que γ(a) = x, γ(b) = y e γ(t) ∈ S, ∀t ∈ [a, b].

Na figura que se segue, o conjunto U é conexo por arcos mas o conjunto S = A ∪ B não é.

Se f é uma função escalar contı́nua cujo domı́nio é conexo por arcos, é válida uma generalização
do teorema de Bolzano que conhecemos para funções reais de variável real. Com efeito, dado que os
subconjuntos conexos por arcos de R são os intervalos, o resultado enunciado no teorema que se segue,
no caso n = 1, diz que se f for contı́nua em [a, b], então f toma todos os valores entre f (a) e f (b).

Teorema 2.22 (Bolzano) Se f : X ⊆ Rn → R é contı́nua e X é um conjunto conexo por arcos,


então f (X) é um intervalo.

2.2 Derivadas parciais e derivadas direccionais


Nesta secção vamos começar por considerar funções com valores reais.

Definição 2.23 Sejam f : D ⊆ R2 → R e (x0 , y0 ) ∈ D ∩ D0 . A derivada parcial de f em ordem


a x no ponto (x0 , y0 ) é dada por
∂f f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) = fx (x0 , y0 ) = lim ,
∂x h→0 h
se este limite existir em R. A derivada parcial de f em ordem a y no ponto (x0 , y0 ) é dada por
∂f f (x0 , y0 + h) − f (x0 , y0 )
(x0 , y0 ) = fy (x0 , y0 ) = lim ,
∂y h→0 h
se este limite existir em R.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

22
∂f
Note-se que (x0 , y0 ) = g 0 (x0 ) onde g é a função real de variável real que se obtém, a partir de
∂x
f , fixando y = y0 e deixando variar apenas x: g(x) = f (x, y0 ). Esta derivada parcial dá-nos, pois, a
taxa de variação da função f em ordem à variável x, mantendo y fixo. O gráfico da função g é a curva
que resulta da intersecção da superfı́cie z = f (x, y) com o plano y = y0 . Assim, a derivada parcial
de f em ordem a x no ponto (x0 , y0 ) representa o declive da recta tangente a essa curva no ponto
(x0 , y0 , f (x0 , y0 )).

Conclusões análogas são válidas para a derivada parcial de f em ordem a y. Neste caso, fixamos o
∂f
valor de x e deixamos variar apenas y tendo-se (x0 , y0 ) = k 0 (y0 ) onde k é dada por k(y) = f (x0 , y).
∂y

Exemplo. Sendo f (x, y) = x2 + 2xy calculemos as derivadas parciais de f em ordem a x e em ordem


a y no ponto (x, y) = (1, 2). Fixando primeiro y = 2, seja g(x) = f (x, 2) = x2 + 4x. Então tem-se
g 0 (x) = 2x + 4 pelo que
∂f
(1, 2) = g 0 (1) = 6.
∂x
Fixando agora x = 1, seja k(y) = f (1, y) = 1 + 2y. Então tem-se k 0 (y) = 2 pelo que
∂f
(1, 2) = k 0 (2) = 2.
∂y
A noção de derivada parcial generaliza-se de forma natural ao caso de funções de mais de duas
variáveis.
Definição 2.24 Dada uma função f : D ⊆ Rn → R, definida numa vizinhança dum ponto a ∈ D, a
derivada parcial de f em ordem a xi , no ponto a, é dada por
∂f f (a1 , . . . , ai−1 , ai + h, ai+1 , . . . , an ) − f (a) f (a + hei ) − f (a)
(a) = fxi (a) = lim = lim ,
∂xi h→0 h h→0 h
se este limite existir em R (onde (e1 , . . . , en ) é a base canónica de Rn ).

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

23
Se f : D ⊆ Rn → R tiver derivada parcial em ordem a xi em todos os pontos de um aberto Di ⊆ D
chamamos função derivada parcial de f em ordem a xi à função definida em Di através da relação
x 7→ fxi (x), com i ∈ {1, . . . , n}. Analogamente ao caso n = 2, fxi é a derivada da função real de
variável real t 7→ f (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ).
Note-se ainda que, uma vez que as derivadas parciais de f se obtêm derivando a função em ordem
a uma das variáveis, mantendo as outras fixas, as regras de derivação já conhecidas para funções reais
de variável real permanecem válidas.
Se as funções derivadas parciais de f puderem por sua vez ser derivadas em ordem a alguma das
variáveis obtemos novas funções chamadas derivadas parciais de segunda ordem de f .
Assim, uma função de duas variáveis tem, caso existam, quatro derivadas parciais de segunda
ordem que se denotam por
∂2f ∂2f ∂2f ∂2f
fxx = , f xy = , f yx = e fyy = .
∂x2 ∂y∂x ∂x∂y ∂y 2
∂2f
Observemos que a notação fxy = significa que derivamos f primeiro em ordem a x e depois em
∂y∂x
∂2f
ordem a y, para fyx = a ordem de derivação é a oposta.
∂x∂y
Analogamente se definem derivadas parciais de ordem superior à segunda. Por exemplo, a derivada
parcial de terceira ordem fyyx obtém-se derivando f duas vezes em ordem a y e depois uma vez em
ordem a x.
Exemplo. Sendo f (x, y, z) = y 2 ex + z sin x, tem-se fx = y 2 ex + z cos x, fy = 2yex , fz = sin x,
fxy = 2yex , fxx = y 2 ex − z sin x e fxxz = − sin x.

Definição 2.25 Seja D um conjunto aberto. Uma função f : D ⊆ Rn → R diz-se de classe C k em


D, k ∈ N0 , e escreve-se f ∈ C k (D), se todas as suas derivadas parciais até à ordem k (inclusive)
forem funções contı́nuas em D. Uma função de classe C 0 em D é uma função contı́nua em D. f
diz-se de classe C ∞ em D, e escreve-se f ∈ C ∞ (D), se f ∈ C k (D), para todo k ∈ N0 .
Uma vez que somas, produtos e compostas de funções contı́nuas são funções contı́nuas, resulta que
somas, produtos e compostas de funções de classe C k são ainda funções de classe C k . É imediato a
partir da definição que C k+1 (D) ⊆ C k (D) se k > 0. A inclusão anterior permanece válida no caso
k = 0 e será justificada na próxima secção.
Teorema 2.26 (Schwarz) Se f é uma função de classe C 2 numa vizinhança do ponto (x0 , y0 ), então
∂2f ∂2f
(x0 , y0 ) = (x0 , y0 ).
∂y∂x ∂x∂y
O resultado anterior pode-se generalizar a funções de mais de duas variáveis e ao caso de derivadas
parciais de ordem superior à segunda. Se f ∈ C 4 (R3 ) pode-se mostrar, por exemplo, que fxxyz =
fxyzx = fyxzx . Note-se que em qualquer destes casos derivamos f duas vezes em ordem a x, uma vez
em ordem a y e uma vez em ordem a z, a ordem de derivação é que é indiferente.
Como vimos acima, as derivadas parciais de uma função real f dão-nos a taxa de variação de f
nas direcções dos eixos coordenados. A derivada direccional de uma função real f num ponto, que
definiremos de seguida, fornece-nos, por definição, a taxa de variação de f numa direcção arbitrária.
Definição 2.27 Dada uma função f : D ⊆ Rn → R, e a ∈ int D, a derivada de f , no ponto a,
segundo o vector u ∈ Rn é dada por
f (a + hu) − f (a)
fu0 (a) = lim ,
h→0 h
se este limite existir em R.
Se o vector u for unitário, isto é, se kuk = 1, a derivada de f , no ponto a, segundo o vector u
diz-se derivada direccional ou derivada dirigida de f , no ponto a, na direcção e sentido de u.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

24
∂f
Se u = ej (vector da base canónica de Rn , j = 1, . . . , n) tem-se fe0 j (a) = (a), ou seja, as
∂xj
derivadas parciais de f são derivadas direccionais nas direcções dos eixos coordenados. Veremos mais
adiante que, para muitas funções, todas as derivadas direccionais podem ser obtidas à custa das
derivadas parciais.
A figura que se segue permite-nos interpretar geometricamente o conceito de derivada direccional
no caso n = 2. Com efeito, intersectando o gráfico de f com o plano perpendicular ao plano xy que
contém a recta definida pelo ponto (x, y) e pelo vector unitário u = (u1 , u2 ), obtemos uma curva C
que é o gráfico da função real de variável real g(h) = f ((x, y) + h(u1 , u2 )). A derivada fu0 (x, y) é o
declive da recta tangente à curva C (também chamado declive da curva) no ponto (x, y, f (x, y)),
portanto fu0 (x, y) = g 0 (0).

Exemplo. Se f : D ⊆ Rn → R admite derivada segundo o vector v num ponto a ∈ int D, então


no ponto a, f admite derivada segundo o vector λv para qualquer λ ∈ R e tem-se fλv 0 (a) = λf 0 (a).
v
Assim, a derivada direccional de f , no ponto a, na direcção e sentido de um vector não nulo v é dada
por fu0 (a) = kvk
1
fv0 (a) onde u = kvk
v
(cf. Ficha 2).
As noções de derivada parcial e de derivada segundo um vector estendem-se de modo natural às
funções vectoriais f : D ⊆ Rn → Rm . Em vez de números reais, estas derivadas são agora vectores de
Rm cujas componentes são exactamente as correspondentes derivadas das m funções componentes de
f . Tem-se assim a seguinte definição.
Definição 2.28 Dada uma função f : D ⊆ Rn → Rm , e a ∈ int D, a derivada de f , no ponto a,
segundo o vector u ∈ Rn é dada por
f (a + hu) − f (a)
fu0 (a) = lim
h→0 h
se este limite existir em Rm . Neste caso, fu0 (a) é um vector de Rm .
Se o vector u for unitário, isto é se kuk = 1, a derivada de f , no ponto a, segundo o vector u
diz-se derivada direccional ou derivada dirigida de f , no ponto a, na direcção e sentido de u.
∂f
Se u = ej tem-se fe0 j (a) = (a), sendo estas derivadas parciais vectores de Rm .
∂xj
Exemplo. Seja f (x, y, z) = (ex + y 2 − 3z, xy 3 z 2 ). Então
fx = (ex , y 3 z 2 ), fy = (2y, 3xy 2 z 2 ), fz = (−3, 2xy 3 z)
donde
fx (0, 1, 2) = (1, 4), fy (0, 1, 2) = (2, 0), fz (0, 1, 2) = (−3, 0).
Podemos ainda generalizar para funções vectoriais a noção de função de classe C k .
Definição 2.29 Seja f : D ⊆ Rn → Rm , f = (f1 , f2 , . . . , fm ). A função f diz-se de classe C k em
D, k ∈ N0 , (respectivamente, de classe C ∞ em D) se fi ∈ C k (D), ∀i = 1, . . . , m, (respectivamente,
fi ∈ C ∞ (D), ∀i = 1, . . . , m).

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

25
2.3 Funções diferenciáveis, noção de gradiente e de matriz jacobiana
Vamos ver nesta secção o que se entende por diferenciabilidade de uma função

f : D ⊆ Rn → R.

Recordemos que uma função real de variável real f se diz diferenciável num ponto a quando tem
derivada finita nesse ponto. Este facto implica a continuidade de f em a. De forma a preservarmos
esta propriedade para funções de duas ou mais variáveis não podemos definir diferenciabilidade de
f num ponto a ∈ Rn como sendo equivalente à existência (em R) das derivadas parciais de f em
a. Com efeito, existem exemplos de funções que têm derivadas parciais finitas num ponto (e que até
admitem derivadas direccionais finitas em qualquer direcção) mas que são descontı́nuas nesse ponto.
Isto acontece uma vez que a existência de derivadas parciais reflecte o comportamento da função
apenas em segmentos de recta paralelos aos eixos coordenados enquanto que a continuidade de f num
certo ponto está relacionada com o comportamento da função numa vizinhança desse ponto.
Exemplo. Seja 
 2xy

, (x, y) 6= (0, 0)
f (x, y) = x2 + y 2 (3)
0, (x, y) = (0, 0).

Então tem-se
f (h, 0) − f (0, 0) f (0, h) − f (0, 0)
fx (0, 0) = lim = 0 e fy (0, 0) = lim = 0,
h→0 h h→0 h
no entanto f é descontı́nua em (0, 0) uma vez que não existe lim f (x, y). Com efeito, os limites
(x,y)→(0,0)
de f relativos às rectas x = 0 e x = y são, respectivamente, 0 e 1.

Definição 2.30 Seja f : D ⊆ Rn → R e seja a um ponto interior de D. Se f tem derivadas parciais


de primeira ordem em a chamamos gradiente de f no ponto a ao vector
∂f ∂f ∂f
 
∇f (a) = (a), (a), . . . , (a) .
∂x1 ∂x2 ∂xn
Exemplo. Sendo f (x, y) = exy , tem-se fx = yexy e fy = xexy , ∀(x, y) ∈ R2 , donde

∇f (0, −1) = (−1, 0) e ∇f (1, 2) = (2e2 , e2 ).

Uma função real de variável real f é diferenciável num ponto a do interior do seu domı́nio se, e só
se, tem derivada finita f 0 (a) dada por
f (a + h) − f (a)
f 0 (a) = lim .
h→0 h
Assim, tem-se
f (a + h) − f (a) − hf 0 (a)
lim = 0.
h→0 |h|
A relação anterior ainda se pode escrever na forma

f (a + h) = f (a) + f 0 (a)h + o(h), (h → 0)

o que significa que podemos aproximar a diferença f (a + h) − f (a) pela função, linear em h, f 0 (a)h
sendo o erro cometido nesta aproximação um infinitésimo de ordem superior a h, quando h → 0.
Notemos ainda que, pondo h = x − a, a relação anterior permite concluir que, numa vizinhança do
ponto a, a função f (x) pode ser aproximada pela função g(x) = f (a) + f 0 (a)(x − a) cujo gráfico é a
f (x) − g(x)
recta tangente ao gráfico de f no ponto a, tendo-se lim = 0.
x→a x−a
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

26
Para uma função escalar de n variáveis tem-se a seguinte definição.
Definição 2.31 Sejam f : D ⊆ Rn → R e a ∈ int D. A função f diz-se diferenciável no ponto a
se, e só se, existir um vector y ∈ Rn tal que
f (a + h) − f (a) − y · h
lim =0 (h ∈ Rn ). (4)
h→0 khk
É fácil de ver que, quando existe um vector y nas condições anteriores, ele é único. Veremos de
seguida que se tem y = ∇f (a).
Teorema 2.32 Sejam f : D ⊆ Rn → R, a ∈ int D e suponhamos que f é diferenciável em a. Então
existem todas as derivadas parciais de primeira ordem de f no ponto a e o vector y de (4) é dado por
y = ∇f (a).
Atendendo ao teorema anterior concluimos assim que uma função f : D ⊆ R2 → R é diferenciável
num ponto (a, b) do interior de D se, para |h| e |k| suficientemente pequenos, se tiver
f (a + h, b + k) = f (a, b) + fx (a, b)h + fy (a, b)k + ε(h, k) = f (a, b) + ∇f (a, b) · (h, k) + ε(h, k),
onde ε(h, k) = o(k(h, k)k), (k(h, k)k → 0). Pondo h = x − a e k = y − b vê-se assim que, numa
vizinhança do ponto (a, b), f (x, y) pode ser aproximada pela função
g(x, y) = f (a, b) + fx (a, b)(x − a) + fy (a, b)(y − b)
cujo gráfico é um plano que passa no ponto P (a, b, f (a, b)) pertencente também ao gráfico de f .
Este plano é o que melhor aproxima o gráfico de f em pontos (x, y) próximos de (a, b) uma vez que
f (x, y) − g(x, y)
lim = 0, por isso dizemos que é o plano tangente ao gráfico de f no ponto
(x,y)→(a,b) k(x − a, y − b)k
(a, b, f (a, b)). De facto, veremos mais adiante que o plano definido por z = g(x, y) contém todas as
rectas tangentes ao gráfico de f no ponto P .

Verificamos assim que uma função diferenciável de uma variável real, f , pode ser aproximada
por uma função cujo gráfico é a recta tangente ao gráfico de f , na passagem para duas variáveis a
aproximação é dada por um plano.
O resultado que se segue dá-nos a esperada relação entre diferenciabilidade e continuidade.
Teorema 2.33 Seja f : D ⊆ Rn → R uma função real definida numa vizinhança do ponto a ∈ D. Se
f é diferenciável em a, então f é contı́nua em a.
A diferenciabilidade de uma função num ponto é, por vezes, de verificação morosa. Nalguns casos
pode ser útil ter em conta a seguinte condição suficiente de diferenciabilidade.
Teorema 2.34 Se a função f : D ⊆ Rn → R tem derivadas parciais contı́nuas numa vizinhança do
ponto a, então f é diferenciável em a.
Mencionámos no inı́cio desta secção que o facto de existirem as derivadas parciais de f não é
suficiente para garantir a diferenciabilidade da função, nem sequer a sua continuidade. O teorema
anterior mostra, no entanto, que se f tem derivadas parciais contı́nuas numa vizinhança do ponto a,
então f é diferenciável em a. Em particular, toda a função de classe C 1 é diferenciável.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

27
Exemplo. Voltemos a considerar a função definida em (3). Como vimos, fx (0, 0) = 0, fy (0, 0) = 0
e f não é contı́nua em (0, 0) pelo que f também não é diferenciável nesse ponto. Por outro lado, as
derivadas parciais de f existem em qualquer ponto (x, y) 6= (0, 0) tendo-se
2y 3 − 2x2 y 2x3 − 2xy 2
fx (x, y) = e fy (x, y) = .
(x2 + y 2 )2 (x2 + y 2 )2
Resulta então do teorema anterior que pelo menos uma destas derivadas parciais terá que ser des-
contı́nua em (0, 0). De facto, não é difı́cil mostrar que não existe o limite lim fx (x, y), pois
(x,y)→(0,0)
x=0
2
fx (0, y) = , o que prova que fx é descontı́nua em (0, 0).
y
Vejamos agora, para o caso de uma função diferenciável f , qual a relação entre a derivada direc-
cional num ponto e o vector gradiente.

Teorema 2.35 Seja f : D ⊆ Rn → R uma função diferenciável no ponto a ∈ int D. Então f tem
derivada segundo qualquer vector u ∈ Rn , no ponto a, e tem-se

fu0 (a) = ∇f (a) · u.

Vê-se assim que se f é diferenciável em a, então a aplicação T : Rn → R definida por u 7→ fu0 (a) é
linear.

Exemplo. Consideremos a função polinomial definida em R3 por

f (x, y, z) = 3x2 yz + xz 4 − 4y. (5)

f é diferenciável em R3 e tem-se ∇f (x, y, z) = (6xyz + z 4 , 3x2 z − 4, 3x2 y + 4xz 3 ). Assim, a derivada


de f , segundo o vector v = (6, 1, −2), no ponto (0, 1, −1), é

fv0 (0, 1, −1) = ∇f (0, 1, −1) · (6, 1, −2) = (1, −4, 0) · (6, 1, −2) = 2.

Teorema 2.36 Seja f uma função diferenciável em a ∈ int D. Então o valor máximo da derivada
direccional fu0 (a) é k∇f (a)k e ocorre quando u tem a direcção e sentido do vector ∇f (a).

Assim, k∇f (a)k corresponde ao valor máximo da taxa de variação de f no ponto a e esse máximo
ocorre na direcção e sentido do vector ∇f (a). Esta é, então, a direcção e sentido em que a função f
aumenta mais rapidamente no ponto a.
0
Exemplo. Para √ a função f definida em (5) o valor máximo da derivada direccional fu (0, 1, −1) é
k∇f (0, 1, −1)k = 17 e ocorre na direcção e sentido do vector ∇f (0, 1, −1) = (1, −4, 0).

Supondo agora que f : D ⊆ Rn → Rm é uma função vectorial, vimos na Definição 2.28 que fu0 (a)
é um vector de Rm que, atendendo ao Teorema 2.11, tem por componentes as derivadas das funções
fi , i = 1, . . . , m, no ponto a, segundo o vector u, isto é,

fu0 (a) = ((f1 )0u (a), (f2 )0u (a), . . . , (fm )0u (a))

onde
fi (a + hu) − fi (a)
(fi )0u (a) = lim , i = 1, . . . , m.
h→0 h
Supondo que todas as funções fi : D ⊆ Rn → R são diferenciáveis no ponto a, pelo Teorema 2.35,
temos que
(fi )0u (a) = ∇fi (a) · u
pelo que
fu0 (a) = (∇f1 (a) · u, ∇f2 (a) · u, . . . , ∇fm (a) · u).
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

28
Usando a notação matricial podemos escrever
 ∂f1 ∂f1 ∂f1 
∂x1 ∂x2 ... ∂xn

u1
 
∇f1 (a)
 
u1

       
       
 ∂f2 ∂f2 ∂f2    ∇f (a)
 ∂x1

∂x2 ... ∂xn



 u2   2



 u2 

0
     
fu (a) =  · = ·
   

 .
 . .. .. ..  
 ..  
..  
.. 
.
 
.
 
.

 . . . .       
      
       
 
∂fm ∂fm ∂fm un ∇fm (a) un
∂x1 ∂x2 ... ∂xn (a) m×n n×1

identificando a matriz coluna m × 1 resultante com o vector de Rm correspondente.

∂fi
Definição 2.37 Seja f : D ⊆ Rn → Rm e seja a ∈ D tal que as derivadas parciais , i = 1, . . . , m,
∂xj
j = 1, . . . , n, existem no ponto a. À matriz
 ∂f1 ∂f1 ∂f1 
∂x1 ∂x2 ... ∂xn

∇f1 (a)

   
   
 ∂f2 ∂f2 ∂f2   ∇f (a)
 ∂x1

∂x2 ... ∂xn

  2


 
Jf (a) =  =
  

 .
 . .. .. ..  
 .. 
.

 . . . .   
  
   
 
∂fm ∂fm ∂fm ∇fm (a)
∂x1 ∂x2 ... ∂xn (a)

dá-se o nome de matriz jacobiana de f no ponto a.


Quando m = n o determinante da matriz Jf (a) diz-se o jacobiano da função f no ponto a e
representa-se por
∂(f1 , f2 , . . . , fn )
det Jf (a) = (a).
∂(x1 , x2 , . . . , xn )

Exemplo. Seja f : R3 → R3 dada por f (x, y, z) = (sin(xyz), x2 − yez , x + yz). Tem-se


   
yz cos(xyz) xz cos(xyz) xy cos(xyz) 0 0 −8
   
   
Jf (4, −2, 0) =  2x −ez −yez =  8 −1 2 .
   

   
   
1 z y (4,−2,0)
1 0 −2

Assim, det Jf (4, −2, 0) = −8 e, para u = (1, 0, −1), vem


     
0 0 −8 1 8
     
     
fu0 (4, −2, 0) =  8 −1 2 · 0 = 6 
     
     
     
1 0 −2 −1 3

pelo que fu0 (4, −2, 0) = (8, 6, 3). Cada componente deste vector é a derivada da correspondente função
componente de f , segundo o vector u, no ponto (4, −2, 0).

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

29
Vejamos finalmente como estender a noção de diferenciabilidade a funções vectoriais
f : D ⊆ Rn → Rm .
Definição 2.38 Sejam f : D ⊆ Rn → Rm e a ∈ int D. A função f diz-se diferenciável no ponto
a se, e só se, existir uma aplicação linear T : Rn → Rm tal que
f (a + h) − f (a) − T (h)
lim = 0. (6)
h→0 khk
Portanto, a função f : D ⊆ Rn → Rm é diferenciável no ponto a se a diferença f (a + h) − f (a)
puder ser aproximada por uma função linear T (h), sendo o erro cometido um infinitésimo que tende
para zero mais rapidamente do que h, quando h → 0. À aplicação linear T da definição anterior
chama-se derivada de f no ponto a e escreve-se T = f 0 (a) = Df (a).
Note-se que a definição anterior generaliza às funções vectoriais a noção de diferenciabilidade
definida atrás para o caso f : D ⊆ Rn → R uma vez que, como vimos, a aplicação
T : Rn → R
h 7→ ∇f (a) · h
é linear.
Denotemos por A a matriz da aplicação linear T relativamente às bases canónicas de Rn e Rm .
Sabe-se da Álgebra Linear que
T (h) = A · h, ∀h ∈ Rn .
À semelhança dos Teoremas 2.11 e 2.18 tem-se o seguinte resultado.
Teorema 2.39 Sejam f : D ⊆ Rn → Rm e a ∈ int D. Então f é diferenciável em a se, e só se, fi é
diferenciável em a, ∀i = 1, . . . , m.
Nota. Da demonstração do teorema anterior resulta que a matriz A é a matriz jacobiana de f no
ponto a. É então imediato o próximo teorema, que generaliza ao caso das funções vectoriais resultados
já conhecidos para funções reais.
Teorema 2.40 Sejam f : D ⊆ Rn → Rm e a ∈ int D. Se f é diferenciável em a, então:
1. f é contı́nua em a;
2. existem todas as derivadas parciais de primeira ordem de f no ponto a;
3. a aplicação linear T da expressão (6) é única e a sua matriz relativamente às bases canónicas
de Rn e Rm é a matriz jacobiana Jf (a);
4. a função f tem derivada no ponto a segundo qualquer vector u ∈ Rn e tem-se
fu0 (a) = T (u) = f 0 (a)(u);

5. a aplicação de Rn para Rm definida por u 7→ fu0 (a) é linear.


Exemplo. Consideremos a função f : R2 → R3 definida por f (x, y) = (2x + 3y, y 2 − x3 , exy ). f é
diferenciável em R2 uma vez que as suas funções componentes são de classe C ∞ (R2 ). Assim, f 0 (0, 2)
é a aplicação linear f 0 (0, 2) : R2 → R3 cuja matriz relativamente às bases canónicas de R2 e de R3 é a
matriz jacobiana de f no ponto (0, 2). Como
   
2 3 2 3
   
   
Jf (0, 2) =  −3x2 2y = 0 4 
   

   
   
yexy xexy (0,2)
2 0
concluimos que f 0 (0, 2)(x, y) = (2x + 3y, 4y, 2x). Daqui resulta que a derivada de f , no ponto (0, 2),
segundo o vector (−3, 1) é f 0 (0, 2)(−3, 1) = (−3, 4, −6).
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

30
2.4 Derivação da função composta

Recordemos a regra de derivação da função composta para funções reais de variável real. Se y = f (x),
onde f é diferenciável em x0 = g(t0 ), e x = g(t), onde g é diferenciável em t0 , então a função composta
y = f (g(t)) é diferenciável em t0 e tem-se

y 0 (t0 ) = (f ◦ g)0 (t0 ) = f 0 (g(t0 ))g 0 (t0 ) = f 0 (x0 )g 0 (t0 ) (7)

ou, em notação abreviada,


dy dy dx
(t0 ) = (x0 ) (t0 ).
dt dx dt
Vamos agora generalizar este resultado ao caso em que as funções intervenientes são funções vec-
toriais de várias variáveis.
Começamos com um caso simples: suponhamos que y = f (x), onde

f :D⊆R→R

é uma função diferenciável em x0 = g(t0 ), e x = g(t) = g(t1 , t2 , . . . , tp ), onde

g : A ⊆ Rp → R

é diferenciável em t0 e g(A) ⊆ D. Então a função composta

y = f (g(t1 , t2 , . . . , tp ))

é diferenciável em t0 . Atendendo a que, para calcularmos as derivadas parciais de y em ordem a ti ,


i = 1, . . . , p, deixamos variar apenas a variável ti , mantendo fixas as restantes, resulta imediatamente
de (7) que
∂ ∂g
(f ◦ g)(t0 ) = f 0 (x0 ) (t0 )
∂ti ∂ti
ou, em notação abreviada,
∂y dy ∂x
(t0 ) = (x0 ) (t0 ).
∂ti dx ∂ti
Note-se que nesta notação abreviada y está a representar duas funções diferentes, no primeiro membro
da equação a função composta f ◦ g, e no segundo membro apenas f .
Exemplo. Seja z(x, y) = f (sin(xy)) onde f : R → R é uma função de classe C 1 . Determinemos
∂z ∂z 0
∂x (π, 1) e ∂y (π, 1), sabendo que f (0) = 2. Pondo u(x, y) = sin(xy) obtemos

∂z ∂u
= f 0 (u) = f 0 (u) y cos(xy)
∂x ∂x
e
∂z ∂u
= f 0 (u) = f 0 (u) x cos(xy).
∂y ∂y
No ponto (x, y) = (π, 1) tem-se u(π, 1) = sin(π) = 0 donde

∂z
(π, 1) = f 0 (0) cos(π) = −2
∂x
e
∂z
(π, 1) = f 0 (0)π cos(π) = −2π.
∂y

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

31
Teorema 2.41 (Regra da Cadeia - Caso 1) Seja

f : D ⊆ Rn → R
x = (x1 , . . . , xn ) 7→ y = f (x)

uma função diferenciável em x0 ∈ int D e seja

g : A ⊆ R → Rn
t 7→ x = (g1 (t), . . . , gn (t))

uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g : A ⊆ R → R é diferenciável em t0 e tem-se
n
0 0 ∂f
(x0 )gi0 (t0 )
X
(f ◦ g) (t0 ) = ∇f (x0 ) · g (t0 ) =
i=1
∂xi

ou, em notação abreviada,


n
dy X ∂y dxi
(t0 ) = (x0 ) (t0 ).
dt i=1
∂xi dt

Tal como no caso anterior, nesta notação abreviada y está a representar duas funções diferentes,
no primeiro membro da equação a função composta f ◦ g, e no segundo membro apenas f . Neste
teorema intervêm três tipos de variáveis: a t chamamos a variável independente, x1 , . . . , xn dizem-se
variáveis intermédias e y é a variável dependente. O teorema anterior é conhecido por regra da cadeia
uma vez que há uma cadeia de dependências entre as várias variáveis nele intervenientes. Com efeito,
a variável dependente y depende das variáveis intermédias x1 , . . . , xn , que por sua vez dependem da
variável independente t. O que este resultado nos diz é que para obtermos a derivada da função
dy
composta, , temos que somar as derivadas “sobre todos os caminhos presentes na cadeia, que vão
dt
de y a t”.

Exemplos. 1) Sejam f (x, y) = x2 y e γ : I ⊆ R → R2 uma linha parametrizada de classe C 1


tal que γ(I) representa a trajectória de uma partı́cula em movimento que no instante t = 5 ocupa a
posição (1, 4) e tem vector velocidade (−1, 7). Sendo h(t) = f (γ(t)), calculemos h0 (5). Uma vez que
∇f (x, y) = (2xy, x2 ), tem-se

h0 (5) = ∇f (γ(5)) · γ 0 (5) = ∇f (1, 4) · (−1, 7) = (8, 1) · (−1, 7) = −1.

2) Seja w = f (x, y, z), onde f : R3 → R é de classe C 1 , e x = et , y = sin t, z = 2t−1. Determinemos


w0 (0) sabendo que ∇f (1, 0, −1) = (3, −2, 3). De acordo com o teorema anterior,

w0 (t) = ∇f (x(t), y(t), z(t)) · (x0 (t), y 0 (t), z 0 (t)) = ∇f (x(t), y(t), z(t)) · (et , cos t, 2)

pelo que

w0 (0) = ∇f (x(0), y(0), z(0)) · (1, 1, 2) = ∇f (1, 0, −1) · (1, 1, 2) = (3, −2, 3) · (1, 1, 2) = 7.

O próximo teorema contempla a situação em que compomos uma função real de variável vectorial
com uma função vectorial de variável vectorial.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

32
Teorema 2.42 (Regra da Cadeia - Caso 2) Seja
f : D ⊆ Rn → R
x = (x1 , . . . , xn ) 7→ y = f (x)
uma função diferenciável em x0 ∈ int D e seja
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g é diferenciável em t0 e tem-se
n
∂(f ◦ g) ∂g1 ∂gn ∂f ∂gj
 X 
(t0 ) = ∇f (x0 ) · (t0 ), . . . , (t0 ) = (x0 ) (t0 ), i = 1, . . . , p
∂ti ∂ti ∂ti j=1
∂xj ∂ti

ou, em notação abreviada,


n
∂y X ∂y ∂xj
(t0 ) = (x0 ) (t0 ), i = 1, . . . , p
∂ti j=1
∂xj ∂ti

onde usamos, por abuso de notação, y para representar quer a função composta f ◦ g, quer apenas f .
Tal como no caso anterior, temos aqui três tipos de variáveis ligadas por uma cadeia de de-
pendências: a variável dependente y depende das variáveis intermédias x1 , . . . , xn , que por sua vez
dependem das variáveis independentes t1 , . . . , tp . Note-se que existem tantas derivadas parciais da
função composta quanto o número de variáveis independentes, cada uma destas é dada por uma soma
de n parcelas, sendo n o número de variáveis intermédias, que representam os n “caminhos na cadeia
que vão de y a ti ”, i = 1, . . . , p.
Usando a notação matricial, as últimas igualdades do teorema anterior ainda se podem escrever
na forma
 
∂x1 ∂x1 ∂x1
∂t1 ∂t2 ... ∂tp
 
 
 
 ∂x2 ∂x2
... ∂x2 
i  ∂t1 ∂t2 ∂tp
h i h 
∂y ∂y ∂y ∂y ∂y ∂y 
∂t1 ∂t2 ... ∂tp = ∂x1 ∂x2 ... ∂xn ·  .
 .. .. ..
 

 . . . 
 
 
 
∂xn ∂xn ∂xn
∂t1 ∂t2 ... ∂tp

O cálculo de derivadas parciais de ordem superior à primeira para funções compostas faz-se apli-
cando tantas vezes quantas necessário o teorema anterior.
Exemplos. 1) Seja z = f (x, y), onde f : R2 → R é de classe C 1 , e suponhamos que x = s + t,
y = s − t. Verifiquemos que se tem
2 2
∂z ∂z ∂z ∂z
 
− = .
∂x ∂y ∂s ∂t
A figura que se segue mostra a cadeia de dependências das variáveis neste caso.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

33
Assim temos,
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = +
∂s ∂x ∂s ∂y ∂s ∂x ∂y
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = −
∂t ∂x ∂t ∂y ∂t ∂x ∂y
donde se conclui o pretendido.
2) Seja u = y 2 sin x ez onde

x = r2 st, y = s + t2 e z = r + s + t. (8)

∂u ∂u ∂u
Calculemos , e no ponto (r, s, t) = (2, 1, 0).
∂r ∂s ∂t

Pela regra da cadeia, e atendendo às relações (8) e ao facto de se ter x(2, 1, 0) = 0, y(2, 1, 0) = 1 e
z(2, 1, 0) = 3, obtemos
 ∂x ∂x ∂x 
 ∂r ∂s ∂t 
 
 
∂u ∂u ∂u
   
∂u ∂u ∂u  ∂y

∂y ∂y 
= ·

∂x ∂y ∂z (0,1,3) 

∂r ∂s ∂t (2,1,0)  ∂r ∂s ∂t 

 

∂z ∂z ∂z 
∂r ∂s ∂t (2,1,0)
2rst r2 t r2 s
 
 
h i  
2 z z 2 z
= y cos x e 2y sin x e y sin x e · 0 1 2t 
 
(0,1,3)  
 
1 1 1 (2,1,0)
 
0 0 4
 
h i   h i
= e3 0 0 · 0 1 0 = 0 0 4e3
 
 
 
1 1 1

∂u ∂u ∂u
donde (2, 1, 0) = 0, (2, 1, 0) = 0 e (2, 1, 0) = 4e3 .
∂r ∂s ∂t
3) Seja z = f (x, y), onde f : R2 → R é uma função de classe C 2 , e suponhamos que x = r2 − s2 ,
∂2z
y = r2 + s2 . Pretende-se calcular . Para esse efeito, começamos por aplicar a regra da cadeia
∂s∂r
∂z
para obter :
∂r
∂z ∂z ∂x ∂z ∂y ∂z ∂z
 
= + = 2r + .
∂r ∂x ∂r ∂y ∂r ∂x ∂y

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

34
∂z
Temos agora que derivar em ordem a s o que implica derivar cada uma das funções compostas
∂r
∂z ∂z
e em ordem a s. Aplicamos então a regra da cadeia a cada uma destas funções: no primeiro
∂x ∂y
caso a cadeia de dependências das variáveis é

donde
∂ ∂z ∂ 2 z ∂x ∂ 2 z ∂y ∂2z ∂2z
 
(x(r, s), y(r, s)) = + = −2s + 2s .
∂s ∂x ∂x2 ∂s ∂y∂x ∂s ∂x2 ∂y∂x
Analogamente,
∂ ∂z ∂ 2 z ∂x ∂ 2 z ∂y ∂2z ∂2z
 
(x(r, s), y(r, s)) = + 2 = −2s + 2s 2 ,
∂s ∂y ∂x∂y ∂s ∂y ∂s ∂x∂y ∂y
pelo que obtemos por fim
!
∂2z ∂ ∂z ∂ ∂z ∂2z ∂2z
   
= 2r + 2r = 4rs − ,
∂s∂r ∂s ∂x ∂s ∂y ∂y 2 ∂x2
∂2z ∂2z
atendendo ao facto de = por f ser de classe C 2 .
∂x∂y ∂y∂x
Finalmente para
f : D ⊆ Rn → Rm
x = (x1 , . . . , xn ) 7→ y = (f1 (x), . . . , fm (x))
e
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
podemos aplicar o Caso 2 a cada uma das componentes de f = (f1 , . . . , fm ) e obtém-se o seguinte
resultado:
Teorema 2.43 (Regra da Cadeia - Caso Geral) Seja
f : D ⊆ Rn → Rm
x = (x1 , . . . , xn ) 7→ y = (f1 (x), . . . , fm (x))
uma função diferenciável em x0 ∈ int D e seja
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g é diferenciável em t0 e tem-se
(f ◦ g)0 (t0 ) = f 0 (x0 ) ◦ g 0 (t0 )
donde
Jf ◦g (t0 ) = Jf (x0 ) · Jg (t0 )
ou seja, em notação abreviada,
n
∂yk X ∂yk ∂xj
(t0 ) = (x0 ) (t0 ), i = 1, . . . , p, k = 1, . . . , m.
∂ti j=1
∂xj ∂ti

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

35
2.5 Plano tangente e recta normal a uma superfı́cie

A regra da cadeia permite-nos demonstrar a seguinte propriedade geométrica do vector gradiente.

Teorema 2.44 Sejam f : D ⊆ R2 → R uma função de classe C 1 , (x0 , y0 ) ∈ int D e k = f (x0 , y0 ).


Suponhamos que a curva de nı́vel da função f que passa em (x0 , y0 ), Ck = {(x, y) ∈ D : f (x, y) = k},
é a imagem da linha parametrizada γ : I ⊆ R → R2 , γ(t) = (x(t), y(t)), onde γ é diferenciável,
γ(t0 ) = (x0 , y0 ) para algum t0 ∈ I e γ 0 (t0 ) 6= (0, 0). Então tem-se

∇f (x0 , y0 ) · γ 0 (t0 ) = 0.

Nas condições do teorema anterior, dizemos que o vector ∇f (x0 , y0 ) é ortogonal (ou normal) à
curva de nı́vel Ck que passa no ponto (x0 , y0 ). Assim, se ∇f (x0 , y0 ) 6= (0, 0), uma equação da recta
tangente a esta curva no ponto γ(t0 ) = (x0 , y0 ) é dada por ∇f (x0 , y0 ) · (x − x0 , y − y0 ) = 0.

Este resultado pode ser generalizado para uma superfı́cie de nı́vel em R3 ,

Ck = {(x, y, z) ∈ D : F (x, y, z) = k} .

Neste caso, o mesmo argumento usado para demonstrar o teorema anterior, permite mostrar que o
vector n = ∇F (x0 , y0 , z0 ), para cada ponto (x0 , y0 , z0 ) pertencente a Ck , é ortogonal ao vector tangente
a qualquer curva diferenciável da superfı́cie Ck que passa por (x0 , y0 , z0 ). Por esse motivo dizemos que
o vector n é um vector normal à superfı́cie de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ). Estas
considerações motivam as definições que se seguem.

Definição 2.45 Seja F : D ⊆ R3 → R uma função de classe C 1 e seja (x0 , y0 , z0 ) um ponto perten-
cente à superfı́cie de nı́vel k de F tal que ∇F (x0 , y0 , z0 ) 6= (0, 0, 0). O plano tangente à superfı́cie
de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ) é o plano de equação

∇F (x0 , y0 , z0 ) · ((x, y, z) − (x0 , y0 , z0 )) = 0.

O vector n = ∇F (x0 , y0 , z0 ) (ou qualquer múltiplo deste) diz-se um vector normal à superfı́cie no
mesmo ponto.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

36
É fácil ver que o plano tangente à superfı́cie esférica de equação x2 + y 2 + z 2 = a2 num ponto
(x0 , y0 , z0 ) é dado por 2x0 (x − x0 ) + 2y0 (y − y0 ) + 2z0 (z − z0 ) = 0 ⇔ xx0 + yy0 + zz0 = a2 .
Definição 2.46 A recta normal à superfı́cie de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ) dessa
superfı́cie é a recta que passa em (x0 , y0 , z0 ) e que tem a direcção do vector não nulo ∇F (x0 , y0 , z0 ).
Assim, as equações paramétricas da recta normal são

 x = x0 + Fx (x0 , y0 , z0 ) t

y = y0 + Fy (x0 , y0 , z0 ) t
 z = z + F (x , y , z ) t, t ∈ R.

0 z 0 0 0

No caso particular em que a superfı́cie F (x, y, z) = k pode ser escrita na forma z = g(x, y) (na
próxima secção veremos algumas circunstâncias em que isto acontece) o respectivo plano tangente, no
ponto (x0 , y0 , z0 ), é dado por
z − z0 = gx (x0 , y0 )(x − x0 ) + gy (x0 , y0 )(y − y0 ),
e as equações paramétricas da recta normal são

 x = x0 + gx (x0 , y0 ) t

y = y0 + gy (x0 , y0 ) t
 z = z − t, t ∈ R.

0

Exemplos. 1) Escrever equações do plano tangente e da recta normal à superfı́cie dada por
z = 3x2 + y 2 no ponto (1, 2, 7).
Pondo g(x, y) = 3x2 + y 2 , a superfı́cie consiste no conjunto dos pontos (x, y, z) que satisfazem
z = g(x, y), ou seja, é o gráfico de g. Como gx = 6x, gx (1, 2) = 6, gy = 2y, gy (1, 2) = 4, o plano
tangente pedido é o plano de equação
z − 7 = 6(x − 1) + 4(y − 2) ⇔ 6x + 4y − z = 7.
O vector n = (gx (1, 2), gy (1, 2), −1) = (6, 4, −1) é normal à referida superfı́cie no ponto (1, 2, 7) pelo
que a recta normal tem equações paramétricas

 x = 1 + 6t

y = 2 + 4t
 z = 7 − t, t ∈ R.

2) Determinar o plano tangente ao cone elı́ptico x2 + 4y 2 = z 2 no ponto (3, 2, 5).


O cone em causa é a superfı́cie de nı́vel c = 0 da função F (x, y, z) = x2 + 4y 2 − z 2 . Uma vez que
∇F (x, y, z) = (2x, 8y, −2z), tem-se que ∇F (3, 2, 5) = (6, 16, −10) pelo que o plano tangente pedido é
dado por
∇F (3, 2, 5) · (x − 3, y − 2, z − 5) = 0 ⇔ 6(x − 3) + 16(y − 2) − 10(z − 5) = 0
⇔ 3x + 8y − 5z = 0.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

37
Terminamos esta secção com uma consequência do Teorema de Lagrange.
Teorema 2.47 (Teorema do Valor Médio) Seja f : D ⊆ Rn → R uma função contı́nua no aberto
D, e sejam a, b ∈ D tais que D contém o segmento de recta de extremidades a e b, ou seja, todos
os pontos da forma x = a + t(b − a), t ∈ [0, 1]. Se f é diferenciável em todos os pontos de S =
{x ∈ Rn : x = a + t(b − a), 0 < t < 1}, então existe um ponto c ∈ S tal que
f (b) − f (a) = ∇f (c) · (b − a).
Um conjunto D diz-se convexo se, para quaisquer a, b ∈ D, o segmento de recta de extremidades
a e b estiver contido em D.

conjunto convexo conjunto não convexo

Não é difı́cil mostrar que as bolas (abertas ou fechadas) são conjuntos convexos. É imediato que
qualquer conjunto convexo é conexo por arcos, pois dois quaisquer pontos podem ser ligados por um
segmento de recta contido no conjunto, mas o recı́proco é falso. Por exemplo, uma coroa circular é
um conjunto conexo por arcos que não é convexo.
Algumas funções regulares definidas em conjuntos convexos têm propriedades semelhantes às das
funções reais de variável real, como é ilustrado pelo resultado anterior. Assim, é consequência do
Teorema do Valor Médio que, se D ⊆ Rn é um aberto convexo e se f : D → R é uma função
diferenciável cujas derivadas parciais de primeira ordem se anulam em todos os pontos de D, então f
é constante em D.

2.6 Teorema da função implı́cita

Consideremos a função f (x, y) = x2 + y 2 − 25 e o seu conjunto de nı́vel C0 que é a circunferência


de centro na origem e raio 5 dada pela equação x2 + y 2 = 25. Note-se que nem sempre para cada
x ∈ [−5, 5] esta equação define uma única função y = g(x). Por√ exemplo, se x = 4 há dois valores
de y que verificam x2 + y 2 = 25: y = 3 e y = −3, pois y = ± 25 − x2 . No entanto, restringindo,
por exemplo, x ∈ ] − 5, 5[ e y ∈ ]0, 5[, uma vez que neste último intervalo se tem y > 0,√podemos
resolver univocamente a equação dada em ordem a y e obtemos como única solução y = 25 − x2 .
Por outras palavras, neste caso, dado o ponto (4, 3), o conjunto de nı́vel C0 contém o gráfico de uma
função y = g(x), passando por (4, 3) e definida para x pertencente a uma certa vizinhança de x = 4.
A questão a que queremos dar resposta nesta secção é a de saber em que condições sobre uma
certa função f se pode garantir que, dado um ponto P pertencente ao conjunto de nı́vel 0 de f , este
conjunto contém o gráfico de uma certa função passando por P .
Contrariamente ao exemplo anterior, em geral, a partir duma equação da forma f (x, y) = 0 pode
não ser possı́vel obter uma fórmula explı́cita para y como função de x (ou de x como função de y).
Por exemplo, não é possı́vel resolver a equação
xy + ex log y − x sin y = 0
em ordem a y, nem em ordem a x.
Veremos de seguida em que condições é que uma equação da forma f (x1 , x2 , . . . , xn ) = 0 define
implicitamente uma das variáveis como função das restantes e, apesar de em geral não ser possı́vel
explicitar tal função, veremos como calcular as suas derivadas (parciais).
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

38
Teorema 2.48 (Teorema da Função Implı́cita - Caso de uma Equação) Seja

f : D ⊆ Rn × R → R
(x, y) 7→ f (x, y),

onde x = (x1 , x2 , . . . , xn ), uma função definida num aberto D ⊆ Rn × R e seja (x0 , y0 ) ∈ D. Suponha-
mos que

1. f ∈ C 1 (D);

2. f (x0 , y0 ) = 0;
∂f
3. (x0 , y0 ) 6= 0.
∂y
Então existem ε > 0, uma função g : Bε (x0 ) ⊆ Rn → R e um aberto W de Rn × R, com
(x0 , y0 ) ∈ W ⊆ D, tais que:

a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (x0 );

b) se (x, y) ∈ W e f (x, y) = 0, então x ∈ Bε (x0 ) e y = g(x);

c) g ∈ C 1 (Bε (x0 )).

Nestas condições dizemos que a equação f (x, y) = 0 define implicitamente y como função de x numa
vizinhança do ponto (x0 , y0 ), e à função g, tal que y = g(x), chamamos função implı́cita.

Neste resultado, uma das variáveis da equação f (x, y) = 0 tem um papel de destaque face às
outras. A essa variável, no enunciado do teorema, damos o nome y e, por comodidade, aparece em
último lugar na expressão de f .
Nas condições anteriores, pode-se ainda provar que, se f ∈ C k (D), k ≥ 1, então g ∈ C k (Bε (x0 )).
O teorema anterior mostra assim que o conjunto de nı́vel C0 = {(x, y) ∈ D : f (x, y) = 0} contém o
gráfico de uma certa função y = g(x), definida para x ∈ Bε (x0 ), que passa pelo ponto (x0 , y0 ), isto é,
tal que g(x0 ) = y0 . Portanto, a solução (x0 , y0 ) da equação f (x, y) = 0 não é uma solução isolada.
Apesar de, na maior parte dos casos, não ser possı́vel explicitar a função g, o teorema fornece um
método que nos permite calcular as suas derivadas (parciais). No caso n = 1, vejamos como calcular
g 0 (x) para x ∈ Bε (x0 ): por a) tem-se

F (x) = f (x, g(x)) = 0, ∀x ∈ Bε (x0 )

pelo que F 0 (x) = 0. Pela regra de derivação da função composta, vem

∂f ∂f
F 0 (x) = (x, g(x)) + (x, g(x))g 0 (x)
∂x ∂y
donde
∂f
(x, g(x))
g (x) = − ∂x
0
∂f
(x, g(x))
∂y
∂f
desde que (x, g(x)) 6= 0, o que acontece numa vizinhança de (x0 , y0 ) pela hipótese 3 e por continui-
∂y
dade das derivadas parciais de f , já que f ∈ C 1 (D).
No caso n > 1 um raciocı́nio análogo permite determinar expressões para as derivadas parciais da
função g.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

39
Note-se que o teorema anterior nos dá um resultado local: a função g que se afirma existir está
definida numa vizinhança do ponto x0 , se alterarmos o ponto (x0 , y0 ) a função também pode variar.
Voltando ao exemplo da circunferência x2 + y 2 = 25, vimos que se x ∈ ] − 5, 5[ e y ∈ ]0, 5[, então
p
y = g(x) = 25 − x2 .

No entanto, se x ∈ ] − 5, 5[ e y ∈ ] − 5, 0[ tem-se
p
y = h(x) = − 25 − x2 ,

uma vez que y < 0.


Observemos ainda que o teorema da função implı́cita é aplicável e permite definir univocamente y
como função de x numa vizinhança de qualquer ponto da circunferência à excepção dos pontos (5, 0) e
∂f
(−5, 0) onde, sendo f (x, y) = x2 + y 2 − 25, a derivada se anula. Neste caso, para além do teorema
∂y
não ser aplicável, é impossı́vel resolver a equação x2 + y 2 = 25 univocamente em ordem a y, como
função de x, na vizinhança destes pontos. De facto, qualquer aberto W contendo (5, 0) contém pontos
(x, y) com y > 0 e outros com y < 0. Assim, a intersecção da circunferência com o conjunto W não
pode ser o gráfico de uma função y = ϕ(x), definida para x pertencente a um intervalo da forma
]5 − ε, 5 + ε[, ε > 0. Com efeito, neste intervalo terı́amos pontos sem imagem, e outros com duas
imagens por meio de ϕ, uma vez que, para o mesmo valor de √ x, há uma solução
√ de f (x, y) = 0 com
y > 0 e outra com y < 0, pelo que é impossı́vel escolher entre 25 − x2 e − 25 − x2 . Portanto, não
é possı́vel escrever univocamente y como função de x (mas pode-se escrever x como função de y...).
Um raciocı́nio análogo é válido para o ponto (−5, 0).

∂f ∂f
A condição (x0 , y0 ) 6= 0 no teorema anterior é apenas suficiente. Se (x0 , y0 ) = 0 nada se
∂y ∂y
pode concluir quanto à existência de função implı́cita. Por exemplo, se

f (x, y) = (y − x)2 ,
∂f
tem-se (0, 0) = 0, e a equação (y − x)2 = 0 define claramente a função y = x. Por outro lado,
∂y
também para
f (x, y) = x2 + y 2
∂f
se tem (0, 0) = 0, mas, neste caso, a equação x2 +y 2 = 0 não define y como função de x em qualquer
∂y
aberto de R que contenha o ponto x = 0 porque (0, 0) é a única solução da equação x2 + y 2 = 0.
Neste caso o conjunto de nı́vel 0 de f é constituı́do por um único ponto, C0 = {(0, 0)}, e, portanto,
não contém o gráfico de qualquer função definida numa vizinhança de x = 0.

Exemplo. Mostremos que a equação xy + ex + log y − 1 = 0 define implicitamente uma função


y = g(x) numa vizinhança do ponto (x, y) = (0, 1) e calculemos g 0 (0) e g 00 (0).
Consideremos a função f (x, y) = xy + ex + log y − 1. Então f é de classe C 1 (D), onde D é o aberto
de R dado por D = (x, y) ∈ R2 : y > 0 , f (0, 1) = 0 e fy (0, 1) = 1 6= 0. Assim, pelo Teorema da
2


Função Implı́cita, concluimos que existem ε > 0, uma função g : Bε (0) → R e um aberto W ⊆ R2 tal
que (0, 1) ∈ W ⊆ D, verificando as seguintes condições:
a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (0),

b) se (x, y) ∈ W e f (x, y) = 0 então x ∈ Bε (0) e y = g(x),

c) g ∈ C 1 (Bε (0)),
ou seja, a equação f (x, y) = 0 define implicitamente y = g(x) numa vizinhança do ponto (x, y) = (0, 1).
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

40
De facto, sabemos que f ∈ C ∞ (D), pelo que a função g também é de classe C ∞ em Bε (0). Assim,
g tem derivadas de qualquer ordem em Bε (0). Uma vez que para cada x ∈ Bε (0) se tem

f (x, g(x)) = 0 ⇔ xg(x) + ex + log(g(x)) − 1 = 0,

para calcularmos g 0 (x) derivamos esta igualdade em ordem a x usando a regra da cadeia. Obtemos

g 0 (x)
g(x) + xg 0 (x) + ex + = 0. (9)
g(x)

Substituindo x = 0 e y(0) = g(0) = 1 em (9) vem g 0 (0) = −2.


Aplicando novamente a regra da derivação da função composta para derivar a equação (9) temos

g 00 (x)g(x) − g 0 (x)g 0 (x)


g 0 (x) + g 0 (x) + xg 00 (x) + ex + = 0,
g 2 (x)

donde, substituindo novamente x = 0, g(0) = 1, e ainda, g 0 (0) = −2, obtemos o valor de g 00 (0):

2g 0 (0) + 1 + g 00 (0) − (g 0 (0))2 = 0 ⇔ g 00 (0) = 7.

O Teorema da Função Implı́cita pode-se generalizar ao caso em que temos um sistema de m


equações.

Teorema 2.49 (Teorema da Função Implı́cita - Caso Geral) Seja

f : D ⊆ Rn+m → Rm
(x, y) 7→ f (x, y) = (f1 (x, y), . . . , fm (x, y)),

onde x = (x1 , . . . , xn ) ∈ Rn e y = (y1 , . . . , ym ) ∈ Rm , uma função definida num aberto D ⊆ Rn+m e


seja (x0 , y0 ) ∈ D, com x0 ∈ Rn e y0 ∈ Rm . Suponhamos que

1. f ∈ C 1 (D);

 f1 (x0 , y0 ) = 0

2. f (x0 , y0 ) = 0 ⇔ ..
 .
fm (x0 , y0 ) = 0;

∂(f1 , . . . , fm )
3. (x0 , y0 ) 6= 0.
∂(y1 , . . . , ym )
Então existem ε > 0, uma função g : Bε (x0 ) ⊆ Rn → Rm e um aberto W de Rn+m , com
(x0 , y0 ) ∈ W ⊆ D, tais que:

a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (x0 );

b) se (x, y) ∈ W e f (x, y) = 0, então x ∈ Bε (x0 ) e y = g(x);

c) g ∈ C 1 (Bε (x0 )).

Nestas condições dizemos que o sistema de equações f (x, y) = 0 define implicitamente y como função
de x numa vizinhança do ponto (x0 , y0 ), e à função g, tal que

y = (y1 , . . . , ym ) = g(x) = (g1 (x1 , . . . , xn ), . . . , gm (x1 , . . . , xn )),

chamamos função implı́cita.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

41
Tal como no caso m = 1, pode-se ainda provar que, se f ∈ C k (D), k ≥ 1, então g ∈ C k (Bε (x0 )).
O teorema anterior mostra que a solução (x0 , y0 ) da equação f (x, y) = 0 não é uma solução isolada
pois faz parte de um conjunto de soluções da forma (x, g(x)) ∈ Rn × Rm , que corresponde ao gráfico
de uma certa função y = g(x), que passa pelo ponto (x0 , y0 ), isto é, tal que g(x0 ) = y0 .
Nas condições mencionadas, fica assim garantida a existência de uma função y = g(x), definida
implicitamente em Bε (x0 ) pela equação f (x, y) = 0, isto é, o sistema de m equações

 f1 (x1 , . . . , xn , y1 , . . . , ym ) = 0

..
 .
fm (x1 , . . . , xn , y1 , . . . , ym ) = 0

permite definir as m funções seguintes, dependendo das restantes n variáveis,



 y1 = g1 (x1 , . . . , xn )

..
 .
ym = gm (x1 , . . . , xn ).

Apesar de, em geral, não ser possı́vel explicitar estas m funções pode-se, tal como anteriormente,
derivar implicitamente, usando a regra da cadeia, as equações do sistema para obter as derivadas
(parciais) destas funções. Após a derivação, o sistema de equações obtido é um sistema linear nas
derivadas (parciais), que, atendendo à hipótese 3, é um sistema de Cramer, e que pode, portanto, ser
resolvido pela regra de Cramer.
Exemplo. Verifiquemos que, numa vizinhança do ponto (x, y, t) = (0, 0, 0), o sistema de equações

 x+y+t=0

(10)
 x3 + sin y − sin t = 0

define implicitamente uma linha parametrizada γ(t) = (x(t), y(t)) e determinemos uma equação da
recta tangente ao traço de γ no ponto γ(0) = (0, 0).
Consideremos a função f : R3 → R2 dada por

f (x, y, t) = (f1 (x, y, t), f2 (x, y, t)) = (x + y + t, x3 + sin y − sin t).

Então f ∈ C ∞ (R3 ) uma vez que as suas funções componentes são soma de funções polinomiais e
trigonométricas, em particular f ∈ C 1 (R3 ), e f (0, 0, 0) = (0, 0), ou seja, o ponto (0, 0, 0) é solução
do sistema (10). Vejamos que o jacobiano de f1 e de f2 relativamente às variáveis x e y no ponto
(x, y, t) = (0, 0, 0) é não nulo:
∂f1 ∂f1
 
   
 ∂x ∂y  1 1 1 1
∂(f1 , f2 )  
(0, 0, 0) = det  = det  = det   = 1 6= 0.
    
∂(x, y)   
 ∂f2 ∂f2  3x2 cos y (0,0,0)
0 1
∂x ∂y (0,0,0)

Assim, o Teorema da Função Implı́cita garante que o sistema (10) define implicitamente x e y como
funções de t, numa vizinhança do ponto (x, y, t) = (0, 0, 0), ou seja, define uma linha parametrizada
γ(t) = (x(t), y(t)) para t pertencente a um certo intervalo I =] − ε, ε[.
Derivando, em ordem a t, as equações do sistema

 x(t) + y(t) + t = 0

 x3 (t) + sin y(t) − sin t = 0


Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

42
obtemos 
0 0
 x (t) + y (t) + 1 = 0

 3x2 (t)x0 (t) + cos y(t)y 0 (t) − cos t = 0


donde, substituindo t = 0 e x(0) = 0, y(0) = 0, vem


 
0 0 0
 x (0) + y (0) + 1 = 0
  x (0) = −2


 y 0 (0) − 1 = 0
  y 0 (0) = 1.

O vector γ 0 (0) = (x0 (0), y 0 (0)) = (−2, 1) é tangente ao traço de γ no ponto γ(0) = (0, 0) pelo que uma
equação da recta tangente à curva γ(I) no ponto γ(0) = (0, 0) é x + 2y = 0.

2.7 Fórmula de Taylor

De modo a generalizarmos a fórmula de Taylor para funções de mais de uma variável começamos por
ver como calcular derivadas, segundo um vector, de ordem superior à primeira.
Consideremos uma função f : D ⊆ R2 → R, de classe C 2 no conjunto aberto D, e seja u = (u1 , u2 )
um vector de R2 . Como f é diferenciável em D, sabemos que f tem derivada segundo o vector u em
qualquer ponto (x, y) ∈ D e tem-se
∂f ∂f
fu0 (x, y) = ∇f (x, y) · u = u1 + u2 .
∂x ∂y
A função assim obtida, fu0 : D ⊆ R2 → R, sendo de classe C 1 em D, pode por sua vez ser derivada,
em qualquer ponto (x, y) ∈ D, segundo qualquer vector de R2 . Em particular, podemos calcular (fu0 )0u
que denotamos por fu00 . Tem-se assim,

∂2f 2 ∂2f ∂2f 2


fu00 = ∇fu0 (x, y) · u = u + 2 u u
1 2 + u ,
∂x2 1 ∂x∂y ∂y 2 2
uma vez que, por f ser de classe C 2 , as suas derivadas parciais mistas de segunda ordem são iguais.
Pondo em evidência o operador de derivação podemos escrever
!
∂2 2 ∂2 ∂2
fu00 = 2
u1 + 2 u1 u2 + 2 u22 f,
∂x ∂x∂y ∂y

ou, simbolicamente,
2
∂ ∂

fu00 = u1 + u2 f.
∂x ∂y
Analogamente, se m ∈ N e f : D ⊆ R2 → R é de classe C m no conjunto aberto D podemos
calcular a sua derivada de ordem m, segundo o vector u = (u1 , u2 ) de R2 . Usando a notação simbólica,
introduzida no caso m = 2, escrevemos
m
∂ ∂

fu(m) = u1 + u2 f
∂x ∂y
e, mais geralmente, se f : D ⊆ Rn → R é de classe C m no conjunto aberto D tem-se
m
∂ ∂

fu(m) = u1 + . . . + un f,
∂x1 ∂xn
onde u = (u1 , . . . , un ) ∈ Rn .
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

43
Exemplos 2.50 Seja f : D ⊆ Rn → R uma função de classe C m no conjunto aberto D.
∂f ∂2f (m) ∂mf
1. Se ei é o i-ésimo vector da base canónica de Rn , então fe0 i = , fe00i = , ... , fei = .
∂xi 2
∂xi ∂xm
i

0 = λf 0 . É simples verificar que se tem f 00 = λ2 f 00 , ... ,


2. Se u ∈ Rn e λ ∈ R já vimos que fλu u λu u
(m) (m)
fλu = λm fu .

Exemplo. Sendo f : R2 → R a função polinomial dada por f (x, y) = 1 + 3x2 + xy + y 2 + x3 , e


u = (1, −1), calculemos fu0 (1, 2), fu00 (1, 2) e fu000 (1, 2).
Comecemos por calcular as derivadas parciais de f até à ordem três:

fx = 6x + y + 3x2 , fy = x + 2y,

fxx = 6 + 6x, fxy = 1, fyy = 2,

fxxx = 6, fyxx = 0, fxyy = 0, fyyy = 0.


Assim,
fu0 (1, 2) = fx (1, 2)u1 + fy (1, 2)u2 = 11 − 5 = 6,

fu00 (1, 2) = fxx (1, 2)u21 + 2fxy (1, 2)u1 u2 + fyy (1, 2)u22 = 12 − 2 + 2 = 12,

fu000 (1, 2) = fxxx (1, 2)u31 + 3fxyy (1, 2)u1 u22 + 3fxxy (1, 2)u21 u2 + fyyy (1, 2)u32 = 6.

Vimos na secção 2.3 que se uma função f : D ⊆ R2 → R é diferenciável num ponto (a, b) do
interior de D, então f (x, y) pode ser aproximada pela função polinomial

P1 (x, y) = f (a, b) + fx (a, b)(x − a) + fy (a, b)(y − b)

cujo gráfico é um plano que passa no ponto (a, b, f (a, b)) pertencente também ao gráfico de f .
Mostrámos ainda que este plano é o que melhor aproxima o gráfico de f em pontos (x, y) próximos de
f (x, y) − P1 (x, y)
(a, b) uma vez que lim = 0. Note-se que o polinómio P1 é o único polinómio
(x,y)→(a,b) k(x − a, y − b)k
de grau inferior ou igual a 1 que satisfaz as seguintes condições:
∂P1 ∂f ∂P1 ∂f
P1 (a, b) = f (a, b), (a, b) = (a, b), (a, b) = (a, b).
∂x ∂x ∂y ∂y
O nosso objectivo é estender estas ideias ao caso em que queremos aproximar uma função de várias
variáveis por polinómios de grau maior ou igual a 1.
Recordemos a fórmula de Taylor para funções reais de variável real. Sejam I um intervalo de R e
f : I → R uma função de classe C m+1 em I. Então, para quaisquer x, a ∈ I, tem-se

f (x) = Pm (x) + Rm (x)

onde
f 00 (a) f (m) (a)
Pm (x) = f (a) + f 0 (a)(x − a) + (x − a)2 + . . . + (x − a)m
2! m!
e Rm (x) = o((x − a)m ), (x → a), isto é,
Rm (x)
lim = 0.
x→a (x − a)m

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

44
Ao polinómio Pm demos o nome de polinómio de Taylor de ordem m de f em torno do ponto a, e
vimos a seguinte expressão para Rm , a que chamámos resto de Lagrange,
f (m+1) (c)
Rm (x) = (x − a)m+1 ,
(m + 1)!
onde o ponto c está entre a e x. Escrevendo x = a + h tem-se
f 00 (a) 2 f (m) (a) m f (m+1) (c) m+1
f (a + h) = f (a) + f 0 (a)h + h + ... + h + h ,
2! m! (m + 1)!

f (m+1) (c) m+1


onde c está entre a e a + h e h = o(hm ), (h → 0).
(m + 1)!
Vejamos agora a generalização para funções de n variáveis.

Teorema 2.51 Sejam f : D ⊆ Rn → R, uma função de classe C m+1 no aberto D, e a ∈ D. Então


para todo h ∈ Rn tal que a + h ∈ D, existe um ponto ch , pertencente ao segmento de recta de
extremidades a e a + h, tal que
1 00 1 (m) 1 (m+1)
f (a + h) = f (a) + fh0 (a) + fh (a) + . . . + fh (a) + fh (ch ).
2! m! (m + 1)!
Ao polinómio de grau inferior ou igual a m dado no teorema anterior, cujas variáveis são as
componentes h1 , h2 , . . . , hn do vector h,
1 00 1 (m)
Pm (h) = f (a) + fh0 (a) + fh (a) + . . . + f (a)
2! m! h
damos o nome de polinómio de Taylor de ordem m de f em torno do ponto a e à expressão
1 (m+1)
Rm (h) = f (ch )
(m + 1)! h
chamamos resto de Lagrange de ordem m, tendo-se Rm (h) = o(khkm ), (h → 0), isto é,
Rm (h)
lim = 0.
h→0 khkm

Para o que se segue, será particularmente útil o caso m = 2 onde


n
1 00 1 X ∂2f
P2 (h) = f (a) + fh0 (a) + fh (a) = f (a) + ∇f (a) · h + (a)hi hj
2! 2 i,j=1 ∂xi ∂xj

e f (a + h) = P2 (h) + o(khk2 ), (h → 0).

Exemplo. Determinemos um polinómio de grau dois que, numa vizinhança do ponto (0, 0),
aproxime a função f (x, y) = exy+y a menos de o(k(x, y)k2 ), (x, y) → (0, 0).
Pelo que foi exposto, temos que determinar o polinómio de Taylor de segunda ordem de f , em
torno do ponto (0, 0). De acordo com as notações acima temos a = (0, 0), a + h = h = (x, y) e
pretendemos calcular P2 (x, y). Para esse efeito, começamos por calcular f (0, 0) e as derivadas parciais
de primeira e de segunda ordem de f , no ponto (0, 0).

f (0, 0) = 1, fx = yexy+y , fx (0, 0) = 0, fy = (x + 1)exy+y , fy (0, 0) = 1,

fxx = y 2 exy+y , fxy = exy+y + y(x + 1)exy+y , fyy = (x + 1)2 exy+y ,


fxx (0, 0) = 0, fxy (0, 0) = 1, fyy (0, 0) = 1.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

45
0
Daqui resulta que f(x,y) (0, 0) = ∇f (0, 0) · (x, y) = y e
00
f(x,y) (0, 0) = fxx (0, 0)x2 + 2fxy (0, 0)xy + fyy (0, 0)y 2 = 2xy + y 2 ,
donde
0 1 00 1 y2
P2 (x, y) = f (0, 0) + f(x,y) (0, 0) + f(x,y) (0, 0) = 1 + y + (2xy + y 2 ) = 1 + y + xy + .
2 2 2

2.8 Extremos locais e absolutos

Nesta secção vamos estender ao caso das funções reais de várias variáveis as noções de máximos e
mı́nimos locais e absolutos.

Definição 2.52 Seja f : D ⊆ Rn → R e seja a ∈ D. A função f tem um máximo (respectivamente,


um mı́nimo) local ou relativo no ponto a se existe uma vizinhança Bε (a) (ε > 0) do ponto a tal
que
f (a) ≥ f (x), ∀x ∈ Bε (a) ∩ D
(respectivamente, f (a) ≤ f (x), ∀x ∈ Bε (a) ∩ D). Em qualquer destes casos dizemos que f tem um
extremo local ou relativo no ponto a.

O facto de uma função ter um extremo local num ponto a depende do comportamento da função
numa vizinhança de a. Os extremos absolutos de f dependem do comportamento da função em
todo o seu domı́nio.

Definição 2.53 Seja f : D ⊆ Rn → R e seja a ∈ D. A função f tem um máximo (respectivamente,


um mı́nimo) absoluto no ponto a se
f (a) ≥ f (x), ∀x ∈ D
(respectivamente, f (a) ≤ f (x), ∀x ∈ D). Em qualquer destes casos dizemos que f tem um extremo
absoluto no ponto a.

Claro que se f tem um extremo absoluto em a também tem um extremo local nesse ponto, mas o
recı́proco é falso.

No caso das funções reais de variável real sabemos que se f tem um extremo local em a pertencente
ao interior do domı́nio, então f 0 (a) = 0 ou f 0 (a) não existe. O resultado análogo para funções de mais
de uma variável é dado em termos de ∇f .

Teorema 2.54 (Fermat) Se a função f : D ⊆ Rn → R tem um extremo local no ponto a ∈ intD,


então ∇f (a) = 0 ou ∇f (a) não existe.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

46
Definição 2.55 Chama-se ponto crı́tico de uma função f : D ⊆ Rn → R a um ponto c do interior
de D para o qual ∇f (c) = 0.

O teorema anterior diz-nos que os únicos pontos, interiores ao domı́nio, onde uma função dife-
renciável f pode atingir extremos locais são os pontos crı́ticos. Note-se, no entanto, que nem todos
os pontos crı́ticos correspondem a extremos locais. Por exemplo, é fácil verificar que o ponto (0, 0) é
ponto crı́tico de ambas as funções f (x, y) = x2 + y 2 e g(x, y) = x2 − y 2 . No primeiro caso, f (0, 0) = 0
é claramente mı́nimo de f mas g não atinge um extremo em (0, 0) uma vez que g(0, 0) = 0 e qualquer
vizinhança de (0, 0) contém pontos onde g > 0 e outros onde g < 0.

Definição 2.56 Chama-se ponto de sela a um ponto crı́tico de f onde não é atingido um extremo
local.

Assim, no exemplo da função g anterior, (0, 0) é ponto de sela.

Se uma função real de variável real é diferenciável e atinge um extremo local no ponto x0 interior
ao domı́nio, então a recta tangente ao gráfico de f no ponto (x0 , y0 ), onde y0 = f (x0 ), é horizontal.
Analogamente, resulta do Teorema 2.54 que se f : D ⊆ R2 → R é diferenciável e atinge um extremo
local no ponto (x0 , y0 ) interior ao domı́nio D, então o plano tangente à superfı́cie z = f (x, y) no ponto
(x0 , y0 , z0 ), onde z0 = f (x0 , y0 ), é horizontal. Com efeito, como neste caso se tem ∇f (x0 , y0 ) = (0, 0),
o referido plano tangente é dado por
∂f ∂f
z − z0 = (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) ⇔ z = z0 .
∂x ∂y
O mesmo é válido se (x0 , y0 ) é ponto de sela de f .

Uma vez que pode haver pontos crı́ticos que são pontos de sela, interessa ter um critério que nos
permita determinar se num certo ponto crı́tico é atingido um extremo local. Veremos agora como dar
resposta a esta questão usando a fórmula de Taylor de segunda ordem. Recordemos que se f é uma
função real de variável real duas vezes diferenciável tal que f 0 (a) = 0, então f tem um mı́nimo local
em a se f 00 (a) > 0 e f tem um máximo local em a se f 00 (a) < 0. Este resultado generaliza-se a funções
de várias variáveis do seguinte modo.

Teorema 2.57 Seja f : D ⊆ Rn → R uma função de classe C 2 (D) e seja a um ponto crı́tico de f .
Então
1. se fh00 (a) > 0, para todo o vector não nulo h ∈ Rn , f tem um mı́nimo local em a;
2. se fh00 (a) < 0, para todo o vector não nulo h ∈ Rn , f tem um máximo local em a;
3. se fh00 (a) toma valores positivos e negativos para diferentes vectores h ∈ Rn , então a é um ponto
de sela de f .

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

47
Para aplicarmos o teorema anterior temos então que estudar o sinal da forma quadrática h 7→ fh00 (a),
ou seja, do polinómio do segundo grau nas variáveis h1 , h2 , . . . , hn dado por
n
∂2f
(a)hi hj = fh00 (a)
X
Q(h) = Q(h1 , . . . , hn ) =
i,j=1
∂xi ∂xj

e que se pode escrever matricialmente na forma


 
h1
h i 
 h2 

Q(h) = h1 h2 . . . h n Hf (a)  .. ,
.
 
 
hn
onde Hf (a) é a matriz dada por
∂2f ∂2f ∂2f
 
∂x21 ∂x1 ∂x2 ... ∂x1 ∂xn
 
 
 
 ∂2f ∂2f ∂2f 
 ∂x2 ∂x1

∂x22
... ∂x2 ∂xn
 " #
 ∂2f
Hf (a) =  = (a) .
 


.. .. .. ..  ∂xi ∂xj i,j=1,...,n
.
 

 . . . 

 
 2

∂ f ∂2f ∂2f
∂xn ∂x1 ∂xn ∂x2 ... ∂x2n (a)

A esta matriz damos o nome de matriz hessiana de f no ponto a. Note-se que, sendo f uma função
de classe C 2 , a matriz hessiana é uma matriz simétrica.
Definição 2.58 Uma forma quadrática Q diz-se
1. definida positiva se Q(h) > 0, para todo o vector não nulo h;
2. definida negativa se Q(h) < 0, para todo o vector não nulo h;
3. indefinida se Q(h) toma valores positivos e valores negativos;
4. semidefinida positiva se Q(h) ≥ 0, para todo o vector h, e existe h 6= 0 tal que Q(h) = 0;
5. semidefinida negativa se Q(h) ≤ 0, para todo o vector h, e existe h 6= 0 tal que Q(h) = 0.

É conhecido da Álgebra Linear que, sendo A a matriz simétrica da forma quadrática Q,


i) se os valores próprios de A são todos positivos, então Q é definida positiva;
ii) se os valores próprios de A são todos negativos, então Q é definida negativa;
iii) se existem valores próprios de A positivos e outros negativos, então Q é indefinida.
" #
α β
No caso n = 2, se A = é a matriz simétrica de uma forma quadrática Q, e se λ1 e λ2
β γ
são os valores próprios de A, atendendo a que det A = λ1 λ2 e tr A = λ1 + λ2 , é um exercı́cio simples
verificar que
1. se α > 0 e det A > 0, então λ1 e λ2 são ambos positivos (e, portanto, Q é definida positiva);
2. se α < 0 e det A > 0, então λ1 e λ2 são ambos negativos (e, portanto, Q é definida negativa);
3. se det A < 0, então λ1 e λ2 têm sinais opostos (e, portanto, Q é indefinida).
Conjugando estes factos com as conclusões do Teorema 2.57 obtemos finalmente o seguinte resul-
tado, que generaliza ao caso das funções de duas variáveis o chamado teste da segunda derivada já
estudado para funções reais de variável real.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

48
Teorema 2.59 Seja f ∈ C 2 (D) e seja (a, b) um ponto crı́tico de f . Consideremos a matriz hessiana
de f no ponto (a, b), dada por

∂2f ∂2f
 

 ∂x2 ∂x∂y 
 
Hf (a, b) = 
 

 ∂2f ∂2f
 

∂y∂x ∂y 2 (a,b)

e seja d = det Hf (a, b). Então:


i) se d < 0, (a, b) é um ponto de sela de f ;
∂2f
ii) se d > 0 e (a, b) > 0, f tem um mı́nimo local em (a, b);
∂x2
∂2f
iii) se d > 0 e (a, b) < 0, f tem um máximo local em (a, b);
∂x2
iv) se d = 0 nada se pode concluir.

∂2f ∂2f ∂2f


Notas 2.60 1) Se (a, b) = 0 obtemos d ≤ 0, uma vez que (a, b) = (a, b).
∂x2 ∂x∂y ∂y∂x

2) Consideremos as funções f (x, y) = x4 + y 4 , g(x, y) = −(x4 + y 4 ) e h(x, y) = x4 − y 4 . É fácil


de ver que (0, 0) é ponto crı́tico para todas elas e que, neste ponto, d = 0 para cada uma das
funções mencionadas. Além disso, não é difı́cil mostrar que (0, 0) é ponto de mı́nimo local de f ,
(0, 0) é ponto de máximo local de g e (0, 0) é ponto de sela de h.
Estes três exemplos mostram que nada se pode concluir no caso em que d = 0 e que a de-
terminação da natureza do ponto crı́tico em causa envolve o estudo directo da função numa
vizinhança desse ponto.

Exemplo 2.61 Vamos determinar e classificar os pontos crı́ticos da função f (x, y) = x3 − y 3 + xy.
Atendendo a que ∇f (x, y) = (3x2 + y, x − 3y 2 ), os pontos crı́ticos de f são as soluções do sistema
  
2 2 2
 3x + y = 0
  y = −3x
  y = −3x

⇔ ⇔
 x − 3y 2 = 0
  x(1 − 27x3 ) = 0
  x = 0 ∨ x = 1.

3
 
Obtemos assim os pontos (0, 0) e 13 , − 31 . Vamos agora classificar estes pontos crı́ticos, isto é, vamos
verificar se são pontos de máximo local, mı́nimo local ou pontos de sela. Para esse efeito usamos
o Teorema 2.59 e calculamos a matriz hessiana de f em cada um dos pontos encontrados. Como
fxx = 6x, fxy = fyx = 1 e fyy = −6y temos
   
2 1 0 1
1 1
 
Hf ,− = e Hf (0, 0) =  .
   
3 3

1 2 1 0
   
Uma vez que det Hf 13 , − 31 = 3 > 0, o ponto 31 , − 13 é um ponto de mı́nimo local de f ; dado que
det Hf (0, 0) = −1 < 0, o ponto
  0) é um ponto de sela de f .
(0,
1 1
Notemos ainda que f 3 , − 3 não é mı́nimo absoluto de f pois considerando a restrição de f à
recta y = 0 tem-se
lim f (x, 0) = lim x3 = −∞.
x→−∞ x→−∞

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

49
Nem todas as funções admitem extremos locais. Por exemplo, a função diferenciável, de domı́nio
R2 , f (x, y) = 2x + y, cujo gráfico é o plano de equação z = 2x + y, não tem pontos crı́ticos pelo que
não tem extremos locais. Por outro lado, como vimos no Exemplo 2.61, há funções que têm extremos
locais mas não absolutos. O Teorema de Weierstrass garante a existência de extremos absolutos para
funções contı́nuas definidas em conjuntos compactos.

Teorema 2.62 (Weierstrass) Se f : D ⊆ Rn → R é contı́nua num conjunto compacto e não vazio


S ⊆ D, então f atinge um máximo e um mı́nimo absolutos em S.

Se f : S ⊆ Rn → R é uma função contı́nua definida no subconjunto compacto S, sabemos então


que f atinge um máximo e um mı́nimo absolutos em S. Estes extremos absolutos podem ser atingidos
no interior do conjunto S ou na sua fronteira. Assim, para determinarmos os extremos absolutos de
uma função diferenciável f num conjunto compacto S:
i) determinamos os pontos crı́ticos de f no interior de S;

ii) determinamos os pontos da fronteira de S que podem dar origem a extremos. No caso n = 2,
uma maneira de fazer isto é parametrizar a fronteira de S através de uma função vectorial r(t) e
reduzir o problema ao estudo da função de uma só variável f (r(t)). Veremos na próxima secção
um método alternativo para resolver este passo.

iii) Calculamos o valor de f em cada um dos pontos determinados nos passos anteriores. O maior
destes valores é o máximo absoluto de f em S, o menor é o mı́nimo absoluto.
Exemplo. Determinemos os extremos absolutos da função diferenciável f (x, y) = 2x + y no
conjunto compacto (um triângulo)
n o
S = (x, y) ∈ R2 : 0 ≤ x ≤ 1 ∧ 0 ≤ y ≤ 1 − x .

Já mencionámos que f não tem pontos crı́ticos, dado que ∇f (x, y) = (2, 1) 6= (0, 0), pelo que os
seus extremos absolutos serão necessariamente atingidos na fronteira de S que é constituı́da pelos três
segmentos de recta n o
S1 = (x, y) ∈ R2 : x = 0 ∧ 0 ≤ y ≤ 1 ,
n o
S2 = (x, y) ∈ R2 : y = 0 ∧ 0 ≤ x ≤ 1
e n o
S3 = (x, y) ∈ R2 : y = 1 − x ∧ 0 ≤ x ≤ 1 .

Dado que f (0, y) = y, o valor máximo de f em S1 é 1 e o seu valor mı́nimo neste conjunto é 0.
No segmento S2 o máximo de f é 2 e o mı́nimo é 0, pois f (x, 0) = 2x. Finalmente, no segmento S3
o valor máximo de f é 2 e o mı́nimo é 1, uma vez que f (x, 1 − x) = x + 1. Concluimos assim que os
extremos absolutos de f no conjunto S são 0 e 2.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

50
Se f : D ⊆ Rn → R é uma função de classe C 2 , e D é um conjunto arbitrário, o estudo de extremos
absolutos de f pode ser uma tarefa muito difı́cil. Nestes casos, começamos por determinar os pontos
crı́ticos e identificar os extremos locais, nos casos em que o Teorema 2.59 é conclusivo. Quando o
referido teorema não permite a classificação de um ponto crı́tico, é necessário fazer um estudo directo
da função f numa vizinhança desse ponto. Também para estas funções, o método que vamos estudar
na próxima secção pode ser uma ajuda no estudo de extremos na fronteira de D.

2.9 Extremos condicionados

Veremos nesta secção como determinar extremos de uma função f : D ⊆ Rn → R no caso em que os
pontos x ∈ Rn estão sujeitos a uma condição do tipo g(x) = 0. Chama-se a isto resolver um problema
de extremos condicionados. Este problema resume-se assim a calcular os extremos da função f
restrita ao conjunto, suposto não vazio,
C = {x ∈ Rn : g(x) = 0},
notada f|C . Vamos usar o chamado método dos multiplicadores de Lagrange.
Teorema 2.63 Sejam D, E ⊆ Rn conjuntos abertos, g : E → R, f : D → R funções tais que
g ∈ C 1 (E), f ∈ C 1 (D) e E ⊆ D, e seja C = {x ∈ E : g(x) = 0}. Se f|C tem um extremo local em
x0 ∈ C e se ∇g(x0 ) não é o vector nulo, então ∇f (x0 ) e ∇g(x0 ) são paralelos, isto é, existe λ ∈ R tal
que
∇f (x0 ) = λ∇g(x0 ).
Ao escalar λ referido no teorema anterior damos o nome de multiplicador de Lagrange.
A figura que se segue ilustra geometricamente as conclusões do resultado anterior no caso n = 2.
Nela encontram-se representadas a preto algumas curvas de nı́vel da função f e a azul a curva de nı́vel
0 da função g, que designamos por C. Nas condições enunciadas, é simples verificar, por aplicação
da regra da cadeia, que se f|C tem um extremo local em (x0 , y0 ) ∈ C, então ∇f (x0 , y0 ) é ortogonal
a C no ponto (x0 , y0 ). Mas, por outro lado, como C é a curva de nı́vel 0 da função g, é sabido (cf.
Teorema 2.44) que ∇g(x0 , y0 ) é ortogonal a C no ponto (x0 , y0 ). Assim, os dois vectores ∇f (x0 , y0 ) e
∇g(x0 , y0 ) são paralelos.

Portanto, para determinarmos os extremos locais de f|C recorrendo ao Teorema 2.63, começamos
por determinar as soluções (x, λ) ∈ Rn × R do sistema
(
∇f (x) = λ∇g(x)
g(x) = 0,
os pontos onde são atingidos os extremos locais de f|C estão entre as projecções x ∈ Rn das soluções
(x, λ) ∈ Rn × R encontradas. Notamos ainda que as soluções (x, λ) do sistema anterior são os pontos
crı́ticos da função auxiliar
F (x, λ) = f (x) − λg(x).

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

51
Exemplo. Determinemos os extremos absolutos da função f (x, y, z) = x2 + 2y 2 − 3z 2 no conjunto
n o
S = (x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 1 .

f é claramente contı́nua e o conjunto S é a esfera de centro (0, 0, 0) e raio 1, logo é compacto, portanto
a existência de extremos absolutos de f em S é garantida pelo Teorema de Weierstrass. Começamos
por notar que
∇f (x, y, z) = (2x, 4y, −6z) = (0, 0, 0) ⇔ (x, y, z) = (0, 0, 0),
pelo que f tem um único ponto crı́tico no interior de S tendo-se f (0, 0, 0) = 0.
Procuremos agora os pontos da fronteira de S onde f pode atingir um extremo. Definindo
g(x, y, z) = x2 + y 2 + z 2 − 1, como ∇g(x, y, z) = (2x, 2y, 2z) 6= (0, 0, 0) se (x, y, z) é um ponto da
fronteira de S, o Teorema 2.63 é aplicável. Determinemos as soluções do sistema
 



2x = 2λx 


x=0∨λ=1

 

 
 

 ∇f (x, y, z) = λ∇g(x, y, z)  4y = 2λy  y =0∨λ=2

 

  
⇔ ⇔
−6z = 2λz z = 0 ∨ λ = −3

 g(x, y, z) = 0 
 


 


 


 

 
 x2 + y 2 + z 2 = 1
  x2 + y 2 + z 2 = 1.

Notemos que se λ = 1, então y = z = 0, donde x2 = 1 ⇔ x = ±1. Se λ = 2 tem-se x = z = 0


e, portanto, y 2 = 1 ⇔ y = ±1. Finalmente, se λ = −3 vem x = y = 0 e logo z 2 = 1 ⇔ z = ±1.
Interessam-nos assim os pontos (±1, 0, 0), (0, ±1, 0) e (0, 0, ±1). Determinando os valores de f nestes
pontos obtemos
f (±1, 0, 0) = 1, f (0, ±1, 0) = 2, f (0, 0, ±1) = −3.
Comparando estes valores com f (0, 0, 0) = 0, concluimos por fim que o máximo e o mı́nimo absolutos
de f em S são, respectivamente, 2 e −3.

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

52
3 Cálculo Integral em Rn
Introdução
O integral de Riemann que definimos para as funções reais de variável real (caso n = 1) é uma
ferramenta que permite, entre outras aplicações, calcular áreas de regiões genéricas do plano, isto
é, permite medir conjuntos em dimensão 2. Recorde-se que dada uma função real de variável real,
positiva e limitada num intervalo limitado I, o seu integral, em I, corresponde ao valor do conceito
que definimos como área da região limitada pelo gráfico da função, pelo eixo do xx e pelas rectas
verticais definidas pelos extremos de I. Também o conceito de integral múltiplo, que vamos definir,
está ligado à noção de medida, permitindo, entre outras aplicações, determinar medidas de conjuntos
em dimensão n, por exemplo, os chamados volumes para objectos em dimensão 3. A ênfase do nosso
estudo recai nos casos n = 2 e n = 3.
Para além do conceito e das suas propriedades, vamos estabelecer técnicas de cálculo de integrais
múltiplos, recorrendo ao cálculo de integrais unidimensionais. À semelhança do caso n = 1, estudare-
mos também um teorema de mudança de variável no integral múltiplo que, nalguns casos, facilita o
cálculo dos mesmos.
Os tópicos abordados neste capı́tulo inserem-se na chamada Teoria da Medida, cujo estudo rigoroso
e completo é feito em cadeiras avançadas (3.o ano da Licenciatura em Matemática). Não obstante,
faremos um estudo cuidadoso dos conceitos, direccionado para o cálculo e aplicações, recorrendo
algumas vezes à intuição e outras às provas formais, cujas ideias sejam pertinentes para a prossecução
da formação matemática dos alunos.

3.1 Definição e propriedades básicas do integral de Riemann


Dizemos que um conjunto I é um intervalo de números reais se, dados a, b ∈ I, arbitrários, e se x ∈ R
é tal que a < x < b, então x ∈ I.
Dizemos que um conjunto I é um intervalo de Rn , com n ∈ N, se I é o produto cartesiano de
n intervalos reais (abertos, fechados, semi-abertos). Se Ik = [ak , bk ] ou Ik =]ak , bk ] ou Ik =]ak , bk [ ou
Ik = [ak , bk [, e ak < bk para todo o k = 1, . . . n, o intervalo I = I1 × . . . × In diz-se não degenerado;
caso contrário diz-se degenerado (pelo menos um dos intervalos do produto cartesiano reduz-se a um
ponto), a não ser que seja o conjunto vazio.

Exemplos.
1) Em R2 os intervalos são rectângulos; exemplo I = [1, 3]×] − 2, 6].

2) Em R3 os intervalos são paralelepı́pedos; exemplo I =] − 3, 4[×]0, 3] × [2, 6[.

3) O segmento de recta [2, 6] × {0} é um intervalo degenerado de R2 .


4) O rectângulo {1} × [1, 3]×] − 2, 6] é um intervalo degenerado de R3 .

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

53
Dado um intervalo real I limitado, [a, b] ou ]a, b] ou ]a, b[ ou [a, b[, com a < b (a ≤ b, no caso
em que o intervalo é fechado), definimos a medida unidimensional de I como sendo o valor b − a,
denotamos por m1 (I), e chamamos a esse valor o comprimento de I.
Dado I = I1 × . . . × In intervalo em Rn , com Ik intervalo real limitado, k = 1, . . . , n, n ∈ N,
definimos a medida n-dimensional de I, e denotamos por mn (I), como sendo o valor
m1 (I1 ) · . . . · m1 (In ).
No caso n = 2, a m2 (I) chamamos área de I. No caso n = 3 dizemos que m3 (I) é o volume de I.
Exemplos.
1) O comprimento de [2, 6[ é m1 ([2, 6[) = 4.
2) A área de [1, 3]×] − 2, 6] é m2 ([1, 3]×] − 2, 6]) = 2 · 8 = 16.
3) O volume de ] − 3, 1[×]0, 3] × [2, 4[ é m3 (] − 3, 1[×]0, 3] × [2, 4[) = 4 · 3 · 2 = 24.
Quando não há necessidade de explicitar a dimensão na medida, em vez de mn , usamos simples-
mente m.
Observe-se que mn (I) = 0 apenas quando I é um intervalo degenerado.
Consideremos I um intervalo não degenerado e limitado de Rn , n ∈ N. Chamamos decomposição
ou partição de I a uma famı́lia finita de intervalos não degenerados de Rn , I1 , . . . , Ip , que apenas
têm em comum pontos das respectivas fronteiras (int Ij ∩ int Ik = ∅, se j 6= k, i, j = 1, . . . , p) e tais que
I = I1 ∪ . . . ∪ Ip .

I (n = 2) Uma decomposição de I
p
X
Dada uma decomposição D = {I1 , . . . , Ip } do intervalo I tem-se que m(I) = m(Ij ), k ∈ N.
j=1

Fixemos I um intervalo fechado (produto cartesiano de intervalos reais fechados), limitado e


não degenerado de Rn . Seja f : I → R uma função (campo escalar) limitada e consideremos
D = {I1 , . . . , Ip } uma decomposição de I, com p ∈ N.
Definimos as somas de Darboux inferior e superior de f relativamente a D, respectivamente,
por
p
X p
X
S(f, D) = (inf f ) mn (Ij ) e S(f, D) = (sup f ) mn (Ij ),
Ij Ij
j=1 j=1

Soma inferior Soma superior


Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

54
e, escolhidos ξj ∈ Ij , j = 1, . . . , p, a soma de Riemann de f relativamente a D e a ξ = (ξj ) por
p
X
S(f, D, ξ) = f (ξj ) mn (Ij ).
j=1

Soma de Riemann
É imediato que
S(f, D) ≤ S(f, D, ξ) ≤ S(f, D). (11)
Como as três figuras anteriores ilustram, no caso n = 2, quando a função f é não negativa, as
somas anteriores representam a soma dos volumes dos paralelepı́pedos cujas bases são os intervalos Ij
da decomposição de I e cujas alturas são respectivamente inf Ij f , supIj f e f (ξj ), j = 1, . . . , p. Cada
um dos sólidos constituı́dos pelos paralelepı́pedos considerados em cada um dos casos anteriores é uma
aproximação da região de R3
S = {(x, y, z) : (x, y) ∈ I, 0 ≤ z ≤ f (x, y)}.
Assim, as somas consideradas são valores aproximados do volume de S, conceito que pretendemos
definir. Este é formulado a partir do conceito do integral de f, que segue as ideias do caso n = 1.
6 A ⊂ Rn , chamamos diâmetro
Comecemos por dar a definição de diâmetro de um conjunto. Seja ∅ =
de A, e representamos por diam (A), ao valor (em R)
sup kx − yk.
x,y∈A

Ilustração de diâmetros:
n=1 n=2 n=3
Considerando D = {I1 , . . . , Ip } uma decomposição de I, chamamos diâmetro da decomposição D
ao maior dos diâmetros de cada Ij , j = 1, . . . , p.
Consideremos então todas as possı́veis sucessões (Dm )m de decomposições de I com diâmetro a tender
para zero (no caso n = 1 consideram-se sucessões de partições do intervalo com comprimento a tender
para zero) e as respectivas sucessões das somas inferior e superior de Darboux: S(f, Dm ) e S(f, Dm ).

Alguns termos da sucessão das somas inferiores de Darboux da função f (x, y) = 16 − x2 − 2y 2 , em I = [0, 2] × [0, 2]
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

55
Dizemos que f é integrável (à Riemann), em I, se existe ` ∈ R tal que

lim S(f, Dm ) = lim S(f, Dm ) = ` ∈ R, (12)


m→+∞ m→+∞

para qualquer sucessão (Dm ) nas


Z condições descritas. Ao valor comum do limite chamamos integral
de f em I e representamos por f. Quando n > 1, referimo-nos ao integral como integral múltiplo.
I
Se f é integrável, então, atendendo a (11), vem
Z
lim S(f, Dm , ξm ) = f,
m→+∞ I

onde ξm = (ξmj ) é uma sucessão de pontos escolhidos em cada intervalo Imj da decomposição Dm de
I, m, j ∈ N. Prova-se que se o limite anterior (das somas de Riemann) existir, então também existem
os limites em (12) e estes três limites coincidem.
Se n = 2, algumas notações para o integral de f , em I, são
Z Z ZZ Z ZZ
f ou f dA ou f (x, y) dA ou f (x, y) dxdy ou f (x, y) dxdy,
I I I I I

e dizemos que temos um integral duplo. Se n = 3, algumas notações para o integral de f , em I, são
Z Z ZZZ Z ZZZ
f ou f dV ou f (x, y, z) dV ou f (x, y, z) dxdydz ou f (x, y, z) dxdydz,
I I I I I

e dizemos que temos um integral triplo. Estas notações generalizam-se para qualquer n sendo a
notação genérica Z
f dx1 dx2 . . . dxn .
I
A ordem dx1 dx2 . . . dxn , na notação anterior, em dxdy no integral duplo, e em dxdydz no integral
triplo, de uma forma geral, reflete a ordem das variáveis no sistema de coordenadas adoptado. Porém,
quando esta ordem não é referida, consideramos a ordem crescente da enumeração (x1 , x2 , . . .) ou a
ordem alfabética (x, y, . . .) das variáveis em uso.
Que funções são integráveis à Riemann? Vejamos alguns exemplos. As funções constantes são
integráveis em intervalos limitados de Rn . Considerando I = [0, 2] × [0, 2], é fácil ver que a função
(
1, (x, y) ∈ I \ {(1, 1)}
f (x, y) =
0, (x, y) = (1, 1)

é integrável em I. Com um pouco mais de trabalho, prova-se que a função


(
1, (x, y) ∈ I, x 6= y
g(x, y) =
0, (x, y) ∈ I, x = y

também é integrável em I. Observamos que a função f é descontı́nua apenas no ponto (1, 1) e que g é
descontı́nua apenas no segmento de recta {(x, x) : x ∈ [0, 2]}. Neste dois últimos casos o conjunto dos
pontos de descontinuidade das funções tem um tamanho pequeno e é por esse facto que são integráveis.
Segue-se o conceito que dá significado a esta ideia e que nos vai permitir responder à pergunta inicial.
Dizemos que A ⊂ Rn é um conjunto desprezável se para cada ε > 0 existe um número finito de
intervalos de Rn , I1 , . . . , Ip , p ∈ N, tais que
p
X
A ⊂ I1 ∪ . . . ∪ Ip e m(Ij ) < ε.
j=1

Também dizemos que A é um conjunto de medida nula e escrevemos m(A) = 0 (esta terminologia
será explicada mais adiante).
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

56
Exemplos e propriedades
1) ∅ é desprezável.
2) Qualquer conjunto finito é desprezável.
3) Um subconjunto de um conjunto desprezável é desprezável.
4) Se X é um conjunto é desprezável, também X (o fecho de X =int X∪ fr(X)) o é.
5) A união finita de desprezáveis é desprezável.
6) A fronteira de um intervalo de Rn é desprezável.
(A fronteira de um intervalo é a união de conjuntos desprezáveis, já que é união de intervalos degene-
rados.

Exemplo. A fronteira do intervalo (de R2 ) [1, 2] × [3, 4] é o conjunto

({1} × [3, 4]) ∪ ({2} × [3, 4]) ∪ ([1, 2] × {3}) ∪ ([1, 2] × {4}).)

7) Dados K ⊂ Rn compacto e f : K → R uma função contı́nua, então

graf f = {(x, y) ∈ Rn+1 : x ∈ K, y = f (x)}

é um conjunto desprezável.
Exemplo.

graf f = {(x, y) ∈ R2 : x ∈ [−5, 9], y = 2 + sin x}

8) Sejam a, b ∈ R, φ1 , ψ1 : [a, b] → R funções contı́nuas tais que φ1 ≤ ψ1 . Então a fronteira do conjunto


n o
(x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x)

é desprezável.
9) Sejam a, b, ∈ R, φ1 , ψ1 : [a, b] → R funções contı́nuas tais que φ1 ≤ ψ1 ,
Ω = {(x, y) : x ∈ [a, b], φ1 (x) ≤ y ≤ ψ1 (x)}, φ2 , ψ2 : Ω → R funções contı́nuas tais que φ2 ≤ ψ2 .
Então a fronteira do conjunto
n o
(x, y, z) ∈ R3 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x), φ2 (x, y) ≤ z ≤ ψ2 (x, y)

é desprezável.
10) Traços de linhas regulares em Rn são conjuntos desprezáveis. Tal como referido na definição,
dizemos que estes conjuntos têm medida nula. O comprimento de uma curva traço de uma linha secc.
C 1 , que é um valor positivo, como foi visto no Capı́tulo 1, não deve ser confundido com esta medida
(nula).

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

57
São válidos os resultados que se seguem.
Teorema 3.1 Sejam I um intervalo de Rn , compacto (conjunto fechado e limitado) e não vazio,
A ⊂ I um conjunto desprezável e f : IZ → R uma função limitada, tal que f (x) = 0, para todo o
x ∈ I \ A. Então f é integrável em I e f = 0.
I

Teorema 3.2 Sejam I um intervalo de Rn , compacto e não vazio, A ⊂ I um conjunto desprezável e


f : I → R uma função contı́nua em I \ A. Então f é integrável em I.

Corolário 3.3 Sejam I um intervalo de Rn , compacto e não vazio e f : I → R uma função contı́nua.
Então f é integrável em I.

A caracterização completa das funções integráveis envolve uma extensão da noção de conjunto
desprezável que está fora do âmbito do nosso curso, mas que enunciamos seguidamente, por uma
questão de completude.
Dizemos que um conjunto A ⊂ Rn é desprezável à Lebesgue se para cada ε > 0 existe uma
famı́lia numerável de intervalos fechados de Rn , (In )n∈N , tais que
[ X
A⊂ In e m(In ) < ε.
n∈N n∈N

É imediato que se A é um conjunto desprezável, então também é desprezável à Lebesgue.

Teorema 3.4 Sejam I um intervalo compacto, não vazio, de Rn e f : I → R uma função limitada.
A função f é integrável à Riemann em I se, e só se, o conjunto dos seus pontos de descontinuidade
é um conjunto desprezável à Lebesgue.

Vamos agora definir o integral de uma função f definida num conjunto Ω ⊂ Rn limitado e cuja
fronteira seja um conjunto desprezável. Seja I um intervalo compacto de Rn tal que Ω ⊂ I e considere-
se a função g definida por (
f (x) se x ∈ Ω
g(x) =
0 se x ∈ I \ Ω.

Dizemos que f é integrável em Ω se g for integrável em I. Nesse caso definimos


Z Z
f := g.
Ω I

Observe-se que uma vez que prolongámos a função f por zero fora de Ω é indiferente qual o intervalo
I que se considera, desde que contenha Ω.

Dizemos que ∅ = 6 Ω ⊂ Rn é um conjunto mensurável (à Jordan) se é um conjunto limitado e se a


sua fronteira for um conjunto desprezável.
Exemplos e propriedades
11) Um intervalo limitado é um conjunto mensurável.
12) Os conjuntos dos exemplos 7) e 8) são mensuráveis.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

58
13) Se dois conjuntos são mensuráveis, o mesmo acontece à sua união e à sua intersecção.
14) Os conjuntos desprezáveis são mensuráveis.

Podemos agora estender a noção de medida n-dimensional, definida inicialmente para intervalos,
para outros conjuntos. Chamamos medida n-dimensional do conjunto mensurável Ω ⊂ Rn ao
número Z
mn (Ω) = 1.

Observe-se que, sendo Ω um conjunto mensurável, a sua fronteira é desprezável pelo que a função
f ≡ 1 é integrável em Ω.
À semelhança dos casos dos intervalos, se n = 2, a m2 (Ω) chamamos a área de Ω e, se n = 3,
a m3 (Ω) chamamos volume de Ω. Também neste caso, quando não há necessidade de explicitar a
dimensão na medida, em vez de mn , usamos simplesmente m.
Dizemos que mn (∅) = 0, por comodidade de linguagem.
Com a introdução do conceito anterior justifica-se a terminologia conjunto de medida nula para
os conjuntos desprezáveis. Prova-se que um conjunto A ⊂ Rn é desprezável se, e só se, é mensurável
e se m(A) = 0.
Observe-se que se Ω é um conjunto mensurável e f é contı́nua em Ω, então f é integrável em Ω.
Mais geralmente, é válido o resultado que se segue.
Teorema 3.5 Seja Ω um conjunto mensurável e f : Ω → R uma função limitada. Então f é integrável
à Riemann em Ω se, e só se, o conjunto das suas descontinuidades é um conjunto desprezável à
Lebesgue.
O resultado que se segue reúne algumas propriedades do integral múltiplo.
Teorema 3.6 Sejam Ω ⊂ Rn um conjunto mensurável, f e g duas funções integráveis em Ω e M ∈ R.
Z
1. Se c é uma constante real, então c = c m(Ω).

2. (Linearidade) Se a e b são constantes reais, a função af + bg é integrável em Ω e tem-se


Z Z Z
(af + bg) = a f +b g.
Ω Ω Ω
Z
3. (Positividade) Se f (x) ≥ 0 para todo x ∈ Ω, então f ≥ 0.

Z Z
4. (Monotonia) Se f (x) ≥ g(x) para todo x ∈ Ω, então f≥ g.
Ω Ω
Z Z

5. A função |f | é integrável em Ω e tem-se f ≤
|f |.
Ω Ω
Z

6. (Majoração) Se |f (x)| ≤ M para todo x ∈ Ω, então f ≤ M m(Ω).

7. (Aditividade dos domı́nios) Seja Ω = Ω1 ∪ Ω2 , com Ω1 e Ω2 mensuráveis, e Ω1 ∩ Ω2 des-


prezável. Se f é integrável em Ω1 e em Ω2 , então f é integrável em Ω e tem-se
Z Z Z
f= f+ f.
Ω Ω1 Ω2

Observações. A propriedade 2) diz-nos que o conjunto das funções integráveis num conjunto men-
surável Ω é um espaço vectorial e que a aplicação que a cada elemento f deste espaço faz corresponder
Z
f é linear.

Por indução, a propriedade 7) generaliza-se ao caso em que Ω pode ser escrito como união finita
de conjuntos mensuráveis Ωi , Ω = Ω1 ∪ Ω2 ∪ . . . ∪ Ωm , tais que Ωi ∩ Ωj é desprezável, para i 6= j,
i, j = 1, . . . , m.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

59
3.2 Cálculo de integrais em Rn por iteração
Na secção anterior estabelecemos o conceito de integral de um campo escalar definido num subconjunto
mensurável de Rn , assim como algumas das suas propriedades, à semelhança do que estudámos em
dimensão 1. Neste último caso (n = 1) é o Teorema Fundamental do Cálculo que nos fornece um
método prático para o cálculo dos integrais. Nesta secção vamos apresentar uma técnica de cálculo
para os integrais que acabámos de definir; basicamente consiste na redução do cálculo de um integral
múltiplo ao cálculo de n integrais simples, a que chamamos integração iterada. Vamos começar pelo
caso dos integrais duplos (n = 2).

Integração iterada em rectângulos


Seja f uma função real definida e contı́nua (para simplificar a abordagem) no rectângulo (intervalo de
R2 ) R = [a, b] × [c, d]. Para cada x ∈ [a, b] fixo, a função

y 7→ f (x, y), com y ∈ [c, d],

é uma função real de variável real, definida num intervalo, para a qual já estabelecemos o conceito de
integral (de Riemann). Assim, podemos escrever
Z d
f (x, y) dy
c

e dizemos que estamos a integrar a função f (x, y) em ordem à variável y, de y = c até y = d, mantendo
fixa a variável x. A este procedimento damos o nome de integração parcial relativamente a y.
Z d
Em geral f (x, y) dy depende do valor de x; fica então definida uma função que só depende de x,
c
dada por
Z d
g(x) = f (x, y) dy, x ∈ [a, b].
c
Prova-se que a função g assim obtida é integrável em [a, b]. Integrando-a agora nesse intervalo (obvi-
amente que agora a integração é relativa à variável x), obtemos
Z b Z b Z d !
g(x) dx = f (x, y) dy dx. (13)
a a c

Analogamente, é integrável em [c, d] a função


Z b
h(y) = f (x, y) dx
a

que se obtém integrando f (x, y) em ordem à variável x, de x = a até x = b, mantendo fixa a variável y.
À semelhança do caso anterior, a este procedimento chamamos integração parcial relativamente
a x. Integrando agora a função h no intervalo [c, d], vem
Z d Z d Z b !
h(y) dy = f (x, y) dx dy. (14)
c c a

Aos integrais obtidos neste procedimento da integração parcial sucessiva, (13) e (14), damos o nome de
integrais iterados e ao processo em si atribuı́mos a designação de integração iterada. Ao fixarmos
uma das variáveis, o cálculo destes integrais envolve integração de funções de uma só variável, pelo
que podemos aplicar as técnicas estudadas para integração de funções reais de variável real.
Observe-se a analogia na terminologia com o caso das derivadas parciais. Em ambas as situações,
derivação e integração, fixamos uma das variáveis e aplicamos um procedimento parcial, respectiva-
mente, derivar e integrar, em relação à outra variável.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

60
Em (13) integramos primeiro em ordem a y, mantendo x fixo, e depois integramos em ordem a
x; em (14) usamos a ordem contrária. Na maioria das situações omitimos os parênteses, escrevendo
apenas
Z bZ d Z dZ b
f (x, y) dy dx e f (x, y) dx dy.
a c c a
No nosso caso, consideramos que se calcula em primeiro lugar o integral “de !
dentro” e só depois o
Z bZ d Z b Z d
“de fora”. Por exemplo, escrever f (x, y) dy dx significa f (x, y) dy dx.
a c a c

Exemplo. Seja f (x, y) = 12x2 y 3 + 1, com (x, y) ∈ [1, 2] × [0, 1].


A integração parcial de f em ordem a y origina a função g, definida em [1, 2], dada por
Z 1 h i1
g(x) = 12x2 y 3 + 1 dy = 3x2 y 4 + y = 3x2 + 1.
0 0

Integrando g no intervalo [1, 2] obtemos


Z 2 Z 2 h i2
g(x) dx = 3x2 + 1 dx = x3 + x = 8 + 2 − 1 − 1 = 8,
1 1 1

assim Z 2Z 1
f (x, y) dy dx = 8. (15)
1 0
A integração parcial de f em ordem a x origina a função h, definida em [0, 1], dada por
Z 2 h i2
h(y) = 12x2 y 3 + 1 dx = 4x3 y 3 + x = 32y 3 + 2 − 4y 3 − 1 = 28y 3 + 1.
1 1

Integrando h no intervalo [0, 1] obtemos


Z 1 Z 1 h i1
h(y) dy = 28y 3 + 1 dy = 7y 4 + y = 7 + 1 = 8,
0 0 0

donde Z 1Z 2
f (x, y) dx dy = 8. (16)
0 1

No exemplo anterior os integrais (15) e (16) têm o mesmo valor. Este facto não é uma coin-
cidência, é uma propriedade verificada por um grande conjunto de funções, que, em particular, inclui
as funções contı́nuas. Assim, nestes casos, é indiferente a ordem de integração.
Z Verifica-se ainda que
o valor comum obtido pela integração iterada é o valor do integral duplo f (x, y) dA, que definimos
R
anteriormente, como iremos constatar mais adiante.

Integração iterada em domı́nios do tipo I e do tipo II


Vamos agora estabelecer o conceito de integração iterada quando consideramos campos escalares em
regiões Ω, mais genéricas do que os rectângulos.
Consideremos uma região Ω1 ⊂ R2 da forma
n o
Ω1 = (x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ φ2 (x)
onde a ≤ b e φ1 e φ2 são funções r.v.r., contı́nuas, com φ1 ≤ φ2 .
Se o campo escalar f for contı́nuo em Ω1 , para cada x fixo no intervalo [a, b] podemos integrar a
função y 7→ f (x, y) relativamente a y, entre y = φ1 (x) e y = φ2 (x), obtendo-se um integral iterado,
que é uma função de x,
Z φ2 (x)
g(x) = f (x, y) dy,
φ1 (x)

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

61
onde, para além da função integranda, também os limites de integração dependem de x, sendo dados
por φ1 (x) e φ2 (x).
Integrando agora g no intervalo [a, b] vem
Z b Z b Z φ2 (x) !
g(x) dx = f (x, y) dy dx.
a a φ1 (x)

Exemplo. 
Sejam Ω1 = (x, y) ∈ R2 : 0 ≤ x ≤ 1, x2 ≤ y ≤ x e f (x, y) = 2xy + 3y 2 , com (x, y) ∈ Ω1 .

Região Ω1
Para cada 0 ≤ x ≤ 1, temos que
Z x h ix
2xy + 3y 2 dy = xy 2 + y 3 = x3 + x3 − x5 − x6
x2 x2
e " #1
x4 x6 x7
Z 1
3 5 6 4
2x − x − x dx = − − = .
0 2 6 7 0
21
Iremos ver que
4
Z
f (x, y) dA = . (17)
Ω1 21

Consideremos agora uma região Ω2 ⊂ R2 da forma


n o
Ω2 = (x, y) ∈ R2 : c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y)
onde c ≤ d e ψ1 e ψ2 são funções r.v.r., contı́nuas, com ψ1 ≤ ψ2 .
Se f for um campo escalar contı́nuo em Ω2 , integrando a função x 7→ f (x, y) em ordem a x entre
x = ψ1 (y) e x = ψ2 (y) obtemos a função
Z ψ2 (y)
h(y) = f (x, y) dx
ψ1 (y)

que pode ser integrada no intervalo [c, d] obtendo-se


Z d Z d Z ψ2 (y) !
h(y) dy = f (x, y) dx dy.
c c ψ1 (y)

Exemplo. n
y2
o
Sejam Ω2 = (x, y) ∈ R2 : −2 ≤ y ≤ 4, 2 − 3 ≤ x ≤ y + 1 e f (x, y) = xy, com (x, y) ∈ Ω2 .

Região Ω2
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

62
Para cada −2 ≤ y ≤ 4, temos que
!2
y2
Z y+1
1 h 2 iy+1 1 1
y2
xy dx = yx y2 = y(y + 1)2 − y −3
2
−3 2 2
−3 2 2 2
e
!2  !3 4
y2 1 y4 2 y2 1 y2
Z 4
1
y(y + 1)2 − y −3 dy =  + y 3 + − −3  = 36.
2 −2 2 2 4 3 2 3 2
−2
Iremos ver que Z
f (x, y) dA = 36. (18)
Ω2

O resultado que se segue conjuga as ideias expostas, fornecendo um método prático para calcular
integrais duplos, para funções reais integráveis em conjuntos como os que acabámos de apresentar,
justificando as afirmações (17) e (18).

Teorema 3.7 (Teorema de Fubini) Se a função real f é integrável na região Ω1 dada por
n o
Ω1 = (x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ φ2 (x) ,

onde φ1 e φ2 são funções r.v.r., contı́nuas em [a, b] (com φ1 ≤ φ2 ), e

(?) ∀x ∈ [a, b] a função y 7→ f (x, y) é integrável em [φ1 (x), φ2 (x)],


Z φ2 (x)
então a função x 7→ f (x, y) dy é integrável em [a, b] e tem-se
φ1 (x)

Z Z b "Z φ2 (x) #
f (x, y) dA = f (x, y) dy dx.
Ω1 a φ1 (x)

Se a função real f é integrável na região Ω2 dada por


n o
Ω2 = (x, y) ∈ R2 : c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y) ,

onde ψ1 e ψ2 são funções r.v.r., contı́nuas em [c, d] (com ψ1 ≤ ψ2 ), e

(??) ∀y ∈ [c, d] a função x 7→ f (x, y) é integrável em [ψ1 (y), ψ2 (y)],


Z ψ2 (y)
então a função y 7→ f (x, y) dx é integrável em [c, d] e tem-se
ψ1 (y)

Z Z d "Z ψ2 (y) #
f (x, y) dA = f (x, y) dx dy.
Ω2 c ψ1 (y)

Notação. Para os integrais duplos iterados usamos também as seguintes notações


Z b Z φ2 (x) Z b Z φ2 (x) Z d Z ψ2 (y) Z d Z ψ2 (y)
f (x, y) dy dx = dx f (x, y) dy e f (x, y) dx dy = dy f (x, y) dx.
a φ1 (x) a φ1 (x) c ψ1 (y) c ψ1 (y)

Um subconjunto de R2 que se escreve como Ω1 diz-se um domı́nio ou região do tipo I (ou


y-normal) e quando se escreve como Ω2 diz-se um domı́nio ou região do tipo II (ou x-normal).
Seguem-se algumas representações geométricas de exemplos de conjuntos destes tipo, em que o eixo
horizontal é o eixo dos xx e o vertical dos yy (em todas as figuras).
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

63
Domı́nios do tipo I

√ Os gráficos que delimitam as regiões das três figuras são, respectivamente,


x 7→ 4 − x2 e x 7→ 12 (x2 − 4), x 7→ sin x + 4 e x 7→ x + 2, x 7→ x2 + 3 e x 7→ −x + 1

Domı́nios do tipo II

Os gráficos que delimitam as regiões das três figuras são, respectivamente,


7 y
y 7→ −3 + |y − 1| e y 7→ 2 − y 2 , y 7→ 1 − y e y 7→ ey y 7→ 1 − y e y 7→ 3 − 3

Informalmente, no plano xy, dizemos que um conjunto é um domı́nio do tipo I se o conjunto dos seus
pontos é limitado inferiormente pelo gráfico de uma função de x e superiormente pelo gráfico de
outra função de x, ambas definidas no mesmo intervalo; e que é um domı́nio do tipo II se o conjunto
dos seus pontos é limitado à esquerda pelo gráfico de uma função de y e à direita pelo gráfico de
outra função de y, ambas definidas no mesmo intervalo (observe-se a direcção das setas nas figuras
dos exemplos anteriores).
Há conjuntos que são simultaneamente do tipo I e do tipo II, sendo, portanto x-normais e
y-normais. Por esse facto designam-se por domı́nios normais. Rectângulos, alguns triângulos e
cı́rculos são exemplos de domı́nios normais.

Observações ao Teorema de Fubini.


1) Se f é contı́nua em Ω1 (resp. em Ω2 ), a hipótese (?) (resp. (??)) é satisfeita.
2) Se o conjunto Ω1 (ou Ω2 ) for um rectângulo R = [a, b] × [c, d] (isto significa que as funções φ1 e
φ2 (resp. ψ1 e ψ2 ) são constantes), e se f for contı́nua em R, o teorema anterior diz-nos que o valor
Z Z bZ d
do integral duplo f (x, y) dA é dado por f (x, y) dy dx e que este valor coincide com o valor
Z dZ b R a c

f (x, y) dx dy, ou seja, é indiferente a ordem de integração no cálculo do integral duplo.


c a
Em geral o Teorema de Fubini é enunciado com a versão para rectângulos (caso n=2) sendo, por
esse motivo, referido como o teorema que permite trocar a ordem de integração.
3) Nos casos em que a ordem de integração pode ser trocada, nem sempre há interesse em fazê-lo,
escolhe-se então aquela em que os integrais iterados são mais fáceis de calcular.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

64
4) Se a região Ω não for do tipo I nem do tipo II mas se puder ser escrita como união finita de regiões
destes dois tipos, então conjugamos o Teorema 3.6 (propriedade 7) com o Teorema 3.7 para calcular
o integral.
5) No caso particular em que f (x, y) = h(x)g(y) e Ω = [a, b] × [c, d], com h e g integráveis, tem-se
Z Z b ! Z d !
f (x, y) dx dy = h(x) dx g(y) dy .
Ω a c

Z 2 Z π Z 2  Z π  h i2
Exemplo. 2
3x sin y dy dx = 2
3x dx sin y dy = x3 [− cos y]π0 = 8(1 + 1) = 16.
0 0 0 0 0

6) Interpretação geométrica dos integrais iterados

Consideremos f uma função real, positiva e contı́nua em [a, b] × [c, d]. Dado x0 ∈ [a, b], a função
Z d
g(x0 ) = f (x0 , y) dy representa a área da região do plano x = x0 , limitada pela intersecção do
c
gráfico de f com este plano, e pelos planos y = c, y = d e z = 0. Veremos que o volume do sólido
n o
(x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)
Z b Z bZ d
é dado por g(x) dx, ou seja, pelo integral duplo f (x, y) dy dx.
a a c
Z
Exemplos. 1) Calcular 5xy dx dy, onde Ω é a região do semi-plano x ≥ 0, limitada pelas curvas

y = 2x e y = x3 .

Em x ≥ 0, as curvas que definem Ω intersectam-se nos pontos cujas abcissas satisfazem



2x = x3 ⇔ x = 0 ∨ x = 2.

Podemos então escrever Ω como uma região do tipo I, Ω = {(x, y) : 0 ≤ x ≤ 2, x3 ≤ y ≤ 2x}.

Z √2 Z 2x Z √2 " #2x Z √2
y2 5
Z
Temos então 5xy dx dy = 5xy dy dx = 5x dx = 10x3 − x7 dx
Ω 0 x3 0 2 x3 0 2
" #√2
5x4 5x8
= − = 10 − 5 = 5.
2 16 0

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

65
Z
2) Calcular 2y + x dx dy, onde Ω é a semi-coroa circular {(x, y) : 1 ≤ x2 + y 2 ≤ 4, y ≥ 0}.

A região de integração Ω pode ser escrita como a união de três domı́nios do tipo I: R1 , R2 e R3 .

Ω R1 R2 R3
p
R1 = {(x, y) : −2 ≤ x ≤ −1, 0 ≤ y ≤ 4 − x2 },
p p
R2 = {(x, y) : −1 ≤ x ≤ 1, 1 − x2 ≤ y ≤ 4 − x2 } e
p
R3 = {(x, y) : 1 ≤ x ≤ 2, 0 ≤ y ≤ 4 − x2 }.
Temos então
Z Z Z Z
2y + x dx dy = 2y + x dx dy + 2y + x dx dy + 2y + x dx dy =
Ω R1 R2 R3
Z −1 Z √4−x2 Z 1 Z √4−x2 Z 2 Z √4−x2
= 2y + x dy dx + √ 2y + x dy dx + 2y + x dy dx
−2 0 −1 1−x2 1 0
Z −1 h i√ 4−x2
Z 1 h i√ 4−x2
Z 2h i√4−x2
2 2 2
= y + xy dx + y + xy √ dx + y + xy dx
−2 0 −1 1−x2 1 0
Z −1 p Z 1 p p Z 2 p
2
= 4−x +x 4− x2 dx + 3+x 4− x2 −x 1− x2 dx + 4 − x2 + x 4 − x2 dx
−2 −1 1
" #−1 " #1 " #2
x3 (4 − x2 )3/2 (4 − x2 )3/2 (1 − x2 )3/2 x3 (4 − x2 )3/2 28
= 4x − − + 3x − + + 4x − − = .
3 3 −2
3 3 −1
3 3 1
3

Neste exemplo o facto da região de integração ser a união de três regiões do tipo I (e também união de
três regiões do tipo II - verifique) torna o cálculo do integral duplo trabalhoso. Há situações em que
esta questão pode ser ultrapassada. Retomaremos este exemplo mais adiante, com outras ferramentas.

É válida uma versão do Teorema de Fubini para integrais múltiplos de funções definidas
em subconjuntos mensuráveis de Rn , n ≥ 3, na qual se encontra a justificação da afirmação feita na
observação 6) ao Teorema de Fubini. Considere-se um conjunto Ω exprimı́vel na forma que se segue

Ω = {(x1 , . . . , xn ) ∈ Rn : a ≤ x1 ≤ b, φ1 (x1 ) ≤ x2 ≤ ψ1 (x1 ),


φ2 (x1 , x2 ) ≤ x3 ≤ ψ2 (x1 , x2 ), . . . , φn−1 (x1 , x2 , . . . , xn−1 ) ≤ xn ≤ ψn−1 (x1 , x2 , . . . , xn−1 )}
onde as funções φi ≤ ψi , i = 1, . . . , n − 1 são funções reais, contı́nuas nas variáveis indicadas. Então
tem-se
Z Z b "Z ψ1 (x1 ) " Z ψn−1 (x1 ,x2 ,...,xn−1 ) # #
f (x1 , . . . , xn ) dx1 . . . dxn = ... f (x1 , . . . , xn ) dxn . . . dx2 dx1 ,
Ω a φ1 (x1 ) φn−1 (x1 ,x2 ,...,xn−1 )

desde que as sucessivas integrações se possam efectuar, o que é válido sempre que f for contı́nua em
Ω. São válidas expressões análogas para outras ordens de integração desde que Ω se possa exprimir
de forma conveniente e que os integrais façam sentido. Vejamos o exemplo que se segue (n = 3).
Consideremos o conjunto
n o
Ω = (x, y, z) ∈ R3 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x), φ2 (x, y) ≤ z ≤ ψ2 (x, y)
com φ1 ≤ ψ1 , φ2 ≤ ψ2 funções reais contı́nuas. Tem-se
Z Z b Z ψ1 (x) Z ψ2 (x,y)
f (x, y, z) dV = f (x, y, z) dz dy dx.
Ω a φ1 (x) φ2 (x,y)

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

66
Não estando presentes os parênteses, subentende-se que o primeiro integral a ser calculado é o mais
à direita e é relativo à variável mais à esquerda, neste caso a z, e assim sucessivamente. Para o mesmo
integral triplo, usamos também a notação
Z Z b Z ψ1 (x) Z ψ2 (x,y)
f (x, y, z) dV = dx dy f (x, y, z) dz,
Ω a φ1 (x) φ2 (x,y)

significando que o integral entre a e b é referente à variável x, que o integral com limites de integração
φ1 (x) e ψ1 (x) é referente à variável y e que o integral com limites de integração φ2 (x, y) e ψ2 (x, y) diz
respeito à variável z.
Supondo que Ω também se pode escrever na forma
n o
Ω = (x, y, z) ∈ R3 : a ≤ x ≤ b, α1 (x) ≤ z ≤ β1 (x), α2 (x, z) ≤ y ≤ β2 (x, z) ,

com α1 ≤ β1 , α2 ≤ β2 funções reais, contı́nuas, então também se tem


Z Z b Z β1 (x) Z β2 (x,z)
f (x, y, z) dV = f (x, y, z) dy dz dx.
Ω a α1 (x) α2 (x,z)

Voltando ao conjunto da observação 6, já referida, temos


n o
S = (x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)

e, por definição, Z
V (S) = 1 dV.
S
Atendendo ao exposto,
Z Z b Z d Z f (x,y) Z bZ d
V (S) = 1 dV = 1 dz dy dx = f (x, y) dy dx.
S a c 0 a c

Nem sempre os conjuntos onde vamos fazer a integração nos aparecem escritos na forma ideal para
a integração iterada. À semelhança do caso n = 2, no caso n = 3 dizemos que um conjunto Ω é
z-normal se
Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, g1 (x, y) ≤ z ≤ g2 (x, y)},

onde D é um conjunto mensurável de R2 (a projecção de Ω sobre o plano xy) e g1 ≤ g2 são funções


reais e contı́nuas em D.
Temos, neste caso, !
Z Z Z g2 (x,y)
f= f (x, y, z) dz dx dy.
Ω D g1 (x,y)

Após a primeira integração ficamos reduzidos ao cálculo de um integral duplo que, de acordo com a
discussão já efectuada, é feito escrevendo D como um domı́nio ou união de domı́nios dos tipos I e/ou
II.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

67
Analogamente se definem conjuntos x-normais e y-normais. A figura que se segue apresenta exem-
plos dos três tipos de conjuntos a que acabámos de nos referir.

Neste processo o cálculo do integral triplo é reduzido, após a primeira integração, ao cálculo de
um integral duplo.

Exemplo.
Z
Calcular x dx dy dz, onde Ω é o tetraedro limitado pelos planos x = 0, y = 0, z = 0 e x + y + z = 1.

É fácil ver que Ω é a região z-normal dada por

Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, 0 ≤ z ≤ 1 − x − y}

com
D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x}.

Ω D

Temos então

Ω = {(x, y, z) ∈ R3 : 0 ≤ x ≤ 1, 0≤y ≤1−x e 0 ≤ z ≤ 1 − x − y},


donde
Z Z 1 Z 1−x Z 1−x−y
x dx dy dz = dx dy x dz
Ω 0 0 0

Z 1 Z 1−x
= dx x(1 − x − y) dy
0 0

" #1−x
(1 − x − y)2
Z 1 Z 1
1 1
= x − dx = x − 2x2 + x3 dx = .
0 2 0
2 0 24

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

68
Há uma outra forma de redução dimensional no cálculo destes integrais. Suponhamos que Ω ⊂ R3
é um conjunto mensurável em que z varia num intervalo [α, β]. Para cada z0 neste intervalo seja Ωz0
a secção transversal obtida cortando Ω pelo plano z = z0 . Designe-se

Az0 = {(x, y) ∈ R2 : (x, y, z0 ) ∈ Ω}

a projecção da fatia Ωz0 sobre o plano xy.

Assim,
Ω = {(x, y, z) ∈ R3 : z ∈ [α, β], (x, y) ∈ Az }.
Supondo agora que cada Az é mensurável (situação que ocorre, por exemplo, quando a fronteira de
Ω é a união de gráficos de funções contı́nuas ou é um conjunto
Z convexo), e considerando f : Ω → R
uma função contı́nua, garante-se que todos os integrais f (x, y, z) dx dy, com z ∈ [α, β], existem e
Az
prova-se que
Z Z β Z 
f= f (x, y, z) dx dy dz.
Ω α Az

No caso em que f = 1 o integral anterior dá-nos o volume do sólido Ω. O método que acabámos
de descrever, com a linguagem dos nossos dias, foi usado por B. Cavalieri (1598-1647) para calcular
volumes de sólidos, antes do aparecimento do cálculo de Newton e de Leibniz!

Terminamos a secção com uma observação relativa ao caso particular em que a função integranda
se escreve na forma

f (x, y, z) = h(x)g(y)ψ(z) e Ω = [a, b] × [c, d] × [α, β],

com h, g e ψ integráveis. Neste caso tem-se


Z b ! Z d ! Z !
Z β
f (x, y, z) dx dy dz = h(x) dx g(y) dy ψ(z) dz . (19)
Ω a c α
Z
Exemplo. Calcular r2 sin ϕ dr dθ dϕ, com (r, θ, ϕ) ∈ Ω = [0, 1] × [0, π] × [0, π2 ].

Temos
π
Z Z 1  Z π  Z !
2
2 2
r sin ϕ dr dθ dϕ = r dr dθ sin ϕ dϕ (20)
Ω 0 0 0
" #1
r3 π π
= π [− cos ϕ]02 = . (21)
3 0
3

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

69
3.2.1 Aplicações dos integrais múltiplos
Atendendo às definições estabelecidas, dado Ω um conjunto mensurável de R2 , temos que:

• a área A de Ω é dada por Z


A= 1 dx dy;

• se f (x, y) ≥ 0 em Ω, o volume V do sólido limitado inferiormente pelo plano z = 0 e superior-


mente pelo gráfico de f , considerada em Ω, (graf f = {(x, y, z) ∈ R3 : (x, y) ∈ Ω, z = f (x, y)}),
é dado por Z
V = f (x, y) dx dy.

Exemplos. 1) Usando um integral duplo, calcular a área de

Ω = {(x, y) ∈ R2 : |x| ≤ y ≤ 2 − x2 }.
Z
Temos então de calcular 1 dx dy, o que implica escrever Ω como uma região do tipo x- ou y-normal.

É fácil ver que Ω = {(x, y) ∈ R2 : −1 ≤ x ≤ 1, |x| ≤ y ≤ 2 − x2 }.

Assim,
Z 1 Z 2−x2 " #1
x3 x2
Z 1 Z 1
7
Z
2 2
1dx dy = dy dx = 2 − x − |x| dx = 2 2 − x − x dx = 2 2x − − = .
Ω −1 |x| −1 | {z } 0 3 2 0
3
par

2) Calcular o volume do sólido limitado superiormente pelo gráfico da função f (x, y) = 4 − x2 − y 2 e


inferiormente pelo plano z = 0, quando (x, y) ∈ Ω, sendo Ω a região do plano xy limitada pela curva
y 2 − x − 1 = 0 e pela recta x = 0.

É fácil ver que as curvas dadas se intersectam nos pontos (0, −1) e (0, 1). Podemos então escrever
Ω como uma região do tipo II, a saber

Ω = {(x, y) : −1 ≤ y ≤ 1, y 2 − 1 ≤ x ≤ 0}.

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

70
O volume V pedido é dado por
" #0
x3
Z Z 1 Z 0 Z 1
2 2 2 2 2 2
V = 4 − x − y dx dy = 4 − x − y dx dy = (4 − y )(1 − y ) − dy
Ω −1 y 2 −1 −1 3 y 2 −1

(y 2 − 1)3
Z 1
100
= 4 − 5y 2 + y 4 + dy = .
−1 3 21

Os integrais duplos e os integrais triplos são também utilizados para, por exemplo, determinar a
massa, o centro de massa e o momento de inércia de regiões planas ou de sólidos, pois as definições
destes conceitos fı́sicos envolvem estes integrais, como veremos seguidamente.
Considere-se um sólido cuja medida de comprimento relativa à direcção z é desprezável em relação às
outras medidas nas variáveis x e y, tal como uma placa fina. Seja Ω a secção desse sólido relativa à
direcção z. Supondo que µ(x, y) é a densidade de massa (massa por unidade de área), então:

1. a massa total M da placa que ocupa a região Ω do plano xy é dada por


Z
M= µ(x, y) dx dy;

2. o centro de massa (também chamado centro de gravidade ou centróide) de Ω é o ponto


C(xC , yC ) com as coordenadas dadas por
1
Z
xC = xµ(x, y) dx dy,
M Ω

1
Z
yC = yµ(x, y) dx dy;
M Ω

3. o momento (de inércia) de Ω relativo a uma recta r (o eixo) é dado por


Z
Ir = d2 ((x, y), r)µ(x, y) dx dy,

onde d((x, y), r) representa a distância do ponto (x, y) à recta r.


(O momento de inércia mede a tendência do sistema girar em torno da recta r.)

Analogamente, dado um sólido S de R3 com densidade de massa µ(x, y, z) define-se a massa total,
as coordenadas do centróide, e o momento relativo a r, de S, respectivamente por
Z
M= µ(x, y, z) dx dy dz
S

1
Z
xC = xµ(x, y, z) dx dy dz,
M S
1
Z
yC = yµ(x, y, z) dx dy dz,
M S
1
Z
zC = zµ(x, y, z) dx dy dz,
M S
Z
Ir = d2 ((x, y, z), r)µ(x, y, z) dx dy dz.
S

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

71
Recordamos que um conjunto Ω ⊂ Rn é conexo por arcos se, para quaisquer x, y ∈ Ω existe uma
linha parametrizada γ : [0, 1] → Ω tal que γ(0) = x e γ(1) = y.

Proposição 3.8 (Teorema do Valor Médio) Seja f uma função contı́nua em Ω ⊂ Rn , conjunto
compacto, mensurável e conexo por arcos. Então existe um ponto x0 ∈ Ω tal que
Z
f (x) = f (x0 ) m(Ω).

A f (x0 ) damos o nome de valor médio (ou média) de f em Ω.

A fórmula do teorema anterior diz que uma caixa, cuja base é um rectângulo R e cuja altura é o valor
médio de f , tem o mesmo volume que o sólido que se encontra abaixo do gráfico de f (f ≥ 0).

Se z = f (x, y) descrever uma região montanhosa e cortarmos os topos das montanhas à altura do
valor médio de f , significa que podemos preencher os vales com a parte obtida pelos cortes e obter
uma região plana.

Demonstração da proposição. Se m(Ω) = 0, o resultado é imediato. Suponhamos então que Ω não


é desprezável. Como f é contı́nua e Ω é compacto, existem a, b ∈ R, tais que a = minΩ f e b = maxΩ f
(pelo Teorema de Weierstrass). Assim, para todo o x ∈ Ω, tem-se a ≤ f (x) ≤ b. Pela propriedade da
monotonia dos integrais (cf. Teorema 3.6, propriedade 4) vem
Z Z Z
a≤ f≤ b,
Ω Ω Ω

logo (cf. Teorema 3.6, propriedade 1)


Z
Z f

a m(Ω) ≤ f ≤ b m(Ω) ⇔ a ≤ ≤ b.
Ω m(Ω)

Como f é contı́nua e Ω é conexo por arcos, o Teorema de Bolzano garante a existência de x0 ∈ Ω,


tal que Z
f

f (x0 ) = ,
m(Ω)
(f assume todos os valores entre a e b), logo
Z
f (x) = f (x0 ) m(Ω). 

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

72
3.3 Mudança de variável no integral múltiplo
No cálculo de integrais de funções reais de variável real temos de lidar com a primitivação da função
integranda, o que nem sempre é uma tarefa simples. A integração por substituição é muitas vezes
a opção que usamos para ultrapassar essa dificuldade. Para essas funções aprendemos o Teorema de
Mudança de Variável que nos diz que
Z u(d) Z d Z d
0
f (x) dx = f (u(t))u (t) dt = f ◦ u(t) u0 (t) dt
u(c) c c

considerando x = u(t) e u : [c, d] → R uma função de classe C 1 .


No caso em que u0 > 0, temos u : [c, d] → [a, b] e u(c) = a, u(d) = b, pelo que
Z b Z u(d) Z d
f (x) dx = f (x) dx = f (u(t))u0 (t) dt.
a u(c) c

No caso em que u0 < 0, temos u : [c, d] → [a, b], com u(c) = b, u(d) = a, donde
Z b Z a Z u(d) Z d Z d
f (x) dx = − f (x) dx = − f (x) dx = − f (u(t))u0 (t) dt = f (u(t))(−u0 (t))dt.
a b u(c) c c

Podemos então escrever Z b Z d


f (x) dx = f (u(t))|u0 (t)| dt.
a c

Ao passarmos para os integrais de campos escalares, a primitivação da função integranda também


é um dos problemas (entre outros) que temos de enfrentar, pelo que se antecipa a necessidade de um
Teorema de Mudança de Variáveis, que enunciamos seguidamente.

Teorema 3.9 (Teorema de Mudança de Variáveis no Integral Múltiplo) Sejam U e V dois


abertos de Rn e T : U → V uma bijecção de classe C 1 , tal que det JT (u) 6= 0, ∀u ∈ U , excepto num
conjunto de medida nula. Sejam D um conjunto limitado mensurável tal que D ⊂ U , Ω = T (D) e
f : Ω → R uma função integrável. Então:
1. (f ◦ T )|det JT | : D → R é integrável e
Z Z
2. f= (f ◦ T )|det JT |,
Ω D

onde |det JT | denota o módulo do jacobiano de T .

Observações.
1) Muitas vezes referimo-nos à função T do teorema anterior como a função mudança de variáveis,
no entanto, observamos que esta referência pode conter um abuso de linguagem, já que essa designação
é o conceito matemático que se segue. Dados dois abertos U e V de Rn , dizemos que uma função
T : U → V é uma mudança de coordenadas ou de variáveis se é uma bijecção de classe C 1 tal
que det JT (u) 6= 0, ∀u ∈ U .
2) Observamos que o teorema anterior ainda é válido se D ⊂ U e D 6⊂ U , desde que U e V sejam
abertos com fronteira de medida nula.
3) Na notação que põe em evidência as “variáveis” de D e Ω, e considerando as relações

xi = Ti (u1 , . . . , un ), i = 1, . . . , n,

a fórmula em 2. do teorema anterior exprime-se da maneira seguinte



∂(x1 , . . . , xn )
Z Z
f (x1 , . . . , xn ) dx1 . . . dxn = f (T1 (u1 , . . . , un ), . . . , Tn (u1 , . . . , un ))
du1 . . . dun .
Ω D ∂(u , . . . , u )
1 n

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

73
Em que situações recorremos a uma mudança de variáveis para calcular um integral múltiplo?
Para além da já referida dificuldade de primitivação da função integranda, agora (n > 1) uma nova
dificuldade pode surgir - a escrita da região de integração usando conjuntos normais em relação a uma
das variáveis.
Z
Como procedemos para efectuar a mudança de variáveis num integral múltiplo f?

Escolhemos uma transformação T , de classe C 1 , bijectiva, cujo jacobiano seja não nulo, eventual-
mente, à excepção de um conjunto de medida nula, e depois aplicamos a fórmula
Z Z
f= (f ◦ T )|det JT |,
Ω D

o que exige o conhecimento do jacobiano de T . Por vezes, o cálculo do jacobiano de T −1 é mais fácil
de efectuar do que o de T . Assim, é útil observar que, se det JT (X) 6= 0, os dois se relacionam da
forma que se segue
1
det JT −1 (Y ) = , com T (X) = Y.
det JT (X)
O resultado que garante esta propriedade é conhecido como Teorema da Função Inversa.
A estrutura de f e de Ω ditam os critérios da escolha de T , alguns dos quais evidenciaremos ao
longo dos exemplos que vamos estudar.
Nos exemplos e exercı́cios propostos apenas trabalharemos em dimensão 2 e em dimensão 3. No
que segue, apresentamos alguns exemplos de mudança de variáveis que utilizamos frequentemente para
o cálculo desses integrais.

3.3.1 Casos particulares de mudança de variáveis em R2

Sejam Ω e D conjuntos mensuráveis, T (u, v) = (x(u, v), y(u, v)) uma transformação nas condições
do Teorema 3.9, tal que T (D) = Ω, e f um campo escalar integrável em Ω. Então, a fórmula de
mudança de variável no integral duplo é

∂(x, y)
Z Z
f (x, y) dx dy = f (x(u, v), y(u, v))
du dv.
Ω D ∂(u, v)

Mudança de Variáveis Linear


Consideremos a aplicação linear
T : R2 → R2
(u, v) 7→ T (u, v) = (au + bv, cu + dv),
com ad − bc 6= 0.
Fazendo x = au + bv e y = cu + dv, tem-se

∂(x, y)
= ad − bc 6= 0.
∂(u, v)

Como T é uma aplicação injectiva de classe C 1 , tem-se


Z Z Z
f (x, y) dx dy = |ad − bc| f (T (u, v)) du dv = |ad − bc| f (au + bv, cu + dv) du dv.
T (D) D D

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

74
Exemplo. Vamos calcular o integral Z y−x
e y+x dx dy,

onde Ω é a região (poligonal) limitada pelas rectas x + y = 2, x + y = 1 e pelos eixos coordenados.

Região Ω = {(x, y) ∈ R2 : x ≥ 0, y ≥ 0, 1 ≤ x + y ≤ 2}

Estamos perante uma região de integração que se escreve como união de dois domı́nios do tipo I
(verifique), pelo que é simples escrever o integral dado como soma de integrais iterados. No entanto,
a função integranda imprime dificuldades à integração directa, pois a sua primitivação (parcial) não é
evidente. Assim, vamos efectuar uma mudança de variáveis (m.v.) no integral dado. A estrutura da
função integranda sugere que consideremos as novas variáveis u e v, dadas por

u=y−x e v = y + x.

As relações anteriores definem uma m.v. linear que verifica



∂(u, v) −1 1 ∂(x, y) 1
= = −2, logo = − 6= 0,
∂(x, y) 1 1 ∂(u, v) 2

e, portanto, é admissı́vel para o Teorema 3.9. Interessa-nos agora escrever as variáveis x e y em função
de u e v, para identificarmos a função mudança de variáveis. Temos
u+v v−u
=y e = x,
2 2
v−u u+v
 
pelo que a função m.v. é dada por T (u, v) = , . Assim, a região D do plano uv tal que
2 2
T (D) = Ω (ou seja, D = T −1 (Ω)) é dada por

D = {(u, v) ∈ R2 : 1 ≤ v ≤ 2, −v ≤ u ≤ v}.

Região D

Efectuando a m.v. no integral vem


1
Z y−x
Z
u
e y+x dx dy = e v du dv.
Ω 2 D

Como D é uma região do tipo II (observe que não é do tipo I) vem


" #2
e − e−1 v 2 3(e − e−1 )
Z 2 Z v Z 2h Z 2
1 u 1 u
iv 1 −1
e du dv =
v ve v dv = (ve − ve ) dv = = .
2 1 −v 2 1 −v 2 1 2 2 1
4

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

75
Coordenadas polares

Vimos que as coordenadas polares (r, θ) de um ponto P ∈ R2 com coordenadas cartesianas p


(x, y) 6= (0, 0) são tais que r é a distância euclidiana do ponto P à origem (0, 0), ou seja, r = x2 + y 2 ;
e θ é o ângulo, em [0, 2π[, que o vector OP faz com o semi-eixo positivo dos xx, medido a partir deste
no sentido directo (sentido contrário ao dos ponteiros do relógio).

As variáveis dos dois sistemas de coordenadas estão relacionadas entre si por


(
x = r cos θ
r > 0, θ ∈ [0, 2π[,
y = r sin θ,
com
arctan xy ,
 

 x > 0 e y ≥ 0;
π
 2, x = 0 e y > 0;


q 
arctan xy + π,

r= x2 + y 2 e θ= (x < 0 e y ≥ 0) ou (x < 0 e y ≤ 0);
 3π ,

x = 0 e y < 0;
 2


y

2π + arctan x , x > 0 e y ≤ 0.
Esta relação é uma restrição da seguinte transformação vectorial definida em R2

T (r, θ) = (x(r, θ), y(r, θ)) = (r cos θ, r sin θ). (22)

No integral duplo, mudar de variáveis cartesianas para coordenadas polares, nas condições do Teorema
3.9, implica considerar a transformação anterior no aberto ]0, +∞[×]0, 2π[, onde é injectiva, de classe
C 1 e com jacobiano dado por (cf. exercı́cio 37 da Ficha 2)

∂(x, y)
= r.
∂(r, θ)
Assim, dado f um campo escalar integrável em Ω, o Teorema 3.9 diz-nos que
Z Z
f (x, y) dx dy = f (r cos θ, r sin θ) r dr dθ,
Ω D

onde Ω é a imagem da região D por meio da transformação anterior.


Temos
T (]0, +∞[×]0, 2π[) = R2 \ {(x, 0) : x ∈ R+
0 },

o que significa que os conjuntos que são atravessados pelo semi-eixo positivo das abcissas não estão
incluı́dos nesta transformação. No entanto, a fronteira de ]0, +∞[×]0, 2π[ é o conjunto, que se prova
ter medida nula, ({0} × [0, 2π]) ∪ ([0, +∞[×{0}) ∪ ([0, +∞[×{2π}), e o semi-eixo positivo das abcissas
é T ([0, +∞[×{0}), pelo que as coordenadas polares podem ser consideradas quando utilizamos o
Teorema 3.9, para qualquer subconjunto Ω de R2 , com D = T (Ω) (observe-se que o jacobiano de T se
anula na fronteira referida). Assim, escrevemos
(
x = r cos θ ∂(x, y)
r ≥ 0, θ ∈ [0, 2π], = r.
Coordenadas Polares y = r sin θ ∂(r, θ)
(r2 = x2 + y 2 )

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

76
Exemplos.
1) O cı́rculo fechado que em coordenadas cartesianas tem centro em (0, 0) e raio 2, ou seja, o conjunto
{(x, y) ∈ R2 : x2 + y 2 ≤ 4}, em coordenadas polares é o rectângulo {(r, θ) : 0 ≤ r ≤ 2, 0 ≤ θ ≤ 2π}.

Genericamente, cı́rculos fechados em coordenadas cartesianas são os transformados de rectângulos


através das coordenadas polares.
Este exemplo (muito simples) ilustra a utilidade do uso de coordenadas polares para o cálculo
de integrais duplos em que a região de integração é circular (cı́rculos, porções de cı́rculos, coroas
circulares). São também úteis quando a função integranda envolve a composição do campo escalar
(x, y) 7→ x2 + y 2 com outras funções reais de variável real, como é o caso dos exemplos seguintes:
2 2
f (x, y) = ex +y e g(x, y) = 3+x12 +y2 .
Z
2) Retomamos agora o exemplo da página 66 e vamos calcular 2y + x dx dy, onde Ω é a semi-coroa

circular {(x, y) : 1 ≤ x2 + y 2 ≤ 4, y ≥ 0}, usando mudança de variáveis no integral.


Começamos por traduzir as condições que definem Ω em coordenadas cartesianas, para condições em
coordenadas polares. Recordando que
(
x = r cos θ
e r 2 = x2 + y 2
y = r sin θ,
vem
r≥0
1 ≤ x2 + y 2 ≤ 4 ⇔ 1 ≤ r2 ≤ 4 ⇐⇒ 1 ≤ r ≤ 2
e, se r 6= 0,
y ≥ 0 ⇔ r sin θ ≥ 0 ⇔ 0 ≤ θ ≤ π.
Assim, Ω é o transformado do rectângulo D = {(r, θ) : 1 ≤ r ≤ 2, 0 ≤ θ ≤ π}, por meio das
coordenadas polares. Aplicando o Teorema 3.9 no integral dado vem
Z Z
I= 2y + x dx dy = (2r sin θ + r cos θ)r dr dθ.
Ω D

(A vermelho o módulo do jacobiano da mudança de variável.) Como D é um rectângulo, é muito


simples escrever o integral duplo anterior na forma de integrais iterados. Vem então
Z πZ 2 Z π" 3 #2
r
I= 2r2 sin θ + r2 cos θ dr dθ = (2 sin θ + cos θ) dθ
0 1 0 3 1
Z π
7 7 28
= (2 sin θ + cos θ) dθ = [−2 cos θ + sin θ]π0 = .
0 3 3 3
É evidente que a resolução acabada de efectuar é muito mais simples que a anteriormente apresentada.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

77
3.3.2 Casos particulares de mudança de variáveis em R3

Sejam Ω e D conjuntos mensuráveis, T (u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) uma trans-
formação nas condições do Teorema 3.9, tal que T (D) = Ω, e f um campo escalar integrável em Ω.
Então, a fórmula de mudança de variável no integral triplo é

∂(x, y, z)
Z Z
f (x, y, z) dx dy dz = f (x(u, v, w), y(u, v, w), z(u, v, w)) du dv dw.
Ω D ∂(u, v, w)

Coordenadas cilı́ndricas em R3
Dado um ponto P de coordenadas cartesianas (x, y, z), em R3 \ {(0, 0, z) : z ∈ R}, a (r, θ, z) com

 x = r cos θ

y = r sin θ com r ∈ ]0, +∞[, θ ∈ [0, 2π[, z ∈ R,

 z = z,

chamamos as coordenadas cilı́ndricas de P , considerando (r, θ) as coordenadas polares de (x, y).


Mudar de variáveis cartesianas para coordenadas cilı́ndricas, nas condições do Teorema 3.9, implica
considerar a transformação seguinte
T :]0, +∞[×]0, 2π[×R → R3 , (r, θ, z) 7→ (r cos θ, r sin θ, z), (23)
que é uma aplicação de classe C 1,
definida no aberto ]0, +∞[×]0, 2π[×R e que é uma bijecção sobre
3
V = R \ {(x, 0, z) : x ≥ 0, z ∈ R} (cf. exercı́cio 27 da Ficha 3). Além disso, temos que
∂(x, y, z)
= r.
∂(r, θ, z)
Nestas condições o Teorema 3.9 diz-nos que, dado f um campo escalar integrável em Ω,
Z Z
f (x, y, z) dx dy dz = f (r cos θ, r sin θ, z) r dr dθ dz,
Ω D
com Ω a imagem da região D por meio da transformação anterior.
À semelhança do que se passa em R2 com as coordenadas polares, alguns conjuntos Ω ⊂ R3 não
são abrangidos por esta mudança de variáveis, nomeadamente aqueles que são atravessados pelo semi-
plano P = {(x, 0, z) : x ≥ 0, z ∈ R}. No entanto, T dada por (23) pode ser considerada no conjunto
W = [0, +∞[×[0, 2π] × R, cuja fronteira se prova ter medida nula e o semi-plano P , que também
se prova ter medida nula, é a imagem de ({0} × [0, 2π] × R) ∪ ([0, +∞[×{0} × R), por meio de T ,
tendo-se T (W ) = R3 . Assim, as coordenadas cilı́ndricas podem ser utilizadas na mudança de variáveis
num integral triplo, considerado um qualquer subconjunto mensurável Ω de R3 , ou seja, podemos
considerar a expressão designatória de T dada em (23) definida em W . Escrevemos então

 x = r cos θ

∂(x, y, z)
y = r sin θ r ≥ 0, θ ∈ [0, 2π], z ∈ R, = r.
Coordenadas Cilı́ndricas 
 z = z, ∂(r, θ, z)
(r2 = x2 + y 2 )

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

78
Observações.
1) O cilindro que em coordenadas cartesianas é o conjunto {(x, y, z) ∈ R3 : x2 + y 2 ≤ 4, 0 ≤ z ≤ 5},

em coordenadas cilı́ndricas é o paralelepı́pedo

{(r, θ, z) : 0 ≤ r ≤ 2, 0 ≤ θ ≤ 2π, 0 ≤ z ≤ 5}.

Genericamente, cilindros cujo eixo de simetria é o eixo dos zz são os transformados de paralelepı́pedos
pela aplicação (23) (considerada em W), daı́ o nome deste sistema de coordenadas.
2) As imagens por meio de T de conjuntos que em coordenadas cilı́ndricas têm uma das coordenadas
constantes são uma superfı́cie cilı́ndrica (r constante), um semi-plano perpendicular ao plano z = 0
(θ constante) e um plano paralelo a z = 0 (z constante), respectivamente dados por

T ({(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : r = r0 }) = {(x, y, z) ∈ R3 : x2 + y 2 = r02 },

T ({(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : θ = θ0 }) = {(x, y, z) ∈ R3 : x = r cos θ0 , y = r sin θ0 , r ≥ 0} e


T ({(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : z = z0 }) = {(x, y, z) ∈ R3 : z = z0 }.
A figura que se segue ilustra as três situações que acabámos de descrever.

Este sistema de coordenadas é particularmente útil quando a região de integração envolve porções
de cilindros, parabolóides ou cones, entre outras regiões.

3) Em R3 , os pares de condições (x2 + y 2 ≤ 1 e −4 ≤ z ≤ 3) e (y 2 + z 2 ≤ 1 e 2 ≤ x ≤ 7) definem, em


coordenadas cartesianas, cilindros, cujos eixos de simetria são as rectas y = 0 ∧ x = 0 (eixo dos zz) e
y = 0 ∧ z = 0 (eixo dos xx), respectivamente. Observamos que a transformação (23) é adequada para
que o primeiro cilindro seja imagem de um paralelepı́pedo, mas o mesmo não acontece com o segundo.
No entanto, se considerarmos a transformação dada por

 x=x

y = r cos θ x ∈ R, r ≥ 0, θ ∈ [0, 2π[ (24)

 z = r sin θ,

já obtemos essa relação, isto é, o segundo cilindro é a imagem por meio da aplicação em (24) do
paralelepı́pedo [2, 7] × [0, 1] × [0, 2π[. Assim, o nome “coordenadas cilı́ndricas” não é apenas atribuı́do
à transformação que figura em (23), mas a qualquer uma em que cilindros de R3 sejam os transformados
de paralelepı́pedos, como a que está definida em (24).
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

79
Exemplos.
1) Seja Ω o sólido limitado pela superfı́cie cilı́ndrica x2 + y 2 = 1, pelo plano z = 4 e p
pelo parabolóide
z = 1 − x2 − y 2 . Sabendo que a densidade de Ω é dada pela função µ(x, y, z) = x2 + y 2 , vamos
determinar a sua massa M .
Comecemos por escrever Ω em coordenadas cartesianas. Temos
Ω = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1, z ≥ 1 − x2 − y 2 , z ≤ 4}.

Por definição Z Z q
M= µ(x, y, z) dx dy dz = x2 + y 2 dx dy dz.
Ω Ω
Para calcular o integral anterior vamos usar mudança de variáveis. Atendendo ao tipo de superfı́cies
envolvidas (cilı́ndrica, parabolóide), vamos escolher coordenadas cilı́ndricas. Queremos determinar D,
tal que T (D) = Ω, onde T é a função definida em (23), considerada em W . Para tal, traduzimos as
condições que definem Ω em coordenadas cartesianas para o sistema de coordenadas escolhido. Vem
então
r≥0
x2 + y 2 ≤ 1 ⇔ r2 ≤ 1 ⇐⇒ 0 ≤ r ≤ 1,
1 − x2 − y 2 ≤ z ≤ 4 ⇔ 1 − r2 ≤ z ≤ 4.
Assim,
D = {(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : 0 ≤ r ≤ 1, 1 − r2 ≤ z ≤ 4}.
Observe-se que não obtivemos nenhuma restrição para θ, o que é natural se observarmos a repre-
sentação geométrica do conjunto Ω. Aplicando então a mudança de variáveis no integral, que também
requer apcomposição da função integranda com a função mudança de variáveis (neste caso a tradução
produz x2 + y 2 = r), vem
Z 2π Z 1 Z 4 Z 1 Z 4 Z 1
∂(x, y, z)
M= dθ dr r
dz = 2π dr r2 dz = 2π (4 − 1 + r2 )r2 dr
0 0 1−r2 ∂(r, θ, z) 0 1−r2 0
" #1
r5
Z 1
2 4 3 12π
= 2π 3r + r dr = 2π r + = .
0 5 0
5

É importante observar que neste caso a ordem pela qual se escrevem os integrais iterados não é
arbitrária. Da esquerda para a direita, o último integral a escrever (que será o primeiro a ser calculado)
é o relativo à variável z, pois esta varia entre dois gráficos, dependendo um deles da variável r. Quanto
aos outros dois não há obrigatoriedade na ordem de escrita, já que θ e r variam em intervalos. Como
a função integranda não depende de θ é mais cómodo escrever em primeiro lugar o integral relativo a
esta variável.

2) Calcular o volume do sólido S limitado pelo plano y = 4 e pelo parabolóide x2 + z 2 = y.


Temos que
S = {(x, y, z) ∈ R3 : x2 + z 2 ≤ y ≤ 4}
e Z
V (S) = 1 dx dy dz.
S

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

80
Para calcular o integral anterior, interessa-nos considerar a seguinte mudança de variáveis

 x = r cos θ

y=y r ≥ 0, y ∈ R, θ ∈ [0, 2π]

 z = r sin θ,

cujo módulo do jacobiano é r (verifique). Vamos determinar D, tal que T (D) = S, onde T é a função
acabada de definir. Para tal, traduzimos as condições que definem S em coordenadas cartesianas para
o sistema de coordenadas escolhido. Vem então

x2 + z 2 ≤ y ≤ 4 ⇔ r2 ≤ y ≤ 4.

Neste caso há uma condição escondida, que tem de ser tida em conta, a condição r2 ≤ 4. Atendendo
a que r ≥ 0, esta condição diz-nos que 0 ≤ r ≤ 2. Mais uma vez não obtivemos restrições para θ.
Podemos escrever

D = {(r, y, θ) ∈ [0, +∞[×R × [0, 2π] : 0 ≤ r ≤ 2, r2 ≤ y ≤ 4},

pelo que a aplicação do Teorema 3.9 implica


" #2
r4
Z 2π Z 2 Z 4 Z 2
3 2
V (S) = dθ dr r dy = 2π 4r − r dr = 2π 2r − = 2π (8 − 4) = 8π.
0 0 r2 0 4 0

Coordenadas esféricas em R3
Dado um ponto P ∈ R3 de coordenadas cartesianas (x, y, z), com (x, y) 6= (0, 0), definimos as suas
coordenadas esféricas (ρ, θ, φ), da forma que se segue: ρ é a distância euclidiana do ponto P à
origem, pelo que é dada por q
ρ= x2 + y 2 + z 2 ;
designando por OP 0 a projecção do segmento OP no plano xy, θ ∈ [0, 2π[ é o ângulo que o vector OP 0
faz com o semi-eixo positivo dos xx, medido a partir deste semi-eixo no sentido directo, e finalmente,
φ ∈ [0, π[ é o ângulo que o vector OP faz com o semi-eixo positivo dos zz, medido a partir do referido
semi-eixo (ver a figura que se segue). Tem-se então

 x = ρ cos θ sin φ

y = ρ sin θ sin φ ρ > 0, θ ∈ [0, 2π[, φ ∈]0, π[.

 z = ρ cos φ,

Tal como no caso das coordenadas cilı́ndricas, efectuar uma mudança de coordenadas cartesianas
para coordenadas esféricas nas condições do Teorema 3.9, implica considerar a transformação

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

81
T :]0, +∞[×]0, 2π[×]0, π[→ R3 ,
dada por
T (ρ, θ, φ) = (x(ρ, θ, φ), y(ρ, θ, φ), z(ρ, θ, φ)) = (ρ cos θ sin φ, ρ sin θ sin φ, ρ cos φ) (25)
que é uma bijecção de classe C 1 (definida num aberto) sobre V = R3 \ {(x, 0, z) : x ≥ 0, z ∈ R}, cujo
jacobiano é (cf. exercı́cio 32 da Ficha 3)
∂(x, y, z)
= −ρ2 sin φ.
∂(ρ, θ, φ)
Nestas condições o Teorema 3.9 diz-nos que
Z Z
f (x, y, z) dx dy dz = f (ρ cos θ sin φ, ρ sin θ sin φ, ρ cos φ) ρ2 sin φ dρ dθ dφ
Ω D
onde Ω é a imagem da região D por meio da transformação anterior e f é um campo escalar integrável
em Ω.
Tal como vimos no caso das coordenadas cilı́ndricas, os conjuntos que são atravessados pelo semi-
plano P = {(x, 0, z) : x ≥ 0, z ∈ R} não são abrangidos por esta mudança de variáveis. Analogamente,
T dada por (25) pode ser considerada num conjunto maior, neste caso E = [0, +∞[×[0, 2π] × [0, π],
tendo-se que P é a imagem de ({0} × [0, 2π] × [0, π]) ∪ ([0, +∞[×{0} × [0, π]) (conjunto que se prova
ter medida nula), e T (E) = R3 . Assim, também as coordenadas esféricas podem ser utilizadas na
mudança de variáveis num integral triplo, considerado um qualquer subconjunto mensurável de R3 ,
ou seja, podemos considerar a expressão designatória de T em (25) em E. Escrevemos então

 x = ρ cos θ sin φ

∂(x, y, z)

= ρ2 sin φ.

y = ρ sin θ sin φ, ρ ≥ 0, θ ∈ [0, 2π], φ ∈ [0, π],
Coord. Esféricas 
 z = ρ cos φ ∂(ρ, θ, φ)
(x2 + y 2 = ρ2 sin2 φ, x2 + y 2 + z 2 = ρ2 )

A figura que se segue ilustra os transformados, por T , dos conjuntos que resultam de fixar a
primeira (ρ = ρ0 ), a segunda (θ = θ0 ) e a terceira (φ = φ0 ) variáveis, respectivamente.

Exemplos.
1) A esfera que em coordenadas cartesianas é o conjunto
{(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ R2 }
é a imagem, por meio de T definida em (25), considerada em E, do paralelepı́pedo
[0, R] × [0, 2π] × [0, π],
que é o tipo de região por excelência para o cálculo de integrais triplos.
Estas coordenadas são particularmente úteis para o cálculo de integrais triplos em regiões limitadas
por (porções de) superfı́cies esféricas ou cones.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

82
1
Z
2) Calcular 2 + y2 + z2
dV , onde B ⊂ R3 é a bola unitária, centrada na origem.
B 4 + x
Vamos calcular o integral usando coordenadas esféricas. Seja D, tal que T (D) = B, onde T é a
função definida em (25), considerada em E. Como B = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 1}, vem
D = {(ρ, θ, φ) ∈ [0, +∞[×[0, 2π] × [0, π] : 0 ≤ ρ ≤ 1}.
Aplicando o Teorema 3.9 obtemos
ρ2
Z 2π Z π Z 1
1 1
Z Z
dV = ρ2 sin φ dρ dθ dφ = dθ dφ sin φ dρ.
B 4 + x2 + y 2 + z 2 D 4 + ρ2 0 0 0 4 + ρ2
Podemos usar a propriedade (19) para calcular o integral triplo anterior e vem

ρ2
Z 2π Z π Z 1 Z 1 Z 1
4 1
dθ sin φ dφ dρ = 2π [− cos φ]π0 1− dρ = 4π 1− ρ 2

0 0 0 4 + ρ2 0 4 + ρ2 0 1+ 2
1
ρ 1
  
= 4π ρ − 2 arctan = 4π 1 − 2 arctan .
2 0 2
p
3) Calcular o volume do sólido G limitado inferiormente pelo cone z = x2 + y 2 e superiormente pela
superfı́cie esférica x2 + y 2 + z 2 = z.
O sólido G em coordenadas cartesianas é dado por
q
G = {(x, y, z) ∈ R3 : x2 + y 2 ≤ z, x2 + y 2 + z 2 ≤ z}

Z
e o seu volume é o valor de 1 dV . Vamos escrever as condições que descrevem o conjunto em
G
coordenadas esféricas. Assim, se ρ 6= 0,
q
φ∈[0,π] π
x2 + y 2 ≤ z ⇔ ρ sin φ ≤ ρ cos φ ⇐⇒ cos φ ≥ 0 ∧ 0 ≤ tan φ ≤ 1 ⇔ 0 ≤ φ ≤
4
e
ρ≥0
x2 + y 2 + z 2 ≤ z ⇔ ρ(ρ − cos φ) ≤ 0 ⇐⇒ 0 ≤ ρ ≤ cos φ.
Temos então G = T (D), com T definida em (25),
π
D = {(ρ, θ, φ) ∈ R3 : 0 ≤ θ ≤ 2π, 0 ≤ φ ≤ , 0 ≤ ρ ≤ cos φ }.
4

ρ varia entre 0 e cos φ φ varia entre 0 e π/4 θ varia entre 0 e 2π


Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

83
O Teorema 3.9 garante que
π π
" #cos φ
ρ3
Z Z Z 2π Z Z cos φ Z
4 4
2 2
1dV = ρ sin φ dρ dθ dφ = dθ dφ ρ sin φ dρ = 2π sin φ dφ
G D 0 0 0 0 3 0
π iπ
2π 2π h π 4 π
Z  
4
= sin φ cos3 φ dφ = − cos4 φ 4 = 1− = .
3 0 3×4 0 6 16 8
Z
4) Calcular o integral x2 + y 2 dV, onde S é dado por
S

1
S = {(x, y, z) ∈ R3 : y ≥ 0, x2 + y 2 + z 2 ≤ 4, x2 + y 2 ≥ 1, z 2 ≤ (x2 + y 2 )}.
3

Vamos usar coordenadas esféricas para calcular o integral pedido. Começamos por traduzir as condições
que definem S para o novo sistema de coordenadas:

(Semi-espaço) y ≥ 0 ⇔ ρ sin θ sin φ ≥ 0 ⇔ sin θ ≥ 0 ⇔ 0 ≤ θ ≤ π;


(Esfera) x2 + y 2 + z 2 ≤ 4 ⇔ ρ2 ≤ 4 ⇔ 0 ≤ ρ ≤ 2;
1
(Cilindro) x2 + y 2 ≥ 1 ⇔ ρ2 sin2 φ ≥ 1 ⇔ ρ ≥ ;
sin φ
1 1 π 2π
(Cone) z 2 ≤ (x2 + y 2 ) ⇔ ρ2 cos2 φ ≤ ρ2 sin2 φ ⇔ ≤ φ ≤ ,
3 3 3 3
1 √ √ π π 2π
(ρ2 cos2 φ ≤ ρ2 sin2 φ ⇔ tan2 φ ≥ 3∨cos φ = 0 ⇔ (tan φ ≥ 3 ∨ tan φ ≤ − 3)∨φ = ⇔ ≤ φ ≤ ),
3 2 3 3
observando que as desigualdades obtidas têm em conta as restrições φ ∈ [0, π] e ρ ≥ 0. Assim, o
domı́nio de integração nas novas coordenadas é
π 2π 1
D = {(ρ, θ, φ) : 0 ≤ θ ≤ π, ≤φ≤ , ≤ ρ ≤ 2},
3 3 sin φ
pelo que, por aplicação do Teorema 3.9, obtemos
Z Z Z π Z 2π Z 2
3
2 2 2 2 2
x + y dV = (ρ sin φ) ρ sin φ dρ dθ dφ = dθ dφ ρ4 sin3 φ dρ
π 1
S D 0 3 sin φ

" #2 2π
ρ5 π 1
Z Z  
3 3
3 3
=π sin φ dφ = sin φ 32 − dφ
π
3
5 1 5 π
3
sin5 φ
sin φ
2π 2π
!
π 1 π 2π
Z Z
3 3
3 2
= 32 sin φ − dφ = 32 sin φ(1 − cos φ) dφ + [cotan φ] π
3
5 π
3
sin2 φ 5 π
3
3

" # 2π  2π
π 32 cos3 φ 3
π cos φ π 8 2
  
3
= −32 cos φ + + = 32 − − √ .
5 3 π 5 sin φ π 5 3 3
3 3

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

84
Anexo 1: Superfı́cies quádricas

x2 y 2 z 2
Elipsóide + 2 + 2 =1
a2 b c

x2 y 2 z 2
Hiperbolóide de uma folha + 2 − 2 =1
a2 b c

z 2 x2 y 2
Hiperbolóide de duas folhas − 2 − 2 =1
c2 a b

Parabolóide elı́ptico z = a2 x2 + b2 y 2

Parabolóide hiperbólico z = a2 x2 − b2 y 2

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

85
Cilindros

x2 y 2
Elı́ptico + 2 =1
a2 b

x2 y 2
Hiperbólico − 2 =1
a2 b

Parabólico y = kx2

x2 y 2 z 2
Cone + 2 − 2 =0
a2 b c

Que superfı́cies são estas?

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

86
Anexo 2: Software
São várias as ferramentas online que permitem o cálculo de integrais múltiplos. Aqui ficam duas
referências.
Wolfram Alpha

https://www.wolframalpha.com/examples/mathematics/calculus-and-analysis/integrals/

Symbolab

http://pt.symbolab.com/solver/double-integrals-calculator

Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso

87
Análise Mat. II e Cálculo Dif. e Int. II Ana Rute Domingos e Ana Cristina Barroso

88

Você também pode gostar