ResumoTeorico - AM - 2-CDI - 2 - Cap1,2,3 - 19-20

Análise Matemática II
e
Cálculo Diferencial e Integral II
Resumo teórico
2019/2020
Ana Rute Domingos e Ana Cristina Barroso
Cursos: Matemática
Matemática Aplicada
Engenharia Biomédica e Biofı́sica
Engenharia Fı́sica
Fı́sica
Conteúdo
Introdução
1. Funções vectoriais de uma variável
2. Cálculo Diferencial em Rn
3. Cálculo Integral em Rn
4. Análise Vectorial
1
Introdução
Este é o segundo curso de Análise/Cálculo para os cursos do DM e do DF da FCUL, onde traba-

lhamos com funções de várias variáveis.
Os pré-requisitos para esta disciplina são as funções reais de variável real (conteúdos da Análise
Matemática I/Cálculo Diferencial e Integral I), com particular destaque para o cálculo de derivadas e
de primitivas/integrais, e as noções básicas de Álgebra Linear.
No primeiro curso tudo se passa em R, um espaço vectorial de dimensão um. Agora vamos trabalhar
em Rn , com n > 1, onde há mudanças significativas. Por exemplo, não temos uma relação de ordem
total. Há duas diferenças essenciais quando se passa da Análise/Cálculo a uma variável para várias
variáveis, uma é o facto da topologia dos subconjuntos de Rn ser mais complexa quando n > 1 e a
outra é necessidade de se usar a álgebra linear para definir alguns conceitos e para demonstrar alguns
resultados. Por exemplo, em dimensão um, uma aplicação linear confunde-se com um número real,
daı́ que em R se considere que a derivada de uma função num ponto é um número real, enquanto que
a derivada de uma função com mais do que uma variável, como veremos, é uma aplicação linear.
Vamos ver extensões dos conceitos estudados em Análise Matemática I/Cálculo Diferencial e In-
tegral I, agora para as funções de várias variáveis, estudaremos propriedades associadas e veremos
algumas das importantes aplicações destes conteúdos.
Introdução Ana Rute Domingos e Ana Cristina Barroso
2
1 Funções vectoriais de uma variável
Motivação
Podemos descrever o movimento de uma partı́cula no espaço associando a cada instante de um certo
intervalo de tempo o ponto do espaço que a referida partı́cula ocupa no referido instante. Esta descrição
constitui uma função vectorial (a imagem de cada objecto é um vector) de variável real (o tempo). No
seu movimento a partı́cula traça um objecto geométrico que corresponde à ideia intuitiva de curva.
Neste capı́tulo estamos interessados neste tipo de funções que nos ajudam, como na situação
anterior, a descrever situações fı́sicas e a estudar alguns objectos geométricos - as curvas. Vamos
formular estes conceitos matemáticos e estudar algumas das suas propriedades.
1.1 Funções vectoriais de uma variável: limites, continuidade, derivadas e inte-

grais
Uma função vectorial de variável real é uma função definida num subconjunto de R e com imagem
em Rn , com n > 1. Seja D um subconjunto de R. Dada uma função vectorial de variável real
r : D ⊆ R → Rn , t 7→ r(t) = (r1 (t), r2 (t), . . . , rn (t)),
ficam definidas n funções reais de variável real ri : D ⊆ R → R, t 7→ ri (t), com i = 1, . . . , n, a que

chamamos funções componentes de r.
O domı́nio da função r é a intersecção dos domı́nios de cada uma das suas funções componentes e
é o maior conjunto onde a expressão que define r faz sentido, a não ser que se explicite uma restrição
deste.
√
Exemplo. Seja r(t) = (t3√ , log(2 − t), 4 t + 5). As funções componentes de r são r1 (t) = t3 ,
r2 (t) = log(2 − t) e r3 (t) = 4 t + 5, cujos domı́nios são, respectivamente, R, ] − ∞, 2[ e [−5, +∞[.
Assim, o domı́nio de r é [−5, 2[.
Neste parágrafo vamos estabelecer o conceito de limite para este tipo de funções, e com ele estender
as noções de continuidade, de derivada e de integral que já conhecemos para as funções reais de variável
real.
Definição 1.1 Sejam r : D ⊆ R → Rn uma função vectorial de variável real, t0 ∈ D0 e L um vector de
Rn . Dizemos que o limite de r, quando t converge para t0 , é L ∈ Rn , e escrevemos limt→t0 r(t) = L
se, e só se, lim kr(t) − Lk = 0, ou seja, se, e só se,
t→t0
∀δ > 0 ∃ ε > 0 : 0 < |t − t0 | < ε ⇒ kr(t) − Lk < δ.

n . Nesta disciplina consideramos, salvo menção
Observamos que k · k denota uma norma em Rq
contrária, a norma euclidiana, i.e., k(x1 , . . . , xn )k = x21 + . . . + x2n .
Assim, dizer que o limite, quando t → t0 , da função vectorial r(t) é o vector L é equivalente a afirmar
que o limite da função real kr(t) − Lk, quando t → t0 , é 0.
Proposição 1.2 Se lim r(t) = L, então lim kr(t)k = kLk.

t→t0 t→t0
Demonstração. Começamos por observar que se tem 0 ≤ | kr(t)k − kLk | ≤ kr(t) − Lk, para todo o
t ∈ D.
Por definição, dizer que limt→t0 r(t) = L é equivalente a dizer que limt→t0 kr(t)−Lk = 0. Atendendo
à observação efectuada e ao Teorema do enquadramento, obtemos
lim |kr(t)k − kLk| = 0,

t→t0
logo limt→t0 (kr(t)k − kLk) = 0, ou seja limt→t0 kr(t)k = kLk, o que termina a prova da proposição.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
3
O próximo resultado reveste-se de uma grande importância prática e diz-nos que os limites das
funções vectoriais se calculam componente a componente, reduzindo-se ao cálculo de n limites de
funções reais de variável real.
Teorema 1.3 Sejam r : D ⊆ R → Rn uma função vectorial de variável real, t0 ∈ D0 e
L = (L1 , . . . , Ln ) ∈ Rn . Então
lim r(t) = L ⇔ lim ri (t) = Li , ∀i = 1, . . . , n.
t→t0 t→t0
!
e2t − 1 t2 + 6 sin t t
Exemplo. Seja r(t) = , 2 , . Temos que
3t t − πt log(1 + 5t)
!
e2t − 1 t2 + 6 sin t t
lim r(t) = lim , lim 2 , lim
t→0 t→0 3t t→0 t − πt t→0 log(1 + 5t)
2t 2t + 6 cos t t 2 6 1

= lim , lim , lim = ,− , .
t→0 3t t→0 2t − π t→0 5t 3 π 5
No resultado anterior podemos considerar t0 = ±∞, se t0 ∈ D0 (em R), estendendo-se desta forma
o conceito de limite de uma função vectorial de variável real ao caso em que o ponto é o infinito. Deste
teorema conclui-se também que as propriedades algébricas dos limites de funções de R em R também
são válidas para funções de R em Rn , como se enuncia seguidamente.
Teorema 1.4 Sejam u, v : D ⊆ R → Rn funções vectoriais de variável real, f : D → R uma função
real de variável real e t0 ∈ D0 . Suponhamos que existem os limites lim u(t), lim v(t) em Rn , e
t→t0 t→t0
limt→t0 f (t) em R. Então tem-se:
i) lim (u(t) + v(t)) = lim u(t) + lim v(t);
t→t0 t→t0 t→t0
ii) lim (cu(t)) = c lim u(t), ∀c ∈ R;

t→t0 t→t0
iii) lim f (t)u(t) = lim f (t) lim u(t);

iv) lim u(t) · v(t) = lim u(t) · lim v(t), onde · representa um produto interno em Rn .
Definição 1.5 Seja r : D ⊆ R → Rn e t0 ∈ D. A função r diz-se contı́nua em t0 se, e só se,

∀δ > 0 ∃ ε > 0 : |t − t0 | < ε ⇒ kr(t) − r(t0 )k < δ.
Em particular, se t0 ∈ D ∩ D0 , r diz-se contı́nua em t0 se, e só se, limt→t0 r(t) = r(t0 ).
A definição anterior conjugada com o Teorema 2.11 permite trabalhar a continuidade componente
a componente.
Teorema 1.6 Seja r : D ⊆ R → Rn e t0 ∈ D ∩ D0 . Então r é contı́nua em t0 se, e só se, as suas
funções componentes ri forem contı́nuas em t0 , ∀i = 1, . . . , n.
A continuidade das funções que resultam de operações algébricas e da composição entre funções
contı́nuas é descrita no próximo resultado.
Teorema 1.7 Sejam u, v : D ⊆ R → Rn , f : D ⊆ R → R e g : E ⊆ R → R tal que g(E) ⊆ D. Então:
i) se u, v e f são contı́nuas em a ∈ D, o mesmo sucede a kuk, u + v, f u e u · v, onde · representa
um produto interno;
ii) se g é contı́nua em a ∈ E e u é contı́nua em g(a) ∈ D, então u ◦ g é contı́nua em a.
4
Definição 1.8 Dada uma função vectorial de variável real r : I = ]a, b[ → Rn a derivada de r no
ponto t ∈ I é dada por
dr r(t + h) − r(t)
(t) = r0 (t) = lim
dt h→0 h
se este limite existir. Neste caso dizemos que a função r é diferenciável em t.
Analogamente define-se a derivada lateral à direita em a, e representa-se por r+ 0 (a), e a derivada la-
teral à esquerda em b, e representa-se por r− (b), tomando no limite h → 0 e h → 0− , respectivamente.

0 +
É fácil ver que se r é diferenciável em t, então r é contı́nua em t (exercı́cio).

Atendendo ao Teorema 2.11 é válido o seguinte teorema:
Teorema 1.9 Seja r : ]a, b[ → Rn uma função vectorial de variável real, seja t0 ∈ ]a, b[ e suponhamos
que todas as funções componentes de r, ri : ]a, b[ → R, i = 1, . . . , n, são diferenciáveis em t0 . Então r
é diferenciável em t0 e tem-se
r0 (t0 ) = (r10 (t0 ), r20 (t0 ), . . . , rn0 (t0 )).
Este teorema diz-nos que r0 (t) é o vector cujas componentes são as derivadas das funções ri ,
i = 1, . . . , n. Consequentemente todas as fórmulas e métodos usados para calcular derivadas de funções
reais de variável real podem ser usados para calcular derivadas de funções vectoriais de variável real,
aplicados componente a componente, como se ilustra no exemplo que se segue.
Exemplo. Seja r(t) = (t2 + 2 arctan(3t), cos(sin(3t7 ))), com t ∈ R. Então

6

0
r (t) = 2t + , −21t6 sin(sin(3t7 )) cos(3t7 ) .
1 + 9t2
r(t0 + h) − r(t0 )
Demonstração do Teorema 1.9. Por definição temos r0 (t0 ) = lim . Vem então
h→0 h
1
r0 (t0 ) = lim (r1 (t0 + h) − r1 (t0 ), . . . , rn (t0 + h) − rn (t0 ))
h→0 h
r1 (t0 + h) − r1 (t0 ) rn (t0 + h) − rn (t0 )

= lim , . . . , lim = (r10 (t0 ), . . . , rn0 (t0 )).
h→0 h h→0 h
As propriedades algébricas da derivação das funções vectoriais de variável real estão reunidas no
próximo teorema.
Teorema 1.10 Sejam u, v : ]a, b[ → Rn , f : ]a, b[ → R e c ∈ R. Se u, v e f forem diferenciáveis em

]a, b[ tem-se, para cada t ∈ ]a, b[,
d
i) (u(t) + v(t)) = u0 (t) + v 0 (t);
dt
d
ii) (cu(t)) = cu0 (t);
dt
d
iii) (f (t)u(t)) = f 0 (t)u(t) + f (t)u0 (t);
dt
d
iv) (u(t) · v(t)) = u0 (t) · v(t) + u(t) · v 0 (t), onde · representa um produto interno em Rn ;
dt
d
v) (u(f (t))) = f 0 (t)u0 (f (t)) (derivação da função composta).
dt
5
Também para as funções em estudo neste capı́tulo podemos definir derivadas de ordem superior a
um. Veja-se a definição que se segue.
Definição 1.11 Seja r : [a, b] → Rn , com r(t) = (r1 (t), . . . , rn (t)), uma função vectorial de variável
real. Dizemos que r é de classe C k , com k ≥ 1, em [a, b], se todas as suas componentes são funções
reais de variável real de classe C k em [a, b].
Definição 1.12 Seja r : [a, b] ⊆ R → Rn , t 7→ (r1 (t), r2 (t), . . . , rn (t)) uma função vectorial de variável
real contı́nua. Para cada t ∈ [a, b] definimos
Z t Z t Z t Z t
r(s) ds = r1 (s) ds, r2 (s) ds, . . . , rn (s) ds .
a a a a
Dizemos que a relação

Z Z Z
t 7→ r1 (t) dt, r2 (t) dt, . . . , rn (t) dt , t ∈ [a, b]
Z
é a famı́lia das primitivas de r e denotamos por r(t) dt.
Z 0
Da definição anterior resulta imediatamente que r(t) dt = r(t). Além disso, se R é uma
primitiva de r, então R + C, com C ∈ Rn , também é uma primitiva de r.
Temos também que o integral duma função vectorial de variável real r é o vector cujas componentes
são os integrais das funções componentes de r. Assim, a linearidade do integral de funções vectori-
ais de variável real é uma das suas propriedades naturais e que está listada no próximo teorema,
conjuntamente com outras.
Teorema 1.13 Sejam u, v : [a, b] ⊆ R → Rn funções contı́nuas, α ∈ R e c ∈ Rn um vector constante.

Então tem-se:
Z b Z b Z b
i) u(t) + v(t) dt = u(t) dt + v(t) dt;
a a a
Z b Z b
ii) α u(t) dt = α u(t) dt;
a a
Z b Z b !
iii) c · u(t) dt = c · u(t) dt , onde · representa um produto interno em Rn ;
a a
Z Z
b b
iv) u(t) dt ≤ ku(t)k dt.

a a
Exemplo. Seja r(t) = (t cos t2 , e5t ). Temos então

Z √π Z √π Z √π √ π √ π !
1 1 5√ π
!
1 1

2 2 2 2 2
2 5t
r(t) dt = t cos t dt, e dt = sin t2 , e5t = , (e 2 − 1) .
0 0 0 2 0 5 0 2 5
6
Demonstração do Teorema 1.13. A prova das propriedades de i) a iii) é um exercı́cio simples.
Vejamos a prova de iv).
Z b
Seja U = u(t) dt ∈ Rn . Se U = 0Rn , o resultado é trivialmente verificado. Vejamos o caso em
a
que U não é o vector nulo. Atendendo à definição de norma e às propriedades dos integrais vem
Z b Z b Z Z
iii)
b b
2
kU k = U · U = U · u(t) dt = U · u(t) dt ≤ U · u(t) dt ≤ |U · u(t)| dt,

a a a a
usando agora a desigualdade de Cauchy-Schwarz no último integral obtemos

Z b Z b
2
kU k ≤ kU k ku(t)k dt = kU k ku(t)k dt,
a a
logo Z Z
Z b b b
kU k ≤ ku(t)k dt ⇐⇒ u(t) dt ≤ ku(t)k dt.

a a a
1.2 Curvas no plano e no espaço

Todos temos uma ideia intuitiva de curva, ideia essa que informalmente corresponde a um objecto
geométrico de dimensão um. Por exemplo, considerando Γ := {(x, y) ∈ R2 : x2 + y 2 = 1}, a
circunferência do plano, de centro na origem e raio 1, é usual dizer que Γ é uma curva. Podemos
descrevê-la através de um parâmetro, da forma seguinte:
Γ = {(cos t, sin t) : t ∈ [0, 2π[}.
Dizemos que descrição anterior é uma parametrização de Γ e temos então uma função vectorial de
variável real, t 7→ (cos t, sin t), a que chamamos linha parametrizada.
Seja n ∈ N2 . No que se segue vamos considerar funções vectoriais de variável real γ : I ⊆ R → Rn
definidas e contı́nuas num intervalo real I, que consideramos sempre não degenerado (com mais do
que um ponto).
Definição 1.14 Chamamos linha parametrizada ou trajectória parametrizada a qualquer fun-

ção vectorial contı́nua γ : I ⊆ R → Rn . À imagem de I por meio de γ, γ(I), chamamos curva ou
traço da linha γ (também se usam as designações traçado e órbita).
A uma linha parametrizada definida num intervalo compacto I = [a, b] damos o nome de caminho.
Neste caso γ(a) e γ(b) dizem-se as extremidades do caminho, sendo γ(a) o ponto inicial e γ(b) o
ponto final do caminho. Se γ(a) = γ(b), o caminho diz-se fechado.
Chamamos arco ou porção da curva γ(I) de extremos γ(α) e γ(β), com α, β ∈ I e α < β, à
curva γ([α, β]).
Por uma questão de simplificação de linguagem é frequente usarmos apenas os vocábulos linha ou
trajectória, omitido-se a designação parametrizada. Observamos que as designações para os conceitos
anteriores (linha, trajectória, curva, caminho) podem variar de autor para autor.
7
Exemplos. 1) γ : R → R3 , γ(t) = (t5 , 8t, et ) é uma linha parametrizada e γ(R) uma curva.
2) γ : [0, 5] → R2 , γ(t) = (cos t, log(t2 + 1)) é um caminho; γ(0) = (1, 0) é o ponto inicial e
γ(5) = (cos 5, log 26) o ponto final.
Definição 1.15 Uma curva C, traço de uma linha γ, diz-se uma curva simples se não se intersec-
tar. No caso de C ser o traço de um caminho, a curva diz-se simples se não se intersectar excepto
possivelmente nos seus extremos.
Curva fechada e não simples Curva fechada e simples Curva simples Curva não simples
Estamos particularmente interessados nos casos em que n = 2 e n = 3 correspondentes às chamadas

curvas no plano e curvas no espaço, respectivamente. Observe-se, no entanto, que chamamos curva
plana a uma curva que seja traço de uma linha parametrizada γ : I → R3 que esteja contida num
plano de R3 .
Exemplo. γ : [0, 2π] → R3 , γ(t) = (−1, 5 cos t, 5 sin t). γ([0, 2π]) está contida no plano x = −1, logo
é uma curva plana.
Como já referimos, as funções vectoriais surgem em inúmeras aplicações, nomeadamente para
descrever o movimento de partı́culas no plano e no espaço. Assim, é frequente usar para a variável
independente a letra t que representa o tempo, interpretando-se γ(t) como o vector posição da partı́cula
no instante t.
Associado a uma linha parametrizada γ : I ⊆ R → Rn , t 7→ γ(t), com γ(t) = (γ1 (t), . . . , γn (t)),
temos um sistema de n equações que descreve a linha (e consequentemente a curva γ(I))


 x1 = γ1 (t)

 x2 = γ2 (t)

..


 .

 xn = γn (t), t∈I
a que chamamos equações paramétricas da curva. À variável independente t chamamos o parâme-
tro. Uma curva pode ser descrita por diferentes sistemas de equações paramétricas. Ao definirmos
uma linha parametrizada estamos a considerar uma parametrização do seu traço, daı́ a designação
de linha/trajectória parametrizada.
Dada uma curva C interessa-nos determinar uma linha parametrizada cujo traço seja C. Por
exemplo, considerando C a parábola y = 3x2 + 1 (C = {(x, y) : y = 3x2 + 1}), temos que
γ(x) = (x, 3x2 + 1), x ∈ R é uma parametrização de C, ou dito de outra forma, γ é uma linha
parametrizada cujo traço é C. Vejamos outros exemplos.
Exemplos de linhas parametrizadas e identificação da curva
1) Recta
Uma parametrização da recta, em Rn , n ∈ N2 , que passa no ponto P e tem a direcção do vector ~u é
γ : R → Rn , γ(t) = P + t~u.
2) Segmento de recta
Uma parametrização do segmento de recta, em Rn , n ∈ N2 , com origem no ponto A e final no ponto
B é
γ : [0, 1] → Rn , γ(t) = A + t(B − A).
8
3) Gráfico de uma função r.v.r. contı́nua
Seja f : [a, b] → R uma função contı́nua. Uma parametrização do gráfico de f é
γ : [a, b] → R2 ,
γ(t) = (t, f (t)).
√
4) Considere-se o caminho γ : [−2, 2] → R2 , dado por γ(t) = (t, 4 − t2 ). As equações paramétricas
associadas são: (
x=√ t
y = 4 − t2 , t ∈ [−2, 2].
√
De y = 4 − x2 , vem y 2 + x2 = 4, com x ∈ [−2, 2] e y ≥ 0, ou seja, o traço deste caminho é a
semi-circunferência de centro na origem, raio 2, com inı́cio no ponto (−2, 0) e final no ponto (2, 0),
percorrida no sentido dos ponteiros do relógio.
5) Uma parametrização da circunferência em R2 , com centro em (a, b), raio R, descrita no
sentido directo (sentido contrário ao dos ponteiros do relógio), uma única vez é
γ : [0, 2π] → R2 , γ(θ) = (a + R cos θ, b + R sin θ).
6) O traço do caminho
γ : [0, 2π] → R3 , γ(θ) = (1 + 7 cos θ, 5, −7 sin θ).
é a circunferência do plano y = 5, centrada no ponto (1, 5, 0) e de raio 7.
7) O traço da linha γ(t) = (3 cos t, 3 sin t, t), t ∈ [0, +∞[ é uma hélice circular, que não é uma curva
plana (encontra-se sobre um cilindro).
É importante perceber que os conceitos de linha parametrizada (função vectorial) e de traço da
linha (curva) são distintos. A linha parametrizada contém informação que o seu traço não tem. Por
exemplo, sejam γ1 (t) = (cos t, sin t) e γ2 (t) = (cos(10t), sin(10t)), com t ∈ [0, 2π]. O traço de ambas
as linhas γ1 e γ2 é a circunferência de centro na origem e raio 1. No entanto, enquanto que a linha γ1
apenas traça a circunferência uma só vez, a linha γ2 passa 10 vezes em cada ponto da circunferência, e
como o faz no mesmo intervalo, significa que o seu “movimento” é dez vezes mais rápido. Este exemplo
ilustra o facto da linha parametrizada conter informação sobre a forma como a curva é traçada.
Definição 1.16 Chama-se mudança de parâmetro a uma aplicação bijectiva α : J → I, de classe
C 1 , com inversa também C 1 , onde J e I são intervalos de R.
Dadas γ : I → Rn uma linha parametrizada e α : J → I uma mudança de parâmetro, à linha
parametrizada γ ◦ α chama-se uma reparametrização de γ (por meio de α). Também se diz uma
reparametrização da curva γ(I).
Observação. Dada γ : [a, b] → Rn uma linha parametrizada, é sempre possı́vel definir uma parametri-
zação γ̃ com o mesmo traço de γ, definida num intervalo dado [c, d], considerando
t−c
γ̃(t) = γ a + d−c (b − a) . Assim, γ̃ é uma reparametrização de γ.
Proposição 1.17 Sejam I e J intervalos de R. Uma aplicação bijectiva α : J → I, de classe C 1 é

uma mudança de parâmetro se, e só se, α0 nunca se anula.
Exemplo. Sejam J = [1, 2], I = [0, log 2] e α : J → I, dada por α(t) = log t. Como α é bijectiva, de
classe C 1 e α0 (t) = 1t > 0, para todo o t ∈ J, então α é uma mudança de parâmetro.
As mudanças de parâmetro de uma mesma linha agrupam-se em dois conjuntos, aquelas cuja
derivada é positiva e aquelas em que a derivada é negativa. Dizemos que a mudança de parâmetro,
no primeiro caso preserva a orientação da linha, e no segundo caso que inverte a orientação da
linha.
Ao conjunto de todas as reparametrizações de uma linha obtidas por uma mudança de parâmetro que
preserva a orientação da linha inicial chama-se uma linha ou trajectória orientada.
9
Definição 1.18 (Caminho inverso) Seja γ : [a, b] → Rn um caminho. Define-se o caminho in-
verso ou oposto, e representa-se por (−γ) o caminho definido por (−γ)(t) = γ(a + b − t), com
t ∈ [a, b].
O ponto inicial de (−γ) é o ponto final de γ e vice-versa. Geometricamente não há distinção entre o
traço dos dois caminhos. Intuitivamente, (−γ) interpreta-se como sendo o caminho γ percorrido no
sentido inverso.
Exemplo. Seja γ1 : [0, π] → R2 , γ1 (t) = (1 + 2 cos t, −1 + 2 sin t). Atendendo à definição, o caminho
inverso da linha anterior é o caminho dado por (−γ1 ) : [0, π] → R2 ,
(−γ1 )(t) = γ1 (0 + π − t) = (1 + 2 cos(π − t), −1 + 2 sin(π − t)) = (1 − 2 cos t, −1 + 2 sin t).
O traço de uma linha parametrizada pode ser um objecto geométrico que nada tem a ver com
a ideia intuitiva que temos de curva. Peano, em 1890, construiu uma linha parametrizada, definida
no intervalo [0, 1] e cujo traço é todo o quadrado [0, 1] × [0, 1]! Há muitos outros exemplos de linhas
parametrizadas cujo traço não coincide com a noção intuitiva de curva. Quando se impõe mais
regularidade a uma linha parametrizada pedindo, por exemplo, que seja pelo menos de classe C 2 (é
natural supor que a “operação” de traçar uma curva num papel possa ser modelada por uma função
vectorial contı́nua que represente a força que a mão exerce sobre a caneta e é razoável supor que o
movimento da ponta da caneta obedeça à 2.a lei de Newton (F = m · a), descrevendo, portanto, uma
trajectória cuja segunda derivada (aceleração) é proporcional à força) e que a primeira derivada não
se anule, então pode provar-se que o seu traço corresponde localmente à ideia intuitiva que temos de
curva. A discussão formal e rigorosa destas ideias sai fora do âmbito do nosso curso.
Em geral, vamos trabalhar com linhas que tenham alguma regularidade e cujo traço se insere na
noção intuitiva que temos de curva.
Definição 1.19 Uma linha parametrizada γ : [a, b] → Rn diz-se seccionalmente de classe C 1
(abreviadamente secc. C 1 ) ou de classe C 1 por troços se γ é contı́nua em [a, b] e existe um número
finito de pontos a = t0 < t1 < t2 < . . . < tp < tp+1 = b tais que γ|[ti ,ti+1 ] é de classe C 1 , para
i = 0, . . . , p.
Observação. É importante não confundir a regularidade de uma linha parametrizada com a regula-
ridade do seu traço. A primeira diz respeito à regularidade de uma função (a linha parametrizada) e
a segunda ao objecto geométrico que é a imagem da função. Observe-se que o traço de uma linha não
é o seu gráfico. Se γ é uma linha parametrizada com valores em Rn , o seu gráfico é um conjunto de
Rn+1 , enquanto que o seu traço é um objecto de Rn . O exercı́cio 18 da Ficha 1 põe em evidência a
distinção entre a regularidade dos dois objectos matemáticos – a linha e a curva, através do exemplo
que trabalha.
Vector tangente, recta tangente

r(t + h) − r(t)
Seja r : I ⊆ R → Rn uma linha parametrizada. O vector é paralelo à corda que liga
h
os pontos r(t + h) e r(t).
10
À medida que h converge para zero a corda associada ao vector anterior torna-se paralela à recta que
corresponde à noção intuitiva que temos de recta tangente a uma curva, neste caso à curva r(I) no
ponto r(t). Assim, a recta tangente à curva terá a direcção do vector
r(t + h) − r(t)
lim = r0 (t). (1)
h→0 h
Esta interpretação geométrica está na base das próximas definições.
Definição 1.20 Seja r : I ⊆ R → Rn uma linha parametrizada. Se r é diferenciável em t0 ∈ I e
r0 (t0 ) 6= 0, a r0 (t0 ) chamamos vector tangente à curva r(I) no ponto r(t0 ).
A recta tangente à curva definida pela linha parametrizada r, diferenciável em t0 , com r0 (t0 ) 6= 0,
no ponto P = r(t0 ), é a recta que passa pelo ponto P e tem a direcção do vector r0 (t0 ).
Exemplos. 1) Determinar uma equação da recta tangente à curva descrita por r(t) = (t, t2 , t3 ) no
ponto (2, 4, 8) implica, neste caso, determinar em primeiro lugar qual é o instante no qual a linha
assume o valor (2, 4, 8) (a curva em causa é simples, pelo que neste caso há um único instante nestas
condições) e o cálculo da derivada de r nesse instante. É fácil ver temos r(2) = (2, 4, 8). Como
r0 (2) = (1, 4, 12), uma equação da recta referida é
(x, y, z) = (2, 4, 8) + λ(1, 4, 12), λ ∈ R.
2) Considere-se a curva C descrita
√ pela parametrização
√ r(t) = (t2 , t3 − 3t), com t ∈ R. Esta curva não
é simples, observe-se que r( 3) = (3, 0) = r(− 3). Neste exemplo há duas rectas tangentes a C no
ponto (3, 0), que diferenciamos referindo
√ qual
√ é o instante
√ em que√a linha passa naquele ponto. Como
0 2
r (t) = (2t, 3t − 3), temos √ 0 0
r (− 3) = (−2 3, 6) e r ( 3) = (2 3, 6), donde uma equação da recta
tangente a C no ponto r(− 3) = (3, 0) é
√
(x, y) = (3, 0) + λ(−2 3, 6), λ ∈ R
√
e uma equação da recta tangente a C no ponto r( 3) = (3, 0) é
√
(x, y) = (3, 0) + λ(2 3, 6), λ ∈ R.
Observamos que há casos de curvas que não são simples e em que há apenas uma recta tangente em
pontos por onde a linha passa mais do que uma vez. Fica como exercı́cio encontrar um exemplo.
Considerando agora a interpretação cinemática das linhas parametrizadas, tomando r(t) o vector
posição do ponto P e h > 0 no limite (1), observe-se que o vector r(t + h) − r(t) tem o mesmo sentido
do movimento; tomando h < 0, o vector r(t + h) − r(t) tem sentido contrário ao do movimento, mas
dividido por h, passa a ter o sentido do movimento.
Então, em qualquer dos casos, r0 (t) aponta na direcção e sentido em que t aumenta.
Se γ é uma linha parametrizada definida num intervalo I, tal que existe γ 0 (t) e γ 00 (t), num certo
t ∈ I, é usual usar a seguinte terminologia que vem da Mecânica: a γ 0 (t) chama-se vector velocidade
ou simplesmente velocidade em t, a kγ 0 (t)k chama-se velocidade escalar em t, a γ 00 (t) chama-se
vector aceleração ou simplesmente aceleração em t. Usam-se as notações
v(t) := γ 0 (t), a(t) := v 0 (t) = γ 00 (t).
11
Os próximos exercı́cios exemplificam situações relativas à terminologia referida.
Exercı́cio 1.21 Sejam c > 0 e ω ∈ ]0, π2 [. Um projéctil é lançado da posição (0, 0) e tem um traçado
parabólico descrito por
γ(t) = ((cos ω)t, (sin ω)t − ct2 ), t ≥ 0.
1. Verifique que o traço da linha é uma porção de parábola e que ω é o ângulo de lançamento do
projéctil com o solo.
(O ângulo de lançamento é o arco-tangente do declive da recta tangente à curva no ponto em
questão.)
2. Qual o ângulo de lançamento que maximiza o alcance do projéctil?
1 π
3. Para c = 2 eω= 4 determine uma equação da recta tangente à curva no instante t = 1.
Exercı́cio 1.22 Um ponto move-se no plano de tal modo que a sua velocidade (vectorial) é dada em
log(t − 1)

função do tempo por v(t) = 3e3(t−2) , , com t ∈ [2, +∞[. Sabendo que a sua posição no
t−1
instante t = 2 é (0, 2), determine a trajectória r(t) da partı́cula.
Definição 1.23 Dizemos que uma linha parametrizada γ : I → Rn diferenciável em I é regular se

kγ 0 (t)k =
6 0 para todo t ∈ I.
Seja γ : I → R3 uma linha parametrizada regular. Podemos considerar o vector

γ 0 (t)
T (t) = Tγ (t) =
kγ 0 (t)k
que é um vector unitário tangente à curva no ponto γ(t) e que se designa por vector unitário
tangente.
Comprimento de arco
Consideremos agora uma linha parametrizada definida num intervalo I. Vejamos como calcular o
comprimento da porção C = γ([a, b]), da curva γ(I), com [a, b] ⊂ I.
Para esse efeito consideramos uma partição do intervalo [a, b], isto é, consideramos pontos ti tais
que
a = t0 < t1 < t2 < . . . < tn−1 < tn = b.
Para cada ponto ti da partição calculamos γ(ti ) e determinamos Pi , o ponto correspondente na curva.
12
Seguidamente consideramos os segmentos de recta que unem os pontos Pi−1 a Pi , i = 1, . . . , n.
Adicionando os comprimentos de todos estes segmentos obtemos o comprimento de uma linha poligonal
dado por
n
X
kγ(ti ) − γ(ti−1 )k.
i=1
Define-se o comprimento da curva C, e representa-se por L(C), como sendo o supremo dos com-
primentos de todas as linhas poligonais assim obtidas. É intuitivo perceber que quanto mais pontos
tiver a linha poligonal melhor o seu comprimento aproxima o comprimento da curva, pelo que a
definição anterior é natural, embora não nos dê uma forma expedita de calcular comprimentos de
Z b
curvas. Prova-se que a soma anterior se relaciona com o valor kγ 0 (t)k dt, como veremos adiante.
a
A próxima proposição diz-nos que o integral da norma da derivada de uma linha é invariante por
reparametrização.
Proposição 1.24 Seja γ1 uma linha de classe C 1 em [a, b] e γ2 : [c, d] → Rn uma reparametrização
de γ1 . Então
Z b Z d
kγ10 (t)k dt = kγ20 (t)k dt.
a c
Demonstração. Como γ2 é uma reparametrização de γ1 , existe uma mudança de parâmetro

α : [c, d] → [a, b] tal que γ2 = γ1 ◦ α. Assim, considerando a mudança de variável t = α(u), no
primeiro integral, e supondo que α0 > 0, obtemos
Z b Z α(d) Z d
kγ10 (t)k dt = kγ10 (t)k dt = kγ10 (α(u))kα0 (u) du.
a α(c) c
γ20 (u)
Como γ20 (u) = γ10 (α(u))α0 (u), então γ10 (α(u)) = . Dos cálculos anteriores resulta que
α0 (u)
Z d 0
kγ20 (u)k 0
Z b Z d Z d
γ2 (u) 0
kγ10 (t)k dt = α (u) du =
α0 (u) α (u) du = kγ20 (t)k dt.
a c c α0 (u) c
O caso em que α0 < 0 é análogo.
Quando a linha é de classe C 1 o resultado anterior permite-nos ter uma forma “simples” (tão
simples quão simples for primitivar kγ 0 (t)k) de calcular o comprimento da curva respectiva, como está
enunciado no próximo teorema.
Teorema 1.25 Seja γ uma linha de classe C 1 em [a, b]. O comprimento da curva C = γ([a, b]) é
dado por
Z b
L(C) = kγ 0 (t)k dt.
a
Nos casos particulares n = 2 com γ(t) = (x(t), y(t)) e n = 3 com γ(t) = (x(t), y(t), z(t)), o
comprimento da linha é dado, respectivamente, por
Z bq Z bq
[x0 (t)]2 + [y 0 (t)]2 dt e [x0 (t)]2 + [y 0 (t)]2 + [z 0 (t)]2 dt.
a a
Em R2 , a fórmula para o cálculo do comprimento do gráfico C de uma função f : [a, b] → R de classe

C 1 é Z q b
L(C) = 1 + [f 0 (x)]2 dx.
a
13
2
√
Exemplo. Vamos calcular o comprimento do gráfico da função f (x) = x3 , com x ∈ [0, 3]. Como
√ 3
f 0 (x) = x, vem
Z 3q Z 3q
√ Z 3√
2
3
14
L= 1 + [f 0 (x)]2 dx = 1 + ( x)2 dx = 1 + x dx = (1 + x)3/2 = .
0 0 0 3 0 3
Definição 1.26 Seja γ uma linha parametrizada e de classe C 1 num intervalo I. Dado a ∈ I, define-
se a função comprimento de arco da forma seguinte
Z t
s(t) = kγ 0 (u)k du, a ≤ t, t ∈ I.
a
Esta função dá-nos o comprimento do arco de γ entre os pontos γ(a) e γ(t).
Sejam γ : [a, b] → Rn uma linha parametrizada, de classe C 1 , regular, e C = γ([a, b]). De acordo
com o teorema fundamental do cálculo tem-se
s0 (t) = kγ 0 (t)k.
Como γ é regular, então s é invertı́vel (s0 > 0). À parametrização
r : [0, L(C)] → Rn , r(t) = γ ◦ s−1 (t)
chamamos parametrização de C (ou de γ) pelo comprimento de arco.
Proposição 1.27 Nas condições anteriores tem-se kr0 (t)k = 1, para todo o t ∈ I.
Proposição 1.28 Se γ : [0, b] → Rn é uma parametrização, de classe C 1 , de uma curva C com

kγ 0 (t)k = 1, para todo o t ∈ [0, b], então γ é a parametrização de C pelo comprimento de arco e
b = L(C).
Proposição 1.29 Seja γ uma linha parametrizada de classe C 1 e regular num intervalo I. Se kγ(t)k
é constante em I, então
γ(t) · γ 0 (t) = 0, ∀t ∈ I.
Proposição 1.30 Seja γ : I → Rn uma linha, de classe C 2 , parametrizada pelo comprimento de arco.
Então γ 0 (t) · γ 00 (t) = 0, para todo t ∈ I. Assim, γ 00 (t) é ortogonal a γ 0 (t).
Os resultados anteriores ilustram as propriedades geométricas que a parametrização pelo compri-

mento de arco tem.
Analogamente define-se a função comprimento de arco para uma linha seccionalmente C 1 , sendo
os resultados anteriores válidos também para estas curvas, com as adaptações óbvias. Também a
Proposição 1.24 e o Teorema 1.25 são válidos para linhas secc. C 1 .
Podemos ainda determinar o comprimento √do traço de linhas parametrizadas definidas em inter-
1
valos ilimitados. Por exemplo, seja r(t) = t, 2 log t, , com t ∈ [1, +∞[ e C = r([1, +∞[). Temos
t
que
1 +∞
Z +∞ Z +∞ r
2 1

0
L(C) = kr (t)k dt = 1 + 2 + 4 dt = t − = +∞.
1 1 t t t 1
Genericamente, se a linha parametrizada r, secc. C 1 , está definida num intervalo I =]a, b[, com
−∞ ≤ a < b ≤ +∞, então tem-se
Z b
L(r(I)) = kr0 (t)k dt.
a
Existirão linhas parametrizadas definidas em intervalos ilimitados cujo traço tem comprimento
finito? (cf. Exercı́cio 29 da Ficha 1.)
14
2 Cálculo Diferencial em Rn
2.1 Domı́nios, limites e continuidade de funções vectoriais de n variáveis
Sejam m, n ∈ N. Neste capı́tulo trabalharemos com funções
f : D ⊆ Rn → Rm
que a cada x = (x1 , x2 , . . . , xn ) ∈ Rn fazem corresponder o elemento de Rm dado por
(f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fm (x1 , x2 , . . . , xn )),
que se designa por imagem de x por meio de f .

Quando m = 1 estas funções designam-se por funções ou campos escalares (ou reais), se m ≥ 2
dizem-se funções ou campos vectoriais. Analogamente ao caso n = 1, estudado no Capı́tulo 1, às
funções reais
fi : D ⊆ Rn → R (2)
(x1 , x2 , . . . , xn ) 7→ fi (x1 , x2 , . . . , xn ),
para i = 1, . . . , m, chamamos funções componentes de f .

O nosso objectivo é estender as noções do cálculo diferencial em R a este tipo de funções que,
quando n > 1, dependem de mais de uma variável e, se m > 1, têm mais de uma função componente.
O conjunto D é o domı́nio da função f e é o maior conjunto onde a expressão que define f faz
sentido, a não ser que se explicite uma restrição deste. Assim, D é a intersecção dos maiores conjuntos
onde podem estar definidas cada uma das suas funções componentes. O contradomı́nio de f é o
conjunto de todas as imagens f (x) para x ∈ D e representa-se por f (D), ou seja,
n o
f (D) = f (x1 , x2 , . . . , xn ) : (x1 , x2 , . . . , xn ) ∈ D .
Dado um subconjunto A ⊆ D, chama-se imagem de A por meio de f ao conjunto

n o
f (A) = f (x1 , x2 , . . . , xn ) : (x1 , x2 , . . . , xn ) ∈ A .
Exemplo. Considerando a função f : R2 → R2 definida por f (x, y) = (ey cos x, ey sin x), é fácil
verificar que a imagem, por meio de f , da recta de equação y = 1 é a circunferência de centro (0, 0) e
raio e.
Definição 2.1 Se f é uma função real de duas variáveis com domı́nio D, o gráfico de f é o conjunto
n o
S = (x, y, z) ∈ R3 : z = f (x, y), (x, y) ∈ D .
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
15
Exemplos. Se f (x, y) = 6 − 3x − 2y, (x, y) ∈ R2 , o gráfico de f é o plano que passa nos pontos
(0, 0, 6), (0, 3, 0) e (2, 0, 0). Para a função definida em R2 por g(x, y) = x2 + y 2 o gráfico é o parabolóide
n o
S = (x, y, z) ∈ R3 : z = x2 + y 2 .
q
Finalmente, para a função h : D ⊂ R2 → R dada por h(x, y) = 9 − (x2 + y 2 ), onde
D = (x, y) ∈ R2 : x2 + y 2 ≤ 9 , o gráfico é o hemisfério

n o
S = (x, y, z) ∈ R3 : x2 + y 2 + z 2 = 9, z ≥ 0 .
Na figura abaixo encontram-se representados, da esquerda para a direita, os gráficos das funções f , g
e h, respectivamente.
Para a maior parte das funções reais de duas variáveis é muito complicado esboçar o respectivo
gráfico, nesses casos um processo que pode ajudar a visualizar a superfı́cie z = f (x, y) é considerar as
suas chamadas curvas de nı́vel.
Definição 2.2 Dados uma função f : D ⊆ Rn → R e um número real k, chamamos conjunto de
nı́vel k ao conjunto, eventualmente vazio,
Ck = {x ∈ D : f (x) = k} .
No caso n = 2, aos conjuntos de nı́vel é usual dar-se o nome de curvas de nı́vel. Com efeito,
se k ∈ f (D) e (a, b) ∈ D é tal que f (a, b) = k, se f não é constante numa vizinhança de (a, b), e
admitindo mais umas condições de regularidade, prova-se que o conjunto de nı́vel k é o gráfico de uma
função real de variável real, ou é uma união de gráficos de funções reais de variável real, pelo que é
uma curva (imagem de uma linha parametrizada), ou uma união de curvas.
Neste caso, a curva de nı́vel de equação f (x, y) = k obtém-se fazendo a projecção no plano Oxy
do corte do gráfico de f pelo plano horizontal z = k. Assim, se desenharmos algumas curvas de nı́vel
duma função e imaginarmos que as levantamos até à altura indicada, ficamos com uma ideia do gráfico
da função. Supondo que a diferença entre os valores de k de dois cortes consecutivos é constante, a
superfı́cie será inclinada onde as curvas de nı́vel estão mais próximas e será mais plana onde estas
estão mais afastadas.
16
Exemplos. Para f (x, y) = 4 − x − y, (x, y) ∈ R2 , as curvas de nı́vel c ∈ R são rectas de equação
4 − x − y = c, já para a função definida em R2 por g(x, y) = xy, as curvas de nı́vel c 6= 0 são hipérboles,
sendo a curva de nı́vel c = 0 uma união de duas rectas.
2 −y 2
A figura que se segue mostra parte do gráfico da função f (x, y) = −xye−x , bem como algumas
curvas de nı́vel.
Para além das curvas de nı́vel, veremos na próxima secção que outras curvas relevantes para o
estudo da função f são as que se obtêm intersectando o gráfico de f com planos da forma x = k ou
y = k, com k ∈ R.
Veremos agora algumas noções topológicas em Rn que nos serão úteis para o que se segue,
permitindo-nos enunciar muitos resultados e definições, em particular, o conceito de limite de funções
cujo domı́nio é um subconjunto de Rn .
Dados n ∈ N e dois pontos P = (x1 , x2 , . . . , xn ) e Q = (y1 , y2 , . . . , yn ), recordemos que a distância
euclidiana, em Rn , entre P e Q é dada por
q
d(P, Q) = k(y1 − x1 , y2 − x2 , . . . , yn − xn )k = (y1 − x1 )2 + (y2 − x2 )2 + . . . + (yn − xn )2 .
Definição 2.3 Dado um ponto a ∈ Rn e um número real δ > 0, chama-se bola aberta de centro em
a e raio δ ao conjunto
n o n o
Bδ (a) = x ∈ Rn : kx − ak < δ = x ∈ Rn : d(x, a) < δ ;
chama-se bola fechada de centro em a e raio δ ao conjunto
n o n o
B δ (a) = x ∈ Rn : kx − ak ≤ δ = x ∈ Rn : d(x, a) ≤ δ .
Uma vizinhança do ponto a ∈ Rn é qualquer conjunto que contenha uma bola aberta de centro em a.
Um conjunto Ω ⊆ Rn diz-se limitado se existir uma bola que o contenha.
Assim, se n = 1 a bola aberta de centro em a e raio δ é o intervalo aberto ]a − δ, a + δ[, se n = 2
a bola aberta de centro em a e raio δ é o cı́rculo (ou disco) aberto de centro em a = (a1 , a2 ) e raio δ
dado por n o
Bδ (a) = (x, y) ∈ R2 : (x − a1 )2 + (y − a2 )2 < δ 2 ,
se n = 3 obtemos a esfera aberta de centro em a = (a1 , a2 , a3 ) e raio δ dada por
n o
Bδ (a) = (x, y, z) ∈ R3 : (x − a1 )2 + (y − a2 )2 + (z − a3 )2 < δ 2 .
17
disco aberto e esfera aberta de centro x0 e raio δ
Definição 2.4 Dado um conjunto Ω ⊆ Rn , um ponto x0 ∈ Rn diz-se interior a Ω se existe um

número real δ > 0 tal que Bδ (x0 ) ⊂ Ω, ou seja, se existe uma vizinhança de x0 contida em Ω. Um
ponto x0 ∈ Rn diz-se um ponto fronteiro a Ω se qualquer vizinhança de x0 contém pontos de Ω e do
seu complementar. Um ponto x0 ∈ Rn diz-se exterior a Ω se existe um número real δ > 0 tal que
Bδ (x0 ) ∩ Ω = ∅, ou seja, se existe uma vizinhança de x0 contida no complementar de Ω.
Ao conjunto dos pontos interiores (respectivamente, exteriores) a Ω chamamos interior (respecti-
vamente, exterior) de Ω e escrevemos int Ω (respectivamente, ext Ω). A fronteira de Ω, denotada
por fr Ω ou ∂Ω, é o conjunto dos pontos fronteiros a Ω. Chamamos fecho ou aderência de Ω ao
conjunto Ω = int Ω ∪ ∂Ω, os elementos deste conjunto dizem-se pontos aderentes a Ω.
x0 é ponto interior a Ω x0 é ponto fronteiro a Ω
É claro que int Ω ∪ ext Ω ∪ fr Ω = Rn e estes conjuntos são disjuntos dois a dois.
Um conjunto diz-se aberto se todos os seus pontos forem pontos interiores, um conjunto diz-se
fechado se contiver todos os seus pontos fronteiros. Por exemplo, as bolas abertas são conjuntos
abertos e as bolas fechadas são conjuntos fechados. Note-se que muitos conjuntos não são abertos nem
fechados. Um subconjunto de Rn é compacto se for limitado e fechado.
Na figura acima, o conjunto mais à esquerda definido por

n o
Ω1 = (x, y) ∈ R2 : 1 < x < 2, 1 < y < 2
é aberto, o do meio dado por

n o
Ω2 = (x, y) ∈ R2 : 3 ≤ x ≤ 4, 1 ≤ y ≤ 2
é fechado (e compacto) e o conjunto mais à direita

n o
Ω3 = (x, y) ∈ R2 : 5 ≤ x ≤ 6, 1 < y < 2
não é aberto nem fechado.

18
Definição 2.5 Seja Ω ⊆ Rn . Um ponto x0 ∈ Rn , diz-se um ponto de acumulação de Ω se, e só se,
qualquer vizinhança de x0 contiver infinitos pontos de Ω. O conjunto dos pontos de acumulação de Ω
representa-se por Ω0 e diz-se o derivado de Ω. Os pontos de Ω que não são pontos de acumulação
dizem-se pontos isolados; assim, se x0 ∈ Ω é um ponto isolado de Ω, então existe δ > 0 tal que
Bδ (x0 ) ∩ Ω = {x0 }.
Definição 2.6 Uma sucessão em Rm é uma função cujo domı́nio é N, u : N → Rm , e que denotamos
por (un )n∈N ou simplesmente por (un ). Denotamos por un = u(n) a imagem do valor n, a que
chamamos o termo de ordem n ou enésimo termo da sucessão, note-se que cada termo da sucessão
é um vector de Rm : un = (u1n , u2n , . . . , um i
n ). Às sucessões (un )n∈N , i = 1, . . . , m, chamamos sucessões
componentes de (un ).
5

Por exemplo, un = , (−1)n , 3 cos(nπ) é uma sucessão em R3 cujos quatro primeiros termos
n
são (5, −1, −3), (5/2, 1, 3), (5/3, −1, −3) e (5/4, 1, 3).
Uma sucessão em Rm diz-se limitada se o conjunto dos√ seus termos S = {un : n ∈ N} for limitado.
Assim, a sucessão acima é limitada uma vez que kun k ≤ 25 + 1 + 9, donde S ⊆ B √35 (0).
Definição 2.7 Uma sucessão (un ) em Rm diz-se convergente para u ∈ Rm , e escrevemos lim un = u
ou un → u, se, e só se, a sucessão de números reais kun − uk convergir para zero, ou seja, se, e só se,
∀δ > 0 ∃ k ∈ N : n ≥ k ⇒ kun − uk < δ.
Teorema 2.8 Seja (un ) = (u1n , u2n , . . . , um m

n ) uma sucessão em R .
1. Se lim un = a e lim un = b, então a = b.
2. Se (un ) é uma sucessão convergente, então (un ) é limitada.
3. A sucessão (un ) converge para u = (u1 , u2 , . . . , um ) se, e só se, uin → ui , i = 1, . . . , m, isto é,
se, e só se, cada uma das suas sucessões componentes (uin )n∈N convergir para a correspondente
componente do vector u.
5

A sucessão em R3 , un = , (−1)n , 3 cos(nπ) , é um exemplo duma sucessão limitada que não
n
é convergente nem ((−1)n ), nem (3 cos(nπ)) são convergentes em R. A sucessão, em R2 ,
pois
2n + 1 cos n

vn = , é convergente para (2, 0).
n n
Definição 2.9 (Cauchy) Seja f : D ⊆ Rn → Rm e seja a ∈ D0 . Dizemos que o limite de f (x),

quando x tende para a, é b, e escrevemos
lim f (x) = b ∈ Rm
x→a
se, e só se,

∀δ > 0 ∃ ε > 0 : x ∈ D ∧ 0 < kx − ak < ε ⇒ kf (x) − bk < δ.
A definição anterior é exactamente igual à já conhecida para as funções reais de variável real
mas com normas a substituir módulos. Assim, dizer que lim f (x) = b é equivalente a afirmar que
x→a
lim kf (x) − bk = 0. Isto significa que a distância entre f (x) e b pode ser arbitrariamente pequena
x→a
desde que se tome a distância entre x e a suficientemente pequena (mas não nula). Note-se que, na
definição anterior, o ponto a pode não pertencer ao domı́nio D de f mas tem que ser um ponto de
acumulação de D para que nos possamos aproximar de a por pontos em D \ {a}. Fazendo a mudança
de variável x = a + h, é claro que lim f (x) = b ⇔ lim f (a + h) = b.
x→a h→0
19
A noção de limite de uma função vectorial de variável vectorial num ponto também pode ser dada
em termos de sucessões, tendo-se a seguinte definição equivalente.
Definição 2.10 (Heine) Sejam f : D ⊆ Rn → Rm , a ∈ D0 e b ∈ Rm . Então lim f (x) = b se, e só
x→a
se, para toda a sucessão (xk )k∈N de pontos de D \ {a} tal que lim xk = a, se tiver lim f (xk ) = b.
O teorema que se segue diz-nos que, tal como para as funções vectoriais de variável real estuda-
das do Capı́tulo 1, os limites das funções vectoriais de variável vectorial se calculam componente a
componente, reduzindo-se ao cálculo de m limites de funções reais.
Teorema 2.11 Sejam f : D ⊆ Rn → Rm , a ∈ D0 e b = (b1 , . . . , bm ) ∈ Rm . Então
lim f (x) = b ⇔ lim fi (x) = bi , ∀i = 1, . . . , m.
x→a x→a
Recordemos que, para funções de variável real, se lim f (x) 6= lim f (x), então não existe
x→a− x→a+
lim f (x). Para funções de mais de uma variável a análise da existência, ou não, de limite é mais
x→a
complicada uma vez que há uma infinidade de caminhos através dos quais x se pode aproximar de a
e o limite, a existir, tem que ser independente do modo como x → a. Portanto, se f (x) → L1 quando
x → a ao longo de uma curva C1 e f (x) → L2 quando x → a ao longo de uma curva C2 , com L1 6= L2 ,
então lim f (x) não existe. Tornamos esta ideia mais precisa com as seguintes definições.
x→a
Definição 2.12 Seja f : D ⊆ Rn → Rm e seja A ⊆ D. A restrição de f ao conjunto A é a função

f|A : A → Rm definida por f|A (x) = f (x), ∀x ∈ A.
Definição 2.13 Sejam f : D ⊆ Rn → Rm , A ⊆ D e a ∈ A0 . Dizemos que o limite de f no ponto
a, relativo ao conjunto A, é b, e escrevemos
lim f (x) = b ∈ Rm ,
x→a
x∈A
se, e só se, lim f|A (x) = b. Se A é a intersecção de D com uma recta passando por a, ao limite
x→a
relativo a A chamamos limite direccional de f em a.
Note-se que quando A = D as definições de limite e de limite relativo coincidem. Além disso, se f
tiver limite em a, todos os limites relativos de f em a existem e são iguais. Isto mostra que no caso
em que existem dois limites relativos distintos de f em a, então não existe lim f (x).
x→a
7x2 − y 3
Exemplos. 1) A função (x, y) 7→ 2 não tem limite quando (x, y) → (0, 0) uma vez que os
x + y2
limites relativos às rectas x = 0 e y = 0 são, respectivamente, 0 e 7.
x2 y
2) Mostremos, recorrendo à definição segundo Cauchy, que lim = 0. Para esse efeito
(x,y)→(0,0) x2 + y 2
x2
iremos fazer uso das desigualdades |y| ≤ k(x, y)k, ∀(x, y) ∈ R2 e 2 ≤ 1, ∀(x, y) ∈ R2 \ {(0, 0)}.
x + y2
x2 y
Dado δ > 0 queremos determinar ε > 0 tal que, se 0 < k(x, y)k < ε, então 2 < δ. Ora pelas

x + y2
desigualdades anteriores temos

x2 y x2
= |y| ≤ |y| ≤ k(x, y)k,

2
x + y2 x2 + y 2

pelo que basta tomar ε = δ.
Teorema 2.14 (Enquadramento) Sejam f, g, h : D ⊆ Rn → R funções escalares definidas num

subconjunto D de Rn e seja a ∈ D0 . Suponhamos que f (x) ≤ g(x) ≤ h(x), ∀x ∈ D e que lim f (x) =
x→a
lim h(x) = b ∈ R, então lim g(x) = b.
x→a x→a
20
Dizemos que uma função f : D ⊆ Rn → Rm é limitada se o conjunto f (D) for limitado, ou seja,
se existe M > 0 tal que kf (x)k ≤ M , ∀x ∈ D. O corolário que se segue é muito útil no cálculo de
limites.
Corolário 2.15 Sejam f, g : D ⊆ Rn → R funções escalares e seja a ∈ D0 . Se lim f (x) = 0 e g é

x→a
limitada, então lim f (x)g(x) = 0.
x→a
x+1

Aplicando o corolário anterior podemos concluir que lim xy sin = 0 uma vez que a
(x,y)→(0,0) y2
x+1

função (x, y) 7→ sin é limitada e lim xy = 0.
y2 (x,y)→(0,0)
São válidas as seguintes propriedades algébricas dos limites, que generalizam as já conhecidas para
funções reais de variável real.
Teorema 2.16 Sejam D um subconjunto de Rn , f, g : D ⊆ Rn → Rm funções vectoriais, λ : D → R

uma função real e a ∈ D0 . Suponhamos que lim f (x) = b, lim g(x) = c, onde b, c ∈ Rm , e que
x→a x→a
lim λ(x) = α ∈ R. Então tem-se:
x→a
i) lim (f (x) + g(x)) = b + c;

x→a
ii) lim f (x) · g(x) = b · c, onde · representa um produto interno;

x→a
iii) lim λ(x)f (x) = αb;

x→a
iv) lim kf (x)k = kbk.

x→a
Definição 2.17 Seja f : D ⊆ Rn → Rm e seja a ∈ D. A função f diz-se contı́nua em a se, e só se,
∀δ > 0 ∃ ε > 0 : x ∈ D ∧ kx − ak < ε ⇒ kf (x) − f (a)k < δ.
Se a for um ponto de acumulação de D, então f é contı́nua em a se, e só se,
lim f (x) = f (a) (∈ Rm ).

x→a
f diz-se contı́nua num conjunto S ⊆ D se for contı́nua em todos os pontos de S, f diz-se contı́nua
se é contı́nua em todos os pontos de D.
Atendendo à Definição 2.10, conclui-se que f : D ⊆ Rn → Rm é contı́nua em a ∈ D se, e só se,

para toda a sucessão (xk )k∈N em D tal que xk → a se tiver f (xk ) → f (a). Note-se ainda que qualquer
função é contı́nua num ponto isolado do seu domı́nio.
Resulta imediatamente do Teorema 2.11 o seguinte.
Teorema 2.18 Seja f : D ⊆ Rn → Rm e seja a ∈ D. Então f é contı́nua em a se, e só se, fi é

contı́nua em a, ∀i = 1, . . . , m.
O próximo resultado dá-nos algumas propriedades das funções contı́nuas, análogos aos já conheci-
dos para funções de variável real.
Teorema 2.19 Sejam f, g : D ⊆ Rn → Rm , ϕ : E ⊆ Rp → Rn tal que ϕ(E) ⊆ D e λ : D ⊆ Rn → R.

Então:
f
i) se f , g e λ são contı́nuas em a ∈ D, o mesmo sucede a kf k, f + g, λf , f · g, e ainda a se
λ
λ(a) 6= 0;
ii) se ϕ é contı́nua em a ∈ E e f é contı́nua em b = ϕ(a), então f ◦ ϕ é contı́nua em a.
21
Do teorema anterior resulta, por indução, que somas, produtos e compostas de um número finito
de funções contı́nuas são funções contı́nuas. Assim, temos como exemplos de funções contı́nuas (nos
respectivos domı́nios) funções cujas componentes sejam funções polinomiais, racionais e funções que
resultem de somas, produtos e compostas de um número finito de funções polinomiais, racionais,
trigonométricas, exponenciais, logarı́tmicas, etc.
/ D. Se existir lim f (x) ∈ Rm podemos definir

Definição 2.20 Sejam f : D ⊂ Rn → Rm , a ∈ D0 e a ∈
x→a
uma nova função f˜ : D ∪ {a} → Rm dada por
(
f (x), se x ∈ D
f˜(x) = lim f (x), se x = a.
x→a
A função f˜ assim construı́da é contı́nua em a. Diz-se, por isso, o prolongamento por continuidade
de f ao ponto a.
sin(x2 + y 2 )
A função f (x, y) = pode ser prolongada por continuidade ao ponto (0, 0) uma vez
x2 + y 2
que lim f (x, y) = 1.
(x,y)→(0,0)
Definição 2.21 Um conjunto S ⊆ Rn diz-se conexo por arcos se quaisquer dois pontos de S podem
ser ligados por uma curva contida em S, isto é, dados x, y ∈ S existe uma linha parametrizada
γ : [a, b] → Rn tal que γ(a) = x, γ(b) = y e γ(t) ∈ S, ∀t ∈ [a, b].
Na figura que se segue, o conjunto U é conexo por arcos mas o conjunto S = A ∪ B não é.
Se f é uma função escalar contı́nua cujo domı́nio é conexo por arcos, é válida uma generalização
do teorema de Bolzano que conhecemos para funções reais de variável real. Com efeito, dado que os
subconjuntos conexos por arcos de R são os intervalos, o resultado enunciado no teorema que se segue,
no caso n = 1, diz que se f for contı́nua em [a, b], então f toma todos os valores entre f (a) e f (b).
Teorema 2.22 (Bolzano) Se f : X ⊆ Rn → R é contı́nua e X é um conjunto conexo por arcos,

então f (X) é um intervalo.
2.2 Derivadas parciais e derivadas direccionais

Nesta secção vamos começar por considerar funções com valores reais.
Definição 2.23 Sejam f : D ⊆ R2 → R e (x0 , y0 ) ∈ D ∩ D0 . A derivada parcial de f em ordem

a x no ponto (x0 , y0 ) é dada por
∂f f (x0 + h, y0 ) − f (x0 , y0 )
(x0 , y0 ) = fx (x0 , y0 ) = lim ,
∂x h→0 h
se este limite existir em R. A derivada parcial de f em ordem a y no ponto (x0 , y0 ) é dada por
∂f f (x0 , y0 + h) − f (x0 , y0 )
(x0 , y0 ) = fy (x0 , y0 ) = lim ,
∂y h→0 h
se este limite existir em R.
22
∂f
Note-se que (x0 , y0 ) = g 0 (x0 ) onde g é a função real de variável real que se obtém, a partir de
∂x
f , fixando y = y0 e deixando variar apenas x: g(x) = f (x, y0 ). Esta derivada parcial dá-nos, pois, a
taxa de variação da função f em ordem à variável x, mantendo y fixo. O gráfico da função g é a curva
que resulta da intersecção da superfı́cie z = f (x, y) com o plano y = y0 . Assim, a derivada parcial
de f em ordem a x no ponto (x0 , y0 ) representa o declive da recta tangente a essa curva no ponto
(x0 , y0 , f (x0 , y0 )).
Conclusões análogas são válidas para a derivada parcial de f em ordem a y. Neste caso, fixamos o
∂f
valor de x e deixamos variar apenas y tendo-se (x0 , y0 ) = k 0 (y0 ) onde k é dada por k(y) = f (x0 , y).
∂y
Exemplo. Sendo f (x, y) = x2 + 2xy calculemos as derivadas parciais de f em ordem a x e em ordem

a y no ponto (x, y) = (1, 2). Fixando primeiro y = 2, seja g(x) = f (x, 2) = x2 + 4x. Então tem-se
g 0 (x) = 2x + 4 pelo que
∂f
(1, 2) = g 0 (1) = 6.
∂x
Fixando agora x = 1, seja k(y) = f (1, y) = 1 + 2y. Então tem-se k 0 (y) = 2 pelo que
∂f
(1, 2) = k 0 (2) = 2.
∂y
A noção de derivada parcial generaliza-se de forma natural ao caso de funções de mais de duas
variáveis.
Definição 2.24 Dada uma função f : D ⊆ Rn → R, definida numa vizinhança dum ponto a ∈ D, a
derivada parcial de f em ordem a xi , no ponto a, é dada por
∂f f (a1 , . . . , ai−1 , ai + h, ai+1 , . . . , an ) − f (a) f (a + hei ) − f (a)
(a) = fxi (a) = lim = lim ,
∂xi h→0 h h→0 h
se este limite existir em R (onde (e1 , . . . , en ) é a base canónica de Rn ).
23
Se f : D ⊆ Rn → R tiver derivada parcial em ordem a xi em todos os pontos de um aberto Di ⊆ D
chamamos função derivada parcial de f em ordem a xi à função definida em Di através da relação
x 7→ fxi (x), com i ∈ {1, . . . , n}. Analogamente ao caso n = 2, fxi é a derivada da função real de
variável real t 7→ f (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ).
Note-se ainda que, uma vez que as derivadas parciais de f se obtêm derivando a função em ordem
a uma das variáveis, mantendo as outras fixas, as regras de derivação já conhecidas para funções reais
de variável real permanecem válidas.
Se as funções derivadas parciais de f puderem por sua vez ser derivadas em ordem a alguma das
variáveis obtemos novas funções chamadas derivadas parciais de segunda ordem de f .
Assim, uma função de duas variáveis tem, caso existam, quatro derivadas parciais de segunda
ordem que se denotam por
∂2f ∂2f ∂2f ∂2f
fxx = , f xy = , f yx = e fyy = .
∂x2 ∂y∂x ∂x∂y ∂y 2
∂2f
Observemos que a notação fxy = significa que derivamos f primeiro em ordem a x e depois em
∂y∂x
∂2f
ordem a y, para fyx = a ordem de derivação é a oposta.
∂x∂y
Analogamente se definem derivadas parciais de ordem superior à segunda. Por exemplo, a derivada
parcial de terceira ordem fyyx obtém-se derivando f duas vezes em ordem a y e depois uma vez em
ordem a x.
Exemplo. Sendo f (x, y, z) = y 2 ex + z sin x, tem-se fx = y 2 ex + z cos x, fy = 2yex , fz = sin x,
fxy = 2yex , fxx = y 2 ex − z sin x e fxxz = − sin x.
Definição 2.25 Seja D um conjunto aberto. Uma função f : D ⊆ Rn → R diz-se de classe C k em

D, k ∈ N0 , e escreve-se f ∈ C k (D), se todas as suas derivadas parciais até à ordem k (inclusive)
forem funções contı́nuas em D. Uma função de classe C 0 em D é uma função contı́nua em D. f
diz-se de classe C ∞ em D, e escreve-se f ∈ C ∞ (D), se f ∈ C k (D), para todo k ∈ N0 .
Uma vez que somas, produtos e compostas de funções contı́nuas são funções contı́nuas, resulta que
somas, produtos e compostas de funções de classe C k são ainda funções de classe C k . É imediato a
partir da definição que C k+1 (D) ⊆ C k (D) se k > 0. A inclusão anterior permanece válida no caso
k = 0 e será justificada na próxima secção.
Teorema 2.26 (Schwarz) Se f é uma função de classe C 2 numa vizinhança do ponto (x0 , y0 ), então
∂2f ∂2f
(x0 , y0 ) = (x0 , y0 ).
∂y∂x ∂x∂y
O resultado anterior pode-se generalizar a funções de mais de duas variáveis e ao caso de derivadas
parciais de ordem superior à segunda. Se f ∈ C 4 (R3 ) pode-se mostrar, por exemplo, que fxxyz =
fxyzx = fyxzx . Note-se que em qualquer destes casos derivamos f duas vezes em ordem a x, uma vez
em ordem a y e uma vez em ordem a z, a ordem de derivação é que é indiferente.
Como vimos acima, as derivadas parciais de uma função real f dão-nos a taxa de variação de f
nas direcções dos eixos coordenados. A derivada direccional de uma função real f num ponto, que
definiremos de seguida, fornece-nos, por definição, a taxa de variação de f numa direcção arbitrária.
Definição 2.27 Dada uma função f : D ⊆ Rn → R, e a ∈ int D, a derivada de f , no ponto a,
segundo o vector u ∈ Rn é dada por
f (a + hu) − f (a)
fu0 (a) = lim ,
h→0 h
se este limite existir em R.
Se o vector u for unitário, isto é, se kuk = 1, a derivada de f , no ponto a, segundo o vector u
diz-se derivada direccional ou derivada dirigida de f , no ponto a, na direcção e sentido de u.
24
∂f
Se u = ej (vector da base canónica de Rn , j = 1, . . . , n) tem-se fe0 j (a) = (a), ou seja, as
∂xj
derivadas parciais de f são derivadas direccionais nas direcções dos eixos coordenados. Veremos mais
adiante que, para muitas funções, todas as derivadas direccionais podem ser obtidas à custa das
derivadas parciais.
A figura que se segue permite-nos interpretar geometricamente o conceito de derivada direccional
no caso n = 2. Com efeito, intersectando o gráfico de f com o plano perpendicular ao plano xy que
contém a recta definida pelo ponto (x, y) e pelo vector unitário u = (u1 , u2 ), obtemos uma curva C
que é o gráfico da função real de variável real g(h) = f ((x, y) + h(u1 , u2 )). A derivada fu0 (x, y) é o
declive da recta tangente à curva C (também chamado declive da curva) no ponto (x, y, f (x, y)),
portanto fu0 (x, y) = g 0 (0).
Exemplo. Se f : D ⊆ Rn → R admite derivada segundo o vector v num ponto a ∈ int D, então

no ponto a, f admite derivada segundo o vector λv para qualquer λ ∈ R e tem-se fλv 0 (a) = λf 0 (a).
v
Assim, a derivada direccional de f , no ponto a, na direcção e sentido de um vector não nulo v é dada
por fu0 (a) = kvk
1
fv0 (a) onde u = kvk
v
(cf. Ficha 2).
As noções de derivada parcial e de derivada segundo um vector estendem-se de modo natural às
funções vectoriais f : D ⊆ Rn → Rm . Em vez de números reais, estas derivadas são agora vectores de
Rm cujas componentes são exactamente as correspondentes derivadas das m funções componentes de
f . Tem-se assim a seguinte definição.
Definição 2.28 Dada uma função f : D ⊆ Rn → Rm , e a ∈ int D, a derivada de f , no ponto a,
segundo o vector u ∈ Rn é dada por
f (a + hu) − f (a)
fu0 (a) = lim
h→0 h
se este limite existir em Rm . Neste caso, fu0 (a) é um vector de Rm .
Se o vector u for unitário, isto é se kuk = 1, a derivada de f , no ponto a, segundo o vector u
diz-se derivada direccional ou derivada dirigida de f , no ponto a, na direcção e sentido de u.
∂f
Se u = ej tem-se fe0 j (a) = (a), sendo estas derivadas parciais vectores de Rm .
∂xj
Exemplo. Seja f (x, y, z) = (ex + y 2 − 3z, xy 3 z 2 ). Então
fx = (ex , y 3 z 2 ), fy = (2y, 3xy 2 z 2 ), fz = (−3, 2xy 3 z)
donde
fx (0, 1, 2) = (1, 4), fy (0, 1, 2) = (2, 0), fz (0, 1, 2) = (−3, 0).
Podemos ainda generalizar para funções vectoriais a noção de função de classe C k .
Definição 2.29 Seja f : D ⊆ Rn → Rm , f = (f1 , f2 , . . . , fm ). A função f diz-se de classe C k em
D, k ∈ N0 , (respectivamente, de classe C ∞ em D) se fi ∈ C k (D), ∀i = 1, . . . , m, (respectivamente,
fi ∈ C ∞ (D), ∀i = 1, . . . , m).
25
2.3 Funções diferenciáveis, noção de gradiente e de matriz jacobiana
Vamos ver nesta secção o que se entende por diferenciabilidade de uma função
f : D ⊆ Rn → R.
Recordemos que uma função real de variável real f se diz diferenciável num ponto a quando tem
derivada finita nesse ponto. Este facto implica a continuidade de f em a. De forma a preservarmos
esta propriedade para funções de duas ou mais variáveis não podemos definir diferenciabilidade de
f num ponto a ∈ Rn como sendo equivalente à existência (em R) das derivadas parciais de f em
a. Com efeito, existem exemplos de funções que têm derivadas parciais finitas num ponto (e que até
admitem derivadas direccionais finitas em qualquer direcção) mas que são descontı́nuas nesse ponto.
Isto acontece uma vez que a existência de derivadas parciais reflecte o comportamento da função
apenas em segmentos de recta paralelos aos eixos coordenados enquanto que a continuidade de f num
certo ponto está relacionada com o comportamento da função numa vizinhança desse ponto.
Exemplo. Seja 
 2xy

, (x, y) 6= (0, 0)
f (x, y) = x2 + y 2 (3)
0, (x, y) = (0, 0).

Então tem-se
f (h, 0) − f (0, 0) f (0, h) − f (0, 0)
fx (0, 0) = lim = 0 e fy (0, 0) = lim = 0,
h→0 h h→0 h
no entanto f é descontı́nua em (0, 0) uma vez que não existe lim f (x, y). Com efeito, os limites
(x,y)→(0,0)
de f relativos às rectas x = 0 e x = y são, respectivamente, 0 e 1.
Definição 2.30 Seja f : D ⊆ Rn → R e seja a um ponto interior de D. Se f tem derivadas parciais

de primeira ordem em a chamamos gradiente de f no ponto a ao vector
∂f ∂f ∂f

∇f (a) = (a), (a), . . . , (a) .
∂x1 ∂x2 ∂xn
Exemplo. Sendo f (x, y) = exy , tem-se fx = yexy e fy = xexy , ∀(x, y) ∈ R2 , donde
∇f (0, −1) = (−1, 0) e ∇f (1, 2) = (2e2 , e2 ).
Uma função real de variável real f é diferenciável num ponto a do interior do seu domı́nio se, e só
se, tem derivada finita f 0 (a) dada por
f (a + h) − f (a)
f 0 (a) = lim .
h→0 h
Assim, tem-se
f (a + h) − f (a) − hf 0 (a)
lim = 0.
h→0 |h|
A relação anterior ainda se pode escrever na forma
f (a + h) = f (a) + f 0 (a)h + o(h), (h → 0)
o que significa que podemos aproximar a diferença f (a + h) − f (a) pela função, linear em h, f 0 (a)h
sendo o erro cometido nesta aproximação um infinitésimo de ordem superior a h, quando h → 0.
Notemos ainda que, pondo h = x − a, a relação anterior permite concluir que, numa vizinhança do
ponto a, a função f (x) pode ser aproximada pela função g(x) = f (a) + f 0 (a)(x − a) cujo gráfico é a
f (x) − g(x)
recta tangente ao gráfico de f no ponto a, tendo-se lim = 0.
x→a x−a
26
Para uma função escalar de n variáveis tem-se a seguinte definição.
Definição 2.31 Sejam f : D ⊆ Rn → R e a ∈ int D. A função f diz-se diferenciável no ponto a
se, e só se, existir um vector y ∈ Rn tal que
f (a + h) − f (a) − y · h
lim =0 (h ∈ Rn ). (4)
h→0 khk
É fácil de ver que, quando existe um vector y nas condições anteriores, ele é único. Veremos de
seguida que se tem y = ∇f (a).
Teorema 2.32 Sejam f : D ⊆ Rn → R, a ∈ int D e suponhamos que f é diferenciável em a. Então
existem todas as derivadas parciais de primeira ordem de f no ponto a e o vector y de (4) é dado por
y = ∇f (a).
Atendendo ao teorema anterior concluimos assim que uma função f : D ⊆ R2 → R é diferenciável
num ponto (a, b) do interior de D se, para |h| e |k| suficientemente pequenos, se tiver
f (a + h, b + k) = f (a, b) + fx (a, b)h + fy (a, b)k + ε(h, k) = f (a, b) + ∇f (a, b) · (h, k) + ε(h, k),
onde ε(h, k) = o(k(h, k)k), (k(h, k)k → 0). Pondo h = x − a e k = y − b vê-se assim que, numa
vizinhança do ponto (a, b), f (x, y) pode ser aproximada pela função
g(x, y) = f (a, b) + fx (a, b)(x − a) + fy (a, b)(y − b)
cujo gráfico é um plano que passa no ponto P (a, b, f (a, b)) pertencente também ao gráfico de f .
Este plano é o que melhor aproxima o gráfico de f em pontos (x, y) próximos de (a, b) uma vez que
f (x, y) − g(x, y)
lim = 0, por isso dizemos que é o plano tangente ao gráfico de f no ponto
(x,y)→(a,b) k(x − a, y − b)k
(a, b, f (a, b)). De facto, veremos mais adiante que o plano definido por z = g(x, y) contém todas as
rectas tangentes ao gráfico de f no ponto P .
Verificamos assim que uma função diferenciável de uma variável real, f , pode ser aproximada
por uma função cujo gráfico é a recta tangente ao gráfico de f , na passagem para duas variáveis a
aproximação é dada por um plano.
O resultado que se segue dá-nos a esperada relação entre diferenciabilidade e continuidade.
Teorema 2.33 Seja f : D ⊆ Rn → R uma função real definida numa vizinhança do ponto a ∈ D. Se
f é diferenciável em a, então f é contı́nua em a.
A diferenciabilidade de uma função num ponto é, por vezes, de verificação morosa. Nalguns casos
pode ser útil ter em conta a seguinte condição suficiente de diferenciabilidade.
Teorema 2.34 Se a função f : D ⊆ Rn → R tem derivadas parciais contı́nuas numa vizinhança do
ponto a, então f é diferenciável em a.
Mencionámos no inı́cio desta secção que o facto de existirem as derivadas parciais de f não é
suficiente para garantir a diferenciabilidade da função, nem sequer a sua continuidade. O teorema
anterior mostra, no entanto, que se f tem derivadas parciais contı́nuas numa vizinhança do ponto a,
então f é diferenciável em a. Em particular, toda a função de classe C 1 é diferenciável.
27
Exemplo. Voltemos a considerar a função definida em (3). Como vimos, fx (0, 0) = 0, fy (0, 0) = 0
e f não é contı́nua em (0, 0) pelo que f também não é diferenciável nesse ponto. Por outro lado, as
derivadas parciais de f existem em qualquer ponto (x, y) 6= (0, 0) tendo-se
2y 3 − 2x2 y 2x3 − 2xy 2
fx (x, y) = e fy (x, y) = .
(x2 + y 2 )2 (x2 + y 2 )2
Resulta então do teorema anterior que pelo menos uma destas derivadas parciais terá que ser des-
contı́nua em (0, 0). De facto, não é difı́cil mostrar que não existe o limite lim fx (x, y), pois
(x,y)→(0,0)
x=0
2
fx (0, y) = , o que prova que fx é descontı́nua em (0, 0).
y
Vejamos agora, para o caso de uma função diferenciável f , qual a relação entre a derivada direc-
cional num ponto e o vector gradiente.
Teorema 2.35 Seja f : D ⊆ Rn → R uma função diferenciável no ponto a ∈ int D. Então f tem
derivada segundo qualquer vector u ∈ Rn , no ponto a, e tem-se
fu0 (a) = ∇f (a) · u.
Vê-se assim que se f é diferenciável em a, então a aplicação T : Rn → R definida por u 7→ fu0 (a) é
linear.
Exemplo. Consideremos a função polinomial definida em R3 por
f (x, y, z) = 3x2 yz + xz 4 − 4y. (5)
f é diferenciável em R3 e tem-se ∇f (x, y, z) = (6xyz + z 4 , 3x2 z − 4, 3x2 y + 4xz 3 ). Assim, a derivada

de f , segundo o vector v = (6, 1, −2), no ponto (0, 1, −1), é
fv0 (0, 1, −1) = ∇f (0, 1, −1) · (6, 1, −2) = (1, −4, 0) · (6, 1, −2) = 2.
Teorema 2.36 Seja f uma função diferenciável em a ∈ int D. Então o valor máximo da derivada
direccional fu0 (a) é k∇f (a)k e ocorre quando u tem a direcção e sentido do vector ∇f (a).
Assim, k∇f (a)k corresponde ao valor máximo da taxa de variação de f no ponto a e esse máximo
ocorre na direcção e sentido do vector ∇f (a). Esta é, então, a direcção e sentido em que a função f
aumenta mais rapidamente no ponto a.
0
Exemplo. Para √ a função f definida em (5) o valor máximo da derivada direccional fu (0, 1, −1) é
k∇f (0, 1, −1)k = 17 e ocorre na direcção e sentido do vector ∇f (0, 1, −1) = (1, −4, 0).
Supondo agora que f : D ⊆ Rn → Rm é uma função vectorial, vimos na Definição 2.28 que fu0 (a)
é um vector de Rm que, atendendo ao Teorema 2.11, tem por componentes as derivadas das funções
fi , i = 1, . . . , m, no ponto a, segundo o vector u, isto é,
fu0 (a) = ((f1 )0u (a), (f2 )0u (a), . . . , (fm )0u (a))
onde
fi (a + hu) − fi (a)
(fi )0u (a) = lim , i = 1, . . . , m.
h→0 h
Supondo que todas as funções fi : D ⊆ Rn → R são diferenciáveis no ponto a, pelo Teorema 2.35,
temos que
(fi )0u (a) = ∇fi (a) · u
pelo que
fu0 (a) = (∇f1 (a) · u, ∇f2 (a) · u, . . . , ∇fm (a) · u).
28
Usando a notação matricial podemos escrever
 ∂f1 ∂f1 ∂f1 
∂x1 ∂x2 ... ∂xn

u1
 
∇f1 (a)
 
u1

       
       
 ∂f2 ∂f2 ∂f2    ∇f (a)
 ∂x1

∂x2 ... ∂xn



 u2   2



 u2 

0
     
fu (a) =  · = ·
   

 .
 . .. .. ..  
 ..  
..  
.. 
.
 
.
 
.

 . . . .       
      
       
 
∂fm ∂fm ∂fm un ∇fm (a) un
∂x1 ∂x2 ... ∂xn (a) m×n n×1
identificando a matriz coluna m × 1 resultante com o vector de Rm correspondente.
∂fi
Definição 2.37 Seja f : D ⊆ Rn → Rm e seja a ∈ D tal que as derivadas parciais , i = 1, . . . , m,
∂xj
j = 1, . . . , n, existem no ponto a. À matriz
 ∂f1 ∂f1 ∂f1 
∂x1 ∂x2 ... ∂xn

∇f1 (a)

   
   
 ∂f2 ∂f2 ∂f2   ∇f (a)
 ∂x1

∂x2 ... ∂xn

  2


 
Jf (a) =  =
  

 .
 . .. .. ..  
 .. 
.

 . . . .   
  
   
 
∂fm ∂fm ∂fm ∇fm (a)
∂x1 ∂x2 ... ∂xn (a)
dá-se o nome de matriz jacobiana de f no ponto a.

Quando m = n o determinante da matriz Jf (a) diz-se o jacobiano da função f no ponto a e
representa-se por
∂(f1 , f2 , . . . , fn )
det Jf (a) = (a).
∂(x1 , x2 , . . . , xn )
Exemplo. Seja f : R3 → R3 dada por f (x, y, z) = (sin(xyz), x2 − yez , x + yz). Tem-se

   
yz cos(xyz) xz cos(xyz) xy cos(xyz) 0 0 −8
   
   
Jf (4, −2, 0) =  2x −ez −yez =  8 −1 2 .
   

   
   
1 z y (4,−2,0)
1 0 −2
Assim, det Jf (4, −2, 0) = −8 e, para u = (1, 0, −1), vem

     
0 0 −8 1 8
     
     
fu0 (4, −2, 0) =  8 −1 2 · 0 = 6 
     
     
     
1 0 −2 −1 3
pelo que fu0 (4, −2, 0) = (8, 6, 3). Cada componente deste vector é a derivada da correspondente função
componente de f , segundo o vector u, no ponto (4, −2, 0).
29
Vejamos finalmente como estender a noção de diferenciabilidade a funções vectoriais
f : D ⊆ Rn → Rm .
Definição 2.38 Sejam f : D ⊆ Rn → Rm e a ∈ int D. A função f diz-se diferenciável no ponto
a se, e só se, existir uma aplicação linear T : Rn → Rm tal que
f (a + h) − f (a) − T (h)
lim = 0. (6)
h→0 khk
Portanto, a função f : D ⊆ Rn → Rm é diferenciável no ponto a se a diferença f (a + h) − f (a)
puder ser aproximada por uma função linear T (h), sendo o erro cometido um infinitésimo que tende
para zero mais rapidamente do que h, quando h → 0. À aplicação linear T da definição anterior
chama-se derivada de f no ponto a e escreve-se T = f 0 (a) = Df (a).
Note-se que a definição anterior generaliza às funções vectoriais a noção de diferenciabilidade
definida atrás para o caso f : D ⊆ Rn → R uma vez que, como vimos, a aplicação
T : Rn → R
h 7→ ∇f (a) · h
é linear.
Denotemos por A a matriz da aplicação linear T relativamente às bases canónicas de Rn e Rm .
Sabe-se da Álgebra Linear que
T (h) = A · h, ∀h ∈ Rn .
À semelhança dos Teoremas 2.11 e 2.18 tem-se o seguinte resultado.
Teorema 2.39 Sejam f : D ⊆ Rn → Rm e a ∈ int D. Então f é diferenciável em a se, e só se, fi é
diferenciável em a, ∀i = 1, . . . , m.
Nota. Da demonstração do teorema anterior resulta que a matriz A é a matriz jacobiana de f no
ponto a. É então imediato o próximo teorema, que generaliza ao caso das funções vectoriais resultados
já conhecidos para funções reais.
Teorema 2.40 Sejam f : D ⊆ Rn → Rm e a ∈ int D. Se f é diferenciável em a, então:
1. f é contı́nua em a;
2. existem todas as derivadas parciais de primeira ordem de f no ponto a;
3. a aplicação linear T da expressão (6) é única e a sua matriz relativamente às bases canónicas
de Rn e Rm é a matriz jacobiana Jf (a);
4. a função f tem derivada no ponto a segundo qualquer vector u ∈ Rn e tem-se
fu0 (a) = T (u) = f 0 (a)(u);
5. a aplicação de Rn para Rm definida por u 7→ fu0 (a) é linear.

Exemplo. Consideremos a função f : R2 → R3 definida por f (x, y) = (2x + 3y, y 2 − x3 , exy ). f é
diferenciável em R2 uma vez que as suas funções componentes são de classe C ∞ (R2 ). Assim, f 0 (0, 2)
é a aplicação linear f 0 (0, 2) : R2 → R3 cuja matriz relativamente às bases canónicas de R2 e de R3 é a
matriz jacobiana de f no ponto (0, 2). Como
   
2 3 2 3
   
   
Jf (0, 2) =  −3x2 2y = 0 4 
   

   
   
yexy xexy (0,2)
2 0
concluimos que f 0 (0, 2)(x, y) = (2x + 3y, 4y, 2x). Daqui resulta que a derivada de f , no ponto (0, 2),
segundo o vector (−3, 1) é f 0 (0, 2)(−3, 1) = (−3, 4, −6).
30
2.4 Derivação da função composta
Recordemos a regra de derivação da função composta para funções reais de variável real. Se y = f (x),
onde f é diferenciável em x0 = g(t0 ), e x = g(t), onde g é diferenciável em t0 , então a função composta
y = f (g(t)) é diferenciável em t0 e tem-se
y 0 (t0 ) = (f ◦ g)0 (t0 ) = f 0 (g(t0 ))g 0 (t0 ) = f 0 (x0 )g 0 (t0 ) (7)
ou, em notação abreviada,

dy dy dx
(t0 ) = (x0 ) (t0 ).
dt dx dt
Vamos agora generalizar este resultado ao caso em que as funções intervenientes são funções vec-
toriais de várias variáveis.
Começamos com um caso simples: suponhamos que y = f (x), onde
f :D⊆R→R
é uma função diferenciável em x0 = g(t0 ), e x = g(t) = g(t1 , t2 , . . . , tp ), onde
g : A ⊆ Rp → R
é diferenciável em t0 e g(A) ⊆ D. Então a função composta
y = f (g(t1 , t2 , . . . , tp ))
é diferenciável em t0 . Atendendo a que, para calcularmos as derivadas parciais de y em ordem a ti ,

i = 1, . . . , p, deixamos variar apenas a variável ti , mantendo fixas as restantes, resulta imediatamente
de (7) que
∂ ∂g
(f ◦ g)(t0 ) = f 0 (x0 ) (t0 )
∂ti ∂ti
∂y dy ∂x
(t0 ) = (x0 ) (t0 ).
∂ti dx ∂ti
Note-se que nesta notação abreviada y está a representar duas funções diferentes, no primeiro membro
da equação a função composta f ◦ g, e no segundo membro apenas f .
Exemplo. Seja z(x, y) = f (sin(xy)) onde f : R → R é uma função de classe C 1 . Determinemos
∂z ∂z 0
∂x (π, 1) e ∂y (π, 1), sabendo que f (0) = 2. Pondo u(x, y) = sin(xy) obtemos
∂z ∂u
= f 0 (u) = f 0 (u) y cos(xy)
∂x ∂x
e
∂z ∂u
= f 0 (u) = f 0 (u) x cos(xy).
∂y ∂y
No ponto (x, y) = (π, 1) tem-se u(π, 1) = sin(π) = 0 donde
∂z
(π, 1) = f 0 (0) cos(π) = −2
∂x
e
∂z
(π, 1) = f 0 (0)π cos(π) = −2π.
∂y
31
Teorema 2.41 (Regra da Cadeia - Caso 1) Seja
f : D ⊆ Rn → R
x = (x1 , . . . , xn ) 7→ y = f (x)
uma função diferenciável em x0 ∈ int D e seja
g : A ⊆ R → Rn
t 7→ x = (g1 (t), . . . , gn (t))
uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g : A ⊆ R → R é diferenciável em t0 e tem-se
n
0 0 ∂f
(x0 )gi0 (t0 )
X
(f ◦ g) (t0 ) = ∇f (x0 ) · g (t0 ) =
i=1
∂xi

n
dy X ∂y dxi
(t0 ) = (x0 ) (t0 ).
dt i=1
∂xi dt
Tal como no caso anterior, nesta notação abreviada y está a representar duas funções diferentes,
no primeiro membro da equação a função composta f ◦ g, e no segundo membro apenas f . Neste
teorema intervêm três tipos de variáveis: a t chamamos a variável independente, x1 , . . . , xn dizem-se
variáveis intermédias e y é a variável dependente. O teorema anterior é conhecido por regra da cadeia
uma vez que há uma cadeia de dependências entre as várias variáveis nele intervenientes. Com efeito,
a variável dependente y depende das variáveis intermédias x1 , . . . , xn , que por sua vez dependem da
variável independente t. O que este resultado nos diz é que para obtermos a derivada da função
dy
composta, , temos que somar as derivadas “sobre todos os caminhos presentes na cadeia, que vão
dt
de y a t”.
Exemplos. 1) Sejam f (x, y) = x2 y e γ : I ⊆ R → R2 uma linha parametrizada de classe C 1

tal que γ(I) representa a trajectória de uma partı́cula em movimento que no instante t = 5 ocupa a
posição (1, 4) e tem vector velocidade (−1, 7). Sendo h(t) = f (γ(t)), calculemos h0 (5). Uma vez que
∇f (x, y) = (2xy, x2 ), tem-se
h0 (5) = ∇f (γ(5)) · γ 0 (5) = ∇f (1, 4) · (−1, 7) = (8, 1) · (−1, 7) = −1.
2) Seja w = f (x, y, z), onde f : R3 → R é de classe C 1 , e x = et , y = sin t, z = 2t−1. Determinemos

w0 (0) sabendo que ∇f (1, 0, −1) = (3, −2, 3). De acordo com o teorema anterior,
w0 (t) = ∇f (x(t), y(t), z(t)) · (x0 (t), y 0 (t), z 0 (t)) = ∇f (x(t), y(t), z(t)) · (et , cos t, 2)
pelo que
w0 (0) = ∇f (x(0), y(0), z(0)) · (1, 1, 2) = ∇f (1, 0, −1) · (1, 1, 2) = (3, −2, 3) · (1, 1, 2) = 7.
O próximo teorema contempla a situação em que compomos uma função real de variável vectorial
com uma função vectorial de variável vectorial.
32
Teorema 2.42 (Regra da Cadeia - Caso 2) Seja
f : D ⊆ Rn → R
x = (x1 , . . . , xn ) 7→ y = f (x)
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
f ◦ g é diferenciável em t0 e tem-se
n
∂(f ◦ g) ∂g1 ∂gn ∂f ∂gj
X
(t0 ) = ∇f (x0 ) · (t0 ), . . . , (t0 ) = (x0 ) (t0 ), i = 1, . . . , p
∂ti ∂ti ∂ti j=1
∂xj ∂ti

n
∂y X ∂y ∂xj
(t0 ) = (x0 ) (t0 ), i = 1, . . . , p
∂ti j=1
∂xj ∂ti
onde usamos, por abuso de notação, y para representar quer a função composta f ◦ g, quer apenas f .
Tal como no caso anterior, temos aqui três tipos de variáveis ligadas por uma cadeia de de-
pendências: a variável dependente y depende das variáveis intermédias x1 , . . . , xn , que por sua vez
dependem das variáveis independentes t1 , . . . , tp . Note-se que existem tantas derivadas parciais da
função composta quanto o número de variáveis independentes, cada uma destas é dada por uma soma
de n parcelas, sendo n o número de variáveis intermédias, que representam os n “caminhos na cadeia
que vão de y a ti ”, i = 1, . . . , p.
Usando a notação matricial, as últimas igualdades do teorema anterior ainda se podem escrever
na forma
 
∂x1 ∂x1 ∂x1
∂t1 ∂t2 ... ∂tp
 
 
 
 ∂x2 ∂x2
... ∂x2 
i  ∂t1 ∂t2 ∂tp
h i h 
∂y ∂y ∂y ∂y ∂y ∂y 
∂t1 ∂t2 ... ∂tp = ∂x1 ∂x2 ... ∂xn ·  .
 .. .. ..
 

 . . . 
 
 
 
∂xn ∂xn ∂xn
∂t1 ∂t2 ... ∂tp
O cálculo de derivadas parciais de ordem superior à primeira para funções compostas faz-se apli-
cando tantas vezes quantas necessário o teorema anterior.
Exemplos. 1) Seja z = f (x, y), onde f : R2 → R é de classe C 1 , e suponhamos que x = s + t,
y = s − t. Verifiquemos que se tem
2 2
∂z ∂z ∂z ∂z

− = .
∂x ∂y ∂s ∂t
A figura que se segue mostra a cadeia de dependências das variáveis neste caso.
33
Assim temos,
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = +
∂s ∂x ∂s ∂y ∂s ∂x ∂y
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = −
∂t ∂x ∂t ∂y ∂t ∂x ∂y
donde se conclui o pretendido.
2) Seja u = y 2 sin x ez onde
x = r2 st, y = s + t2 e z = r + s + t. (8)
∂u ∂u ∂u
Calculemos , e no ponto (r, s, t) = (2, 1, 0).
∂r ∂s ∂t
Pela regra da cadeia, e atendendo às relações (8) e ao facto de se ter x(2, 1, 0) = 0, y(2, 1, 0) = 1 e
z(2, 1, 0) = 3, obtemos
 ∂x ∂x ∂x 
 ∂r ∂s ∂t 
 
 
∂u ∂u ∂u

∂u ∂u ∂u  ∂y

∂y ∂y 
= ·

∂x ∂y ∂z (0,1,3) 

∂r ∂s ∂t (2,1,0)  ∂r ∂s ∂t 

 

∂z ∂z ∂z 
∂r ∂s ∂t (2,1,0)
2rst r2 t r2 s
 
 
h i  
2 z z 2 z
= y cos x e 2y sin x e y sin x e · 0 1 2t 
 
(0,1,3)  
 
1 1 1 (2,1,0)
 
0 0 4
 
h i   h i
= e3 0 0 · 0 1 0 = 0 0 4e3
 
 
 
1 1 1
∂u ∂u ∂u
donde (2, 1, 0) = 0, (2, 1, 0) = 0 e (2, 1, 0) = 4e3 .
∂r ∂s ∂t
3) Seja z = f (x, y), onde f : R2 → R é uma função de classe C 2 , e suponhamos que x = r2 − s2 ,
∂2z
y = r2 + s2 . Pretende-se calcular . Para esse efeito, começamos por aplicar a regra da cadeia
∂s∂r
∂z
para obter :
∂r
∂z ∂z ∂x ∂z ∂y ∂z ∂z

= + = 2r + .
∂r ∂x ∂r ∂y ∂r ∂x ∂y
34
∂z
Temos agora que derivar em ordem a s o que implica derivar cada uma das funções compostas
∂r
∂z ∂z
e em ordem a s. Aplicamos então a regra da cadeia a cada uma destas funções: no primeiro
∂x ∂y
caso a cadeia de dependências das variáveis é
donde
∂ ∂z ∂ 2 z ∂x ∂ 2 z ∂y ∂2z ∂2z

(x(r, s), y(r, s)) = + = −2s + 2s .
∂s ∂x ∂x2 ∂s ∂y∂x ∂s ∂x2 ∂y∂x
Analogamente,
∂ ∂z ∂ 2 z ∂x ∂ 2 z ∂y ∂2z ∂2z

(x(r, s), y(r, s)) = + 2 = −2s + 2s 2 ,
∂s ∂y ∂x∂y ∂s ∂y ∂s ∂x∂y ∂y
pelo que obtemos por fim
!
∂2z ∂ ∂z ∂ ∂z ∂2z ∂2z

= 2r + 2r = 4rs − ,
∂s∂r ∂s ∂x ∂s ∂y ∂y 2 ∂x2
∂2z ∂2z
atendendo ao facto de = por f ser de classe C 2 .
∂x∂y ∂y∂x
Finalmente para
f : D ⊆ Rn → Rm
x = (x1 , . . . , xn ) 7→ y = (f1 (x), . . . , fm (x))
e
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
podemos aplicar o Caso 2 a cada uma das componentes de f = (f1 , . . . , fm ) e obtém-se o seguinte
resultado:
Teorema 2.43 (Regra da Cadeia - Caso Geral) Seja
f : D ⊆ Rn → Rm
x = (x1 , . . . , xn ) 7→ y = (f1 (x), . . . , fm (x))
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
f ◦ g é diferenciável em t0 e tem-se
(f ◦ g)0 (t0 ) = f 0 (x0 ) ◦ g 0 (t0 )
donde
Jf ◦g (t0 ) = Jf (x0 ) · Jg (t0 )
ou seja, em notação abreviada,
n
∂yk X ∂yk ∂xj
(t0 ) = (x0 ) (t0 ), i = 1, . . . , p, k = 1, . . . , m.
∂ti j=1
∂xj ∂ti
35
2.5 Plano tangente e recta normal a uma superfı́cie
A regra da cadeia permite-nos demonstrar a seguinte propriedade geométrica do vector gradiente.
Teorema 2.44 Sejam f : D ⊆ R2 → R uma função de classe C 1 , (x0 , y0 ) ∈ int D e k = f (x0 , y0 ).

Suponhamos que a curva de nı́vel da função f que passa em (x0 , y0 ), Ck = {(x, y) ∈ D : f (x, y) = k},
é a imagem da linha parametrizada γ : I ⊆ R → R2 , γ(t) = (x(t), y(t)), onde γ é diferenciável,
γ(t0 ) = (x0 , y0 ) para algum t0 ∈ I e γ 0 (t0 ) 6= (0, 0). Então tem-se
∇f (x0 , y0 ) · γ 0 (t0 ) = 0.
Nas condições do teorema anterior, dizemos que o vector ∇f (x0 , y0 ) é ortogonal (ou normal) à
curva de nı́vel Ck que passa no ponto (x0 , y0 ). Assim, se ∇f (x0 , y0 ) 6= (0, 0), uma equação da recta
tangente a esta curva no ponto γ(t0 ) = (x0 , y0 ) é dada por ∇f (x0 , y0 ) · (x − x0 , y − y0 ) = 0.
Este resultado pode ser generalizado para uma superfı́cie de nı́vel em R3 ,
Ck = {(x, y, z) ∈ D : F (x, y, z) = k} .
Neste caso, o mesmo argumento usado para demonstrar o teorema anterior, permite mostrar que o
vector n = ∇F (x0 , y0 , z0 ), para cada ponto (x0 , y0 , z0 ) pertencente a Ck , é ortogonal ao vector tangente
a qualquer curva diferenciável da superfı́cie Ck que passa por (x0 , y0 , z0 ). Por esse motivo dizemos que
o vector n é um vector normal à superfı́cie de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ). Estas
considerações motivam as definições que se seguem.
Definição 2.45 Seja F : D ⊆ R3 → R uma função de classe C 1 e seja (x0 , y0 , z0 ) um ponto perten-
cente à superfı́cie de nı́vel k de F tal que ∇F (x0 , y0 , z0 ) 6= (0, 0, 0). O plano tangente à superfı́cie
de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ) é o plano de equação
∇F (x0 , y0 , z0 ) · ((x, y, z) − (x0 , y0 , z0 )) = 0.
O vector n = ∇F (x0 , y0 , z0 ) (ou qualquer múltiplo deste) diz-se um vector normal à superfı́cie no
mesmo ponto.
36
É fácil ver que o plano tangente à superfı́cie esférica de equação x2 + y 2 + z 2 = a2 num ponto
(x0 , y0 , z0 ) é dado por 2x0 (x − x0 ) + 2y0 (y − y0 ) + 2z0 (z − z0 ) = 0 ⇔ xx0 + yy0 + zz0 = a2 .
Definição 2.46 A recta normal à superfı́cie de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ) dessa
superfı́cie é a recta que passa em (x0 , y0 , z0 ) e que tem a direcção do vector não nulo ∇F (x0 , y0 , z0 ).
Assim, as equações paramétricas da recta normal são

 x = x0 + Fx (x0 , y0 , z0 ) t

y = y0 + Fy (x0 , y0 , z0 ) t
 z = z + F (x , y , z ) t, t ∈ R.

0 z 0 0 0
No caso particular em que a superfı́cie F (x, y, z) = k pode ser escrita na forma z = g(x, y) (na
próxima secção veremos algumas circunstâncias em que isto acontece) o respectivo plano tangente, no
ponto (x0 , y0 , z0 ), é dado por
z − z0 = gx (x0 , y0 )(x − x0 ) + gy (x0 , y0 )(y − y0 ),
e as equações paramétricas da recta normal são

 x = x0 + gx (x0 , y0 ) t

y = y0 + gy (x0 , y0 ) t
 z = z − t, t ∈ R.

0
Exemplos. 1) Escrever equações do plano tangente e da recta normal à superfı́cie dada por
z = 3x2 + y 2 no ponto (1, 2, 7).
Pondo g(x, y) = 3x2 + y 2 , a superfı́cie consiste no conjunto dos pontos (x, y, z) que satisfazem
z = g(x, y), ou seja, é o gráfico de g. Como gx = 6x, gx (1, 2) = 6, gy = 2y, gy (1, 2) = 4, o plano
tangente pedido é o plano de equação
z − 7 = 6(x − 1) + 4(y − 2) ⇔ 6x + 4y − z = 7.
O vector n = (gx (1, 2), gy (1, 2), −1) = (6, 4, −1) é normal à referida superfı́cie no ponto (1, 2, 7) pelo
que a recta normal tem equações paramétricas

 x = 1 + 6t

y = 2 + 4t
 z = 7 − t, t ∈ R.

2) Determinar o plano tangente ao cone elı́ptico x2 + 4y 2 = z 2 no ponto (3, 2, 5).

O cone em causa é a superfı́cie de nı́vel c = 0 da função F (x, y, z) = x2 + 4y 2 − z 2 . Uma vez que
∇F (x, y, z) = (2x, 8y, −2z), tem-se que ∇F (3, 2, 5) = (6, 16, −10) pelo que o plano tangente pedido é
dado por
∇F (3, 2, 5) · (x − 3, y − 2, z − 5) = 0 ⇔ 6(x − 3) + 16(y − 2) − 10(z − 5) = 0
⇔ 3x + 8y − 5z = 0.
37
Terminamos esta secção com uma consequência do Teorema de Lagrange.
Teorema 2.47 (Teorema do Valor Médio) Seja f : D ⊆ Rn → R uma função contı́nua no aberto
D, e sejam a, b ∈ D tais que D contém o segmento de recta de extremidades a e b, ou seja, todos
os pontos da forma x = a + t(b − a), t ∈ [0, 1]. Se f é diferenciável em todos os pontos de S =
{x ∈ Rn : x = a + t(b − a), 0 < t < 1}, então existe um ponto c ∈ S tal que
f (b) − f (a) = ∇f (c) · (b − a).
Um conjunto D diz-se convexo se, para quaisquer a, b ∈ D, o segmento de recta de extremidades
a e b estiver contido em D.
conjunto convexo conjunto não convexo
Não é difı́cil mostrar que as bolas (abertas ou fechadas) são conjuntos convexos. É imediato que
qualquer conjunto convexo é conexo por arcos, pois dois quaisquer pontos podem ser ligados por um
segmento de recta contido no conjunto, mas o recı́proco é falso. Por exemplo, uma coroa circular é
um conjunto conexo por arcos que não é convexo.
Algumas funções regulares definidas em conjuntos convexos têm propriedades semelhantes às das
funções reais de variável real, como é ilustrado pelo resultado anterior. Assim, é consequência do
Teorema do Valor Médio que, se D ⊆ Rn é um aberto convexo e se f : D → R é uma função
diferenciável cujas derivadas parciais de primeira ordem se anulam em todos os pontos de D, então f
é constante em D.
2.6 Teorema da função implı́cita
Consideremos a função f (x, y) = x2 + y 2 − 25 e o seu conjunto de nı́vel C0 que é a circunferência

de centro na origem e raio 5 dada pela equação x2 + y 2 = 25. Note-se que nem sempre para cada
x ∈ [−5, 5] esta equação define uma única função y = g(x). Por√ exemplo, se x = 4 há dois valores
de y que verificam x2 + y 2 = 25: y = 3 e y = −3, pois y = ± 25 − x2 . No entanto, restringindo,
por exemplo, x ∈ ] − 5, 5[ e y ∈ ]0, 5[, uma vez que neste último intervalo se tem y > 0,√podemos
resolver univocamente a equação dada em ordem a y e obtemos como única solução y = 25 − x2 .
Por outras palavras, neste caso, dado o ponto (4, 3), o conjunto de nı́vel C0 contém o gráfico de uma
função y = g(x), passando por (4, 3) e definida para x pertencente a uma certa vizinhança de x = 4.
A questão a que queremos dar resposta nesta secção é a de saber em que condições sobre uma
certa função f se pode garantir que, dado um ponto P pertencente ao conjunto de nı́vel 0 de f , este
conjunto contém o gráfico de uma certa função passando por P .
Contrariamente ao exemplo anterior, em geral, a partir duma equação da forma f (x, y) = 0 pode
não ser possı́vel obter uma fórmula explı́cita para y como função de x (ou de x como função de y).
Por exemplo, não é possı́vel resolver a equação
xy + ex log y − x sin y = 0
em ordem a y, nem em ordem a x.
Veremos de seguida em que condições é que uma equação da forma f (x1 , x2 , . . . , xn ) = 0 define
implicitamente uma das variáveis como função das restantes e, apesar de em geral não ser possı́vel
explicitar tal função, veremos como calcular as suas derivadas (parciais).
38
Teorema 2.48 (Teorema da Função Implı́cita - Caso de uma Equação) Seja
f : D ⊆ Rn × R → R
(x, y) 7→ f (x, y),
onde x = (x1 , x2 , . . . , xn ), uma função definida num aberto D ⊆ Rn × R e seja (x0 , y0 ) ∈ D. Suponha-
mos que
1. f ∈ C 1 (D);
2. f (x0 , y0 ) = 0;
∂f
3. (x0 , y0 ) 6= 0.
∂y
Então existem ε > 0, uma função g : Bε (x0 ) ⊆ Rn → R e um aberto W de Rn × R, com
(x0 , y0 ) ∈ W ⊆ D, tais que:
a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (x0 );
b) se (x, y) ∈ W e f (x, y) = 0, então x ∈ Bε (x0 ) e y = g(x);
c) g ∈ C 1 (Bε (x0 )).
Nestas condições dizemos que a equação f (x, y) = 0 define implicitamente y como função de x numa
vizinhança do ponto (x0 , y0 ), e à função g, tal que y = g(x), chamamos função implı́cita.
Neste resultado, uma das variáveis da equação f (x, y) = 0 tem um papel de destaque face às
outras. A essa variável, no enunciado do teorema, damos o nome y e, por comodidade, aparece em
último lugar na expressão de f .
Nas condições anteriores, pode-se ainda provar que, se f ∈ C k (D), k ≥ 1, então g ∈ C k (Bε (x0 )).
O teorema anterior mostra assim que o conjunto de nı́vel C0 = {(x, y) ∈ D : f (x, y) = 0} contém o
gráfico de uma certa função y = g(x), definida para x ∈ Bε (x0 ), que passa pelo ponto (x0 , y0 ), isto é,
tal que g(x0 ) = y0 . Portanto, a solução (x0 , y0 ) da equação f (x, y) = 0 não é uma solução isolada.
Apesar de, na maior parte dos casos, não ser possı́vel explicitar a função g, o teorema fornece um
método que nos permite calcular as suas derivadas (parciais). No caso n = 1, vejamos como calcular
g 0 (x) para x ∈ Bε (x0 ): por a) tem-se
F (x) = f (x, g(x)) = 0, ∀x ∈ Bε (x0 )
pelo que F 0 (x) = 0. Pela regra de derivação da função composta, vem
∂f ∂f
F 0 (x) = (x, g(x)) + (x, g(x))g 0 (x)
∂x ∂y
donde
∂f
(x, g(x))
g (x) = − ∂x
0
∂f
(x, g(x))
∂y
∂f
desde que (x, g(x)) 6= 0, o que acontece numa vizinhança de (x0 , y0 ) pela hipótese 3 e por continui-
∂y
dade das derivadas parciais de f , já que f ∈ C 1 (D).
No caso n > 1 um raciocı́nio análogo permite determinar expressões para as derivadas parciais da
função g.
39
Note-se que o teorema anterior nos dá um resultado local: a função g que se afirma existir está
definida numa vizinhança do ponto x0 , se alterarmos o ponto (x0 , y0 ) a função também pode variar.
Voltando ao exemplo da circunferência x2 + y 2 = 25, vimos que se x ∈ ] − 5, 5[ e y ∈ ]0, 5[, então
p
y = g(x) = 25 − x2 .
No entanto, se x ∈ ] − 5, 5[ e y ∈ ] − 5, 0[ tem-se
p
y = h(x) = − 25 − x2 ,
uma vez que y < 0.

Observemos ainda que o teorema da função implı́cita é aplicável e permite definir univocamente y
como função de x numa vizinhança de qualquer ponto da circunferência à excepção dos pontos (5, 0) e
∂f
(−5, 0) onde, sendo f (x, y) = x2 + y 2 − 25, a derivada se anula. Neste caso, para além do teorema
∂y
não ser aplicável, é impossı́vel resolver a equação x2 + y 2 = 25 univocamente em ordem a y, como
função de x, na vizinhança destes pontos. De facto, qualquer aberto W contendo (5, 0) contém pontos
(x, y) com y > 0 e outros com y < 0. Assim, a intersecção da circunferência com o conjunto W não
pode ser o gráfico de uma função y = ϕ(x), definida para x pertencente a um intervalo da forma
]5 − ε, 5 + ε[, ε > 0. Com efeito, neste intervalo terı́amos pontos sem imagem, e outros com duas
imagens por meio de ϕ, uma vez que, para o mesmo valor de √ x, há uma solução
√ de f (x, y) = 0 com
y > 0 e outra com y < 0, pelo que é impossı́vel escolher entre 25 − x2 e − 25 − x2 . Portanto, não
é possı́vel escrever univocamente y como função de x (mas pode-se escrever x como função de y...).
Um raciocı́nio análogo é válido para o ponto (−5, 0).
∂f ∂f
A condição (x0 , y0 ) 6= 0 no teorema anterior é apenas suficiente. Se (x0 , y0 ) = 0 nada se
∂y ∂y
pode concluir quanto à existência de função implı́cita. Por exemplo, se
f (x, y) = (y − x)2 ,
∂f
tem-se (0, 0) = 0, e a equação (y − x)2 = 0 define claramente a função y = x. Por outro lado,
∂y
também para
f (x, y) = x2 + y 2
∂f
se tem (0, 0) = 0, mas, neste caso, a equação x2 +y 2 = 0 não define y como função de x em qualquer
∂y
aberto de R que contenha o ponto x = 0 porque (0, 0) é a única solução da equação x2 + y 2 = 0.
Neste caso o conjunto de nı́vel 0 de f é constituı́do por um único ponto, C0 = {(0, 0)}, e, portanto,
não contém o gráfico de qualquer função definida numa vizinhança de x = 0.
Exemplo. Mostremos que a equação xy + ex + log y − 1 = 0 define implicitamente uma função

y = g(x) numa vizinhança do ponto (x, y) = (0, 1) e calculemos g 0 (0) e g 00 (0).
Consideremos a função f (x, y) = xy + ex + log y − 1. Então f é de classe C 1 (D), onde D é o aberto
de R dado por D = (x, y) ∈ R2 : y > 0 , f (0, 1) = 0 e fy (0, 1) = 1 6= 0. Assim, pelo Teorema da
2

Função Implı́cita, concluimos que existem ε > 0, uma função g : Bε (0) → R e um aberto W ⊆ R2 tal
que (0, 1) ∈ W ⊆ D, verificando as seguintes condições:
a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (0),
b) se (x, y) ∈ W e f (x, y) = 0 então x ∈ Bε (0) e y = g(x),
c) g ∈ C 1 (Bε (0)),
ou seja, a equação f (x, y) = 0 define implicitamente y = g(x) numa vizinhança do ponto (x, y) = (0, 1).
40
De facto, sabemos que f ∈ C ∞ (D), pelo que a função g também é de classe C ∞ em Bε (0). Assim,
g tem derivadas de qualquer ordem em Bε (0). Uma vez que para cada x ∈ Bε (0) se tem
f (x, g(x)) = 0 ⇔ xg(x) + ex + log(g(x)) − 1 = 0,
para calcularmos g 0 (x) derivamos esta igualdade em ordem a x usando a regra da cadeia. Obtemos
g 0 (x)
g(x) + xg 0 (x) + ex + = 0. (9)
g(x)
Substituindo x = 0 e y(0) = g(0) = 1 em (9) vem g 0 (0) = −2.

Aplicando novamente a regra da derivação da função composta para derivar a equação (9) temos
g 00 (x)g(x) − g 0 (x)g 0 (x)

g 0 (x) + g 0 (x) + xg 00 (x) + ex + = 0,
g 2 (x)
donde, substituindo novamente x = 0, g(0) = 1, e ainda, g 0 (0) = −2, obtemos o valor de g 00 (0):
2g 0 (0) + 1 + g 00 (0) − (g 0 (0))2 = 0 ⇔ g 00 (0) = 7.
O Teorema da Função Implı́cita pode-se generalizar ao caso em que temos um sistema de m

equações.
Teorema 2.49 (Teorema da Função Implı́cita - Caso Geral) Seja
f : D ⊆ Rn+m → Rm
(x, y) 7→ f (x, y) = (f1 (x, y), . . . , fm (x, y)),
onde x = (x1 , . . . , xn ) ∈ Rn e y = (y1 , . . . , ym ) ∈ Rm , uma função definida num aberto D ⊆ Rn+m e

seja (x0 , y0 ) ∈ D, com x0 ∈ Rn e y0 ∈ Rm . Suponhamos que
1. f ∈ C 1 (D);

 f1 (x0 , y0 ) = 0

2. f (x0 , y0 ) = 0 ⇔ ..
 .
fm (x0 , y0 ) = 0;

∂(f1 , . . . , fm )
3. (x0 , y0 ) 6= 0.
∂(y1 , . . . , ym )
Então existem ε > 0, uma função g : Bε (x0 ) ⊆ Rn → Rm e um aberto W de Rn+m , com
(x0 , y0 ) ∈ W ⊆ D, tais que:
a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (x0 );
b) se (x, y) ∈ W e f (x, y) = 0, então x ∈ Bε (x0 ) e y = g(x);
c) g ∈ C 1 (Bε (x0 )).
Nestas condições dizemos que o sistema de equações f (x, y) = 0 define implicitamente y como função
de x numa vizinhança do ponto (x0 , y0 ), e à função g, tal que
y = (y1 , . . . , ym ) = g(x) = (g1 (x1 , . . . , xn ), . . . , gm (x1 , . . . , xn )),
chamamos função implı́cita.
41
Tal como no caso m = 1, pode-se ainda provar que, se f ∈ C k (D), k ≥ 1, então g ∈ C k (Bε (x0 )).
O teorema anterior mostra que a solução (x0 , y0 ) da equação f (x, y) = 0 não é uma solução isolada
pois faz parte de um conjunto de soluções da forma (x, g(x)) ∈ Rn × Rm , que corresponde ao gráfico
de uma certa função y = g(x), que passa pelo ponto (x0 , y0 ), isto é, tal que g(x0 ) = y0 .
Nas condições mencionadas, fica assim garantida a existência de uma função y = g(x), definida
implicitamente em Bε (x0 ) pela equação f (x, y) = 0, isto é, o sistema de m equações

 f1 (x1 , . . . , xn , y1 , . . . , ym ) = 0

..
 .
fm (x1 , . . . , xn , y1 , . . . , ym ) = 0

permite definir as m funções seguintes, dependendo das restantes n variáveis,


 y1 = g1 (x1 , . . . , xn )

..
 .
ym = gm (x1 , . . . , xn ).

Apesar de, em geral, não ser possı́vel explicitar estas m funções pode-se, tal como anteriormente,
derivar implicitamente, usando a regra da cadeia, as equações do sistema para obter as derivadas
(parciais) destas funções. Após a derivação, o sistema de equações obtido é um sistema linear nas
derivadas (parciais), que, atendendo à hipótese 3, é um sistema de Cramer, e que pode, portanto, ser
resolvido pela regra de Cramer.
Exemplo. Verifiquemos que, numa vizinhança do ponto (x, y, t) = (0, 0, 0), o sistema de equações

 x+y+t=0

(10)
 x3 + sin y − sin t = 0

define implicitamente uma linha parametrizada γ(t) = (x(t), y(t)) e determinemos uma equação da
recta tangente ao traço de γ no ponto γ(0) = (0, 0).
Consideremos a função f : R3 → R2 dada por
f (x, y, t) = (f1 (x, y, t), f2 (x, y, t)) = (x + y + t, x3 + sin y − sin t).
Então f ∈ C ∞ (R3 ) uma vez que as suas funções componentes são soma de funções polinomiais e
trigonométricas, em particular f ∈ C 1 (R3 ), e f (0, 0, 0) = (0, 0), ou seja, o ponto (0, 0, 0) é solução
do sistema (10). Vejamos que o jacobiano de f1 e de f2 relativamente às variáveis x e y no ponto
(x, y, t) = (0, 0, 0) é não nulo:
∂f1 ∂f1
 
   
 ∂x ∂y  1 1 1 1
∂(f1 , f2 )  
(0, 0, 0) = det  = det  = det   = 1 6= 0.
    
∂(x, y)   
 ∂f2 ∂f2  3x2 cos y (0,0,0)
0 1
∂x ∂y (0,0,0)
Assim, o Teorema da Função Implı́cita garante que o sistema (10) define implicitamente x e y como
funções de t, numa vizinhança do ponto (x, y, t) = (0, 0, 0), ou seja, define uma linha parametrizada
γ(t) = (x(t), y(t)) para t pertencente a um certo intervalo I =] − ε, ε[.
Derivando, em ordem a t, as equações do sistema

 x(t) + y(t) + t = 0

 x3 (t) + sin y(t) − sin t = 0


42
obtemos 
0 0
 x (t) + y (t) + 1 = 0

 3x2 (t)x0 (t) + cos y(t)y 0 (t) − cos t = 0


donde, substituindo t = 0 e x(0) = 0, y(0) = 0, vem

 
0 0 0
 x (0) + y (0) + 1 = 0
  x (0) = −2

⇔
 y 0 (0) − 1 = 0
  y 0 (0) = 1.

O vector γ 0 (0) = (x0 (0), y 0 (0)) = (−2, 1) é tangente ao traço de γ no ponto γ(0) = (0, 0) pelo que uma
equação da recta tangente à curva γ(I) no ponto γ(0) = (0, 0) é x + 2y = 0.
2.7 Fórmula de Taylor
De modo a generalizarmos a fórmula de Taylor para funções de mais de uma variável começamos por
ver como calcular derivadas, segundo um vector, de ordem superior à primeira.
Consideremos uma função f : D ⊆ R2 → R, de classe C 2 no conjunto aberto D, e seja u = (u1 , u2 )
um vector de R2 . Como f é diferenciável em D, sabemos que f tem derivada segundo o vector u em
qualquer ponto (x, y) ∈ D e tem-se
∂f ∂f
fu0 (x, y) = ∇f (x, y) · u = u1 + u2 .
∂x ∂y
A função assim obtida, fu0 : D ⊆ R2 → R, sendo de classe C 1 em D, pode por sua vez ser derivada,
em qualquer ponto (x, y) ∈ D, segundo qualquer vector de R2 . Em particular, podemos calcular (fu0 )0u
que denotamos por fu00 . Tem-se assim,
∂2f 2 ∂2f ∂2f 2

fu00 = ∇fu0 (x, y) · u = u + 2 u u
1 2 + u ,
∂x2 1 ∂x∂y ∂y 2 2
uma vez que, por f ser de classe C 2 , as suas derivadas parciais mistas de segunda ordem são iguais.
Pondo em evidência o operador de derivação podemos escrever
!
∂2 2 ∂2 ∂2
fu00 = 2
u1 + 2 u1 u2 + 2 u22 f,
∂x ∂x∂y ∂y
ou, simbolicamente,
2
∂ ∂

fu00 = u1 + u2 f.
∂x ∂y
Analogamente, se m ∈ N e f : D ⊆ R2 → R é de classe C m no conjunto aberto D podemos
calcular a sua derivada de ordem m, segundo o vector u = (u1 , u2 ) de R2 . Usando a notação simbólica,
introduzida no caso m = 2, escrevemos
m
∂ ∂

fu(m) = u1 + u2 f
∂x ∂y
e, mais geralmente, se f : D ⊆ Rn → R é de classe C m no conjunto aberto D tem-se
m
∂ ∂

fu(m) = u1 + . . . + un f,
∂x1 ∂xn
onde u = (u1 , . . . , un ) ∈ Rn .
43
Exemplos 2.50 Seja f : D ⊆ Rn → R uma função de classe C m no conjunto aberto D.
∂f ∂2f (m) ∂mf
1. Se ei é o i-ésimo vector da base canónica de Rn , então fe0 i = , fe00i = , ... , fei = .
∂xi 2
∂xi ∂xm
i
0 = λf 0 . É simples verificar que se tem f 00 = λ2 f 00 , ... ,

2. Se u ∈ Rn e λ ∈ R já vimos que fλu u λu u
(m) (m)
fλu = λm fu .
Exemplo. Sendo f : R2 → R a função polinomial dada por f (x, y) = 1 + 3x2 + xy + y 2 + x3 , e

u = (1, −1), calculemos fu0 (1, 2), fu00 (1, 2) e fu000 (1, 2).
Comecemos por calcular as derivadas parciais de f até à ordem três:
fx = 6x + y + 3x2 , fy = x + 2y,
fxx = 6 + 6x, fxy = 1, fyy = 2,
fxxx = 6, fyxx = 0, fxyy = 0, fyyy = 0.

Assim,
fu0 (1, 2) = fx (1, 2)u1 + fy (1, 2)u2 = 11 − 5 = 6,
fu00 (1, 2) = fxx (1, 2)u21 + 2fxy (1, 2)u1 u2 + fyy (1, 2)u22 = 12 − 2 + 2 = 12,
fu000 (1, 2) = fxxx (1, 2)u31 + 3fxyy (1, 2)u1 u22 + 3fxxy (1, 2)u21 u2 + fyyy (1, 2)u32 = 6.
Vimos na secção 2.3 que se uma função f : D ⊆ R2 → R é diferenciável num ponto (a, b) do
interior de D, então f (x, y) pode ser aproximada pela função polinomial
P1 (x, y) = f (a, b) + fx (a, b)(x − a) + fy (a, b)(y − b)
cujo gráfico é um plano que passa no ponto (a, b, f (a, b)) pertencente também ao gráfico de f .
Mostrámos ainda que este plano é o que melhor aproxima o gráfico de f em pontos (x, y) próximos de
f (x, y) − P1 (x, y)
(a, b) uma vez que lim = 0. Note-se que o polinómio P1 é o único polinómio
(x,y)→(a,b) k(x − a, y − b)k
de grau inferior ou igual a 1 que satisfaz as seguintes condições:
∂P1 ∂f ∂P1 ∂f
P1 (a, b) = f (a, b), (a, b) = (a, b), (a, b) = (a, b).
∂x ∂x ∂y ∂y
O nosso objectivo é estender estas ideias ao caso em que queremos aproximar uma função de várias
variáveis por polinómios de grau maior ou igual a 1.
Recordemos a fórmula de Taylor para funções reais de variável real. Sejam I um intervalo de R e
f : I → R uma função de classe C m+1 em I. Então, para quaisquer x, a ∈ I, tem-se
f (x) = Pm (x) + Rm (x)
onde
f 00 (a) f (m) (a)
Pm (x) = f (a) + f 0 (a)(x − a) + (x − a)2 + . . . + (x − a)m
2! m!
e Rm (x) = o((x − a)m ), (x → a), isto é,
Rm (x)
lim = 0.
x→a (x − a)m
44
Ao polinómio Pm demos o nome de polinómio de Taylor de ordem m de f em torno do ponto a, e
vimos a seguinte expressão para Rm , a que chamámos resto de Lagrange,
f (m+1) (c)
Rm (x) = (x − a)m+1 ,
(m + 1)!
onde o ponto c está entre a e x. Escrevendo x = a + h tem-se
f 00 (a) 2 f (m) (a) m f (m+1) (c) m+1
f (a + h) = f (a) + f 0 (a)h + h + ... + h + h ,
2! m! (m + 1)!
f (m+1) (c) m+1

onde c está entre a e a + h e h = o(hm ), (h → 0).
(m + 1)!
Vejamos agora a generalização para funções de n variáveis.
Teorema 2.51 Sejam f : D ⊆ Rn → R, uma função de classe C m+1 no aberto D, e a ∈ D. Então

para todo h ∈ Rn tal que a + h ∈ D, existe um ponto ch , pertencente ao segmento de recta de
extremidades a e a + h, tal que
1 00 1 (m) 1 (m+1)
f (a + h) = f (a) + fh0 (a) + fh (a) + . . . + fh (a) + fh (ch ).
2! m! (m + 1)!
Ao polinómio de grau inferior ou igual a m dado no teorema anterior, cujas variáveis são as
componentes h1 , h2 , . . . , hn do vector h,
1 00 1 (m)
Pm (h) = f (a) + fh0 (a) + fh (a) + . . . + f (a)
2! m! h
damos o nome de polinómio de Taylor de ordem m de f em torno do ponto a e à expressão
1 (m+1)
Rm (h) = f (ch )
(m + 1)! h
chamamos resto de Lagrange de ordem m, tendo-se Rm (h) = o(khkm ), (h → 0), isto é,
Rm (h)
lim = 0.
h→0 khkm
Para o que se segue, será particularmente útil o caso m = 2 onde

n
1 00 1 X ∂2f
P2 (h) = f (a) + fh0 (a) + fh (a) = f (a) + ∇f (a) · h + (a)hi hj
2! 2 i,j=1 ∂xi ∂xj
e f (a + h) = P2 (h) + o(khk2 ), (h → 0).
Exemplo. Determinemos um polinómio de grau dois que, numa vizinhança do ponto (0, 0),
aproxime a função f (x, y) = exy+y a menos de o(k(x, y)k2 ), (x, y) → (0, 0).
Pelo que foi exposto, temos que determinar o polinómio de Taylor de segunda ordem de f , em
torno do ponto (0, 0). De acordo com as notações acima temos a = (0, 0), a + h = h = (x, y) e
pretendemos calcular P2 (x, y). Para esse efeito, começamos por calcular f (0, 0) e as derivadas parciais
de primeira e de segunda ordem de f , no ponto (0, 0).
f (0, 0) = 1, fx = yexy+y , fx (0, 0) = 0, fy = (x + 1)exy+y , fy (0, 0) = 1,
fxx = y 2 exy+y , fxy = exy+y + y(x + 1)exy+y , fyy = (x + 1)2 exy+y ,

fxx (0, 0) = 0, fxy (0, 0) = 1, fyy (0, 0) = 1.
45
0
Daqui resulta que f(x,y) (0, 0) = ∇f (0, 0) · (x, y) = y e
00
f(x,y) (0, 0) = fxx (0, 0)x2 + 2fxy (0, 0)xy + fyy (0, 0)y 2 = 2xy + y 2 ,
donde
0 1 00 1 y2
P2 (x, y) = f (0, 0) + f(x,y) (0, 0) + f(x,y) (0, 0) = 1 + y + (2xy + y 2 ) = 1 + y + xy + .
2 2 2
2.8 Extremos locais e absolutos
Nesta secção vamos estender ao caso das funções reais de várias variáveis as noções de máximos e
mı́nimos locais e absolutos.
Definição 2.52 Seja f : D ⊆ Rn → R e seja a ∈ D. A função f tem um máximo (respectivamente,

um mı́nimo) local ou relativo no ponto a se existe uma vizinhança Bε (a) (ε > 0) do ponto a tal
que
f (a) ≥ f (x), ∀x ∈ Bε (a) ∩ D
(respectivamente, f (a) ≤ f (x), ∀x ∈ Bε (a) ∩ D). Em qualquer destes casos dizemos que f tem um
extremo local ou relativo no ponto a.
O facto de uma função ter um extremo local num ponto a depende do comportamento da função
numa vizinhança de a. Os extremos absolutos de f dependem do comportamento da função em
todo o seu domı́nio.
Definição 2.53 Seja f : D ⊆ Rn → R e seja a ∈ D. A função f tem um máximo (respectivamente,

um mı́nimo) absoluto no ponto a se
f (a) ≥ f (x), ∀x ∈ D
(respectivamente, f (a) ≤ f (x), ∀x ∈ D). Em qualquer destes casos dizemos que f tem um extremo
absoluto no ponto a.
Claro que se f tem um extremo absoluto em a também tem um extremo local nesse ponto, mas o
recı́proco é falso.
No caso das funções reais de variável real sabemos que se f tem um extremo local em a pertencente
ao interior do domı́nio, então f 0 (a) = 0 ou f 0 (a) não existe. O resultado análogo para funções de mais
de uma variável é dado em termos de ∇f .
Teorema 2.54 (Fermat) Se a função f : D ⊆ Rn → R tem um extremo local no ponto a ∈ intD,

então ∇f (a) = 0 ou ∇f (a) não existe.
46
Definição 2.55 Chama-se ponto crı́tico de uma função f : D ⊆ Rn → R a um ponto c do interior
de D para o qual ∇f (c) = 0.
O teorema anterior diz-nos que os únicos pontos, interiores ao domı́nio, onde uma função dife-
renciável f pode atingir extremos locais são os pontos crı́ticos. Note-se, no entanto, que nem todos
os pontos crı́ticos correspondem a extremos locais. Por exemplo, é fácil verificar que o ponto (0, 0) é
ponto crı́tico de ambas as funções f (x, y) = x2 + y 2 e g(x, y) = x2 − y 2 . No primeiro caso, f (0, 0) = 0
é claramente mı́nimo de f mas g não atinge um extremo em (0, 0) uma vez que g(0, 0) = 0 e qualquer
vizinhança de (0, 0) contém pontos onde g > 0 e outros onde g < 0.
Definição 2.56 Chama-se ponto de sela a um ponto crı́tico de f onde não é atingido um extremo
local.
Assim, no exemplo da função g anterior, (0, 0) é ponto de sela.
Se uma função real de variável real é diferenciável e atinge um extremo local no ponto x0 interior
ao domı́nio, então a recta tangente ao gráfico de f no ponto (x0 , y0 ), onde y0 = f (x0 ), é horizontal.
Analogamente, resulta do Teorema 2.54 que se f : D ⊆ R2 → R é diferenciável e atinge um extremo
local no ponto (x0 , y0 ) interior ao domı́nio D, então o plano tangente à superfı́cie z = f (x, y) no ponto
(x0 , y0 , z0 ), onde z0 = f (x0 , y0 ), é horizontal. Com efeito, como neste caso se tem ∇f (x0 , y0 ) = (0, 0),
o referido plano tangente é dado por
∂f ∂f
z − z0 = (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) ⇔ z = z0 .
∂x ∂y
O mesmo é válido se (x0 , y0 ) é ponto de sela de f .
Uma vez que pode haver pontos crı́ticos que são pontos de sela, interessa ter um critério que nos
permita determinar se num certo ponto crı́tico é atingido um extremo local. Veremos agora como dar
resposta a esta questão usando a fórmula de Taylor de segunda ordem. Recordemos que se f é uma
função real de variável real duas vezes diferenciável tal que f 0 (a) = 0, então f tem um mı́nimo local
em a se f 00 (a) > 0 e f tem um máximo local em a se f 00 (a) < 0. Este resultado generaliza-se a funções
de várias variáveis do seguinte modo.
Teorema 2.57 Seja f : D ⊆ Rn → R uma função de classe C 2 (D) e seja a um ponto crı́tico de f .
Então
1. se fh00 (a) > 0, para todo o vector não nulo h ∈ Rn , f tem um mı́nimo local em a;
2. se fh00 (a) < 0, para todo o vector não nulo h ∈ Rn , f tem um máximo local em a;
3. se fh00 (a) toma valores positivos e negativos para diferentes vectores h ∈ Rn , então a é um ponto
de sela de f .
47
Para aplicarmos o teorema anterior temos então que estudar o sinal da forma quadrática h 7→ fh00 (a),
ou seja, do polinómio do segundo grau nas variáveis h1 , h2 , . . . , hn dado por
n
∂2f
(a)hi hj = fh00 (a)
X
Q(h) = Q(h1 , . . . , hn ) =
i,j=1
∂xi ∂xj
e que se pode escrever matricialmente na forma

 
h1
h i 
 h2 

Q(h) = h1 h2 . . . h n Hf (a)  .. ,
.
 
 
hn
onde Hf (a) é a matriz dada por
∂2f ∂2f ∂2f
 
∂x21 ∂x1 ∂x2 ... ∂x1 ∂xn
 
 
 
 ∂2f ∂2f ∂2f 
 ∂x2 ∂x1

∂x22
... ∂x2 ∂xn
 " #
 ∂2f
Hf (a) =  = (a) .
 


.. .. .. ..  ∂xi ∂xj i,j=1,...,n
.
 

 . . . 

 
 2

∂ f ∂2f ∂2f
∂xn ∂x1 ∂xn ∂x2 ... ∂x2n (a)
A esta matriz damos o nome de matriz hessiana de f no ponto a. Note-se que, sendo f uma função
de classe C 2 , a matriz hessiana é uma matriz simétrica.
Definição 2.58 Uma forma quadrática Q diz-se
1. definida positiva se Q(h) > 0, para todo o vector não nulo h;
2. definida negativa se Q(h) < 0, para todo o vector não nulo h;
3. indefinida se Q(h) toma valores positivos e valores negativos;
4. semidefinida positiva se Q(h) ≥ 0, para todo o vector h, e existe h 6= 0 tal que Q(h) = 0;
5. semidefinida negativa se Q(h) ≤ 0, para todo o vector h, e existe h 6= 0 tal que Q(h) = 0.
É conhecido da Álgebra Linear que, sendo A a matriz simétrica da forma quadrática Q,

i) se os valores próprios de A são todos positivos, então Q é definida positiva;
ii) se os valores próprios de A são todos negativos, então Q é definida negativa;
iii) se existem valores próprios de A positivos e outros negativos, então Q é indefinida.
" #
α β
No caso n = 2, se A = é a matriz simétrica de uma forma quadrática Q, e se λ1 e λ2
β γ
são os valores próprios de A, atendendo a que det A = λ1 λ2 e tr A = λ1 + λ2 , é um exercı́cio simples
verificar que
1. se α > 0 e det A > 0, então λ1 e λ2 são ambos positivos (e, portanto, Q é definida positiva);
2. se α < 0 e det A > 0, então λ1 e λ2 são ambos negativos (e, portanto, Q é definida negativa);
3. se det A < 0, então λ1 e λ2 têm sinais opostos (e, portanto, Q é indefinida).
Conjugando estes factos com as conclusões do Teorema 2.57 obtemos finalmente o seguinte resul-
tado, que generaliza ao caso das funções de duas variáveis o chamado teste da segunda derivada já
estudado para funções reais de variável real.
48
Teorema 2.59 Seja f ∈ C 2 (D) e seja (a, b) um ponto crı́tico de f . Consideremos a matriz hessiana
de f no ponto (a, b), dada por
∂2f ∂2f
 
 ∂x2 ∂x∂y 
 
Hf (a, b) = 
 

 ∂2f ∂2f
 

∂y∂x ∂y 2 (a,b)
e seja d = det Hf (a, b). Então:

i) se d < 0, (a, b) é um ponto de sela de f ;
∂2f
ii) se d > 0 e (a, b) > 0, f tem um mı́nimo local em (a, b);
∂x2
∂2f
iii) se d > 0 e (a, b) < 0, f tem um máximo local em (a, b);
∂x2
iv) se d = 0 nada se pode concluir.
∂2f ∂2f ∂2f

Notas 2.60 1) Se (a, b) = 0 obtemos d ≤ 0, uma vez que (a, b) = (a, b).
∂x2 ∂x∂y ∂y∂x
2) Consideremos as funções f (x, y) = x4 + y 4 , g(x, y) = −(x4 + y 4 ) e h(x, y) = x4 − y 4 . É fácil

de ver que (0, 0) é ponto crı́tico para todas elas e que, neste ponto, d = 0 para cada uma das
funções mencionadas. Além disso, não é difı́cil mostrar que (0, 0) é ponto de mı́nimo local de f ,
(0, 0) é ponto de máximo local de g e (0, 0) é ponto de sela de h.
Estes três exemplos mostram que nada se pode concluir no caso em que d = 0 e que a de-
terminação da natureza do ponto crı́tico em causa envolve o estudo directo da função numa
vizinhança desse ponto.
Exemplo 2.61 Vamos determinar e classificar os pontos crı́ticos da função f (x, y) = x3 − y 3 + xy.
Atendendo a que ∇f (x, y) = (3x2 + y, x − 3y 2 ), os pontos crı́ticos de f são as soluções do sistema
  
2 2 2
 3x + y = 0
  y = −3x
  y = −3x

⇔ ⇔
 x − 3y 2 = 0
  x(1 − 27x3 ) = 0
  x = 0 ∨ x = 1.

3

Obtemos assim os pontos (0, 0) e 13 , − 31 . Vamos agora classificar estes pontos crı́ticos, isto é, vamos
verificar se são pontos de máximo local, mı́nimo local ou pontos de sela. Para esse efeito usamos
o Teorema 2.59 e calculamos a matriz hessiana de f em cada um dos pontos encontrados. Como
fxx = 6x, fxy = fyx = 1 e fyy = −6y temos
   
2 1 0 1
1 1

Hf ,− = e Hf (0, 0) =  .
   
3 3

1 2 1 0

Uma vez que det Hf 13 , − 31 = 3 > 0, o ponto 31 , − 13 é um ponto de mı́nimo local de f ; dado que
det Hf (0, 0) = −1 < 0, o ponto
0) é um ponto de sela de f .
(0,
1 1
Notemos ainda que f 3 , − 3 não é mı́nimo absoluto de f pois considerando a restrição de f à
recta y = 0 tem-se
lim f (x, 0) = lim x3 = −∞.
x→−∞ x→−∞
49
Nem todas as funções admitem extremos locais. Por exemplo, a função diferenciável, de domı́nio
R2 , f (x, y) = 2x + y, cujo gráfico é o plano de equação z = 2x + y, não tem pontos crı́ticos pelo que
não tem extremos locais. Por outro lado, como vimos no Exemplo 2.61, há funções que têm extremos
locais mas não absolutos. O Teorema de Weierstrass garante a existência de extremos absolutos para
funções contı́nuas definidas em conjuntos compactos.
Teorema 2.62 (Weierstrass) Se f : D ⊆ Rn → R é contı́nua num conjunto compacto e não vazio

S ⊆ D, então f atinge um máximo e um mı́nimo absolutos em S.
Se f : S ⊆ Rn → R é uma função contı́nua definida no subconjunto compacto S, sabemos então

que f atinge um máximo e um mı́nimo absolutos em S. Estes extremos absolutos podem ser atingidos
no interior do conjunto S ou na sua fronteira. Assim, para determinarmos os extremos absolutos de
uma função diferenciável f num conjunto compacto S:
i) determinamos os pontos crı́ticos de f no interior de S;
ii) determinamos os pontos da fronteira de S que podem dar origem a extremos. No caso n = 2,
uma maneira de fazer isto é parametrizar a fronteira de S através de uma função vectorial r(t) e
reduzir o problema ao estudo da função de uma só variável f (r(t)). Veremos na próxima secção
um método alternativo para resolver este passo.
iii) Calculamos o valor de f em cada um dos pontos determinados nos passos anteriores. O maior
destes valores é o máximo absoluto de f em S, o menor é o mı́nimo absoluto.
Exemplo. Determinemos os extremos absolutos da função diferenciável f (x, y) = 2x + y no
conjunto compacto (um triângulo)
n o
S = (x, y) ∈ R2 : 0 ≤ x ≤ 1 ∧ 0 ≤ y ≤ 1 − x .
Já mencionámos que f não tem pontos crı́ticos, dado que ∇f (x, y) = (2, 1) 6= (0, 0), pelo que os
seus extremos absolutos serão necessariamente atingidos na fronteira de S que é constituı́da pelos três
segmentos de recta n o
S1 = (x, y) ∈ R2 : x = 0 ∧ 0 ≤ y ≤ 1 ,
n o
S2 = (x, y) ∈ R2 : y = 0 ∧ 0 ≤ x ≤ 1
e n o
S3 = (x, y) ∈ R2 : y = 1 − x ∧ 0 ≤ x ≤ 1 .
Dado que f (0, y) = y, o valor máximo de f em S1 é 1 e o seu valor mı́nimo neste conjunto é 0.
No segmento S2 o máximo de f é 2 e o mı́nimo é 0, pois f (x, 0) = 2x. Finalmente, no segmento S3
o valor máximo de f é 2 e o mı́nimo é 1, uma vez que f (x, 1 − x) = x + 1. Concluimos assim que os
extremos absolutos de f no conjunto S são 0 e 2.
50
Se f : D ⊆ Rn → R é uma função de classe C 2 , e D é um conjunto arbitrário, o estudo de extremos
absolutos de f pode ser uma tarefa muito difı́cil. Nestes casos, começamos por determinar os pontos
crı́ticos e identificar os extremos locais, nos casos em que o Teorema 2.59 é conclusivo. Quando o
referido teorema não permite a classificação de um ponto crı́tico, é necessário fazer um estudo directo
da função f numa vizinhança desse ponto. Também para estas funções, o método que vamos estudar
na próxima secção pode ser uma ajuda no estudo de extremos na fronteira de D.
2.9 Extremos condicionados
Veremos nesta secção como determinar extremos de uma função f : D ⊆ Rn → R no caso em que os
pontos x ∈ Rn estão sujeitos a uma condição do tipo g(x) = 0. Chama-se a isto resolver um problema
de extremos condicionados. Este problema resume-se assim a calcular os extremos da função f
restrita ao conjunto, suposto não vazio,
C = {x ∈ Rn : g(x) = 0},
notada f|C . Vamos usar o chamado método dos multiplicadores de Lagrange.
Teorema 2.63 Sejam D, E ⊆ Rn conjuntos abertos, g : E → R, f : D → R funções tais que
g ∈ C 1 (E), f ∈ C 1 (D) e E ⊆ D, e seja C = {x ∈ E : g(x) = 0}. Se f|C tem um extremo local em
x0 ∈ C e se ∇g(x0 ) não é o vector nulo, então ∇f (x0 ) e ∇g(x0 ) são paralelos, isto é, existe λ ∈ R tal
que
∇f (x0 ) = λ∇g(x0 ).
Ao escalar λ referido no teorema anterior damos o nome de multiplicador de Lagrange.
A figura que se segue ilustra geometricamente as conclusões do resultado anterior no caso n = 2.
Nela encontram-se representadas a preto algumas curvas de nı́vel da função f e a azul a curva de nı́vel
0 da função g, que designamos por C. Nas condições enunciadas, é simples verificar, por aplicação
da regra da cadeia, que se f|C tem um extremo local em (x0 , y0 ) ∈ C, então ∇f (x0 , y0 ) é ortogonal
a C no ponto (x0 , y0 ). Mas, por outro lado, como C é a curva de nı́vel 0 da função g, é sabido (cf.
Teorema 2.44) que ∇g(x0 , y0 ) é ortogonal a C no ponto (x0 , y0 ). Assim, os dois vectores ∇f (x0 , y0 ) e
∇g(x0 , y0 ) são paralelos.
Portanto, para determinarmos os extremos locais de f|C recorrendo ao Teorema 2.63, começamos
por determinar as soluções (x, λ) ∈ Rn × R do sistema
(
∇f (x) = λ∇g(x)
g(x) = 0,
os pontos onde são atingidos os extremos locais de f|C estão entre as projecções x ∈ Rn das soluções
(x, λ) ∈ Rn × R encontradas. Notamos ainda que as soluções (x, λ) do sistema anterior são os pontos
crı́ticos da função auxiliar
F (x, λ) = f (x) − λg(x).
51
Exemplo. Determinemos os extremos absolutos da função f (x, y, z) = x2 + 2y 2 − 3z 2 no conjunto
n o
S = (x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 1 .
f é claramente contı́nua e o conjunto S é a esfera de centro (0, 0, 0) e raio 1, logo é compacto, portanto
a existência de extremos absolutos de f em S é garantida pelo Teorema de Weierstrass. Começamos
por notar que
∇f (x, y, z) = (2x, 4y, −6z) = (0, 0, 0) ⇔ (x, y, z) = (0, 0, 0),
pelo que f tem um único ponto crı́tico no interior de S tendo-se f (0, 0, 0) = 0.
Procuremos agora os pontos da fronteira de S onde f pode atingir um extremo. Definindo
g(x, y, z) = x2 + y 2 + z 2 − 1, como ∇g(x, y, z) = (2x, 2y, 2z) 6= (0, 0, 0) se (x, y, z) é um ponto da
fronteira de S, o Teorema 2.63 é aplicável. Determinemos as soluções do sistema
 



2x = 2λx 


x=0∨λ=1

 

 
 

 ∇f (x, y, z) = λ∇g(x, y, z)  4y = 2λy  y =0∨λ=2

 

  
⇔ ⇔
−6z = 2λz z = 0 ∨ λ = −3

 g(x, y, z) = 0 
 


 


 


 

 
 x2 + y 2 + z 2 = 1
  x2 + y 2 + z 2 = 1.

Notemos que se λ = 1, então y = z = 0, donde x2 = 1 ⇔ x = ±1. Se λ = 2 tem-se x = z = 0

e, portanto, y 2 = 1 ⇔ y = ±1. Finalmente, se λ = −3 vem x = y = 0 e logo z 2 = 1 ⇔ z = ±1.
Interessam-nos assim os pontos (±1, 0, 0), (0, ±1, 0) e (0, 0, ±1). Determinando os valores de f nestes
pontos obtemos
f (±1, 0, 0) = 1, f (0, ±1, 0) = 2, f (0, 0, ±1) = −3.
Comparando estes valores com f (0, 0, 0) = 0, concluimos por fim que o máximo e o mı́nimo absolutos
de f em S são, respectivamente, 2 e −3.
52
3 Cálculo Integral em Rn
Introdução
O integral de Riemann que definimos para as funções reais de variável real (caso n = 1) é uma
ferramenta que permite, entre outras aplicações, calcular áreas de regiões genéricas do plano, isto
é, permite medir conjuntos em dimensão 2. Recorde-se que dada uma função real de variável real,
positiva e limitada num intervalo limitado I, o seu integral, em I, corresponde ao valor do conceito
que definimos como área da região limitada pelo gráfico da função, pelo eixo do xx e pelas rectas
verticais definidas pelos extremos de I. Também o conceito de integral múltiplo, que vamos definir,
está ligado à noção de medida, permitindo, entre outras aplicações, determinar medidas de conjuntos
em dimensão n, por exemplo, os chamados volumes para objectos em dimensão 3. A ênfase do nosso
estudo recai nos casos n = 2 e n = 3.
Para além do conceito e das suas propriedades, vamos estabelecer técnicas de cálculo de integrais
múltiplos, recorrendo ao cálculo de integrais unidimensionais. À semelhança do caso n = 1, estudare-
mos também um teorema de mudança de variável no integral múltiplo que, nalguns casos, facilita o
cálculo dos mesmos.
Os tópicos abordados neste capı́tulo inserem-se na chamada Teoria da Medida, cujo estudo rigoroso
e completo é feito em cadeiras avançadas (3.o ano da Licenciatura em Matemática). Não obstante,
faremos um estudo cuidadoso dos conceitos, direccionado para o cálculo e aplicações, recorrendo
algumas vezes à intuição e outras às provas formais, cujas ideias sejam pertinentes para a prossecução
da formação matemática dos alunos.
3.1 Definição e propriedades básicas do integral de Riemann

Dizemos que um conjunto I é um intervalo de números reais se, dados a, b ∈ I, arbitrários, e se x ∈ R
é tal que a < x < b, então x ∈ I.
Dizemos que um conjunto I é um intervalo de Rn , com n ∈ N, se I é o produto cartesiano de
n intervalos reais (abertos, fechados, semi-abertos). Se Ik = [ak , bk ] ou Ik =]ak , bk ] ou Ik =]ak , bk [ ou
Ik = [ak , bk [, e ak < bk para todo o k = 1, . . . n, o intervalo I = I1 × . . . × In diz-se não degenerado;
caso contrário diz-se degenerado (pelo menos um dos intervalos do produto cartesiano reduz-se a um
ponto), a não ser que seja o conjunto vazio.
Exemplos.
1) Em R2 os intervalos são rectângulos; exemplo I = [1, 3]×] − 2, 6].
2) Em R3 os intervalos são paralelepı́pedos; exemplo I =] − 3, 4[×]0, 3] × [2, 6[.
3) O segmento de recta [2, 6] × {0} é um intervalo degenerado de R2 .

4) O rectângulo {1} × [1, 3]×] − 2, 6] é um intervalo degenerado de R3 .
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
53
Dado um intervalo real I limitado, [a, b] ou ]a, b] ou ]a, b[ ou [a, b[, com a < b (a ≤ b, no caso
em que o intervalo é fechado), definimos a medida unidimensional de I como sendo o valor b − a,
denotamos por m1 (I), e chamamos a esse valor o comprimento de I.
Dado I = I1 × . . . × In intervalo em Rn , com Ik intervalo real limitado, k = 1, . . . , n, n ∈ N,
definimos a medida n-dimensional de I, e denotamos por mn (I), como sendo o valor
m1 (I1 ) · . . . · m1 (In ).
No caso n = 2, a m2 (I) chamamos área de I. No caso n = 3 dizemos que m3 (I) é o volume de I.
Exemplos.
1) O comprimento de [2, 6[ é m1 ([2, 6[) = 4.
2) A área de [1, 3]×] − 2, 6] é m2 ([1, 3]×] − 2, 6]) = 2 · 8 = 16.
3) O volume de ] − 3, 1[×]0, 3] × [2, 4[ é m3 (] − 3, 1[×]0, 3] × [2, 4[) = 4 · 3 · 2 = 24.
Quando não há necessidade de explicitar a dimensão na medida, em vez de mn , usamos simples-
mente m.
Observe-se que mn (I) = 0 apenas quando I é um intervalo degenerado.
Consideremos I um intervalo não degenerado e limitado de Rn , n ∈ N. Chamamos decomposição
ou partição de I a uma famı́lia finita de intervalos não degenerados de Rn , I1 , . . . , Ip , que apenas
têm em comum pontos das respectivas fronteiras (int Ij ∩ int Ik = ∅, se j 6= k, i, j = 1, . . . , p) e tais que
I = I1 ∪ . . . ∪ Ip .
I (n = 2) Uma decomposição de I
p
X
Dada uma decomposição D = {I1 , . . . , Ip } do intervalo I tem-se que m(I) = m(Ij ), k ∈ N.
j=1
Fixemos I um intervalo fechado (produto cartesiano de intervalos reais fechados), limitado e

não degenerado de Rn . Seja f : I → R uma função (campo escalar) limitada e consideremos
D = {I1 , . . . , Ip } uma decomposição de I, com p ∈ N.
Definimos as somas de Darboux inferior e superior de f relativamente a D, respectivamente,
por
p
X p
X
S(f, D) = (inf f ) mn (Ij ) e S(f, D) = (sup f ) mn (Ij ),
Ij Ij
j=1 j=1
Soma inferior Soma superior

54
e, escolhidos ξj ∈ Ij , j = 1, . . . , p, a soma de Riemann de f relativamente a D e a ξ = (ξj ) por
p
X
S(f, D, ξ) = f (ξj ) mn (Ij ).
j=1
Soma de Riemann
É imediato que
S(f, D) ≤ S(f, D, ξ) ≤ S(f, D). (11)
Como as três figuras anteriores ilustram, no caso n = 2, quando a função f é não negativa, as
somas anteriores representam a soma dos volumes dos paralelepı́pedos cujas bases são os intervalos Ij
da decomposição de I e cujas alturas são respectivamente inf Ij f , supIj f e f (ξj ), j = 1, . . . , p. Cada
um dos sólidos constituı́dos pelos paralelepı́pedos considerados em cada um dos casos anteriores é uma
aproximação da região de R3
S = {(x, y, z) : (x, y) ∈ I, 0 ≤ z ≤ f (x, y)}.
Assim, as somas consideradas são valores aproximados do volume de S, conceito que pretendemos
definir. Este é formulado a partir do conceito do integral de f, que segue as ideias do caso n = 1.
6 A ⊂ Rn , chamamos diâmetro
Comecemos por dar a definição de diâmetro de um conjunto. Seja ∅ =
de A, e representamos por diam (A), ao valor (em R)
sup kx − yk.
x,y∈A
Ilustração de diâmetros:
n=1 n=2 n=3
Considerando D = {I1 , . . . , Ip } uma decomposição de I, chamamos diâmetro da decomposição D
ao maior dos diâmetros de cada Ij , j = 1, . . . , p.
Consideremos então todas as possı́veis sucessões (Dm )m de decomposições de I com diâmetro a tender
para zero (no caso n = 1 consideram-se sucessões de partições do intervalo com comprimento a tender
para zero) e as respectivas sucessões das somas inferior e superior de Darboux: S(f, Dm ) e S(f, Dm ).
Alguns termos da sucessão das somas inferiores de Darboux da função f (x, y) = 16 − x2 − 2y 2 , em I = [0, 2] × [0, 2]
55
Dizemos que f é integrável (à Riemann), em I, se existe ` ∈ R tal que
lim S(f, Dm ) = lim S(f, Dm ) = ` ∈ R, (12)

m→+∞ m→+∞
para qualquer sucessão (Dm ) nas

Z condições descritas. Ao valor comum do limite chamamos integral
de f em I e representamos por f. Quando n > 1, referimo-nos ao integral como integral múltiplo.
I
Se f é integrável, então, atendendo a (11), vem
Z
lim S(f, Dm , ξm ) = f,
m→+∞ I
onde ξm = (ξmj ) é uma sucessão de pontos escolhidos em cada intervalo Imj da decomposição Dm de
I, m, j ∈ N. Prova-se que se o limite anterior (das somas de Riemann) existir, então também existem
os limites em (12) e estes três limites coincidem.
Se n = 2, algumas notações para o integral de f , em I, são
Z Z ZZ Z ZZ
f ou f dA ou f (x, y) dA ou f (x, y) dxdy ou f (x, y) dxdy,
I I I I I
e dizemos que temos um integral duplo. Se n = 3, algumas notações para o integral de f , em I, são
Z Z ZZZ Z ZZZ
f ou f dV ou f (x, y, z) dV ou f (x, y, z) dxdydz ou f (x, y, z) dxdydz,
I I I I I
e dizemos que temos um integral triplo. Estas notações generalizam-se para qualquer n sendo a
notação genérica Z
f dx1 dx2 . . . dxn .
I
A ordem dx1 dx2 . . . dxn , na notação anterior, em dxdy no integral duplo, e em dxdydz no integral
triplo, de uma forma geral, reflete a ordem das variáveis no sistema de coordenadas adoptado. Porém,
quando esta ordem não é referida, consideramos a ordem crescente da enumeração (x1 , x2 , . . .) ou a
ordem alfabética (x, y, . . .) das variáveis em uso.
Que funções são integráveis à Riemann? Vejamos alguns exemplos. As funções constantes são
integráveis em intervalos limitados de Rn . Considerando I = [0, 2] × [0, 2], é fácil ver que a função
(
1, (x, y) ∈ I \ {(1, 1)}
f (x, y) =
0, (x, y) = (1, 1)
é integrável em I. Com um pouco mais de trabalho, prova-se que a função

(
1, (x, y) ∈ I, x 6= y
g(x, y) =
0, (x, y) ∈ I, x = y
também é integrável em I. Observamos que a função f é descontı́nua apenas no ponto (1, 1) e que g é
descontı́nua apenas no segmento de recta {(x, x) : x ∈ [0, 2]}. Neste dois últimos casos o conjunto dos
pontos de descontinuidade das funções tem um tamanho pequeno e é por esse facto que são integráveis.
Segue-se o conceito que dá significado a esta ideia e que nos vai permitir responder à pergunta inicial.
Dizemos que A ⊂ Rn é um conjunto desprezável se para cada ε > 0 existe um número finito de
intervalos de Rn , I1 , . . . , Ip , p ∈ N, tais que
p
X
A ⊂ I1 ∪ . . . ∪ Ip e m(Ij ) < ε.
j=1
Também dizemos que A é um conjunto de medida nula e escrevemos m(A) = 0 (esta terminologia
será explicada mais adiante).
56
Exemplos e propriedades
1) ∅ é desprezável.
2) Qualquer conjunto finito é desprezável.
3) Um subconjunto de um conjunto desprezável é desprezável.
4) Se X é um conjunto é desprezável, também X (o fecho de X =int X∪ fr(X)) o é.
5) A união finita de desprezáveis é desprezável.
6) A fronteira de um intervalo de Rn é desprezável.
(A fronteira de um intervalo é a união de conjuntos desprezáveis, já que é união de intervalos degene-
rados.
Exemplo. A fronteira do intervalo (de R2 ) [1, 2] × [3, 4] é o conjunto
({1} × [3, 4]) ∪ ({2} × [3, 4]) ∪ ([1, 2] × {3}) ∪ ([1, 2] × {4}).)
7) Dados K ⊂ Rn compacto e f : K → R uma função contı́nua, então
graf f = {(x, y) ∈ Rn+1 : x ∈ K, y = f (x)}
é um conjunto desprezável.
Exemplo.
graf f = {(x, y) ∈ R2 : x ∈ [−5, 9], y = 2 + sin x}
8) Sejam a, b ∈ R, φ1 , ψ1 : [a, b] → R funções contı́nuas tais que φ1 ≤ ψ1 . Então a fronteira do conjunto

n o
(x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x)
é desprezável.
9) Sejam a, b, ∈ R, φ1 , ψ1 : [a, b] → R funções contı́nuas tais que φ1 ≤ ψ1 ,
Ω = {(x, y) : x ∈ [a, b], φ1 (x) ≤ y ≤ ψ1 (x)}, φ2 , ψ2 : Ω → R funções contı́nuas tais que φ2 ≤ ψ2 .
Então a fronteira do conjunto
n o
(x, y, z) ∈ R3 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x), φ2 (x, y) ≤ z ≤ ψ2 (x, y)
é desprezável.
10) Traços de linhas regulares em Rn são conjuntos desprezáveis. Tal como referido na definição,
dizemos que estes conjuntos têm medida nula. O comprimento de uma curva traço de uma linha secc.
C 1 , que é um valor positivo, como foi visto no Capı́tulo 1, não deve ser confundido com esta medida
(nula).
57
São válidos os resultados que se seguem.
Teorema 3.1 Sejam I um intervalo de Rn , compacto (conjunto fechado e limitado) e não vazio,
A ⊂ I um conjunto desprezável e f : IZ → R uma função limitada, tal que f (x) = 0, para todo o
x ∈ I \ A. Então f é integrável em I e f = 0.
I
Teorema 3.2 Sejam I um intervalo de Rn , compacto e não vazio, A ⊂ I um conjunto desprezável e

f : I → R uma função contı́nua em I \ A. Então f é integrável em I.
Corolário 3.3 Sejam I um intervalo de Rn , compacto e não vazio e f : I → R uma função contı́nua.
Então f é integrável em I.
A caracterização completa das funções integráveis envolve uma extensão da noção de conjunto
desprezável que está fora do âmbito do nosso curso, mas que enunciamos seguidamente, por uma
questão de completude.
Dizemos que um conjunto A ⊂ Rn é desprezável à Lebesgue se para cada ε > 0 existe uma
famı́lia numerável de intervalos fechados de Rn , (In )n∈N , tais que
[ X
A⊂ In e m(In ) < ε.
n∈N n∈N
É imediato que se A é um conjunto desprezável, então também é desprezável à Lebesgue.
Teorema 3.4 Sejam I um intervalo compacto, não vazio, de Rn e f : I → R uma função limitada.
A função f é integrável à Riemann em I se, e só se, o conjunto dos seus pontos de descontinuidade
é um conjunto desprezável à Lebesgue.
Vamos agora definir o integral de uma função f definida num conjunto Ω ⊂ Rn limitado e cuja
fronteira seja um conjunto desprezável. Seja I um intervalo compacto de Rn tal que Ω ⊂ I e considere-
se a função g definida por (
f (x) se x ∈ Ω
g(x) =
0 se x ∈ I \ Ω.
Dizemos que f é integrável em Ω se g for integrável em I. Nesse caso definimos

Z Z
f := g.
Ω I
Observe-se que uma vez que prolongámos a função f por zero fora de Ω é indiferente qual o intervalo
I que se considera, desde que contenha Ω.
Dizemos que ∅ = 6 Ω ⊂ Rn é um conjunto mensurável (à Jordan) se é um conjunto limitado e se a

sua fronteira for um conjunto desprezável.
Exemplos e propriedades
11) Um intervalo limitado é um conjunto mensurável.
12) Os conjuntos dos exemplos 7) e 8) são mensuráveis.
58
13) Se dois conjuntos são mensuráveis, o mesmo acontece à sua união e à sua intersecção.
14) Os conjuntos desprezáveis são mensuráveis.
Podemos agora estender a noção de medida n-dimensional, definida inicialmente para intervalos,
para outros conjuntos. Chamamos medida n-dimensional do conjunto mensurável Ω ⊂ Rn ao
número Z
mn (Ω) = 1.
Ω
Observe-se que, sendo Ω um conjunto mensurável, a sua fronteira é desprezável pelo que a função
f ≡ 1 é integrável em Ω.
À semelhança dos casos dos intervalos, se n = 2, a m2 (Ω) chamamos a área de Ω e, se n = 3,
a m3 (Ω) chamamos volume de Ω. Também neste caso, quando não há necessidade de explicitar a
dimensão na medida, em vez de mn , usamos simplesmente m.
Dizemos que mn (∅) = 0, por comodidade de linguagem.
Com a introdução do conceito anterior justifica-se a terminologia conjunto de medida nula para
os conjuntos desprezáveis. Prova-se que um conjunto A ⊂ Rn é desprezável se, e só se, é mensurável
e se m(A) = 0.
Observe-se que se Ω é um conjunto mensurável e f é contı́nua em Ω, então f é integrável em Ω.
Mais geralmente, é válido o resultado que se segue.
Teorema 3.5 Seja Ω um conjunto mensurável e f : Ω → R uma função limitada. Então f é integrável
à Riemann em Ω se, e só se, o conjunto das suas descontinuidades é um conjunto desprezável à
Lebesgue.
O resultado que se segue reúne algumas propriedades do integral múltiplo.
Teorema 3.6 Sejam Ω ⊂ Rn um conjunto mensurável, f e g duas funções integráveis em Ω e M ∈ R.
Z
1. Se c é uma constante real, então c = c m(Ω).
Ω
2. (Linearidade) Se a e b são constantes reais, a função af + bg é integrável em Ω e tem-se

Z Z Z
(af + bg) = a f +b g.
Ω Ω Ω
Z
3. (Positividade) Se f (x) ≥ 0 para todo x ∈ Ω, então f ≥ 0.
Ω
Z Z
4. (Monotonia) Se f (x) ≥ g(x) para todo x ∈ Ω, então f≥ g.
Ω Ω
Z Z

5. A função |f | é integrável em Ω e tem-se f ≤
|f |.
Ω Ω
Z

6. (Majoração) Se |f (x)| ≤ M para todo x ∈ Ω, então f ≤ M m(Ω).

Ω
7. (Aditividade dos domı́nios) Seja Ω = Ω1 ∪ Ω2 , com Ω1 e Ω2 mensuráveis, e Ω1 ∩ Ω2 des-

prezável. Se f é integrável em Ω1 e em Ω2 , então f é integrável em Ω e tem-se
Z Z Z
f= f+ f.
Ω Ω1 Ω2
Observações. A propriedade 2) diz-nos que o conjunto das funções integráveis num conjunto men-
surável Ω é um espaço vectorial e que a aplicação que a cada elemento f deste espaço faz corresponder
Z
f é linear.
Ω
Por indução, a propriedade 7) generaliza-se ao caso em que Ω pode ser escrito como união finita
de conjuntos mensuráveis Ωi , Ω = Ω1 ∪ Ω2 ∪ . . . ∪ Ωm , tais que Ωi ∩ Ωj é desprezável, para i 6= j,
i, j = 1, . . . , m.
59
3.2 Cálculo de integrais em Rn por iteração
Na secção anterior estabelecemos o conceito de integral de um campo escalar definido num subconjunto
mensurável de Rn , assim como algumas das suas propriedades, à semelhança do que estudámos em
dimensão 1. Neste último caso (n = 1) é o Teorema Fundamental do Cálculo que nos fornece um
método prático para o cálculo dos integrais. Nesta secção vamos apresentar uma técnica de cálculo
para os integrais que acabámos de definir; basicamente consiste na redução do cálculo de um integral
múltiplo ao cálculo de n integrais simples, a que chamamos integração iterada. Vamos começar pelo
caso dos integrais duplos (n = 2).
Integração iterada em rectângulos

Seja f uma função real definida e contı́nua (para simplificar a abordagem) no rectângulo (intervalo de
R2 ) R = [a, b] × [c, d]. Para cada x ∈ [a, b] fixo, a função
y 7→ f (x, y), com y ∈ [c, d],
é uma função real de variável real, definida num intervalo, para a qual já estabelecemos o conceito de
integral (de Riemann). Assim, podemos escrever
Z d
f (x, y) dy
c
e dizemos que estamos a integrar a função f (x, y) em ordem à variável y, de y = c até y = d, mantendo
fixa a variável x. A este procedimento damos o nome de integração parcial relativamente a y.
Z d
Em geral f (x, y) dy depende do valor de x; fica então definida uma função que só depende de x,
c
dada por
Z d
g(x) = f (x, y) dy, x ∈ [a, b].
c
Prova-se que a função g assim obtida é integrável em [a, b]. Integrando-a agora nesse intervalo (obvi-
amente que agora a integração é relativa à variável x), obtemos
Z b Z b Z d !
g(x) dx = f (x, y) dy dx. (13)
a a c
Analogamente, é integrável em [c, d] a função

Z b
h(y) = f (x, y) dx
a
que se obtém integrando f (x, y) em ordem à variável x, de x = a até x = b, mantendo fixa a variável y.
À semelhança do caso anterior, a este procedimento chamamos integração parcial relativamente
a x. Integrando agora a função h no intervalo [c, d], vem
Z d Z d Z b !
h(y) dy = f (x, y) dx dy. (14)
c c a
Aos integrais obtidos neste procedimento da integração parcial sucessiva, (13) e (14), damos o nome de
integrais iterados e ao processo em si atribuı́mos a designação de integração iterada. Ao fixarmos
uma das variáveis, o cálculo destes integrais envolve integração de funções de uma só variável, pelo
que podemos aplicar as técnicas estudadas para integração de funções reais de variável real.
Observe-se a analogia na terminologia com o caso das derivadas parciais. Em ambas as situações,
derivação e integração, fixamos uma das variáveis e aplicamos um procedimento parcial, respectiva-
mente, derivar e integrar, em relação à outra variável.
60
Em (13) integramos primeiro em ordem a y, mantendo x fixo, e depois integramos em ordem a
x; em (14) usamos a ordem contrária. Na maioria das situações omitimos os parênteses, escrevendo
apenas
Z bZ d Z dZ b
f (x, y) dy dx e f (x, y) dx dy.
a c c a
No nosso caso, consideramos que se calcula em primeiro lugar o integral “de !
dentro” e só depois o
Z bZ d Z b Z d
“de fora”. Por exemplo, escrever f (x, y) dy dx significa f (x, y) dy dx.
a c a c
Exemplo. Seja f (x, y) = 12x2 y 3 + 1, com (x, y) ∈ [1, 2] × [0, 1].

A integração parcial de f em ordem a y origina a função g, definida em [1, 2], dada por
Z 1 h i1
g(x) = 12x2 y 3 + 1 dy = 3x2 y 4 + y = 3x2 + 1.
0 0
Integrando g no intervalo [1, 2] obtemos

Z 2 Z 2 h i2
g(x) dx = 3x2 + 1 dx = x3 + x = 8 + 2 − 1 − 1 = 8,
1 1 1
assim Z 2Z 1
f (x, y) dy dx = 8. (15)
1 0
A integração parcial de f em ordem a x origina a função h, definida em [0, 1], dada por
Z 2 h i2
h(y) = 12x2 y 3 + 1 dx = 4x3 y 3 + x = 32y 3 + 2 − 4y 3 − 1 = 28y 3 + 1.
1 1
Integrando h no intervalo [0, 1] obtemos

Z 1 Z 1 h i1
h(y) dy = 28y 3 + 1 dy = 7y 4 + y = 7 + 1 = 8,
0 0 0
donde Z 1Z 2
f (x, y) dx dy = 8. (16)
0 1
No exemplo anterior os integrais (15) e (16) têm o mesmo valor. Este facto não é uma coin-
cidência, é uma propriedade verificada por um grande conjunto de funções, que, em particular, inclui
as funções contı́nuas. Assim, nestes casos, é indiferente a ordem de integração.
Z Verifica-se ainda que
o valor comum obtido pela integração iterada é o valor do integral duplo f (x, y) dA, que definimos
R
anteriormente, como iremos constatar mais adiante.
Integração iterada em domı́nios do tipo I e do tipo II

Vamos agora estabelecer o conceito de integração iterada quando consideramos campos escalares em
regiões Ω, mais genéricas do que os rectângulos.
Consideremos uma região Ω1 ⊂ R2 da forma
n o
Ω1 = (x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ φ2 (x)
onde a ≤ b e φ1 e φ2 são funções r.v.r., contı́nuas, com φ1 ≤ φ2 .
Se o campo escalar f for contı́nuo em Ω1 , para cada x fixo no intervalo [a, b] podemos integrar a
função y 7→ f (x, y) relativamente a y, entre y = φ1 (x) e y = φ2 (x), obtendo-se um integral iterado,
que é uma função de x,
Z φ2 (x)
g(x) = f (x, y) dy,
φ1 (x)
61
onde, para além da função integranda, também os limites de integração dependem de x, sendo dados
por φ1 (x) e φ2 (x).
Integrando agora g no intervalo [a, b] vem
Z b Z b Z φ2 (x) !
g(x) dx = f (x, y) dy dx.
a a φ1 (x)
Exemplo.
Sejam Ω1 = (x, y) ∈ R2 : 0 ≤ x ≤ 1, x2 ≤ y ≤ x e f (x, y) = 2xy + 3y 2 , com (x, y) ∈ Ω1 .

Região Ω1
Para cada 0 ≤ x ≤ 1, temos que
Z x h ix
2xy + 3y 2 dy = xy 2 + y 3 = x3 + x3 − x5 − x6
x2 x2
e " #1
x4 x6 x7
Z 1
3 5 6 4
2x − x − x dx = − − = .
0 2 6 7 0
21
Iremos ver que
4
Z
f (x, y) dA = . (17)
Ω1 21
Consideremos agora uma região Ω2 ⊂ R2 da forma

n o
Ω2 = (x, y) ∈ R2 : c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y)
onde c ≤ d e ψ1 e ψ2 são funções r.v.r., contı́nuas, com ψ1 ≤ ψ2 .
Se f for um campo escalar contı́nuo em Ω2 , integrando a função x 7→ f (x, y) em ordem a x entre
x = ψ1 (y) e x = ψ2 (y) obtemos a função
Z ψ2 (y)
h(y) = f (x, y) dx
ψ1 (y)
que pode ser integrada no intervalo [c, d] obtendo-se

Z d Z d Z ψ2 (y) !
h(y) dy = f (x, y) dx dy.
c c ψ1 (y)
Exemplo. n
y2
o
Sejam Ω2 = (x, y) ∈ R2 : −2 ≤ y ≤ 4, 2 − 3 ≤ x ≤ y + 1 e f (x, y) = xy, com (x, y) ∈ Ω2 .
Região Ω2
62
Para cada −2 ≤ y ≤ 4, temos que
!2
y2
Z y+1
1 h 2 iy+1 1 1
y2
xy dx = yx y2 = y(y + 1)2 − y −3
2
−3 2 2
−3 2 2 2
e
!2  !3 4
y2 1 y4 2 y2 1 y2
Z 4
1
y(y + 1)2 − y −3 dy =  + y 3 + − −3  = 36.
2 −2 2 2 4 3 2 3 2
−2
Iremos ver que Z
f (x, y) dA = 36. (18)
Ω2
O resultado que se segue conjuga as ideias expostas, fornecendo um método prático para calcular
integrais duplos, para funções reais integráveis em conjuntos como os que acabámos de apresentar,
justificando as afirmações (17) e (18).
Teorema 3.7 (Teorema de Fubini) Se a função real f é integrável na região Ω1 dada por
n o
Ω1 = (x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ φ2 (x) ,
onde φ1 e φ2 são funções r.v.r., contı́nuas em [a, b] (com φ1 ≤ φ2 ), e
(?) ∀x ∈ [a, b] a função y 7→ f (x, y) é integrável em [φ1 (x), φ2 (x)],

Z φ2 (x)
então a função x 7→ f (x, y) dy é integrável em [a, b] e tem-se
φ1 (x)
Z Z b "Z φ2 (x) #
f (x, y) dA = f (x, y) dy dx.
Ω1 a φ1 (x)
Se a função real f é integrável na região Ω2 dada por

n o
Ω2 = (x, y) ∈ R2 : c ≤ y ≤ d, ψ1 (y) ≤ x ≤ ψ2 (y) ,
onde ψ1 e ψ2 são funções r.v.r., contı́nuas em [c, d] (com ψ1 ≤ ψ2 ), e
(??) ∀y ∈ [c, d] a função x 7→ f (x, y) é integrável em [ψ1 (y), ψ2 (y)],

Z ψ2 (y)
então a função y 7→ f (x, y) dx é integrável em [c, d] e tem-se
ψ1 (y)
Z Z d "Z ψ2 (y) #
f (x, y) dA = f (x, y) dx dy.
Ω2 c ψ1 (y)
Notação. Para os integrais duplos iterados usamos também as seguintes notações

Z b Z φ2 (x) Z b Z φ2 (x) Z d Z ψ2 (y) Z d Z ψ2 (y)
f (x, y) dy dx = dx f (x, y) dy e f (x, y) dx dy = dy f (x, y) dx.
a φ1 (x) a φ1 (x) c ψ1 (y) c ψ1 (y)
Um subconjunto de R2 que se escreve como Ω1 diz-se um domı́nio ou região do tipo I (ou

y-normal) e quando se escreve como Ω2 diz-se um domı́nio ou região do tipo II (ou x-normal).
Seguem-se algumas representações geométricas de exemplos de conjuntos destes tipo, em que o eixo
horizontal é o eixo dos xx e o vertical dos yy (em todas as figuras).
63
Domı́nios do tipo I
√ Os gráficos que delimitam as regiões das três figuras são, respectivamente,

x 7→ 4 − x2 e x 7→ 12 (x2 − 4), x 7→ sin x + 4 e x 7→ x + 2, x 7→ x2 + 3 e x 7→ −x + 1
Domı́nios do tipo II
Os gráficos que delimitam as regiões das três figuras são, respectivamente,

7 y
y 7→ −3 + |y − 1| e y 7→ 2 − y 2 , y 7→ 1 − y e y 7→ ey y 7→ 1 − y e y 7→ 3 − 3
Informalmente, no plano xy, dizemos que um conjunto é um domı́nio do tipo I se o conjunto dos seus
pontos é limitado inferiormente pelo gráfico de uma função de x e superiormente pelo gráfico de
outra função de x, ambas definidas no mesmo intervalo; e que é um domı́nio do tipo II se o conjunto
dos seus pontos é limitado à esquerda pelo gráfico de uma função de y e à direita pelo gráfico de
outra função de y, ambas definidas no mesmo intervalo (observe-se a direcção das setas nas figuras
dos exemplos anteriores).
Há conjuntos que são simultaneamente do tipo I e do tipo II, sendo, portanto x-normais e
y-normais. Por esse facto designam-se por domı́nios normais. Rectângulos, alguns triângulos e
cı́rculos são exemplos de domı́nios normais.
Observações ao Teorema de Fubini.

1) Se f é contı́nua em Ω1 (resp. em Ω2 ), a hipótese (?) (resp. (??)) é satisfeita.
2) Se o conjunto Ω1 (ou Ω2 ) for um rectângulo R = [a, b] × [c, d] (isto significa que as funções φ1 e
φ2 (resp. ψ1 e ψ2 ) são constantes), e se f for contı́nua em R, o teorema anterior diz-nos que o valor
Z Z bZ d
do integral duplo f (x, y) dA é dado por f (x, y) dy dx e que este valor coincide com o valor
Z dZ b R a c
f (x, y) dx dy, ou seja, é indiferente a ordem de integração no cálculo do integral duplo.

c a
Em geral o Teorema de Fubini é enunciado com a versão para rectângulos (caso n=2) sendo, por
esse motivo, referido como o teorema que permite trocar a ordem de integração.
3) Nos casos em que a ordem de integração pode ser trocada, nem sempre há interesse em fazê-lo,
escolhe-se então aquela em que os integrais iterados são mais fáceis de calcular.
64
4) Se a região Ω não for do tipo I nem do tipo II mas se puder ser escrita como união finita de regiões
destes dois tipos, então conjugamos o Teorema 3.6 (propriedade 7) com o Teorema 3.7 para calcular
o integral.
5) No caso particular em que f (x, y) = h(x)g(y) e Ω = [a, b] × [c, d], com h e g integráveis, tem-se
Z Z b ! Z d !
f (x, y) dx dy = h(x) dx g(y) dy .
Ω a c
Z 2 Z π Z 2 Z π h i2
Exemplo. 2
3x sin y dy dx = 2
3x dx sin y dy = x3 [− cos y]π0 = 8(1 + 1) = 16.
0 0 0 0 0
6) Interpretação geométrica dos integrais iterados
Consideremos f uma função real, positiva e contı́nua em [a, b] × [c, d]. Dado x0 ∈ [a, b], a função
Z d
g(x0 ) = f (x0 , y) dy representa a área da região do plano x = x0 , limitada pela intersecção do
c
gráfico de f com este plano, e pelos planos y = c, y = d e z = 0. Veremos que o volume do sólido
n o
(x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)
Z b Z bZ d
é dado por g(x) dx, ou seja, pelo integral duplo f (x, y) dy dx.
a a c
Z
Exemplos. 1) Calcular 5xy dx dy, onde Ω é a região do semi-plano x ≥ 0, limitada pelas curvas
Ω
y = 2x e y = x3 .
Em x ≥ 0, as curvas que definem Ω intersectam-se nos pontos cujas abcissas satisfazem

√
2x = x3 ⇔ x = 0 ∨ x = 2.
√
Podemos então escrever Ω como uma região do tipo I, Ω = {(x, y) : 0 ≤ x ≤ 2, x3 ≤ y ≤ 2x}.
Z √2 Z 2x Z √2 " #2x Z √2
y2 5
Z
Temos então 5xy dx dy = 5xy dy dx = 5x dx = 10x3 − x7 dx
Ω 0 x3 0 2 x3 0 2
" #√2
5x4 5x8
= − = 10 − 5 = 5.
2 16 0
65
Z
2) Calcular 2y + x dx dy, onde Ω é a semi-coroa circular {(x, y) : 1 ≤ x2 + y 2 ≤ 4, y ≥ 0}.
Ω
A região de integração Ω pode ser escrita como a união de três domı́nios do tipo I: R1 , R2 e R3 .
Ω R1 R2 R3
p
R1 = {(x, y) : −2 ≤ x ≤ −1, 0 ≤ y ≤ 4 − x2 },
p p
R2 = {(x, y) : −1 ≤ x ≤ 1, 1 − x2 ≤ y ≤ 4 − x2 } e
p
R3 = {(x, y) : 1 ≤ x ≤ 2, 0 ≤ y ≤ 4 − x2 }.
Temos então
Z Z Z Z
2y + x dx dy = 2y + x dx dy + 2y + x dx dy + 2y + x dx dy =
Ω R1 R2 R3
Z −1 Z √4−x2 Z 1 Z √4−x2 Z 2 Z √4−x2
= 2y + x dy dx + √ 2y + x dy dx + 2y + x dy dx
−2 0 −1 1−x2 1 0
Z −1 h i√ 4−x2
Z 1 h i√ 4−x2
Z 2h i√4−x2
2 2 2
= y + xy dx + y + xy √ dx + y + xy dx
−2 0 −1 1−x2 1 0
Z −1 p Z 1 p p Z 2 p
2
= 4−x +x 4− x2 dx + 3+x 4− x2 −x 1− x2 dx + 4 − x2 + x 4 − x2 dx
−2 −1 1
" #−1 " #1 " #2
x3 (4 − x2 )3/2 (4 − x2 )3/2 (1 − x2 )3/2 x3 (4 − x2 )3/2 28
= 4x − − + 3x − + + 4x − − = .
3 3 −2
3 3 −1
3 3 1
3
Neste exemplo o facto da região de integração ser a união de três regiões do tipo I (e também união de
três regiões do tipo II - verifique) torna o cálculo do integral duplo trabalhoso. Há situações em que
esta questão pode ser ultrapassada. Retomaremos este exemplo mais adiante, com outras ferramentas.
É válida uma versão do Teorema de Fubini para integrais múltiplos de funções definidas
em subconjuntos mensuráveis de Rn , n ≥ 3, na qual se encontra a justificação da afirmação feita na
observação 6) ao Teorema de Fubini. Considere-se um conjunto Ω exprimı́vel na forma que se segue
Ω = {(x1 , . . . , xn ) ∈ Rn : a ≤ x1 ≤ b, φ1 (x1 ) ≤ x2 ≤ ψ1 (x1 ),

φ2 (x1 , x2 ) ≤ x3 ≤ ψ2 (x1 , x2 ), . . . , φn−1 (x1 , x2 , . . . , xn−1 ) ≤ xn ≤ ψn−1 (x1 , x2 , . . . , xn−1 )}
onde as funções φi ≤ ψi , i = 1, . . . , n − 1 são funções reais, contı́nuas nas variáveis indicadas. Então
tem-se
Z Z b "Z ψ1 (x1 ) " Z ψn−1 (x1 ,x2 ,...,xn−1 ) # #
f (x1 , . . . , xn ) dx1 . . . dxn = ... f (x1 , . . . , xn ) dxn . . . dx2 dx1 ,
Ω a φ1 (x1 ) φn−1 (x1 ,x2 ,...,xn−1 )
desde que as sucessivas integrações se possam efectuar, o que é válido sempre que f for contı́nua em
Ω. São válidas expressões análogas para outras ordens de integração desde que Ω se possa exprimir
de forma conveniente e que os integrais façam sentido. Vejamos o exemplo que se segue (n = 3).
Consideremos o conjunto
n o
Ω = (x, y, z) ∈ R3 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x), φ2 (x, y) ≤ z ≤ ψ2 (x, y)
com φ1 ≤ ψ1 , φ2 ≤ ψ2 funções reais contı́nuas. Tem-se
Z Z b Z ψ1 (x) Z ψ2 (x,y)
f (x, y, z) dV = f (x, y, z) dz dy dx.
Ω a φ1 (x) φ2 (x,y)
66
Não estando presentes os parênteses, subentende-se que o primeiro integral a ser calculado é o mais
à direita e é relativo à variável mais à esquerda, neste caso a z, e assim sucessivamente. Para o mesmo
integral triplo, usamos também a notação
Z Z b Z ψ1 (x) Z ψ2 (x,y)
f (x, y, z) dV = dx dy f (x, y, z) dz,
Ω a φ1 (x) φ2 (x,y)
significando que o integral entre a e b é referente à variável x, que o integral com limites de integração
φ1 (x) e ψ1 (x) é referente à variável y e que o integral com limites de integração φ2 (x, y) e ψ2 (x, y) diz
respeito à variável z.
Supondo que Ω também se pode escrever na forma
n o
Ω = (x, y, z) ∈ R3 : a ≤ x ≤ b, α1 (x) ≤ z ≤ β1 (x), α2 (x, z) ≤ y ≤ β2 (x, z) ,
com α1 ≤ β1 , α2 ≤ β2 funções reais, contı́nuas, então também se tem

Z Z b Z β1 (x) Z β2 (x,z)
f (x, y, z) dV = f (x, y, z) dy dz dx.
Ω a α1 (x) α2 (x,z)
Voltando ao conjunto da observação 6, já referida, temos

n o
S = (x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)
e, por definição, Z
V (S) = 1 dV.
S
Atendendo ao exposto,
Z Z b Z d Z f (x,y) Z bZ d
V (S) = 1 dV = 1 dz dy dx = f (x, y) dy dx.
S a c 0 a c
Nem sempre os conjuntos onde vamos fazer a integração nos aparecem escritos na forma ideal para
a integração iterada. À semelhança do caso n = 2, no caso n = 3 dizemos que um conjunto Ω é
z-normal se
Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, g1 (x, y) ≤ z ≤ g2 (x, y)},
onde D é um conjunto mensurável de R2 (a projecção de Ω sobre o plano xy) e g1 ≤ g2 são funções

reais e contı́nuas em D.
Temos, neste caso, !
Z Z Z g2 (x,y)
f= f (x, y, z) dz dx dy.
Ω D g1 (x,y)
Após a primeira integração ficamos reduzidos ao cálculo de um integral duplo que, de acordo com a
discussão já efectuada, é feito escrevendo D como um domı́nio ou união de domı́nios dos tipos I e/ou
II.
67
Analogamente se definem conjuntos x-normais e y-normais. A figura que se segue apresenta exem-
plos dos três tipos de conjuntos a que acabámos de nos referir.
Neste processo o cálculo do integral triplo é reduzido, após a primeira integração, ao cálculo de
um integral duplo.
Exemplo.
Z
Calcular x dx dy dz, onde Ω é o tetraedro limitado pelos planos x = 0, y = 0, z = 0 e x + y + z = 1.
Ω
É fácil ver que Ω é a região z-normal dada por
Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, 0 ≤ z ≤ 1 − x − y}
com
D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x}.
Ω D
Temos então
Ω = {(x, y, z) ∈ R3 : 0 ≤ x ≤ 1, 0≤y ≤1−x e 0 ≤ z ≤ 1 − x − y},

donde
Z Z 1 Z 1−x Z 1−x−y
x dx dy dz = dx dy x dz
Ω 0 0 0
Z 1 Z 1−x
= dx x(1 − x − y) dy
0 0
" #1−x
(1 − x − y)2
Z 1 Z 1
1 1
= x − dx = x − 2x2 + x3 dx = .
0 2 0
2 0 24
68
Há uma outra forma de redução dimensional no cálculo destes integrais. Suponhamos que Ω ⊂ R3
é um conjunto mensurável em que z varia num intervalo [α, β]. Para cada z0 neste intervalo seja Ωz0
a secção transversal obtida cortando Ω pelo plano z = z0 . Designe-se
Az0 = {(x, y) ∈ R2 : (x, y, z0 ) ∈ Ω}
a projecção da fatia Ωz0 sobre o plano xy.
Assim,
Ω = {(x, y, z) ∈ R3 : z ∈ [α, β], (x, y) ∈ Az }.
Supondo agora que cada Az é mensurável (situação que ocorre, por exemplo, quando a fronteira de
Ω é a união de gráficos de funções contı́nuas ou é um conjunto
Z convexo), e considerando f : Ω → R
uma função contı́nua, garante-se que todos os integrais f (x, y, z) dx dy, com z ∈ [α, β], existem e
Az
prova-se que
Z Z β Z
f= f (x, y, z) dx dy dz.
Ω α Az
No caso em que f = 1 o integral anterior dá-nos o volume do sólido Ω. O método que acabámos
de descrever, com a linguagem dos nossos dias, foi usado por B. Cavalieri (1598-1647) para calcular
volumes de sólidos, antes do aparecimento do cálculo de Newton e de Leibniz!
Terminamos a secção com uma observação relativa ao caso particular em que a função integranda
se escreve na forma
f (x, y, z) = h(x)g(y)ψ(z) e Ω = [a, b] × [c, d] × [α, β],
com h, g e ψ integráveis. Neste caso tem-se

Z b ! Z d ! Z !
Z β
f (x, y, z) dx dy dz = h(x) dx g(y) dy ψ(z) dz . (19)
Ω a c α
Z
Exemplo. Calcular r2 sin ϕ dr dθ dϕ, com (r, θ, ϕ) ∈ Ω = [0, 1] × [0, π] × [0, π2 ].
Ω
Temos
π
Z Z 1 Z π Z !
2
2 2
r sin ϕ dr dθ dϕ = r dr dθ sin ϕ dϕ (20)
Ω 0 0 0
" #1
r3 π π
= π [− cos ϕ]02 = . (21)
3 0
3
69
3.2.1 Aplicações dos integrais múltiplos
Atendendo às definições estabelecidas, dado Ω um conjunto mensurável de R2 , temos que:
• a área A de Ω é dada por Z

A= 1 dx dy;
Ω
• se f (x, y) ≥ 0 em Ω, o volume V do sólido limitado inferiormente pelo plano z = 0 e superior-

mente pelo gráfico de f , considerada em Ω, (graf f = {(x, y, z) ∈ R3 : (x, y) ∈ Ω, z = f (x, y)}),
é dado por Z
V = f (x, y) dx dy.
Ω
Exemplos. 1) Usando um integral duplo, calcular a área de
Ω = {(x, y) ∈ R2 : |x| ≤ y ≤ 2 − x2 }.
Z
Temos então de calcular 1 dx dy, o que implica escrever Ω como uma região do tipo x- ou y-normal.
Ω
É fácil ver que Ω = {(x, y) ∈ R2 : −1 ≤ x ≤ 1, |x| ≤ y ≤ 2 − x2 }.
Assim,
Z 1 Z 2−x2 " #1
x3 x2
Z 1 Z 1
7
Z
2 2
1dx dy = dy dx = 2 − x − |x| dx = 2 2 − x − x dx = 2 2x − − = .
Ω −1 |x| −1 | {z } 0 3 2 0
3
par
2) Calcular o volume do sólido limitado superiormente pelo gráfico da função f (x, y) = 4 − x2 − y 2 e

inferiormente pelo plano z = 0, quando (x, y) ∈ Ω, sendo Ω a região do plano xy limitada pela curva
y 2 − x − 1 = 0 e pela recta x = 0.
É fácil ver que as curvas dadas se intersectam nos pontos (0, −1) e (0, 1). Podemos então escrever
Ω como uma região do tipo II, a saber
Ω = {(x, y) : −1 ≤ y ≤ 1, y 2 − 1 ≤ x ≤ 0}.
70
O volume V pedido é dado por
" #0
x3
Z Z 1 Z 0 Z 1
2 2 2 2 2 2
V = 4 − x − y dx dy = 4 − x − y dx dy = (4 − y )(1 − y ) − dy
Ω −1 y 2 −1 −1 3 y 2 −1
(y 2 − 1)3
Z 1
100
= 4 − 5y 2 + y 4 + dy = .
−1 3 21
Os integrais duplos e os integrais triplos são também utilizados para, por exemplo, determinar a
massa, o centro de massa e o momento de inércia de regiões planas ou de sólidos, pois as definições
destes conceitos fı́sicos envolvem estes integrais, como veremos seguidamente.
Considere-se um sólido cuja medida de comprimento relativa à direcção z é desprezável em relação às
outras medidas nas variáveis x e y, tal como uma placa fina. Seja Ω a secção desse sólido relativa à
direcção z. Supondo que µ(x, y) é a densidade de massa (massa por unidade de área), então:
1. a massa total M da placa que ocupa a região Ω do plano xy é dada por

Z
M= µ(x, y) dx dy;
Ω
2. o centro de massa (também chamado centro de gravidade ou centróide) de Ω é o ponto

C(xC , yC ) com as coordenadas dadas por
1
Z
xC = xµ(x, y) dx dy,
M Ω
1
Z
yC = yµ(x, y) dx dy;
M Ω
3. o momento (de inércia) de Ω relativo a uma recta r (o eixo) é dado por

Z
Ir = d2 ((x, y), r)µ(x, y) dx dy,
Ω
onde d((x, y), r) representa a distância do ponto (x, y) à recta r.

(O momento de inércia mede a tendência do sistema girar em torno da recta r.)
Analogamente, dado um sólido S de R3 com densidade de massa µ(x, y, z) define-se a massa total,
as coordenadas do centróide, e o momento relativo a r, de S, respectivamente por
Z
M= µ(x, y, z) dx dy dz
S
1
Z
xC = xµ(x, y, z) dx dy dz,
M S
1
Z
yC = yµ(x, y, z) dx dy dz,
M S
1
Z
zC = zµ(x, y, z) dx dy dz,
M S
Z
Ir = d2 ((x, y, z), r)µ(x, y, z) dx dy dz.
S
71
Recordamos que um conjunto Ω ⊂ Rn é conexo por arcos se, para quaisquer x, y ∈ Ω existe uma
linha parametrizada γ : [0, 1] → Ω tal que γ(0) = x e γ(1) = y.
Proposição 3.8 (Teorema do Valor Médio) Seja f uma função contı́nua em Ω ⊂ Rn , conjunto
compacto, mensurável e conexo por arcos. Então existe um ponto x0 ∈ Ω tal que
Z
f (x) = f (x0 ) m(Ω).
Ω
A f (x0 ) damos o nome de valor médio (ou média) de f em Ω.
A fórmula do teorema anterior diz que uma caixa, cuja base é um rectângulo R e cuja altura é o valor
médio de f , tem o mesmo volume que o sólido que se encontra abaixo do gráfico de f (f ≥ 0).
Se z = f (x, y) descrever uma região montanhosa e cortarmos os topos das montanhas à altura do
valor médio de f , significa que podemos preencher os vales com a parte obtida pelos cortes e obter
uma região plana.
Demonstração da proposição. Se m(Ω) = 0, o resultado é imediato. Suponhamos então que Ω não

é desprezável. Como f é contı́nua e Ω é compacto, existem a, b ∈ R, tais que a = minΩ f e b = maxΩ f
(pelo Teorema de Weierstrass). Assim, para todo o x ∈ Ω, tem-se a ≤ f (x) ≤ b. Pela propriedade da
monotonia dos integrais (cf. Teorema 3.6, propriedade 4) vem
Z Z Z
a≤ f≤ b,
Ω Ω Ω
logo (cf. Teorema 3.6, propriedade 1)

Z
Z f
Ω
a m(Ω) ≤ f ≤ b m(Ω) ⇔ a ≤ ≤ b.
Ω m(Ω)
Como f é contı́nua e Ω é conexo por arcos, o Teorema de Bolzano garante a existência de x0 ∈ Ω,

tal que Z
f
Ω
f (x0 ) = ,
m(Ω)
(f assume todos os valores entre a e b), logo
Z
f (x) = f (x0 ) m(Ω).
Ω
72
3.3 Mudança de variável no integral múltiplo
No cálculo de integrais de funções reais de variável real temos de lidar com a primitivação da função
integranda, o que nem sempre é uma tarefa simples. A integração por substituição é muitas vezes
a opção que usamos para ultrapassar essa dificuldade. Para essas funções aprendemos o Teorema de
Mudança de Variável que nos diz que
Z u(d) Z d Z d
0
f (x) dx = f (u(t))u (t) dt = f ◦ u(t) u0 (t) dt
u(c) c c
considerando x = u(t) e u : [c, d] → R uma função de classe C 1 .

No caso em que u0 > 0, temos u : [c, d] → [a, b] e u(c) = a, u(d) = b, pelo que
Z b Z u(d) Z d
f (x) dx = f (x) dx = f (u(t))u0 (t) dt.
a u(c) c
No caso em que u0 < 0, temos u : [c, d] → [a, b], com u(c) = b, u(d) = a, donde
Z b Z a Z u(d) Z d Z d
f (x) dx = − f (x) dx = − f (x) dx = − f (u(t))u0 (t) dt = f (u(t))(−u0 (t))dt.
a b u(c) c c
Podemos então escrever Z b Z d

f (x) dx = f (u(t))|u0 (t)| dt.
a c
Ao passarmos para os integrais de campos escalares, a primitivação da função integranda também

é um dos problemas (entre outros) que temos de enfrentar, pelo que se antecipa a necessidade de um
Teorema de Mudança de Variáveis, que enunciamos seguidamente.
Teorema 3.9 (Teorema de Mudança de Variáveis no Integral Múltiplo) Sejam U e V dois

abertos de Rn e T : U → V uma bijecção de classe C 1 , tal que det JT (u) 6= 0, ∀u ∈ U , excepto num
conjunto de medida nula. Sejam D um conjunto limitado mensurável tal que D ⊂ U , Ω = T (D) e
f : Ω → R uma função integrável. Então:
1. (f ◦ T )|det JT | : D → R é integrável e
Z Z
2. f= (f ◦ T )|det JT |,
Ω D
onde |det JT | denota o módulo do jacobiano de T .
Observações.
1) Muitas vezes referimo-nos à função T do teorema anterior como a função mudança de variáveis,
no entanto, observamos que esta referência pode conter um abuso de linguagem, já que essa designação
é o conceito matemático que se segue. Dados dois abertos U e V de Rn , dizemos que uma função
T : U → V é uma mudança de coordenadas ou de variáveis se é uma bijecção de classe C 1 tal
que det JT (u) 6= 0, ∀u ∈ U .
2) Observamos que o teorema anterior ainda é válido se D ⊂ U e D 6⊂ U , desde que U e V sejam
abertos com fronteira de medida nula.
3) Na notação que põe em evidência as “variáveis” de D e Ω, e considerando as relações
xi = Ti (u1 , . . . , un ), i = 1, . . . , n,
a fórmula em 2. do teorema anterior exprime-se da maneira seguinte

∂(x1 , . . . , xn )
Z Z
f (x1 , . . . , xn ) dx1 . . . dxn = f (T1 (u1 , . . . , un ), . . . , Tn (u1 , . . . , un ))
du1 . . . dun .
Ω D ∂(u , . . . , u )
1 n
73
Em que situações recorremos a uma mudança de variáveis para calcular um integral múltiplo?
Para além da já referida dificuldade de primitivação da função integranda, agora (n > 1) uma nova
dificuldade pode surgir - a escrita da região de integração usando conjuntos normais em relação a uma
das variáveis.
Z
Como procedemos para efectuar a mudança de variáveis num integral múltiplo f?
Ω
Escolhemos uma transformação T , de classe C 1 , bijectiva, cujo jacobiano seja não nulo, eventual-
mente, à excepção de um conjunto de medida nula, e depois aplicamos a fórmula
Z Z
f= (f ◦ T )|det JT |,
Ω D
o que exige o conhecimento do jacobiano de T . Por vezes, o cálculo do jacobiano de T −1 é mais fácil
de efectuar do que o de T . Assim, é útil observar que, se det JT (X) 6= 0, os dois se relacionam da
forma que se segue
1
det JT −1 (Y ) = , com T (X) = Y.
det JT (X)
O resultado que garante esta propriedade é conhecido como Teorema da Função Inversa.
A estrutura de f e de Ω ditam os critérios da escolha de T , alguns dos quais evidenciaremos ao
longo dos exemplos que vamos estudar.
Nos exemplos e exercı́cios propostos apenas trabalharemos em dimensão 2 e em dimensão 3. No
que segue, apresentamos alguns exemplos de mudança de variáveis que utilizamos frequentemente para
o cálculo desses integrais.
3.3.1 Casos particulares de mudança de variáveis em R2
Sejam Ω e D conjuntos mensuráveis, T (u, v) = (x(u, v), y(u, v)) uma transformação nas condições
do Teorema 3.9, tal que T (D) = Ω, e f um campo escalar integrável em Ω. Então, a fórmula de
mudança de variável no integral duplo é

∂(x, y)
Z Z
f (x, y) dx dy = f (x(u, v), y(u, v))
du dv.
Ω D ∂(u, v)
Mudança de Variáveis Linear

Consideremos a aplicação linear
T : R2 → R2
(u, v) 7→ T (u, v) = (au + bv, cu + dv),
com ad − bc 6= 0.
Fazendo x = au + bv e y = cu + dv, tem-se
∂(x, y)
= ad − bc 6= 0.
∂(u, v)
Como T é uma aplicação injectiva de classe C 1 , tem-se

Z Z Z
f (x, y) dx dy = |ad − bc| f (T (u, v)) du dv = |ad − bc| f (au + bv, cu + dv) du dv.
T (D) D D
74
Exemplo. Vamos calcular o integral Z y−x
e y+x dx dy,
Ω
onde Ω é a região (poligonal) limitada pelas rectas x + y = 2, x + y = 1 e pelos eixos coordenados.
Região Ω = {(x, y) ∈ R2 : x ≥ 0, y ≥ 0, 1 ≤ x + y ≤ 2}
Estamos perante uma região de integração que se escreve como união de dois domı́nios do tipo I
(verifique), pelo que é simples escrever o integral dado como soma de integrais iterados. No entanto,
a função integranda imprime dificuldades à integração directa, pois a sua primitivação (parcial) não é
evidente. Assim, vamos efectuar uma mudança de variáveis (m.v.) no integral dado. A estrutura da
função integranda sugere que consideremos as novas variáveis u e v, dadas por
u=y−x e v = y + x.
As relações anteriores definem uma m.v. linear que verifica

∂(u, v) −1 1 ∂(x, y) 1
= = −2, logo = − 6= 0,
∂(x, y) 1 1 ∂(u, v) 2
e, portanto, é admissı́vel para o Teorema 3.9. Interessa-nos agora escrever as variáveis x e y em função
de u e v, para identificarmos a função mudança de variáveis. Temos
u+v v−u
=y e = x,
2 2
v−u u+v

pelo que a função m.v. é dada por T (u, v) = , . Assim, a região D do plano uv tal que
2 2
T (D) = Ω (ou seja, D = T −1 (Ω)) é dada por
D = {(u, v) ∈ R2 : 1 ≤ v ≤ 2, −v ≤ u ≤ v}.
Região D
Efectuando a m.v. no integral vem

1
Z y−x
Z
u
e y+x dx dy = e v du dv.
Ω 2 D
Como D é uma região do tipo II (observe que não é do tipo I) vem

" #2
e − e−1 v 2 3(e − e−1 )
Z 2 Z v Z 2h Z 2
1 u 1 u
iv 1 −1
e du dv =
v ve v dv = (ve − ve ) dv = = .
2 1 −v 2 1 −v 2 1 2 2 1
4
75
Coordenadas polares
Vimos que as coordenadas polares (r, θ) de um ponto P ∈ R2 com coordenadas cartesianas p

(x, y) 6= (0, 0) são tais que r é a distância euclidiana do ponto P à origem (0, 0), ou seja, r = x2 + y 2 ;
e θ é o ângulo, em [0, 2π[, que o vector OP faz com o semi-eixo positivo dos xx, medido a partir deste
no sentido directo (sentido contrário ao dos ponteiros do relógio).
As variáveis dos dois sistemas de coordenadas estão relacionadas entre si por

(
x = r cos θ
r > 0, θ ∈ [0, 2π[,
y = r sin θ,
com
arctan xy ,


 x > 0 e y ≥ 0;
π
 2, x = 0 e y > 0;


q 
arctan xy + π,

r= x2 + y 2 e θ= (x < 0 e y ≥ 0) ou (x < 0 e y ≤ 0);
 3π ,

x = 0 e y < 0;
 2


y

2π + arctan x , x > 0 e y ≤ 0.
Esta relação é uma restrição da seguinte transformação vectorial definida em R2
T (r, θ) = (x(r, θ), y(r, θ)) = (r cos θ, r sin θ). (22)
No integral duplo, mudar de variáveis cartesianas para coordenadas polares, nas condições do Teorema
3.9, implica considerar a transformação anterior no aberto ]0, +∞[×]0, 2π[, onde é injectiva, de classe
C 1 e com jacobiano dado por (cf. exercı́cio 37 da Ficha 2)
∂(x, y)
= r.
∂(r, θ)
Assim, dado f um campo escalar integrável em Ω, o Teorema 3.9 diz-nos que
Z Z
f (x, y) dx dy = f (r cos θ, r sin θ) r dr dθ,
Ω D
onde Ω é a imagem da região D por meio da transformação anterior.

Temos
T (]0, +∞[×]0, 2π[) = R2 \ {(x, 0) : x ∈ R+
0 },
o que significa que os conjuntos que são atravessados pelo semi-eixo positivo das abcissas não estão
incluı́dos nesta transformação. No entanto, a fronteira de ]0, +∞[×]0, 2π[ é o conjunto, que se prova
ter medida nula, ({0} × [0, 2π]) ∪ ([0, +∞[×{0}) ∪ ([0, +∞[×{2π}), e o semi-eixo positivo das abcissas
é T ([0, +∞[×{0}), pelo que as coordenadas polares podem ser consideradas quando utilizamos o
Teorema 3.9, para qualquer subconjunto Ω de R2 , com D = T (Ω) (observe-se que o jacobiano de T se
anula na fronteira referida). Assim, escrevemos
(
x = r cos θ ∂(x, y)
r ≥ 0, θ ∈ [0, 2π], = r.
Coordenadas Polares y = r sin θ ∂(r, θ)
(r2 = x2 + y 2 )
76
Exemplos.
1) O cı́rculo fechado que em coordenadas cartesianas tem centro em (0, 0) e raio 2, ou seja, o conjunto
{(x, y) ∈ R2 : x2 + y 2 ≤ 4}, em coordenadas polares é o rectângulo {(r, θ) : 0 ≤ r ≤ 2, 0 ≤ θ ≤ 2π}.
Genericamente, cı́rculos fechados em coordenadas cartesianas são os transformados de rectângulos

através das coordenadas polares.
Este exemplo (muito simples) ilustra a utilidade do uso de coordenadas polares para o cálculo
de integrais duplos em que a região de integração é circular (cı́rculos, porções de cı́rculos, coroas
circulares). São também úteis quando a função integranda envolve a composição do campo escalar
(x, y) 7→ x2 + y 2 com outras funções reais de variável real, como é o caso dos exemplos seguintes:
2 2
f (x, y) = ex +y e g(x, y) = 3+x12 +y2 .
Z
2) Retomamos agora o exemplo da página 66 e vamos calcular 2y + x dx dy, onde Ω é a semi-coroa
Ω
circular {(x, y) : 1 ≤ x2 + y 2 ≤ 4, y ≥ 0}, usando mudança de variáveis no integral.
Ω
Começamos por traduzir as condições que definem Ω em coordenadas cartesianas, para condições em
coordenadas polares. Recordando que
(
x = r cos θ
e r 2 = x2 + y 2
y = r sin θ,
vem
r≥0
1 ≤ x2 + y 2 ≤ 4 ⇔ 1 ≤ r2 ≤ 4 ⇐⇒ 1 ≤ r ≤ 2
e, se r 6= 0,
y ≥ 0 ⇔ r sin θ ≥ 0 ⇔ 0 ≤ θ ≤ π.
Assim, Ω é o transformado do rectângulo D = {(r, θ) : 1 ≤ r ≤ 2, 0 ≤ θ ≤ π}, por meio das
coordenadas polares. Aplicando o Teorema 3.9 no integral dado vem
Z Z
I= 2y + x dx dy = (2r sin θ + r cos θ)r dr dθ.
Ω D
(A vermelho o módulo do jacobiano da mudança de variável.) Como D é um rectângulo, é muito

simples escrever o integral duplo anterior na forma de integrais iterados. Vem então
Z πZ 2 Z π" 3 #2
r
I= 2r2 sin θ + r2 cos θ dr dθ = (2 sin θ + cos θ) dθ
0 1 0 3 1
Z π
7 7 28
= (2 sin θ + cos θ) dθ = [−2 cos θ + sin θ]π0 = .
0 3 3 3
É evidente que a resolução acabada de efectuar é muito mais simples que a anteriormente apresentada.
77
3.3.2 Casos particulares de mudança de variáveis em R3
Sejam Ω e D conjuntos mensuráveis, T (u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) uma trans-
formação nas condições do Teorema 3.9, tal que T (D) = Ω, e f um campo escalar integrável em Ω.
Então, a fórmula de mudança de variável no integral triplo é

∂(x, y, z)
Z Z
f (x, y, z) dx dy dz = f (x(u, v, w), y(u, v, w), z(u, v, w)) du dv dw.
Ω D ∂(u, v, w)
Coordenadas cilı́ndricas em R3
Dado um ponto P de coordenadas cartesianas (x, y, z), em R3 \ {(0, 0, z) : z ∈ R}, a (r, θ, z) com

 x = r cos θ

y = r sin θ com r ∈ ]0, +∞[, θ ∈ [0, 2π[, z ∈ R,

 z = z,
chamamos as coordenadas cilı́ndricas de P , considerando (r, θ) as coordenadas polares de (x, y).

Mudar de variáveis cartesianas para coordenadas cilı́ndricas, nas condições do Teorema 3.9, implica
considerar a transformação seguinte
T :]0, +∞[×]0, 2π[×R → R3 , (r, θ, z) 7→ (r cos θ, r sin θ, z), (23)
que é uma aplicação de classe C 1,
definida no aberto ]0, +∞[×]0, 2π[×R e que é uma bijecção sobre
3
V = R \ {(x, 0, z) : x ≥ 0, z ∈ R} (cf. exercı́cio 27 da Ficha 3). Além disso, temos que
∂(x, y, z)
= r.
∂(r, θ, z)
Nestas condições o Teorema 3.9 diz-nos que, dado f um campo escalar integrável em Ω,
Z Z
f (x, y, z) dx dy dz = f (r cos θ, r sin θ, z) r dr dθ dz,
Ω D
com Ω a imagem da região D por meio da transformação anterior.
À semelhança do que se passa em R2 com as coordenadas polares, alguns conjuntos Ω ⊂ R3 não
são abrangidos por esta mudança de variáveis, nomeadamente aqueles que são atravessados pelo semi-
plano P = {(x, 0, z) : x ≥ 0, z ∈ R}. No entanto, T dada por (23) pode ser considerada no conjunto
W = [0, +∞[×[0, 2π] × R, cuja fronteira se prova ter medida nula e o semi-plano P , que também
se prova ter medida nula, é a imagem de ({0} × [0, 2π] × R) ∪ ([0, +∞[×{0} × R), por meio de T ,
tendo-se T (W ) = R3 . Assim, as coordenadas cilı́ndricas podem ser utilizadas na mudança de variáveis
num integral triplo, considerado um qualquer subconjunto mensurável Ω de R3 , ou seja, podemos
considerar a expressão designatória de T dada em (23) definida em W . Escrevemos então

 x = r cos θ

∂(x, y, z)
y = r sin θ r ≥ 0, θ ∈ [0, 2π], z ∈ R, = r.
Coordenadas Cilı́ndricas 
 z = z, ∂(r, θ, z)
(r2 = x2 + y 2 )
78
Observações.
1) O cilindro que em coordenadas cartesianas é o conjunto {(x, y, z) ∈ R3 : x2 + y 2 ≤ 4, 0 ≤ z ≤ 5},
em coordenadas cilı́ndricas é o paralelepı́pedo
{(r, θ, z) : 0 ≤ r ≤ 2, 0 ≤ θ ≤ 2π, 0 ≤ z ≤ 5}.
Genericamente, cilindros cujo eixo de simetria é o eixo dos zz são os transformados de paralelepı́pedos
pela aplicação (23) (considerada em W), daı́ o nome deste sistema de coordenadas.
2) As imagens por meio de T de conjuntos que em coordenadas cilı́ndricas têm uma das coordenadas
constantes são uma superfı́cie cilı́ndrica (r constante), um semi-plano perpendicular ao plano z = 0
(θ constante) e um plano paralelo a z = 0 (z constante), respectivamente dados por
T ({(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : r = r0 }) = {(x, y, z) ∈ R3 : x2 + y 2 = r02 },
T ({(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : θ = θ0 }) = {(x, y, z) ∈ R3 : x = r cos θ0 , y = r sin θ0 , r ≥ 0} e

T ({(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : z = z0 }) = {(x, y, z) ∈ R3 : z = z0 }.
A figura que se segue ilustra as três situações que acabámos de descrever.
Este sistema de coordenadas é particularmente útil quando a região de integração envolve porções
de cilindros, parabolóides ou cones, entre outras regiões.
3) Em R3 , os pares de condições (x2 + y 2 ≤ 1 e −4 ≤ z ≤ 3) e (y 2 + z 2 ≤ 1 e 2 ≤ x ≤ 7) definem, em

coordenadas cartesianas, cilindros, cujos eixos de simetria são as rectas y = 0 ∧ x = 0 (eixo dos zz) e
y = 0 ∧ z = 0 (eixo dos xx), respectivamente. Observamos que a transformação (23) é adequada para
que o primeiro cilindro seja imagem de um paralelepı́pedo, mas o mesmo não acontece com o segundo.
No entanto, se considerarmos a transformação dada por

 x=x

y = r cos θ x ∈ R, r ≥ 0, θ ∈ [0, 2π[ (24)

 z = r sin θ,
já obtemos essa relação, isto é, o segundo cilindro é a imagem por meio da aplicação em (24) do
paralelepı́pedo [2, 7] × [0, 1] × [0, 2π[. Assim, o nome “coordenadas cilı́ndricas” não é apenas atribuı́do
à transformação que figura em (23), mas a qualquer uma em que cilindros de R3 sejam os transformados
de paralelepı́pedos, como a que está definida em (24).
79
Exemplos.
1) Seja Ω o sólido limitado pela superfı́cie cilı́ndrica x2 + y 2 = 1, pelo plano z = 4 e p
pelo parabolóide
z = 1 − x2 − y 2 . Sabendo que a densidade de Ω é dada pela função µ(x, y, z) = x2 + y 2 , vamos
determinar a sua massa M .
Comecemos por escrever Ω em coordenadas cartesianas. Temos
Ω = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1, z ≥ 1 − x2 − y 2 , z ≤ 4}.
Por definição Z Z q
M= µ(x, y, z) dx dy dz = x2 + y 2 dx dy dz.
Ω Ω
Para calcular o integral anterior vamos usar mudança de variáveis. Atendendo ao tipo de superfı́cies
envolvidas (cilı́ndrica, parabolóide), vamos escolher coordenadas cilı́ndricas. Queremos determinar D,
tal que T (D) = Ω, onde T é a função definida em (23), considerada em W . Para tal, traduzimos as
condições que definem Ω em coordenadas cartesianas para o sistema de coordenadas escolhido. Vem
então
r≥0
x2 + y 2 ≤ 1 ⇔ r2 ≤ 1 ⇐⇒ 0 ≤ r ≤ 1,
1 − x2 − y 2 ≤ z ≤ 4 ⇔ 1 − r2 ≤ z ≤ 4.
Assim,
D = {(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : 0 ≤ r ≤ 1, 1 − r2 ≤ z ≤ 4}.
Observe-se que não obtivemos nenhuma restrição para θ, o que é natural se observarmos a repre-
sentação geométrica do conjunto Ω. Aplicando então a mudança de variáveis no integral, que também
requer apcomposição da função integranda com a função mudança de variáveis (neste caso a tradução
produz x2 + y 2 = r), vem
Z 2π Z 1 Z 4 Z 1 Z 4 Z 1
∂(x, y, z)
M= dθ dr r
dz = 2π dr r2 dz = 2π (4 − 1 + r2 )r2 dr
0 0 1−r2 ∂(r, θ, z) 0 1−r2 0
" #1
r5
Z 1
2 4 3 12π
= 2π 3r + r dr = 2π r + = .
0 5 0
5
É importante observar que neste caso a ordem pela qual se escrevem os integrais iterados não é
arbitrária. Da esquerda para a direita, o último integral a escrever (que será o primeiro a ser calculado)
é o relativo à variável z, pois esta varia entre dois gráficos, dependendo um deles da variável r. Quanto
aos outros dois não há obrigatoriedade na ordem de escrita, já que θ e r variam em intervalos. Como
a função integranda não depende de θ é mais cómodo escrever em primeiro lugar o integral relativo a
esta variável.
2) Calcular o volume do sólido S limitado pelo plano y = 4 e pelo parabolóide x2 + z 2 = y.

Temos que
S = {(x, y, z) ∈ R3 : x2 + z 2 ≤ y ≤ 4}
e Z
V (S) = 1 dx dy dz.
S
80
Para calcular o integral anterior, interessa-nos considerar a seguinte mudança de variáveis

 x = r cos θ

y=y r ≥ 0, y ∈ R, θ ∈ [0, 2π]

 z = r sin θ,
cujo módulo do jacobiano é r (verifique). Vamos determinar D, tal que T (D) = S, onde T é a função
acabada de definir. Para tal, traduzimos as condições que definem S em coordenadas cartesianas para
o sistema de coordenadas escolhido. Vem então
x2 + z 2 ≤ y ≤ 4 ⇔ r2 ≤ y ≤ 4.
Neste caso há uma condição escondida, que tem de ser tida em conta, a condição r2 ≤ 4. Atendendo
a que r ≥ 0, esta condição diz-nos que 0 ≤ r ≤ 2. Mais uma vez não obtivemos restrições para θ.
Podemos escrever
D = {(r, y, θ) ∈ [0, +∞[×R × [0, 2π] : 0 ≤ r ≤ 2, r2 ≤ y ≤ 4},
pelo que a aplicação do Teorema 3.9 implica

" #2
r4
Z 2π Z 2 Z 4 Z 2
3 2
V (S) = dθ dr r dy = 2π 4r − r dr = 2π 2r − = 2π (8 − 4) = 8π.
0 0 r2 0 4 0
Coordenadas esféricas em R3
Dado um ponto P ∈ R3 de coordenadas cartesianas (x, y, z), com (x, y) 6= (0, 0), definimos as suas
coordenadas esféricas (ρ, θ, φ), da forma que se segue: ρ é a distância euclidiana do ponto P à
origem, pelo que é dada por q
ρ= x2 + y 2 + z 2 ;
designando por OP 0 a projecção do segmento OP no plano xy, θ ∈ [0, 2π[ é o ângulo que o vector OP 0
faz com o semi-eixo positivo dos xx, medido a partir deste semi-eixo no sentido directo, e finalmente,
φ ∈ [0, π[ é o ângulo que o vector OP faz com o semi-eixo positivo dos zz, medido a partir do referido
semi-eixo (ver a figura que se segue). Tem-se então

 x = ρ cos θ sin φ

y = ρ sin θ sin φ ρ > 0, θ ∈ [0, 2π[, φ ∈]0, π[.

 z = ρ cos φ,
Tal como no caso das coordenadas cilı́ndricas, efectuar uma mudança de coordenadas cartesianas
para coordenadas esféricas nas condições do Teorema 3.9, implica considerar a transformação
81
T :]0, +∞[×]0, 2π[×]0, π[→ R3 ,
dada por
T (ρ, θ, φ) = (x(ρ, θ, φ), y(ρ, θ, φ), z(ρ, θ, φ)) = (ρ cos θ sin φ, ρ sin θ sin φ, ρ cos φ) (25)
que é uma bijecção de classe C 1 (definida num aberto) sobre V = R3 \ {(x, 0, z) : x ≥ 0, z ∈ R}, cujo
jacobiano é (cf. exercı́cio 32 da Ficha 3)
∂(x, y, z)
= −ρ2 sin φ.
∂(ρ, θ, φ)
Nestas condições o Teorema 3.9 diz-nos que
Z Z
f (x, y, z) dx dy dz = f (ρ cos θ sin φ, ρ sin θ sin φ, ρ cos φ) ρ2 sin φ dρ dθ dφ
Ω D
onde Ω é a imagem da região D por meio da transformação anterior e f é um campo escalar integrável
em Ω.
Tal como vimos no caso das coordenadas cilı́ndricas, os conjuntos que são atravessados pelo semi-
plano P = {(x, 0, z) : x ≥ 0, z ∈ R} não são abrangidos por esta mudança de variáveis. Analogamente,
T dada por (25) pode ser considerada num conjunto maior, neste caso E = [0, +∞[×[0, 2π] × [0, π],
tendo-se que P é a imagem de ({0} × [0, 2π] × [0, π]) ∪ ([0, +∞[×{0} × [0, π]) (conjunto que se prova
ter medida nula), e T (E) = R3 . Assim, também as coordenadas esféricas podem ser utilizadas na
mudança de variáveis num integral triplo, considerado um qualquer subconjunto mensurável de R3 ,
ou seja, podemos considerar a expressão designatória de T em (25) em E. Escrevemos então

 x = ρ cos θ sin φ

∂(x, y, z)

= ρ2 sin φ.

y = ρ sin θ sin φ, ρ ≥ 0, θ ∈ [0, 2π], φ ∈ [0, π],
Coord. Esféricas 
 z = ρ cos φ ∂(ρ, θ, φ)
(x2 + y 2 = ρ2 sin2 φ, x2 + y 2 + z 2 = ρ2 )
A figura que se segue ilustra os transformados, por T , dos conjuntos que resultam de fixar a
primeira (ρ = ρ0 ), a segunda (θ = θ0 ) e a terceira (φ = φ0 ) variáveis, respectivamente.
Exemplos.
1) A esfera que em coordenadas cartesianas é o conjunto
{(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ R2 }
é a imagem, por meio de T definida em (25), considerada em E, do paralelepı́pedo
[0, R] × [0, 2π] × [0, π],
que é o tipo de região por excelência para o cálculo de integrais triplos.
Estas coordenadas são particularmente úteis para o cálculo de integrais triplos em regiões limitadas
por (porções de) superfı́cies esféricas ou cones.
82
1
Z
2) Calcular 2 + y2 + z2
dV , onde B ⊂ R3 é a bola unitária, centrada na origem.
B 4 + x
Vamos calcular o integral usando coordenadas esféricas. Seja D, tal que T (D) = B, onde T é a
função definida em (25), considerada em E. Como B = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 1}, vem
D = {(ρ, θ, φ) ∈ [0, +∞[×[0, 2π] × [0, π] : 0 ≤ ρ ≤ 1}.
Aplicando o Teorema 3.9 obtemos
ρ2
Z 2π Z π Z 1
1 1
Z Z
dV = ρ2 sin φ dρ dθ dφ = dθ dφ sin φ dρ.
B 4 + x2 + y 2 + z 2 D 4 + ρ2 0 0 0 4 + ρ2
Podemos usar a propriedade (19) para calcular o integral triplo anterior e vem
ρ2
Z 2π Z π Z 1 Z 1 Z 1
4 1
dθ sin φ dφ dρ = 2π [− cos φ]π0 1− dρ = 4π 1− ρ 2
dρ
0 0 0 4 + ρ2 0 4 + ρ2 0 1+ 2
1
ρ 1

= 4π ρ − 2 arctan = 4π 1 − 2 arctan .
2 0 2
p
3) Calcular o volume do sólido G limitado inferiormente pelo cone z = x2 + y 2 e superiormente pela
superfı́cie esférica x2 + y 2 + z 2 = z.
O sólido G em coordenadas cartesianas é dado por
q
G = {(x, y, z) ∈ R3 : x2 + y 2 ≤ z, x2 + y 2 + z 2 ≤ z}
Z
e o seu volume é o valor de 1 dV . Vamos escrever as condições que descrevem o conjunto em
G
coordenadas esféricas. Assim, se ρ 6= 0,
q
φ∈[0,π] π
x2 + y 2 ≤ z ⇔ ρ sin φ ≤ ρ cos φ ⇐⇒ cos φ ≥ 0 ∧ 0 ≤ tan φ ≤ 1 ⇔ 0 ≤ φ ≤
4
e
ρ≥0
x2 + y 2 + z 2 ≤ z ⇔ ρ(ρ − cos φ) ≤ 0 ⇐⇒ 0 ≤ ρ ≤ cos φ.
Temos então G = T (D), com T definida em (25),
π
D = {(ρ, θ, φ) ∈ R3 : 0 ≤ θ ≤ 2π, 0 ≤ φ ≤ , 0 ≤ ρ ≤ cos φ }.
4
ρ varia entre 0 e cos φ φ varia entre 0 e π/4 θ varia entre 0 e 2π

83
O Teorema 3.9 garante que
π π
" #cos φ
ρ3
Z Z Z 2π Z Z cos φ Z
4 4
2 2
1dV = ρ sin φ dρ dθ dφ = dθ dφ ρ sin φ dρ = 2π sin φ dφ
G D 0 0 0 0 3 0
π iπ
2π 2π h π 4 π
Z
4
= sin φ cos3 φ dφ = − cos4 φ 4 = 1− = .
3 0 3×4 0 6 16 8
Z
4) Calcular o integral x2 + y 2 dV, onde S é dado por
S
1
S = {(x, y, z) ∈ R3 : y ≥ 0, x2 + y 2 + z 2 ≤ 4, x2 + y 2 ≥ 1, z 2 ≤ (x2 + y 2 )}.
3
Vamos usar coordenadas esféricas para calcular o integral pedido. Começamos por traduzir as condições
que definem S para o novo sistema de coordenadas:
(Semi-espaço) y ≥ 0 ⇔ ρ sin θ sin φ ≥ 0 ⇔ sin θ ≥ 0 ⇔ 0 ≤ θ ≤ π;

(Esfera) x2 + y 2 + z 2 ≤ 4 ⇔ ρ2 ≤ 4 ⇔ 0 ≤ ρ ≤ 2;
1
(Cilindro) x2 + y 2 ≥ 1 ⇔ ρ2 sin2 φ ≥ 1 ⇔ ρ ≥ ;
sin φ
1 1 π 2π
(Cone) z 2 ≤ (x2 + y 2 ) ⇔ ρ2 cos2 φ ≤ ρ2 sin2 φ ⇔ ≤ φ ≤ ,
3 3 3 3
1 √ √ π π 2π
(ρ2 cos2 φ ≤ ρ2 sin2 φ ⇔ tan2 φ ≥ 3∨cos φ = 0 ⇔ (tan φ ≥ 3 ∨ tan φ ≤ − 3)∨φ = ⇔ ≤ φ ≤ ),
3 2 3 3
observando que as desigualdades obtidas têm em conta as restrições φ ∈ [0, π] e ρ ≥ 0. Assim, o
domı́nio de integração nas novas coordenadas é
π 2π 1
D = {(ρ, θ, φ) : 0 ≤ θ ≤ π, ≤φ≤ , ≤ ρ ≤ 2},
3 3 sin φ
pelo que, por aplicação do Teorema 3.9, obtemos
Z Z Z π Z 2π Z 2
3
2 2 2 2 2
x + y dV = (ρ sin φ) ρ sin φ dρ dθ dφ = dθ dφ ρ4 sin3 φ dρ
π 1
S D 0 3 sin φ
2π
" #2 2π
ρ5 π 1
Z Z
3 3
3 3
=π sin φ dφ = sin φ 32 − dφ
π
3
5 1 5 π
3
sin5 φ
sin φ
2π 2π
!
π 1 π 2π
Z Z
3 3
3 2
= 32 sin φ − dφ = 32 sin φ(1 − cos φ) dφ + [cotan φ] π
3
5 π
3
sin2 φ 5 π
3
3
" # 2π 2π
π 32 cos3 φ 3
π cos φ π 8 2

3
= −32 cos φ + + = 32 − − √ .
5 3 π 5 sin φ π 5 3 3
3 3
84
Anexo 1: Superfı́cies quádricas
x2 y 2 z 2
Elipsóide + 2 + 2 =1
a2 b c
x2 y 2 z 2
Hiperbolóide de uma folha + 2 − 2 =1
a2 b c
z 2 x2 y 2
Hiperbolóide de duas folhas − 2 − 2 =1
c2 a b
Parabolóide elı́ptico z = a2 x2 + b2 y 2
Parabolóide hiperbólico z = a2 x2 − b2 y 2
85
Cilindros
x2 y 2
Elı́ptico + 2 =1
a2 b
x2 y 2
Hiperbólico − 2 =1
a2 b
Parabólico y = kx2
x2 y 2 z 2
Cone + 2 − 2 =0
a2 b c
Que superfı́cies são estas?
86
Anexo 2: Software
São várias as ferramentas online que permitem o cálculo de integrais múltiplos. Aqui ficam duas
referências.
Wolfram Alpha
https://www.wolframalpha.com/examples/mathematics/calculus-and-analysis/integrals/
Symbolab
http://pt.symbolab.com/solver/double-integrals-calculator
87
Análise Mat. II e Cálculo Dif. e Int. II Ana Rute Domingos e Ana Cristina Barroso
88

ResumoTeorico - AM - 2-CDI - 2 - Cap1,2,3 - 19-20

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

ResumoTeorico - AM - 2-CDI - 2 - Cap1,2,3 - 19-20

Enviado por

Direitos autorais:

Formatos disponíveis

Análise Matemática II

Ana Rute Domingos e Ana Cristina Barroso

Este é o segundo curso de Análise/Cálculo para os cursos do DM e do DF da FCUL, onde traba-

Introdução Ana Rute Domingos e Ana Cristina Barroso

1.1 Funções vectoriais de uma variável: limites, continuidade, derivadas e inte-

r : D ⊆ R → Rn , t 7→ r(t) = (r1 (t), r2 (t), . . . , rn (t)),

ficam definidas n funções reais de variável real ri : D ⊆ R → R, t 7→ ri (t), com i = 1, . . . , n, a que

∀δ > 0 ∃ ε > 0 : 0 < |t − t0 | < ε ⇒ kr(t) − Lk < δ.

Proposição 1.2 Se lim r(t) = L, então lim kr(t)k = kLk.

lim |kr(t)k − kLk| = 0,

ii) lim (cu(t)) = c lim u(t), ∀c ∈ R;

iii) lim f (t)u(t) = lim f (t) lim u(t);

Definição 1.5 Seja r : D ⊆ R → Rn e t0 ∈ D. A função r diz-se contı́nua em t0 se, e só se,

teral à esquerda em b, e representa-se por r− (b), tomando no limite h → 0 e h → 0− , respectivamente.

É fácil ver que se r é diferenciável em t, então r é contı́nua em t (exercı́cio).

r0 (t0 ) = (r10 (t0 ), r20 (t0 ), . . . , rn0 (t0 )).

Exemplo. Seja r(t) = (t2 + 2 arctan(3t), cos(sin(3t7 ))), com t ∈ R. Então

Teorema 1.10 Sejam u, v : ]a, b[ → Rn , f : ]a, b[ → R e c ∈ R. Se u, v e f forem diferenciáveis em

Dizemos que a relação

Teorema 1.13 Sejam u, v : [a, b] ⊆ R → Rn funções contı́nuas, α ∈ R e c ∈ Rn um vector constante.

Exemplo. Seja r(t) = (t cos t2 , e5t ). Temos então

usando agora a desigualdade de Cauchy-Schwarz no último integral obtemos

1.2 Curvas no plano e no espaço

Γ = {(cos t, sin t) : t ∈ [0, 2π[}.

Definição 1.14 Chamamos linha parametrizada ou trajectória parametrizada a qualquer fun-

Estamos particularmente interessados nos casos em que n = 2 e n = 3 correspondentes às chamadas

Proposição 1.17 Sejam I e J intervalos de R. Uma aplicação bijectiva α : J → I, de classe C 1 é

Vector tangente, recta tangente

Definição 1.23 Dizemos que uma linha parametrizada γ : I → Rn diferenciável em I é regular se

Seja γ : I → R3 uma linha parametrizada regular. Podemos considerar o vector

a = t0 < t1 < t2 < . . . < tn−1 < tn = b.

Demonstração. Como γ2 é uma reparametrização de γ1 , existe uma mudança de parâmetro

O caso em que α0 < 0 é análogo.

Em R2 , a fórmula para o cálculo do comprimento do gráfico C de uma função f : [a, b] → R de classe

Esta função dá-nos o comprimento do arco de γ entre os pontos γ(a) e γ(t).

Como γ é regular, então s é invertı́vel (s0 > 0). À parametrização

r : [0, L(C)] → Rn , r(t) = γ ◦ s−1 (t)

chamamos parametrização de C (ou de γ) pelo comprimento de arco.

Proposição 1.28 Se γ : [0, b] → Rn é uma parametrização, de classe C 1 , de uma curva C com

Os resultados anteriores ilustram as propriedades geométricas que a parametrização pelo compri-

que a cada x = (x1 , x2 , . . . , xn ) ∈ Rn fazem corresponder o elemento de Rm dado por

(f1 (x1 , x2 , . . . , xn ), f2 (x1 , x2 , . . . , xn ), . . . , fm (x1 , x2 , . . . , xn )),

que se designa por imagem de x por meio de f .

para i = 1, . . . , m, chamamos funções componentes de f .

Dado um subconjunto A ⊆ D, chama-se imagem de A por meio de f ao conjunto

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos

Definição 2.4 Dado um conjunto Ω ⊆ Rn , um ponto x0 ∈ Rn diz-se interior a Ω se existe um

x0 é ponto interior a Ω x0 é ponto fronteiro a Ω

Na figura acima, o conjunto mais à esquerda definido por

é aberto, o do meio dado por

é fechado (e compacto) e o conjunto mais à direita

não é aberto nem fechado.

∀δ > 0 ∃ k ∈ N : n ≥ k ⇒ kun − uk < δ.

Teorema 2.8 Seja (un ) = (u1n , u2n , . . . , um m

1. Se lim un = a e lim un = b, então a = b.

2. Se (un ) é uma sucessão convergente, então (un ) é limitada.

Definição 2.9 (Cauchy) Seja f : D ⊆ Rn → Rm e seja a ∈ D0 . Dizemos que o limite de f (x),

se, e só se,

Definição 2.12 Seja f : D ⊆ Rn → Rm e seja A ⊆ D. A restrição de f ao conjunto A é a função

pelo que basta tomar ε = δ.

Teorema 2.14 (Enquadramento) Sejam f, g, h : D ⊆ Rn → R funções escalares definidas num