Escolar Documentos
Profissional Documentos
Cultura Documentos
e
Cálculo Diferencial e Integral II
Resumo teórico
2019/2020
Cursos: Matemática
Matemática Aplicada
Engenharia Biomédica e Biofı́sica
Engenharia Fı́sica
Fı́sica
Conteúdo
Introdução
1. Funções vectoriais de uma variável
2. Cálculo Diferencial em Rn
3. Cálculo Integral em Rn
4. Análise Vectorial
1
Introdução
2
1 Funções vectoriais de uma variável
Motivação
Podemos descrever o movimento de uma partı́cula no espaço associando a cada instante de um certo
intervalo de tempo o ponto do espaço que a referida partı́cula ocupa no referido instante. Esta descrição
constitui uma função vectorial (a imagem de cada objecto é um vector) de variável real (o tempo). No
seu movimento a partı́cula traça um objecto geométrico que corresponde à ideia intuitiva de curva.
Neste capı́tulo estamos interessados neste tipo de funções que nos ajudam, como na situação
anterior, a descrever situações fı́sicas e a estudar alguns objectos geométricos - as curvas. Vamos
formular estes conceitos matemáticos e estudar algumas das suas propriedades.
Demonstração. Começamos por observar que se tem 0 ≤ | kr(t)k − kLk | ≤ kr(t) − Lk, para todo o
t ∈ D.
Por definição, dizer que limt→t0 r(t) = L é equivalente a dizer que limt→t0 kr(t)−Lk = 0. Atendendo
à observação efectuada e ao Teorema do enquadramento, obtemos
logo limt→t0 (kr(t)k − kLk) = 0, ou seja limt→t0 kr(t)k = kLk, o que termina a prova da proposição.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
3
O próximo resultado reveste-se de uma grande importância prática e diz-nos que os limites das
funções vectoriais se calculam componente a componente, reduzindo-se ao cálculo de n limites de
funções reais de variável real.
Teorema 1.3 Sejam r : D ⊆ R → Rn uma função vectorial de variável real, t0 ∈ D0 e
L = (L1 , . . . , Ln ) ∈ Rn . Então
lim r(t) = L ⇔ lim ri (t) = Li , ∀i = 1, . . . , n.
t→t0 t→t0
!
e2t − 1 t2 + 6 sin t t
Exemplo. Seja r(t) = , 2 , . Temos que
3t t − πt log(1 + 5t)
!
e2t − 1 t2 + 6 sin t t
lim r(t) = lim , lim 2 , lim
t→0 t→0 3t t→0 t − πt t→0 log(1 + 5t)
2t 2t + 6 cos t t 2 6 1
= lim , lim , lim = ,− , .
t→0 3t t→0 2t − π t→0 5t 3 π 5
No resultado anterior podemos considerar t0 = ±∞, se t0 ∈ D0 (em R), estendendo-se desta forma
o conceito de limite de uma função vectorial de variável real ao caso em que o ponto é o infinito. Deste
teorema conclui-se também que as propriedades algébricas dos limites de funções de R em R também
são válidas para funções de R em Rn , como se enuncia seguidamente.
Teorema 1.4 Sejam u, v : D ⊆ R → Rn funções vectoriais de variável real, f : D → R uma função
real de variável real e t0 ∈ D0 . Suponhamos que existem os limites lim u(t), lim v(t) em Rn , e
t→t0 t→t0
limt→t0 f (t) em R. Então tem-se:
i) lim (u(t) + v(t)) = lim u(t) + lim v(t);
t→t0 t→t0 t→t0
iv) lim u(t) · v(t) = lim u(t) · lim v(t), onde · representa um produto interno em Rn .
t→t0 t→t0 t→t0
A definição anterior conjugada com o Teorema 2.11 permite trabalhar a continuidade componente
a componente.
Teorema 1.6 Seja r : D ⊆ R → Rn e t0 ∈ D ∩ D0 . Então r é contı́nua em t0 se, e só se, as suas
funções componentes ri forem contı́nuas em t0 , ∀i = 1, . . . , n.
A continuidade das funções que resultam de operações algébricas e da composição entre funções
contı́nuas é descrita no próximo resultado.
Teorema 1.7 Sejam u, v : D ⊆ R → Rn , f : D ⊆ R → R e g : E ⊆ R → R tal que g(E) ⊆ D. Então:
i) se u, v e f são contı́nuas em a ∈ D, o mesmo sucede a kuk, u + v, f u e u · v, onde · representa
um produto interno;
ii) se g é contı́nua em a ∈ E e u é contı́nua em g(a) ∈ D, então u ◦ g é contı́nua em a.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
4
Definição 1.8 Dada uma função vectorial de variável real r : I = ]a, b[ → Rn a derivada de r no
ponto t ∈ I é dada por
dr r(t + h) − r(t)
(t) = r0 (t) = lim
dt h→0 h
se este limite existir. Neste caso dizemos que a função r é diferenciável em t.
Analogamente define-se a derivada lateral à direita em a, e representa-se por r+ 0 (a), e a derivada la-
Teorema 1.9 Seja r : ]a, b[ → Rn uma função vectorial de variável real, seja t0 ∈ ]a, b[ e suponhamos
que todas as funções componentes de r, ri : ]a, b[ → R, i = 1, . . . , n, são diferenciáveis em t0 . Então r
é diferenciável em t0 e tem-se
Este teorema diz-nos que r0 (t) é o vector cujas componentes são as derivadas das funções ri ,
i = 1, . . . , n. Consequentemente todas as fórmulas e métodos usados para calcular derivadas de funções
reais de variável real podem ser usados para calcular derivadas de funções vectoriais de variável real,
aplicados componente a componente, como se ilustra no exemplo que se segue.
r(t0 + h) − r(t0 )
Demonstração do Teorema 1.9. Por definição temos r0 (t0 ) = lim . Vem então
h→0 h
1
r0 (t0 ) = lim (r1 (t0 + h) − r1 (t0 ), . . . , rn (t0 + h) − rn (t0 ))
h→0 h
r1 (t0 + h) − r1 (t0 ) rn (t0 + h) − rn (t0 )
= lim , . . . , lim = (r10 (t0 ), . . . , rn0 (t0 )).
h→0 h h→0 h
As propriedades algébricas da derivação das funções vectoriais de variável real estão reunidas no
próximo teorema.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
5
Também para as funções em estudo neste capı́tulo podemos definir derivadas de ordem superior a
um. Veja-se a definição que se segue.
Definição 1.11 Seja r : [a, b] → Rn , com r(t) = (r1 (t), . . . , rn (t)), uma função vectorial de variável
real. Dizemos que r é de classe C k , com k ≥ 1, em [a, b], se todas as suas componentes são funções
reais de variável real de classe C k em [a, b].
Definição 1.12 Seja r : [a, b] ⊆ R → Rn , t 7→ (r1 (t), r2 (t), . . . , rn (t)) uma função vectorial de variável
real contı́nua. Para cada t ∈ [a, b] definimos
Z t Z t Z t Z t
r(s) ds = r1 (s) ds, r2 (s) ds, . . . , rn (s) ds .
a a a a
Z 0
Da definição anterior resulta imediatamente que r(t) dt = r(t). Além disso, se R é uma
primitiva de r, então R + C, com C ∈ Rn , também é uma primitiva de r.
Temos também que o integral duma função vectorial de variável real r é o vector cujas componentes
são os integrais das funções componentes de r. Assim, a linearidade do integral de funções vectori-
ais de variável real é uma das suas propriedades naturais e que está listada no próximo teorema,
conjuntamente com outras.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
6
Demonstração do Teorema 1.13. A prova das propriedades de i) a iii) é um exercı́cio simples.
Vejamos a prova de iv).
Z b
Seja U = u(t) dt ∈ Rn . Se U = 0Rn , o resultado é trivialmente verificado. Vejamos o caso em
a
que U não é o vector nulo. Atendendo à definição de norma e às propriedades dos integrais vem
Z b Z b Z Z
iii)
b b
2
kU k = U · U = U · u(t) dt = U · u(t) dt ≤ U · u(t) dt ≤ |U · u(t)| dt,
a a a a
logo
Z
Z
Z b
b
b
kU k ≤ ku(t)k dt ⇐⇒
u(t) dt
≤ ku(t)k dt.
a
a
a
Dizemos que descrição anterior é uma parametrização de Γ e temos então uma função vectorial de
variável real, t 7→ (cos t, sin t), a que chamamos linha parametrizada.
Seja n ∈ N2 . No que se segue vamos considerar funções vectoriais de variável real γ : I ⊆ R → Rn
definidas e contı́nuas num intervalo real I, que consideramos sempre não degenerado (com mais do
que um ponto).
Por uma questão de simplificação de linguagem é frequente usarmos apenas os vocábulos linha ou
trajectória, omitido-se a designação parametrizada. Observamos que as designações para os conceitos
anteriores (linha, trajectória, curva, caminho) podem variar de autor para autor.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
7
Exemplos. 1) γ : R → R3 , γ(t) = (t5 , 8t, et ) é uma linha parametrizada e γ(R) uma curva.
2) γ : [0, 5] → R2 , γ(t) = (cos t, log(t2 + 1)) é um caminho; γ(0) = (1, 0) é o ponto inicial e
γ(5) = (cos 5, log 26) o ponto final.
Definição 1.15 Uma curva C, traço de uma linha γ, diz-se uma curva simples se não se intersec-
tar. No caso de C ser o traço de um caminho, a curva diz-se simples se não se intersectar excepto
possivelmente nos seus extremos.
Curva fechada e não simples Curva fechada e simples Curva simples Curva não simples
8
3) Gráfico de uma função r.v.r. contı́nua
Seja f : [a, b] → R uma função contı́nua. Uma parametrização do gráfico de f é
γ : [a, b] → R2 ,
γ(t) = (t, f (t)).
√
4) Considere-se o caminho γ : [−2, 2] → R2 , dado por γ(t) = (t, 4 − t2 ). As equações paramétricas
associadas são: (
x=√ t
y = 4 − t2 , t ∈ [−2, 2].
√
De y = 4 − x2 , vem y 2 + x2 = 4, com x ∈ [−2, 2] e y ≥ 0, ou seja, o traço deste caminho é a
semi-circunferência de centro na origem, raio 2, com inı́cio no ponto (−2, 0) e final no ponto (2, 0),
percorrida no sentido dos ponteiros do relógio.
5) Uma parametrização da circunferência em R2 , com centro em (a, b), raio R, descrita no
sentido directo (sentido contrário ao dos ponteiros do relógio), uma única vez é
γ : [0, 2π] → R2 , γ(θ) = (a + R cos θ, b + R sin θ).
6) O traço do caminho
γ : [0, 2π] → R3 , γ(θ) = (1 + 7 cos θ, 5, −7 sin θ).
é a circunferência do plano y = 5, centrada no ponto (1, 5, 0) e de raio 7.
7) O traço da linha γ(t) = (3 cos t, 3 sin t, t), t ∈ [0, +∞[ é uma hélice circular, que não é uma curva
plana (encontra-se sobre um cilindro).
É importante perceber que os conceitos de linha parametrizada (função vectorial) e de traço da
linha (curva) são distintos. A linha parametrizada contém informação que o seu traço não tem. Por
exemplo, sejam γ1 (t) = (cos t, sin t) e γ2 (t) = (cos(10t), sin(10t)), com t ∈ [0, 2π]. O traço de ambas
as linhas γ1 e γ2 é a circunferência de centro na origem e raio 1. No entanto, enquanto que a linha γ1
apenas traça a circunferência uma só vez, a linha γ2 passa 10 vezes em cada ponto da circunferência, e
como o faz no mesmo intervalo, significa que o seu “movimento” é dez vezes mais rápido. Este exemplo
ilustra o facto da linha parametrizada conter informação sobre a forma como a curva é traçada.
Definição 1.16 Chama-se mudança de parâmetro a uma aplicação bijectiva α : J → I, de classe
C 1 , com inversa também C 1 , onde J e I são intervalos de R.
Dadas γ : I → Rn uma linha parametrizada e α : J → I uma mudança de parâmetro, à linha
parametrizada γ ◦ α chama-se uma reparametrização de γ (por meio de α). Também se diz uma
reparametrização da curva γ(I).
Observação. Dada γ : [a, b] → Rn uma linha parametrizada, é sempre possı́vel definir uma parametri-
zação γ̃ com o mesmo traço de γ, definida num intervalo dado [c, d], considerando
t−c
γ̃(t) = γ a + d−c (b − a) . Assim, γ̃ é uma reparametrização de γ.
Exemplo. Sejam J = [1, 2], I = [0, log 2] e α : J → I, dada por α(t) = log t. Como α é bijectiva, de
classe C 1 e α0 (t) = 1t > 0, para todo o t ∈ J, então α é uma mudança de parâmetro.
As mudanças de parâmetro de uma mesma linha agrupam-se em dois conjuntos, aquelas cuja
derivada é positiva e aquelas em que a derivada é negativa. Dizemos que a mudança de parâmetro,
no primeiro caso preserva a orientação da linha, e no segundo caso que inverte a orientação da
linha.
Ao conjunto de todas as reparametrizações de uma linha obtidas por uma mudança de parâmetro que
preserva a orientação da linha inicial chama-se uma linha ou trajectória orientada.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
9
Definição 1.18 (Caminho inverso) Seja γ : [a, b] → Rn um caminho. Define-se o caminho in-
verso ou oposto, e representa-se por (−γ) o caminho definido por (−γ)(t) = γ(a + b − t), com
t ∈ [a, b].
O ponto inicial de (−γ) é o ponto final de γ e vice-versa. Geometricamente não há distinção entre o
traço dos dois caminhos. Intuitivamente, (−γ) interpreta-se como sendo o caminho γ percorrido no
sentido inverso.
Exemplo. Seja γ1 : [0, π] → R2 , γ1 (t) = (1 + 2 cos t, −1 + 2 sin t). Atendendo à definição, o caminho
inverso da linha anterior é o caminho dado por (−γ1 ) : [0, π] → R2 ,
(−γ1 )(t) = γ1 (0 + π − t) = (1 + 2 cos(π − t), −1 + 2 sin(π − t)) = (1 − 2 cos t, −1 + 2 sin t).
O traço de uma linha parametrizada pode ser um objecto geométrico que nada tem a ver com
a ideia intuitiva que temos de curva. Peano, em 1890, construiu uma linha parametrizada, definida
no intervalo [0, 1] e cujo traço é todo o quadrado [0, 1] × [0, 1]! Há muitos outros exemplos de linhas
parametrizadas cujo traço não coincide com a noção intuitiva de curva. Quando se impõe mais
regularidade a uma linha parametrizada pedindo, por exemplo, que seja pelo menos de classe C 2 (é
natural supor que a “operação” de traçar uma curva num papel possa ser modelada por uma função
vectorial contı́nua que represente a força que a mão exerce sobre a caneta e é razoável supor que o
movimento da ponta da caneta obedeça à 2.a lei de Newton (F = m · a), descrevendo, portanto, uma
trajectória cuja segunda derivada (aceleração) é proporcional à força) e que a primeira derivada não
se anule, então pode provar-se que o seu traço corresponde localmente à ideia intuitiva que temos de
curva. A discussão formal e rigorosa destas ideias sai fora do âmbito do nosso curso.
Em geral, vamos trabalhar com linhas que tenham alguma regularidade e cujo traço se insere na
noção intuitiva que temos de curva.
Definição 1.19 Uma linha parametrizada γ : [a, b] → Rn diz-se seccionalmente de classe C 1
(abreviadamente secc. C 1 ) ou de classe C 1 por troços se γ é contı́nua em [a, b] e existe um número
finito de pontos a = t0 < t1 < t2 < . . . < tp < tp+1 = b tais que γ|[ti ,ti+1 ] é de classe C 1 , para
i = 0, . . . , p.
Observação. É importante não confundir a regularidade de uma linha parametrizada com a regula-
ridade do seu traço. A primeira diz respeito à regularidade de uma função (a linha parametrizada) e
a segunda ao objecto geométrico que é a imagem da função. Observe-se que o traço de uma linha não
é o seu gráfico. Se γ é uma linha parametrizada com valores em Rn , o seu gráfico é um conjunto de
Rn+1 , enquanto que o seu traço é um objecto de Rn . O exercı́cio 18 da Ficha 1 põe em evidência a
distinção entre a regularidade dos dois objectos matemáticos – a linha e a curva, através do exemplo
que trabalha.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
10
À medida que h converge para zero a corda associada ao vector anterior torna-se paralela à recta que
corresponde à noção intuitiva que temos de recta tangente a uma curva, neste caso à curva r(I) no
ponto r(t). Assim, a recta tangente à curva terá a direcção do vector
r(t + h) − r(t)
lim = r0 (t). (1)
h→0 h
Esta interpretação geométrica está na base das próximas definições.
Definição 1.20 Seja r : I ⊆ R → Rn uma linha parametrizada. Se r é diferenciável em t0 ∈ I e
r0 (t0 ) 6= 0, a r0 (t0 ) chamamos vector tangente à curva r(I) no ponto r(t0 ).
A recta tangente à curva definida pela linha parametrizada r, diferenciável em t0 , com r0 (t0 ) 6= 0,
no ponto P = r(t0 ), é a recta que passa pelo ponto P e tem a direcção do vector r0 (t0 ).
Exemplos. 1) Determinar uma equação da recta tangente à curva descrita por r(t) = (t, t2 , t3 ) no
ponto (2, 4, 8) implica, neste caso, determinar em primeiro lugar qual é o instante no qual a linha
assume o valor (2, 4, 8) (a curva em causa é simples, pelo que neste caso há um único instante nestas
condições) e o cálculo da derivada de r nesse instante. É fácil ver temos r(2) = (2, 4, 8). Como
r0 (2) = (1, 4, 12), uma equação da recta referida é
(x, y, z) = (2, 4, 8) + λ(1, 4, 12), λ ∈ R.
2) Considere-se a curva C descrita
√ pela parametrização
√ r(t) = (t2 , t3 − 3t), com t ∈ R. Esta curva não
é simples, observe-se que r( 3) = (3, 0) = r(− 3). Neste exemplo há duas rectas tangentes a C no
ponto (3, 0), que diferenciamos referindo
√ qual
√ é o instante
√ em que√a linha passa naquele ponto. Como
0 2
r (t) = (2t, 3t − 3), temos √ 0 0
r (− 3) = (−2 3, 6) e r ( 3) = (2 3, 6), donde uma equação da recta
tangente a C no ponto r(− 3) = (3, 0) é
√
(x, y) = (3, 0) + λ(−2 3, 6), λ ∈ R
√
e uma equação da recta tangente a C no ponto r( 3) = (3, 0) é
√
(x, y) = (3, 0) + λ(2 3, 6), λ ∈ R.
Observamos que há casos de curvas que não são simples e em que há apenas uma recta tangente em
pontos por onde a linha passa mais do que uma vez. Fica como exercı́cio encontrar um exemplo.
Considerando agora a interpretação cinemática das linhas parametrizadas, tomando r(t) o vector
posição do ponto P e h > 0 no limite (1), observe-se que o vector r(t + h) − r(t) tem o mesmo sentido
do movimento; tomando h < 0, o vector r(t + h) − r(t) tem sentido contrário ao do movimento, mas
dividido por h, passa a ter o sentido do movimento.
Então, em qualquer dos casos, r0 (t) aponta na direcção e sentido em que t aumenta.
Se γ é uma linha parametrizada definida num intervalo I, tal que existe γ 0 (t) e γ 00 (t), num certo
t ∈ I, é usual usar a seguinte terminologia que vem da Mecânica: a γ 0 (t) chama-se vector velocidade
ou simplesmente velocidade em t, a kγ 0 (t)k chama-se velocidade escalar em t, a γ 00 (t) chama-se
vector aceleração ou simplesmente aceleração em t. Usam-se as notações
v(t) := γ 0 (t), a(t) := v 0 (t) = γ 00 (t).
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
11
Os próximos exercı́cios exemplificam situações relativas à terminologia referida.
Exercı́cio 1.21 Sejam c > 0 e ω ∈ ]0, π2 [. Um projéctil é lançado da posição (0, 0) e tem um traçado
parabólico descrito por
γ(t) = ((cos ω)t, (sin ω)t − ct2 ), t ≥ 0.
1. Verifique que o traço da linha é uma porção de parábola e que ω é o ângulo de lançamento do
projéctil com o solo.
(O ângulo de lançamento é o arco-tangente do declive da recta tangente à curva no ponto em
questão.)
2. Qual o ângulo de lançamento que maximiza o alcance do projéctil?
1 π
3. Para c = 2 eω= 4 determine uma equação da recta tangente à curva no instante t = 1.
Exercı́cio 1.22 Um ponto move-se no plano de tal modo que a sua velocidade (vectorial) é dada em
log(t − 1)
função do tempo por v(t) = 3e3(t−2) , , com t ∈ [2, +∞[. Sabendo que a sua posição no
t−1
instante t = 2 é (0, 2), determine a trajectória r(t) da partı́cula.
Comprimento de arco
Consideremos agora uma linha parametrizada definida num intervalo I. Vejamos como calcular o
comprimento da porção C = γ([a, b]), da curva γ(I), com [a, b] ⊂ I.
Para esse efeito consideramos uma partição do intervalo [a, b], isto é, consideramos pontos ti tais
que
Para cada ponto ti da partição calculamos γ(ti ) e determinamos Pi , o ponto correspondente na curva.
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
12
Seguidamente consideramos os segmentos de recta que unem os pontos Pi−1 a Pi , i = 1, . . . , n.
Adicionando os comprimentos de todos estes segmentos obtemos o comprimento de uma linha poligonal
dado por
n
X
kγ(ti ) − γ(ti−1 )k.
i=1
Define-se o comprimento da curva C, e representa-se por L(C), como sendo o supremo dos com-
primentos de todas as linhas poligonais assim obtidas. É intuitivo perceber que quanto mais pontos
tiver a linha poligonal melhor o seu comprimento aproxima o comprimento da curva, pelo que a
definição anterior é natural, embora não nos dê uma forma expedita de calcular comprimentos de
Z b
curvas. Prova-se que a soma anterior se relaciona com o valor kγ 0 (t)k dt, como veremos adiante.
a
A próxima proposição diz-nos que o integral da norma da derivada de uma linha é invariante por
reparametrização.
Proposição 1.24 Seja γ1 uma linha de classe C 1 em [a, b] e γ2 : [c, d] → Rn uma reparametrização
de γ1 . Então
Z b Z d
kγ10 (t)k dt = kγ20 (t)k dt.
a c
γ20 (u)
Como γ20 (u) = γ10 (α(u))α0 (u), então γ10 (α(u)) = . Dos cálculos anteriores resulta que
α0 (u)
Z d
0
kγ20 (u)k 0
Z b
Z d Z d
γ2 (u)
0
kγ10 (t)k dt =
α (u) du =
α0 (u)
α (u) du = kγ20 (t)k dt.
a c c α0 (u) c
Quando a linha é de classe C 1 o resultado anterior permite-nos ter uma forma “simples” (tão
simples quão simples for primitivar kγ 0 (t)k) de calcular o comprimento da curva respectiva, como está
enunciado no próximo teorema.
Teorema 1.25 Seja γ uma linha de classe C 1 em [a, b]. O comprimento da curva C = γ([a, b]) é
dado por
Z b
L(C) = kγ 0 (t)k dt.
a
Nos casos particulares n = 2 com γ(t) = (x(t), y(t)) e n = 3 com γ(t) = (x(t), y(t), z(t)), o
comprimento da linha é dado, respectivamente, por
Z bq Z bq
[x0 (t)]2 + [y 0 (t)]2 dt e [x0 (t)]2 + [y 0 (t)]2 + [z 0 (t)]2 dt.
a a
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
13
2
√
Exemplo. Vamos calcular o comprimento do gráfico da função f (x) = x3 , com x ∈ [0, 3]. Como
√ 3
f 0 (x) = x, vem
Z 3q Z 3q
√ Z 3√
2
3
14
L= 1 + [f 0 (x)]2 dx = 1 + ( x)2 dx = 1 + x dx = (1 + x)3/2 = .
0 0 0 3 0 3
Definição 1.26 Seja γ uma linha parametrizada e de classe C 1 num intervalo I. Dado a ∈ I, define-
se a função comprimento de arco da forma seguinte
Z t
s(t) = kγ 0 (u)k du, a ≤ t, t ∈ I.
a
Sejam γ : [a, b] → Rn uma linha parametrizada, de classe C 1 , regular, e C = γ([a, b]). De acordo
com o teorema fundamental do cálculo tem-se
s0 (t) = kγ 0 (t)k.
Proposição 1.27 Nas condições anteriores tem-se kr0 (t)k = 1, para todo o t ∈ I.
Proposição 1.29 Seja γ uma linha parametrizada de classe C 1 e regular num intervalo I. Se kγ(t)k
é constante em I, então
γ(t) · γ 0 (t) = 0, ∀t ∈ I.
Proposição 1.30 Seja γ : I → Rn uma linha, de classe C 2 , parametrizada pelo comprimento de arco.
Então γ 0 (t) · γ 00 (t) = 0, para todo t ∈ I. Assim, γ 00 (t) é ortogonal a γ 0 (t).
Analogamente define-se a função comprimento de arco para uma linha seccionalmente C 1 , sendo
os resultados anteriores válidos também para estas curvas, com as adaptações óbvias. Também a
Proposição 1.24 e o Teorema 1.25 são válidos para linhas secc. C 1 .
Podemos ainda determinar o comprimento √do traço de linhas parametrizadas definidas em inter-
1
valos ilimitados. Por exemplo, seja r(t) = t, 2 log t, , com t ∈ [1, +∞[ e C = r([1, +∞[). Temos
t
que
1 +∞
Z +∞ Z +∞ r
2 1
0
L(C) = kr (t)k dt = 1 + 2 + 4 dt = t − = +∞.
1 1 t t t 1
Genericamente, se a linha parametrizada r, secc. C 1 , está definida num intervalo I =]a, b[, com
−∞ ≤ a < b ≤ +∞, então tem-se
Z b
L(r(I)) = kr0 (t)k dt.
a
Existirão linhas parametrizadas definidas em intervalos ilimitados cujo traço tem comprimento
finito? (cf. Exercı́cio 29 da Ficha 1.)
Funções vectoriais de uma variável Ana Rute Domingos e Ana Cristina Barroso
14
2 Cálculo Diferencial em Rn
2.1 Domı́nios, limites e continuidade de funções vectoriais de n variáveis
Sejam m, n ∈ N. Neste capı́tulo trabalharemos com funções
f : D ⊆ Rn → Rm
fi : D ⊆ Rn → R (2)
(x1 , x2 , . . . , xn ) 7→ fi (x1 , x2 , . . . , xn ),
Exemplo. Considerando a função f : R2 → R2 definida por f (x, y) = (ey cos x, ey sin x), é fácil
verificar que a imagem, por meio de f , da recta de equação y = 1 é a circunferência de centro (0, 0) e
raio e.
Definição 2.1 Se f é uma função real de duas variáveis com domı́nio D, o gráfico de f é o conjunto
n o
S = (x, y, z) ∈ R3 : z = f (x, y), (x, y) ∈ D .
15
Exemplos. Se f (x, y) = 6 − 3x − 2y, (x, y) ∈ R2 , o gráfico de f é o plano que passa nos pontos
(0, 0, 6), (0, 3, 0) e (2, 0, 0). Para a função definida em R2 por g(x, y) = x2 + y 2 o gráfico é o parabolóide
n o
S = (x, y, z) ∈ R3 : z = x2 + y 2 .
q
Finalmente, para a função h : D ⊂ R2 → R dada por h(x, y) = 9 − (x2 + y 2 ), onde
D = (x, y) ∈ R2 : x2 + y 2 ≤ 9 , o gráfico é o hemisfério
n o
S = (x, y, z) ∈ R3 : x2 + y 2 + z 2 = 9, z ≥ 0 .
Na figura abaixo encontram-se representados, da esquerda para a direita, os gráficos das funções f , g
e h, respectivamente.
Para a maior parte das funções reais de duas variáveis é muito complicado esboçar o respectivo
gráfico, nesses casos um processo que pode ajudar a visualizar a superfı́cie z = f (x, y) é considerar as
suas chamadas curvas de nı́vel.
Definição 2.2 Dados uma função f : D ⊆ Rn → R e um número real k, chamamos conjunto de
nı́vel k ao conjunto, eventualmente vazio,
Ck = {x ∈ D : f (x) = k} .
No caso n = 2, aos conjuntos de nı́vel é usual dar-se o nome de curvas de nı́vel. Com efeito,
se k ∈ f (D) e (a, b) ∈ D é tal que f (a, b) = k, se f não é constante numa vizinhança de (a, b), e
admitindo mais umas condições de regularidade, prova-se que o conjunto de nı́vel k é o gráfico de uma
função real de variável real, ou é uma união de gráficos de funções reais de variável real, pelo que é
uma curva (imagem de uma linha parametrizada), ou uma união de curvas.
Neste caso, a curva de nı́vel de equação f (x, y) = k obtém-se fazendo a projecção no plano Oxy
do corte do gráfico de f pelo plano horizontal z = k. Assim, se desenharmos algumas curvas de nı́vel
duma função e imaginarmos que as levantamos até à altura indicada, ficamos com uma ideia do gráfico
da função. Supondo que a diferença entre os valores de k de dois cortes consecutivos é constante, a
superfı́cie será inclinada onde as curvas de nı́vel estão mais próximas e será mais plana onde estas
estão mais afastadas.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
16
Exemplos. Para f (x, y) = 4 − x − y, (x, y) ∈ R2 , as curvas de nı́vel c ∈ R são rectas de equação
4 − x − y = c, já para a função definida em R2 por g(x, y) = xy, as curvas de nı́vel c 6= 0 são hipérboles,
sendo a curva de nı́vel c = 0 uma união de duas rectas.
2 −y 2
A figura que se segue mostra parte do gráfico da função f (x, y) = −xye−x , bem como algumas
curvas de nı́vel.
Para além das curvas de nı́vel, veremos na próxima secção que outras curvas relevantes para o
estudo da função f são as que se obtêm intersectando o gráfico de f com planos da forma x = k ou
y = k, com k ∈ R.
Veremos agora algumas noções topológicas em Rn que nos serão úteis para o que se segue,
permitindo-nos enunciar muitos resultados e definições, em particular, o conceito de limite de funções
cujo domı́nio é um subconjunto de Rn .
Dados n ∈ N e dois pontos P = (x1 , x2 , . . . , xn ) e Q = (y1 , y2 , . . . , yn ), recordemos que a distância
euclidiana, em Rn , entre P e Q é dada por
q
d(P, Q) = k(y1 − x1 , y2 − x2 , . . . , yn − xn )k = (y1 − x1 )2 + (y2 − x2 )2 + . . . + (yn − xn )2 .
Definição 2.3 Dado um ponto a ∈ Rn e um número real δ > 0, chama-se bola aberta de centro em
a e raio δ ao conjunto
n o n o
Bδ (a) = x ∈ Rn : kx − ak < δ = x ∈ Rn : d(x, a) < δ ;
chama-se bola fechada de centro em a e raio δ ao conjunto
n o n o
B δ (a) = x ∈ Rn : kx − ak ≤ δ = x ∈ Rn : d(x, a) ≤ δ .
Uma vizinhança do ponto a ∈ Rn é qualquer conjunto que contenha uma bola aberta de centro em a.
Um conjunto Ω ⊆ Rn diz-se limitado se existir uma bola que o contenha.
Assim, se n = 1 a bola aberta de centro em a e raio δ é o intervalo aberto ]a − δ, a + δ[, se n = 2
a bola aberta de centro em a e raio δ é o cı́rculo (ou disco) aberto de centro em a = (a1 , a2 ) e raio δ
dado por n o
Bδ (a) = (x, y) ∈ R2 : (x − a1 )2 + (y − a2 )2 < δ 2 ,
se n = 3 obtemos a esfera aberta de centro em a = (a1 , a2 , a3 ) e raio δ dada por
n o
Bδ (a) = (x, y, z) ∈ R3 : (x − a1 )2 + (y − a2 )2 + (z − a3 )2 < δ 2 .
17
disco aberto e esfera aberta de centro x0 e raio δ
É claro que int Ω ∪ ext Ω ∪ fr Ω = Rn e estes conjuntos são disjuntos dois a dois.
Um conjunto diz-se aberto se todos os seus pontos forem pontos interiores, um conjunto diz-se
fechado se contiver todos os seus pontos fronteiros. Por exemplo, as bolas abertas são conjuntos
abertos e as bolas fechadas são conjuntos fechados. Note-se que muitos conjuntos não são abertos nem
fechados. Um subconjunto de Rn é compacto se for limitado e fechado.
18
Definição 2.5 Seja Ω ⊆ Rn . Um ponto x0 ∈ Rn , diz-se um ponto de acumulação de Ω se, e só se,
qualquer vizinhança de x0 contiver infinitos pontos de Ω. O conjunto dos pontos de acumulação de Ω
representa-se por Ω0 e diz-se o derivado de Ω. Os pontos de Ω que não são pontos de acumulação
dizem-se pontos isolados; assim, se x0 ∈ Ω é um ponto isolado de Ω, então existe δ > 0 tal que
Bδ (x0 ) ∩ Ω = {x0 }.
Definição 2.6 Uma sucessão em Rm é uma função cujo domı́nio é N, u : N → Rm , e que denotamos
por (un )n∈N ou simplesmente por (un ). Denotamos por un = u(n) a imagem do valor n, a que
chamamos o termo de ordem n ou enésimo termo da sucessão, note-se que cada termo da sucessão
é um vector de Rm : un = (u1n , u2n , . . . , um i
n ). Às sucessões (un )n∈N , i = 1, . . . , m, chamamos sucessões
componentes de (un ).
5
Por exemplo, un = , (−1)n , 3 cos(nπ) é uma sucessão em R3 cujos quatro primeiros termos
n
são (5, −1, −3), (5/2, 1, 3), (5/3, −1, −3) e (5/4, 1, 3).
Uma sucessão em Rm diz-se limitada se o conjunto dos√ seus termos S = {un : n ∈ N} for limitado.
Assim, a sucessão acima é limitada uma vez que kun k ≤ 25 + 1 + 9, donde S ⊆ B √35 (0).
Definição 2.7 Uma sucessão (un ) em Rm diz-se convergente para u ∈ Rm , e escrevemos lim un = u
ou un → u, se, e só se, a sucessão de números reais kun − uk convergir para zero, ou seja, se, e só se,
3. A sucessão (un ) converge para u = (u1 , u2 , . . . , um ) se, e só se, uin → ui , i = 1, . . . , m, isto é,
se, e só se, cada uma das suas sucessões componentes (uin )n∈N convergir para a correspondente
componente do vector u.
5
A sucessão em R3 , un = , (−1)n , 3 cos(nπ) , é um exemplo duma sucessão limitada que não
n
é convergente nem ((−1)n ), nem (3 cos(nπ)) são convergentes em R. A sucessão, em R2 ,
pois
2n + 1 cos n
vn = , é convergente para (2, 0).
n n
lim f (x) = b ∈ Rm
x→a
A definição anterior é exactamente igual à já conhecida para as funções reais de variável real
mas com normas a substituir módulos. Assim, dizer que lim f (x) = b é equivalente a afirmar que
x→a
lim kf (x) − bk = 0. Isto significa que a distância entre f (x) e b pode ser arbitrariamente pequena
x→a
desde que se tome a distância entre x e a suficientemente pequena (mas não nula). Note-se que, na
definição anterior, o ponto a pode não pertencer ao domı́nio D de f mas tem que ser um ponto de
acumulação de D para que nos possamos aproximar de a por pontos em D \ {a}. Fazendo a mudança
de variável x = a + h, é claro que lim f (x) = b ⇔ lim f (a + h) = b.
x→a h→0
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
19
A noção de limite de uma função vectorial de variável vectorial num ponto também pode ser dada
em termos de sucessões, tendo-se a seguinte definição equivalente.
Definição 2.10 (Heine) Sejam f : D ⊆ Rn → Rm , a ∈ D0 e b ∈ Rm . Então lim f (x) = b se, e só
x→a
se, para toda a sucessão (xk )k∈N de pontos de D \ {a} tal que lim xk = a, se tiver lim f (xk ) = b.
O teorema que se segue diz-nos que, tal como para as funções vectoriais de variável real estuda-
das do Capı́tulo 1, os limites das funções vectoriais de variável vectorial se calculam componente a
componente, reduzindo-se ao cálculo de m limites de funções reais.
Teorema 2.11 Sejam f : D ⊆ Rn → Rm , a ∈ D0 e b = (b1 , . . . , bm ) ∈ Rm . Então
lim f (x) = b ⇔ lim fi (x) = bi , ∀i = 1, . . . , m.
x→a x→a
Recordemos que, para funções de variável real, se lim f (x) 6= lim f (x), então não existe
x→a− x→a+
lim f (x). Para funções de mais de uma variável a análise da existência, ou não, de limite é mais
x→a
complicada uma vez que há uma infinidade de caminhos através dos quais x se pode aproximar de a
e o limite, a existir, tem que ser independente do modo como x → a. Portanto, se f (x) → L1 quando
x → a ao longo de uma curva C1 e f (x) → L2 quando x → a ao longo de uma curva C2 , com L1 6= L2 ,
então lim f (x) não existe. Tornamos esta ideia mais precisa com as seguintes definições.
x→a
se, e só se, lim f|A (x) = b. Se A é a intersecção de D com uma recta passando por a, ao limite
x→a
relativo a A chamamos limite direccional de f em a.
Note-se que quando A = D as definições de limite e de limite relativo coincidem. Além disso, se f
tiver limite em a, todos os limites relativos de f em a existem e são iguais. Isto mostra que no caso
em que existem dois limites relativos distintos de f em a, então não existe lim f (x).
x→a
7x2 − y 3
Exemplos. 1) A função (x, y) 7→ 2 não tem limite quando (x, y) → (0, 0) uma vez que os
x + y2
limites relativos às rectas x = 0 e y = 0 são, respectivamente, 0 e 7.
x2 y
2) Mostremos, recorrendo à definição segundo Cauchy, que lim = 0. Para esse efeito
(x,y)→(0,0) x2 + y 2
x2
iremos fazer uso das desigualdades |y| ≤ k(x, y)k, ∀(x, y) ∈ R2 e 2 ≤ 1, ∀(x, y) ∈ R2 \ {(0, 0)}.
x + y2
x2 y
Dado δ > 0 queremos determinar ε > 0 tal que, se 0 < k(x, y)k < ε, então 2 < δ. Ora pelas
x + y2
desigualdades anteriores temos
x2 y x2
= |y| ≤ |y| ≤ k(x, y)k,
2
x + y2 x2 + y 2
20
Dizemos que uma função f : D ⊆ Rn → Rm é limitada se o conjunto f (D) for limitado, ou seja,
se existe M > 0 tal que kf (x)k ≤ M , ∀x ∈ D. O corolário que se segue é muito útil no cálculo de
limites.
x+1
Aplicando o corolário anterior podemos concluir que lim xy sin = 0 uma vez que a
(x,y)→(0,0) y2
x+1
função (x, y) 7→ sin é limitada e lim xy = 0.
y2 (x,y)→(0,0)
São válidas as seguintes propriedades algébricas dos limites, que generalizam as já conhecidas para
funções reais de variável real.
Definição 2.17 Seja f : D ⊆ Rn → Rm e seja a ∈ D. A função f diz-se contı́nua em a se, e só se,
f diz-se contı́nua num conjunto S ⊆ D se for contı́nua em todos os pontos de S, f diz-se contı́nua
se é contı́nua em todos os pontos de D.
O próximo resultado dá-nos algumas propriedades das funções contı́nuas, análogos aos já conheci-
dos para funções de variável real.
21
Do teorema anterior resulta, por indução, que somas, produtos e compostas de um número finito
de funções contı́nuas são funções contı́nuas. Assim, temos como exemplos de funções contı́nuas (nos
respectivos domı́nios) funções cujas componentes sejam funções polinomiais, racionais e funções que
resultem de somas, produtos e compostas de um número finito de funções polinomiais, racionais,
trigonométricas, exponenciais, logarı́tmicas, etc.
A função f˜ assim construı́da é contı́nua em a. Diz-se, por isso, o prolongamento por continuidade
de f ao ponto a.
sin(x2 + y 2 )
A função f (x, y) = pode ser prolongada por continuidade ao ponto (0, 0) uma vez
x2 + y 2
que lim f (x, y) = 1.
(x,y)→(0,0)
Definição 2.21 Um conjunto S ⊆ Rn diz-se conexo por arcos se quaisquer dois pontos de S podem
ser ligados por uma curva contida em S, isto é, dados x, y ∈ S existe uma linha parametrizada
γ : [a, b] → Rn tal que γ(a) = x, γ(b) = y e γ(t) ∈ S, ∀t ∈ [a, b].
Na figura que se segue, o conjunto U é conexo por arcos mas o conjunto S = A ∪ B não é.
Se f é uma função escalar contı́nua cujo domı́nio é conexo por arcos, é válida uma generalização
do teorema de Bolzano que conhecemos para funções reais de variável real. Com efeito, dado que os
subconjuntos conexos por arcos de R são os intervalos, o resultado enunciado no teorema que se segue,
no caso n = 1, diz que se f for contı́nua em [a, b], então f toma todos os valores entre f (a) e f (b).
22
∂f
Note-se que (x0 , y0 ) = g 0 (x0 ) onde g é a função real de variável real que se obtém, a partir de
∂x
f , fixando y = y0 e deixando variar apenas x: g(x) = f (x, y0 ). Esta derivada parcial dá-nos, pois, a
taxa de variação da função f em ordem à variável x, mantendo y fixo. O gráfico da função g é a curva
que resulta da intersecção da superfı́cie z = f (x, y) com o plano y = y0 . Assim, a derivada parcial
de f em ordem a x no ponto (x0 , y0 ) representa o declive da recta tangente a essa curva no ponto
(x0 , y0 , f (x0 , y0 )).
Conclusões análogas são válidas para a derivada parcial de f em ordem a y. Neste caso, fixamos o
∂f
valor de x e deixamos variar apenas y tendo-se (x0 , y0 ) = k 0 (y0 ) onde k é dada por k(y) = f (x0 , y).
∂y
23
Se f : D ⊆ Rn → R tiver derivada parcial em ordem a xi em todos os pontos de um aberto Di ⊆ D
chamamos função derivada parcial de f em ordem a xi à função definida em Di através da relação
x 7→ fxi (x), com i ∈ {1, . . . , n}. Analogamente ao caso n = 2, fxi é a derivada da função real de
variável real t 7→ f (x1 , . . . , xi−1 , t, xi+1 , . . . , xn ).
Note-se ainda que, uma vez que as derivadas parciais de f se obtêm derivando a função em ordem
a uma das variáveis, mantendo as outras fixas, as regras de derivação já conhecidas para funções reais
de variável real permanecem válidas.
Se as funções derivadas parciais de f puderem por sua vez ser derivadas em ordem a alguma das
variáveis obtemos novas funções chamadas derivadas parciais de segunda ordem de f .
Assim, uma função de duas variáveis tem, caso existam, quatro derivadas parciais de segunda
ordem que se denotam por
∂2f ∂2f ∂2f ∂2f
fxx = , f xy = , f yx = e fyy = .
∂x2 ∂y∂x ∂x∂y ∂y 2
∂2f
Observemos que a notação fxy = significa que derivamos f primeiro em ordem a x e depois em
∂y∂x
∂2f
ordem a y, para fyx = a ordem de derivação é a oposta.
∂x∂y
Analogamente se definem derivadas parciais de ordem superior à segunda. Por exemplo, a derivada
parcial de terceira ordem fyyx obtém-se derivando f duas vezes em ordem a y e depois uma vez em
ordem a x.
Exemplo. Sendo f (x, y, z) = y 2 ex + z sin x, tem-se fx = y 2 ex + z cos x, fy = 2yex , fz = sin x,
fxy = 2yex , fxx = y 2 ex − z sin x e fxxz = − sin x.
24
∂f
Se u = ej (vector da base canónica de Rn , j = 1, . . . , n) tem-se fe0 j (a) = (a), ou seja, as
∂xj
derivadas parciais de f são derivadas direccionais nas direcções dos eixos coordenados. Veremos mais
adiante que, para muitas funções, todas as derivadas direccionais podem ser obtidas à custa das
derivadas parciais.
A figura que se segue permite-nos interpretar geometricamente o conceito de derivada direccional
no caso n = 2. Com efeito, intersectando o gráfico de f com o plano perpendicular ao plano xy que
contém a recta definida pelo ponto (x, y) e pelo vector unitário u = (u1 , u2 ), obtemos uma curva C
que é o gráfico da função real de variável real g(h) = f ((x, y) + h(u1 , u2 )). A derivada fu0 (x, y) é o
declive da recta tangente à curva C (também chamado declive da curva) no ponto (x, y, f (x, y)),
portanto fu0 (x, y) = g 0 (0).
25
2.3 Funções diferenciáveis, noção de gradiente e de matriz jacobiana
Vamos ver nesta secção o que se entende por diferenciabilidade de uma função
f : D ⊆ Rn → R.
Recordemos que uma função real de variável real f se diz diferenciável num ponto a quando tem
derivada finita nesse ponto. Este facto implica a continuidade de f em a. De forma a preservarmos
esta propriedade para funções de duas ou mais variáveis não podemos definir diferenciabilidade de
f num ponto a ∈ Rn como sendo equivalente à existência (em R) das derivadas parciais de f em
a. Com efeito, existem exemplos de funções que têm derivadas parciais finitas num ponto (e que até
admitem derivadas direccionais finitas em qualquer direcção) mas que são descontı́nuas nesse ponto.
Isto acontece uma vez que a existência de derivadas parciais reflecte o comportamento da função
apenas em segmentos de recta paralelos aos eixos coordenados enquanto que a continuidade de f num
certo ponto está relacionada com o comportamento da função numa vizinhança desse ponto.
Exemplo. Seja
2xy
, (x, y) 6= (0, 0)
f (x, y) = x2 + y 2 (3)
0, (x, y) = (0, 0).
Então tem-se
f (h, 0) − f (0, 0) f (0, h) − f (0, 0)
fx (0, 0) = lim = 0 e fy (0, 0) = lim = 0,
h→0 h h→0 h
no entanto f é descontı́nua em (0, 0) uma vez que não existe lim f (x, y). Com efeito, os limites
(x,y)→(0,0)
de f relativos às rectas x = 0 e x = y são, respectivamente, 0 e 1.
Uma função real de variável real f é diferenciável num ponto a do interior do seu domı́nio se, e só
se, tem derivada finita f 0 (a) dada por
f (a + h) − f (a)
f 0 (a) = lim .
h→0 h
Assim, tem-se
f (a + h) − f (a) − hf 0 (a)
lim = 0.
h→0 |h|
A relação anterior ainda se pode escrever na forma
o que significa que podemos aproximar a diferença f (a + h) − f (a) pela função, linear em h, f 0 (a)h
sendo o erro cometido nesta aproximação um infinitésimo de ordem superior a h, quando h → 0.
Notemos ainda que, pondo h = x − a, a relação anterior permite concluir que, numa vizinhança do
ponto a, a função f (x) pode ser aproximada pela função g(x) = f (a) + f 0 (a)(x − a) cujo gráfico é a
f (x) − g(x)
recta tangente ao gráfico de f no ponto a, tendo-se lim = 0.
x→a x−a
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
26
Para uma função escalar de n variáveis tem-se a seguinte definição.
Definição 2.31 Sejam f : D ⊆ Rn → R e a ∈ int D. A função f diz-se diferenciável no ponto a
se, e só se, existir um vector y ∈ Rn tal que
f (a + h) − f (a) − y · h
lim =0 (h ∈ Rn ). (4)
h→0 khk
É fácil de ver que, quando existe um vector y nas condições anteriores, ele é único. Veremos de
seguida que se tem y = ∇f (a).
Teorema 2.32 Sejam f : D ⊆ Rn → R, a ∈ int D e suponhamos que f é diferenciável em a. Então
existem todas as derivadas parciais de primeira ordem de f no ponto a e o vector y de (4) é dado por
y = ∇f (a).
Atendendo ao teorema anterior concluimos assim que uma função f : D ⊆ R2 → R é diferenciável
num ponto (a, b) do interior de D se, para |h| e |k| suficientemente pequenos, se tiver
f (a + h, b + k) = f (a, b) + fx (a, b)h + fy (a, b)k + ε(h, k) = f (a, b) + ∇f (a, b) · (h, k) + ε(h, k),
onde ε(h, k) = o(k(h, k)k), (k(h, k)k → 0). Pondo h = x − a e k = y − b vê-se assim que, numa
vizinhança do ponto (a, b), f (x, y) pode ser aproximada pela função
g(x, y) = f (a, b) + fx (a, b)(x − a) + fy (a, b)(y − b)
cujo gráfico é um plano que passa no ponto P (a, b, f (a, b)) pertencente também ao gráfico de f .
Este plano é o que melhor aproxima o gráfico de f em pontos (x, y) próximos de (a, b) uma vez que
f (x, y) − g(x, y)
lim = 0, por isso dizemos que é o plano tangente ao gráfico de f no ponto
(x,y)→(a,b) k(x − a, y − b)k
(a, b, f (a, b)). De facto, veremos mais adiante que o plano definido por z = g(x, y) contém todas as
rectas tangentes ao gráfico de f no ponto P .
Verificamos assim que uma função diferenciável de uma variável real, f , pode ser aproximada
por uma função cujo gráfico é a recta tangente ao gráfico de f , na passagem para duas variáveis a
aproximação é dada por um plano.
O resultado que se segue dá-nos a esperada relação entre diferenciabilidade e continuidade.
Teorema 2.33 Seja f : D ⊆ Rn → R uma função real definida numa vizinhança do ponto a ∈ D. Se
f é diferenciável em a, então f é contı́nua em a.
A diferenciabilidade de uma função num ponto é, por vezes, de verificação morosa. Nalguns casos
pode ser útil ter em conta a seguinte condição suficiente de diferenciabilidade.
Teorema 2.34 Se a função f : D ⊆ Rn → R tem derivadas parciais contı́nuas numa vizinhança do
ponto a, então f é diferenciável em a.
Mencionámos no inı́cio desta secção que o facto de existirem as derivadas parciais de f não é
suficiente para garantir a diferenciabilidade da função, nem sequer a sua continuidade. O teorema
anterior mostra, no entanto, que se f tem derivadas parciais contı́nuas numa vizinhança do ponto a,
então f é diferenciável em a. Em particular, toda a função de classe C 1 é diferenciável.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
27
Exemplo. Voltemos a considerar a função definida em (3). Como vimos, fx (0, 0) = 0, fy (0, 0) = 0
e f não é contı́nua em (0, 0) pelo que f também não é diferenciável nesse ponto. Por outro lado, as
derivadas parciais de f existem em qualquer ponto (x, y) 6= (0, 0) tendo-se
2y 3 − 2x2 y 2x3 − 2xy 2
fx (x, y) = e fy (x, y) = .
(x2 + y 2 )2 (x2 + y 2 )2
Resulta então do teorema anterior que pelo menos uma destas derivadas parciais terá que ser des-
contı́nua em (0, 0). De facto, não é difı́cil mostrar que não existe o limite lim fx (x, y), pois
(x,y)→(0,0)
x=0
2
fx (0, y) = , o que prova que fx é descontı́nua em (0, 0).
y
Vejamos agora, para o caso de uma função diferenciável f , qual a relação entre a derivada direc-
cional num ponto e o vector gradiente.
Teorema 2.35 Seja f : D ⊆ Rn → R uma função diferenciável no ponto a ∈ int D. Então f tem
derivada segundo qualquer vector u ∈ Rn , no ponto a, e tem-se
Vê-se assim que se f é diferenciável em a, então a aplicação T : Rn → R definida por u 7→ fu0 (a) é
linear.
fv0 (0, 1, −1) = ∇f (0, 1, −1) · (6, 1, −2) = (1, −4, 0) · (6, 1, −2) = 2.
Teorema 2.36 Seja f uma função diferenciável em a ∈ int D. Então o valor máximo da derivada
direccional fu0 (a) é k∇f (a)k e ocorre quando u tem a direcção e sentido do vector ∇f (a).
Assim, k∇f (a)k corresponde ao valor máximo da taxa de variação de f no ponto a e esse máximo
ocorre na direcção e sentido do vector ∇f (a). Esta é, então, a direcção e sentido em que a função f
aumenta mais rapidamente no ponto a.
0
Exemplo. Para √ a função f definida em (5) o valor máximo da derivada direccional fu (0, 1, −1) é
k∇f (0, 1, −1)k = 17 e ocorre na direcção e sentido do vector ∇f (0, 1, −1) = (1, −4, 0).
Supondo agora que f : D ⊆ Rn → Rm é uma função vectorial, vimos na Definição 2.28 que fu0 (a)
é um vector de Rm que, atendendo ao Teorema 2.11, tem por componentes as derivadas das funções
fi , i = 1, . . . , m, no ponto a, segundo o vector u, isto é,
fu0 (a) = ((f1 )0u (a), (f2 )0u (a), . . . , (fm )0u (a))
onde
fi (a + hu) − fi (a)
(fi )0u (a) = lim , i = 1, . . . , m.
h→0 h
Supondo que todas as funções fi : D ⊆ Rn → R são diferenciáveis no ponto a, pelo Teorema 2.35,
temos que
(fi )0u (a) = ∇fi (a) · u
pelo que
fu0 (a) = (∇f1 (a) · u, ∇f2 (a) · u, . . . , ∇fm (a) · u).
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
28
Usando a notação matricial podemos escrever
∂f1 ∂f1 ∂f1
∂x1 ∂x2 ... ∂xn
u1
∇f1 (a)
u1
∂f2 ∂f2 ∂f2 ∇f (a)
∂x1
∂x2 ... ∂xn
u2 2
u2
0
fu (a) = · = ·
.
. .. .. ..
..
..
..
.
.
.
. . . .
∂fm ∂fm ∂fm un ∇fm (a) un
∂x1 ∂x2 ... ∂xn (a) m×n n×1
∂fi
Definição 2.37 Seja f : D ⊆ Rn → Rm e seja a ∈ D tal que as derivadas parciais , i = 1, . . . , m,
∂xj
j = 1, . . . , n, existem no ponto a. À matriz
∂f1 ∂f1 ∂f1
∂x1 ∂x2 ... ∂xn
∇f1 (a)
∂f2 ∂f2 ∂f2 ∇f (a)
∂x1
∂x2 ... ∂xn
2
Jf (a) = =
.
. .. .. ..
..
.
. . . .
∂fm ∂fm ∂fm ∇fm (a)
∂x1 ∂x2 ... ∂xn (a)
pelo que fu0 (4, −2, 0) = (8, 6, 3). Cada componente deste vector é a derivada da correspondente função
componente de f , segundo o vector u, no ponto (4, −2, 0).
29
Vejamos finalmente como estender a noção de diferenciabilidade a funções vectoriais
f : D ⊆ Rn → Rm .
Definição 2.38 Sejam f : D ⊆ Rn → Rm e a ∈ int D. A função f diz-se diferenciável no ponto
a se, e só se, existir uma aplicação linear T : Rn → Rm tal que
f (a + h) − f (a) − T (h)
lim = 0. (6)
h→0 khk
Portanto, a função f : D ⊆ Rn → Rm é diferenciável no ponto a se a diferença f (a + h) − f (a)
puder ser aproximada por uma função linear T (h), sendo o erro cometido um infinitésimo que tende
para zero mais rapidamente do que h, quando h → 0. À aplicação linear T da definição anterior
chama-se derivada de f no ponto a e escreve-se T = f 0 (a) = Df (a).
Note-se que a definição anterior generaliza às funções vectoriais a noção de diferenciabilidade
definida atrás para o caso f : D ⊆ Rn → R uma vez que, como vimos, a aplicação
T : Rn → R
h 7→ ∇f (a) · h
é linear.
Denotemos por A a matriz da aplicação linear T relativamente às bases canónicas de Rn e Rm .
Sabe-se da Álgebra Linear que
T (h) = A · h, ∀h ∈ Rn .
À semelhança dos Teoremas 2.11 e 2.18 tem-se o seguinte resultado.
Teorema 2.39 Sejam f : D ⊆ Rn → Rm e a ∈ int D. Então f é diferenciável em a se, e só se, fi é
diferenciável em a, ∀i = 1, . . . , m.
Nota. Da demonstração do teorema anterior resulta que a matriz A é a matriz jacobiana de f no
ponto a. É então imediato o próximo teorema, que generaliza ao caso das funções vectoriais resultados
já conhecidos para funções reais.
Teorema 2.40 Sejam f : D ⊆ Rn → Rm e a ∈ int D. Se f é diferenciável em a, então:
1. f é contı́nua em a;
2. existem todas as derivadas parciais de primeira ordem de f no ponto a;
3. a aplicação linear T da expressão (6) é única e a sua matriz relativamente às bases canónicas
de Rn e Rm é a matriz jacobiana Jf (a);
4. a função f tem derivada no ponto a segundo qualquer vector u ∈ Rn e tem-se
fu0 (a) = T (u) = f 0 (a)(u);
30
2.4 Derivação da função composta
Recordemos a regra de derivação da função composta para funções reais de variável real. Se y = f (x),
onde f é diferenciável em x0 = g(t0 ), e x = g(t), onde g é diferenciável em t0 , então a função composta
y = f (g(t)) é diferenciável em t0 e tem-se
f :D⊆R→R
g : A ⊆ Rp → R
y = f (g(t1 , t2 , . . . , tp ))
∂z ∂u
= f 0 (u) = f 0 (u) y cos(xy)
∂x ∂x
e
∂z ∂u
= f 0 (u) = f 0 (u) x cos(xy).
∂y ∂y
No ponto (x, y) = (π, 1) tem-se u(π, 1) = sin(π) = 0 donde
∂z
(π, 1) = f 0 (0) cos(π) = −2
∂x
e
∂z
(π, 1) = f 0 (0)π cos(π) = −2π.
∂y
31
Teorema 2.41 (Regra da Cadeia - Caso 1) Seja
f : D ⊆ Rn → R
x = (x1 , . . . , xn ) 7→ y = f (x)
g : A ⊆ R → Rn
t 7→ x = (g1 (t), . . . , gn (t))
uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g : A ⊆ R → R é diferenciável em t0 e tem-se
n
0 0 ∂f
(x0 )gi0 (t0 )
X
(f ◦ g) (t0 ) = ∇f (x0 ) · g (t0 ) =
i=1
∂xi
Tal como no caso anterior, nesta notação abreviada y está a representar duas funções diferentes,
no primeiro membro da equação a função composta f ◦ g, e no segundo membro apenas f . Neste
teorema intervêm três tipos de variáveis: a t chamamos a variável independente, x1 , . . . , xn dizem-se
variáveis intermédias e y é a variável dependente. O teorema anterior é conhecido por regra da cadeia
uma vez que há uma cadeia de dependências entre as várias variáveis nele intervenientes. Com efeito,
a variável dependente y depende das variáveis intermédias x1 , . . . , xn , que por sua vez dependem da
variável independente t. O que este resultado nos diz é que para obtermos a derivada da função
dy
composta, , temos que somar as derivadas “sobre todos os caminhos presentes na cadeia, que vão
dt
de y a t”.
w0 (t) = ∇f (x(t), y(t), z(t)) · (x0 (t), y 0 (t), z 0 (t)) = ∇f (x(t), y(t), z(t)) · (et , cos t, 2)
pelo que
w0 (0) = ∇f (x(0), y(0), z(0)) · (1, 1, 2) = ∇f (1, 0, −1) · (1, 1, 2) = (3, −2, 3) · (1, 1, 2) = 7.
O próximo teorema contempla a situação em que compomos uma função real de variável vectorial
com uma função vectorial de variável vectorial.
32
Teorema 2.42 (Regra da Cadeia - Caso 2) Seja
f : D ⊆ Rn → R
x = (x1 , . . . , xn ) 7→ y = f (x)
uma função diferenciável em x0 ∈ int D e seja
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g é diferenciável em t0 e tem-se
n
∂(f ◦ g) ∂g1 ∂gn ∂f ∂gj
X
(t0 ) = ∇f (x0 ) · (t0 ), . . . , (t0 ) = (x0 ) (t0 ), i = 1, . . . , p
∂ti ∂ti ∂ti j=1
∂xj ∂ti
onde usamos, por abuso de notação, y para representar quer a função composta f ◦ g, quer apenas f .
Tal como no caso anterior, temos aqui três tipos de variáveis ligadas por uma cadeia de de-
pendências: a variável dependente y depende das variáveis intermédias x1 , . . . , xn , que por sua vez
dependem das variáveis independentes t1 , . . . , tp . Note-se que existem tantas derivadas parciais da
função composta quanto o número de variáveis independentes, cada uma destas é dada por uma soma
de n parcelas, sendo n o número de variáveis intermédias, que representam os n “caminhos na cadeia
que vão de y a ti ”, i = 1, . . . , p.
Usando a notação matricial, as últimas igualdades do teorema anterior ainda se podem escrever
na forma
∂x1 ∂x1 ∂x1
∂t1 ∂t2 ... ∂tp
∂x2 ∂x2
... ∂x2
i ∂t1 ∂t2 ∂tp
h i h
∂y ∂y ∂y ∂y ∂y ∂y
∂t1 ∂t2 ... ∂tp = ∂x1 ∂x2 ... ∂xn · .
.. .. ..
. . .
∂xn ∂xn ∂xn
∂t1 ∂t2 ... ∂tp
O cálculo de derivadas parciais de ordem superior à primeira para funções compostas faz-se apli-
cando tantas vezes quantas necessário o teorema anterior.
Exemplos. 1) Seja z = f (x, y), onde f : R2 → R é de classe C 1 , e suponhamos que x = s + t,
y = s − t. Verifiquemos que se tem
2 2
∂z ∂z ∂z ∂z
− = .
∂x ∂y ∂s ∂t
A figura que se segue mostra a cadeia de dependências das variáveis neste caso.
33
Assim temos,
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = +
∂s ∂x ∂s ∂y ∂s ∂x ∂y
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = −
∂t ∂x ∂t ∂y ∂t ∂x ∂y
donde se conclui o pretendido.
2) Seja u = y 2 sin x ez onde
x = r2 st, y = s + t2 e z = r + s + t. (8)
∂u ∂u ∂u
Calculemos , e no ponto (r, s, t) = (2, 1, 0).
∂r ∂s ∂t
Pela regra da cadeia, e atendendo às relações (8) e ao facto de se ter x(2, 1, 0) = 0, y(2, 1, 0) = 1 e
z(2, 1, 0) = 3, obtemos
∂x ∂x ∂x
∂r ∂s ∂t
∂u ∂u ∂u
∂u ∂u ∂u ∂y
∂y ∂y
= ·
∂x ∂y ∂z (0,1,3)
∂r ∂s ∂t (2,1,0) ∂r ∂s ∂t
∂z ∂z ∂z
∂r ∂s ∂t (2,1,0)
2rst r2 t r2 s
h i
2 z z 2 z
= y cos x e 2y sin x e y sin x e · 0 1 2t
(0,1,3)
1 1 1 (2,1,0)
0 0 4
h i h i
= e3 0 0 · 0 1 0 = 0 0 4e3
1 1 1
∂u ∂u ∂u
donde (2, 1, 0) = 0, (2, 1, 0) = 0 e (2, 1, 0) = 4e3 .
∂r ∂s ∂t
3) Seja z = f (x, y), onde f : R2 → R é uma função de classe C 2 , e suponhamos que x = r2 − s2 ,
∂2z
y = r2 + s2 . Pretende-se calcular . Para esse efeito, começamos por aplicar a regra da cadeia
∂s∂r
∂z
para obter :
∂r
∂z ∂z ∂x ∂z ∂y ∂z ∂z
= + = 2r + .
∂r ∂x ∂r ∂y ∂r ∂x ∂y
34
∂z
Temos agora que derivar em ordem a s o que implica derivar cada uma das funções compostas
∂r
∂z ∂z
e em ordem a s. Aplicamos então a regra da cadeia a cada uma destas funções: no primeiro
∂x ∂y
caso a cadeia de dependências das variáveis é
donde
∂ ∂z ∂ 2 z ∂x ∂ 2 z ∂y ∂2z ∂2z
(x(r, s), y(r, s)) = + = −2s + 2s .
∂s ∂x ∂x2 ∂s ∂y∂x ∂s ∂x2 ∂y∂x
Analogamente,
∂ ∂z ∂ 2 z ∂x ∂ 2 z ∂y ∂2z ∂2z
(x(r, s), y(r, s)) = + 2 = −2s + 2s 2 ,
∂s ∂y ∂x∂y ∂s ∂y ∂s ∂x∂y ∂y
pelo que obtemos por fim
!
∂2z ∂ ∂z ∂ ∂z ∂2z ∂2z
= 2r + 2r = 4rs − ,
∂s∂r ∂s ∂x ∂s ∂y ∂y 2 ∂x2
∂2z ∂2z
atendendo ao facto de = por f ser de classe C 2 .
∂x∂y ∂y∂x
Finalmente para
f : D ⊆ Rn → Rm
x = (x1 , . . . , xn ) 7→ y = (f1 (x), . . . , fm (x))
e
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
podemos aplicar o Caso 2 a cada uma das componentes de f = (f1 , . . . , fm ) e obtém-se o seguinte
resultado:
Teorema 2.43 (Regra da Cadeia - Caso Geral) Seja
f : D ⊆ Rn → Rm
x = (x1 , . . . , xn ) 7→ y = (f1 (x), . . . , fm (x))
uma função diferenciável em x0 ∈ int D e seja
g : A ⊆ Rp → Rn
t = (t1 , . . . , tp ) 7→ x = (g1 (t), . . . , gn (t))
uma função diferenciável em t0 ∈ int A, tal que g(A) ⊆ D e g(t0 ) = x0 . Então a função composta
f ◦ g é diferenciável em t0 e tem-se
(f ◦ g)0 (t0 ) = f 0 (x0 ) ◦ g 0 (t0 )
donde
Jf ◦g (t0 ) = Jf (x0 ) · Jg (t0 )
ou seja, em notação abreviada,
n
∂yk X ∂yk ∂xj
(t0 ) = (x0 ) (t0 ), i = 1, . . . , p, k = 1, . . . , m.
∂ti j=1
∂xj ∂ti
35
2.5 Plano tangente e recta normal a uma superfı́cie
∇f (x0 , y0 ) · γ 0 (t0 ) = 0.
Nas condições do teorema anterior, dizemos que o vector ∇f (x0 , y0 ) é ortogonal (ou normal) à
curva de nı́vel Ck que passa no ponto (x0 , y0 ). Assim, se ∇f (x0 , y0 ) 6= (0, 0), uma equação da recta
tangente a esta curva no ponto γ(t0 ) = (x0 , y0 ) é dada por ∇f (x0 , y0 ) · (x − x0 , y − y0 ) = 0.
Ck = {(x, y, z) ∈ D : F (x, y, z) = k} .
Neste caso, o mesmo argumento usado para demonstrar o teorema anterior, permite mostrar que o
vector n = ∇F (x0 , y0 , z0 ), para cada ponto (x0 , y0 , z0 ) pertencente a Ck , é ortogonal ao vector tangente
a qualquer curva diferenciável da superfı́cie Ck que passa por (x0 , y0 , z0 ). Por esse motivo dizemos que
o vector n é um vector normal à superfı́cie de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ). Estas
considerações motivam as definições que se seguem.
Definição 2.45 Seja F : D ⊆ R3 → R uma função de classe C 1 e seja (x0 , y0 , z0 ) um ponto perten-
cente à superfı́cie de nı́vel k de F tal que ∇F (x0 , y0 , z0 ) 6= (0, 0, 0). O plano tangente à superfı́cie
de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ) é o plano de equação
O vector n = ∇F (x0 , y0 , z0 ) (ou qualquer múltiplo deste) diz-se um vector normal à superfı́cie no
mesmo ponto.
36
É fácil ver que o plano tangente à superfı́cie esférica de equação x2 + y 2 + z 2 = a2 num ponto
(x0 , y0 , z0 ) é dado por 2x0 (x − x0 ) + 2y0 (y − y0 ) + 2z0 (z − z0 ) = 0 ⇔ xx0 + yy0 + zz0 = a2 .
Definição 2.46 A recta normal à superfı́cie de equação F (x, y, z) = k no ponto (x0 , y0 , z0 ) dessa
superfı́cie é a recta que passa em (x0 , y0 , z0 ) e que tem a direcção do vector não nulo ∇F (x0 , y0 , z0 ).
Assim, as equações paramétricas da recta normal são
x = x0 + Fx (x0 , y0 , z0 ) t
y = y0 + Fy (x0 , y0 , z0 ) t
z = z + F (x , y , z ) t, t ∈ R.
0 z 0 0 0
No caso particular em que a superfı́cie F (x, y, z) = k pode ser escrita na forma z = g(x, y) (na
próxima secção veremos algumas circunstâncias em que isto acontece) o respectivo plano tangente, no
ponto (x0 , y0 , z0 ), é dado por
z − z0 = gx (x0 , y0 )(x − x0 ) + gy (x0 , y0 )(y − y0 ),
e as equações paramétricas da recta normal são
x = x0 + gx (x0 , y0 ) t
y = y0 + gy (x0 , y0 ) t
z = z − t, t ∈ R.
0
Exemplos. 1) Escrever equações do plano tangente e da recta normal à superfı́cie dada por
z = 3x2 + y 2 no ponto (1, 2, 7).
Pondo g(x, y) = 3x2 + y 2 , a superfı́cie consiste no conjunto dos pontos (x, y, z) que satisfazem
z = g(x, y), ou seja, é o gráfico de g. Como gx = 6x, gx (1, 2) = 6, gy = 2y, gy (1, 2) = 4, o plano
tangente pedido é o plano de equação
z − 7 = 6(x − 1) + 4(y − 2) ⇔ 6x + 4y − z = 7.
O vector n = (gx (1, 2), gy (1, 2), −1) = (6, 4, −1) é normal à referida superfı́cie no ponto (1, 2, 7) pelo
que a recta normal tem equações paramétricas
x = 1 + 6t
y = 2 + 4t
z = 7 − t, t ∈ R.
37
Terminamos esta secção com uma consequência do Teorema de Lagrange.
Teorema 2.47 (Teorema do Valor Médio) Seja f : D ⊆ Rn → R uma função contı́nua no aberto
D, e sejam a, b ∈ D tais que D contém o segmento de recta de extremidades a e b, ou seja, todos
os pontos da forma x = a + t(b − a), t ∈ [0, 1]. Se f é diferenciável em todos os pontos de S =
{x ∈ Rn : x = a + t(b − a), 0 < t < 1}, então existe um ponto c ∈ S tal que
f (b) − f (a) = ∇f (c) · (b − a).
Um conjunto D diz-se convexo se, para quaisquer a, b ∈ D, o segmento de recta de extremidades
a e b estiver contido em D.
Não é difı́cil mostrar que as bolas (abertas ou fechadas) são conjuntos convexos. É imediato que
qualquer conjunto convexo é conexo por arcos, pois dois quaisquer pontos podem ser ligados por um
segmento de recta contido no conjunto, mas o recı́proco é falso. Por exemplo, uma coroa circular é
um conjunto conexo por arcos que não é convexo.
Algumas funções regulares definidas em conjuntos convexos têm propriedades semelhantes às das
funções reais de variável real, como é ilustrado pelo resultado anterior. Assim, é consequência do
Teorema do Valor Médio que, se D ⊆ Rn é um aberto convexo e se f : D → R é uma função
diferenciável cujas derivadas parciais de primeira ordem se anulam em todos os pontos de D, então f
é constante em D.
38
Teorema 2.48 (Teorema da Função Implı́cita - Caso de uma Equação) Seja
f : D ⊆ Rn × R → R
(x, y) 7→ f (x, y),
onde x = (x1 , x2 , . . . , xn ), uma função definida num aberto D ⊆ Rn × R e seja (x0 , y0 ) ∈ D. Suponha-
mos que
1. f ∈ C 1 (D);
2. f (x0 , y0 ) = 0;
∂f
3. (x0 , y0 ) 6= 0.
∂y
Então existem ε > 0, uma função g : Bε (x0 ) ⊆ Rn → R e um aberto W de Rn × R, com
(x0 , y0 ) ∈ W ⊆ D, tais que:
Nestas condições dizemos que a equação f (x, y) = 0 define implicitamente y como função de x numa
vizinhança do ponto (x0 , y0 ), e à função g, tal que y = g(x), chamamos função implı́cita.
Neste resultado, uma das variáveis da equação f (x, y) = 0 tem um papel de destaque face às
outras. A essa variável, no enunciado do teorema, damos o nome y e, por comodidade, aparece em
último lugar na expressão de f .
Nas condições anteriores, pode-se ainda provar que, se f ∈ C k (D), k ≥ 1, então g ∈ C k (Bε (x0 )).
O teorema anterior mostra assim que o conjunto de nı́vel C0 = {(x, y) ∈ D : f (x, y) = 0} contém o
gráfico de uma certa função y = g(x), definida para x ∈ Bε (x0 ), que passa pelo ponto (x0 , y0 ), isto é,
tal que g(x0 ) = y0 . Portanto, a solução (x0 , y0 ) da equação f (x, y) = 0 não é uma solução isolada.
Apesar de, na maior parte dos casos, não ser possı́vel explicitar a função g, o teorema fornece um
método que nos permite calcular as suas derivadas (parciais). No caso n = 1, vejamos como calcular
g 0 (x) para x ∈ Bε (x0 ): por a) tem-se
∂f ∂f
F 0 (x) = (x, g(x)) + (x, g(x))g 0 (x)
∂x ∂y
donde
∂f
(x, g(x))
g (x) = − ∂x
0
∂f
(x, g(x))
∂y
∂f
desde que (x, g(x)) 6= 0, o que acontece numa vizinhança de (x0 , y0 ) pela hipótese 3 e por continui-
∂y
dade das derivadas parciais de f , já que f ∈ C 1 (D).
No caso n > 1 um raciocı́nio análogo permite determinar expressões para as derivadas parciais da
função g.
39
Note-se que o teorema anterior nos dá um resultado local: a função g que se afirma existir está
definida numa vizinhança do ponto x0 , se alterarmos o ponto (x0 , y0 ) a função também pode variar.
Voltando ao exemplo da circunferência x2 + y 2 = 25, vimos que se x ∈ ] − 5, 5[ e y ∈ ]0, 5[, então
p
y = g(x) = 25 − x2 .
No entanto, se x ∈ ] − 5, 5[ e y ∈ ] − 5, 0[ tem-se
p
y = h(x) = − 25 − x2 ,
∂f ∂f
A condição (x0 , y0 ) 6= 0 no teorema anterior é apenas suficiente. Se (x0 , y0 ) = 0 nada se
∂y ∂y
pode concluir quanto à existência de função implı́cita. Por exemplo, se
f (x, y) = (y − x)2 ,
∂f
tem-se (0, 0) = 0, e a equação (y − x)2 = 0 define claramente a função y = x. Por outro lado,
∂y
também para
f (x, y) = x2 + y 2
∂f
se tem (0, 0) = 0, mas, neste caso, a equação x2 +y 2 = 0 não define y como função de x em qualquer
∂y
aberto de R que contenha o ponto x = 0 porque (0, 0) é a única solução da equação x2 + y 2 = 0.
Neste caso o conjunto de nı́vel 0 de f é constituı́do por um único ponto, C0 = {(0, 0)}, e, portanto,
não contém o gráfico de qualquer função definida numa vizinhança de x = 0.
Função Implı́cita, concluimos que existem ε > 0, uma função g : Bε (0) → R e um aberto W ⊆ R2 tal
que (0, 1) ∈ W ⊆ D, verificando as seguintes condições:
a) (x, g(x)) ∈ W e f (x, g(x)) = 0, ∀x ∈ Bε (0),
c) g ∈ C 1 (Bε (0)),
ou seja, a equação f (x, y) = 0 define implicitamente y = g(x) numa vizinhança do ponto (x, y) = (0, 1).
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
40
De facto, sabemos que f ∈ C ∞ (D), pelo que a função g também é de classe C ∞ em Bε (0). Assim,
g tem derivadas de qualquer ordem em Bε (0). Uma vez que para cada x ∈ Bε (0) se tem
para calcularmos g 0 (x) derivamos esta igualdade em ordem a x usando a regra da cadeia. Obtemos
g 0 (x)
g(x) + xg 0 (x) + ex + = 0. (9)
g(x)
donde, substituindo novamente x = 0, g(0) = 1, e ainda, g 0 (0) = −2, obtemos o valor de g 00 (0):
f : D ⊆ Rn+m → Rm
(x, y) 7→ f (x, y) = (f1 (x, y), . . . , fm (x, y)),
1. f ∈ C 1 (D);
f1 (x0 , y0 ) = 0
2. f (x0 , y0 ) = 0 ⇔ ..
.
fm (x0 , y0 ) = 0;
∂(f1 , . . . , fm )
3. (x0 , y0 ) 6= 0.
∂(y1 , . . . , ym )
Então existem ε > 0, uma função g : Bε (x0 ) ⊆ Rn → Rm e um aberto W de Rn+m , com
(x0 , y0 ) ∈ W ⊆ D, tais que:
Nestas condições dizemos que o sistema de equações f (x, y) = 0 define implicitamente y como função
de x numa vizinhança do ponto (x0 , y0 ), e à função g, tal que
41
Tal como no caso m = 1, pode-se ainda provar que, se f ∈ C k (D), k ≥ 1, então g ∈ C k (Bε (x0 )).
O teorema anterior mostra que a solução (x0 , y0 ) da equação f (x, y) = 0 não é uma solução isolada
pois faz parte de um conjunto de soluções da forma (x, g(x)) ∈ Rn × Rm , que corresponde ao gráfico
de uma certa função y = g(x), que passa pelo ponto (x0 , y0 ), isto é, tal que g(x0 ) = y0 .
Nas condições mencionadas, fica assim garantida a existência de uma função y = g(x), definida
implicitamente em Bε (x0 ) pela equação f (x, y) = 0, isto é, o sistema de m equações
f1 (x1 , . . . , xn , y1 , . . . , ym ) = 0
..
.
fm (x1 , . . . , xn , y1 , . . . , ym ) = 0
Apesar de, em geral, não ser possı́vel explicitar estas m funções pode-se, tal como anteriormente,
derivar implicitamente, usando a regra da cadeia, as equações do sistema para obter as derivadas
(parciais) destas funções. Após a derivação, o sistema de equações obtido é um sistema linear nas
derivadas (parciais), que, atendendo à hipótese 3, é um sistema de Cramer, e que pode, portanto, ser
resolvido pela regra de Cramer.
Exemplo. Verifiquemos que, numa vizinhança do ponto (x, y, t) = (0, 0, 0), o sistema de equações
x+y+t=0
(10)
x3 + sin y − sin t = 0
define implicitamente uma linha parametrizada γ(t) = (x(t), y(t)) e determinemos uma equação da
recta tangente ao traço de γ no ponto γ(0) = (0, 0).
Consideremos a função f : R3 → R2 dada por
Então f ∈ C ∞ (R3 ) uma vez que as suas funções componentes são soma de funções polinomiais e
trigonométricas, em particular f ∈ C 1 (R3 ), e f (0, 0, 0) = (0, 0), ou seja, o ponto (0, 0, 0) é solução
do sistema (10). Vejamos que o jacobiano de f1 e de f2 relativamente às variáveis x e y no ponto
(x, y, t) = (0, 0, 0) é não nulo:
∂f1 ∂f1
∂x ∂y 1 1 1 1
∂(f1 , f2 )
(0, 0, 0) = det = det = det = 1 6= 0.
∂(x, y)
∂f2 ∂f2 3x2 cos y (0,0,0)
0 1
∂x ∂y (0,0,0)
Assim, o Teorema da Função Implı́cita garante que o sistema (10) define implicitamente x e y como
funções de t, numa vizinhança do ponto (x, y, t) = (0, 0, 0), ou seja, define uma linha parametrizada
γ(t) = (x(t), y(t)) para t pertencente a um certo intervalo I =] − ε, ε[.
Derivando, em ordem a t, as equações do sistema
x(t) + y(t) + t = 0
42
obtemos
0 0
x (t) + y (t) + 1 = 0
O vector γ 0 (0) = (x0 (0), y 0 (0)) = (−2, 1) é tangente ao traço de γ no ponto γ(0) = (0, 0) pelo que uma
equação da recta tangente à curva γ(I) no ponto γ(0) = (0, 0) é x + 2y = 0.
De modo a generalizarmos a fórmula de Taylor para funções de mais de uma variável começamos por
ver como calcular derivadas, segundo um vector, de ordem superior à primeira.
Consideremos uma função f : D ⊆ R2 → R, de classe C 2 no conjunto aberto D, e seja u = (u1 , u2 )
um vector de R2 . Como f é diferenciável em D, sabemos que f tem derivada segundo o vector u em
qualquer ponto (x, y) ∈ D e tem-se
∂f ∂f
fu0 (x, y) = ∇f (x, y) · u = u1 + u2 .
∂x ∂y
A função assim obtida, fu0 : D ⊆ R2 → R, sendo de classe C 1 em D, pode por sua vez ser derivada,
em qualquer ponto (x, y) ∈ D, segundo qualquer vector de R2 . Em particular, podemos calcular (fu0 )0u
que denotamos por fu00 . Tem-se assim,
ou, simbolicamente,
2
∂ ∂
fu00 = u1 + u2 f.
∂x ∂y
Analogamente, se m ∈ N e f : D ⊆ R2 → R é de classe C m no conjunto aberto D podemos
calcular a sua derivada de ordem m, segundo o vector u = (u1 , u2 ) de R2 . Usando a notação simbólica,
introduzida no caso m = 2, escrevemos
m
∂ ∂
fu(m) = u1 + u2 f
∂x ∂y
e, mais geralmente, se f : D ⊆ Rn → R é de classe C m no conjunto aberto D tem-se
m
∂ ∂
fu(m) = u1 + . . . + un f,
∂x1 ∂xn
onde u = (u1 , . . . , un ) ∈ Rn .
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
43
Exemplos 2.50 Seja f : D ⊆ Rn → R uma função de classe C m no conjunto aberto D.
∂f ∂2f (m) ∂mf
1. Se ei é o i-ésimo vector da base canónica de Rn , então fe0 i = , fe00i = , ... , fei = .
∂xi 2
∂xi ∂xm
i
fx = 6x + y + 3x2 , fy = x + 2y,
fu00 (1, 2) = fxx (1, 2)u21 + 2fxy (1, 2)u1 u2 + fyy (1, 2)u22 = 12 − 2 + 2 = 12,
fu000 (1, 2) = fxxx (1, 2)u31 + 3fxyy (1, 2)u1 u22 + 3fxxy (1, 2)u21 u2 + fyyy (1, 2)u32 = 6.
Vimos na secção 2.3 que se uma função f : D ⊆ R2 → R é diferenciável num ponto (a, b) do
interior de D, então f (x, y) pode ser aproximada pela função polinomial
cujo gráfico é um plano que passa no ponto (a, b, f (a, b)) pertencente também ao gráfico de f .
Mostrámos ainda que este plano é o que melhor aproxima o gráfico de f em pontos (x, y) próximos de
f (x, y) − P1 (x, y)
(a, b) uma vez que lim = 0. Note-se que o polinómio P1 é o único polinómio
(x,y)→(a,b) k(x − a, y − b)k
de grau inferior ou igual a 1 que satisfaz as seguintes condições:
∂P1 ∂f ∂P1 ∂f
P1 (a, b) = f (a, b), (a, b) = (a, b), (a, b) = (a, b).
∂x ∂x ∂y ∂y
O nosso objectivo é estender estas ideias ao caso em que queremos aproximar uma função de várias
variáveis por polinómios de grau maior ou igual a 1.
Recordemos a fórmula de Taylor para funções reais de variável real. Sejam I um intervalo de R e
f : I → R uma função de classe C m+1 em I. Então, para quaisquer x, a ∈ I, tem-se
onde
f 00 (a) f (m) (a)
Pm (x) = f (a) + f 0 (a)(x − a) + (x − a)2 + . . . + (x − a)m
2! m!
e Rm (x) = o((x − a)m ), (x → a), isto é,
Rm (x)
lim = 0.
x→a (x − a)m
44
Ao polinómio Pm demos o nome de polinómio de Taylor de ordem m de f em torno do ponto a, e
vimos a seguinte expressão para Rm , a que chamámos resto de Lagrange,
f (m+1) (c)
Rm (x) = (x − a)m+1 ,
(m + 1)!
onde o ponto c está entre a e x. Escrevendo x = a + h tem-se
f 00 (a) 2 f (m) (a) m f (m+1) (c) m+1
f (a + h) = f (a) + f 0 (a)h + h + ... + h + h ,
2! m! (m + 1)!
Exemplo. Determinemos um polinómio de grau dois que, numa vizinhança do ponto (0, 0),
aproxime a função f (x, y) = exy+y a menos de o(k(x, y)k2 ), (x, y) → (0, 0).
Pelo que foi exposto, temos que determinar o polinómio de Taylor de segunda ordem de f , em
torno do ponto (0, 0). De acordo com as notações acima temos a = (0, 0), a + h = h = (x, y) e
pretendemos calcular P2 (x, y). Para esse efeito, começamos por calcular f (0, 0) e as derivadas parciais
de primeira e de segunda ordem de f , no ponto (0, 0).
45
0
Daqui resulta que f(x,y) (0, 0) = ∇f (0, 0) · (x, y) = y e
00
f(x,y) (0, 0) = fxx (0, 0)x2 + 2fxy (0, 0)xy + fyy (0, 0)y 2 = 2xy + y 2 ,
donde
0 1 00 1 y2
P2 (x, y) = f (0, 0) + f(x,y) (0, 0) + f(x,y) (0, 0) = 1 + y + (2xy + y 2 ) = 1 + y + xy + .
2 2 2
Nesta secção vamos estender ao caso das funções reais de várias variáveis as noções de máximos e
mı́nimos locais e absolutos.
O facto de uma função ter um extremo local num ponto a depende do comportamento da função
numa vizinhança de a. Os extremos absolutos de f dependem do comportamento da função em
todo o seu domı́nio.
Claro que se f tem um extremo absoluto em a também tem um extremo local nesse ponto, mas o
recı́proco é falso.
No caso das funções reais de variável real sabemos que se f tem um extremo local em a pertencente
ao interior do domı́nio, então f 0 (a) = 0 ou f 0 (a) não existe. O resultado análogo para funções de mais
de uma variável é dado em termos de ∇f .
46
Definição 2.55 Chama-se ponto crı́tico de uma função f : D ⊆ Rn → R a um ponto c do interior
de D para o qual ∇f (c) = 0.
O teorema anterior diz-nos que os únicos pontos, interiores ao domı́nio, onde uma função dife-
renciável f pode atingir extremos locais são os pontos crı́ticos. Note-se, no entanto, que nem todos
os pontos crı́ticos correspondem a extremos locais. Por exemplo, é fácil verificar que o ponto (0, 0) é
ponto crı́tico de ambas as funções f (x, y) = x2 + y 2 e g(x, y) = x2 − y 2 . No primeiro caso, f (0, 0) = 0
é claramente mı́nimo de f mas g não atinge um extremo em (0, 0) uma vez que g(0, 0) = 0 e qualquer
vizinhança de (0, 0) contém pontos onde g > 0 e outros onde g < 0.
Definição 2.56 Chama-se ponto de sela a um ponto crı́tico de f onde não é atingido um extremo
local.
Se uma função real de variável real é diferenciável e atinge um extremo local no ponto x0 interior
ao domı́nio, então a recta tangente ao gráfico de f no ponto (x0 , y0 ), onde y0 = f (x0 ), é horizontal.
Analogamente, resulta do Teorema 2.54 que se f : D ⊆ R2 → R é diferenciável e atinge um extremo
local no ponto (x0 , y0 ) interior ao domı́nio D, então o plano tangente à superfı́cie z = f (x, y) no ponto
(x0 , y0 , z0 ), onde z0 = f (x0 , y0 ), é horizontal. Com efeito, como neste caso se tem ∇f (x0 , y0 ) = (0, 0),
o referido plano tangente é dado por
∂f ∂f
z − z0 = (x0 , y0 )(x − x0 ) + (x0 , y0 )(y − y0 ) ⇔ z = z0 .
∂x ∂y
O mesmo é válido se (x0 , y0 ) é ponto de sela de f .
Uma vez que pode haver pontos crı́ticos que são pontos de sela, interessa ter um critério que nos
permita determinar se num certo ponto crı́tico é atingido um extremo local. Veremos agora como dar
resposta a esta questão usando a fórmula de Taylor de segunda ordem. Recordemos que se f é uma
função real de variável real duas vezes diferenciável tal que f 0 (a) = 0, então f tem um mı́nimo local
em a se f 00 (a) > 0 e f tem um máximo local em a se f 00 (a) < 0. Este resultado generaliza-se a funções
de várias variáveis do seguinte modo.
Teorema 2.57 Seja f : D ⊆ Rn → R uma função de classe C 2 (D) e seja a um ponto crı́tico de f .
Então
1. se fh00 (a) > 0, para todo o vector não nulo h ∈ Rn , f tem um mı́nimo local em a;
2. se fh00 (a) < 0, para todo o vector não nulo h ∈ Rn , f tem um máximo local em a;
3. se fh00 (a) toma valores positivos e negativos para diferentes vectores h ∈ Rn , então a é um ponto
de sela de f .
47
Para aplicarmos o teorema anterior temos então que estudar o sinal da forma quadrática h 7→ fh00 (a),
ou seja, do polinómio do segundo grau nas variáveis h1 , h2 , . . . , hn dado por
n
∂2f
(a)hi hj = fh00 (a)
X
Q(h) = Q(h1 , . . . , hn ) =
i,j=1
∂xi ∂xj
A esta matriz damos o nome de matriz hessiana de f no ponto a. Note-se que, sendo f uma função
de classe C 2 , a matriz hessiana é uma matriz simétrica.
Definição 2.58 Uma forma quadrática Q diz-se
1. definida positiva se Q(h) > 0, para todo o vector não nulo h;
2. definida negativa se Q(h) < 0, para todo o vector não nulo h;
3. indefinida se Q(h) toma valores positivos e valores negativos;
4. semidefinida positiva se Q(h) ≥ 0, para todo o vector h, e existe h 6= 0 tal que Q(h) = 0;
5. semidefinida negativa se Q(h) ≤ 0, para todo o vector h, e existe h 6= 0 tal que Q(h) = 0.
48
Teorema 2.59 Seja f ∈ C 2 (D) e seja (a, b) um ponto crı́tico de f . Consideremos a matriz hessiana
de f no ponto (a, b), dada por
∂2f ∂2f
∂x2 ∂x∂y
Hf (a, b) =
∂2f ∂2f
∂y∂x ∂y 2 (a,b)
Exemplo 2.61 Vamos determinar e classificar os pontos crı́ticos da função f (x, y) = x3 − y 3 + xy.
Atendendo a que ∇f (x, y) = (3x2 + y, x − 3y 2 ), os pontos crı́ticos de f são as soluções do sistema
2 2 2
3x + y = 0
y = −3x
y = −3x
⇔ ⇔
x − 3y 2 = 0
x(1 − 27x3 ) = 0
x = 0 ∨ x = 1.
3
Obtemos assim os pontos (0, 0) e 13 , − 31 . Vamos agora classificar estes pontos crı́ticos, isto é, vamos
verificar se são pontos de máximo local, mı́nimo local ou pontos de sela. Para esse efeito usamos
o Teorema 2.59 e calculamos a matriz hessiana de f em cada um dos pontos encontrados. Como
fxx = 6x, fxy = fyx = 1 e fyy = −6y temos
2 1 0 1
1 1
Hf ,− = e Hf (0, 0) = .
3 3
1 2 1 0
Uma vez que det Hf 13 , − 31 = 3 > 0, o ponto 31 , − 13 é um ponto de mı́nimo local de f ; dado que
det Hf (0, 0) = −1 < 0, o ponto
0) é um ponto de sela de f .
(0,
1 1
Notemos ainda que f 3 , − 3 não é mı́nimo absoluto de f pois considerando a restrição de f à
recta y = 0 tem-se
lim f (x, 0) = lim x3 = −∞.
x→−∞ x→−∞
49
Nem todas as funções admitem extremos locais. Por exemplo, a função diferenciável, de domı́nio
R2 , f (x, y) = 2x + y, cujo gráfico é o plano de equação z = 2x + y, não tem pontos crı́ticos pelo que
não tem extremos locais. Por outro lado, como vimos no Exemplo 2.61, há funções que têm extremos
locais mas não absolutos. O Teorema de Weierstrass garante a existência de extremos absolutos para
funções contı́nuas definidas em conjuntos compactos.
ii) determinamos os pontos da fronteira de S que podem dar origem a extremos. No caso n = 2,
uma maneira de fazer isto é parametrizar a fronteira de S através de uma função vectorial r(t) e
reduzir o problema ao estudo da função de uma só variável f (r(t)). Veremos na próxima secção
um método alternativo para resolver este passo.
iii) Calculamos o valor de f em cada um dos pontos determinados nos passos anteriores. O maior
destes valores é o máximo absoluto de f em S, o menor é o mı́nimo absoluto.
Exemplo. Determinemos os extremos absolutos da função diferenciável f (x, y) = 2x + y no
conjunto compacto (um triângulo)
n o
S = (x, y) ∈ R2 : 0 ≤ x ≤ 1 ∧ 0 ≤ y ≤ 1 − x .
Já mencionámos que f não tem pontos crı́ticos, dado que ∇f (x, y) = (2, 1) 6= (0, 0), pelo que os
seus extremos absolutos serão necessariamente atingidos na fronteira de S que é constituı́da pelos três
segmentos de recta n o
S1 = (x, y) ∈ R2 : x = 0 ∧ 0 ≤ y ≤ 1 ,
n o
S2 = (x, y) ∈ R2 : y = 0 ∧ 0 ≤ x ≤ 1
e n o
S3 = (x, y) ∈ R2 : y = 1 − x ∧ 0 ≤ x ≤ 1 .
Dado que f (0, y) = y, o valor máximo de f em S1 é 1 e o seu valor mı́nimo neste conjunto é 0.
No segmento S2 o máximo de f é 2 e o mı́nimo é 0, pois f (x, 0) = 2x. Finalmente, no segmento S3
o valor máximo de f é 2 e o mı́nimo é 1, uma vez que f (x, 1 − x) = x + 1. Concluimos assim que os
extremos absolutos de f no conjunto S são 0 e 2.
Cálculo Diferencial em Rn Ana Cristina Barroso e Ana Rute Domingos
50
Se f : D ⊆ Rn → R é uma função de classe C 2 , e D é um conjunto arbitrário, o estudo de extremos
absolutos de f pode ser uma tarefa muito difı́cil. Nestes casos, começamos por determinar os pontos
crı́ticos e identificar os extremos locais, nos casos em que o Teorema 2.59 é conclusivo. Quando o
referido teorema não permite a classificação de um ponto crı́tico, é necessário fazer um estudo directo
da função f numa vizinhança desse ponto. Também para estas funções, o método que vamos estudar
na próxima secção pode ser uma ajuda no estudo de extremos na fronteira de D.
Veremos nesta secção como determinar extremos de uma função f : D ⊆ Rn → R no caso em que os
pontos x ∈ Rn estão sujeitos a uma condição do tipo g(x) = 0. Chama-se a isto resolver um problema
de extremos condicionados. Este problema resume-se assim a calcular os extremos da função f
restrita ao conjunto, suposto não vazio,
C = {x ∈ Rn : g(x) = 0},
notada f|C . Vamos usar o chamado método dos multiplicadores de Lagrange.
Teorema 2.63 Sejam D, E ⊆ Rn conjuntos abertos, g : E → R, f : D → R funções tais que
g ∈ C 1 (E), f ∈ C 1 (D) e E ⊆ D, e seja C = {x ∈ E : g(x) = 0}. Se f|C tem um extremo local em
x0 ∈ C e se ∇g(x0 ) não é o vector nulo, então ∇f (x0 ) e ∇g(x0 ) são paralelos, isto é, existe λ ∈ R tal
que
∇f (x0 ) = λ∇g(x0 ).
Ao escalar λ referido no teorema anterior damos o nome de multiplicador de Lagrange.
A figura que se segue ilustra geometricamente as conclusões do resultado anterior no caso n = 2.
Nela encontram-se representadas a preto algumas curvas de nı́vel da função f e a azul a curva de nı́vel
0 da função g, que designamos por C. Nas condições enunciadas, é simples verificar, por aplicação
da regra da cadeia, que se f|C tem um extremo local em (x0 , y0 ) ∈ C, então ∇f (x0 , y0 ) é ortogonal
a C no ponto (x0 , y0 ). Mas, por outro lado, como C é a curva de nı́vel 0 da função g, é sabido (cf.
Teorema 2.44) que ∇g(x0 , y0 ) é ortogonal a C no ponto (x0 , y0 ). Assim, os dois vectores ∇f (x0 , y0 ) e
∇g(x0 , y0 ) são paralelos.
Portanto, para determinarmos os extremos locais de f|C recorrendo ao Teorema 2.63, começamos
por determinar as soluções (x, λ) ∈ Rn × R do sistema
(
∇f (x) = λ∇g(x)
g(x) = 0,
os pontos onde são atingidos os extremos locais de f|C estão entre as projecções x ∈ Rn das soluções
(x, λ) ∈ Rn × R encontradas. Notamos ainda que as soluções (x, λ) do sistema anterior são os pontos
crı́ticos da função auxiliar
F (x, λ) = f (x) − λg(x).
51
Exemplo. Determinemos os extremos absolutos da função f (x, y, z) = x2 + 2y 2 − 3z 2 no conjunto
n o
S = (x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 1 .
f é claramente contı́nua e o conjunto S é a esfera de centro (0, 0, 0) e raio 1, logo é compacto, portanto
a existência de extremos absolutos de f em S é garantida pelo Teorema de Weierstrass. Começamos
por notar que
∇f (x, y, z) = (2x, 4y, −6z) = (0, 0, 0) ⇔ (x, y, z) = (0, 0, 0),
pelo que f tem um único ponto crı́tico no interior de S tendo-se f (0, 0, 0) = 0.
Procuremos agora os pontos da fronteira de S onde f pode atingir um extremo. Definindo
g(x, y, z) = x2 + y 2 + z 2 − 1, como ∇g(x, y, z) = (2x, 2y, 2z) 6= (0, 0, 0) se (x, y, z) é um ponto da
fronteira de S, o Teorema 2.63 é aplicável. Determinemos as soluções do sistema
2x = 2λx
x=0∨λ=1
∇f (x, y, z) = λ∇g(x, y, z) 4y = 2λy y =0∨λ=2
⇔ ⇔
−6z = 2λz z = 0 ∨ λ = −3
g(x, y, z) = 0
x2 + y 2 + z 2 = 1
x2 + y 2 + z 2 = 1.
52
3 Cálculo Integral em Rn
Introdução
O integral de Riemann que definimos para as funções reais de variável real (caso n = 1) é uma
ferramenta que permite, entre outras aplicações, calcular áreas de regiões genéricas do plano, isto
é, permite medir conjuntos em dimensão 2. Recorde-se que dada uma função real de variável real,
positiva e limitada num intervalo limitado I, o seu integral, em I, corresponde ao valor do conceito
que definimos como área da região limitada pelo gráfico da função, pelo eixo do xx e pelas rectas
verticais definidas pelos extremos de I. Também o conceito de integral múltiplo, que vamos definir,
está ligado à noção de medida, permitindo, entre outras aplicações, determinar medidas de conjuntos
em dimensão n, por exemplo, os chamados volumes para objectos em dimensão 3. A ênfase do nosso
estudo recai nos casos n = 2 e n = 3.
Para além do conceito e das suas propriedades, vamos estabelecer técnicas de cálculo de integrais
múltiplos, recorrendo ao cálculo de integrais unidimensionais. À semelhança do caso n = 1, estudare-
mos também um teorema de mudança de variável no integral múltiplo que, nalguns casos, facilita o
cálculo dos mesmos.
Os tópicos abordados neste capı́tulo inserem-se na chamada Teoria da Medida, cujo estudo rigoroso
e completo é feito em cadeiras avançadas (3.o ano da Licenciatura em Matemática). Não obstante,
faremos um estudo cuidadoso dos conceitos, direccionado para o cálculo e aplicações, recorrendo
algumas vezes à intuição e outras às provas formais, cujas ideias sejam pertinentes para a prossecução
da formação matemática dos alunos.
Exemplos.
1) Em R2 os intervalos são rectângulos; exemplo I = [1, 3]×] − 2, 6].
53
Dado um intervalo real I limitado, [a, b] ou ]a, b] ou ]a, b[ ou [a, b[, com a < b (a ≤ b, no caso
em que o intervalo é fechado), definimos a medida unidimensional de I como sendo o valor b − a,
denotamos por m1 (I), e chamamos a esse valor o comprimento de I.
Dado I = I1 × . . . × In intervalo em Rn , com Ik intervalo real limitado, k = 1, . . . , n, n ∈ N,
definimos a medida n-dimensional de I, e denotamos por mn (I), como sendo o valor
m1 (I1 ) · . . . · m1 (In ).
No caso n = 2, a m2 (I) chamamos área de I. No caso n = 3 dizemos que m3 (I) é o volume de I.
Exemplos.
1) O comprimento de [2, 6[ é m1 ([2, 6[) = 4.
2) A área de [1, 3]×] − 2, 6] é m2 ([1, 3]×] − 2, 6]) = 2 · 8 = 16.
3) O volume de ] − 3, 1[×]0, 3] × [2, 4[ é m3 (] − 3, 1[×]0, 3] × [2, 4[) = 4 · 3 · 2 = 24.
Quando não há necessidade de explicitar a dimensão na medida, em vez de mn , usamos simples-
mente m.
Observe-se que mn (I) = 0 apenas quando I é um intervalo degenerado.
Consideremos I um intervalo não degenerado e limitado de Rn , n ∈ N. Chamamos decomposição
ou partição de I a uma famı́lia finita de intervalos não degenerados de Rn , I1 , . . . , Ip , que apenas
têm em comum pontos das respectivas fronteiras (int Ij ∩ int Ik = ∅, se j 6= k, i, j = 1, . . . , p) e tais que
I = I1 ∪ . . . ∪ Ip .
I (n = 2) Uma decomposição de I
p
X
Dada uma decomposição D = {I1 , . . . , Ip } do intervalo I tem-se que m(I) = m(Ij ), k ∈ N.
j=1
54
e, escolhidos ξj ∈ Ij , j = 1, . . . , p, a soma de Riemann de f relativamente a D e a ξ = (ξj ) por
p
X
S(f, D, ξ) = f (ξj ) mn (Ij ).
j=1
Soma de Riemann
É imediato que
S(f, D) ≤ S(f, D, ξ) ≤ S(f, D). (11)
Como as três figuras anteriores ilustram, no caso n = 2, quando a função f é não negativa, as
somas anteriores representam a soma dos volumes dos paralelepı́pedos cujas bases são os intervalos Ij
da decomposição de I e cujas alturas são respectivamente inf Ij f , supIj f e f (ξj ), j = 1, . . . , p. Cada
um dos sólidos constituı́dos pelos paralelepı́pedos considerados em cada um dos casos anteriores é uma
aproximação da região de R3
S = {(x, y, z) : (x, y) ∈ I, 0 ≤ z ≤ f (x, y)}.
Assim, as somas consideradas são valores aproximados do volume de S, conceito que pretendemos
definir. Este é formulado a partir do conceito do integral de f, que segue as ideias do caso n = 1.
6 A ⊂ Rn , chamamos diâmetro
Comecemos por dar a definição de diâmetro de um conjunto. Seja ∅ =
de A, e representamos por diam (A), ao valor (em R)
sup kx − yk.
x,y∈A
Ilustração de diâmetros:
n=1 n=2 n=3
Considerando D = {I1 , . . . , Ip } uma decomposição de I, chamamos diâmetro da decomposição D
ao maior dos diâmetros de cada Ij , j = 1, . . . , p.
Consideremos então todas as possı́veis sucessões (Dm )m de decomposições de I com diâmetro a tender
para zero (no caso n = 1 consideram-se sucessões de partições do intervalo com comprimento a tender
para zero) e as respectivas sucessões das somas inferior e superior de Darboux: S(f, Dm ) e S(f, Dm ).
Alguns termos da sucessão das somas inferiores de Darboux da função f (x, y) = 16 − x2 − 2y 2 , em I = [0, 2] × [0, 2]
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
55
Dizemos que f é integrável (à Riemann), em I, se existe ` ∈ R tal que
onde ξm = (ξmj ) é uma sucessão de pontos escolhidos em cada intervalo Imj da decomposição Dm de
I, m, j ∈ N. Prova-se que se o limite anterior (das somas de Riemann) existir, então também existem
os limites em (12) e estes três limites coincidem.
Se n = 2, algumas notações para o integral de f , em I, são
Z Z ZZ Z ZZ
f ou f dA ou f (x, y) dA ou f (x, y) dxdy ou f (x, y) dxdy,
I I I I I
e dizemos que temos um integral duplo. Se n = 3, algumas notações para o integral de f , em I, são
Z Z ZZZ Z ZZZ
f ou f dV ou f (x, y, z) dV ou f (x, y, z) dxdydz ou f (x, y, z) dxdydz,
I I I I I
e dizemos que temos um integral triplo. Estas notações generalizam-se para qualquer n sendo a
notação genérica Z
f dx1 dx2 . . . dxn .
I
A ordem dx1 dx2 . . . dxn , na notação anterior, em dxdy no integral duplo, e em dxdydz no integral
triplo, de uma forma geral, reflete a ordem das variáveis no sistema de coordenadas adoptado. Porém,
quando esta ordem não é referida, consideramos a ordem crescente da enumeração (x1 , x2 , . . .) ou a
ordem alfabética (x, y, . . .) das variáveis em uso.
Que funções são integráveis à Riemann? Vejamos alguns exemplos. As funções constantes são
integráveis em intervalos limitados de Rn . Considerando I = [0, 2] × [0, 2], é fácil ver que a função
(
1, (x, y) ∈ I \ {(1, 1)}
f (x, y) =
0, (x, y) = (1, 1)
também é integrável em I. Observamos que a função f é descontı́nua apenas no ponto (1, 1) e que g é
descontı́nua apenas no segmento de recta {(x, x) : x ∈ [0, 2]}. Neste dois últimos casos o conjunto dos
pontos de descontinuidade das funções tem um tamanho pequeno e é por esse facto que são integráveis.
Segue-se o conceito que dá significado a esta ideia e que nos vai permitir responder à pergunta inicial.
Dizemos que A ⊂ Rn é um conjunto desprezável se para cada ε > 0 existe um número finito de
intervalos de Rn , I1 , . . . , Ip , p ∈ N, tais que
p
X
A ⊂ I1 ∪ . . . ∪ Ip e m(Ij ) < ε.
j=1
Também dizemos que A é um conjunto de medida nula e escrevemos m(A) = 0 (esta terminologia
será explicada mais adiante).
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
56
Exemplos e propriedades
1) ∅ é desprezável.
2) Qualquer conjunto finito é desprezável.
3) Um subconjunto de um conjunto desprezável é desprezável.
4) Se X é um conjunto é desprezável, também X (o fecho de X =int X∪ fr(X)) o é.
5) A união finita de desprezáveis é desprezável.
6) A fronteira de um intervalo de Rn é desprezável.
(A fronteira de um intervalo é a união de conjuntos desprezáveis, já que é união de intervalos degene-
rados.
({1} × [3, 4]) ∪ ({2} × [3, 4]) ∪ ([1, 2] × {3}) ∪ ([1, 2] × {4}).)
é um conjunto desprezável.
Exemplo.
é desprezável.
9) Sejam a, b, ∈ R, φ1 , ψ1 : [a, b] → R funções contı́nuas tais que φ1 ≤ ψ1 ,
Ω = {(x, y) : x ∈ [a, b], φ1 (x) ≤ y ≤ ψ1 (x)}, φ2 , ψ2 : Ω → R funções contı́nuas tais que φ2 ≤ ψ2 .
Então a fronteira do conjunto
n o
(x, y, z) ∈ R3 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x), φ2 (x, y) ≤ z ≤ ψ2 (x, y)
é desprezável.
10) Traços de linhas regulares em Rn são conjuntos desprezáveis. Tal como referido na definição,
dizemos que estes conjuntos têm medida nula. O comprimento de uma curva traço de uma linha secc.
C 1 , que é um valor positivo, como foi visto no Capı́tulo 1, não deve ser confundido com esta medida
(nula).
57
São válidos os resultados que se seguem.
Teorema 3.1 Sejam I um intervalo de Rn , compacto (conjunto fechado e limitado) e não vazio,
A ⊂ I um conjunto desprezável e f : IZ → R uma função limitada, tal que f (x) = 0, para todo o
x ∈ I \ A. Então f é integrável em I e f = 0.
I
Corolário 3.3 Sejam I um intervalo de Rn , compacto e não vazio e f : I → R uma função contı́nua.
Então f é integrável em I.
A caracterização completa das funções integráveis envolve uma extensão da noção de conjunto
desprezável que está fora do âmbito do nosso curso, mas que enunciamos seguidamente, por uma
questão de completude.
Dizemos que um conjunto A ⊂ Rn é desprezável à Lebesgue se para cada ε > 0 existe uma
famı́lia numerável de intervalos fechados de Rn , (In )n∈N , tais que
[ X
A⊂ In e m(In ) < ε.
n∈N n∈N
Teorema 3.4 Sejam I um intervalo compacto, não vazio, de Rn e f : I → R uma função limitada.
A função f é integrável à Riemann em I se, e só se, o conjunto dos seus pontos de descontinuidade
é um conjunto desprezável à Lebesgue.
Vamos agora definir o integral de uma função f definida num conjunto Ω ⊂ Rn limitado e cuja
fronteira seja um conjunto desprezável. Seja I um intervalo compacto de Rn tal que Ω ⊂ I e considere-
se a função g definida por (
f (x) se x ∈ Ω
g(x) =
0 se x ∈ I \ Ω.
Observe-se que uma vez que prolongámos a função f por zero fora de Ω é indiferente qual o intervalo
I que se considera, desde que contenha Ω.
58
13) Se dois conjuntos são mensuráveis, o mesmo acontece à sua união e à sua intersecção.
14) Os conjuntos desprezáveis são mensuráveis.
Podemos agora estender a noção de medida n-dimensional, definida inicialmente para intervalos,
para outros conjuntos. Chamamos medida n-dimensional do conjunto mensurável Ω ⊂ Rn ao
número Z
mn (Ω) = 1.
Ω
Observe-se que, sendo Ω um conjunto mensurável, a sua fronteira é desprezável pelo que a função
f ≡ 1 é integrável em Ω.
À semelhança dos casos dos intervalos, se n = 2, a m2 (Ω) chamamos a área de Ω e, se n = 3,
a m3 (Ω) chamamos volume de Ω. Também neste caso, quando não há necessidade de explicitar a
dimensão na medida, em vez de mn , usamos simplesmente m.
Dizemos que mn (∅) = 0, por comodidade de linguagem.
Com a introdução do conceito anterior justifica-se a terminologia conjunto de medida nula para
os conjuntos desprezáveis. Prova-se que um conjunto A ⊂ Rn é desprezável se, e só se, é mensurável
e se m(A) = 0.
Observe-se que se Ω é um conjunto mensurável e f é contı́nua em Ω, então f é integrável em Ω.
Mais geralmente, é válido o resultado que se segue.
Teorema 3.5 Seja Ω um conjunto mensurável e f : Ω → R uma função limitada. Então f é integrável
à Riemann em Ω se, e só se, o conjunto das suas descontinuidades é um conjunto desprezável à
Lebesgue.
O resultado que se segue reúne algumas propriedades do integral múltiplo.
Teorema 3.6 Sejam Ω ⊂ Rn um conjunto mensurável, f e g duas funções integráveis em Ω e M ∈ R.
Z
1. Se c é uma constante real, então c = c m(Ω).
Ω
Observações. A propriedade 2) diz-nos que o conjunto das funções integráveis num conjunto men-
surável Ω é um espaço vectorial e que a aplicação que a cada elemento f deste espaço faz corresponder
Z
f é linear.
Ω
Por indução, a propriedade 7) generaliza-se ao caso em que Ω pode ser escrito como união finita
de conjuntos mensuráveis Ωi , Ω = Ω1 ∪ Ω2 ∪ . . . ∪ Ωm , tais que Ωi ∩ Ωj é desprezável, para i 6= j,
i, j = 1, . . . , m.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
59
3.2 Cálculo de integrais em Rn por iteração
Na secção anterior estabelecemos o conceito de integral de um campo escalar definido num subconjunto
mensurável de Rn , assim como algumas das suas propriedades, à semelhança do que estudámos em
dimensão 1. Neste último caso (n = 1) é o Teorema Fundamental do Cálculo que nos fornece um
método prático para o cálculo dos integrais. Nesta secção vamos apresentar uma técnica de cálculo
para os integrais que acabámos de definir; basicamente consiste na redução do cálculo de um integral
múltiplo ao cálculo de n integrais simples, a que chamamos integração iterada. Vamos começar pelo
caso dos integrais duplos (n = 2).
é uma função real de variável real, definida num intervalo, para a qual já estabelecemos o conceito de
integral (de Riemann). Assim, podemos escrever
Z d
f (x, y) dy
c
e dizemos que estamos a integrar a função f (x, y) em ordem à variável y, de y = c até y = d, mantendo
fixa a variável x. A este procedimento damos o nome de integração parcial relativamente a y.
Z d
Em geral f (x, y) dy depende do valor de x; fica então definida uma função que só depende de x,
c
dada por
Z d
g(x) = f (x, y) dy, x ∈ [a, b].
c
Prova-se que a função g assim obtida é integrável em [a, b]. Integrando-a agora nesse intervalo (obvi-
amente que agora a integração é relativa à variável x), obtemos
Z b Z b Z d !
g(x) dx = f (x, y) dy dx. (13)
a a c
que se obtém integrando f (x, y) em ordem à variável x, de x = a até x = b, mantendo fixa a variável y.
À semelhança do caso anterior, a este procedimento chamamos integração parcial relativamente
a x. Integrando agora a função h no intervalo [c, d], vem
Z d Z d Z b !
h(y) dy = f (x, y) dx dy. (14)
c c a
Aos integrais obtidos neste procedimento da integração parcial sucessiva, (13) e (14), damos o nome de
integrais iterados e ao processo em si atribuı́mos a designação de integração iterada. Ao fixarmos
uma das variáveis, o cálculo destes integrais envolve integração de funções de uma só variável, pelo
que podemos aplicar as técnicas estudadas para integração de funções reais de variável real.
Observe-se a analogia na terminologia com o caso das derivadas parciais. Em ambas as situações,
derivação e integração, fixamos uma das variáveis e aplicamos um procedimento parcial, respectiva-
mente, derivar e integrar, em relação à outra variável.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
60
Em (13) integramos primeiro em ordem a y, mantendo x fixo, e depois integramos em ordem a
x; em (14) usamos a ordem contrária. Na maioria das situações omitimos os parênteses, escrevendo
apenas
Z bZ d Z dZ b
f (x, y) dy dx e f (x, y) dx dy.
a c c a
No nosso caso, consideramos que se calcula em primeiro lugar o integral “de !
dentro” e só depois o
Z bZ d Z b Z d
“de fora”. Por exemplo, escrever f (x, y) dy dx significa f (x, y) dy dx.
a c a c
assim Z 2Z 1
f (x, y) dy dx = 8. (15)
1 0
A integração parcial de f em ordem a x origina a função h, definida em [0, 1], dada por
Z 2 h i2
h(y) = 12x2 y 3 + 1 dx = 4x3 y 3 + x = 32y 3 + 2 − 4y 3 − 1 = 28y 3 + 1.
1 1
donde Z 1Z 2
f (x, y) dx dy = 8. (16)
0 1
No exemplo anterior os integrais (15) e (16) têm o mesmo valor. Este facto não é uma coin-
cidência, é uma propriedade verificada por um grande conjunto de funções, que, em particular, inclui
as funções contı́nuas. Assim, nestes casos, é indiferente a ordem de integração.
Z Verifica-se ainda que
o valor comum obtido pela integração iterada é o valor do integral duplo f (x, y) dA, que definimos
R
anteriormente, como iremos constatar mais adiante.
61
onde, para além da função integranda, também os limites de integração dependem de x, sendo dados
por φ1 (x) e φ2 (x).
Integrando agora g no intervalo [a, b] vem
Z b Z b Z φ2 (x) !
g(x) dx = f (x, y) dy dx.
a a φ1 (x)
Exemplo.
Sejam Ω1 = (x, y) ∈ R2 : 0 ≤ x ≤ 1, x2 ≤ y ≤ x e f (x, y) = 2xy + 3y 2 , com (x, y) ∈ Ω1 .
Região Ω1
Para cada 0 ≤ x ≤ 1, temos que
Z x h ix
2xy + 3y 2 dy = xy 2 + y 3 = x3 + x3 − x5 − x6
x2 x2
e " #1
x4 x6 x7
Z 1
3 5 6 4
2x − x − x dx = − − = .
0 2 6 7 0
21
Iremos ver que
4
Z
f (x, y) dA = . (17)
Ω1 21
Exemplo. n
y2
o
Sejam Ω2 = (x, y) ∈ R2 : −2 ≤ y ≤ 4, 2 − 3 ≤ x ≤ y + 1 e f (x, y) = xy, com (x, y) ∈ Ω2 .
Região Ω2
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
62
Para cada −2 ≤ y ≤ 4, temos que
!2
y2
Z y+1
1 h 2 iy+1 1 1
y2
xy dx = yx y2 = y(y + 1)2 − y −3
2
−3 2 2
−3 2 2 2
e
!2 !3 4
y2 1 y4 2 y2 1 y2
Z 4
1
y(y + 1)2 − y −3 dy = + y 3 + − −3 = 36.
2 −2 2 2 4 3 2 3 2
−2
Iremos ver que Z
f (x, y) dA = 36. (18)
Ω2
O resultado que se segue conjuga as ideias expostas, fornecendo um método prático para calcular
integrais duplos, para funções reais integráveis em conjuntos como os que acabámos de apresentar,
justificando as afirmações (17) e (18).
Teorema 3.7 (Teorema de Fubini) Se a função real f é integrável na região Ω1 dada por
n o
Ω1 = (x, y) ∈ R2 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ φ2 (x) ,
Z Z b "Z φ2 (x) #
f (x, y) dA = f (x, y) dy dx.
Ω1 a φ1 (x)
Z Z d "Z ψ2 (y) #
f (x, y) dA = f (x, y) dx dy.
Ω2 c ψ1 (y)
63
Domı́nios do tipo I
Domı́nios do tipo II
Informalmente, no plano xy, dizemos que um conjunto é um domı́nio do tipo I se o conjunto dos seus
pontos é limitado inferiormente pelo gráfico de uma função de x e superiormente pelo gráfico de
outra função de x, ambas definidas no mesmo intervalo; e que é um domı́nio do tipo II se o conjunto
dos seus pontos é limitado à esquerda pelo gráfico de uma função de y e à direita pelo gráfico de
outra função de y, ambas definidas no mesmo intervalo (observe-se a direcção das setas nas figuras
dos exemplos anteriores).
Há conjuntos que são simultaneamente do tipo I e do tipo II, sendo, portanto x-normais e
y-normais. Por esse facto designam-se por domı́nios normais. Rectângulos, alguns triângulos e
cı́rculos são exemplos de domı́nios normais.
64
4) Se a região Ω não for do tipo I nem do tipo II mas se puder ser escrita como união finita de regiões
destes dois tipos, então conjugamos o Teorema 3.6 (propriedade 7) com o Teorema 3.7 para calcular
o integral.
5) No caso particular em que f (x, y) = h(x)g(y) e Ω = [a, b] × [c, d], com h e g integráveis, tem-se
Z Z b ! Z d !
f (x, y) dx dy = h(x) dx g(y) dy .
Ω a c
Z 2 Z π Z 2 Z π h i2
Exemplo. 2
3x sin y dy dx = 2
3x dx sin y dy = x3 [− cos y]π0 = 8(1 + 1) = 16.
0 0 0 0 0
Consideremos f uma função real, positiva e contı́nua em [a, b] × [c, d]. Dado x0 ∈ [a, b], a função
Z d
g(x0 ) = f (x0 , y) dy representa a área da região do plano x = x0 , limitada pela intersecção do
c
gráfico de f com este plano, e pelos planos y = c, y = d e z = 0. Veremos que o volume do sólido
n o
(x, y, z) ∈ R3 : a ≤ x ≤ b, c ≤ y ≤ d, 0 ≤ z ≤ f (x, y)
Z b Z bZ d
é dado por g(x) dx, ou seja, pelo integral duplo f (x, y) dy dx.
a a c
Z
Exemplos. 1) Calcular 5xy dx dy, onde Ω é a região do semi-plano x ≥ 0, limitada pelas curvas
Ω
y = 2x e y = x3 .
Z √2 Z 2x Z √2 " #2x Z √2
y2 5
Z
Temos então 5xy dx dy = 5xy dy dx = 5x dx = 10x3 − x7 dx
Ω 0 x3 0 2 x3 0 2
" #√2
5x4 5x8
= − = 10 − 5 = 5.
2 16 0
65
Z
2) Calcular 2y + x dx dy, onde Ω é a semi-coroa circular {(x, y) : 1 ≤ x2 + y 2 ≤ 4, y ≥ 0}.
Ω
A região de integração Ω pode ser escrita como a união de três domı́nios do tipo I: R1 , R2 e R3 .
Ω R1 R2 R3
p
R1 = {(x, y) : −2 ≤ x ≤ −1, 0 ≤ y ≤ 4 − x2 },
p p
R2 = {(x, y) : −1 ≤ x ≤ 1, 1 − x2 ≤ y ≤ 4 − x2 } e
p
R3 = {(x, y) : 1 ≤ x ≤ 2, 0 ≤ y ≤ 4 − x2 }.
Temos então
Z Z Z Z
2y + x dx dy = 2y + x dx dy + 2y + x dx dy + 2y + x dx dy =
Ω R1 R2 R3
Z −1 Z √4−x2 Z 1 Z √4−x2 Z 2 Z √4−x2
= 2y + x dy dx + √ 2y + x dy dx + 2y + x dy dx
−2 0 −1 1−x2 1 0
Z −1 h i√ 4−x2
Z 1 h i√ 4−x2
Z 2h i√4−x2
2 2 2
= y + xy dx + y + xy √ dx + y + xy dx
−2 0 −1 1−x2 1 0
Z −1 p Z 1 p p Z 2 p
2
= 4−x +x 4− x2 dx + 3+x 4− x2 −x 1− x2 dx + 4 − x2 + x 4 − x2 dx
−2 −1 1
" #−1 " #1 " #2
x3 (4 − x2 )3/2 (4 − x2 )3/2 (1 − x2 )3/2 x3 (4 − x2 )3/2 28
= 4x − − + 3x − + + 4x − − = .
3 3 −2
3 3 −1
3 3 1
3
Neste exemplo o facto da região de integração ser a união de três regiões do tipo I (e também união de
três regiões do tipo II - verifique) torna o cálculo do integral duplo trabalhoso. Há situações em que
esta questão pode ser ultrapassada. Retomaremos este exemplo mais adiante, com outras ferramentas.
É válida uma versão do Teorema de Fubini para integrais múltiplos de funções definidas
em subconjuntos mensuráveis de Rn , n ≥ 3, na qual se encontra a justificação da afirmação feita na
observação 6) ao Teorema de Fubini. Considere-se um conjunto Ω exprimı́vel na forma que se segue
desde que as sucessivas integrações se possam efectuar, o que é válido sempre que f for contı́nua em
Ω. São válidas expressões análogas para outras ordens de integração desde que Ω se possa exprimir
de forma conveniente e que os integrais façam sentido. Vejamos o exemplo que se segue (n = 3).
Consideremos o conjunto
n o
Ω = (x, y, z) ∈ R3 : a ≤ x ≤ b, φ1 (x) ≤ y ≤ ψ1 (x), φ2 (x, y) ≤ z ≤ ψ2 (x, y)
com φ1 ≤ ψ1 , φ2 ≤ ψ2 funções reais contı́nuas. Tem-se
Z Z b Z ψ1 (x) Z ψ2 (x,y)
f (x, y, z) dV = f (x, y, z) dz dy dx.
Ω a φ1 (x) φ2 (x,y)
66
Não estando presentes os parênteses, subentende-se que o primeiro integral a ser calculado é o mais
à direita e é relativo à variável mais à esquerda, neste caso a z, e assim sucessivamente. Para o mesmo
integral triplo, usamos também a notação
Z Z b Z ψ1 (x) Z ψ2 (x,y)
f (x, y, z) dV = dx dy f (x, y, z) dz,
Ω a φ1 (x) φ2 (x,y)
significando que o integral entre a e b é referente à variável x, que o integral com limites de integração
φ1 (x) e ψ1 (x) é referente à variável y e que o integral com limites de integração φ2 (x, y) e ψ2 (x, y) diz
respeito à variável z.
Supondo que Ω também se pode escrever na forma
n o
Ω = (x, y, z) ∈ R3 : a ≤ x ≤ b, α1 (x) ≤ z ≤ β1 (x), α2 (x, z) ≤ y ≤ β2 (x, z) ,
e, por definição, Z
V (S) = 1 dV.
S
Atendendo ao exposto,
Z Z b Z d Z f (x,y) Z bZ d
V (S) = 1 dV = 1 dz dy dx = f (x, y) dy dx.
S a c 0 a c
Nem sempre os conjuntos onde vamos fazer a integração nos aparecem escritos na forma ideal para
a integração iterada. À semelhança do caso n = 2, no caso n = 3 dizemos que um conjunto Ω é
z-normal se
Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, g1 (x, y) ≤ z ≤ g2 (x, y)},
Após a primeira integração ficamos reduzidos ao cálculo de um integral duplo que, de acordo com a
discussão já efectuada, é feito escrevendo D como um domı́nio ou união de domı́nios dos tipos I e/ou
II.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
67
Analogamente se definem conjuntos x-normais e y-normais. A figura que se segue apresenta exem-
plos dos três tipos de conjuntos a que acabámos de nos referir.
Neste processo o cálculo do integral triplo é reduzido, após a primeira integração, ao cálculo de
um integral duplo.
Exemplo.
Z
Calcular x dx dy dz, onde Ω é o tetraedro limitado pelos planos x = 0, y = 0, z = 0 e x + y + z = 1.
Ω
Ω = {(x, y, z) ∈ R3 : (x, y) ∈ D, 0 ≤ z ≤ 1 − x − y}
com
D = {(x, y) ∈ R2 : 0 ≤ x ≤ 1, 0 ≤ y ≤ 1 − x}.
Ω D
Temos então
Z 1 Z 1−x
= dx x(1 − x − y) dy
0 0
" #1−x
(1 − x − y)2
Z 1 Z 1
1 1
= x − dx = x − 2x2 + x3 dx = .
0 2 0
2 0 24
68
Há uma outra forma de redução dimensional no cálculo destes integrais. Suponhamos que Ω ⊂ R3
é um conjunto mensurável em que z varia num intervalo [α, β]. Para cada z0 neste intervalo seja Ωz0
a secção transversal obtida cortando Ω pelo plano z = z0 . Designe-se
Assim,
Ω = {(x, y, z) ∈ R3 : z ∈ [α, β], (x, y) ∈ Az }.
Supondo agora que cada Az é mensurável (situação que ocorre, por exemplo, quando a fronteira de
Ω é a união de gráficos de funções contı́nuas ou é um conjunto
Z convexo), e considerando f : Ω → R
uma função contı́nua, garante-se que todos os integrais f (x, y, z) dx dy, com z ∈ [α, β], existem e
Az
prova-se que
Z Z β Z
f= f (x, y, z) dx dy dz.
Ω α Az
No caso em que f = 1 o integral anterior dá-nos o volume do sólido Ω. O método que acabámos
de descrever, com a linguagem dos nossos dias, foi usado por B. Cavalieri (1598-1647) para calcular
volumes de sólidos, antes do aparecimento do cálculo de Newton e de Leibniz!
Terminamos a secção com uma observação relativa ao caso particular em que a função integranda
se escreve na forma
69
3.2.1 Aplicações dos integrais múltiplos
Atendendo às definições estabelecidas, dado Ω um conjunto mensurável de R2 , temos que:
Ω = {(x, y) ∈ R2 : |x| ≤ y ≤ 2 − x2 }.
Z
Temos então de calcular 1 dx dy, o que implica escrever Ω como uma região do tipo x- ou y-normal.
Ω
É fácil ver que Ω = {(x, y) ∈ R2 : −1 ≤ x ≤ 1, |x| ≤ y ≤ 2 − x2 }.
Assim,
Z 1 Z 2−x2 " #1
x3 x2
Z 1 Z 1
7
Z
2 2
1dx dy = dy dx = 2 − x − |x| dx = 2 2 − x − x dx = 2 2x − − = .
Ω −1 |x| −1 | {z } 0 3 2 0
3
par
É fácil ver que as curvas dadas se intersectam nos pontos (0, −1) e (0, 1). Podemos então escrever
Ω como uma região do tipo II, a saber
Ω = {(x, y) : −1 ≤ y ≤ 1, y 2 − 1 ≤ x ≤ 0}.
70
O volume V pedido é dado por
" #0
x3
Z Z 1 Z 0 Z 1
2 2 2 2 2 2
V = 4 − x − y dx dy = 4 − x − y dx dy = (4 − y )(1 − y ) − dy
Ω −1 y 2 −1 −1 3 y 2 −1
(y 2 − 1)3
Z 1
100
= 4 − 5y 2 + y 4 + dy = .
−1 3 21
Os integrais duplos e os integrais triplos são também utilizados para, por exemplo, determinar a
massa, o centro de massa e o momento de inércia de regiões planas ou de sólidos, pois as definições
destes conceitos fı́sicos envolvem estes integrais, como veremos seguidamente.
Considere-se um sólido cuja medida de comprimento relativa à direcção z é desprezável em relação às
outras medidas nas variáveis x e y, tal como uma placa fina. Seja Ω a secção desse sólido relativa à
direcção z. Supondo que µ(x, y) é a densidade de massa (massa por unidade de área), então:
1
Z
yC = yµ(x, y) dx dy;
M Ω
Analogamente, dado um sólido S de R3 com densidade de massa µ(x, y, z) define-se a massa total,
as coordenadas do centróide, e o momento relativo a r, de S, respectivamente por
Z
M= µ(x, y, z) dx dy dz
S
1
Z
xC = xµ(x, y, z) dx dy dz,
M S
1
Z
yC = yµ(x, y, z) dx dy dz,
M S
1
Z
zC = zµ(x, y, z) dx dy dz,
M S
Z
Ir = d2 ((x, y, z), r)µ(x, y, z) dx dy dz.
S
71
Recordamos que um conjunto Ω ⊂ Rn é conexo por arcos se, para quaisquer x, y ∈ Ω existe uma
linha parametrizada γ : [0, 1] → Ω tal que γ(0) = x e γ(1) = y.
Proposição 3.8 (Teorema do Valor Médio) Seja f uma função contı́nua em Ω ⊂ Rn , conjunto
compacto, mensurável e conexo por arcos. Então existe um ponto x0 ∈ Ω tal que
Z
f (x) = f (x0 ) m(Ω).
Ω
A fórmula do teorema anterior diz que uma caixa, cuja base é um rectângulo R e cuja altura é o valor
médio de f , tem o mesmo volume que o sólido que se encontra abaixo do gráfico de f (f ≥ 0).
Se z = f (x, y) descrever uma região montanhosa e cortarmos os topos das montanhas à altura do
valor médio de f , significa que podemos preencher os vales com a parte obtida pelos cortes e obter
uma região plana.
72
3.3 Mudança de variável no integral múltiplo
No cálculo de integrais de funções reais de variável real temos de lidar com a primitivação da função
integranda, o que nem sempre é uma tarefa simples. A integração por substituição é muitas vezes
a opção que usamos para ultrapassar essa dificuldade. Para essas funções aprendemos o Teorema de
Mudança de Variável que nos diz que
Z u(d) Z d Z d
0
f (x) dx = f (u(t))u (t) dt = f ◦ u(t) u0 (t) dt
u(c) c c
No caso em que u0 < 0, temos u : [c, d] → [a, b], com u(c) = b, u(d) = a, donde
Z b Z a Z u(d) Z d Z d
f (x) dx = − f (x) dx = − f (x) dx = − f (u(t))u0 (t) dt = f (u(t))(−u0 (t))dt.
a b u(c) c c
Observações.
1) Muitas vezes referimo-nos à função T do teorema anterior como a função mudança de variáveis,
no entanto, observamos que esta referência pode conter um abuso de linguagem, já que essa designação
é o conceito matemático que se segue. Dados dois abertos U e V de Rn , dizemos que uma função
T : U → V é uma mudança de coordenadas ou de variáveis se é uma bijecção de classe C 1 tal
que det JT (u) 6= 0, ∀u ∈ U .
2) Observamos que o teorema anterior ainda é válido se D ⊂ U e D 6⊂ U , desde que U e V sejam
abertos com fronteira de medida nula.
3) Na notação que põe em evidência as “variáveis” de D e Ω, e considerando as relações
xi = Ti (u1 , . . . , un ), i = 1, . . . , n,
73
Em que situações recorremos a uma mudança de variáveis para calcular um integral múltiplo?
Para além da já referida dificuldade de primitivação da função integranda, agora (n > 1) uma nova
dificuldade pode surgir - a escrita da região de integração usando conjuntos normais em relação a uma
das variáveis.
Z
Como procedemos para efectuar a mudança de variáveis num integral múltiplo f?
Ω
Escolhemos uma transformação T , de classe C 1 , bijectiva, cujo jacobiano seja não nulo, eventual-
mente, à excepção de um conjunto de medida nula, e depois aplicamos a fórmula
Z Z
f= (f ◦ T )|det JT |,
Ω D
o que exige o conhecimento do jacobiano de T . Por vezes, o cálculo do jacobiano de T −1 é mais fácil
de efectuar do que o de T . Assim, é útil observar que, se det JT (X) 6= 0, os dois se relacionam da
forma que se segue
1
det JT −1 (Y ) = , com T (X) = Y.
det JT (X)
O resultado que garante esta propriedade é conhecido como Teorema da Função Inversa.
A estrutura de f e de Ω ditam os critérios da escolha de T , alguns dos quais evidenciaremos ao
longo dos exemplos que vamos estudar.
Nos exemplos e exercı́cios propostos apenas trabalharemos em dimensão 2 e em dimensão 3. No
que segue, apresentamos alguns exemplos de mudança de variáveis que utilizamos frequentemente para
o cálculo desses integrais.
Sejam Ω e D conjuntos mensuráveis, T (u, v) = (x(u, v), y(u, v)) uma transformação nas condições
do Teorema 3.9, tal que T (D) = Ω, e f um campo escalar integrável em Ω. Então, a fórmula de
mudança de variável no integral duplo é
∂(x, y)
Z Z
f (x, y) dx dy = f (x(u, v), y(u, v))
du dv.
Ω D ∂(u, v)
∂(x, y)
= ad − bc 6= 0.
∂(u, v)
74
Exemplo. Vamos calcular o integral Z y−x
e y+x dx dy,
Ω
onde Ω é a região (poligonal) limitada pelas rectas x + y = 2, x + y = 1 e pelos eixos coordenados.
Região Ω = {(x, y) ∈ R2 : x ≥ 0, y ≥ 0, 1 ≤ x + y ≤ 2}
Estamos perante uma região de integração que se escreve como união de dois domı́nios do tipo I
(verifique), pelo que é simples escrever o integral dado como soma de integrais iterados. No entanto,
a função integranda imprime dificuldades à integração directa, pois a sua primitivação (parcial) não é
evidente. Assim, vamos efectuar uma mudança de variáveis (m.v.) no integral dado. A estrutura da
função integranda sugere que consideremos as novas variáveis u e v, dadas por
u=y−x e v = y + x.
e, portanto, é admissı́vel para o Teorema 3.9. Interessa-nos agora escrever as variáveis x e y em função
de u e v, para identificarmos a função mudança de variáveis. Temos
u+v v−u
=y e = x,
2 2
v−u u+v
pelo que a função m.v. é dada por T (u, v) = , . Assim, a região D do plano uv tal que
2 2
T (D) = Ω (ou seja, D = T −1 (Ω)) é dada por
D = {(u, v) ∈ R2 : 1 ≤ v ≤ 2, −v ≤ u ≤ v}.
Região D
75
Coordenadas polares
No integral duplo, mudar de variáveis cartesianas para coordenadas polares, nas condições do Teorema
3.9, implica considerar a transformação anterior no aberto ]0, +∞[×]0, 2π[, onde é injectiva, de classe
C 1 e com jacobiano dado por (cf. exercı́cio 37 da Ficha 2)
∂(x, y)
= r.
∂(r, θ)
Assim, dado f um campo escalar integrável em Ω, o Teorema 3.9 diz-nos que
Z Z
f (x, y) dx dy = f (r cos θ, r sin θ) r dr dθ,
Ω D
o que significa que os conjuntos que são atravessados pelo semi-eixo positivo das abcissas não estão
incluı́dos nesta transformação. No entanto, a fronteira de ]0, +∞[×]0, 2π[ é o conjunto, que se prova
ter medida nula, ({0} × [0, 2π]) ∪ ([0, +∞[×{0}) ∪ ([0, +∞[×{2π}), e o semi-eixo positivo das abcissas
é T ([0, +∞[×{0}), pelo que as coordenadas polares podem ser consideradas quando utilizamos o
Teorema 3.9, para qualquer subconjunto Ω de R2 , com D = T (Ω) (observe-se que o jacobiano de T se
anula na fronteira referida). Assim, escrevemos
(
x = r cos θ ∂(x, y)
r ≥ 0, θ ∈ [0, 2π], = r.
Coordenadas Polares y = r sin θ ∂(r, θ)
(r2 = x2 + y 2 )
76
Exemplos.
1) O cı́rculo fechado que em coordenadas cartesianas tem centro em (0, 0) e raio 2, ou seja, o conjunto
{(x, y) ∈ R2 : x2 + y 2 ≤ 4}, em coordenadas polares é o rectângulo {(r, θ) : 0 ≤ r ≤ 2, 0 ≤ θ ≤ 2π}.
Ω
Começamos por traduzir as condições que definem Ω em coordenadas cartesianas, para condições em
coordenadas polares. Recordando que
(
x = r cos θ
e r 2 = x2 + y 2
y = r sin θ,
vem
r≥0
1 ≤ x2 + y 2 ≤ 4 ⇔ 1 ≤ r2 ≤ 4 ⇐⇒ 1 ≤ r ≤ 2
e, se r 6= 0,
y ≥ 0 ⇔ r sin θ ≥ 0 ⇔ 0 ≤ θ ≤ π.
Assim, Ω é o transformado do rectângulo D = {(r, θ) : 1 ≤ r ≤ 2, 0 ≤ θ ≤ π}, por meio das
coordenadas polares. Aplicando o Teorema 3.9 no integral dado vem
Z Z
I= 2y + x dx dy = (2r sin θ + r cos θ)r dr dθ.
Ω D
77
3.3.2 Casos particulares de mudança de variáveis em R3
Sejam Ω e D conjuntos mensuráveis, T (u, v, w) = (x(u, v, w), y(u, v, w), z(u, v, w)) uma trans-
formação nas condições do Teorema 3.9, tal que T (D) = Ω, e f um campo escalar integrável em Ω.
Então, a fórmula de mudança de variável no integral triplo é
∂(x, y, z)
Z Z
f (x, y, z) dx dy dz = f (x(u, v, w), y(u, v, w), z(u, v, w)) du dv dw.
Ω D ∂(u, v, w)
Coordenadas cilı́ndricas em R3
Dado um ponto P de coordenadas cartesianas (x, y, z), em R3 \ {(0, 0, z) : z ∈ R}, a (r, θ, z) com
x = r cos θ
y = r sin θ com r ∈ ]0, +∞[, θ ∈ [0, 2π[, z ∈ R,
z = z,
78
Observações.
1) O cilindro que em coordenadas cartesianas é o conjunto {(x, y, z) ∈ R3 : x2 + y 2 ≤ 4, 0 ≤ z ≤ 5},
Genericamente, cilindros cujo eixo de simetria é o eixo dos zz são os transformados de paralelepı́pedos
pela aplicação (23) (considerada em W), daı́ o nome deste sistema de coordenadas.
2) As imagens por meio de T de conjuntos que em coordenadas cilı́ndricas têm uma das coordenadas
constantes são uma superfı́cie cilı́ndrica (r constante), um semi-plano perpendicular ao plano z = 0
(θ constante) e um plano paralelo a z = 0 (z constante), respectivamente dados por
Este sistema de coordenadas é particularmente útil quando a região de integração envolve porções
de cilindros, parabolóides ou cones, entre outras regiões.
já obtemos essa relação, isto é, o segundo cilindro é a imagem por meio da aplicação em (24) do
paralelepı́pedo [2, 7] × [0, 1] × [0, 2π[. Assim, o nome “coordenadas cilı́ndricas” não é apenas atribuı́do
à transformação que figura em (23), mas a qualquer uma em que cilindros de R3 sejam os transformados
de paralelepı́pedos, como a que está definida em (24).
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
79
Exemplos.
1) Seja Ω o sólido limitado pela superfı́cie cilı́ndrica x2 + y 2 = 1, pelo plano z = 4 e p
pelo parabolóide
z = 1 − x2 − y 2 . Sabendo que a densidade de Ω é dada pela função µ(x, y, z) = x2 + y 2 , vamos
determinar a sua massa M .
Comecemos por escrever Ω em coordenadas cartesianas. Temos
Ω = {(x, y, z) ∈ R3 : x2 + y 2 ≤ 1, z ≥ 1 − x2 − y 2 , z ≤ 4}.
Por definição Z Z q
M= µ(x, y, z) dx dy dz = x2 + y 2 dx dy dz.
Ω Ω
Para calcular o integral anterior vamos usar mudança de variáveis. Atendendo ao tipo de superfı́cies
envolvidas (cilı́ndrica, parabolóide), vamos escolher coordenadas cilı́ndricas. Queremos determinar D,
tal que T (D) = Ω, onde T é a função definida em (23), considerada em W . Para tal, traduzimos as
condições que definem Ω em coordenadas cartesianas para o sistema de coordenadas escolhido. Vem
então
r≥0
x2 + y 2 ≤ 1 ⇔ r2 ≤ 1 ⇐⇒ 0 ≤ r ≤ 1,
1 − x2 − y 2 ≤ z ≤ 4 ⇔ 1 − r2 ≤ z ≤ 4.
Assim,
D = {(r, θ, z) ∈ [0, +∞[×[0, 2π[×R : 0 ≤ r ≤ 1, 1 − r2 ≤ z ≤ 4}.
Observe-se que não obtivemos nenhuma restrição para θ, o que é natural se observarmos a repre-
sentação geométrica do conjunto Ω. Aplicando então a mudança de variáveis no integral, que também
requer apcomposição da função integranda com a função mudança de variáveis (neste caso a tradução
produz x2 + y 2 = r), vem
Z 2π Z 1 Z 4 Z 1 Z 4 Z 1
∂(x, y, z)
M= dθ dr r
dz = 2π dr r2 dz = 2π (4 − 1 + r2 )r2 dr
0 0 1−r2 ∂(r, θ, z) 0 1−r2 0
" #1
r5
Z 1
2 4 3 12π
= 2π 3r + r dr = 2π r + = .
0 5 0
5
É importante observar que neste caso a ordem pela qual se escrevem os integrais iterados não é
arbitrária. Da esquerda para a direita, o último integral a escrever (que será o primeiro a ser calculado)
é o relativo à variável z, pois esta varia entre dois gráficos, dependendo um deles da variável r. Quanto
aos outros dois não há obrigatoriedade na ordem de escrita, já que θ e r variam em intervalos. Como
a função integranda não depende de θ é mais cómodo escrever em primeiro lugar o integral relativo a
esta variável.
80
Para calcular o integral anterior, interessa-nos considerar a seguinte mudança de variáveis
x = r cos θ
y=y r ≥ 0, y ∈ R, θ ∈ [0, 2π]
z = r sin θ,
cujo módulo do jacobiano é r (verifique). Vamos determinar D, tal que T (D) = S, onde T é a função
acabada de definir. Para tal, traduzimos as condições que definem S em coordenadas cartesianas para
o sistema de coordenadas escolhido. Vem então
x2 + z 2 ≤ y ≤ 4 ⇔ r2 ≤ y ≤ 4.
Neste caso há uma condição escondida, que tem de ser tida em conta, a condição r2 ≤ 4. Atendendo
a que r ≥ 0, esta condição diz-nos que 0 ≤ r ≤ 2. Mais uma vez não obtivemos restrições para θ.
Podemos escrever
Coordenadas esféricas em R3
Dado um ponto P ∈ R3 de coordenadas cartesianas (x, y, z), com (x, y) 6= (0, 0), definimos as suas
coordenadas esféricas (ρ, θ, φ), da forma que se segue: ρ é a distância euclidiana do ponto P à
origem, pelo que é dada por q
ρ= x2 + y 2 + z 2 ;
designando por OP 0 a projecção do segmento OP no plano xy, θ ∈ [0, 2π[ é o ângulo que o vector OP 0
faz com o semi-eixo positivo dos xx, medido a partir deste semi-eixo no sentido directo, e finalmente,
φ ∈ [0, π[ é o ângulo que o vector OP faz com o semi-eixo positivo dos zz, medido a partir do referido
semi-eixo (ver a figura que se segue). Tem-se então
x = ρ cos θ sin φ
y = ρ sin θ sin φ ρ > 0, θ ∈ [0, 2π[, φ ∈]0, π[.
z = ρ cos φ,
Tal como no caso das coordenadas cilı́ndricas, efectuar uma mudança de coordenadas cartesianas
para coordenadas esféricas nas condições do Teorema 3.9, implica considerar a transformação
81
T :]0, +∞[×]0, 2π[×]0, π[→ R3 ,
dada por
T (ρ, θ, φ) = (x(ρ, θ, φ), y(ρ, θ, φ), z(ρ, θ, φ)) = (ρ cos θ sin φ, ρ sin θ sin φ, ρ cos φ) (25)
que é uma bijecção de classe C 1 (definida num aberto) sobre V = R3 \ {(x, 0, z) : x ≥ 0, z ∈ R}, cujo
jacobiano é (cf. exercı́cio 32 da Ficha 3)
∂(x, y, z)
= −ρ2 sin φ.
∂(ρ, θ, φ)
Nestas condições o Teorema 3.9 diz-nos que
Z Z
f (x, y, z) dx dy dz = f (ρ cos θ sin φ, ρ sin θ sin φ, ρ cos φ) ρ2 sin φ dρ dθ dφ
Ω D
onde Ω é a imagem da região D por meio da transformação anterior e f é um campo escalar integrável
em Ω.
Tal como vimos no caso das coordenadas cilı́ndricas, os conjuntos que são atravessados pelo semi-
plano P = {(x, 0, z) : x ≥ 0, z ∈ R} não são abrangidos por esta mudança de variáveis. Analogamente,
T dada por (25) pode ser considerada num conjunto maior, neste caso E = [0, +∞[×[0, 2π] × [0, π],
tendo-se que P é a imagem de ({0} × [0, 2π] × [0, π]) ∪ ([0, +∞[×{0} × [0, π]) (conjunto que se prova
ter medida nula), e T (E) = R3 . Assim, também as coordenadas esféricas podem ser utilizadas na
mudança de variáveis num integral triplo, considerado um qualquer subconjunto mensurável de R3 ,
ou seja, podemos considerar a expressão designatória de T em (25) em E. Escrevemos então
x = ρ cos θ sin φ
∂(x, y, z)
= ρ2 sin φ.
y = ρ sin θ sin φ, ρ ≥ 0, θ ∈ [0, 2π], φ ∈ [0, π],
Coord. Esféricas
z = ρ cos φ ∂(ρ, θ, φ)
(x2 + y 2 = ρ2 sin2 φ, x2 + y 2 + z 2 = ρ2 )
A figura que se segue ilustra os transformados, por T , dos conjuntos que resultam de fixar a
primeira (ρ = ρ0 ), a segunda (θ = θ0 ) e a terceira (φ = φ0 ) variáveis, respectivamente.
Exemplos.
1) A esfera que em coordenadas cartesianas é o conjunto
{(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ R2 }
é a imagem, por meio de T definida em (25), considerada em E, do paralelepı́pedo
[0, R] × [0, 2π] × [0, π],
que é o tipo de região por excelência para o cálculo de integrais triplos.
Estas coordenadas são particularmente úteis para o cálculo de integrais triplos em regiões limitadas
por (porções de) superfı́cies esféricas ou cones.
Cálculo Integral em Rn Ana Rute Domingos e Ana Cristina Barroso
82
1
Z
2) Calcular 2 + y2 + z2
dV , onde B ⊂ R3 é a bola unitária, centrada na origem.
B 4 + x
Vamos calcular o integral usando coordenadas esféricas. Seja D, tal que T (D) = B, onde T é a
função definida em (25), considerada em E. Como B = {(x, y, z) ∈ R3 : x2 + y 2 + z 2 ≤ 1}, vem
D = {(ρ, θ, φ) ∈ [0, +∞[×[0, 2π] × [0, π] : 0 ≤ ρ ≤ 1}.
Aplicando o Teorema 3.9 obtemos
ρ2
Z 2π Z π Z 1
1 1
Z Z
dV = ρ2 sin φ dρ dθ dφ = dθ dφ sin φ dρ.
B 4 + x2 + y 2 + z 2 D 4 + ρ2 0 0 0 4 + ρ2
Podemos usar a propriedade (19) para calcular o integral triplo anterior e vem
ρ2
Z 2π Z π Z 1 Z 1 Z 1
4 1
dθ sin φ dφ dρ = 2π [− cos φ]π0 1− dρ = 4π 1− ρ 2
dρ
0 0 0 4 + ρ2 0 4 + ρ2 0 1+ 2
1
ρ 1
= 4π ρ − 2 arctan = 4π 1 − 2 arctan .
2 0 2
p
3) Calcular o volume do sólido G limitado inferiormente pelo cone z = x2 + y 2 e superiormente pela
superfı́cie esférica x2 + y 2 + z 2 = z.
O sólido G em coordenadas cartesianas é dado por
q
G = {(x, y, z) ∈ R3 : x2 + y 2 ≤ z, x2 + y 2 + z 2 ≤ z}
Z
e o seu volume é o valor de 1 dV . Vamos escrever as condições que descrevem o conjunto em
G
coordenadas esféricas. Assim, se ρ 6= 0,
q
φ∈[0,π] π
x2 + y 2 ≤ z ⇔ ρ sin φ ≤ ρ cos φ ⇐⇒ cos φ ≥ 0 ∧ 0 ≤ tan φ ≤ 1 ⇔ 0 ≤ φ ≤
4
e
ρ≥0
x2 + y 2 + z 2 ≤ z ⇔ ρ(ρ − cos φ) ≤ 0 ⇐⇒ 0 ≤ ρ ≤ cos φ.
Temos então G = T (D), com T definida em (25),
π
D = {(ρ, θ, φ) ∈ R3 : 0 ≤ θ ≤ 2π, 0 ≤ φ ≤ , 0 ≤ ρ ≤ cos φ }.
4
83
O Teorema 3.9 garante que
π π
" #cos φ
ρ3
Z Z Z 2π Z Z cos φ Z
4 4
2 2
1dV = ρ sin φ dρ dθ dφ = dθ dφ ρ sin φ dρ = 2π sin φ dφ
G D 0 0 0 0 3 0
π iπ
2π 2π h π 4 π
Z
4
= sin φ cos3 φ dφ = − cos4 φ 4 = 1− = .
3 0 3×4 0 6 16 8
Z
4) Calcular o integral x2 + y 2 dV, onde S é dado por
S
1
S = {(x, y, z) ∈ R3 : y ≥ 0, x2 + y 2 + z 2 ≤ 4, x2 + y 2 ≥ 1, z 2 ≤ (x2 + y 2 )}.
3
Vamos usar coordenadas esféricas para calcular o integral pedido. Começamos por traduzir as condições
que definem S para o novo sistema de coordenadas:
" # 2π 2π
π 32 cos3 φ 3
π cos φ π 8 2
3
= −32 cos φ + + = 32 − − √ .
5 3 π 5 sin φ π 5 3 3
3 3
84
Anexo 1: Superfı́cies quádricas
x2 y 2 z 2
Elipsóide + 2 + 2 =1
a2 b c
x2 y 2 z 2
Hiperbolóide de uma folha + 2 − 2 =1
a2 b c
z 2 x2 y 2
Hiperbolóide de duas folhas − 2 − 2 =1
c2 a b
Parabolóide elı́ptico z = a2 x2 + b2 y 2
Parabolóide hiperbólico z = a2 x2 − b2 y 2
85
Cilindros
x2 y 2
Elı́ptico + 2 =1
a2 b
x2 y 2
Hiperbólico − 2 =1
a2 b
Parabólico y = kx2
x2 y 2 z 2
Cone + 2 − 2 =0
a2 b c
86
Anexo 2: Software
São várias as ferramentas online que permitem o cálculo de integrais múltiplos. Aqui ficam duas
referências.
Wolfram Alpha
https://www.wolframalpha.com/examples/mathematics/calculus-and-analysis/integrals/
Symbolab
http://pt.symbolab.com/solver/double-integrals-calculator
87
Análise Mat. II e Cálculo Dif. e Int. II Ana Rute Domingos e Ana Cristina Barroso
88