Você está na página 1de 125

Capítulo 17

Funções reais de várias variáveis

No primeiro curso de Cálculo Diferencial e Integral estuda-se funções reais de


uma única variável. Como exemplos de tais funções podemos citar a área de uma
esfera A(r) = 4pr2 ou o volume contido pela esfera V (r) = 43 pr3 , que dependem
apenas do raio da esfera e de nenhuma outra variável.
Sabemos calcular limites, derivadas e integrais de tais funções. Sabemos in-
terpretar geometricamente a derivada de uma função como a inclinação da reta
tangente à curva representada explicitamente por y = f (x). Sabemos interpretar a
integral de uma função sobre o intervalo como o limite de aproximações da região
limitada pela curva por retângulos.
No entanto, diversos problemas dependem de mais de uma variável. O volume
de um cilindro de base circular com raio r e altura h é

V (r, h) = pr2 h . (17.1)

Em algumas situações podemos manter uma destas variáveis constante, como no


trabalho realizado pela expansão de um gás dentro de um pistão cilíndrico. Mas se
o gás escapa do pistão não podemos esperar que ele se expanda como um cilindro
de raio constante. Devemos neste caso adequar a matemática a estas condições da
natureza, por mais complicadas que elas sejam.
Nosso objetivo agora é extender os conceitos de continuidade, diferenciabi-
lidade e integrabilidade conhecidos para funções reais de uma única variável a
funções que dependem de várias variáveis independentes.

17.1 Campos escalares


Definição 17.1.
Uma função f de n variáveis x1 , x2 , . . . , xn é uma transformação que a cada
conjunto ordenado de números reais (x1 , x2 , . . . , xn ) associa um único número real
478 Funções reais de várias variáveis

f (x1 , x2 , . . . , xn ).

Se f é uma função de duas variáveis é comum representar as variáveis por x e


y, o par ordenado por (x, y) e o número real associado pela função f por f (x, y).
No caso de três variáveis, representamos o número real associado ao conjunto
ordenado (x, y, z) por f (x, y, z).
Sabemos que um conjunto ordenado (x1 , x2 , . . . , xn ) representa um elemento
do espaço vetorial Rn de acordo com a base canônica do sistema de coordenadas
cartesianas. Se representamos este elemento do Rn como o vetor

~r = (x1 , . . . , xn ) , (17.2)

podemos definir uma função de várias variáveis como uma transformação cujo
argumento é um vetor do Rn e a imagem deste vetor pela função é um número
real.

Definição 17.2.
Uma função real de n variáveis é uma transformação que a cada elemento~r 2
Rn associa um único número real f (~r ). Esta transformação pode ser denotada
como f : Rn ! R. Como o contra-domínio destas funções é um corpo, chamamos
funções reais de n variáveis de campos escalares.

A rigor a função deve ser denotada pelo símbolo f enquanto o número real
associado ao vetor ~r pela função é denotado pelo símbolo f (~r ), mas é comum
fazer um abuso de notação e denotar a função por f (~r ) ou por f (x, y) no caso de
funções de duas variáveis. A vantagem do abuso de notação é explicitar a depen-
dência da função, mas é importante tomar cuidado para não confundir a função f
com o número real f (~r ), que são elementos de espaços vetoriais diferentes.

Exemplo 17.1 (Transformações lineares).


Uma função f : R2 ! R é uma transformação linear se

f (~r +~s ) = f (~r ) + f (~s ) e f (a ·~r ) = a · f (~r ) (17.3)

para quaisquer ~r e ~s contidos no R2 e qualquer número real a. Se os vetores do


R2 possuem coordenadas x e y, o valor f (x, y) assume a forma

f (x, y) = a · x + b · y (17.4)

com a e b reais constantes. Esta operação pode ser representada matricialmente


por
✓ ◆
x
f (x, y) = a b = a·x+b·y . (17.5)
y
17.1 Campos escalares 479

Na notação matricial o vetor~r é representado por uma matriz coluna de entradas


x e y, a função f é representada por uma matriz linha de entradas a e b e o número
real f (x, y) é o resultado da multiplicação da matriz linha que representa f pela
matriz coluna que representa~r .
O perigo do abuso de notação ao denotar a função pelo símbolo f (~r ) é confun-
dir uma função (que neste exemplo é denotado por uma matriz) com um número
real.

17.1.1 Domínio de campos escalares


No caso de funções reais de uma única variável o domínio de uma função f ,
normalmente denorado por D f , é o conjunto de números reais para os quais a
função f é definida e o número real f (x) pode ser calculado. Algumas vezes o
domínio é restringido pois a função não pode ser calculada em alguns valores de x,
como f (x) = log(x) cujo domínio é D f = R+ pois o logaritmo está definido apenas
se x > 0, ou porque estamos interessados no comportamento de uma função em
um intervalo limitado, como no caso de integrais definidas em um intervalo [a, b].
Se quisermos calcular a área limitada pela parábola f (x) = 1 x2 e a reta y = 0, é
irrelevante o comportamento da função fora do intervalo [ 1, 1].
O domínio de uma função de uma única variável pode ser toda a reta real,
pode ser limitado inferiormente ( [a, +•) ou (a, +•)), limitado superiormente
(( •, a] ou ( •, a)) ou limitado ([a, b], (a, b), [a, b) ou (a, b]). O domínio pode
ser também uma união dos exemplos mencionados.

Exemplo 17.2.
y Seja f uma função tal que

f (x) = log (1 x2 )(x2 4) . (17.6)

O domínio da função é tal que o argu-


mento do logaritmo seja positivo, como
-2 -1 1 2 x ilustrado na figura ao lado, o que ocorre
nos intervalos abertos ( 2, 1) e (1, 2).
Portanto

D f = ( 2, 1) [ (1, 2) . (17.7)

Exemplo 17.3.
No caso da função
p
f (x) = sen(x) , (17.8)
480 Funções reais de várias variáveis

o domínio é o conjunto de pontos em que sen(x) 0, o que ocorre nos interva-


los fechados, [2kp, 2kp + p] portanto o domínio de f é a união destes infinitos
conjuntos fechados.

O domínio de funções de várias variáveis é definido de maneira semelhante.


Podemos selecionar as regiões em que queremos analisar o comportamento da
função (como faremos ao definir integral dupla) ou temos também que excluir
pontos em que alguma operação não está definida.

Exemplo 17.4.
Seja

f (x, y) = log(a2 x2 y2 ) , (17.9)

com a > 0. O logaritmo pode ser calculado somente nos pontos em que o argu-
mento é positivo, ou seja,

a2 x2 y2 > 0 =) x2 + y2 < a2 . (17.10)

O domínio desta função é o conjunto de


pontos dentro da circunferência de raio
a centrada na origem. A circunferência
está representada na figura ao lado por
uma linha tracejada para denotar que os
pontos da circunferência não pertencem
ao domínio.

D f = (x, y) 2 R2 | x2 + y2 < a2
(17.11)

Exemplo 17.5.
17.1 Campos escalares 481

No caso da função
p
f (x, y) = a2 x2 y2 (17.12)

com a > 0, o domínio da função é o con-


junto de pontos em que o argumento é
maior ou igual a zero. Neste exemplo

D f = (x, y) 2 R2 | x2 + y2  a2
(17.13)

Na figura ao lado a circunferência está


representada por uma linha contínua para
indicar que a curve pertence ao domínio.

17.1.2 Conjuntos abertos


A diferença entre os domínios dos dois últimos exemplos é que um deles con-
tém a circunferência de raio a centrada na origem enquanto o outro domínio não
contém esta circunferência. Queremos definir o conjunto que contém a circunfe-
rência como um conjunto fechado e o conjunto que não contém a circunferência
como um conjunto aberto. Antes de utilizar estes termos devemos definí-los de
uma maneira mais adequada a funções de várias variáveis.

Definição 17.3 (Bola aberta).


Seja~r 0 um elemento qualquer do Rn e a um número real positivo. O conjunto

B(~r 0 , a) = {~r 2 Rn | k~r ~r 0 k < a} (17.14)

é chamado de bola aberta de raio a centrada em~r 0 .

A bola aberta de raio a centrada em um ponto é o conjunto de elementos do Rn


cuja distância ao ponto ~r 0 é menor que a, ou seja, a vizinhança
p de tamanho a do
ponto ~r 0 . Em duas dimensões, k~r ~r 0 k < a implica (x x0 )2 + (y y0 )2 < a
que por sua vez implica (x x0 )2 + (y y0 )2 < a2 , ou seja, a bola aberta de raio a
no R2 é um disco (sem incluir a circunferência).
Em três dimensões k~r ~r 0 k < a implica (x x0 )2 + (y y0 )2 + (z z0 )2 < a2 ,
isto é, os pontos dentro de uma esfera de raio a centrada em (x0 , y0 , z0 ), sem incluir
a esfera. Em uma dimensão k~r ~r 0 k < a implica |x x0 | < a, que implica a
desigualdade x0 a < x < x0 + a. A bola aberta em uma dimensão é um intervalo
aberto.
482 Funções reais de várias variáveis

Em quatro dimensões podemos descrever a bola aberto como o conjunto de


pontos limitados por uma hiper-esfera, que é uma hiper-superfície de três dimen-
sões imersa em um espaço de quatro dimensões. No entanto apesar de podemos
descrever matematicamente estas regiões, não temos uma interpretação geomé-
trica simples deste conjunto. Para evitar um nome diferente para cada número de
dimensões chamamos este conjunto de bola aberta independente do número de
dimensões.

Definição 17.4 (Ponto interior).


Seja S um subconjunto do Rn e seja~r 0 2
S. Dizemos que~r 0 é um ponto interior de
S se existir uma bola aberta centrada em
~r 0 contida em S.

Os três pontos ilustrados na figura ao


lado são pontos interiores da região pre-
enchida em azul, pois cada ponto possui
uma bola aberta centrada nele contida na
região azul.

Definição 17.5 (Ponto exterior).


Seja S um subconjunto do Rn e seja~r 0 2
/
S. Dizemos que ~r 0 é um ponto exterior
de S se existir uma bola aberta centrada
em~r 0 que não contém elementos de S.

Os três pontos ilustrados ao lado não per-


tencem à região preenchida em azul e
ainda possuem uma vizinhança em torno
deles sem interseção com a região azul,
portanto são pontos exteriores ao con-
junto em questão.
17.1 Campos escalares 483

Definição 17.6 (Ponto de fronteira).


Seja S um subconjunto do Rn e seja~r 0 2
Rn . Dizemos que~r 0 é um ponto de fron-
teira de S se não for um ponto interior e
nem exterior.

Os pontos ilustrados na figura ao lado


estão na linha tracejada. Qualquer vizi-
nhança destes pontos possui interseção
com a região preenchida em azul, mas
não está totalmente contida nesta região.

Em outras palavras, um ponto interior de S possui uma vizinhança inteira-


mente contida em S. Um ponto exterior possui uma vizinhança cuja interseção
com S é o conjunto vazio. E por fim, em um ponto de fronteira qualquer vizi-
nhança possui interseção não nula com S mas não está totalmente contida em S.
É irrelevante para esta definição se os pontos de fronteira pertencem ou não ao
conjunto.
Definição 17.7 (Interior e Exterior).
O conjunto dos pontos interiores de S é chamado de interior de S e denotado
por int(S). O conjunto dos pontos exteriores a S é chamado de exterior de S é
denotado por ext(S). O conjunto dos pontos de fronteira é chamado de fronteira
de S.
Definição 17.8 (Conjunto aberto).
Um conjunto S ⇢ Rn é um conjunto aberto se todos os seus elementos são
pontos interiores, isto é, se
int(S) = S . (17.15)
Exemplo 17.6.
O domínio da função f (x, y) =
log(a2 x2 y2 ) é Df =
(x, y) 2 R | x + y2 < a2 .
2 2

Um elemento qualquer ~r 0 2 S possui


uma distância d até a circunferência x2 +
y2 = a2 . Seja d tal que 0 < d < d. A
bola aberta de raio d centrada em~r 0 é um
ponto interior, pois B(~r 0 , d) ⇢ D f . Como
qualquer ponto de D f é um ponto inte-
rior, D f é um conjunto aberto.
484 Funções reais de várias variáveis

Exemplo 17.7.
O domínio
p da função
f (x, y) = 2
a x y 2 2 é Df =
(x, y) 2 R2 | x2 + y2  a2 . Seja ~r 0 um
elemento da circunferência x2 + y2 = a2 ,
que pertence a D f . Para qualquer d > 0
a bola aberta centrada em ~r 0 contém
pontos tais que x2 + y2 > a2 , ou seja, que
não pertencem a S, mas cuja interseção
com S não é vazia. Portanto os pontos da
circunferência x2 + y2 = a2 são pontos
de fronteira. Como D f contém pontos
que não são interiores, D f não é um
conjunto aberto.
Exemplo 17.8 (Intervalo aberto).
O intervalo (a, b) ⇢ R é um conjunto
aberto. Seja x0 2 (a, b). Seja d =
a x-δ x x+δ b x min (|x0 a|, |x b|), que é um número
positivo. Seja d tal que 0 < d < d.
A bola aberta centrada em x0 de raio d é um intervalo aberto totalmente contido
em x0 , portanto x0 é um ponto interior. Como qualquer elemento de (a, b) é um
ponto interior, intervalos abertos são conjuntos abertos.
Exemplo 17.9 (Bola aberta).
Em qualquer número de dimensões a bola aberta de raio a centrada em ~r 0 é
um conjunto aberto, como no caso do conjunto S = (x, y) 2 R2 | x2 + y2 < a2
ou do intervalo aberto, que são casos particulares de bola aberta.
Exemplo 17.10 (Produto cartesiano).
O produto cartesiano cartesiano dos in-
y

tervalos abertos (a, b) e (c, d), isto é, S =


(x, y) 2 R2 | a < x < b e c < y < d , é
um conjunto aberto. Qualquer ponto
neste conjunto tem uma certa distância
c

x
positiva a alguma fronteira e uma bola
aberta de raio menor que esta distância
a b

estará contida na região preenchida em


azul.
Exemplo 17.11 (Conjunto vazio).
Seja S = 0/ o conjunto vazio. O conjunto de pontos interiores ao conjunto
/ = 0.
vazio é vazio, portanto int(0) / Pela definição, o conjunto vazio é um conjunto
aberto.
17.1 Campos escalares 485

Exemplo 17.12 (Rn ).


Seja~r 0 um elemento qualquer do Rn e a um número real positivo qualquer. A
bola aberta de raio a centrada em ~r 0 está inteiramente contida no Rn , portanto é
um ponto interior. Como todos os elementos do Rn são pontos interiores, o Rn é
um conjunto aberto.

Exemplo 17.13 (União).


Sejam A e B conjuntos abertos. A união de A e B é um conjunto aberto. É
trivial verificar que se ~r 0 2 (A [ B), então ~r 0 é um ponto interior de A ou B, e
portanto é ponto interior de A [ B.

Exemplo 17.14 (Interseção).


A interseção de dois conjuntos abertos é também um conjunto aberto. Se A
e B são abertos, sua interseção pode ser vazia, que por definição é um conjunto
aberto, ou pode ser um subconjunto não vazio. Se ~r 0 2 A \ B, então este ponto
pertence simultaneamente a A e B. Como A e B só contém pontos interiores, ~r 0
existe alguma bola aberta centrada em~r 0 contida em A e alguma outra bola aberta
contida em B. A menor delas estará contida na interseção de A e B, tornando o
ponto~r 0 um interior da interseção.

17.1.3 Conjuntos fechados

Definição 17.9 (Complemento).


Seja S um subconjunto do Rn . Definimos o complemento de S como o conjunto
dos elementos do Rn que não pertencem a S, que denotamos por

SC = S = {~r 2 Rn |~r 2
/ S} . (17.16)

Definição 17.10 (Conjunto fechado).


Um subconjunto S ⇢ Rn é dito fechado se o seu complemento for um conjunto
aberto.

Exemplo 17.15.
486 Funções reais de várias variáveis

O domínio da função f (x, y) =


log(a2 x2 y2 ) é Df =
2 2 2
(x, y) 2 R | x + y < a 2 e
seu complemento é Df =
(x, y) 2 R2 | x2 + y2 a2 .
Os elementos da circunferência x2 +y2 =
a2 são pontos de fronteira tanto de D f
quando do seu complemento. Como eles
não pertencem a D f , devem pertencer ao
complemento. Se o complemento possui
pontos que não são pontos interiores, en-
tão o complemento não é aberto e o con-
junto D f não é fechado.

Exemplo 17.16.
O domínio p da função
f (x, y) = a2 x2 y2 é
Df = 2 2 2
(x, y) 2 R | x + y  a 2

e seu complemento é D f =
(x, y) 2 R2 | x2 + y2 > a2 .
Assim como no exemplo anterior, a fron-
teira do domínio é a circunferência x2 +
y2 = a2 . Como todos os pontos da fron-
teira pertencem a D f , o complemento
contém apenas os pontos exteriores a
D f , que são pontos interiores do com-
plemento D f . Se o complemento possui
apenas pontos interiores, é um conjunto
aberto e pela definição o domínio D f é
um conjunto fechado.
Exemplo 17.17 (Intervalo fechado).
Seja S = [a, b] um intervalo real fechado. O complemento de S é a união
dos intervalos abertos ( •, a) e (b, +•). A união de dois conjuntos abertos é
também um conjunto aberto, portanto o complemento do intervalo fechado [a, b]
é um conjunto aberto. Logo intervalos fechados são conjuntos fechados, como já
esperado pelo nome.

Exemplo 17.18 (Produto cartesiano).


O produto cartesiano cartesiano dos intervalos fechados [a, b] e [c, d], isto é,

S = (x, y) 2 R2 | a  x  b e c  y  d , (17.17)
17.1 Campos escalares 487

é um conjunto fechado. Todos os pontos de fronteira pertencem a S, logo o com-


plemente possui apenas os pontes exteriores a S, que são pontos interiores do
complemento. Sendo o complemento um conjunto aberto, S é um conjunto fe-
chado.
Exemplo 17.19 (Conjunto vazio).
Seja S = o conjunto vazio. O complemento do conjunto vazio é o conjunto
dos elementos que pertencem ao Rn mas que não pertencem ao vazio, isto é, todo
o Rn . Como o Rn é um conjunto aberto, pela definição o vazio é um conjunto
fechado.
Exemplo 17.20 (Rn ).
O complemento do Rn é o conjunto vazio, que como vimos é um conjunto
aberto. Portanto o Rn é um conjunto fechado.
Por mais estranho que possa parecer, as definições de conjunto aberto e con-
junto fechado não são excludentes. O conjunto vazio e o Rn são simultaneamente
abertos e fechados.
Exemplo 17.21 (União).
Sejam A e B conjuntos fechados e S = A [ B. O complemento da união de dois
conjuntos é a interseção dos complementos de cada conjunto, isto é,
A[B = A\B . (17.18)
Se A e B são fechados, por definição A e B são abertos, e a interseção de conjuntos
abertos é um conjunto aberto. Portanto A [ B é um conjunto fechado.
Exemplo 17.22 (Interseção).
Sejam A e B conjuntos fechados e S = A \ B. O complemento da interseção de
dois conjuntos é a união dos complementos de cada conjunto, isto é,
A\B = A[B . (17.19)
Se A e B são fechados, por definição A e B são abertos, e a união de conjuntos
abertos é um conjunto aberto. Portanto A [ B é um conjunto fechado. Se os
conjuntos A e B são disjuntos, sua interseção é vazia, que também é um conjunto
fechado.
Exemplo 17.23.
Seja S = [a, b) ⇥ [c, d) o produto cartesi-
y

ano de intervalos semi-abertos. Este pro-


duto cartesiano representa um retângulo
que contém a fronteira inferior e a fron-
teira à esquerda, mas não contém a fron-
c

x
teira superior e nem a fronteira à direita.
Como S contém pontos de fronteira ele
a b

não pode ser um conjunto aberto.


488 Funções reais de várias variáveis

O complemento de S também não é um conjunto aberto, pois contém os pontos


de fronteira que não estão contidos em S. Logo se o complemento não é aberto,
S não é um conjunto fechado. Neste exemplo o conjunto não é aberto e não é
fechado.

Resumindo, se um subconjunto do Rn tem uma fronteira. Ele é aberto se


nenhum ponto da fronteira pertencer ao conjunto. Ele é fechado se contiver todos
os pontos da fronteira. O conjunto vazio e o Rn são conjuntos simultaneamente
abertos e fechados.
17.1 Campos escalares 489

17.1.4 Imagem de campos escalares


Como uma função de várias variáveis é uma transformação f : Rn ! R, o
contradomínio é o conjunto dos números reais. A imagem de uma função de
várias variáveis é o conjunto de números reais que o valor f (~r ) pode assumir.

Exemplo 17.24.
Seja

f (x, y) = x y 8(x, y) 2 R2 . (17.20)

Como tanto x quando y podem assumir qualquer valor real, a diferença x y não
é limitada superiormente ou inferiormente, portanto Im( f ) = ( •, +•).

Exemplo 17.25.
Seja

f (x, y) = ex y
8(x, y) 2 R2 . (17.21)

O argumento da exponencial pode assumir qualquer valor real, mas o resultado da


exponenciação é sempre positivo, então neste caso Im( f ) = (0, +•).

Exemplo 17.26.
Seja

x2 y2 z2
f (x, y, z) = e 8(x, y, z) 2 R3 . (17.22)

Por mais que x, y e z possam assumir qualquer valor real, o argumento da expo-
nencial nunca será positivo. Nestas condições Im( f ) = (0, 1].

Exemplo 17.27.
Seja

f (x, y) = x y 8(x, y) 2 [a, b] ⇥ [c, d] . (17.23)

O domínio agora é um conjunto fechado de área finita. É fácil perceber que f (x, y)
é maior quanto maior for o valor de x e menor for o valor de y, portanto o seu valor
máximo neste domínio ocorre quando x = b e y = c. Da mesma forma, o valor
mínimo de f (x, y) ocorre quando x = a e y = d. Portanto Im( f ) = [a d, b c].
490 Funções reais de várias variáveis

17.1.5 Gráfico de campos escalares


Seja f uma função de duas variáveis com um certo domínio D f . Seja S o
subconjunto do R3 definido por

S = (x, y, z) 2 R3 | (x, y) 2 D f , z = f (x, y) . (17.24)

A equação z = f (x, y) é um vínculo que define uma superfície contida no R3 , que


chamamos de gráfico da função. Este vínculo é chamado também de represen-
tação explícita da superfície S ⇢ R3 . Para cada ponto do domínio D f que é um
subconjunto do R2 , a função f associa um ponto com altura z = f (x, y). A coleção
destes pontos pertencentes ao conjunto S forma o gráfico da função.

Figura 17.1: A superfície em vermelho representa o gráfico da função z = x2


y2 + 50. O retângulo em verde representa o domínio.

É possível verificar que o conjunto S é um conjunto fechado. Cada ponto


de S é um ponto de fronteira, pois qualquer bola aberta contém pontos em que
z > f (x, y) e z < f (x, y). Possuindo pontos de fronteira, este conjunto não é aberto.
O complemento de S é a união de dois conjuntos abertos definidos pelos pontos
que satisfazem z > f (x, y) ou z < f (x, y). Como a união de conjuntos abertos é
também um conjunto aberto, o complemento de S é fechado, portanto o gráfico de
uma função de duas variáveis é um conjunto fechado.
17.1 Campos escalares 491

Exemplo 17.28 (Função constante).

Figura 17.2: Seja f (x, y) = K e D f = R2 , com K constante. O gráfico desta função


é o plano horizontal representado em vermelho, com o domínio representado em
verde.

Exemplo 17.29 (Transformação Linear).

Figura 17.3: Seja f (x, y) = a · x + b · y e D f = R2 , com a e b constantes. O gráfico


desta função é um plano não vertical que passa pela origem. Toda transformação
linear do R2 em R assume esta forma com algum a e b reais.
492 Funções reais de várias variáveis

Exemplo 17.30 (Função afim).

Figura 17.4: Seja f (x, y) = a · x + b · y + c e D f = R2 , com a, b e c constantes e


com c 6= 0. O gráfico desta função é um plano não vertical que não passa pela
origem.

Exemplo 17.31 (Hemisfério).


A esfera de raio a centrada na origem é representada
implicitamente por x2 + y2 + z2 = a2 . Isolando o z
temos duas soluções reais
p
z = ± a2 x2 y2 . (17.25)

Cada sinal representa explicitamente um hemisfério


da esfera. O domínio desta função é o conjunto fe-
chado D f = (x, y) 2 R2 | x2 + y2  a2
Em um número de dimensões arbitrário o gráfico de uma função de n variá-
veis é ainda o conjunto de elementos do Rn+1 que satisfazem o vínculo xn+1 =
f (x1 , . . . , xn ),

G = (x1 , x2 , . . . , xn , xn+1 ) 2 Rn+1 | (x1 , x2 , . . . , xn ) 2 D f , xn+1 = f (x1 , x2 , . . . , xn ) .


(17.26)

Apesar das aplicações geométricas não terem aplicações práticas, existem di-
versas aplicações em Física e em Engenharia de funções de mais de três variáveis,
especialmente na Termodinâmica e em sistemas mecânicos de várias partículas.
17.1 Campos escalares 493

Exemplo 17.32.

Figura 17.5: Seja f (x, y) = sen(x2 + y2 ) e D f = R2 . O gráfico desta função exibe


oscilações circulares.

Exemplo 17.33.

Figura 17.6: Seja f (x, y) = sen(x) · sen(y) e D f = R2 . O gráfico desta função


exibe oscilações num padrão quadriculado.
494 Funções reais de várias variáveis

Exemplo 17.34.

Figura 17.7: Seja f (x, y) = log(3x + 2y) e D f = (x, y) 2 R2 | 3x + 2y > 0 . O


gráfico desta função diverge quando o argumento do logaritmo se aproxima de
zero.

17.1.6 Curvas de nível


O gráfico de uma função de duas variáveis é uma superfície contida no R3 .
Esta superfície pode ainda ser visualizada, mas se quisermos representar o com-
portamento da função em duas dimensões (como por exemplo em um papel), po-
demos traçar um conjunto de curvas chamado curvas de nível.
Seja k um número real contido na imagem da função f . O vínculo
f (x, y) = k (17.27)
é a representação implícita de uma curva que chamamos de curva de nível refe-
rente ao nível k. Ao mudar o valor de k encontramos outra curva de nível referente
ao novo nível escolhido.
Exemplo 17.35 (Esfera).
O hemisfério superior da esfera da raio 1 centrada na origem é o gráfico da
função
p
f (x, y) = 1 x2 y2 (17.28)
com domínio
D f = (x, y) 2 R2 | x2 + y2  1 . (17.29)
17.1 Campos escalares 495

A imagem desta função é Im( f ) = [0, 1], então podemos escolher qualquer valor
de
p k neste intervalo. A curva de nível é representada implicitamente por k =
1 px2 y2 ou equivalentemente x2 + y2 = 1 k2 , que é uma circunferência de
raio 1 k2 centrada na origem. Escolhendo k = 0, k = 0.2, k = 0.4, k = 0.6,
k = 0.8 e k = 1 temos um conjunto de seis curvas de nível da esfera.
Ao escolher um nível, estamos escolhendo os pontos com altura z constante.
O conjunto de pontos com altura constante é um plano horizontal. Na figura 17.8
exibimos à esquerda diversos planos horizontais, e à direita a interseção destes
planos horizontais com a superfície da esfera, que são curvas.

Figura 17.8: Cortes horizontais na esfera de diferentes níveis (esquerda) e inter-


seção destes cortes com a superfície da esfera (direita).

Estas curvas são projetadas no plano z = 0 na figura 17.9 à esquerda. Dese-


nhando apenas as seis curvas de nível escolhidas com k = 0, k = 0.2, k = 0.4,
k = 0.6, k = 0.8 e k = 1 temos o conjunto de circunferências mostradas na fi-
gura 17.9 à direita.

Figura 17.9: Curvas de nível da esfera projetadas no domínio (esquerda) e visua-


lização bidimensional (direita)
496 Funções reais de várias variáveis

Exemplo 17.36 (Cone). p


Seja f (x, y) = 1 x2 + y2 , com domínio D f = (x, y) 2 R2 | x2 + y2  1 e
imagem Im( f ) = [0, 1]. As curvas de nível são dadas por
p
k=1 x2 + y2 =) x2 + y2 = (1 k)2 , (17.30)
ou seja, são circunferências centradas na origem de raio 1 k, como ilustrado na
figura 17.10 com k = 0, k = 0.2, k = 0.4, k = 0.6, k = 0.8 e k = 1.

Figura 17.10: Cortes horizontais no cone e curvas de nível.

Olhando apenas as curvas de nível pode ser difícil distinguir um cone de uma
esfera. A diferença está no espaçamento entre as curvas. Escolhendo níveis igual-
mente espaçados, como k = 0, k = 0.2, k = 0.4, k = 0.6, k = 0.8 e k = 1 nos
exemplos anteriores, no caso do cone as circunferências possuem raios igualmente
espaçados, enquanto na circunferência não.
Exemplo 17.37 (Paraboloide de revolução).
Seja f (x, y) = 1 x2 y2 , com domínio D f = (x, y) 2 R2 | x2 + y2  1 e
imagem Im( f ) = [0, 1]. As curvas de nível são dadas por
k=1 x2 y2 =) x2 + y2 = (1 k) , (17.31)

Figura 17.11: Cortes horizontais no paraboloide de revolução e curvas de nível.


17.1 Campos escalares 497

p
ou seja, são circunferências centradas na origem de raio 1 k, como ilus-
trado na figura 17.11 com k = 0, k = 0.2, k = 0.4, k = 0.6, k = 0.8 e k = 1.

Assim como no caso da circunferência, as curvas de nível não possuem raios


igualmente espaçados. É difícil apenas pelas curvas de nível distinguir uma cir-
cunferência de um paraboloide de revolução. O espaçamento das curvas de nível
depende de quão íngreme é a superfície, mas este conceito ainda precisa ser defi-
nido de maneira mais formal.

Exemplo 17.38 (Sela de cavalo).


Seja f (x, y) = x2 y2 . O domínio desta função é todo o R2 e a imagem é todo
o eixo real. Neste caso podemos escolher qualquer k real. O vínculo x2 y2 = k
representa um par de hipérboles que interceptam o eixo x se k > 0, um par de
hipérboles que interceptam o eixo y se k < 0 e duas retas se k = 0.

Figura 17.12: Curvas de nível da sela de cavalo.

Exemplo 17.39.
Voltando ao exemplo f (x, y) = sen(x2 + y2 ) o comportamento circular pode
ser observado de forma mais simples nas curvas de nível. Dependendo do ângulo
de observação e do número de linhas utilizados ao montar o gráfico a superfície
tridimensional pode não exibir um comportamento de forma tão clara quanto as
curvas de nível.
498 Funções reais de várias variáveis

Figura 17.13: Curvas de nível de f (x, y) = sen(x2 + y2 ).

Exemplo 17.40.
Assim como no exemplo anterior, a função f (x, y) = sen(x) · sen(y) descreve
uma oscilação, mas neste caso com um comportamento reticulado, o que não é
observado tão bem no gráfico da função. As curvas de nível exibem este compor-
tamento de forma mais explícita.

Figura 17.14: Curvas de nível de f (x, y) = sen(x) · sen(y).


17.1 Campos escalares 499

Exemplo 17.41.
No caso da função f (x, y) = log(3x + 2y), o fato das curvas de nível serem
retas traz a informação de que a dependência nas varíaveis x e y é sempre em uma
combinação linear específica delas, no caso a combinação linear 3x + 2y. Pelas
curvas de nível é difícil observar que a função é um logaritmo desta combinação
linear, esta informação é exibida pelo gráfico da função.

Figura 17.15: Curvas de nível de f (x, y) = log(3x + 2y).

17.1.7 Superfícies de nível


Superfícies de nível são o análogo a curvas de nível para funções de três variá-
veis. Seja a equação u = f (x, y, z), onde f é uma função real de três variáveis. O
gráfico desta função é uma hipersuperfície tridimensional imerso num espaço de
quatro dimensões, o que está além da nossa habilidade de desenhar e visualizar.
No entanto, se escolhermos algum valor da imagem da função, isto é, escolher-
mos algum k 2 Im( f ) e colecionamos o conjunto de pontos no domínio da função
com este valor específico, o vínculo f (x, y, z) = k com k fixado é a representação
explícita de uma superfície no R3 .

Sk = (x, y, z) 2 R3 | f (x, y, z) = k (17.32)

Cada valor específico de k define uma superfície. A coleção das superfícies


definidas pelos diversos valores diferentes de k forma as superfícies de nível da
função f .
500 Funções reais de várias variáveis

Exemplo 17.42.
Seja

f (x, y, z) = x2 + y2 + z2 , (17.33)

que possui domínio D f = R3 e imagem


Im( f ) = [0, +•). Para cada k 0 cons-
tante o vínculo x2 + y2 +pz2 = k repre-
senta uma esfera de raio k. As super-
fícies de nível desta função são esferas
centradas na origem.

p Assim como no caso de curvas p de nível, existem outras funções, como f (x, y, z) =
x2 + y2 + z2 ou f (x, y, z) = 1 x2 y2 z2 , cujas superfícies de nível são es-
feras concêntricas e a diferença pode ser vista no espaçamento entre as esferas.

Exemplo 17.43.
Seja

f (x, y, z) = x2 + y2 z2 , (17.34)

com domínio D f = R3 e imagem Im( f ) = ( •, +•). Podemos calcular superfí-


cies de nível com qualquer valor real de k.
Se k = 0, o vínculo x2 + y2 z2 = 0 re-
presenta um cone. Se k > 0, o vínculo
x2 + y2 z2 = k representa um hiperbo-
loide de uma folha. Se k < 0, o vínculo
x2 + y2 z2 = k representa um hiperbo-
loide de duas folhas. Estas superfícies
estão ilustradas na figura ao lado.
17.2 Limite e Continuidade 501

17.2 Limite e Continuidade


Assim como no caso de funções reais de uma única variável, é importante
definir o limite de uma função de várias variáveis de maneira rigorosa, pois uma
definição imprecisa pode atribuir um limite quando ele na verdade não existe. Por
exemplo, se definimos o limite de uma função como um número real L do qual
f (x) se aproxima à medida em que x se aproxima de um certo x0 , podemos con-
cluir erroneamente o limite da função f (x) = sen px vale 0 ou qualquer valor real
entre 1 e 1 escolhendo uma tabela específica. Neste exemplo tabelas diferentes
podem concluir limites diferentes.
Se uma função é contínua qualquer tabela tenderá ao valor correto de limite,
mas a definição de função contínua depende da definição de limites, portanto pre-
cisamos de uma definição mais precisa de limites envolvendo o conceito de vi-
zinhança. No caso de funções de mais de uma variável estes problemas podem
acontecer mesmo em funções racionais, como mostrado nos exemplos a seguir.
Exemplo 17.44.
Seja
xy
f (x, y) = . (17.35)
x2 + y2
Esta função está definida em todo o R2 exceto na origem. Não podemos calcular
f (0, 0), mas podemos calcular f (x, y) em valores de (x, y) próximos de (x0 , y0 ) =
(0, 0) e fazer o ponto (x, y) se aproximar cada vez mais de (x0 , y0 ). A maneira que
o ponto (x, y) se aproxima de (x0 , y0 ) é um caminho contido no R2 .
Seja C um caminho contínuo parametrizado por ~r (t) = (x(t), y(t)) com t 2
[a, b] tal que~r (t0 ) = (x0 , y0 ). A composição

F(t) = f (x(t), y(t)) (17.36)

é uma função real de uma única variável e o campo vetorial


~g (t) = (x(t), y(t), f (x(t), y(t))) (17.37)

define um caminho contido na superfície z = f (x, y).


Como f não está definida no ponto (x0 , y0 ) = (0, 0), a superfície possui um
“buraco” neste ponto. Mas podemos calcular a altura deste “buraco” pelo valor
do limite da componente z da curva contida na superfície que passa por este ponto,
isto é, pelo limite

z0 = lim F(t) = lim f (x(t), y(t)) . (17.38)


t!t0 t!t0

Este limite é o limite de uma função real de uma única variável.


502 Funções reais de várias variáveis

Os caminhos mais simples que passam pela origem são a reta horizontal y = 0
e a reta vertical x = 0. No caso da reta horizontal parametrizamos o caminho por
~r (t) = (t, 0) e em t = 0 temos~r (0) = (0, 0). Então o limite que queremos calcular
é o limite da composição

t ·0 0
z(t) = f (t, 0) = = =0 (17.39)
t 2 + 02 t2
se t 6= 0. O limite desta composição é

lim f (t, 0) = 0 . (17.40)


t!0

Ao longo da reta y = 0 a superfície z = f (x, y) possui altura constante que vale


zero.
No caso da reta vertical x = 0 parametrizamos o caminho por ~r (t) = (0,t) e
em t = 0 temos~r (0) = (0, 0). Então o limite que queremos calcular é o limite da
composição

0 ·t 0
z(t) = f (0,t) = = =0 (17.41)
02 + t 2 t2
se t 6= 0. O limite desta composição é

lim f (0,t) = 0 . (17.42)


t!0

Ao longo desta reta a superfície z = f (x, y) também possui altura constante nula.
Nestes dois caminhos os valores de f (x, y) = x2xy +y2
se aproximam do valor 0 à
medida em que o argumento se aproxima da origem (0, 0), o que sugere que o
limite desta função vale zero quando o argumento se aproxima da origem.
Seja agora a reta inclinada y = mx com m 6= 0, que também intercepta a origem.
Parametrizamos este caminho por~r (t) = (t, mt), com~r (0) = (0, 0). A composição
f (x(t), y(t)) vale

t · mt mt 2 m
f (x(t), y(t)) = = = . (17.43)
t 2 + (mt)2 t 2 + m2t 2 1 + m2

Esta função é constante, portanto


m
lim f (x(t), y(t)) = . (17.44)
t!0 1 + m2
Agora à medida em que o caminho se aproxima da origem o valor de f (x, y)
se aproxima de um valor que depende de m, isto é, depende do ângulo em que a
17.2 Limite e Continuidade 503

reta cruza a origem. Se o limite tem valores diferentes para caminhos diferentes,
então o limite
xy
lim não existe. (17.45)
(x,y)!(0,0) x + y2
2

Esta não existência é análoga ao caso de funções de uma variável com limites
laterais distintos, e portanto o limite não existe.

xy
Figura 17.16: Gráfico da superfície z = x2 +y2
.

Exemplo 17.45.
Essa questão de limites ao longo de caminhos pode ser ainda mais complicada.
Seja agora

xy2
f (x, y) = . (17.46)
x2 + y4

Novamente temos uma função definida em todos os pontos do R2 exceto na ori-


gem, onde queremos calcular o limite. Pela reta vertical x = 0 temos o caminho
parametrizado por ~r (t) = (0,t) com ~r (0) = (0, 0). A composição f (x(t), y(t))
neste caminho vale
0t 2 0
f (0,t) = 2 4
= 4 =0 (17.47)
0 +t t
se t 6= 0 e portanto

lim f (0,t) = 0 . (17.48)


t!0
504 Funções reais de várias variáveis

Por este caminho os valores de f (x, y) se aproximam de zero à medida em que o


argumento (x, y) tende à origem.
Consideramos agora a reta não vertical y = mx, com m real, que parametriza-
mos por ~r (t) = (t, m ·t) e quando t = 0 a reta passa pela origem. A composição
f (~r (t)) é

t(mt)2 m2 t 3 m2t
f (t, mt) = = = (17.49)
t 2 + (mt)4 t 2 + m4t 4 1 + m4t 2

m2 t
lim f (t, mt) = lim =0. (17.50)
t!0 t!0 1 + m4t 2

Ao longo de todas as infinitas retas que passam pela origem a altura da superfície
z = f (x, y) é nula quando t = 0. Se o limite ao longo de infinitos caminhos que
passam pela origem da composição da função é nulo, parece mais seguro afirmar
que o limite de f (x, y) quando (x, y) tende a (0, 0).
Seja agora o caminho ao longo da parábola x = y2 , que também corta a origem.
Podemos parametrizar este caminho pela função vetorial ~r (t) = (t 2 ,t) e ~r (0) =
(0, 0). Ao longo deste caminho a composição f (~r (t)) vale

(t 2 )t 2 t4 1
f (t 2 ,t) = = = (17.51)
(t 2 )2 + t 4 t 4 + t 4 2

se t 6= 0 e portanto

1
lim f (t 2 ,t) = . (17.52)
t!0 2

Este exemplo mostra que é possível que o limite ao longo de infinitos caminhos
sejam iguais e mesmo assim os caminhos ao longo de todos os caminhos não são
necessariamente iguais.
17.2 Limite e Continuidade 505

xy2
Figura 17.17: Gráfico da superfície z = x2 +y4
.

Este exemplo mostra que mesmo testando infinitos caminhos distintos pelos
quais o argumento (x, y) tende a um certo valor (x0 , y0 ) e encontrando o mesmo
valor ainda assim não é possível afirmar que o limite da função existe. Este pro-
blema é análogo ao caso unidimensional da função f (x) = sen px . Se montarmos
uma tabela dos valores de x tendendo a zero pela sequência xk = 1k os valores cal-
2
culados da função tendem a 0. Se montarmos uma tabela com valores xk = 4k+1 os
valores calculados da função tendem a 1. É possível montar infinitas tabelas dis-
tintas que sugerem que a função tende a 0 assim como é possível montar infinitas
tabelas distintas que sugerem que a função tende a 1.
Para evitar este problema, definimos o limite de uma função pelo conceito de
vizinhança. No limite de funções reais de uma variável dizemos que f (x) tende a
L quando x tende a x0 se os valores de f (x) são arbitrariamente próximo de L se
os valores de x forem suficientemente de x0 . Em uma linguagem mais matemática,
dizemos que

lim f (x) = L (17.53)


x!x0

se para todo e > 0 existir um d > 0 tal que

| f (x) L| < e sempre que 0 < |x x0 | < d . (17.54)

Esta definição pode ser extendida para funções de várias variáveis mudando a
expressão para a vizinhança de um ponto no Rn . Seja f : R2 ! R. Novamente
dizemos que o limite de f quando (x, y) tende a (x0 , y0 ) tende a um valor L se os
506 Funções reais de várias variáveis

valores de f (x, y) estiverem arbitrariamente próximos de L sempre que os vetor


(x, y) estiver suficientemente próximo de (x0 , y0 ).
Como f (x, y) continua sendo um elemento da reta real, a distância entre f (x, y)
e L é calculada pela expressão | f (x, y) L|. A expressão “ f (x, y) está arbitraria-
mente próximo de L” é equivalente a dizer que | f (x, y) L| < e para qualquer e
arbitrário. Os vetores (x, y) e (x0 , y0 ) no entanto são elementos do R2 , e a expres-
são para a distância entre estes elementos é diferente.
O R2 é um espaço vetorial euclidiano com produto interno definido pelo pro-
duto escalar usual. Então se ~r1 = (x1 , y1 ) e ~r2 = (x2 , y2 ) o produto interno entre
estes dois vetores é dado por

h~r1 ,~r2 i = x1 x2 + y1 y2 (17.55)

e a distância entre estes dois vetores é dada por


p
d(~r1 ,~r2 ) = k~r1 ~r2 k = h~r1 ~r2 ,~r1 ~r2 i . (17.56)

Neste caso a vizinhança de um ponto, ou seja, o conjunto de elementos do R2


cuja distância até um certo elemento~r0 = (x0 , y0 ) é menor que um valor real d > 0
pode ser expressa como o conjunto de valores (x, y) que satisfazem a equação
q
(x x0 )2 + (y y0 )2 < d . (17.57)

Geometricamente esta última equação representa o conjunto de pontos que estão


dentro de uma circunferência de raio d centrada em (x0 , y0 ), ou seja, representa
um disco. Em três dimensões, se ~r = (x, y, z) e ~r0 = (x0 , y0 , z0 ), a desigualdade
k~r ~r0 k < d pode ser escrita como
q
(x x0 )2 + (y y0 )2 + (z z0 )2 < d (17.58)

e representa o conjunto de pontos dentro de uma esfera de raio d centrada em ~r0 ,


que podemos chamar de bola. Em quatro ou mais dimensões não temos nomes
específicos para cada figura geométrica possível então para evitar uma nomencla-
tura diferente para cada número de dimensões chamamos o conjunto de valores
de~r que satisfazem a desigualdade k~r ~r0 k < d de bola aberta de raio d centrada
em~r0 independente do número de dimensões do domínio.
Na definição de limite excluímos a possibilidade de que ~r = ~r0 , pois a fun-
ção pode não estar definida em ~r0 . Este vínculo adicional pode ser escrito como
k~r ~r0 k > 0, pois a norma é sempre maior ou igual a zero e se anula apenas
quando~r = ~r0 . O conjunto de pontos na vizinhança de~r0 com o vínculo adicional
~r 6= ~r0 pode ser expresso apenas como 0 < k~r ~r0 k < d. Desta forma definimos o
limite de uma funções de várias variáveis da seguinte forma.
17.2 Limite e Continuidade 507

Definição 17.11. Seja f : Rn ! R. Dizemos que

lim f (~r) = L (17.59)


~r!~r0

se para todo e > 0 existir algum d > 0 tal que

| f (~r) L| < e sempre que 0 < k~r ~r0 k < d . (17.60)

No exemplo em que
xy
f (x, y) = , (17.61)
x2 + y2
vimos que ao longo da reta y = x existem pontos arbitrariamente próximos da
origem para os quais f (x, y) = 12 . Ao longo da reta y = x existem pontos arbitra-
riamente próximos da origem para os quais f (x, y) = 12 . Portanto qualquer bola
aberta em torno da origem contém pontos nos quais f (x, y) = 12 e f (x, y) = 12 .
Então se e < 12 não existe bola aberta em torno da origem tal que | f (x, y) L| < e
para qualquer ponto desta bola aberta. Portanto o limite
xy
lim (17.62)
(x,y)!(0,0) x2 + y2

não existe.
3x2 y
Exemplo 17.46. Seja f (x, y) = x2 +y2
. Queremos mostrar que

3x2 y
lim =0. (17.63)
(x,y)!(0,0) x2 + y2

Temos que
✓ ◆
3x2 y x2 p
0 = 3|y| 2  3|y|  3 x2 + y2 = 3 k(x, y) (0, 0)k . (17.64)
x2 + y2 x + y2

Para qualquer e positivo podemos escolher algum d tal que 0 < d < 3e . Então
sempre que k(x, y) (0, 0)k < d temos que

3x2 y e
0  3 k(x, y) (0, 0)k < 3 = e , (17.65)
x2 + y2 3

provando a equação (17.63).

Partindo da definição 17.11 podemos provar as seguintes propriedades.


508 Funções reais de várias variáveis

Teorema 17.1.
Seja ~r : R ! Rn um campo vetorial uniparamétrico contínuo em t0 tal que
~r (t0 ) =~r 0 e ~r (t) 6= ~r 0 se t 6= t0 . Seja f uma função de n variáveis com domínio
D f que contém a imagem do campo vetorial uniparamétrico~r (t). Se

lim f (~r ) = L , então lim f (~r (t)) = L . (17.66)


~r !~r 0 t!t0

Demonstração.
Como f (~r ) tende a L quando~r tende a~r 0 , por definição para todo e > 0 existe
algum d1 tal que | f (~r ) L| < e sempre que 0 < k~r ~r 0 k < d1 . Como o campo
vetorial é contínuo em t0 , para este d1 existe algum d > 0 tal que k~r (t) ~r (t0 )k <
d1 sempre que |t t0 | < d. Como~r (t) 6= ~r 0 se t 6= t0 , temos que

0 < |t t0 | < d =) 0 < k~r (t) ~r (t0 )k < d1 =) | f (~r (t)) L| < e , (17.67)

ou seja,

| f (~r (t)) L| < e sempre que 0 < |t t0 | < d , (17.68)

encerrando assim a demonstração.


Este teorema mostra que se o limite do campo escalar f (~r ) existe quando ~r
tende a~r 0 , então o limite de qualquer composição f (~r (t)) com~r (t0 ) =~r 0 quando
t tende a t0 existe e possui o mesmo valor. Em outras palavras, se o limite do
campo escalar existe em um ponto, o limite por qualquer caminho que passa por
este ponto existe e possui o mesmo valor. Como um corolário deste teorema, se
o limite em um ponto por caminhos distintos possui valores distintos, então não
existe o limite do campo escalar, como observado em alguns exemplos.
Este caso é análogo ao caso de limites de funções de uma variável por tabelas.
Se o limite de uma função existe, qualquer tabela de valores de f (x) com x se
aproximando de x0 se aproxima do mesmo valor L. No entanto não podemos
afirmar que o limite existe pelo cálculo por tabelas porque é possível que tabelas
distintas se aproximem de valores distintos para a mesma função.
Teorema 17.2. Se ~r!~
lim f (~r) = L1 e lim g(~r) = L2 , então
r0 ~r!~r0

(a)

lim [ f (~r) + g(~r)] = L1 + L2 ; (17.69)


~r!~r0

(b)

lim [a f (~r)] = aL1 para todo a real; (17.70)


~r!~r0
17.2 Limite e Continuidade 509

(c)
lim [ f (~r)g(~r)] = L1 L2 ; (17.71)
~r!~r0

(d)

f (~r) L1
lim = se L2 6= 0. (17.72)
~r!~r0 g(~r) L2

Demonstração. Queremos provar que para todo e > 0 existe algum d > 0 tal que
| f (~r) + g(~r) (L1 + L2 )| < e (17.73)
sempre que 0 < k~r ~r0 k < d. Pela desigualdade triangular
| f (~r) + g(~r) (L1 + L2 )| < | f (~r) L1 | + |g(~r) L2 | (17.74)
lim f (~r) = L1 e lim g(~r) = L2 , sabemos que para todo e > 0 existem d1 e
Como ~r!~ r0 ~r!~r0
d2 positivos tais que
e
| f (~r) L1 | < sempre que 0 < k~r ~r0 k < d1 e
2
e
|g(~r) L2 | < sempre que 0 < k~r ~r0 k < d2 .
2
Seja d o menor valor entre d1 e d2 . Então sempre que ~r satisfaz a desigualdade
0 < k~r ~r0 k < d este vetor satisfaz simultaneamente 0 < k~r ~r0 k < d1 e 0 <
k~r ~r0 k < d2 , portanto
e e
| f (~r) + g(~r) (L1 + L2 )| < | f (~r) L1 | + |g(~r) L2 | < + = e , (17.75)
2 2
o que prova o item (a) do teorema.
Para provar o item (b), devemos mostrar que para todo e > 0 existe algum
d > 0 tal que
|a f (~r) aL1 | < e (17.76)
sempre que 0 < k~r ~r0 k < d. Sabendo que ~r!~
lim f (~r) = L1 , para todo e > 0 existe
r0
um d > 0 tal que
e
| f (~r) L1 | < sempre que 0 < k~r ~r0 k < d . (17.77)
1 + |a|
Logo se 0 < k~r ~r0 k < d temos que
|a|
|a f (~r) aL1 | = |a|| f (~r) L1 | < e<e. (17.78)
1 + |a|
510 Funções reais de várias variáveis

Para o item (c), precisamos mostrar que para todo e > 0 existe algum d > 0 tal
que

| f (~r)g(~r) L1 L2 | < e (17.79)

sempre que 0 < k~r ~r0 k < d. Primeiro escrevemos

| f (~r)g(~r) L1 L2 | = | ( f (~r) L1 ) (g(~r) L2 ) + L1 (g(~r) L2 ) + L2 ( f (~r) L1 ) | .


(17.80)

Utilizando a desigualdade triangular, temos

| f (~r)g(~r) L1 L2 |  | f (~r) L1 ||g(~r) L2 | + |L1 ||g(~r) L2 | + |L2 || f (~r) L1 | .


(17.81)
lim f (~r) = L1 e lim g(~r) = L2 , sabemos que para todo e > 0 existem d1 , d2 ,
Como ~r!~ r0 ~r!~r0
d3 e d4 positivos tais que
r
e
| f (~r) L1 | < sempre que 0 < k~r ~r0 k < d1 ,
3
r
e
|g(~r) L2 | < sempre que 0 < k~r ~r0 k < d2 ,
3
e
| f (~r) L1 | < sempre que 0 < k~r ~r0 k < d3 e
3(1 + |L2 |)
e
|g(~r) L2 | < sempre que 0 < k~r ~r0 k < d4 .
3(1 + |L1 |)
Seja d o menor valor entre d1 , d2 , d3 e d4 . Então sempre que ~r pertence à bola
aberta de raio d centrada em ~r0 sabemos ~r pertence simultaneamente às quatro
bolas abertas mencionadas na equação anterior. Então aplicando as desigualdades
acima na equação (17.81) temos
r r
e e |L1 | e |L2 | e e e e
| f (~r)g(~r) L1 L2 | < + + < + + = e (17.82)
3 3 1 + |L1 | 3 1 + |L2 | 3 3 3 3
sempre que 0 < k~r ~r0 k < d, o que encerra a demonstração o item (c).
Para provar (d) provaremos primeiro que g(~1r) tende a L12 . Como L2 6= 0, o
número real |L22 | é necessariamente positivo, portanto para este número positivo
existe algum d1 > 0 tal que |g(~r) L2 | < |L22 | sempre que 0 < k~r ~r0 k < d1 . Nesta
bola aberta temos que
|L2 |
|L2 | = |L2 g(~r) + g(~r)|  |L2 g(~r)| + |g(~r)| < + |g(~r)| (17.83)
2
17.2 Limite e Continuidade 511

e
|L2 | |L2 | 1 2
|L2 | < + |g(~r)| =) < |g(~r)| =) < . (17.84)
2 2 |g(~r)| |L2 |
2
Para todo e > 0 existe algum d2 > 0 tal que |g(~r) L2 | < |L22 | e sempre que
0 < k~r ~r0 k < d2 . Seja d o menor valor entre d1 e d2 . Então sempre que 0 <
k~r ~r0 k < d temos que

1 1 L2 g(~r) 1 1 1 2 |L2 |2
= = |g(~r) L2 | < e < e . (17.85)
g(~r) L2 L2 g(~r) |L2 | |g(~r)| |L2 | |L2 | 2

Agora que provamos que ~r!~lim 1 = 1 utilizamos a propriedade (c) deste teorema
r0 g(~r) L2
já demonstrada para concluir que
✓ ◆ ✓ ◆✓ ◆
f (~r) 1 1 L1
lim = lim f (~r) lim = L1 = . (17.86)
~r!~r0 g(~r) ~r!~r0 ~r!~r0 g(~r) L2 L2

Com estas propriedades podemos calcular o limite de funções racionais co-


nhecendo limites de funções simples.
Exemplo 17.47 (Função constante).
Seja f (x, y) = c com c constante. Neste caso | f (x, y) c| = 0 para qualquer
valor (x, y) 2 R2 . Seja e > 0 arbitrário. Evidentemente | f (x, y) c| < e para todo
(x, y) 2 R2 . Assim em qualquer bola aberta em torno de qualquer ponto (x0 , y0 )
arbitrário é garantido que

| f (x, y) c| < e sempre que 0 < k(x, y) (x0 , y0 )k < d , (17.87)

ou seja,

lim f (x, y) = c . (17.88)


(x,y)!(x0 ,y0 )

O limite de uma função constante é sempre igual ao próprio valor da constante.


Exemplo 17.48 ( f (x, y) = x).
No caso da função f (x, y) = x, queremos mostrar que

lim x = x0 . (17.89)
(x,y)!(x0 ,y0 )

Para isto queremos mostrar que para qualquer e > 0 existe algum d > 0 tal que

|x x0 | < e sempre que 0 < k(x, y) (x0 , y0 )k < d . (17.90)


512 Funções reais de várias variáveis

A desigualdade |x x0 | < e equivale a


x0 e < x < x0 + e, o que no R2 signi-
fica que o ponto (x, y) está numa faixa
y
infinita aberta vertical como indicado na
figura ao lado.
A espessura desta faixa é 2e. Se esco-
lhermos algum d positivo e menor que
e, a bola aberta de raio d centrada em
x - x x +
(x0 , y0 ) está contida na faixa de espessura
2e onde vale a desigualdade |x x0 | < e,
isto é,

0 < k(x, y) (x0 , y0 )k < d =) |x x0 | < e , (17.91)


provando assim que
lim x = x0 (17.92)
(x,y)!(x0 ,y0 )

para qualquer (x0 , y0 ) 2 R2 .


Exemplo 17.49 ( f (x, y) = y).
Este exemplo é semelhante ao anterior. A desigualdade |y y0 | < e equivale a
y0 e < y < y0 +e, que no R2 representa uma faixa horizontal infinita de espessura
2e. Para qualquer e > 0 esta faixa contém uma bola aberta de raio d < e centrada
em (x0 , y0 ). Portanto
0 < k(x, y) (x0 , y0 )k < d =) |y y0 | < e , (17.93)
provando assim que
lim y = y0 (17.94)
(x,y)!(x0 ,y0 )

para qualquer (x0 , y0 ) 2 R2 .


Exemplo 17.50 (Transformação linear).
Seja f (x, y) = a · x + b · y com a e b reais constantes. Pelas propriedades de
limites,
✓ ◆ ✓ ◆ ✓ ◆ ✓ ◆
lim [a · x + b · y] = lim a · lim x + lim b · lim y .
(x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 )
(17.95)

Já calculamos os valores de cada um destes limites. Portanto


lim [a · x + b · y] = a · x0 + b · y0 . (17.96)
(x,y)!(x0 ,y0 )
17.2 Limite e Continuidade 513

Exemplo 17.51 (Forma quadrática).


Se f (x, y) = ax2 + bxy + cy2 , com a, b e c constantes, pelas propriedades de
limite já vistas quemos que
✓ ◆ ✓ ◆ ✓ ◆
⇥ 2 ⇤
lim ax + bxy + cy2 = lim a · lim x · lim x
(x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 )
✓ ◆ ✓ ◆ ✓ ◆
+ lim b · lim x · lim y
(x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 )
✓ ◆ ✓ ◆ ✓ ◆
+ lim c · lim y · lim y
(x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 ) (x,y)!(x0 ,y0 )

= ax02 + bx0 y0 + cy20 . (17.97)

Desta forma é possível calcular o limite de qualquer função racional de várias


variáveis, desde que o limite do denominador seja diferente de zero. Para funções
mais complicadas, que envolvem raiz, exponenciais, funções trigonométricas e
logaritmos, é mais simples definir primeiro o conceito de continuidade de funções
de várias variáveis.
514 Funções reais de várias variáveis

17.2.1 Continuidade de campos escalares


Definido o conceito de limite é simples definir a continuidade de uma função
de várias variáveis.

Definição 17.12. Uma função f : Rn ! R é contínua em~r0 se f é definida em~r0


e se

lim f (~r) = f (~r0 ) . (17.98)


~r!~r0

Uma função é contínua em um conjunto S se ela for contínua em todos os elemen-


tos de S. Se uma função for contínua em todo o seu domínio, dizemos apenas que
a função é contínua, omitindo o domínio.

Se o conjunto S for um conjunto aberto, então cada ponto do conjunto tem


uma vizinhança inteiramente contida em S. Se o conjunto for fechado, as vizi-
nhanças dos pontos de fronteira não estão inteiramente contidas em S e podem
conter pontos em que f não está definida. Dizemos que a função é contínua num
ponto de fronteira se

| f (~r ) f (~r 0 )| < e sempre que ~r 2 B(~r0 , d) \ S , (17.99)

isto é, o argumento~r deve estar na vizinhança do ponto de fronteira~r 0 contida em


S. Esta definição é análoga ao caso unidimensional onde dizemos que f é contínua
no intervalo fechado [a, b] se for contínua no intervalo aberto (a, b), contínua à
direita em x = a e contínua à esquerda em x = b, pois nestes pontos de fronteira
do intervalo exigimos apenas o limite lateral contido no intervalo.

Exemplo 17.52 (Função constante).


Vimos que se f (x, y) = c, então para qualquer (x0 , y0 ) 2 R2

lim f (x, y) = c = f (x0 , y0 ) , (17.100)


(x,y)!(x0 ,y0 )

portanto funções constantes são contínuas.

Exemplo 17.53 (Transformação linear).


Se f (x, y) = a · x + b · y, então em qualquer (x0 , y0 ) 2 R2

lim f (x, y) = a · x0 + b · y0 = f (x0 , y0 ) , (17.101)


(x,y)!(x0 ,y0 )

mostrando assim que transformações lineares também são funções contínuas.


17.2 Limite e Continuidade 515

Exemplo 17.54 (Forma quadrática).


Se f (x, y) = ax2 + bxy + cy2 , então em qualquer (x0 , y0 ) 2 R2

lim f (x, y) = ax02 + bx0 y0 + cy20 = f (x0 , y0 ) , (17.102)


(x,y)!(x0 ,y0 )

ou seja, formas quadráticas também são funções contínuas.


Exemplo 17.55.
Seja
(
3x2 y
se (x, y) 6= (0, 0)
f (x, y) = x2 +y2 (17.103)
0 se (x, y) 6= (0, 0)

Esta função é contínua na origem, pois como visto na equação (17.63)

lim f (x, y) = 0 = f (0, 0) . (17.104)


(x,y)!(0,0)

Exemplo 17.56 (Polinômios).


A forma geral de um polinômio de duas variáveis é
n m
p(x, y) = Â Â ci j xiy j . (17.105)
i=0 j=0

Aplicando a operação de limite temos que


n m
lim
(x,y)!(x0 ,y0 )
p(x, y) = lim   ci j xiy j
(x,y)!(x0 ,y0 ) i=0 j=0
n m
= Â Â (x,y)!(x
lim
0 ,y0 )
ci j xi y j
i=0 j=0
n m ✓ ◆✓ ◆i ✓ ◆j
= ÂÂ lim
(x,y)!(x0 ,y0 )
ci j lim
(x,y)!(x0 ,y0 )
x lim
(x,y)!(x0 ,y0 )
y
i=0 j=0
n m
  ci j x0i y0 = p(x0, y0) ,
j
=
i=0 j=0

portanto qualquer polinômio é uma função contínua.


Exemplo 17.57 (Funções racionais).
Uma função da forma
p(x, y)
R(x, y) = , (17.106)
q(x, y)
516 Funções reais de várias variáveis

onde p e q são polinômios, é uma função racional. Pelas propriedades de limites,


a razão entre funções contínuas é também uma função contínua desde que o de-
nominador não se anule. Então funções racionais são contínuas nos conjuntos em
que q(x, y) 6= 0.
Exemplo 17.58 (Funções separáveis).
Funções de várias variáveis são ditas separáveis se forem o produto de diversas
funções de uma única variável. Em duas variáveis, funções separáveis são da
forma
f (x, y) = A(x) · B(y) , (17.107)
onde A e B são funções reais de uma única variável. Entre estas funções pode-
mos citar como exemplo f (x, y) = ex · cos(y), f (x, y) = y · log(1 + x2 ) e f (x, y) =
tan(x) · log(y). Se as funções A e B forem contínuas em algum intervalo, a função
f será contínua no retângulo correspondente, o que é garantido pelo teorema a
seguir.
Teorema 17.3.
Se uma função f : Rn ! R depende de uma variável apenas, isto é, se f (~r ) =
g(xk ) com ~r = (x1 , . . . , xn ), e se g é uma função contínua em xk = a, então f é
contínua em qualquer~r em que a k-ésima coordenada de~r 0 é igual a a.
Demonstração.
A demonstração será feita para o caso de funções de duas variáveis. A gene-
ralização para n variáveis é idêntica. Seja f (x, y) = g(x), isto é, a função f não
depende de y (ou é constante em relação a y). Como x!alim g(x) = g(a) = f (a, y) para
qualquer y, sabemos que para todo e > 0 existe algum d1 > 0 tal que |g(x) L| < e
sempre que |x a| < d1 . Esta última desigualdade implica a d1 < x < a + d1 .
No R2 esta desigualdade implica que ~r
deve estar numa faixa infinita aberta ver-
tical em torno da reta vertical x = a,
y0
como ilustrado na figura ao lado.
Escolhendo d tal que 0 < d < d1 , pode-
mos traçar uma bola aberta de raio d em
torno de qualquer ponto da reta vertical
x = a inteiramente contida na faixa. En-
a- a a+
tão para qualquer b real temos que

k(x, y) (a, b)k < d =) |x a| < d1 =) |g(x) g(a)| < e =) | f (x, y) f (a, b)| < e ,
(17.108)
provando assim a continuidade de f .
17.2 Limite e Continuidade 517

Exemplo 17.59 (Funções compostas).


Agora queremos estabelecer a continuidade de funções do tipo como f (x, y) =
sen(x · y), f (x, y) = ex · y ou f (x, y) = log(1 + x2 + y2 ) que não são funções separá-
veis, mas podem ser escritas como composições de uma função real de uma única
variável com uma função de duas variáveis que já sabemos que é contínua. A
continuidade de tais funções será verificada pelo teorema a seguir.
Teorema 17.4.
Seja f : Rn ! R e g : R ! R. Se f (~r ) é contínua em~r 0 e g(u) é contínua em
u0 = f (~r 0 ), então a composição g( f (~r )) é contínua em~r 0 .
Demonstração.
Sabemos pela definição de continuidade de g que para todo e > 0 existe um
d1 > 0

|g(u) g(u0 )| < e sempre que |u u 0 | < d1 . (17.109)

Seja u = f (~r ). Escrevemos a equação anterior como

|g( f (~r )) g( f (~r 0 )| < e sempre que | f (~r ) f (~r 0 )| < d1 . (17.110)

Pela continuidade de f sabemos que para este d1 existe algum d > 0 tal que

| f (~r ) f (~r 0 )| < d1 sempre que k~r ~r 0 k < d . (17.111)

Então

k~r ~r 0 k < d =) |g( f (~r )) g( f (~r 0 )| < e , (17.112)

provando a continuidade da composição.

Exemplo 17.60 (Função gaussiana).


2 2
Seja f (x, y) = e a(x +y ) , que é uma distribuição gaussiana bidimensional.
Como eu é uma função contínua em todo u real,
a(x2 +y2 ) a(x2 +y2 ) a(x02 +y20 )
lim e = elim(x,y)!(x0 ,y0 ) =e = f (x0 , y0 ) . (17.113)
(x,y)!(x0 ,y0 )

A distribuição gaussiana também é uma função contínua.


Exemplo 17.61.
Seja agora a função f (~r ) = k~r k, que no Rn assume a forma
s
n
f (~r ) = Â xk2 . (17.114)
k=1
518 Funções reais de várias variáveis

Aplicando o limite temos que


s s s
n n n
lim f (~r ) = lim
~r !~r 0 ~r !~r 0
 xk2 = lim
~r !~r 0
 xk2 =  ~rlim
!~r 0
xk2 = k~r 0 k = f (~r 0 ) .
k=1 k=1 k=1
(17.115)

A norma de um vetor é uma função contínua em todo o Rn .

Exemplo 17.62 (Potencial gravitacional).


O potencial gravitacional devido a uma partícula de massa M localizada na
origem é dado por

GM
V (~r ) = , (17.116)
k~r k

onde G e M são constantes. Tanto o numerador quanto o denominador são funções


contínuas, então o potencial gravitacional é uma função contínua em todos os
pontos em que o denominador não se anula, isto é, é uma função contínua exceto
na origem.

Exemplo 17.63 (Descontinuidade de salto).


Seja
(
1 se x  0 ou y  0
f (x, y) = (17.117)
0 se x > 0 e y > 0
17.2 Limite e Continuidade 519

No primeiro quadrante esta função é constante e vale 0. Nos demais qua-


drantes e nos eixos x e y a função é constante e vale 1. Qualquer bola aberta em
torno da origem contém pontos de cada um dos quadrantes. É possível chegar
arbitrariamente próximo da origem por um caminho em que f (~r (t)) vale 1 e por
um caminho em que f (~r (t)) vale 0. Portanto a função não é contínua na origem,
assim como na fronteira entre o primeito quadrante e o segundo quadrante e na
fronteira entre o primeiro quadrante e o quarto quadrante.

Esta descontinuidade é análoga ao caso da função de uma variável f (x) = |x|


x ,
onde há um “salto” da função em x = 0. Tais saltos não podem acontecer numa
função contínua como consequência do Teorema do Valor Intermediário.

Teorema 17.5 (Teorema do valor intermediário).


Seja f : Rn ! R uma função contínua em um conjunto aberto convexo S.
Sejam ~r 1 e ~r 2 elementos de S tais que f (~r 1 ) 6= f (~r 2 ). Seja K um número real
entre f (~r 1 ) e f (~r 2 ). Existe algum~r 3 2 S tal que f (~r 3 ) = K.

Demonstração.
Se ~r (t) é um campo vetorial contínuo em [a, b] e o campo vetorial f (~r ) é
contínuo em uma região que contém a curva parametrizada pelo campo vetorial,
então a composição f (~r (t)) é uma função real de uma única variável contínua em
[a, b].
Seja ~r (t) = (1 t) ·~r1 + t ·~r 2 a parametrização do segmento de reta que une
~r1 a ~r 2 . Como S é um conjunto convexo, todos os pontos deste segmento estão
contidos em S, portanto a composição F(t) = f (~r (t)) é contínua no intervalo [0, 1]
e para esta composição vale o Teorema do Valor Intermediário para funções reais
de uma variável.
Como F(0) = f (~r 1 ) e F(1) = f (~r 2 ), existe algum t¯ 2 [0, 1] para o qual F(t¯) =
f (~r (t¯)) = K para qualquer K entre f (~r 1 ) e f (~r 2 ). Logo~r 3 =~r (t¯) e o teorema está
demonstrado.

Exemplo 17.64 (Assíntotas verticais).


Voltando ao exemplo do potencial gravitacional dado por

GM
V (~r ) = , (17.118)
k~r k

esta função claramente não está definida na origem, mas podemos tentar calcular
o limite desta função quando~r tende à origem.
Se o limite existir, então o limite ao longo de qualquer caminho que passa
pela origem existe e possui o mesmo valor. O cálculo do limite por caminho não
520 Funções reais de várias variáveis

prova que o limite da função existe, mas se o limite por caminho não existir, então
sabemos que o limite da função não existe.
Escolhendo como caminho no R3 uma reta ao longo do eixo z parametrizada
por ~r (t) = (0, 0,t), que passa pela origem quando t = 0, a composição f (~r (t)) é
dada por
GM GM
f (~r (t)) = = (17.119)
k~r (t)k |t|
e
GM
lim f (~r (t)) = limt ! 0 = •. (17.120)
t!0 |t|
O limite da composição não existe, então o limite da função também não existe.
Não é possível definir V (~0 ) de modo que a função seja contínua na origem. No
entanto o limite da composição não existe porque a composição assume valores
negativos arbitrariamente grandes à medida em que o parâmetro t se aproxima de
0. A curva y = f (~r (t)) possui uma assíntota vertical. Podemos definir limites
envolvendo o infinito para funções de várias variáveis da mesma maneira que
fizemos para funções reais de uma única variável.
Definição 17.13.
Dizemos que ~rlim
!~r 0
f (~r 0 ) = +• se para todo número real M > 0 arbitraria-
mente grande existir uma bola aberta de tamanho d em torno de~r 0 tal que
f (~r ) > M sempre que 0 < k~r ~r 0 k < d . (17.121)
Analogamente dizemos que ~rlim
!~r 0
f (~r 0 ) = • se para todo número real M > 0
arbitrariamente grande existir uma bola aberta de tamanho d em torno de~r 0 tal
que
f (~r ) < M sempre que 0 < k~r ~r 0 k < d . (17.122)
GM
No exemplo do potencial gravitacional V (~r ) = k~r k , seja K um número po-
sitivo arbitrariamente grande.
GM GM GM
V (~r ) < K =) < K =) > K =) k~r k < . (17.123)
k~r k k~r k K
GM
Então escolhendo d < K temos que

0 < ~r ~0 < d =) k~r k < GM =) V (~r ) < K , (17.124)


K
portanto
lim V (~r ) = • . (17.125)
~r !~0
17.2 Limite e Continuidade 521

Exemplo 17.65 (Mudança de variáveis).


Seja

sen(x2 + y2 )
f (x, y) = . (17.126)
x2 + y2
Esta função não está definida na origem e queremos calcular, se possível, o limite
desta função neste ponto. Infelizmente o denominador tende a zero e os teoremas
vistos não são válidos neste caso.
O numerador também tende a zero, e no caso de funções de uma variável po-
deríamos utilizar a Regra de l’Hôpital. No entanto ainda não definimos a operação
de derivação de funções de várias variáveis. Mas podemos simplificar o problema
e transformar este problema em um limite de uma função de uma única variável
se encontrarmos uma transformação de coordenadas nas quais a função resultante
dependa apenas de uma das coordenadas.
Neste exemplo podemos utilizar as coordenadas polares,
x = r · cos(q) , (17.127)
y = r · sen(q) , (17.128)
e nestas coordenadas a origem é dada por r = 0. A função é transformada como

sen(r2 cos2 (q) + r2 sen2 (q)) sen(r2 )


f (r, q) = = . (17.129)
r2 cos2 (q) + r2 sen2 (q) r2
Esta função depende apenas da variável r. Assim

sen(r2 ) sen(u)
lim 2
= lim =1 (17.130)
r!0 r u!0 + u
pelo limite fundamental. Portanto

sen(x2 + y2 )
lim =1. (17.131)
(x,y)!(0,0) x2 + y2
Exemplo 17.66.
Seja agora

f (x, y) = (x2 + y2 ) · log(x2 + y2 ) . (17.132)

Esta função é contínua em todos os pontos exceto na origem, onde ela não está
definida. Queremos calcular este limite, se possível. Como as variáveis x e y
ocorrem sempre na forma x2 + y2 , é natural utilizar coordenadas polares e

f (r, q) = r2 · log(r2 ) . (17.133)


522 Funções reais de várias variáveis

Assim

lim r2 · log(r2 ) = lim u · log(u) , (17.134)


r!0 u!0+

que é uma indeterminação do tipo 0 · •. Podemos utilizar a Regra de l’Hôpital


escrevendo

log(u)
lim u · log(u) = lim , (17.135)
u!0+ u!0+ 1/u

que é uma indeterminação do tipo •/• e

1/u
lim u · log(u) = lim = lim u=0. (17.136)
u!0+ u!0+ 1/u2 u!0+

Portanto

lim (x2 + y2 ) · log(x2 + y2 ) = 0 (17.137)


(x,y)!(0,0)

e se definirmos
(
(x2 + y2 ) · log(x2 + y2 ) se (x, y) 6= (0, 0)
f (x, y) = (17.138)
0 se (x, y) = (0, 0)

temos uma função contínua em todo o R2 .

Teorema 17.6 (Teorema de Weierstrass). Se f : R2 ! R é uma função contínua


no retângulo fechado Q = [a, b] ⇥ [c, d], então f possui um máximo global e um
mínimo global em Q.

Demonstração. Primeiro provamos que f é limitada em Q, isto é, existe um nú-


mero real positivo C tal que | f (x, y)| < C para todo (x, y) 2 Q. Esta prova é feita
por contradição. Suponha que f não é limitada em Q, ou seja, para qualquer C > 0
existe algum (x0 , y0 ) 2 Q tal que | f (x, y)| > C.
Seja A = (b a)(d c) a área do retân-
y

gulo Q. Como exibido na figura ao lado


dividimos o retângulo Q em quatro sub-
retângulos de tamanhos iguais. Como a
c‾

função f não é limitada em Q, ela não é


c
limitada em pelo menos um destes qua-
x

tro sub-retângulos.
a a‾ b
17.2 Limite e Continuidade 523

Seja Q1 o sub-retângulo de Q no qual


y

f não é limitada. Se a função não


for limitada em mais de um destes sub-
retângulos, escolhemos o que possuir
d

canto inferior esquerdo mais próximo


c =c

x
do ponto (a, c). Escrevendo este sub-
retângulo como Q1 = [a1 , b1 ] ⇥ [c1 , d1 ]
a a b =b

definimos um retângulo de área A1 = A4 ,


como visto na figura ao lado, no qual a
função f não é limitada.
Repetindo este procedimento no retân-
y

gulo Q1 , como ilustrado, definimos um


novo retângulo Q2 = [a2 , b2 ] ⇥ [c2 , d2 ] de
área A2 = 4A2 no qual a função f não é
d2

c2

limitada. Este processo pode ser repe-


c

x
tido quantas vezes quisermos. Após n
processos obtemos um retângulo Qn =
a a2 b2 b

[an , bn ] ⇥ [cn , dn ] de área An = 4An no qual


a função f não é limitada.
A sequência {a, a1 , a2 , a3 , . . .} é não nula, crescente pois a  a1  a2  . . . e
limitada superiormente por b, portanto possui um supremo a que é elemento do
intervalo [a, b]. Da mesma forma a sequência {c, c1 , c2 , . . .} possui um supremo g
no intervalo [c, d]. Como (a, g) 2 Q, f é contínua neste ponto, portanto escolhendo
e = 1 existe algum d > 0 tal que | f (x, y) f (a, g)| < 1 se (x, y) pertence à bola
aberta de raio d centrada em (a, g). Esta desigualdade é equivalente a f (a, g) 1 <
f (x, y) < f (a, g) + 1. Pela desigualdade triangular, temos | f (x, y)|  | f (a, g)| + 1,
ou seja, f é uma função limitada na bola aberta de raio d centrada em (a, g) se f
for contínua no retângulo Q.
No entanto para todo d > 0 existe algum
y

n grande o suficiente de modo que o re-


tângulo Qn no qual f não é limitada es-
γ
teja contida na bola aberta de raio d cen-
trada no ponto (a, g). Isso contradiz o
c

x
fato de que f é limitada nesta bola aberta,
portanto a função não pode ser simulta-
a α b

neamente contínua em um retângulo fe-


chado e ilimitada neste retângulo.
Como a imagem de f é limitada, este conjunto possui um supremo M e um
ínfimo m. Queremos agora provar que existe algum elemento (xM , yM ) 2 Q tal
que f (xM , yM ) = M e algum elemento (xm , ym ) 2 Q tal que f (xm , ym ) = M, ou
seja, que f possui um máximo local e um mínimo local em Q. Novamente pro-
524 Funções reais de várias variáveis

vamos esta propriedade por contradição. Suponha que não existe (xM , yM ) em Q
tal que f (xM , yM ) = M. Neste caso a função g(x, y) = M f1(x,y) é contínua em Q,
pois este denominador nunca se anula. Como g é contínua, g é também limitada
em Q, logo existe algum C > 0 tal que g(x, y) < C para todo (x, y) 2 Q. Então
1
M f (x,y) < C =) M f (x, y) < C1 =) f (x, y) < M C1 para todo (x, y) 2 Q.
Consequentemente o número real M C1 é um limite superior da imagem de f
menor que o supremo M, o que contradiz a definição de supremo. Portanto deve
existir (xM , yM ) 2 Q tal que f (xM , yM ) = M, provando a existência do máximo
global. O mesmo argumento prova a existência do mínimo global.

O teorema de Weierstrass pode ser demonstrado para funções de n variáveis


com o mesmo raciocínio. Combinando o teorema de Weierstrass com o teorema
do valor intermediário podemos provar que a imagem de uma função contínua em
um retângulo fechado é um intervalo fechado.
17.3 Diferenciabilidade 525

17.3 Diferenciabilidade
17.3.1 Derivada direcional e parcial
Se f é uma função de uma variável, podemos dizer que f é diferenciável em
x0 se a derivada f 0 existe neste ponto, ou seja, se o limite

f (x0 + h) f (x0 )
f 0 (x0 ) = lim (17.139)
h!0 h
existe. Esta definição é motivada pelo conceito da inclinação do gráfico da curva
representada por y = f (x) no ponto x0 .
Imagine que um pico de uma montanha é bem descrito pelo paraboloide de
revolução

f (x, y) = a2 x2 y2 , (17.140)

cujo gráfico é simétrico por rotação em torno do eixo z. É simples observar que
qualquer direção pela qual chegamos ao topo possui a mesma inclinação.
Já no caso de um elipsoide representado por
r
x2 y2
f (x, y) = c 1 , (17.141)
a2 b2
cujo gráfico não possui a mesma simetria observamos que a dificuldade em escalar
depende da direção percorrida. Neste caso a inclinação é menor ao longo do semi-
eixo maior, o que é corroborado pelas curvas de nível.
Num caso mais geral de uma superfície irregular, o caminho para o topo com
a menor inclinação nem sempre é uma reta. Queremos agora definir o conceito de
derivadas de funções de várias variáveis e descrever a inclinação da superfície em
um certo ponto.
A equação z = f (x, y) representa uma superfície e queremos que o conceito de
derivada expresse a inclinação desta superfície (ou de maneira mais geral, como
uma variação no vetor (x, y) afeta a variação em z). Se imaginarmos que a super-
fície representada por z = f (x, y) descreve a altura de uma montanha que estamos
escalando, no topo da montanha temos uma inclinação nula e num ponto qual-
quer entre a base da montanha sabemos que existem direções nas quais o valor
de z aumenta (se estivermos subindo a montanha), direções nas quais o valor de
z diminui (descendo a montanha) e direções nas quais o valor de z não muda (se-
guindo a curva de nível).
Seja C um caminho parametrizado por um campo vetorial ~r (t) contido no
domínio da função f . A projeção deste caminho na superfície representada por
z = f (x, y) define um caminho cuja última componente tem altura z(t) = f (~r (t)).
526 Funções reais de várias variáveis

Como z(t) é uma função real de uma única variável, sabemos derivar esta função
num valor t0 2 [a, b] e calcular assim o que definimos como derivada da função f
em relação ao caminho C no ponto~r 0 =~r (t0 ).
Exemplo 17.67 (Paraboloide de revolução).
Seja a superfície representada explicitamente por

z = a2 x2 y2 (17.142)

e a reta que cruza a origem com um ângulo q, parametrizada por

~r (t) = (t · cos(q),t · sen(q)) , (17.143)

que passa pela origem em t = 0. A altura ao longo da superfície é calculada como

z(t) = z(~r (t)) = a2 t 2 cos2 (q) t 2 sen2 (q) = a2 t2 , (17.144)

que num ponto t0 qualquer tem derivada

z0 (t0 ) = 2t0 . (17.145)

A inclinação não depende do ângulo pelo qual interceptamos a origem.


Exemplo 17.68 (Paraboloide elíptico).
Considere agora a superfície representada por

x2
z=1 y2 , (17.146)
4
cujas curvas de nível são elipses. Considere os caminhos C1 e C2 como as retas
y = 0 e x = 0, respectivamente, parametrizadas por

~r 1 (t) = (t, 0) e ~r 2 (t) = (0,t) . (17.147)

As alturas ao longo da superfície são

t2
z1 (t) = 1 e z2 (t) = 1 t2 , (17.148)
4
com inclinações
t
z01 (t) = e z02 (t) = 2t . (17.149)
2
A uma mesma distância t da origem a inclinação ao longo de C2 é maior que ao
longo de C1 .
17.3 Diferenciabilidade 527

Exemplo 17.69.
Voltamos agora ao exemplo da superfície representada por
( 2
xy
se (x, y) 6= (0, 0)
z = x2 +y4 (17.150)
0 se (x, y) = (0, 0)

Seja novamente a reta parametrizada por~r (t) = (t · cos(q),t · sen(q)), que in-
tercepta a origem com um ângulo q em relação ao eixo x positivo. A altura ao
longo da superfície neste caminho é
(t cos(q))(t sen(q))2 cos(q) sen2 (q)t
z(t) = z(x(t), y(t)) = =
(t cos(q))2 + (t sen(q))4 cos2 (q) + t 2 sen4 (q)
t
= sen(q) tan(q) (17.151)
1 + t sen (q) tan2 (q)
2 2

ou apenas
at
z(t) = com a = sen(q) tan(q) (17.152)
1 + a2t 2
se t 6= 0 e z(0) = 0. Neste caso

lim z(t) = 0 , (17.153)


t!0

então em cada uma destas retas a curva ao longo da superfície cruza a origem. A
inclinação é dada por

a(1 + a2t 2 ) at · 2at a + a3t 2 2a3t 2 1 a2 y2


z0 (t) = = = a (17.154)
(1 + a2t 2 )2 (1 + a2t 2 )2 (1 + a2t 2 )2
se t 6= 0. Ao atingir a origem, a inclinação será

lim z0 (t) = a = sen(q) tan(q) . (17.155)


t!0

A inclinação depende do ângulo q. Ao longo da reta y = 0 a curva terá inclinação


horizontal, mas ao longo da reta x = 0 a inclinação será infinita.
Agora ao longo da parábola x = y2 , que parametrizamos por ~r (t) = (t 2 ,t),
temos
(t 2 )(t)2 t4 1
z(t) = 2 2 4
= 4
= (17.156)
(t ) + (t) 2t 2
se t 6= 0. Ao longo desta curva a altura é constante, e a curva atinge o ponto
0, 0, 12 com inclinação nula.
528 Funções reais de várias variáveis

Agora podemos definir as derivadas ao longo de direções de maneira geral.


Seja f : Rn ! R uma função definida em um domínio aberto D e seja ~r 0 2 D.
Seja ~v 2 Rn um vetor que aponta na direção desejada. A reta nesta direção que
passa pelo ponto~r0 pode ser parametrizada pela função vetorial~r(h) =~r0 + h~v.
A composição f (~r(h)) é uma função de uma única variável que descreve a
altura da superfície ao longo desta reta. Por ser uma função de uma única variável,
a sua derivada está muito bem definida pela equação (17.139). Esta derivada é
chamada de derivada direcional, dada por

d f (~r0 + h~v) f (~r0 )


( f (~r(h))) = lim . (17.157)
dh h!0 h
Exemplo 17.70 (Função constante).
Começando pelo caso mais simples, seja f (~r ) = K para todo ~r 2 Rn . Para
qualquer~r 0 e qualquer vetor não nulo ~v . Neste caso

f (~r0 + h~v) f (~r0 ) K K


lim = lim =0. (17.158)
h!0 h h!0 h
A derivada direcional de uma função constante em qualquer ponto em relação a
qualquer direção é nula.

Exemplo 17.71 (Transformação linear).


Seja agora

f (x, y) = a · x + b · y (17.159)

com a e b constantes. Se~r 0 = (x0 , y0 ) e~v = (vx , vy ), a composição f (~r (h)) é dada
por

f (~r (h)) = a · (x0 + vx · h) + b · (y0 + vy · h) (17.160)

e a derivada direcional vale

a · (x0 + vx · h) + b · (y0 + vy · h) a · x0 + b · y0 avx h + bvy h


lim = lim = avx +bvy .
h!0 h h!0 h
(17.161)

Se por exemplo f (x, y) = 3x + 2y, a derivada direcional num ponto qualquer


(x0 , y0 ) na direção definida por ~v = (1, 1) vale 5. Já na direção definida por ~v =
(2, 2) a derivada direcional vale 10.

Aqui encontramos um problema. Os vetores (1, 1) e (2, 2) definem a mesma


direção, no entanto possuem derivadas direcionais diferentes. A diferença entre
17.3 Diferenciabilidade 529

os caminhos é o quão rápido a reta é percorrida, e queremos que a derivada de


uma função de várias variáveis seja uma propriedade da superfície apenas, e não
de quão rápido percorremos um caminho nesta superfície.
Uma maneira de contornar este problema é exigir que o vetor ~v que define
a direção seja unitário.⇣ No exemplo
⌘ anterior ao invés de utilizar (1, 1) ou (2, 2)
1 1
devemos utilizar ~v = p2 , p2 como vetor que define a direção. Neste caso a
derivada direcional vale p52 . A imposição de k~v k = 1 ainda não resolve o pro-
blema da inclinação depender do ângulo pelo qual atingimos o ponto ~r 0 , mas já
não depende da parametrização da reta.

Definição 17.14 (Derivada direcional).


Seja ~v 2 Rn um vetor unitário e f : Rn ! R uma função definida no domínio
aberto D f . Seja ~r 0 2 D f . Definimos a derivada direcional de f no ponto ~r 0 na
direção ~v como

f (~r 0 + h ·~v ) f (~r 0 )


lim (17.162)
h!0 h
se este limite existir.

Entre as infinitas direções possíveis as mais simples são as direções dadas


pelos elementos da base canônica do Rn .

Definição 17.15 (Derivada parcial).


Seja ~e k um vetor cuja k-ésima coordenada vale 1 e com as demais coordena-
das nulas. A derivada direcional de uma função f na direção ~e k é chamada de
derivada parcial de f em relação a xk e denotada por

∂f f (x1 , . . . , xk 1 , xk + h, xk+1 , . . . , xn ) f (x1 , . . . , xk 1 , xk , xk+1 , . . . , xn )


= lim .
∂xk h!0 h
(17.163)

O símbolo “∂” é a grafia em itálico da quarta letra do alfabeto cirílico, que é


um “d” estilizado e normalmente pronunciado como “del”. No caso de funções de
duas variáveis temos duas derivadas parciais. A primeira, em relação à variável x

∂f f (x0 + h, y0 ) f (x0 , y0 )
(x0 , y0 ) = lim (17.164)
∂x h!0 h
e a segunda em relação a y

∂f f (x0 , y0 + h) f (x0 , y0 )
(x0 , y0 ) = . (17.165)
∂y h
530 Funções reais de várias variáveis

No R3 temos três derivadas parciais dadas por

∂f f (x0 + h, y0 , z0 ) f (x0 , y0 , z0 )
(x0 , y0 , z0 ) = lim , (17.166)
∂x h!0 h
∂f f (x0 , y0 + h, z0 ) f (x0 , y0 , z0 )
(x0 , y0 , z0 ) = lim , (17.167)
∂y h!0 h
∂f f (x0 , y0 , z0 + h) f (x0 , y0 , z0 )
(x0 , y0 , z0 ) = lim . (17.168)
∂z h!0 h
Exemplo 17.72 (Transformação linear).
Se f (x, y) = a · x + b · y, as derivadas parciais são

∂f a(x0 + h) + by0 ax0 by0 ah


(x0 , y0 ) = lim = lim =a (17.169)
∂x h!0 h h!0 h

e
∂f ax0 + b(y0 + h) ax0 by0 bh
(x0 , y0 ) = lim = lim =b. (17.170)
∂y h!0 h h!0 h

Mesmo para transformações lineares do Rn em R, todas as derivadas parciais são


funções constantes.

Exemplo 17.73 (Forma quadrática).


Se f (x, y) = ax2 + bxy + cy2 , as derivadas parciais são

∂f a(x0 + h)2 + b(x0 + h)y0 + cy20 ax02 bx0 y0 cy20


(x0 , y0 ) = lim
∂x h!0 h
ax02 + 2ax0 h + ah2 + bx0 y0 + bhy0 + cy20 ax02 bx0 y0 cy20
= lim
h!0 h
2
ah + 2ax0 h + by0 h
= lim = 2ax0 + by0 (17.171)
h!0 h
e
∂f ax2 + bx0 (y0 + h) + c(y0 + h)2 ax02 bx0 y0 cy20
(x0 , y0 ) = lim 0
∂y h!0 h
ax + +bx0 y0 + bx0 h + cy0 + 2cy0 h + ch2
2 2 ax02 bx0 y0 cy20
= lim 0
h!0 h
2
ch + 2cy0 h + bx0 h
= lim = 2cy0 + bx0 (17.172)
h!0 h
Exemplo 17.74.
17.3 Diferenciabilidade 531

Se f (x, y) = exy , as derivadas parciais são

∂f e(x0 +h)y0 ex0 y0 ex0 y0 +hy0 ex0 y0


(x0 , y0 ) = lim = lim
∂x h!0 h h!0 h
ehy0 1
= ex0 y0 lim = ex0 y0 · y0 (17.173)
h!0 h
e

∂f ex0 (y0 +h) ex0 y0 ex0 y0 +x0 h ex0 y0


(x0 , y0 ) = lim = lim
∂y h!0 h h!0 h
ehx0 1
= ex0 y0 lim = ex0 y0 · x0 . (17.174)
h!0 h

Exemplo 17.75.
Se f (x, y, z) = cos(x + y + z),

∂f cos(x0 + h + y0 + z0 ) cos(x0 + y0 + z0 )
(x0 , y0 , z0 ) = lim
∂x h!0 h
cos(x0 + y0 + z0 ) cos(h) sen(x0 + y0 + z0 ) sen(h) cos(x0 + y0 + z0 )
= lim
h!0 h
cos(h) 1 sen(h)
= cos(x0 + y0 + z0 ) lim sen(x0 , y0 , z0 ) lim
h!0 h h!0 h
= sen(x0 + y0 + z0 ) . (17.175)

Repetindo a mesma conta para as outras variáveis encontramos

∂f
(x0 , y0 , z0 ) = sen(x0 + y0 + z0 ) (17.176)
∂y

∂f
(x0 , y0 , z0 ) = sen(x0 + y0 + z0 ) . (17.177)
∂z

Já é possível perceber um padrão nas contas. O cálculo de uma derivada par-


cial de uma função de duas variáveis é idêntico ao cálculo da derivada unidimen-
sional como se a função dependesse apenas da variável x como se a variável y
fosse constante. De fato quanto calculamos esta derivada parcial, temos uma pa-
rametrização~r (t) = (x0 , y0 ) + h(1, 0) = (x0 + h, y0 ) que de fato mantém a variável
y constante ao longo do caminho percorrido.
532 Funções reais de várias variáveis

17.3.2 Operador de derivada parcial


No cálculo de uma função de uma única variável f (x) definimos a função
derivada como uma função que a cada x = x0 calcula a derivada f 0 (x0 ), que deno-
tamos por f 0 (x) ou ddxf e que podemos denotar como a aplicação do operador de
d
derivação dx na função f .
No caso de funções de várias variáveis, podemos denotar também uma função
derivada parcial em relação a x como uma função que a cada~r 0 retorna o valor da
derivada parcial em relação a x neste ponto ∂∂xf (~r 0 ). Também podemos definir o

operador de derivada parcial pelo símbolo ∂x , que é um objeto que age na função
∂f
f (~r ) e retorna a função ∂x (~r ). Na prática, esta função é calculada da mesma
maneira que calculamos a derivada parcial, apenas omitindo os índices subscritos.
Exemplo 17.76.
Se f (x, y) = e (x2 +y2 ) · cos(x y), a função derivada parciais em relação a x é
dada por
∂f (x2 +y2 ) (x2 +y2 )
(x, y) = 2xe · cos(x y) + e · ( sen(x y)) (17.178)
∂x
ou
∂f (x2 +y2 )
(x, y) = e (2x cos(x y) + sen(x y)) (17.179)
∂x
A derivada parcial em relação a y vale
∂f (x2 +y2 ) (x2 +y2 )
(x, y) = 2ye · cos(x y) + e · ( sen(x y)( 1)) (17.180)
∂y
ou
∂f (x2 +y2 )
(x, y) = e (2y cos(x y) sen(x y)) . (17.181)
∂x

17.3.3 Derivadas parciais de ordem superior



Como podemos tratar o símbolo ∂x como um operador (ou transformação)
que age numa função de várias variáveis e o resultado é outra função de várias
variáveis.
∂ ∂f ∂ ∂f
f (x, y) = (x, y) e f (x, y) = (x, y) . (17.182)
∂x ∂x ∂y ∂y
Como o resultado destas operações é uma função de várias variáveis, podemos
aplicar novamente algum operador de derivada parcial e obter assim derivadas
17.3 Diferenciabilidade 533

parciais de ordem superior. As derivadas parciais de segunda ordem de uma


função de duas variáveis são
✓ ◆✓ ◆
∂2 f ∂ ∂f ∂ ∂
= = f, (17.183)
∂x 2 ∂x ∂x ∂x ∂x

✓ ◆✓ ◆
∂2 f ∂ ∂f ∂ ∂
= = f, (17.184)
∂y 2 ∂y ∂y ∂y ∂y

✓ ◆✓ ◆
∂2 f ∂ ∂f ∂ ∂
= = f, (17.185)
∂y∂x ∂y ∂x ∂y ∂x

✓ ◆✓ ◆
∂2 f ∂ ∂f ∂ ∂
= = f. (17.186)
∂x∂y ∂x ∂y ∂x ∂y
∂2 f ∂2 f
As derivadas ∂x∂y e ∂y∂x são chamadas derivadas mistas.

Exemplo 17.77 (Potencial gravitacional).


Em duas dimensões, o potencial gravitacional gerado por uma partícula de
massa M localizada na origem é
GM GM
V (x, y) = = p . (17.187)
k~r k x2 + y2
As derivadas parciais de primeira ordem são
! !
∂V ∂ GM 1 GMx
= p = GM 2x = 3 (17.188)
∂x ∂x x2 + y2
3
2 (x2 + y2 ) 2 (x2 + y2 ) 2
e
! !
∂V ∂ GM 1 GMy
= p = GM 2y = . (17.189)
∂y ∂y x2 + y2 2 (x2 + y2 )
3
2
3
(x2 + y2 ) 2
As derivadas parciais de segunda ordem são
! 3 1
∂2 f ∂ GMx (x2 + y2 ) 2 · 1 (x) · 32 (x2 + y2 ) 2 2x
= = GM
∂x2 ∂x (x2 + y2 ) 32 (x2 + y2 )3
(x2 + y2 ) 3x2 GM(y2 2x2 )
= GM 5 = 5 , (17.190)
(x2 + y2 ) 2 (x2 + y2 ) 2
534 Funções reais de várias variáveis

! ✓ ◆
∂2 f ∂ GMx 3 1
= = GMx 2y
∂y∂x ∂y (x2 + y2 )
3
2 2 5
(x2 + y2 ) 2
3GMxy
= 5 , (17.191)
(x2 + y2 ) 2

! ✓ ◆
∂2 f ∂ GMy 3 1
= = GMy 2x
∂x∂y ∂x (x2 + y2 )
3
2 2 5
(x2 + y2 ) 2
3GMxy
= 5 (17.192)
(x2 + y2 ) 2
e
! 3 1
∂2 f ∂ GMy (x2 + y2 ) 2 · 1 (y) · 32 (x2 + y2 ) 2 2y
= = GM
∂y2 ∂y (x2 + y2 ) 2
3
(x2 + y2 )3
(x2 + y2 ) 3y2 GM(x2 2y2 )
= GM 5 = 5 . (17.193)
(x2 + y2 ) 2 (x2 + y2 ) 2
Exemplo 17.78.
Seja
⇣y⌘
f (x, y) = arctan . (17.194)
x
As derivadas parciais de primeira ordem são

∂f ∂ ⇣y⌘ 1 ⇣ y⌘ y
= arctan = = 2 (17.195)
∂x ∂x x 1 + xy
2 x 2 x + y2

e
⇣y⌘ ✓ ◆
∂f ∂ 1 1 x
= arctan = = 2 . (17.196)
∂y ∂y x 1 + xy
2 x x + y2

As derivadas parciais de segunda ordem são

∂2 f ∂ y 1 2xy
= = y 2 2x = 2 , (17.197)
∂x 2 ∂x x + y
2 2 2
(x + y )2 (x + y2 )2

∂2 f ∂ y (x2 + y2 )( 1) 2y( y) y2 x2
= = = , (17.198)
∂y∂x ∂y x2 + y2 (x2 + y2 )2 (x2 + y2 )2
17.3 Diferenciabilidade 535

∂2 f ∂ x (x2 + y2 )(1) 2x(x) y2 x2


= = = (17.199)
∂x∂y ∂x x2 + y2 (x2 + y2 )2 (x2 + y2 )2
e
∂2 f ∂ x 1 2xy
= =x 2 2y = 2 , (17.200)
∂y 2 ∂y x + y
2 2 2
(x + y )2 (x + y2 )2
Exemplo 17.79.
Seja

( 2 2
xy xx2 +yy2 se (x, y) 6= (0, 0)
f (x, y) = (17.201)
0 se (x, y) = (0, 0)

Esta função é contínua em todo o R2 . A derivada parciail em relação a x vale

∂f y(x4 + 4x2 y2 y4 )
(x, y) = . (17.202)
∂x (x2 + y2 )2
Ao longo da reta x = 0 temos

∂f y5
(0, y) = 4 = y (17.203)
∂x y
e a derivada parcial em relação a y desta última função vale

∂2 f
(0, y) = 1 . (17.204)
∂y∂x
Em particular na origem temos

∂2 f
(0, 0) = 1 . (17.205)
∂y∂x
A derivada em relação a y da função original vale

∂f x(x4 4x2 y2 y4 )
(x, y) = . (17.206)
∂y (x2 + y2 )2
Ao longo da reta y = 0 temos

∂f x5
(x, 0) = 4 = x (17.207)
∂y x
536 Funções reais de várias variáveis

e a derivada parcial em relação a x desta função vale


∂2 f
(x, 0) = 1 . (17.208)
∂x∂y
Calculando na origem temos
∂2 f
(0, 0) = 1 . (17.209)
∂x∂y
Neste exemplo
∂2 f ∂2 f
(0, 0) 6= (0, 0) , (17.210)
∂x∂y ∂y∂x
o que mostra que as derivadas mistas de uma função contínua não são necessaria-
mente iguais.
Exemplo 17.80 (Equações diferenciais parciais).
Seja a função de duas variáveis
r2
u(r,t) = t n e 4t . (17.211)

Queremos determinar o valor de n de modo que a função u seja solução da equação

✓ ◆
∂u 1 ∂ 2 ∂u
= 2 r . (17.212)
∂t r ∂r ∂r
Calculando a derivada parcial em relação a t encontramos
2 ✓ ◆
∂u n 1 r2
n r2 r n r2
= nt e 4t +t e 4t = u(r,t) + . (17.213)
∂t 4t 2 t 4t 2
Agora calculamos o lado direito da equação que a função u deve satisfazer.
∂u r2 2r 1 n 1 r2
= t ne 4t = rt e 4t . (17.214)
∂r 4t 2
Multiplicando por r2 temos
∂u 1 3n 1 r2
r2 = r t e 4t . (17.215)
∂r 2
Derivando esta função em relação a r temos
✓ ◆ ✓ ◆
∂ 2 ∂u ∂ 1 3 n 1 r2 3 2n 1 r2 1 3n 1 r2 2r
r = r t e 4t = r t e 4t r t e 4t
∂r ∂r ∂r 2 2 2 4t
17.3 Diferenciabilidade 537

(17.216)

Dividindo este resultado por r2 temos


✓ ◆ ✓ ◆
1 ∂ 2 ∂u 3 n 1 r2 r 2 n 2 r2 3 r2
r = t e 4t + t e 4t = + u(r,t) (17.217)
r2 ∂r ∂r 2 4 2t 4t 2

A equação
✓ ◆
∂u 1 ∂ 2 ∂u
= 2 r (17.218)
∂t r ∂r ∂r

implica
✓ ◆ ✓ ◆
n r2 3 r2
+ u(r,t) = + u(r,t) . (17.219)
t 4t 2 2t 4t 2

Se u(r,t) 6= 0, esta última equação implica n = 32 .


Uma equação que envolve derivadas parciais de uma mesma função é cha-
mada de equação diferencial parcial. Várias situações de interesse em Física e
Engenharia são modeladas por equações diferenciais parciais, como a equação de
Laplace

∂2 u ∂2 u
+ =0, (17.220)
∂x2 ∂y2
que descreve o potencial gravitacional ou eletrostático no vácuo, a equação de
difusão
∂u ∂2 f
=a 2 , (17.221)
∂t ∂x
que descreve a propagação de calor em uma barra, ou a equação de onda

1 ∂2 f ∂2 f
= , (17.222)
v2 ∂t 2 ∂x2
que como o próprio nome indica descreve a propagação de uma onda unidimensi-
onal.
538 Funções reais de várias variáveis

17.3.4 Diferenciabilidade e plano tangente


Na seção 17.2 vimos que a existência de limites calculados nas direções princi-
pais não implica que o limite existe em qualquer direção. É natural se perguntar se
a existência das derivadas parciais de uma função em um ponto implica a existên-
cia de todas as derivadas direcionais neste ponto. Basta um exemplo para mostrar
que isto nem sempre é verdade.

Exemplo 17.81. Seja



0 se x > 0 e y > 0
f (x, y) = (17.223)
1 se x  0 ou y  0

Figura 17.18: Gráfico da superfície z = f (x, y) dada pela equação (17.223).

Na origem as derivadas parciais existem e são dadas por

∂f f (0 + h, 0) f (0, 0) 1 1
(0, 0) = lim = lim =0 (17.224)
∂x h!0 h h!0 h
e
∂f f (0, 0 + h) f (0, 0) 1 1
(0, 0) = lim = lim =0. (17.225)
∂y h!0 h h!0 h

No entanto se escolhermos o vetor unitário ~v = p12 (1, 1) a composição f (h~v) é


descontínua em h = 0, não existindo a derivada direcional.
17.3 Diferenciabilidade 539

Precisamos então de um conceito mais preciso de diferenciabilidade que de-


pende do comportamento da função na vizinhança do ponto, e não apenas em dire-
ções específicas. Voltando ao caso de funções de uma variável podemos expressar
o conceito de diferenciabilidade da seguinte maneira. Seja a curva representada
pela equação y = f (x) e (x0 , f (x0 )) um ponto desta curva. Se a derivada f 0 (x0 )
existe, podemos calcular a equação da reta tangente à curva y = f (x) no ponto
(x0 , f (x0 )), cuja equação é
y = f (x0 ) + f 0 (x0 )(x x0 ) . (17.226)
Seja D f o incremento na direção y ao longo da curva y = f (x) após um incremento
Dx em x, que pode ser calculado como
D f = f (x0 + Dx) f (x0 ) . (17.227)
Df
O limite da razão Dx é dado por
Df f (x0 + Dx) f (x0 )
lim = lim = f 0 (x0 ) . (17.228)
Dx!0 Dx Dx!0 Dx
Então

Df
lim f 0 (x0 ) = 0 . (17.229)
Dx!0 Dx
h i
Df
Seja e1 = Dx
lim e1 = 0. Isolando o termo D f temos
f 0 (x0 ) . Claramente Dx!0

D f = f 0 (x0 )Dx + e1 Dx . (17.230)


y
O termo f 0 (x0 )Dx corresponde ao incre-
f(x+h) mento ao longo da reta tangente. O
E(x) termo e1 Dx pode ser interpretado como
Δy erro da aproximação da curva y = f (x)
dy pela reta tangente y = f (x0 ) + f 0 (x0 )(x
f(x) x0 ) calculada em x = x0 +Dx. A função f
é diferenciável em x0 se e somente se este
x x+h x
erro tende a zero quando Dx ! 0 mais rá-
Δx pido que o incremento Dx. Podemos en-
tão definir diferenciabilidade da seguinte
maneira.
Definição 17.16.
Uma função f : R ! R é diferenciável em x0 se existir uma função e1 tal que
f (x0 + Dx) = f (x0 ) + f 0 (x0 )Dx + e1 Dx onde lim e1 = 0 . (17.231)
Dx!0
540 Funções reais de várias variáveis

17.3.5 Aproximação linear


Esta definição pode ser extendida para funções de várias variáveis. O signifi-
cado geométrico da equação (17.231) é que a reta tangente à curva y = f (x) é a
reta que melhor aproxima a curva numa vizinhança pequena, pois o erro da apro-
ximação tende a zero mais rápido que o incremento Dx. A reta é dita ser uma
aproximação linear pois é uma aproximação polinomial com maior termo linear,
apesar de não ser uma função linear se a reta não passa pela origem.
Em duas variáveis a equação z = f (x, y) é a representação explícita de uma
superfície. Uma aproximação linear desta função é uma aproximação polinomial
cujo maior grau é linear, ou seja, uma função expressa como z = ax + by + c. Esta
função não é linear se c 6= 0, apesar de chamamos esta aproximação de aproxima-
ção linear. Esta aproximação descreve um plano não vertical. O plano não vertical
que melhor aproxima a superfície z = f (x, y) no ponto (x0 , y0 , z0 ) é chamado de
plano tangente. A imposição de que o plano intercepta o ponto (x0 , y0 , z0 ) implica

z0 = ax0 + by0 + c (17.232)

e isolamos c = z0 ax0 by0 para substituir na equação do plano z = ax + by + c


e obter

z z0 = a(x x0 ) + b(y y0 ) . (17.233)

Todo plano não vertical que intercepta o ponto (x0 , y0 , z0 ) deve possuir esta
equação. Mas entre estes infinitos planos o plano tangente é aquele que melhor
aproxima a superfície numa vizinhança de (x0 , y0 ).

Figura 17.19: Cortes verticais na superfície S e no plano tangente.

Seja o plano vertical y = y0 . A interseção deste plano vertical com a superfície


z = f (x, y) é a curva representada por z = f (x, y0 ). A interseção do plano vertical
17.3 Diferenciabilidade 541

com o plano z z0 = a(x x0 ) + b(y y0 ) é a reta z z0 = a(x x0 ). Se o plano


tangente é o plano que melhor aproxima a superfície z = f (x, y), então a reta
z z0 = a(x x0 ) deve ser a reta que melhor aproxima a curva z = f (x, y0 ), isto
é, a reta z z0 = a(x x0 ) é a reta tangente à curva z = f (x, y0 ). O coeficiente
angular da reta tangente é a derivada da função em relação à variável x calculada
no ponto x0 , sendo que y é mantido constante. Portanto o coeficiente a do plano
tangente deve ser dado por
∂f
a= (x0 , y0 ) . (17.234)
∂x
Agora repetimos o argumento com o plano vertical x = x0 . A interseção deste
plano com a superfície z = f (x, y) é a curva z = f (x0 , y). A interseção do plano
vertical com o plano tangente z z0 = a(x x0 ) + b(y y0 ) é a reta z z0 = b(y
y0 ). Esta reta deve ser a reta tangente à curva z = f (x0 , y), portanto o coeficiente
angular b deve ser igual à derivada da função f (x0 , y) em relação à variável y,
calculada em y0 , isto é,
∂f
b= (x0 , y0 ) . (17.235)
∂y
Definição 17.17 (Plano tangente).
Seja S uma superfície representada explicitamente por z = f (x, y). A equação
do plano tangente a S no ponto (x0 , y0 , z0 ) é dada por
∂f ∂f
z z0 = (x0 , y0 )(x x0 ) + (x0 , y0 )(y y0 ) (17.236)
∂x ∂y
se as derivadas parciais de f existirem em (x0 , y0 ).

17.3.6 Incrementos
Com a definição de plano tangente podemos finalmente extender a definição
de diferenciabilidade para funções de duas variáveis. Seja (x0 , y0 , z0 ) um ponto da
superfície S representada explicitamente pela equação z = f (x, y) com derivadas
parciais existentes em (x0 , y0 ), e que portanto admite um plano tangente. Seja o
incremento em~r dado por

D~r = (Dx, Dy) (17.237)

No ponto~r =~r 0 + D~r calculamos os seguintes incrementos. O incremento ao


longo da superfície S é

D f = f (~r 0 + D~r ) f (~r 0 ) = f (x0 + Dx, y0 + Dy) f (x0 , y0 ) . (17.238)


542 Funções reais de várias variáveis

O incremento ao longo do plano tangente é


∂f ∂f
df = (x0 , y0 )Dx + (x0 , y0 )Dy . (17.239)
∂x ∂y
Se aproximarmos a superfície S pelo
E(Δx,Δy) plano tangente, o erro cometido ao fazer
Δf
esta aproximação é igual à diferença en-
df tre estes incrementos, como ilustrado na
figura ao lado.

E(Dx, Dy) = D f d f . (17.240)


Evidentemente este erro é nulo se (Dx, Dy) = (0, 0), portanto podemos escrever
este erro como
E(Dx, Dy) = e1 · Dx + e2 · Dy , (17.241)
onde e1 e e2 são funções do incremento D~r . Se estas funções tiverem um limite
não nulo quando D~r tende a ~0 , então o erro da aproximação é proporcional ao
incremento. Para que o erro tenda a zero mais rápido que o incremento, além do
erro ser escrito desta forma é necessário que
lim e1 = 0 e lim e2 = 0 . (17.242)
(Dx,Dy)!(0,0) (Dx,Dy)!(0,0)

Neste caso dizemos que a superfície S é bem aproximada pelo plano tangente e
que a função f é diferenciável neste ponto. A equação (17.240) pode ser escrita
como
✓ ◆
∂f ∂f
e1 · Dx+e2 · Dy = f (x0 +Dx, y0 +Dy) f (x0 , y0 ) (x0 , y0 )Dx + (x0 , y0 )Dy .
∂x ∂y
(17.243)
Isolando o termo f (x0 + Dx, y0 + Dy)) temos a seguinte definição de diferenciabi-
lidade.
Definição 17.18. Uma função de duas variáveis é diferenciável em (x0 , y0 ) se
existirem funções e1 e e2 tais que
∂f ∂f
f (x0 + Dx, y0 + Dy) = f (x0 , y0 ) + (x0 , y0 )Dx + (x0 , y0 )Dy + e1 Dx + e2 Dy
∂x ∂y
(17.244)
e
lim e1 = lim e2 = 0 . (17.245)
(Dx,Dy)!(0,0) (Dx,Dy)!(0,0)
17.3 Diferenciabilidade 543

No caso de funções de n variáveis, dizemos que a função é diferenciável em


~r0 se existir uma função vetorial ~e = (e1 , . . . , en ) tal que
n n
∂f
f (~r0 + D~r) = f (~r0 ) + Â (~r 0 ) · Dxk + Â ek · Dxk (17.246)
k=1 ∂xk k=1
e

lim ek = 0 (17.247)
D~r!~0

para todo k = 1, . . . , n.
Exemplo 17.82 (Forma quadrática).
Seja a forma quadrática

f (x, y) = ax2 + bxy + cy2 . (17.248)

As derivadas parciais desta função em um ponto arbitrário (x0 , y0 ) são


∂f ∂f
(x0 , y0 ) = 2ax0 + by0 , e (x0 , y0 ) = bx0 + 2cy0 . (17.249)
∂x ∂y
Em (x, y) = (x0 + Dx, y0 + Dy) temos
f (x0 + Dx, y0 + Dy) = a(x0 + Dx)2 + b(x0 + Dx)(y0 + Dy) + c(y0 + Dy)2
= ax02 + 2ax0 Dx + a(Dx)2 + bx0 y0 + bx0 Dy + by0 Dx + bDxDy + cy20 + 2cy0 Dy + c(Dy)2
⇥ ⇤
= ax02 + bx0 y0 + cy20 + [2ax0 + by0 ] Dx + [bx0 + 2cy0 ] Dy + [aDx + bDy] Dx + [cDy] Dy
∂f ∂f
= f (x0 , y0 ) + (x0 , y0 )Dx + (x0 , y0 )Dy + e1 Dx + e2 Dy ,
∂x ∂y
onde

lim e1 = lim (aDx + bDy) = 0 (17.250)


(Dx,Dy)!(0,0) (Dx,Dy)!(0,0)

lim e2 = lim (cDy) = 0 , (17.251)


(Dx,Dy)!(0,0) (Dx,Dy)!(0,0)

provando que funções quadráticas são diferenciáveis em qualquer ponto do R2 .


Exemplo 17.83.
Seja
(
1 se x  0 ou y  0
f (x, y) = (17.252)
0 se x > 0 e y > 0
544 Funções reais de várias variáveis

que vimos que as duas derivadas parciais existem na origem e


∂f ∂f
f (0, 0) = 1 , (0, 0) = 0 e (0, 0) = 0 . (17.253)
∂x ∂y
O incremento ao longo da superfície é

D f = f (Dx, Dy) f (0, 0) = 1 se Dx > 0 e Dy > 0 . (17.254)

O incremento ao longo do plano tangente é

d f = 0 · Dx + 0 · Dy = 0 . (17.255)

O erro da aproximação é

E(Dx, Dy) = D f df = 1 . (17.256)

Enquanto Dx > 0 e Dy > 0, é possível estar arbitrariamente próximo da origem


com erro igual a 1. Este erro nem tende a zero quando (Dx, Dy) tende a (0, 0),
muito menos tende a zero mais rápido que o incremento, portanto esta função não
é diferenciável na origem, mesmo tendo todas as derivadas parciais bem definidas.

A definição dada de diferenciabilidade pode ser bem trabalhosa de ser testada


com funções mais complicadas, mas existe uma condição suficiente de diferenci-
abilidade simples de ser verificada.

Teorema 17.7. Se uma função f : R2 ! R possuir derivadas parciais contínuas


em uma bola aberta de raio d > 0 centrada em (x0 , y0 ), então f é diferenciável
em (x0 , y0 ).

Demonstração. Seja D f = f (x0 + Dx, y0 + Dy) f (x0 , y0 ) o incremento ao longo


da superfície tal que Dx2 + Dy2 < d2 , ou seja, o ponto (x0 + Dx, y0 + Dy) pertence
à bola aberta na qual as derivadas parciais são contínuas.
Somando e subtraindo f (x0 + Dx, y0 ) no
y

y + Δy
incremento D f temos
D f = [ f (x0 + Dx, y0 + Dy) f (x0 + Dx, y0 )]
y

+ [ f (x0 + Dx) f (x0 , y0 )] .

x
x x +Δx

Pelo teorema do valor médio, existe algum ȳ no intervalo [y0 , y0 + Dy] para o
qual
∂f
[ f (x0 + Dx, y0 + Dy) f (x0 + Dx, y0 )] = (x0 + Dx, ȳ)Dy . (17.257)
∂y
17.3 Diferenciabilidade 545

Da mesma forma, existe algum x̄ no intervalo [x0 , x0 + Dx] para o qual

∂f
[ f (x0 + Dx, y0 ) f (x0 , y0 )] = (x̄, y0 )Dx . (17.258)
∂x
Então
∂f ∂f
f (x0 + Dx, y0 + Dy) f (x0 , y0 ) = (x̄, y0 )Dx + (x0 + Dx, ȳ)Dy . (17.259)
∂x ∂y
∂f ∂f
Subtraindo ∂x (x0 , y0 )Dx + ∂y (x0 , y0 )Dy dos dois delas desta última equação temos
∂f ∂f
f (x0 + Dx, y0 + Dy) f (x0 , y0 ) (x0 , y0 )Dx (x0 , y0 )Dy = (17.260)
∂x ∂y
 
∂f ∂f ∂f ∂f
(x̄, y0 ) (x0 , y0 ) Dx + (x0 + Dx, ȳ) (x0 , y0 ) Dy .
∂x ∂x ∂y ∂y
Definindo
 
∂f ∂f ∂f ∂f
e1 = (x̄, y0 ) (x0 , y0 ) e e2 = (x0 + Dx, ȳ) (x0 , y0 ) Dy (17.261)
∂x ∂x ∂y ∂y
podemos escrever

∂f ∂f
f (x0 + Dx, y0 + Dy) = f (x0 , y0 ) + (x0 , y0 )Dx + (x0 , y0 )Dy + e1 Dx + e2 Dy
∂x ∂y
(17.262)

como exigido pela definição de diferenciabilidade. No limite em que (Dx, Dy)


tende a (0, 0) os argumentos das derivadas parciais que aparecem em e1 e e2 ten-
dem a (x0 , y0 ). Como estas derivadas parciais são contínuas temos que

lim e1 = lim e2 = 0 , (17.263)


(Dx,Dy)!(0,0) (Dx,Dy)!(0,0)

encerrando a demonstração.
Como consequência deste teorema, se as derivadas parciais de uma função
f forem contínuas em um conjunto aberto A, então em qualquer ponto ~r 0 2 A as
condições do teorema são satisfeitas e a função f é diferenciável, o que nos motiva
a seguinte definição.
Definição 17.19.
Seja f uma função definida em um conjunto aberto A ⇢ Rn . Dizemos que f
é de classe C1 em A ( ou f 2 C1 (A) ) se todas as derivadas parciais de f forem
contínuas em A.
546 Funções reais de várias variáveis

Como consequência do teorema anterior, funções de classe C1 (A) são diferen-


ciáveis em A. É simples mostrar que o conjunto de funções de classe C1 (A) é um
espaço vetorial, pois as operações de derivadas parciais são lineares. Funções de
classe C1 (A) são automaticamente contínuas, o que é comprovado pelo teorema a
seguir.
Teorema 17.8.
Se f : R2 ! R é diferenciável em (x0 , y0 ), então f é contínua em (x0 , y0 ).
Demonstração. Queremos mostrar que
lim f (x, y) = f (x0 , y0 ) . (17.264)
(x,y)!(x0 ,y0 )

Com a mudança de variáveis x = x0 + Dx e y = y0 + Dy podemos escrever a equa-


ção anterior como
lim [ f (x0 + Dx, y0 + Dy) f (x0 , y0 )] = 0 . (17.265)
(Dx,Dy)!(0,0)

Este termo entre colchetes é o incremento D f . Como f é diferenciável temos que



∂f ∂f
lim Df = lim (x0 , y0 )Dx + (x0 , y0 )Dy + e1 Dx + e2 Dy = 0 ,
(Dx,Dy)!(0,0) (Dx,Dy)!(0,0) ∂x ∂y
(17.266)
provando que a equação (17.265) é verdadeira.
Naturalmente podemos definir funções que são mais de uma vez diferenciá-
veis, como fizemos para funções de uma única variável.
Definição 17.20.
Uma função f : Rn ! R é dita duas vezes diferenciável em~r 0 se cada derivada
parcial for uma função diferenciável em~r 0 . Similarmente dizemos que f é n vezes
diferenciável em ~r 0 se cada derivada parcial for n 1 vezes diferenciável neste
ponto. Uma função n vezes diferenciável em um conjunto aberto A é dito ser de
classe Cn em A (o que denotamos como f 2 Cn (A)). Uma função infinitamente
diferenciável é dita de classe C• ou apenas suave.
Funções de classe C2 possuem a propriedade conveniente de que as derivadas
mistas são iguais.
Teorema 17.9.
Seja f : R2 ! R uma função de classe C2 no conjunto aberto A. Então
∂2 f ∂2 f
(x, y) = (x, y) (17.267)
∂x∂y ∂y∂x
para todo (x, y) 2 A.
17.3 Diferenciabilidade 547

Demonstração.
Seja (x0 , y0 ) um elemento qualquer de A. Como A é aberto, existem Dx e
Dy pequenos o suficiente de modo que o retângulo fechado Q = [x0 , x0 + Dx] ⇥
[y0 , y0 + Dy] esteja contido em A. Seja

F(Dx, Dy) = f (x0 + Dx, y0 + Dy) f (x0 + Dx, y0 ) f (x0 , y0 + Dy) + f (x0 , y0 ) ,
(17.268)

que é uma combinação de f (x, y) calculada nos vértices do retângulo Q contido


em A.
Os dois primeiros termos possuem o valor de x fixo em x0 + Dx enquanto os
dois ultímos possuem x = x0 . Definindo a função de uma variável

G(x) = f (x, y0 + Dy) f (x, y0 ) (17.269)

podemos escrever

F(Dx, Dy) = G(x0 + Dx) G(x0 ) . (17.270)

A função G é calculada na fronteira do retângulo Q, portanto em pontos contidos


em A onde f é diferenciável. Então G é diferenciável em [x0 , x0 + Dx] e pelo
Teorema do Valor Médio existe algum x1 2 [x0 , x0 + Dx] tal que G(x0 + Dx)
G(x0 ) = G0 (x1 ) · Dx. No entanto
G(x1 + h) G(x1 )
G0 (x1 ) = lim (17.271)
h!0 h
f (x1 + h, y0 + Dy) f (x1 + h, y0 ) ( f (x1 , y0 + Dy) f (x1 , y0 ))
= lim
h!0 h
f (x1 + h, y0 + Dy) f (x1 , y0 + Dy) f (x1 + h, y0 ) f (x1 , y0 )
= lim lim
h!0 h h!0 h
∂f ∂f
= (x1 , y0 + Dy) (x1 , y0 ) .
∂x ∂x
Desta forma

∂f ∂f
F(Dx, Dy) = (x1 , y0 + Dy) (x1 , y0 ) Dx . (17.272)
∂x ∂x

Como esta diferença possui o valor de x fixo em x1 , podemos definir outra função
de uma variável H(y) = ∂∂xf (x1 , y) e escrever

F(Dx, Dy) = [H(y0 + Dy) H(y0 )] Dx . (17.273)


548 Funções reais de várias variáveis

Se a derivada ∂∂xf é diferenciável em A, então H(y) é diferenciável em [y0 , y0 +


Dy] e pelo Teorema do Valor Médio existe algum y1 2 [y0 , y0 + Dy] tal que H(y0 +
Dy) H(y0 ) = H 0 (y1 ) · Dy, sendo

∂f ∂f
0 H(y1 + h) H(y1 ) ∂x (x1 , y1 + h) ∂x (x1 , y1 ) ∂2 f
H (y1 ) = lim = lim = (x1 , y1 ) .
h!0 h h!0 h ∂y∂x
(17.274)

Portanto
∂2 f
F(Dx, Dy) = (x1 , y1 ) · Dx · Dy . (17.275)
∂y∂x

Agora voltamos à expressão original para F(Dx, Dy) que rearranjamos como

F(Dx, Dy) = f (x0 + Dx, y0 + Dy) f (x0 , y0 + Dy) f (x0 + Dx, y0 ) + f (x0 , y0 ) .
(17.276)

Agora definimos M(y) = f (x0 + Dx, y) f (x0 , y) para escrever

F(Dx, Dy) = M(y0 + Dy) M(y0 ) . (17.277)

Pelos mesmos argumentos utilizados na função G, a função M é diferenciável em


[y0 , y0 + Dy] e pelo Teorema do Valor Médio existe algum y2 2 [y0 , y0 + Dy] tal que
M(y0 + Dy) M(y0 ) = M 0 (y2 ) · Dy onde
M(y2 + h) M(y2 )
M 0 (y2 ) = lim (17.278)
h!0 h
f (x0 + Dx, y2 + h) f (x0 , y2 + h) ( f (x0 + Dx, y2 ) f (x0 , y2 ))
= lim
h!0 h
f (x0 + Dx, y2 + h) f (x0 + Dx, y2 ) f (x0 , y2 + h) f (x0 , y2 )
= lim lim
h!0 h h!0 h
∂f ∂f
= (x0 + Dx, y2 ) (x0 , y2 ) ,
∂y ∂y
o que nos permite escrever

∂f ∂f
F(Dx, Dy) = (x0 + Dx, y2 ) (x0 , y2 ) Dy . (17.279)
∂y ∂y
∂f
Definindo N(x) = ∂y (x, y2 ) temos

F(Dx, Dy) = [N(x0 + Dx) N(x0 )] Dy . (17.280)


17.3 Diferenciabilidade 549

Como a derivada parcial ∂∂yf é diferenciável no conjunto aberto A, a função N


é diferenciável no intervalo [x0 , x0 + Dx] e pelo Teorema de Valor Médio existe
algum x2 2 [x0 , x0 + Dx] tal que N(x0 + Dx) N(x0 ) = N 0 (x2 ) · Dx com

∂f ∂f
0 N(x2 + h) N(x2 ) ∂y (x2 + h, y2 ) ∂y (x2 , y2 ) ∂2 f
N (x2 ) = lim = lim = (x2 , y2 ) .
h!0 h h!0 h ∂x∂y
(17.281)

Assim escrevemos

∂2 f
F(Dx, Dy) = (x2 , y2 ) · Dx · Dy . (17.282)
∂x∂y

Dividindo as equações (17.275) e (17.282) por Dx · Dy e igualando-as temos

∂2 f ∂2 f
(x1 , y1 ) = (x2 , y2 ) (17.283)
∂y∂x ∂x∂y

para algum (x1 , y1 ) 2 Q e algum (x2 , y2 ) 2 Q. No limite em que (Dx, Dy) ! (0, 0),
temos que (x1 , y1 ) ! (x0 , y0 ) e (x2 , y2 ) ! (x0 , y0 ) pelo Teorema do Confronto.
Pela continuidade das derivadas mistas temos que

∂2 f ∂2 f
(x0 , y0 ) = (x0 , y0 ) (17.284)
∂y∂x ∂x∂y

para qualquer (x0 , y0 ) 2 A.

Este teorema pode ser extendido para funções de 3 ou mais variáveis ou para
derivadas mistas de ordem maior que 2.

17.3.7 Diferencial de funções de várias variáveis


No cálculo de funções de uma variável vimos que se as variáveis y e x estão
relacionadas por y = f (x) e se o incremento Dx for um incremento infinitesimal
dx, calculamos o diferencial dy pelo incremento infinitesimal ao longo da reta
tangente devido ao incremento infinitesimal dx, isto é,

dy = f 0 (x)dx . (17.285)

Expressões como esta aparecem por exemplo nas operações de mudança de variá-
vel nas integrais de funções de uma única variável.
550 Funções reais de várias variáveis

Se x e y agora são variáveis independentes e uma terceira variável z está rela-


cionada às variáveis x e y por z = f (x, y), podemos também definir os incrementos
infinitesimais em x e y, denotados respectivamente por dx e dy, calculamos o di-
ferencial dz pelo incremento ao longo do plano tangente devido ao incremento
infinitesimal d~r = (dx, dy),

∂f ∂f
dz = dx + dy . (17.286)
∂x ∂y
Estas expressões serão comuns no cálculo de integral de linhas e nas soluções de
equações diferenciais exatas.

Exemplo 17.84.
Se z = f (x, y) = xye (x2 +y2 ) , as derivadas parciais são

∂f (x2 +y2 ) (x2 +y2 )


= ye 2x2 ye (17.287)
∂x
e
∂f (x2 +y2 ) (x2 +y2 )
= xe 2xy2 e . (17.288)
∂y
Estas funções são combinações e composições de exponenciais e polinômios, por-
tanto são contínuas em todo o R2 , que é um conjunto aberto. Então a função f é
de classe C1 no R2 . O diferencial dz é dado por
(x2 +y2 ) (x2 +y2 )
dz = y(1 2x2 )e dx + x(1 2y2 )e dy . (17.289)
17.3 Diferenciabilidade 551

17.3.8 Regra da cadeia


Quando definimos a derivada de uma função de n variáveis f (~r ) ao longo de
um caminho parametrizado por~r (t), calculamos a composição

g(t) = f (~r (t)) . (17.290)

Como g(t) é uma função de uma variável, podemos utilizar as técnicas do cálculo
de funções de uma única variável para saber se g é diferenciável em um certo t0 .
No entanto, mesmo que a derivada g0 (t0 ) ao longo de um certo caminho exista,
nada garante que a derivada da composição existe ao longo de outros caminhos,
pois vimos que mesmo que infinitas derivadas ao longo de caminhos distintos
existam no mesmo ponto, f (~r ) não é necessariamente diferenciável neste ponto.
O resultado que permite concluir a diferenciabilidade da composição g(t) =
f (~r (t)) a partir da diferenciabilidade de f (~r ) e~r (t) chama-se regra da cadeia.

Teorema 17.10 (Regra da cadeia).


Seja f : Rn ! R uma função definida em uma região aberta A ⇢ Rn e ~r :
R ! Rn um campo vetorial uniparamétrico com domínio [a, b] e imagem contida
em A. Seja a função composta g(t) = f (~r(t)) definida no intervalo [a, b]. Se o
campo vetorial ~r(t) = (x1 (t), . . . , xn (t)) é diferenciável em t0 2 [a, b] e se f (~r ) é
diferenciável em~r(t0 ), então a composição g(t) é diferenciável em t0 e
n
∂f dxk
g0 (t0 ) = Â ∂xk (~r (t0)) · dt
(t0 ) (17.291)
k=1

Demonstração. A demonstração será feita para uma função de duas variáveis. O


caso geral é apenas mais trabalhoso. Seja~r(t) = (x(t), y(t)). Após um incremento
Dt em t temos

g(t0 + Dt) = f (x(t0 + Dt), y(t0 + Dt)) . (17.292)

Como o campo vetorial é diferenciável em t0 , escrevemos


x(t0 + Dt) = x(t0 ) + x0 (t0 )Dt + ex Dt , (17.293)
y(t0 + Dt) = y(t0 ) + y0 (t0 )Dt + ey Dt , (17.294)
onde

lim ex = lim ey = 0 . (17.295)


Dt!0 Dt!0

Então

g(t0 + Dt) = f x(t0 ) + x0 (t0 )Dt + ex Dt, y(t0 ) + y0 (t0 )Dt + ey Dt . (17.296)
552 Funções reais de várias variáveis

Escrevendo x0 = x(t0 ), y0 = y(t0 ), Dx = x0 (t0 )Dt + ex Dt e Dy = y0 (t0 )Dt + ey Dt


temos que Dx e Dy tendem a zero se Dt tende a zero e g(t0 + Dt) = f (x0 + Dx, y0 +
Dy). Como f é diferenciável em (x0 , y0 ) escrevemos

∂f ∂f
g(t0 + Dt) = f (x0 , y0 ) + (x0 ,t0 )Dx + (x0 ,t0 )Dy + e1 Dx + e2 Dy , (17.297)
∂x ∂y

onde

lim e1 = lim e2 = 0 . (17.298)


(Dx,Dy)!(0,0) (Dx,Dy)!(0,0)

Escrevendo explicitamente a dependência em t0 e Dt temos


∂f ⇥ ⇤
g(t0 + Dt) = f (x(t0 ), y(t0 )) + (x(t0 ), y(t0 )) x0 (t0 )Dt + ex Dt
∂x
∂f ⇥ 0 ⇤ ⇥ ⇤
+ (x(t0 ), y(t0 )) y (t0 )Dt + ey Dt + e1 x0 (t0 )Dt + ex Dt
∂y
⇥ ⇤
+e2 y0 (t0 )Dt + ey Dt , (17.299)

que podemos rearranjar como



∂f ∂f
g(t0 + Dt) = f (x(t0 ), y(t0 )) + (x(t0 ), y(t0 ))x0 (t0 ) + (x(t0 ), y(t0 ))y0 (t0 ) Dt
∂x ∂y

∂f ∂f
+ (x(t0 ), y(t0 ))ex + (x(t0 ), y(t0 ))ey + e1 x0 (t0 ) + e2 y0 (t0 ) + e1 ex + e2 ey Dt .
∂x ∂y
Como este último termo entre colchetes tende a zero quando Dt tende a zero,
conseguimos reescrever esta equação como

g(t0 + Dt) = g(t0 ) + g0 (t0 )Dt + et Dt (17.300)

onde

lim et = 0 (17.301)
Dt!0

pois é uma combinação de funções limitadas com funções que tendem a zero, o
que prova que a função g é diferenciável em t0 e que

∂f ∂f
g0 (t0 ) = (x(t0 ), y(t0 ))x0 (t0 ) + (x(t0 ), y(t0 ))y0 (t0 ) . (17.302)
∂x ∂y
17.3 Diferenciabilidade 553

Para um valor qualquer de t e em n variáveis escrevemos esta expressão como

n
d ∂ f dxk
f (~r (t)) = Â . (17.303)
dt k=1 ∂xk dt

Esta somatória pode ser escrita como o produto escalar de dois vetores. O segundo
vetor tem componentes
✓ ◆
dx1 dx2 dxn
, ,..., (17.304)
dt dt dt

e é facilmente reconhecido como o vetor tangente à curva~r 0 (t). O segundo vetor


tem componentes
✓ ◆
∂f ∂f ∂f
, ,..., (17.305)
∂x1 ∂x2 ∂xn
que chamamos de vetor gradiente.

17.3.9 Vetor gradiente


O vetor gradiente é um vetor denotado por ~— f definido por
✓ ◆
~— f = ∂ f , ∂ f , . . . , ∂ f . (17.306)
∂x1 ∂x2 ∂xn

O símbolo — chama-se “nabla”. O vetor gradiente é calculado a partir de uma


função escalar de várias variáveis. No caso de funções de duas variáveis, o vetor
gradiente é um vetor de duas componentes dadas por
✓ ◆
~— f = ∂ f , ∂ f . (17.307)
∂x ∂y
Para funções de três variáveis, o vetor gradiente é calculado como
✓ ◆
~— f = ∂ f ∂ f ∂ f
, , . (17.308)
∂x ∂y ∂z
Assim como consideramos a derivada de uma função de uma variável como
d
um operador denotado por dx que age na função f (x) e que resulta na função
derivada
d
f (x) = f 0 (x) (17.309)
dx
554 Funções reais de várias variáveis

e equivalentemente para as derivadas parciais

∂ ∂f
f (x, y, z) = (x, y, z) , (17.310)
∂z ∂z
podemos definir o gradiente de uma função como a aplicação do operador nabla
✓ ◆
~— = ∂ ∂ ∂
, ,..., (17.311)
∂x1 ∂x2 ∂xn

na função de n variáveis f (~r ) como se esta operação fosse a multiplicação do


vetor ~— pelo escalar f (~r ) pela direita. Em três dimensões esta operação é
✓ ◆ ✓ ◆
~— f (x, y, z) = ∂ ∂ ∂ ∂f ∂f ∂f
, , f (x, y, z) = (x, y, z), (x, y, z), (x, y, z) .
∂x ∂y ∂z ∂x ∂y ∂z
(17.312)

Teorema 17.11 (Linearidade).


O gradiente é uma transformação linear, isto é,

~— (a · f (~r ) + b · g(~r )) = a · ~— f (~r ) + b · ~—g(~r ) (17.313)

para quaisquer funções diferenciáveis f e g e quaisquer números reais a e b.

Demonstração.
No caso de funções de duas variáveis,
✓ ◆
~— (a · f (x, y) + b · g(x, y)) = ∂ , ∂ (a · f (x, y) + b · g(x, y))
∂x ∂y
✓ ◆
∂ ∂
= (a · f (x, y) + b · g(x, y)) , (a · f (x, y) + b · g(x, y))
∂x ∂y
✓ ◆
∂f ∂g ∂ f ∂g
= a +b ,a +b
∂x ∂x ∂y ∂y
✓ ◆ ✓ ◆
∂f ∂f ∂g ∂g
= a· , +b· ,
∂x ∂y ∂x ∂y
= a · ~— f (x, y) + b · ~—g(x, y) . (17.314)

Teorema 17.12 (Derivada direcional).


A derivada direcional de uma função diferenciável f no ponto ~r 0 na direção
~v com k~v k = 1 é a projeção do gradiente de f calculado em~r 0 na direção ~v .
17.3 Diferenciabilidade 555

Demonstração.
A derivada direcional é definida como a derivada da composição f (~r (t)) quando
~r (t) parametriza a reta que passa por~r 0 com vetor diretor ~v . Se~r (t) =~r 0 + t ·~v ,
a reta passa por~r 0 em t = 0 e a derivada direcional é dada por dtd f (~r 0 + t ·~v ) t=0 .
Pela regra da cadeia,
d
f (~r 0 + t ·~v ) = ~— f (~r 0 + t ·~v ) ·~r 0 (t) . (17.315)
dt
O vetor tangente vale~r 0 (t) =~v . Calculando esta expressão em t = 0 temos

d
f (~r 0 + t ·~v ) = ~— f (~r 0 ) ·~v . (17.316)
dt t=0

A projeção do gradiente na direção ~v é dada por


⇣ ⌘ ~— f (~r ) ·~v
0
proj~v ~— f (~r 0 ) = 2
= ~— f (~r 0 ) ·~v , (17.317)
k~v k

pois o vetor ~v é unitário.


Este teorema tem um corolário interessante.

Teorema 17.13.
O gradiente de uma função diferenciável de n variáveis f aponta na direção de
maior crescimento, isto é, a derivada direcional de f em~r 0 é maior se a direção
~v aponta na direção do gradiente.

Demonstração.
Pelo teorema anterior, a derivada direcional vale

d
f (~r 0 + t ·~v ) = ~— f (~r 0 ) ·~v = ~— f (~r 0 ) · k~v k · cos(q) , (17.318)
dt t=0

onde q é o ângulo entre o vetor gradiente e o vetor diretor ~v , que é unitário. A


derivada direcional é portanto limitada por

~— f (~r 0 )  d f (~r 0 + t ·~v )  ~— f (~r 0 ) . (17.319)


dt t=0

O valor máximo ocorre quando q = 0, isto é, quando o gradiente e o vetor ~v


possuem mesma direção e mesmo sentido. O valor mínimo ocorre em q = p, ou
seja, quando o vetor gradiente e ~v possuem mesma direção e sentidos opostos.
556 Funções reais de várias variáveis

Exemplo 17.85 (Paraboloide de revolução).


Seja
f (x, y) = a2 x2 y2 . (17.320)
O gradiente desta função vale
✓ ◆
~— f = ∂ a2 x2 y2 , ∂ a2 x 2
y2
= ( 2x, 2y) = 2 · (x, y) = 2~r .
∂x ∂y
(17.321)
O gradiente sempre aponta na direção da origem. No caso em que~r 0 = (1, 2),
o gradiente é dado por
~— f (~r 0 ) = ( 2, 4) . (17.322)
Seja a direção ~v = (cos(q), sen(q)) com q arbitrário. Sem utilizar o gradiente
calculamos a derivada direcional desta função como
d d
f (~r 0 + t ·~v ) = f (1 + t cos(q), 2 + t sen(q))
dt t=0 dt t=0
d⇥ 2 ⇤
= a (1 + t cos(q))2 (2 + t sen(q))2
dt t=0
d⇥ 2 ⇤
= a 1 2t cos(q) t 2 cos2 (q) 4 4t sen(q) t 2 sen2 (q)
dt t=0
d⇥ 2 ⇤
= a 5 2t cos(q) 4t sen(q) t 2
dt t=0
= [ 2 cos(q) 4 sen(q) 2t]|t=0
= 2 cos(q) 4 sen(q) . (17.323)
Esta última expressão depende de q, isto é, a derivada direcional no ponto ~r 0 =
(1, 2) vale
g(q) = 2 cos(q) 4 sen(q) . (17.324)
Queremos saber quais os valores de q para os quais a derivada direcional tem o
valor máximo e o valor mínimo. Estes valores ocorrem quando g0 (q) = 0, ou seja,

2 sen(q) 4 cos(q) = 0 =) tan(q) = 2 . (17.325)


Esta inclinação é a mesma inclinação do vetor~r 0 = (2, 4). O valor máximo ocorre
com a mesma direção e sentido de ~r 0 e o valor mínimo ocorre com a mesma
direção e sentidos opostos.
17.3 Diferenciabilidade 557

Exemplo 17.86 (Conjuntos de nível).


Como já visto, os conjuntos de nível de uma função de n variáveis são os
valores de~r 2 Rn que satisfazem o vínculo

f (~r ) = k , (17.326)

onde k 2 Im( f ). Se f é uma função de duas variáveis os conjuntos de nível são


curvas de nível, e no caso de funções de três variáveis são superfícies de nível.
O vetor gradiente em ~r 0 é ortogonal ao conjunto de nível de f que intercepta
~r 0 .
Seja k = f (~r 0 ). Obviamente o conjunto de nível f (~r ) = k contém ~r 0 . Seja
C um caminho contido neste conjunto de nível que passa por ~r 0 quando t = t0
parametrizado por~r (t). Nestas condições

f (~r (t)) = k . (17.327)

Derivando dos dois lados temos


d d
f (~r (t)) = k =0, (17.328)
dt t=t0 dt t=t0

pois o lado direito é a derivada de uma constante. Pela regra da cadeia escrevemos

~— f (~r (t)) ·~r 0 (t) =0 (17.329)


t=t0

ou
~— f (~r 0 ) ·~r 0 (t0 ) = 0 . (17.330)

Se f depende de três variáveis o conjunto de nível é uma superfície. Como o


vetor gradiente ~— f (~r 0 ) é ortogonal à superfície de nível representada implicita-
mente por f (~r ) = f (~r 0 ), podemos definir o plano ortogonal ao gradiente como o
plano tangente a esta superfície de nível. A equação deste plano tangente é

∂f ∂f ∂f
(x0 , y0 , z0 )(x x0 )+ (x0 , y0 , z0 )(y y0 )+ (x0 , y0 , z0 )(z z0 ) = 0 (17.331)
∂x ∂y ∂z
ou apenas

~— f (~r 0 ) · (~r ~r 0 ) = 0 . (17.332)

Esta última fórmula pode ser extendida para um número de dimensões arbitrário.
558 Funções reais de várias variáveis

Exemplo 17.87 (Esfera de raio a).


A esfera de raio a centrada na origem é representada implicitamente pela equa-
ção

x2 + y2 + z2 = a2 . (17.333)

Esta superfície pode ser representada explicitamente pelas equações


p
z = ± a2 x2 y2 . (17.334)
q
Seja (x0 , y0 , z0 ) um ponto da calota superior, ou seja, com z0 = a2 x02 y20 . O
plano tangente esta superfície representada explicitamente neste ponto é
∂f ∂f
z z0 = (x0 , y0 )(x x0 ) + (x0 , y0 )(y y0 ) (17.335)
∂x ∂y
p
com f (x, y) = a2 x2 y2 , o que resulta em
∂f x0 ∂f y0
(x0 , y0 ) = q e (x0 , y0 ) = q (17.336)
∂x a2 x02 y20 ∂y a2 x02 y20

e a equação do plano tangente é dada por


x0 y0
z z0 = q (x x0 ) + q (y y0 ) . (17.337)
a2 x02 y20 a2 x02 y20

A representação
q explícita não é capaz de obter um plano tangente nos pontos
em que a2 x02 y20 = 0, isto é, nos pontos em que z0 = 0 que forma a linha
do equador. Nestes pontos a função f (x, y) não é diferenciável, apesar de ser
contínua.
Além desta abordagem podemos descrever a esfera de raio a como a superfície
de nível da função

g(x, y, z) = x2 + y2 + z2 (17.338)

no nível g(x, y, z) = a2 . O plano tangente a esta superfície de nível no ponto


(x0 , y0 , z0 ) é dado por
~— g(~r 0 ) · (~r ~r 0 ) = 0 (17.339)

ou
∂g ∂g ∂g
(x0 , y0 , z0 )(x x0 )+ (x0 , y0 , z0 )(y y0 )+ (x0 , y0 , z0 )(z z0 ) = 0 (17.340)
∂x ∂y ∂z
17.3 Diferenciabilidade 559

ou ainda

2x0 (x x0 ) + 2y0 (y y0 ) + 2z0 (z z0 ) = 0 . (17.341)

Nos pontos em que z0 = 0 esta equação resulta num plano vertical, como esperado
do plano tangente a uma esfera nos pontos pertencentes ao equador. Acima do
equador podemos dividir esta equação por 2z0 e obter a equação
x0 y0
z z0 = (x x0 ) (y y0 ) (17.342)
z0 z0
q
e substituindo z0 = a2 x02 y20 obtemos

x0 y0
z z0 = q (x x0 ) + q (y y0 ) , (17.343)
a2 x02 y20 a2 x02 y20

que é a equação do plano tangente obtida pela representação explícita, mas com
contas mais simples.
Exemplo 17.88 (Derivada total).
A regra da cadeia nos diz que para uma função de duas variáveis
d ∂ f dx ∂ f dy
f (x(t), y(t)) = + . (17.344)
dt ∂x dt ∂y dt
Seja uma representação paramétrica cujo parâmetro é a própria variável x, ou seja,

~r (x) = (x, y(x)) . (17.345)

O vetor tangente é
✓ ◆
0 dy
r (x) = 1, (17.346)
dx

e a derivada da composição f (~r (x)) em relação ao parâmetro x é

df ∂ f ∂ f dy
= + . (17.347)
dx ∂x ∂y dx
Esta derivada é chamada de derivada total da função f em relação a x. A derivada
total de f em relação a y é
df ∂ f ∂ f dx
= + . (17.348)
dy ∂y ∂x dy
560 Funções reais de várias variáveis

No caso de funções de três variáveis, a derivada total de f em relação a x é

df ∂ f ∂ f dy ∂ f dz
= + + . (17.349)
dx ∂x ∂y dx ∂z dx

Se no caminho parametrizado por x da forma ~r (x) = (x, y(x), z(x)) as variáveis y


dy dz
e z são mantidas constantes temos que dx = 0 e dx = 0. Somente neste caso a
derivada total de f em relação a x é igual à derivada parcial, mas em geral estas
derivadas são diferentes, motivo pelo qual o erro comum de escrever o símbolo ddxf
em vez de ∂∂xf é um erro conceitual grave, pois estes símbolos denotam conceitos
diferentes.

Exemplo 17.89 (Derivação implícita).


Seja uma curva representada implicitamente por uma curva de nível de uma
função de duas variáveis

f (x, y) = k . (17.350)

Queremos encontrar a inclinação da reta tangente a um ponto qualquer desta curva


dy
dx . A derivada total da equação anterior em relação à variável x é

df ∂ f ∂ f dy
= + =0, (17.351)
dx ∂x ∂y dx

∂f
pois o lado direito é uma constante. Se no ponto em questão ∂y 6= 0, podemos
dy
isolar o termo dx como

dy ∂ f/∂x
= . (17.352)
dx ∂ f/∂y

Exemplo 17.90 (Diferenciabilidade de uma função de n variáveis).


Podemos reescrever a expressão que define a diferenciabilidade de uma função
de n variáveis. Dizemos que a função f : Rn ! R é diferenciável em~r 0 se existir
um vetor de funções ~e = (e1 , . . . , en ) tais que

f (~r 0 + D~r ) = f (~r 0 ) + ~— f (~r 0 ) · D~r +~e · D~r (17.353)

com

lim ek = 0 8k = 1, . . . , n (17.354)
D~r !~0
17.3 Diferenciabilidade 561

Exemplo 17.91 (Diferencial de uma função de n variáveis).


O diferencial d f de uma função de n variáveis é o incremento ao longo do
plano tangente devido a um incremento infinitesimal d~r = (dx1 , . . . , dxn ). Em
termos do gradiente podemos escrever o diferencial de uma função como

d f = ~— f (~r ) · d~r . (17.355)

Esta expressão será muito utilizada no cálculo de integrais de linha e em equações


diferenciais exatas.
562 Funções reais de várias variáveis

17.3.10 Aproximação de Taylor


Uma função diferenciável é, por definição, uma função que é bem aproximada
pela plano tangente. O erro da aproximação da função pelo plano tangente tende
a zero mais rápido que o incremento. Uma função com derivadas parciais contí-
nuas num conjunto aberto é diferenciável neste conjunto. Suponha agora que as
derivadas parciais sejam funções diferenciáveis num certo ponto. Podemos neste
caso melhorar a aproximação e utilizar uma aproximação quadrática ao invés de
linear, como garantido pela aproximação de Taylor de funções de duas variáveis.
Vimos no cálculo de funções de uma única variável que se uma função f : R !
R for n vezes diferenciável num ponto x0 , podemos aproximar f (x0 + Dx) por um
polinômio chamado polinômio de Taylor de grau n e escrevemos f (x) como
n
1
f (x0 + Dx) = Â k! f (k)(x0)(Dx)k + en(Dx) · (Dx)n (17.356)
k=0

com

lim en (Dx) = 0 , (17.357)


Dx!0

ou seja, o erro da aproximação da função pelo polinômio de Taylor tende a zero


mais rápido que (Dx)n . Com a mudança de variáveis x = x0 + Dx escrevemos a
aproximação de Taylor como
n
1
f (x) = Â k! f (k)(x0)(x x0 )k + en (x) · (x x0 )n . (17.358)
k=0

Antes de generalizar esta fórmula para funções de duas variáveis é interessante


reescrever o erro da seguinte forma, que normalmente é chamada de fórmula de
Taylor com resto.

Teorema 17.14.
Se f : R ! R é n + 1 vezes diferenciável em uma vizinhança de x0 , então
podemos nesta vizinhança aproximar
n
1
f (x) = Â k! f (k)(x0)(x x0 )k + En (x) (17.359)
k=0

com
x
1
ˆ
En (x) = (x t)n f (n+1) (t)dt . (17.360)
n! x0
17.3 Diferenciabilidade 563

Demonstração.
Este teorema é provado por indução. Para o caso n = 1 temos

f (x) = f (x0 ) + f 0 (x0 )(x x0 ) + E1 (x) (17.361)

ou

E1 (x) = f (x) f (x0 ) f 0 (x0 )(x x0 ) . (17.362)

As diferenças f (x) f (x0 ) e (x x0 ) podem, de acordo com o Teorema Funda-


mental do Cálculo, serem escritas como integrais, resultando em
ˆ x ˆ x
E1 (x) = f 0 (t)dt f 0 (x0 ) 1dt . (17.363)
x0 x0

Pela linearidade da integral escrevemos


ˆ x
⇥ 0 ⇤
E1 (x) = f (t) f 0 (x0 ) dt . (17.364)
x0

Agora aplicamos o método de integração por partes. Escolhendo u(t) = f 0 (t)


f 0 (x0 ) e v(t) = t x temos du = f 00 (t), dv = 1dt e
ˆ x
0 0 x
E1 (x) = f (t) f (x0 ) · (t x) x f 00 (t)(t x)dt (17.365)
0
x0

ou apenas
ˆ x
E1 (x) = (x t) f 00 (t)dt , (17.366)
x0

provando assim o teorema para o caso n = 1.


Agora supomos que um caso arbitrário n seja válido para desta suposição mos-
trar que o caso n + 1 também é. Escrevendo a aproximação até ordem n temos
n
f (x) = Â f (k)(x0)(x x0 )k + En (x) (17.367)
k=0

e aproximando até ordem n + 1 temos

n
1 1
f (x) = Â k! f (k)(x0)(x x0 )k +
(n + 1)!
f (n+1) (x0 )(x x0 )n+1 + En+1 (x) .
k=0
(17.368)
564 Funções reais de várias variáveis

Subtraindo estas equações temos

1
En+1 (x) = En (x) f (n+1) (x0 )(x x0 )n+1 . (17.369)
(n + 1)!

Pela hipótese de indução, substituímos En (x) pela expressão que queremos provar
que é verdadeira, obtendo
x
1 1
ˆ
En+1 (x) = (x t)n f (n+1) (t)dt f (n+1) (x0 )(x x0 )n+1 . (17.370)
n! x0 (n + 1)!

A diferença (x x0 )n+1 pode também ser escrita como uma integral.


ˆ x
n+1
(x x0 ) = (n + 1) (x t)n dt , (17.371)
x0

portanto
x x
1 1 (n+1)
ˆ ˆ
n (n+1)
En+1 (x) = (x t) f (t)dt f (x0 ) (x t)n dt . (17.372)
n! x0 n! x0

Pela linearidade da integral temos


ˆ xh i
1
En+1 (x) = f (n+1) (t) f (n+1) (x0 ) (x t)n dt . (17.373)
n! x0

Novamente aplicamos o método de integração por partes escolhendo as funções


t)n+1
u(t) = f (n+1) (t) f (n+1) (x0 ) e v(t) = (x n+1 , que implicam du = f (n+2) (t),
dv = (x t)n e
h i x x ✓ ◆
1 1 (x t)n+1
ˆ
En+1 (x) = f (n+1) (t) f (n+1) (x0 ) (x t)n+1 f (n+2) (t) dt .
(n + 1)! x0 n! x0 n+1
(17.374)

Os termos fora da integral se anulam, resultando em


x
1
ˆ
En+1 (x) = (x t)n+1 f (n+2) (t)dt , (17.375)
(n + 1)! x0

que é a fórmula que queremos provar. Por indução esta fórmula é válida para todo
n 1.
17.3 Diferenciabilidade 565

Com esta expressão para a aproximação de Taylor com resto podemos deduzir
uma expressão semelhante para funções de duas ou mais variáveis. Sejam ~r e ~r 0
elementos de A. Queremos aproximar o valor de f (~r ) por um polinômio de até
segunda ordem, isto é, por uma função constante somada a uma transformação
linear e a uma forma quadrática, em alguma vizinhança de~r 0 .
Seja C o segmento de reta que une ~r 0 e ~r , que podemos parametrizar por
~r (t) = (1 t)~r 0 + t~r com t 2 [0, 1]. Nesta parametrização ~r (0) =~r 0 e ~r (1) =~r .
Escrevendo ~r = ~r 0 + D~r . Neste caso a parametrização do segmento de reta é
~r (t) =~r 0 + tD~r , com~r 0 (t) = D~r .
Seja a composição

g(t) = f (~r (t)) = f (~r 0 + tD~r ) . (17.376)

Como o conjunto A é convexo, o segmento de reta C está contido em A, então a


composição g(t) é duas vezes diferenciável no intervalo [0, 1]. Então pela aproxi-
mação de Taylor de primeira ordem com resto podemos escrever

1
1
ˆ
0
g(1) = g(0) + g (0) (1 0) + (1 t)2 g00 (t)dt . (17.377)
2 0

Pelo teorema do valor médio para integrais existe c 2 [0, 1] tal que

1
g(1) = g(0) + g0 (0) + g00 (c) , (17.378)
2

ou seja,

d 1 d2
f (~r 0 + D~r ) = f (~r 0 ) + [ f (~r (t))] + [ f (~r (t))] . (17.379)
dt t=0 2 dt 2 t=c

Pela regra da cadeia

d
g0 (0) = [ f (~r (t))] = ~— f (~r (t)) ·~r 0 (t) = ~— f (~r 0 ) · Dr . (17.380)
dt t=0 t=0

Em duas dimensões,

∂f ∂f
g0 (0) = (x0 , y0 )Dx + (x0 , y0 )Dy . (17.381)
∂x ∂y
566 Funções reais de várias variáveis

O termo 12 g00 (c) em duas dimensões é dado por

1 00 1 d2
g (c) = f (x(t), y(t))
2 2 dt 2 t=c
 ✓ ◆
1 d ∂f ∂f
= (x(t), y(t))Dx + (x(t), y(t))Dy
2 dt ∂x ∂y
✓ 2 2 ◆ t=c
1 ∂ f ∂ f
= (x(t), y(t))Dx + (x(t), y(t))Dy Dx (17.382)
2 ∂x2 ∂y∂x
✓ 2 ◆
∂ f ∂2 f
+ (x(t), y(t))Dx + 2 (x(t), y(t))Dy Dy
∂x∂y ∂y t=c
1 ∂2 f 2 ∂2 f 1 ∂2 f
= (x(c), y(c))Dx + (x(c), y(c))DxDy + (x(c), y(c))Dy2 .
2 ∂x2 ∂x∂y 2 ∂y2
Com estas expressões podemos finalmente escrever a aproximação de Taylor
de primeira ordem

∂f ∂f
f (x0 + Dx, y0 + Dy) = f (x0 , y0 ) + (x0 , y0 )Dx + (x0 , y0 )Dy + E2 (Dx, Dy)
∂x ∂y
(17.383)

com erro dado por

1 ∂2 f 2 ∂2 f 1 ∂2 f
E2 (Dx, Dy) = (x(c), y(c))Dx + (x(c), y(c))DxDy + (x(c), y(c))Dy2 ,
2 ∂x2 ∂x∂y 2 ∂y2
(17.384)

que é uma forma quadrádica dos incrementos Dx e Dy.


Voltando às variáveis x = x0 + Dx e y = y0 + Dy escrevemos a aproximação de
Taylor como

∂f ∂f
f (x, y) = f (x0 , y0 ) + (x0 , y0 )(x x0 ) + (x0 , y0 )(y y0 ) + E2 (x, y) (17.385)
∂x ∂y

também com erro quadrático.


No caso de funções de n variáveis este resultado é escrito como

f (~r ) = f (~r 0 ) + ~— f (~r 0 ) · (~r ~r 0 ) + E2 (~r ) , (17.386)

ou seja, de acordo com a aproximação de Taylor a função f (~r ) é aproximada em


primeira ordem pelo plano tangente com um erro quadrático se a função for de
classe C2 .
17.3 Diferenciabilidade 567

Se a função for de classe C3 , podemos estimar a aproximação de Taylor de


segunda ordem. Novamente definimos
g(t) = f (~r (t)) = f (~r 0 + tD~r ) (17.387)
e utilizamos a aproximação de Taylor de funções de uma variável e o teorema do
valor médio para escrever
1 1
g(1) = g(0) + g0 (0) + g00 (0) + g000 (c) (17.388)
2 3!
com 0  c  1. Novamente
g0 (0) = ~— f (~r 0 ) · D~r . (17.389)
O termo adicional 12 g00 (0) vale
1 00 1 d2
g (0) = [ f (~r (t))]
2 2 dt 2 t=0
✓ ◆
1 d ∂f dx ∂ f dy
= (x(t), y(t)) + (x(t), y(t))
2 dt ∂x dt ∂y dt t=0
✓ ◆
1 d ∂f ∂f
= (x(t), y(t))Dx + (x(t), y(t))Dy (17.390)
2 dt ∂x ∂y t=0
✓ 2 ◆
1 ∂ f ∂2 f
= (x(t), y(t))Dx + (x(t), y(t))Dy Dx
2 ∂x2 ∂y∂x
✓ 2 ◆
∂ f ∂2 f
+ (x(t), y(t))Dx + 2 (x(t), y(t))Dy Dy
∂x∂y ∂y t=0
✓ 2 2 2f ◆
1 ∂ f 2 ∂ f ∂ 2
= (x0 , y0 )Dx + 2 (x0 , y0 )DxDy + 2 (x0 , y0 )Dy .
2 ∂x2 ∂x∂y ∂y
No cálculo do erro proporcional a g000 (c) podemos aproveitar alguns cálculos
já feitos. Da expressão
✓ 2 ◆
00 ∂ f 2 ∂2 f ∂2 f 2
g (c) = (x(t), y(t))Dx + 2 (x(t), y(t))DxDy + 2 (x(t), y(t))Dy
∂x2 ∂x∂y ∂y t=c
(17.391)
temos

d ∂2 f ∂2 f ∂2 f
000
g (c) = (x(t), y(t))Dx2 + 2 (x(t), y(t))DxDy + 2 (x(t), y(t))Dy2
dt ∂x 2 ∂x∂y ∂y t=c
✓ 3 3
◆ ✓ 3 3
◆ ✓ 3 3f

∂ f ∂ f 2 ∂ f ∂ f ∂ f ∂
= Dx + Dy Dx + 2 Dx Dy DxDy + Dx + 3 Dy Dy2
∂x3 ∂y∂x2 ∂x2 ∂y ∂y2 ∂x ∂x∂y2 ∂y t=c
 3 3 3 3
∂ f 3 ∂ f ∂ f ∂ f
= Dx + 3 2 Dx2 Dy + 3 DxDy2 + 3 Dy3 (17.392)
∂x3 ∂x ∂y ∂x∂y2 ∂y t=c
568 Funções reais de várias variáveis

então voltando à aproximação de terceira ordem


1 1
g(1) = g(0) + g0 (0) + g00 (0) + g000 (c) (17.393)
2 3!
encontramos a aproximação de Taylor de segunda ordem
∂f ∂f
f (x0 + Dx, y0 + Dy) = f (x0 , y0 ) + (x0 , y0 )Dx + (x0 , y0 )Dy (17.394)
∂x ∂y
✓ ◆
1 ∂2 f 2 ∂2 f ∂2 f 2
+ (x0 , y0 )Dx + 2 (x0 , y0 )DxDy + 2 (x0 , y0 )Dy + E3 (Dx, Dy)
2 ∂x2 ∂x∂y ∂y
com erro cúbico nos incrementos Dx e Dy dado por

1 ∂3 f 3 ∂3 f 2 ∂3 f 2 ∂3 f 3
E3 (Dx, Dy) = Dx + 3 Dx Dy + 3 DxDy + Dy .
3! ∂x3 ∂x2 ∂y ∂x∂y2 ∂y3 t=c
(17.395)
Voltando às variáveis x = x0 + Dx e y = y0 + Dy escrevemos a aproximação de
Taylor como
∂f ∂f
f (x, y) = f (x0 , y0 ) + (x0 , y0 )(x x0 ) + (x0 , y0 )(y y0 ) (17.396)
∂x ∂y
✓ 2 ◆
1 ∂ f 2 ∂2 f ∂2 f 2
+ (x0 , y0 )(x x0 ) + 2 (x0 , y0 )(x x0 )(y y0 ) + 2 (x0 , y0 )(y y0 )
2 ∂x2 ∂x∂y ∂y
+E3 (x, y)
com erro dado pela expressão cúbica

1 ∂3 f ∂3 f ∂3 f ∂3 f
E3 (x, y) = (x x0 )3 + 3 (x x0 )2 (y y0 ) + 3 (x x0 )(y y0 )2 + (y y0 )3
3! ∂x3 ∂x2 ∂y ∂x∂y2 ∂y3
(17.397)

onde estas derivadas parciais de terceira ordem são calculadas em algum ponto
entre (x, y) e (x0 , y0 ).
Esta forma quadrática pode ser escrita matricialmente como
0 2 1
∂ f ∂2 f ✓ ◆
1 00 1 ∂x 2 (x ,
0 0y ) (x ,
∂y∂x 0 0 A y ) Dx
g (0) = Dx Dy @
∂2 f 2 . (17.398)
2 2 (x0 , y0 ) ∂ 2f (x0 , y0 ) Dy
∂x∂y ∂y

A matriz associada a esta forma quadrática é chamada de matriz Hessiana da


função f , que nada mais é que a matriz jacobiana do gradiente de f . Denotamos
a matriz Hessiana como
1 00 1
g (0) = D~r T H( f )D~r . (17.399)
2 2
17.3 Diferenciabilidade 569

Assim a aproximação de Taylor de segunda ordem pode ser escrita como


1
f (~r 0 + D~r ) = f (~r 0 ) + ~— f (~r 0 ) · D~r + D~r T H( f )D~r + E(D~r ) (17.400)
2
com erro cúbico no incremento D~r . Esta última expressão é válida para uma
função de n variáveis.
Para encontrar aproximações de Taylor de ordem mais altas, como necessá-
rio para deduzir o método de Runge-Kutta de quarta ordem, basta repetir estes
processos com derivadas de ordem mais altas. Para funções de duas variáveis a
expansão de Taylor de ordem N é
" #
N k ✓ ◆
1 k ∂k f
f (x0 +Dx, y0 +Dy) = f (x0 , y0 )+ Â Â m ∂xk m∂ym (x0, y0)Dxk mDym
k=1 k! m=0
(17.401)

mais um erro de ordem N + 1 nos incrementos Dx e Dy.


Exemplo 17.92 (Distribuição gaussiana bidimensional).
Seja
a(x2 +y2 )
f (x, y) = e (17.402)

com a > 0. Esta função descreve uma densidade de probabilidade em duas dimen-
sões. O máximo global desta função ocorre na origem, onde f (x, y) = 1. Em torno
da origem podemos calcular uma aproximação de Taylor. As derivadas parciais
são
∂f a(x2 +y2 ) ∂f a(x2 +y2 )
= 2axe e = 2aye . (17.403)
∂x ∂y
As derivadas parciais de segunda ordem são

∂2 f a(x2 +y2 ) ∂2 f a(x2 +y2 ) ∂2 f a(x2 +y2 )


= (4a2 x2 2a)e , = 4a2 xye e = (4a2 y2 2a)e .
∂x2 ∂x∂y ∂y2
(17.404)

Calculando estas derivadas parciais na origem temos


∂f ∂f
(0, 0) = 0 , (0, 0) = 0 , (17.405)
∂x ∂y

∂2 f ∂2 f ∂2 f
(0, 0) = 2a , (0, 0) = 0 e (0, 0) = 2a . (17.406)
∂x2 ∂x∂y ∂y2
570 Funções reais de várias variáveis

A aproximação de Taylor de segunda ordem da gaussiana em torno da origem é


1
f (x, y) = 1 + 0 · x + 0 · y + 2ax2 + 0 · xy 2ay2 + E(x, y) (17.407)
2
ou

f (x, y) = 1 a(x2 + y2 ) + E(x, y) . (17.408)

Em uma vizinhança da origem a distribuição gaussiana pode ser aproximada por


um paraboloide de revolução.

Exemplo 17.93.
Seja agora

f (x, y) = 1 + x2 x4 y2 . (17.409)
⇣ ⌘
Queremos aproximar esta função em torno dos pontos de interesse (0, 0), p12 , 0
⇣ ⌘
1
e p
2
, 0 . As derivadas parciais de primeira ordem são

∂f ∂f
= 2x 4x3 e = 2y . (17.410)
∂x ∂y
As derivadas parciais de segunda ordem são

∂2 f ∂2 f ∂2 f
=2 12x2 , =0e 2 = 2. (17.411)
∂x2 ∂x∂y ∂y
Em torno da origem temos
1
f (x, y) = 1 + 0 · x + 0 · y + + 2 · x2 + 0 · xy 2 · y2 + E(x, y) (17.412)
2
ou

f (x, y) = 1 + x2 y2 + E(x, y) , (17.413)

isto é, a função é bem aproximada por um paraboloide hiperbólico em torno da


origem. ⇣ ⌘
1
Já nos pontos ± 2 , 0 temos
p

✓ ◆ " ✓ ◆ ✓ ◆ #
5 1 1 1 2 1 2
f (x, y) = + 0 · x ⌥ p + 0 · y + 4· x⌥ p 0· x⌥ p y 2y + E(x, y)
4 2 2 2 2
(17.414)
17.3 Diferenciabilidade 571

que simplificamos como


✓ ◆
5 1 2
f (x, y) = 2 x⌥ p y2 + E(x, y) . (17.415)
4 2
Na vizinhança destes pontos a função é bem aproximada por um paraboloide elíp-
tico.

Exemplo 17.94.
Imagine que a função
2 y2
f (x, y) = xyex (17.416)

é complicada demais para ser calculada no ponto (x, y) = (1.1, 0.9), o que é ver-
dade se não temos uma calculadora a disposição. Esta função é uma combinação
de exponencial com polinômios, e é uma função de classe C2 em todo o R2 , o que
nos permite calcular a aproximação de Taylor de segunda ordem.
No ponto (x0 , y0 ) = (1, 1) a função é facilmente calculada como
2 12
f (1, 1) = 1 · 1 · e1 = 1 · e0 = 1 . (17.417)

As derivadas parciais de primeira ordem desta função são


∂f 2 y2 2 y2
= yex + 2x2 yex , (17.418)
∂x
∂f 2 y2 2 y2
= xex 2xy2 ex (17.419)
∂y
e as derivadas parciais de segunda ordem são

∂2 f 2 2 2 2
= 6xyex y + 4x3 yex y , (17.420)
∂x 2

∂2 f 2 2 2 2
= 6xyex y + 4xy3 ex y , (17.421)
∂y 2

∂2 f 2 2 2 2 2 y2 2 y2
= ex y + 2x2 ex y 2y2 ex 4x2 y2 ex . (17.422)
∂x∂y
Calculando no ponto (x0 , y0 ) = (1, 1) temos
∂f
(1, 1) = 1 · e0 + 2 · 12 · 1 · e0 = 3 , (17.423)
∂x
∂f
(1, 1) = 1 · e0 2 · 1 · 12 · e0 = 1 (17.424)
∂y
572 Funções reais de várias variáveis

e
∂2 f
(1, 1) = 6 · 1 · 1 · e0 + 4 · 13 · 1 · e0 = 10 , (17.425)
∂x2
∂2 f
(1, 1) = 6 · 1 · 1 · e0 + 4 · 1 · 13 · e0 = 2 , (17.426)
∂y2
∂2 f
(1, 1) = e0 + 2 · 12 · e0 2 · 12 · e0 4 · 12 · 12 · e0 = 3 . (17.427)
∂x∂y
A aproximação de Taylor de segunda ordem
∂f ∂f
f (x, y) = f (1, 1) + (1, 1)(x 1) + (1, 1)(y 1) (17.428)
∂x ∂y
1 ∂2 f 2
∂ f 1 ∂2 f
+ (1, 1)(x 1)2 + (1, 1)(x 1)(y1 ) + (1, 1)(y 1)2 + E(x, y)
2 ∂x2 ∂x∂y 2 ∂y2
é dada por

f (x, y) = 1+3(x 1) 1(y 1)+5(x 1)2 3(x 1)(y 1) 1(y 1)2 +E(x, y)
(17.429)

com erro de ordem cúbica em (x 1, y 1).


No ponto em questão (x, y) = (1.1, 0.9) temos (x 1) = 0.1 e (y 1) = 0.1.
Então

f (x, y) = 1 + 0.3 + 0.1 + 0.05 + 0.03 0.01 + · · · = 1.47 + · · · (17.430)

Uma calculadora nos mostra que esta função vale aproximadamente 1.47691 cal-
culando com cinco casas decimais. O erro desta aproximação é por volta de
7 ⇥ 103 , o que se espera de uma aproximação de segunda ordem.
17.3 Diferenciabilidade 573

17.3.11 Valores extremos


Vários problemas de Física e Engenharia envolvem otimização, isto é, de-
terminar quais valores de uma certa variável resultam na melhor solução para o
problema. Um motor pode ser construído com peças de diversos tamanhos e que-
remos saber antes de gastar dinheiro em peças quais os tamanhos ideais para que
a eficiência do motor seja a maior possível. Podemos também ao invés de maxi-
mizar a eficiência montar um motor com custo final mínimo.
No cálculo de funções reais de uma variável aprende-se a resolver problemas
de otimização de problemas com apenas uma variável livre. No entanto em várias
situações não é possível fixar as outras variáveis deixando apenas uma indepen-
dente. Nestas situações a função que queremos maximizar ou minimizar passa a
ser uma função de várias variáveis. Queremos agora desenvolver um método para
maximizar funções de duas ou mais variáveis.
Na seção de continuidade vimos o Teorema de Weierstrass, que garante que
se uma função f é contínua em um retângulo fechado, esta função é limitada
e admite um valor máximo e um valor mínimo neste conjunto. Os pontos de
máximo e mínimo em uma região são definidos da seguinte maneira.

Definição 17.21.
Seja f : Rn ! R uma função definida num conjunto S. Dizemos que ~r 0 2 S é
o máximo global de f (~r ) em S se

f (~r 0 ) f (~r ) 8~r 2 S . (17.431)

Dizemos que~r 0 2 S é o mínimo global de f (~r ) em S se

f (~r 0 )  f (~r ) 8~r 2 S . (17.432)

O Teorema de Weierstrass garante a existência de pelo menos um máximo


global e um mínimo global em qualquer retângulo fechado no qual a função é
contínua. Este teorema não diz quantos pontos de máximo global ou mínimo
global a função admite. Além disso o teorema não ajuda a encontrar o ponto,
apenas garante a existência dele. Para encontrar os valores máximos e mínimos
devemos procurar por máximos e mínimos relativos a uma vizinhança, que serão
definidos a seguir.

Definição 17.22.
Seja f : Rn ! R uma função definida num conjunto aberto A. Dizemos que
~r 0 2 S é um máximo local de f (~r ) se existir uma vizinhança B(~r 0 , d) tal que

f (~r 0 ) f (~r ) sempre que k~r ~r 0 k < d (17.433)


574 Funções reais de várias variáveis

Dizemos que~r 0 2 S é um mínimo local de f (~r ) se existir uma vizinhança B(~r 0 , d)


tal que

f (~r 0 )  f (~r ) sempre que k~r ~r 0 k < d (17.434)

O teorema a seguir mostra uma condição necessária para que um ponto seja
um máximo ou mínimo local.
Teorema 17.15.
Se f é uma função de classe C1 no conjunto aberto A e ~r 0 2 A é um máximo
local ou mínimo local de f (~r ), então ~— f (~r 0 ) = ~0 .
Demonstração.
No caso de funções de duas variáveis, seja o ponto (x0 , y0 ) um máximo ou
mínimo local de f (x, y) em alguma vizinhança de (x0 , y0 ). Fixando a variável
y = y0 definimos a função

g(x) = f (x, y0 ) , (17.435)

que é uma função de uma única variável. Como f é diferenciável, a derivada


g0 (x) existe. Além disso, o ponto x = x0 é um máximo ou mínimo local de g(x),
portanto pelo teorema de Fermat g0 (x0 ) = 0, o que implica

∂f
(x0 , y0 ) = 0 . (17.436)
∂x
Repetindo este raciocínio fixando a variável x = x0 concluímos que
∂f
(x0 , y0 ) = 0 . (17.437)
∂y
Assim todas as componentes do gradiente de f devem se anular, mesmo no caso
de funções de n variáveis.

Exemplo 17.95.
Assim como no caso unidimensional, a recíproca deste teorema não é verda-
deira. Uma função pode ter gradiente nulo num ponto que não é máximo e nem
mínimo local. Seja por exemplo

f (x, y) = xy , (17.438)

que é uma função diferenciável em todo o R2 com gradiente


~— f (x, y) = (y, x) . (17.439)
17.3 Diferenciabilidade 575

Na origem temos que

f (0, 0) = 0 e ~— f (0, 0) = (0, 0) . (17.440)

Na origem o gradiente é nulo, mas qualquer vizinhança deste ponto contém ele-
mentos dos quatro quadrantes, ou seja, contém elementos em que f (x, y) > f (0, 0)
e elementos em que f (x, y) < f (0, 0). Este ponto não é máximo ou mínimo local,
mesmo tendo gradiente nulo.
Este exemplo justifica as seguintes classificações de pontos com gradiente
nulo.
Definição 17.23.
Se f é diferenciável em ~r 0 e ~— f (~r 0 ) = ~0 , dizemos que ~r 0 é um ponto crítico
de f . Um ponto crítico que não é um máximo local ou mínimo local é chamado
de ponto de sela.
De acordo com o análogo do Teorema de Fermat para funções de várias va-
riáveis, todo ponto de máximo local ou mínimo local é um ponto crítico. Então
podemos procurar pelos máximos e mínimos de uma função procurando pelos
pontos em que ~— f (~r ) = ~0 , o que envolve resolver um sistema de equações não
lineares, e testar um por um se este ponto é máximo ou mínimo local.
Exemplo 17.96.
Seja

f (x, y) = 1 + x2 x4 y2 . (17.441)

que é um polinômio e portanto diferenciável em todo o R2 . O gradiente desta


função vale
~— f (x, y) = 2x 4x3 , 2y . (17.442)

Queremos encontrar os pontos em que o gradiente se anula.


∂f 1
= 0 =) 2x 4x3 = 0 =) x = 0 ou x = ± p . (17.443)
∂x 2

∂f
= 0 =) 2y = 0 =) y = 0 . (17.444)
∂y
⇣ ⌘ ⇣ ⌘
Os pontos críticos desta função são (0, 0), p12 , 0 e p1 , 0 . Se anali-
2
sarmos o gráfico da função podemos observar que a origem é um ponto de sela
enquanto os demais pontos são máximos locais.
576 Funções reais de várias variáveis

Exemplo 17.97.
Seja agora a função
f (x, y) = x3 3xy2 , (17.445)
que é um polinômio e, como tal, diferenciável no R2 . O gradiente desta função é
~— f = 3x2 3y2 , 6xy . (17.446)
Procurando pelos pontos em que o gradiente é nulo temos
∂f
= 0 =) 3x2 3y2 = 0 =) x2 = y2 =) x = ±y . (17.447)
∂x

∂f
= 0 =) 6xy = 0 =) x = 0 ou y = 0 . (17.448)
∂y
Substituindo x = ±y na equação 6xy = 0 temos
±6y2 = 0 =) y = 0 . (17.449)
O único ponto em que o gradiente é nulo é a origem. Queremos agora determinar
se este ponto é um máximo local, mínimo local ou ponto de sela. Podemos clas-
sificar este ponto analisando as curvas de nível. Seja k = 0. As curvas deste nível
são
p
f (x, y) = 0 =) x3 3xy2 = 0 =) x x2 3y2 = 0 =) x = 0 ou x = ± 3y .
(17.450)
A curva de nível f (x, y) = 0 é um conjunto de três retas que interceptam a origem.
Estas curvas de nível separam regiões em que f (x, y) > 0 e f (x, y) < 0. Como
pode ser observado na figura, qualquer vizinhança da origem contém regiões em
que f (x, y) > f (0, 0) e f (x, y) < f (0, 0), portanto a origem é um ponto de sela.
Exemplo 17.98.
Analisamos agora a função
f (x, y) = 1 x2 , (17.451)
que também é diferenciável no R2 e possui gradiente dado por
~— f = ( 2x, 0) . (17.452)
Qualquer ponto da reta x = 0 é um ponto crítico da função e em cada um destes
pontos a função vale f (x, y) = 1. Como a imagem da função é o intervalo ( •, 1],
todos estes pontos são máximos locais e máximos globais de f .
17.3 Diferenciabilidade 577

Nos três exemplos vistos foi necessário visualizar o gráfico da função, as cur-
vas de nível da superfície ou a imagem da função. Estes procedimentos podem
ser simples no caso de funções de duas variáveis, mas não são adequados para
funções de três ou mais variáveis. Precisamos de um critério melhor para estudar
tais funções ou para analisar os máximos e mínimos a partir de um algoritmo.
Assim como no caso de funções reais de uma única variável, o critério para
classificar os pontos críticos da função envolve a segunda derivada de f . Vimos
já que pela aproximação de Taylor de segunda ordem podemos aproximar o valor
da função na vizinhança do ponto crítico~r 0 por

~ r + 1 D~r T H[ f (~r 0 )]D~r + E3 (D~r ) , (17.453)


f (~r 0 + D~r ) = f (~r 0 ) + ~— f (~r 0 ) · D~
2
onde H[ f ] é a matriz hessiana e o erro tende a zero como uma função cúbica do
argumento D~r .
Se ~r 0 é um ponto crítico, o gradiente é nulo. Então em torno deste ponto
podemos escrever

1
f (~r 0 + D~r ) f (~r 0 ) = D~r T H[ f (~r 0 )]D~r + E(D~r ) . (17.454)
2
Como o erro tende a zero mais rápido que a forma quadrática, podemos determinar
se o ponto crítico é um máximo local, um mínimo local ou um ponto de sela pelo
sinal da forma quadrática.

Teorema 17.16.
Seja Q(~r ) uma forma quadrática associada à matriz real simétrica A, isto é,

Q(~r ) =~r T A~r . (17.455)

Então

(a) Q(~r ) > 0 para todo ~r 6= 0 se e somente se todos os autovalores de A são


positivos;

(b) Q(~r ) < 0 para todo ~r 6= 0 se e somente se todos os autovalores de A são


negativos.

Demonstração.
A demonstração deste teorema é feita no curso de Álgebra Linear.

Este teorema é utilizado para provar a seguinte condição suficiente.


578 Funções reais de várias variáveis

Teorema 17.17.
Seja f uma função de classe C3 num conjunto aberto que contém o ponto
crítico ~r 0 . Seja H[ f (~r 0 )] a matriz hessiana de f calculada no ponto crítico ~r 0
com autovalores não nulos. Então:
(a) ~r 0 é um mínimo local de f se todos os autovalores de H[ f (~r 0 )] forem posi-
tivos;
(b) ~r 0 é um máximo local de f se todos os autovalores de H[ f (~r 0 )] forem ne-
gativos;
(c) ~r 0 é um ponto de sela de f se H[ f (~r 0 )] tiver algum autovalor negativo e
algum autovalor positivo.
Demonstração.
Consideramos o caso bidimensional por simplicidade. Como já visto, o erro da
aproximação de Taylor de segunda ordem é uma função cúbica dos incrementos
Dx e Dy na forma
E(Dx, Dy) = ADx3 + BDx2 Dy +CDxDy2 + DDy3 , (17.456)
onde os termos A, B, C e D são múltiplos das derivadas parciais de terceira ordem
de f calculadas em~r 0 . Podemos escrever este erro como uma forma quadrática
✓ ◆✓ ◆
exx exy Dx
E(Dx, Dy) = Dx Dy (17.457)
eyx eyy Dy
onde cada elemento desta matriz associada ao erro tende a zero quando D~r tende
a zero.
Sejam l1 e l2 os autovalores da matriz hessiana H[ f (~r 0 )], que são positivos
no caso (a). Seja h o menor de todos estes autovalores. Para qualquer u < h posi-
tivo os números reais (l1 u) e (l2 u) são autovalores da matriz real simétrica
H[ f (~r 0 )] u11. Portanto a forma quadrática D~r T [H[ f (~r 0 )] u11] D~r é positiva
para todo D~r 6= 0, o que implica
D~r T H[ f (~r 0 )]D~r > D~r T [u11] D~r = u kD~r k2 . (17.458)
Em particular, se escolhermos u = h2 ,
h
D~r T H[ f (~r 0 )]D~r >= kD~r k2 . (17.459)
2
Seja E a matriz de erros associada à forma quadrática (17.457). Como a matriz de
erros tende a zero, existe um d > 0 tal que
h
D~r T ED~r < kD~r k2 sempre que 0 < kD~r k < d , (17.460)
2
17.3 Diferenciabilidade 579

o que implica

D~r T H[ f (~r 0 )]D~r > D~r T ED~r (17.461)

nesta vizinhança, onde também podemos escrever

f (~r 0 + D~r ) f (~r 0 ) = D~r T H[ f (~r 0 )]D~r D~r T ED~r > 0 , (17.462)

o que por sua vez implica

f (~r 0 + D~r ) > f (~r 0 ) sempre que 0 < kD~r k < d , (17.463)

provando assim que~r 0 é um mínimo local se todos os autovalores são positivos.


A demonstração do caso (b) é análoga e pode também ser obtida aplicando a
demonstração feita para o caso (a) na função g(~r ) = f (~r ).
Para o caso (c), suponha que os autovalores l1 e l2 possuem sinais opos-
tos. Seja h = min {|l1 |, |l2 |} e u tal que 0 < u < h. Os números reais (l1
u) e (l2 u) são autovalores da matriz H[ f (~r 0 )] u11 ainda com sinais opos-
tos. Se D~r aponta na direção autovetor associado ao autovalor positivo, então
D~r T [H[ f (~r 0 )] u11] D~r > 0, enquanto se D~r aponta na direção do autovetor as-
sociado ao autovalor negativo, D~r T [H[ f (~r 0 )] u11] D~r < 0. Qualquer vizinhança
de ~r 0 contém pontos em que D~r aponta na direção de qualquer autovetor. Pelo
mesmo argumento utilizado para demonstrar o item (a), qualquer vizinhança de~r 0
contém pontos em que f (~r 0 + D~r ) > f (~r 0 ) e outros pontos em que f (~r 0 + D~r ) <
f (~r 0 ), mostrando assim que se trata de um ponto de sela.
O caso em que algum autovalor é nulo deve ser analisado com uma aproxima-
ção de Taylor de ordem mais alta.

Apesar de ser necessário o formalismo de autovalores e autovetores para o


caso de funções de n variáveis, no caso bidimensional é possível deduzir um al-
goritmo que dispensa este formalismo.
Teorema 17.18.
Seja f : R2 ! R uma função de classe C3 em uma região aberta A. Seja ~r 0
um ponto crítico de f contido em A e seja D = det (H[ f (~r 0 )]). Então
(a) Se D < 0,~r 0 é um ponto de sela de f ;
∂2 f
(b) Se D > 0 e (x , y ) > 0,~r 0
∂x2 0 0
é um mínimo local de f ;
∂2 f
(c) Se D > 0 e (x , y ) < 0,~r 0
∂x2 0 0
é um máximo local de f ;

(d) Se D = 0, este critério é inconclusivo.


580 Funções reais de várias variáveis

Demonstração.
Os autovalores da matriz hessiana são soluções do polinômio característico

det (H[ f (~r 0 )] l11) , (17.464)

que no caso de funções de duas variáveis é o polinômio de segundo grau

l2 tl + D = 0 , (17.465)

onde t é o traço da matriz hessiana e D o seu determinante. Os autovalores l1 e


l2 devem satisfazer

l1 + l2 = t e l1 · l2 = D . (17.466)

Se D < 0 os autovalores possuem sinais opostos e o ponto (x0 , y0 ) é um ponto de


sela, provando assim o item (a).
Se D > 0 os autovalores possuem o mesmo sinal, mas ainda dependemos de
outro critério para determinar qual é este sinal. Como o determinanto é positivo,
✓ ◆✓ 2 ◆ ✓ 2 ◆2
∂2 f ∂ f ∂ f
(x0 , y0 ) (x0 , y0 ) > (x0 , y0 ) > 0 , (17.467)
∂x2 ∂y2 ∂x∂y
2 2
portanto as derivadas ∂∂x2f (x0 , y0 ) e ∂∂y2f (x0 , y0 ) possuem o mesmo sinal, que será
o sinal do traço t, que deve ser também o sinal dos autovalores l1 e l2 . Então o
2
sinal da derivada ∂∂x2f (x0 , y0 ) determina se o ponto é um máximo ou mínimo local.
Para provar o item (d), basta encontrar um máximo local e um ponto de sela
que satisfazem D = 0, o que será mostrado nos dois exemplos a seguir.
Exemplo 17.99.
No caso da função

f (x, y) = x3 3xy2 , (17.468)

vimos que a origem é um ponto de sela. A matriz hessiana desta função é


✓ ◆
6x 6y
H( f ) = (17.469)
6y 6x

que é uma matriz nula na origem que obviamente possui determinante nulo.
Exemplo 17.100.
No caso da função

f (x, y) = 1 x2 , (17.470)
17.3 Diferenciabilidade 581

todo ponto com coordenada x nula é um máximo local. A matriz hessiana desta
função é
✓ ◆
2 0
H( f ) = (17.471)
0 0

que também possui determinante nulo.

Agora podemos revisitar alguns exemplos vistos e classificá-los pelo traço e


determinante da matriz hessiana.

Exemplo 17.101.
Seja a sela de cavalo

f (x, y) = xy , (17.472)

que é uma função de classe C3 no R2 com gradiente

~— f (x, y) = (y, x) . (17.473)

Obviamente o único ponto crítico é a origem. A matriz hessiana vale


✓ ◆
0 1
H( f ) = (17.474)
1 0

que possui determinante D = 1. Portanto o ponto crítico da sela de cavalo é um


ponto de sela.

Exemplo 17.102.
Voltamos à função

f (x, y) = 1 + x2 x4 y2 , (17.475)

que por ser um polinômio é de classe C3 no R2 . O gradiente vale

~— f (x, y) = 2x 4x3 , 2y . (17.476)


⇣ ⌘ ⇣ ⌘
Os pontos críticos da função (0, 0), p12 , 0 e p1 , 0 determinamos sua natu-
2
reza pelo gráfico da função.
Agora queremos calcular a matriz hessiana em cada um destes pontos.
✓ ◆
2 12x2 0
H( f ) = . (17.477)
0 2
582 Funções reais de várias variáveis

No ponto~r 0 = (0, 0),


✓ ◆
2 0
H( f ) = (17.478)
0 2
e D = 4, portanto a ⇣origem é⌘um ponto de sela.
Nos pontos~r 0 = ± p12 , 0 temos
✓ ◆
4 0
H( f ) = . (17.479)
0 2
∂2 f
Neste caso D = 8 que é positivo. Além disso ∂x2
= 4 < 0, portanto estes pontos
são máximos locais.
Exemplo 17.103.
Seja agora

f (x, y) = x4 + y4 4xy + 4 . (17.480)

O gradiente desta função é


~— f = 4x3 4y, 4y3 4x . (17.481)

Os pontos críticos são soluções do sistema de equações


4x3 4y = 0 y = x3
=) (17.482)
4y3 4x = 0 x = y3
Substituindo a primeira equação na segunda temos
x = x9 =) x9 x = 0 =) x(x8 1) = 0 =) x(x4 1)(x4 + 1) = 0
=) x(x2 1)(x2 + 1)(x4 + 1) = 0 =) x(x 1)(x + 1)(x2 + 1)(x4 + 1) = 0
cujas soluções são apenas
x=0 y = 03 = 0
x = 1 =) y = 13 = 1 (17.483)
x= 1 y = ( 1)3 = 1
Existem três pontos críticos desta função.

(x0 , y0 ) = (0, 0) , (x1 , y1 ) = (1, 1) e (x2 , y2 ) = ( 1, 1) . (17.484)

A matriz hessiana é
✓ ◆
12x2 4
H[ f (x, y)] = (17.485)
4 12y2
17.3 Diferenciabilidade 583

No primeiro ponto crítico temos


✓ ◆
0 4
H[ f (0, 0)] = =) D = 16 (17.486)
4 0

e portanto este ponto crítico é um ponto de sela.


No segundo ponto crítico
✓ ◆
12 4 ∂2 f
H[ f (1, 1)] = =) D = 144 16 = 128 > 0 e (1, 1) = 12 > 0
4 12 ∂x2
(17.487)

e assim este ponto crítico é um mínimo local.


Por fim, no terceiro ponto temos que
✓ ◆
12 4
H[ f ( 1, 1)] = =) D = 144 16 = 128 > 0 (17.488)
4 12
e
∂2 f
( 1, 1) = 12 > 0 (17.489)
∂x2
e assim como o ponto anterior este ponto crítico é um mínimo local.
584 Funções reais de várias variáveis

17.3.12 Multiplicadores de Lagrange


Algumas aplicações do problema de máximos e mínimos de uma função en-
volve encontrar qual ponto de um subconjunto do Rn maximiza ou minimiza uma
certa função. Por exemplo, se quisermos calcular o máximo e o mínimo em um
conjunto fechado, devemos procurar os máximos e mínimos no interior do con-
junto pelos pontos em que o gradiante se anula além de procurar os valores máxi-
mos e mínimos na fronteira deste conjunto.

Exemplo 17.104.
Seja f (x, y) = 3x + 2y definida no domínio Q = [0, 1] ⇥ [0, 2]. Este domínio é
fechado, então pelo teorema de Weierstrass, existe um máximo global de f (x, y)
em Q assim como um mínimo global. Se estes pontos estiverem no interior do
retângulo, que é uma região aberta, então ~— f (x, y) = (0, 0) nestes pontos. Mas no
caso desta função, ~— f (x, y) = (3, 2) para qualquer ponto do interior de Q. Então
não existem pontos de máximo ou mínimo no interior do retângulo. O máximo
e o mínimo global, cuja existência é garantida pelo teorema de Weierstrass, deve
então estar na fronteira do retângulo.

Exemplo 17.105.
Imagine por exemplo que conhecemos a função temperatura T (x, y, z) no con-
junto S = (x, y, z) 2 R3 | x2 + y2 + z2  a2 , que é um conjunto fechado. Além
de procurar os pontos em que o gradiente é nulo no interior da esfera, devemos
procurar por máximos e mínimos na p esfera em si. Se representamos o hemisfé-
rio norte pela equação z = f (x, y) = a2 x2 y2 , podemos definir a composi-
ção t(x, y) = T (x, y, f (x, y)) e calcular os máximos e mínimos desta função pelos
métodos já conhecidos. No entanto pode ser mais prático trabalhar com a repre-
sentação implícita da esfera x2 + y2 + z2 = a2 , que é capaz de descrever a esfera
inteira.

As fronteiras de interesse geométrico que iremos tratar são curvas no R2 , su-


perfícies no R3 e curvas no R3 .
Caso 1: Curvas no R2
Seja f uma função diferenciável em um conjunto aberto A que contém uma
curva C representada implicitamente por g(x, y) = 0. Se f é diferenciável, suas
curvas de nível são linhas contínuas. Seja (x0 , y0 ) um máximo local de f (x, y)
em C. Por definição existe uma bola aberta centrada em (x0 , y0 ) tal que f (x, y) 
f (x0 , y0 ). Suponha que o máximo ocorre apenas em um ponto, isto é, que f (x, y) <
f (x0 , y0 ) se (x, y) 6= (x0 , y0 ). Neste caso a curva de nível f (x, y) = f (x0 , y0 ) inter-
cepta a curva C em apenas um ponto.
17.3 Diferenciabilidade 585

Como o vetor gradiente é perpendicular às curvas de nível, os vetores ~— f (x0 , y0 )


e ~— g(x0 , y0 ) são linearmente independentes. Se ~— f (x0 , y0 ) 6= ~0 e ~— f (x0 , y0 ) 6= ~0 ,
então existe um número real não nulo l tal que
~— f (x0 , y0 ) = l · ~— g(x0 , y0 ) . (17.490)
Este número real l é chamado de multiplicador de Lagrange. A equação (17.490)
consiste de duas equações independentes, uma para cada componente do gradi-
ente. Com o vínculo g(x0 , y0 ) = 0 temos um sistema de três equações e três
incógnitas x0 , y0 e l. Como o máximo local é solução deste sistema, podemos
encontrar candidatos a máximos globais e mínimos globais resolvendo o sistema
de equações
~— f (x0 , y0 ) = l · ~— g(x0 , y0 ) e g(x0 , y0 ) = 0 . (17.491)
Se o número de soluções for finito, podemos comparar o valor de f (x, y) em cada
um destes pontos para encontrar o máximo global e o mínimo global. Este proce-
dimento é justificado de maneira mais rigorosa pelo seguinte teorema.
Teorema 17.19.
Seja f : R2 ! R um campo escalar diferenciável em um conjunto aberto A que
contém uma curva C representada implicitamente por g(x, y) = 0 com ~— g(x, y) 6=
(0, 0) em cada ponto (x, y) 2 C. Um ponto (x0 , y0 ) 2 C é um máximo local ou
mínimo local de f (x, y) em C somente se existir um número real l tal que
~— f (x0 , y0 ) = l · ~— g(x0 , y0 ) . (17.492)
Demonstração. Se (x0 , y0 ) é um máximo local de f em C, existe uma bola aberta
B tal que f (x, y)  f (x0 , y0 ) para todo (x, y) 2 B \C. Então existe uma parametri-
zação de C dada por ~r (t) tal que ~r (t0 ) = (x0 , y0 ), ~r 0 (t) 6= ~0 e g(~r (t)) = 0, com a
composição g(~r (t)) diferenciável em um intervalo que contém t0 .
Como g(~r (t)) = 0 e (x0 , y0 ) é um máximo local de f (x, y) em C, então t0 é um
máximo local da composição f (~r (t)), ou seja,
d ~— f (x0 , y0 ) ·~r 0 (t0 ) = 0 .
[ f (~r (t))] =) (17.493)
dt t=t0
A equação g(~r (t)) = 0 implica
~— g(~r (t)) ·~r 0 (t) = 0 (17.494)
em todo t e em particular em t = t0 . Então tanto ~— f (x0 , y0 ) quanto ~— g(x0 , y0 ) são
perpendiculares a ~r 0 (t0 ). Como o gradiente de g é não nulo, existe um número
real l tal que
~— f (x0 , y0 ) = l · ~— g(x0 , y0 ) . (17.495)
586 Funções reais de várias variáveis

Exemplo 17.106.
Queremos encontrar o valor máximo e o valor mínimo da função
f (x, y) = ax + by (17.496)
sob o vínculo x2 + y2 = 1.
O gráfico desta função é um plano inclinado. O vínculo x2 + y2 = 1, que é
uma circunferência no domínio, define uma elipse inclinada que é a interseção do
plano inclinado com o cilindro x2 + y2 = 1. Neste exemplo temos
~— f (x, y) = (a, b) e ~— g(x, y) = (2x, 2y) . (17.497)
O gradiente de g é nulo apenas na origem, mas não em pontos da curva C. Assim
~— f (x, y) = l · ~— g(x, y) =) (a, b) = (2lx, 2ly) , (17.498)
de onde escrevemos
a b
x= e y= . (17.499)
2l 2l
Podemos determinar o valor de l substituindo estes valores de x e y no vínculo
x2 + y2 = 1, resultando em
p
a2 b2 a2 + b2
+ = 1 =) l = ± . (17.500)
4l2 4l2 2
Cada sinal nos dá um ponto crítico. O primeiro deles é
✓ ◆ ✓ ◆
a b a b
(x0 , y0 ) = , = p ,p (17.501)
2l 2l a2 + b2 a2 + b2
e o segundo é
✓ ◆
a b
(x1 , y1 ) = p , p . (17.502)
a2 + b2 a2 + b2
Testando o valor da função nestes dois pontos temos
a2 b2
f (x0 , y0 ) = ax0 + by0 = p +p >0 (17.503)
a2 + b2 a2 + b2
e
a2 b2
f (x1 , y1 ) = ax1 + by1 = p p <0. (17.504)
a2 + b2 a2 + b2
Portanto (x0 , y0 ) é o máximo global de f (x, y) na curva C enquanto (x1 , y1 ) é o
mínimo global de f (x, y) na curva C.
17.3 Diferenciabilidade 587

Exemplo 17.107.
Seja agora

f (x, y) = x2 + y2 (17.505)

e queremos encontrar o valor mínimo desta função sob a condição

ax + by = c , (17.506)

o que geometricamente significa encontrar o ponto da reta ax + by = c mais pró-


ximo da origem. Neste caso

~— f (x, y) = (2x, 2y) e ~— g(x, y) = (a, b) . (17.507)

O gradiente de g é sempre não nulo. O sistema a ser resolvido é

~— f (x, y) = l~— g(x, y) =) (2x, 2y) = (la, lb) . =) x = la e y = lb . (17.508)


2 2
Substituindo no vínculo ax + by = c temos

la2 lb2 2c
+ = c =) l = 2 . (17.509)
2 2 a + b2
Só existe um ponto crítico com coordenadas
ac bc
x= e y= (17.510)
a2 + b2 a2 + b2
que são as coordenadas do ponto da reta em questão mais próximo da origem.

Caso 2: Superfícies no R3
Este problema é análogo ao caso de curvas do R2 por envolver apenas um
vínculo. Seja f : R3 ! R uma função diferenciável em uma região aberta que
contém a superfície representada implicitamente pelo vínculo g(x, y, z) = 0.
No caso bidimensional vimos que a curva g(x, y) = 0 intercepta a curva de
nível f (x, y) = f (x0 , y0 ) apenas no ponto crítico (x0 , y0 ). No caso de funções de
três variáveis temos uma superfície de nível f (x, y, z) = f (x0 , y0 , z0 ).
Seja por exemplo a transformação linear f (x, y, z) = ax + by + cz. As superfí-
cies de nível desta função são planos paralelos. Se g(x, y, z) = 0 representa uma
esfera, como no caso g(x, y, z) = x2 + y2 + z2 R2 , a interseção da esfera com al-
guma superfície de nível pode ser uma circunferência, pode ser vazia ou pode ser
apenas um ponto. Nos casos em que a interseção é apenas um ponto há um ponto
588 Funções reais de várias variáveis

crítico da função f (x, y, z) na esfera g(x, y, z) = 0. Além disso nestes pontos a su-
perfície de nível é o plano tangente à esfera no ponto crítico, portanto as equações

~— f (~r 0 ) · (~r ~r 0 ) = 0 e ~— g(~r 0 ) · (~r ~r 0 ) = 0 (17.511)

representam o mesmo plano, o que implica que os vetores ~— f (~r 0 ) e ~— g(~r 0 ) são
linearmente independentes. Se ambos os gradientes são não nulos existe algum l
diferente de zero tal que
~— f (~r 0 ) = l~— g(~r 0 ) , (17.512)

também conhecido como multiplicador de Lagrange.

Teorema 17.20.
Seja f : R3 ! R um campo escalar diferenciável em um conjunto aberto A
que contém uma superfície S representada implicitamente por g(x, y, z) = 0 com
~— g(~r ) 6= ~0 em cada ponto de S. Um ponto ~r 0 é um máximo ou mínimo local de
f (~r ) na superfície S somente se existir um número real l tal que

~— f (~r 0 ) = l~— g(~r 0 ) . (17.513)

Demonstração.
Seja C uma curva contida na superfície S parametrizada por~r (t). Como C está
contida em S, a composição g(~r (t)) = 0.
Seja ~r 0 um máximo local de f (~r ) em S. Logo existe uma bola aberta B cen-
trada em~r 0 tal que

f (~r )  f (~r0 ) sempre que ~r 2 S \ B . (17.514)

Se a curva C passa por ~r 0 em t = t0 , então t0 é um máximo local da composição


f (~r (t)). Pelo teorema de Fermat,

d ~— f (~r 0 ) ·~r 0 (t0 ) = 0 .


f (~r (t)) =0 =) (17.515)
dt t=t0

A equação g(~r (t)) = 0 para todo t implica que a derivada desta função é também
sempre nula, ou seja,
~— g(~r 0 ) ·~r 0 (t0 ) = 0 . (17.516)

O vetor ~r 0 (t0 ) pertence ao plano tangente à superfície S em ~r 0 , que é um espaço


de duas dimensões. Como ~— f (~r 0 ) ·~r 0 (t0 ) = 0 para qualquer vetor neste plano
17.3 Diferenciabilidade 589

tangente, o gradiente de f em ~r 0 é um vetor normal a este plano tangente, assim


como o vetor gradiente de g em~r 0 . Como o gradiente de g é por hipótese sempre
não nulo, existe um número real l tal que
~— f (~r 0 ) = l~— g(~r 0 ) (17.517)

como queríamos demonstrar.

Exemplo 17.108.
Queremos encontrar o ponto pertencente ao plano

ax + by + cz = d (17.518)

mais próximo da origem. Neste caso basta encontrar o ponto pertencente a este
plano que minimiza a função

f (x, y, z) = x2 + y2 + z2 . (17.519)

Neste caso
~— f (x, y, z) = (2x, 2y, 2z) e ~— g(x, y, z) = (a, b, c) . (17.520)

A equação ~— f = l~— g implica


✓ ◆
la lb lc
(2x, 2y, 2z) = l(a, b, c) =) (x, y, z) = , , . (17.521)
2 2 2
Substituindo no vínculo ax + by + cz = d temos

la2 lb2 lc2 2d


+ + =d =) l= . (17.522)
2 2 2 a2 + b2 + c2
O ponto que minimiza a distância à origem é então
✓ ◆
ad bd cd
~r 0 = , , . (17.523)
a2 + b2 + c2 a2 + b2 + c2 a2 + b2 + c2
No caso particular em que d = 0 o plano intercepta a origem, e neste caso obvia-
mente a origem é o ponto do plano com a menor distância até ele.

Caso 3: Curvas no R3
Sejam S1 e S2 duas superfícies contidas no R3 representadas implicitamente
pelos vínculos g1 (x, y, z) = 0 e g2 (x, y, z) = 0, respectivamente. Se os vetores ~— g1
590 Funções reais de várias variáveis

e ~— g2 são linearmente independentes, a interseção destas superfícies (se houver)


define uma curva C expressa por
C = (x, y, z) 2 R3 | g1 (x, y, z) = 0 e g2 (x, y, z) = 0 . (17.524)
Queremos agora encontrar uma condição necessária para que um ponto ~r 0 2 C
seja o máximo ou mínimo local de uma função f (x, y, z) em C. Suponha que
esta função seja diferenciável em uma região aberta que contém a curva C. Seja
~r (t) uma representação paramétrica de C tal que ~r (t0 ) =~r 0 . Se este ponto é um
máximo local, existe uma bola aberta B centrada em ~r 0 tal que f (~r )  f (~r 0 )
sempre que~r 2 C \ B. Desta forma o ponto t0 é um máximo local da composição
f (~r (t)) e pelo teorema de Fermat
d ~— f (~r 0 ) · r0 (t0 ) = 0 .
f (~r (t)) =) (17.525)
dt t=t0

Como a curva C pertence às superfícies S1 e S2 simultaneamente, temos que


g1 (~r (t)) = 0 e g2 (~r (t)) = 0, que possuem derivadas nulas e portanto
~— g1 (~r 0 ) · r0 (t0 ) = 0 e ~— g2 (~r 0 ) · r0 (t0 ) = 0 (17.526)

Se ~r 0 (t0 ) é um vetor não nulo, então os gradientes ~— f (~r 0 ), ~— g1 (~r 0 ) e ~— g2 (~r 0 )


pertencem ao plano ortogonal ao vetor tangente r0 (t0 ) e são, portanto, linearmente
dependentes. Como supostamente os gradientes ~— g1 (~r 0 ) e ~— g2 (~r 0 ) são indepen-
dentes, então escrevemos o gradiente de f como combinação linear dos outros
dois, isto é, existem números reais l1 e l2 tais que
~— f (~r 0 ) = l1~— g1 (~r 0 ) + l2~— g2 (~r 0 ) (17.527)
chamados de multiplicadores de Lagrange. Este raciocínio prova o seguinte teo-
rema.
Teorema 17.21.
Seja f : R3 ! R uma função diferenciável num conjunto aberto A que contém
a curva
C = (x, y, z) 2 R3 | g1 (x, y, z) = 0 e g2 (x, y, z) = 0 , (17.528)
onde g1 e g2 são diferenciáveis em A e
~— g1 (~r ) ⇥ ~— g2 (~r ) 6= ~0 (17.529)
para todo ~r 2 C. Um ponto ~r 0 2 C é um máximo ou mínimo local de f (~r ) em C
somente se existirem números reais l1 e l2 tais que
~— f (~r 0 ) = l1~— g1 (~r 0 ) + l2~— g2 (~r 0 ) . (17.530)
17.3 Diferenciabilidade 591

Exemplo 17.109.
Seja C a interseção do cilindro x2 + y2 = R2 com o plano horizontal z = h.
Queremos encontrar o valor máximo e o valor mínimo da transformação linear

f (x, y, z) = ax + by + cz (17.531)

em C. Os gradientes da função e dos vínculos são

~— f (~r ) = (a, b, c) , ~— g1 (~r ) = (2x, 2y, 0) e ~— g2 (~r ) = (0, 0, 1) . (17.532)

O sistema a ser resolvido é

(a, b, c) = l1 (2x, 2y, 0) + l2 (0, 0, 1) =) (a, b, c) = (2xl1 , 2yl1 , l2 ) . (17.533)

Deste sistema temos que l2 = c, x = 2la 1 e y = 2lb 1 . O vínculo z = h determina a


componente z dos pontos críticos. O vínculo restante x2 + y2 = R2 implica
p
a2 b2 2 a2 + b2
+ = R =) l1 = ± . (17.534)
4l21 4l21 2R

O sinal positivo implica na solução


✓ ◆
aR bR
~r 0 = p ,p ,h (17.535)
a2 + b2 a2 + b2
enquanto o sinal negativo resulta em
✓ ◆
aR bR
~r 1 = p , p ,h . (17.536)
a2 + b2 a2 + b2
Um destes pontos é o máximo de f (~r ) em C enquanto o outro é o mínimo. Cal-
culando a função nestes pontos temos

a2 R b2 R p
f (~r 0 ) = p +p + ch = R a2 + b2 + ch (17.537)
a2 + b2 a2 + b2
e
a2 R b2 R p
f (~r 1 ) = p + p + ch = R a2 + b2 + ch . (17.538)
a2 + b2 a2 + b2
Claramente ~r 0 é o máximo global de f (~r ) em C e ~r 1 é o mínimo global de f (~r )
em C.
592 Funções reais de várias variáveis

17.4 Campos vetoriais


Vimos já que a função que parametriza uma curva no R2 expressa por

~r (t) = (x(t), y(t)) (17.539)

é uma função que a cada t 2 R1 associa um vetor ~r (t) 2 R2 . O elemento ~r (t) é


um vetor e por este motivo chamamos esta função de função vetorial ou campo
vetorial.
Uma função cujo resultado é um número real, ou seja, a imagem é um subcon-
junto da reta real, é chamada de função escalar ou campo escalar
p independente
do número de variáveis. Funções como f (x) = e lx e f (x, y) = a2 x2 y2 são
campos escalares.
Um campo vetorial é qualquer função que independente do argumento associa
um elemento do Rm com m > 1, independente do número de variáveis. Se o
número de variáveis é n, então a função vetorial associa um elemento do Rn a um
elemento do Rm . Como a função é vetorial, denotamos por
~F : Rn ! Rm (17.540)

Exemplo 17.110 (Gradiente).


Seja f (x, y, z) um campo escalar de três variáveis. O gradiente de f é dado por

✓ ◆
~— f = ∂f ∂f ∂f
, , . (17.541)
∂x ∂y ∂z

Cada componente é uma função de três variáveis. Então o gradiente de uma fun-
ção associa a cada elemento do R3 um vetor de três componentes. O gradiente de
uma função de três variáveis é um campo vetorial do R3 no R3 .

Exemplo 17.111 (Campo gravitacional).


O campo gravitacional devido a uma partícula de massa M localizada na ori-
gem do R3 é um campo vetorial dado por
✓ ◆
GMx GMy GMz
~g (x, y, z) = , , .
(x2 + y2 + z2 )3/2 (x2 + y2 + z2 )3/2 (x2 + y2 + z2 )3/2
(17.542)

Diversas grandezas físicas são modeladas por campos vetoriais. Além do


campo gravitacional temos o campo elétrico e o campo magnético estudados no
eletromagnetismo e também o campo de velocidades de um fluido como estudado
na mecânica de fluidos.
17.4 Campos vetoriais 593

17.4.1 Domínio de campos vetoriais


O domínio de um campo vetorial pode ser limitado a uma região escolhida.
Por exemplo, se estamos estudando o movimento de um fluido numa piscina re-
tangular, o domínio do campo vetorial é

D f = [a, b] ⇥ [c, d] ⇥ [e, f ] (17.543)

que é um paralelepípedo fechado que representa a piscina que contém o fluido.

Exemplo 17.112.
Se o domínio for restringido pelos pontos em que o campo vetorial pode ser
calculado, podemos analisar cada componente como um campo escalar indepen-
dente e definir o domínio do campo vetorial como a interseção dos domínios de
cada componente. Seja por exemplo
⇣ p ⌘
~F (x, y) = log(x2 + y2 1), 4 x2 y2 . (17.544)

A componente x deste campo vetorial é a função escalar

P(x, y) = log(x2 + y2 1) (17.545)

enquanto a componente y é a função escalar


p
Q(x, y) = 4 x2 y2 . (17.546)

O domínio da função P é o exterior do disco de raio 1, isto é,

DP = (x, y) 2 R2 | x2 + y2 > 1 (17.547)

enquanto o domínio de Q é o interior e a fronteira do disco de raio 2, isto é,

DQ = (x, y) 2 R2 | x2 + y2  4 . (17.548)

O domínio DP é um conjunto aberto. O domínio DQ é um conjunto fechado. O


domínio do campo vetorial ~F é o conjunto de pontos em que ambas as funções
podem ser calculadas, ou seja, a interseção destes domínios

D~F = DP \ DQ , (17.549)

que é um conjunto que não é aberto e nem é fechado.


594 Funções reais de várias variáveis

17.4.2 Limite e continuidade de campos vetoriais


A definição de limite e continuidade de campos vetoriais segue a mesma lin-
guagem já usada desde limites de funções reais de uma variável, modificando
apenas a definição de vizinhança. Seja ~F : Rn ! Rm e ~L 2 Rm . Dizemos que o li-
mite de ~F (~r ) quando~r tende a~r 0 vale ~L se ~F (~r ) estiver arbitrariamente próximo
de ~L se~r estiver suficientemente próximo de~r 0 .
Se~r e~r 0 são elementos do Rn , a vizinhança de~r 0 é uma bola aberta expressa
por k~r ~r 0 k < d. Se ~F (~r ) e ~L são elementos do Rm , vizinhança de ~L é também
uma bola aberta expressa por ~F (~r ) ~L < e. Com estas expressões definimos
o conceito de limite da seguinte maneira.
Definição 17.24.
Dizemos que
lim ~F (~r ) = ~L (17.550)
~r !~r 0

se para todo e > 0 existir algum d > 0 tal que


~F (~r ) ~L < e sempre que k~r ~r 0 k < d . (17.551)

Dada esta definição é possível mostrar que

lim ~F (~r ) = ~L se e somente se lim ~F (~r ) ~L = 0 (17.552)


~r !~r 0 ~r !~r 0

além das seguintes propriedades, cujas demonstrações são idênticas ao caso de


funções vetoriais uniparamétricas.
Teorema 17.22.
Se
lim ~F (~r ) = L~1 e ~ (~r ) = L~2 ,
lim G (17.553)
~r !~r 0 ~r !~r 0

então
h i h i
~ (~r ) = L~1 + L~2
lim ~F (~r ) + G e ~ (~r ) = L~1 · L~2 . (17.554)
lim ~F (~r ) · G
~r !~r 0 ~r !~r 0

Definição 17.25.
Dizemos que o campo vetorial ~F (~r ) é contínuo em~r 0 se ~F (~r 0 ) existe e se
lim ~F (~r ) = ~F (~r 0 ) . (17.555)
~r !~r 0

Dizemos que o campo vetorial é contínuo em um conjunto S se for contínuo em


cada ponto de S.
17.4 Campos vetoriais 595

Funções contínuas possuem diversas propriedades importantes, como a pro-


priedade a seguir.
Teorema 17.23.
Sejam ~F : Rn ! Rm e G ~ : R p ! Rn campos vetoriais. Se G ~ (~r ) é contínuo
⇣ ⌘
~ (~r 0 ), então a composição ~F G
em ~r 0 e ~F (~u ) é contínua em ~u 0 = G ~ (~r ) é um
campo vetorial contínuo em~r 0 .
Demonstração. ⇣ ⌘
Seja H~ (~r ) = ~F G~ (~r ) . Queremos provar que para todo e > 0 existe algum
d > 0 tal que

~ (~r )
H ~ (~r 0 ) < e
H sempre que k~r ~r 0 k < d . (17.556)

Sabemos que para todo e > 0 existe algum d1 > 0 tal que

~F (~u ) ~F (~u 0 ) < e sempre que k~u ~u 0 k < d1 . (17.557)

~ (~r ) e ~u 0 = G
Escrevendo ~u = G ~ (~r 0 ) escrevemos a condição acima como

~ (~r ))
~F (G ~ (~r 0 ) < e
~F (G sempre que ~ (~r
G ~ (~r 0 < d1 . (17.558)
G

~ sabemos que para este d1 > 0 existe algum


Pela continuidade do campo vetorial G
d > 0 tal que

~ (~r )
G ~ (~r 0 ) < d1
G sempre que k~r ~r 0 k < d . (17.559)

Então

k~r ~r 0 k < d =) G
~ (~r ) ~ (~r 0 ) < d1 =) ~F (G
G ~ (~r )) ~ (~r 0 ) < e ,
~F (G
(17.560)

o que prova o teorema.

17.4.3 Diferenciabilidade de campos vetoriais


Um campo vetorial ~F : Rn ! Rm é diferenciável num ponto ~r 0 se cada com-
ponente for uma função diferenciável. No caso de funções vetoriais de três com-
ponentes e três variáveis, podemos escrever
~F (x, y, z) = (P(x, y, z), Q(x, y, z), R(x, y, z)) . (17.561)
596 Funções reais de várias variáveis

No ponto~r =~r 0 + D~r temos


~F (~r 0 + D~r ) = (P(~r 0 + D~r ), Q(~r 0 + D~r ), R(~r 0 + D~r )) . (17.562)
Se cada uma das funções P, Q e R é diferenciável em (x0 , y0 , z0 ) podemos escrever
~F (x0 + Dx, y0 + Dy, z0 + Dz) = (17.563)

∂P ∂P ∂P
P(~r 0 ) + (~r 0 )Dx + (~r 0 )Dy + (~r 0 )Dz + ePx Dx + ePy Dy + ePz Dz ,
∂x ∂y ∂z
∂Q ∂Q ∂Q
Q(~r 0 ) + (~r 0 )Dx + (~r 0 )Dy + (~r 0 )Dz + eQx Dx + eQy Dy + eQz Dz ,
∂x ∂y ∂z

∂R ∂R ∂R
R(~r 0 ) + (~r 0 )Dx + (~r 0 )Dy + (~r 0 )Dz + eRx Dx + eRy Dy + eRz Dz
∂x ∂y ∂z
que podemos escrever como a soma de três vetores
~F (x0 + Dx, y0 + Dy, z0 + Dz) = (P(x0 , y0 , z0 ), Q(x0 , y0 , z0 ), R(x0 , y0 , z0 ))
✓ ◆
∂P ∂P ∂P ∂Q ∂Q ∂Q ∂R ∂R ∂R
+ Dx + Dy + Dz , Dx + Dy + Dz , Dx + Dy + Dz
∂x ∂y ∂z ∂x ∂y ∂z ∂x ∂y ∂z
+ (ePx Dx + ePy Dy + ePz Dz , eQx Dx + eQy Dy + eQz Dz , eRx Dx + eRy Dy + eRz Dz)
Esta última equação pode ser escrita numa forma matricial
0 1 0 1 0 ∂P ∂P ∂P 1 0 1
P(~r 0 + Dr) P(~r 0 ) ∂x ∂y ∂z Dx
@ Q(~r 0 + Dr) A = @ Q(~r 0 ) A + B ∂Q ∂Q ∂Q C
@ ∂x ∂y ∂z A @ Dy A
R(~r 0 + Dr) R(~r 0 ) ∂R ∂R ∂R Dz
∂x ∂y ∂z
0 10 1
ePx ePy ePz Dx
+ @ eQx eQy eQz A @ Dy A . (17.564)
eRx eRy eRz Dz
A primeira matriz que aparece na equação anterior contém derivadas parciais das
componentes do compo vetorial ~F calculadas no ponto~r 0 . Esta matriz é chamada
de matriz jacobiana do campo vetorial ~F ,
0 ∂P ∂P ∂P 1
∂x ∂y ∂z
B ∂Q ∂Q ∂Q C
J(~F ) = @ ∂x ∂y ∂z A. (17.565)
∂R ∂R ∂R
∂x ∂y ∂z

A segunda matriz é uma matriz de erros que deve tender a zero quando D~r tende
a zero para que o campo vetorial seja diferenciável.
0 1
ePx ePy ePz
E = @ eQx eQy eQz A . (17.566)
eRx eRy eRz
17.4 Campos vetoriais 597

Definição 17.26.
Dizemos que o campo vetorial ~F : Rn ! Rm é diferenciável no ponto ~r 0 se
existir uma matriz de erros E tal que
h i
~F (~r 0 + Dr) = ~F (~r 0 ) + J ~F (~r 0 ) D~r + ED~r (17.567)

com a matriz de erros tendendo à matriz nula quando o incremento D~r tende a
zero.
O número de linhas da matriz jacobiana é igual ao número de componentes
do campo vetorial. O número de colunas é igual ao número de variáveis das quais
o campo vetorial depende (ou o número de componentes da variável vetorial ~r ).
Estes números não precisam ser iguais.
No caso particular em que ~F só possui uma componente, a matriz jacobiana
é o gradiente desta única componente de ~F . Podemos observar também que cada
linha da matriz jacobiana é o gradiente de alguma componente de ~F .
Exemplo 17.113 (Função identidade).
A função identidade é uma função ~F : Rn ! Rn tal que
~F (~r ) =~r (17.568)
para todo ~r 2 Rn . Em duas dimensões a função identidade é a transformação
linear
~F (x, y) = (x, y) . (17.569)
O jacobiano desta transformação é
! ✓ ◆
∂ ∂
∂x x ∂y x 1 0
J(~F ) = ∂ ∂ = . (17.570)
∂x y ∂y y
0 1

Mesmo em um número de dimensões arbitrário a matriz jacobiana da função iden-


tidade é a matriz identidade.
Exemplo 17.114 (Rotação em duas dimensões).
Seja ~F : R2 ! R2 uma função que associa a cada vetor ~r = (x, y) a rotação
deste vetor por um ângulo q em torno da origem. Neste caso
~F (x, y) = (x · cos(q) y sen(q), x sen(q) + y cos(q)) . (17.571)
A matriz jacobiana desta função é
✓ ◆
~ cos(q) sen(q)
J(F ) = , (17.572)
sen(q) cos(q)
que é a matriz de rotação em duas dimensões.
598 Funções reais de várias variáveis

Teorema 17.24 (Regra da cadeia).


Seja G ~ : R p ! Rn um campo vetorial diferenciável em ~r 0 2 R p e seja ~F :
Rn⇣! Rm⌘um campo vetorial diferenciável em ~u 0 = G ~ (~r 0 ). Então a composição
~F G ~ (~r ) é um campo vetorial diferenciável em~r 0 e o jacobiano da composição
~ ).
é o produto das matrizes jacobianas J(~F ) e J(G
Demonstração. ⇣ ⌘
~ ~
Seja H(~r ) a composição F G (~r ) . Queremos escrever

H(~r 0 + Dr) = H(~r 0 ) + J(H


~ (~r 0 ))D~r + EH D~r (17.573)

onde a matriz EH tende à matriz nula quando Dr tende a zero. De acordo com a
composição,
⇣ ⌘
H(~r 0 + Dr) = ~F G~ (~r 0 + D~r ) . (17.574)

Como G ~ é diferenciável em~r 0 , existe uma matriz de erros EG que tende à matriz
nula quando D~r tende ao vetor nulo tal que
⇣ ⌘
H(~r 0 + Dr) = ~F G ~ (~r 0 )]D~r + EG Dr .
~ (~r 0 ) + J[G (17.575)

~ (~r 0 ) e D~u = J[G


Escrevendo ~u 0 = G ~ (~r 0 )]D~r + EG Dr temos

H(~r 0 + Dr) = ~F (~u 0 + D~u ) . (17.576)

Como ~F é diferenciável em u0 existe uma matriz EF que tende à matriz nula


quando Du tende ao vetor nulo tal que

H(~r 0 + Dr) = ~F (~u 0 ) + J[~F (~u 0 )]D~u + EF D~u . (17.577)

Substituindo ~u 0 e D~u em termos de G ~ e D~r temos


⇣ ⌘ ⇣ ⌘
H(~r 0 + Dr) = ~F G ~ (~r 0 ) + J[~F (G ~ (~r 0 )]D~r + EG Dr
~ (~r 0 ))] J[G
⇣ ⌘
+EF J[G ~ (~r 0 )]D~r + EG Dr . (17.578)
que rearranjamos como
⇣ ⌘
H(~r 0 + Dr) = ~F G~ (~r 0 ) + J[~F (G
~ (~r 0 ))]J[G
~ (~r 0 )]D~r
h i
+ J[F (G (~r 0 ))]EG + EF J[G (~r 0 )] + EF EG D~r . (17.579)
~ ~ ~

O termo entre colchetes identificamos como a matriz de erros EH . No limite


em que D~r tende ao vetor nulo D~u também tende ao vetor nulo e portanto as
17.4 Campos vetoriais 599

matrizes EG e EF tendem à matriz nula. Como cada jacobiano de ~F e G ~ possuem


componentes limitadas, cada termo de EH tende a zero.
Identificamos também o termo que não é proporcional a D~r como H(~r 0 ). As-
sim o campo vetorial H ~ é diferenciável em~r 0 e o jacobiano de H
~ deve ser o termo
proporcional a D~r restante na equação, isto é,
h i
J H ~ (~r 0 ))]J[G
~ (~r 0 ) = J[~F (G ~ (~r 0 )] . (17.580)

Exemplo 17.115 (Coordenadas polares).


Seja uma transformação que mapeia um conjunto de coordenadas r e q na
posição~r = (x, y) em coordenadas polares, isto é,

~r (r, q) = (r · cos(q), r · sen(q)) . (17.581)

O jacobiano desta transformação de coordenadas é


! ✓ ◆
∂x ∂x
∂r ∂q cos(q) r · sen(q)
J(r, q) = ∂y ∂y = (17.582)
sen(q) r · cos(q)
∂r ∂q

O determinante deste jacobiano vale

det(J) = r cos2 (q) + r sen2 (q) = r . (17.583)

O jacobiano é uma matriz não inversível se a calcularmos na origem. Este fato é


consequência do fato das coordenadas polares não serem inversíveis na origem,
pois o sistema de coordenadas é degenerado neste ponto.

Exemplo 17.116 (Equações de Euler da mecânica de fluidos).


Seja ~v (t, x, y, z) um campo vetorial de três componentes e quatro variáveis que
descreve o campo de velocidades de um fluido com densidade r(t, x, y, z). A se-
gunda lei de Newton nos diz que

~F = m d~v , (17.584)
dt
sendo esta derivada no tempo uma derivada total. Se as componentes do campo
vetorial ~v são
✓ ◆
dx dy dz
~v = (vx , vy , vz ) = , , , (17.585)
dt dt dt
600 Funções reais de várias variáveis

escrevemos a aceleração como


✓ ◆
d~v dvx dvy dvz
= , ,
dt dt dt dt

∂vx ∂vx dx ∂vx dy ∂vx dz
= + + + ,
∂t ∂x dt ∂y dt ∂z dt
∂vy ∂vy dx ∂vy dy ∂vy dz
+ + + ,
∂t ∂x dt ∂y dt ∂z dt

∂vz ∂vz dx ∂vz dy ∂vz dz
+ + + ,
∂t ∂x dt ∂y dt ∂z dt
que escrevemos como

d~v ∂vx ∂vx ∂vx ∂vx ∂vy ∂vy ∂vy ∂vy
= + vx + vy + vz , + vx + vy + vz ,
dt ∂t ∂x ∂y ∂z ∂t ∂x ∂y ∂z

∂vz ∂vz ∂vz ∂vz
+ vx + vy + vz
∂t ∂x ∂y ∂z
ou ainda como

✓ ✓ ◆ ✓ ◆
d~v ∂vx ∂ ∂ ∂ ∂vy ∂ ∂ ∂
= + vx + vy + vz vx , + vx + vy + vz vy ,
dt ∂t ∂x ∂y ∂z ∂t ∂x ∂y ∂z
✓ ◆ ◆
∂vz ∂ ∂ ∂
+ vx + vy + vz vz .
∂t ∂x ∂y ∂z

Este operador dentro de cada componente pode ser escrito como


✓ ◆
~ ∂ ∂ ∂
~v · — = vx + vy + vz (17.586)
∂x ∂y ∂z
que é um operador escalar, o que nos permite escrever
✓ ◆
d~v ∂vx ~ ∂vy ~ ∂vz ~
= + (~v · — )vx , + (~v · — )vy , + (~v · — )vz (17.587)
dt ∂t ∂t ∂t
ou
✓ ◆ ⇣ ⌘
d~v ∂vx ∂vy ∂vz
= , , + ~v · ~— (vx , vy , vz ) (17.588)
dt ∂t ∂t ∂t
e finalmente
d~v ∂~v ⇣ ~ ⌘
= + ~v · — ~v . (17.589)
dt ∂t
17.4 Campos vetoriais 601

Imagine que a força que o fluido está contido num bloco de dimensões Dx, Dy e Dz
com volume DV = Dx · Dy · Dz. Se o bloquinho for pequeno o suficiente, podemos
aproximar a densidade do fluido por uma constante e a massa do fluido dentro do
bloquinho é

Dm = r(t, x, y, z)DxDyDz . (17.590)

A força que age no bloquinho de fluido é dada pela pressão do fluido e pelo campo
gravitacional. A componente x da força devido à pressão é igual à pressão em
cada parede vezes a àrea de cada parede. Denotamos uma força positiva como
uma força que aponta para a direita. Então na parede da esquerda localizada em
x = x0 a força que age dentro do bloco é P(t, x0 , y, z)DyDz. Na parede da direita
localizada em x = x0 + Dx a força que age dentro do bloco é P(t, x0 + Dx, y, z).
A componente x da força devido à pressão que age no bloco é

Fx = ( P(t, x0 + Dx, y, z) + P(t, x0 , y, z)) . (17.591)

Se a pressão é uma função diferenciável, escrevemos a equação acima como


∂P
Fx = (t, x0 , y, z)DxDyDz + · · · (17.592)
∂x
onde omitimos os termos que tendem a zero mais rápido que os incrementos.
A força devido à pressão é dada então por
~F P = ~— PDxDyDz + · · · . (17.593)

A força gravitacional é
~F G = m~g = r~g DxDyDz . (17.594)

Após estes cálculos a segunda lei de Newton ~F = m~a é escrita como


✓ ◆
∂~v ⇣ ~ ⌘
r + ~v · — ~v DxDyDz = ~— PDxDyDz + r~g DxDyDz + · · · . (17.595)
∂t
No limite em que os incrementos Dx, Dy e Dz tendem a zero temos
∂~v ⇣ ~ ⌘ 1~
+ ~v · — ~v = — P +~g . (17.596)
∂t r
que são as equações de Euler da mecânica de fluidos para um fluido perfeito (in-
compressível e sem viscosidade). O movimento do fluido ainda depende de uma
equação para a densidade, que é dada pela equação de continuidade e que será
deduzida após definirmos fluxos e integrais de superfície.

Você também pode gostar