Você está na página 1de 15

Calculo Avancado

Assunto: Funcoes Diferenciaveis e Regra da Cadeia


Alunos: Amalia Soares Vieira de Vasconcelos e Fabricio Alves Oliveira
Professor: Rodrigo Tomas Nogueira Cardoso

Funcoes Diferenciaveis (caso escalar)

Do Calculo 1 sabemos que se uma funcao f : I R R e derivavel em x0 I, entao ela e contnua em x0 .


Para funcoes de duas variaveis, o fato de existirem as derivadas parciais em relacao a x e a y em um ponto
(x0 , y0 ) nao garante a continuidade da funcao neste ponto. Por exemplo, considere a funcao

xy
, se (x, y) = (0, 0)
f(x, y) = x + y2
2
.
0, se (x, y) = (0, 0)

f f
Vamos mostrar que existem as derivadas parciais (0, 0) e (0, 0), mas f nao e contnua em (0, 0).
x y
De fato, temos que
f f(h, 0) f(0, 0) 0
(0, 0) = lim = lim = 0,
x h0 h h0 h
f f(0, k) f(0, 0) 0
(0, 0) = lim = lim = 0,
y k0 k k0 k

logo, existem as derivadas parciais de f em relacao a x e a y na origem.


No entanto, nao existe o limite lim f(x, y), pois, ao aproximar da origem atraves dos pontos do eixo x,
(x,y)(0,0)
obtemos
0
lim f(x, y) = lim f(x, 0) = lim =0
(x,y)(0,0) (x,y)(0,0) x0 x2
e, ao aproximar da origem atraves dos pontos da reta y = x, temos que

x2 1
lim f(x, y) = lim f(x, x) = lim 2
= .
(x,y)(0,0) (x,y)(0,0) x0 2x 2

Portanto, f nao e contnua em (0, 0).

Como podemos garantir a continuidade de funcoes de varias variaveis reais?

Definicao: Sejam f : U R, com U Rn aberto e a U. Dizemos que f e diferenciavel em a quando


existirem constantes A1 , . . . , An tais que para todo vetor v = (1 , . . . , n ) Rn , com a + v U, se tenha
r(v)
f(a + v) = f(a) + A1 1 + + An n + r(v), onde lim = 0.
v0 ||v||
Se f for diferenciavel em todos os pontos de U, dizemos simplesmente que f e diferenciavel.

Observacoes:

(1) Se f e diferenciavel no ponto a entao, tomando v = tei , i = 1, . . . , n, temos que j = 0, se j = i e i = t.


Assim,
f(a + tei ) = f(a) + Ai t + r(v),
ou seja,

f(a + tei ) f(a) r(tei )


= Ai +
t t
r(tei )
= Ai
|t|
r(tei )
= Ai .
||tei ||

1
r(tei )
Fazendo t 0, temos que lim = 0, e da,
t0 ||tei ||
f
(a) = Ai , para todo i = 1, . . . , n.
xi
Logo, poderamos ter definido diferenciabilidade da seguinte forma:

Uma funcao f : U R, definida no aberto U Rn , diz-se diferenciavel em a U, quando existirem as


f f
derivadas parciais (a), , (a), e para todo vetor v = (1 , . . . , n ) Rn , com a + v U, tivermos
x1 xn
f f r(v)
f(a + v) = f(a) + (a)1 + + (a)n + r(v), onde lim = 0.
x1 xn v0 ||v||
(2) Note que o restor(v) na definicao anterior e dado por

n
f
r(v) = f(a + v) f(a) (a)i .
xi
i=1

Logo, o resto pode ser definido para qualquer funcao que possua derivadas parciais. A diferenca e que, para ser
r(v)
diferenciavel, devemos ter lim = 0. Esta e a condicao crucial que deve ser verificada sempre que quisermos
v0 ||v||
provar que uma funcao e diferenciavel.

A proposicao a seguir responde nossa pergunta inicial.

Proposicao: Seja f : U Rn R, U aberto e seja a U. Se f e diferenciavel em a, entao f e contnua em


a.
f f
Demonstracao. Como f e diferenciavel em a, entao existem as derivadas parciais (a), , (a) e, para
x1 xn
todo vetor v = (1 , . . . , n ) tal que a + v U, vale que
f f r(v)
f(a + v) = f(a) + (a)1 + + (a)n + r(v), onde lim = 0.
x1 xn v0 ||v||

r(v)
Como lim = 0, obtemos que
v0 ||v||
r(v)
lim r(v) = lim ||v|| = 0.
v0 v0 ||v||
Alem disso, quando v 0, segue que i 0, para todo i = 1, . . . , n. Assim,
[ n ]
f
lim [f(a + v) f(a)] = lim (a)i + r(v) = 0.
v0 v0 xi
i=1

Logo, lim f(a + v) = f(a), ou seja, lim f(x) = f(a). Portanto, f e contnua em a. 
v0 xa

Observacoes:

(1) Segue da proposicao acima que se f nao for contnua em a, entao f nao sera diferenciavel em a.

(2) Quando n = 1, a funcao f : U R R e diferenciavel no ponto a se, e somente se, possui derivada
neste ponto, ou seja, para funcoes do Calculo 1, diferenciabilidade e o mesmo que derivabilidade. De fato, como
v R, agora podemos dividir por v e de f(a + v) = f(a) + f (a)v + r(v), temos que
r(v) f(a + v) f(a)
r(v) = f(a + v) f(a) f (a)v = f (a)
v [ v ]
r(v) f(a + v) f(a)
= f (a) .
|v| v

r(v) f(a + v) f(a)


Logo, lim = 0 lim = f (a).
v0 |v| v0 v

2
Exerccios:

(1) Prove, usando a definicao, que a funcao f : R2 R, definida por f(x, y) = x2 + y2 e diferenciavel.

(2) Verificar se as funcoes dadas sao diferenciaveis na origem:



x2 2y ,
3

2 2
, se (x, y)
= (0, 0) se (x, y) = (0, 0)
(a) f(x, y) = x +y (b) f(x, y) = x + y2
2

0, se (x, y) = (0, 0) 0, se (x, y) = (0, 0)

Condicao suficiente para diferenciabilidade

Definicao: Seja f : U R, U Rn aberto. Dizemos que f e de classe Ck (escrevemos f Ck ) quando todas


as derivadas parciais de ordem menor ou igual a k existem e sao contnuas em U. Dizemos que f e de classe C0
quando ela e contnua e e de classe C quando possui todas as derivadas parciais de todas as ordens contnuas.
f f
Em particular, dizemos que f e de classe C1 quando existem as derivadas parciais (x), , (x), para
x1 xn
f
todo x U e as n funcoes : U R sao contnuas, para todo i = 1, . . . , n.
xi
Teorema: Seja f : U Rn R, U aberto. Se f e de classe C1 , entao f e diferenciavel.

Demonstracao. Por simplicidade, vamos considerar n = 2. O caso geral se trata de maneira analoga.
Fixemos a = (x0 , y0 ) U. Como U e aberto, existe uma bola aberta B de centro a contida em U.
Seja v = (h, k) R2 tal que a + v B U. Temos que

f f
r(v) = r(h, k) = f(x0 + h, y0 + k) f(x0 , y0 ) (x0 , y0 )h (x0 , y0 )k.
x y
Da, podemos escrever
f f
r(v) = f(x0 + h, y0 + k) f(x0 , y0 + k) + f(x0 , y0 + k) f(x0 , y0 ) (x0 , y0 )h (x0 , y0 )k.
x y

Seja G(x) = f(x, y0 + k). Pelo Teorema do Valor Medio (para funcoes de uma variavel real), existe x entre x0 e
x0 + h tal que
f
G(x0 + h) G(x0 ) = G (x)h = (x, y0 + k)h.
x
Como x esta entre x0 e x0 + h, entao existe 1 , pertencente ao intervalo (0, 1) tal que x = x0 + 1 h. Assim,

f
G(x0 + h) G(x0 ) = (x0 + 1 h, y0 + k)h,
x
ou seja,
f
f(x0 + h, y0 + k) f(x0 , y0 + k) =
(x0 + 1 h, y0 + k)h. (1)
x
Da mesma forma, considerando H(y) = f(x0 , y), temos pelo Teorema do Valor Medio (para funcoes de uma
variavel real), que existe y entre y0 e y0 + k tal que

f
H(y0 + k) H(y0 ) = H (y)k = (x0 , y)k,
y

isto e, existe 2 (0, 1), tal que y = y0 + 2 k e

f
H(y0 + k) H(y0 ) = (x0 , y0 + 2 k)k,
y
ou seja,
f
f(x0 , y0 + k) f(x0 , y0 ) = (x0 , y0 + 2 k)k. (2)
y
Substituindo (1) e (2) em r(v), obtemos

f f f f
r(v) = (x0 + 1 h, y0 + k)h + (x0 , y0 + 2 k)k (x0 , y0 )h (x0 , y0 )k,
x y x y

3
logo,
[ ] [ ]
r(v) f f h f f k
= (x0 + 1 h, y0 + k) (x0 , y0 ) + (x0 , y0 + 2 k) (x0 , y0 ) .
||v|| x x h2 + k2 y y h 2 + k2
Quando v 0 os termos dentro dos colchetes acima tendem a zero, pela continuidade das derivadas parciais
x e y . Alem disso, os termos fora dos colchetes sao limitados (pois tem valor absoluto 1). Portanto,
f f

r(v)
lim = 0 e entao f e diferenciavel. 
v0 ||v||

Observacao: A recproca desse teorema nao e verdadeira. Existem funcoes diferenciaveis em um ponto (x0 , y0 )
tal que as derivadas parciais nao sao contnuas em (x0 , y0 ). Por exemplo, a funcao
{ ( )
(x2 + y2 )sen x2 +y1
2 , se (x, y) = (0, 0)
f(x, y) =
0, se (x, y) = (0, 0)
f f
e diferenciavel em (0, 0), mas as derivadas parciais x e y nao sao contnuas em (0, 0).

Exerccio: Verifique que as funcoes a seguir sao diferenciaveis em R2 :


(a) f(x, y) = 3xy2 + 4x2 y + 2xy (b) g(x, y) = sen(xy2 )

Aproximacao linear e diferenciabilidade

Vamos ver que se uma funcao for diferenciavel num ponto, entao ela pode ser aproximada na vizinhanca desse
ponto por uma funcao bem mais simples: uma funcao afim, que e a composicao de uma translacao com uma
transformacao linear.

Funcoes escalares de 1 variavel real - a equacao da reta tangente

Teorema: Sejam f : I R R uma funcao e p um ponto do interior de I. Se f e diferenciavel em p,


entao existe uma unica reta l que satisfaz as condicoes l(p) = f(p) e l (p) = f (p):

y = l(x) = f(p) + f (p)(x p).

Mais ainda, vale que


f(x) l(x)
lim = 0,
xp xp
isto e, a diferenca entre f(x) e l(x) vai para zero mais rapidamente do que x p. Em outras palavras,
R(p, x)
f(x) = f(p) + f (p)(x p) + R(p, x), com lim = 0.
xp xp

O teorema acima nos diz que se uma funcao f e diferenciavel em p, entao e possvel aproxima-la na vizinhanca
desse ponto pela equacao da reta tangente l(x) = f(p) + f (p)(x p) (uma funcao afim) e que o erro R(p, x) =
f(x) l(x) cometido nesta aproximacao tende a zero mais rapidamente do que x p.

y
grfico de l

f(p)
grfico de f

p x

Observacao: Vimos que se f e diferenciavel em p, entao


R(p, x)
f(x) = f(p) + f (p)(x p) + R(p, x), com lim = 0.
xp xp

4
Fazendo h = x p, temos que x = p + h e as equacoes acima sao dadas por
R(p, h)
f(p + h) = f(p) + f (p) h + R(p, h), com lim = 0,
h0 h
ou seja,
R(p, h)
f(p + h) f(p) = f (p) h +R(p, h) com lim = 0.
| {z } | {z } h0 h
V(h) T (h)

Essa equacao nos diz que a variacao V(h) = f(p + h) f(p) do valor da funcao f no ponto x = p pode ser
aproximada pela transformacao linear
T: R R
,
h 7 T (h) = f (p) h

e que o erro R(p, h) = V(h) T (h) cometido nesta aproximacao tende a zero mais rapidamente do que h. A
matriz associada a esta transformacao linear e dada por
[ ]
df
(p)
dx 11

e ela pode ser identificada com o numero real df


dx (p) = f (p).

Exemplo: Seja f(x) = ex . Sabemos que f e diferenciavel para todo x R. A equacao da reta tangente ao
grafico de f no ponto p = 0 e dada por

y = l(x) = f(0) + f (0)(x 0) = e0 + e0 x = 1 + x.

Desta maneira,
R(0, x)
ex = 1 + x + R(0, x), com lim = 0.
x0 x
Podemos usar l para estimar o valor de f, para x proximo de 0. Por exemplo, em x = 0, 2 temos l(0, 2) =
1 + 0, 2 = 1, 2, enquanto que f(0, 2) = e0,2 = 1, 22140 . . . .

Funcoes escalares de 2 variaveis reais - a equacao do plano tangente

Teorema: Seja f : U R2 R uma funcao, com U aberto e seja p = (a, b) U. Se f e diferenciavel


em p, entao existe um unico plano l que satisfaz as condicoes l(p) = f(p) e

l f l f
(p) = (p) e (p) = (p)
x x y y
a saber,
f f
z = l(x, y) = f(a, b) + (a, b)(x a) + (a, b)(y b).
x y
Mais ainda, vale que

f(x, y) l(x, y) f(x, y) l(x, y)


lim = lim = 0,
(x,y)(a,b) ||(x a, y b)|| (x,y)(a,b) (x a)2 + (y b)2

isto e, a diferenca entre f(x, y) e l(x, y) vai para zero mais rapidamente do que ||(x a, y b)||. Em outras
palavras,
f f R(a, b, x, y)
f(x, y) = f(a, b) + (a, b)(x a) + (a, b)(y b) + R(a, b, x, y), com lim = 0.
x y (x,y)(a,b) (x a)2 + (y b)2

O teorema anterior nos diz que se uma funcao f de duas variaveis e diferenciavel em um ponto p, entao e possvel
aproxima-la na vizinhanca desse ponto pela equacao do plano tangente
f f
l(x, y) = f(a, b) + (a, b)(x a) + (a, b)(y b) (uma funcao afim)
x y
e que o erro R(a, b, x, y) = f(x, y) l(x, y) cometido nesta aproximacao tende a zero mais rapidamente do que
||(x a, y b)||.

5
z
grfico de l

grfico de f
b
y
a
p
x
Observacao: Fazendo (h1 , h2 ) = (x a, y b), entao x = a + h1 , y = b + h2 e as equacoes do teorema podem
ser reescritas como
f f R(a, b, h1 , h2 )
f(a + h1 , b + h2 ) = f(a, b) + (a, b)h1 + (a, b)h2 + R(a, b, h1 , h2 ), com lim = 0,
x y (h1 ,h2 )(0,0) ||(h1 , h2 )||
ou seja,
f f R(a, b, h1 , h2 )
f(a + h1 , b + h2 ) f(a, b) = (a, b)h1 + (a, b)h2 +R(a, b, h1 , h2 ), com lim = 0.
| {z } x y (h1 ,h2 )(0,0) ||(h1 , h2 )||
V(h ,h )
| {z }
1 2
T (h1 ,h2 )

Essa equacao nos diz que a variacao V(h1 , h2 ) = f(a + h1 , b + h2 ) f(a, b) do valor da funcao f no ponto
p = (a, b) pode ser aproximada pela transformacao linear
T : R2 R
f f ,
(h1 , h2 ) 7 T (h1 , h2 ) = (a, b)h1 + (a, b)h2
x y
e que o erro R(a, b, h1 , h2 ) = V(h1 , h2 ) T (h1 , h2 ) cometido nesta aproximacao tende a zero mais rapidamente
do que ||(h1 , h2 )||. A matriz associada a esta transformacao linear e dada por
[ ]
f f
(a, b) (a, b) ,
x y 12

de modo que
f f
T (h1 , h2 ) = (a, b)h1 + (a, b)h2
x y
[ ] [ ]
f f h1
= (a, b) (a, b) .
x y 12
h2 21
Temos que T e a melhor transformacao linear que aproxima a variacao de f perto do ponto p = (a, b) ou,
equivalentemente, l (que define a equacao do plano tangente) e a melhor funcao afim que aproxima f perto do
ponto p = (a, b).

Exemplo: Use a aproximacao linear da funcao f(x, y) = x2 + y2 no ponto (1, 1) para obter uma aproximacao
de f(1.01, 1.12).

Solucao: Como f e de classe C1 , segue que f e diferenciavel em R2 . Em particular, f e diferenciavel no ponto


(1, 1).
A equacao do plano tangente ao grafico de f no ponto (1, 1, f(1, 1)) = (1, 1, 2) e dada por
f f
l(x, y) = f(1, 1) + (1, 1)(x 1) + (1, 1)(y 1)
x y
= 2 + 2(x 1) + 2(y 1)
= 2x + 2y 2.
Logo, uma aproximacao para f(1.01, 1.12) e dada por
l(1.01, 1.12) = 2 (1.01) + 2 (1.12) 2 = 2.26.

Evidentemente, tudo isto pode ser estendido para funcoes que dependam de n variaveis.

6
Funcoes escalares de n variaveis reais

Teorema: Seja f : U Rn R uma funcao, com U aberto e seja p = (p1 , . . . , pn ) U. Se f e


diferenciavel em p, entao existe uma unica funcao afim l que satisfaz as condicoes l(p) = f(p) e

l f l f
(p) = (p), . . . , (p) = (p)
x1 x1 xn xn
a saber,
f f
l(x) = f(p) + (p)(x1 p1 ) + + (p)(xn pn ).
x1 xn
Mais ainda, vale que
f(x) l(x)
lim = 0,
xp ||x p||
isto e, a diferenca entre f(x) e l(x) tende a zero mais rapidamente do que ||x p||. Em outras palavras,
f f R(p, x)
f(x) = f(p) + (p)(x1 p1 ) + + (p)(xn pn ) + R(p, x), com lim = 0.
x1 xn xp ||x p||

O teorema afirma que se uma funcao f de n variaveis e diferenciavel em um ponto p, entao e possvel aproxima-la
na vizinhanca desse ponto pela funcao afim l e que o erro R(p, x) = f(x) l(x) cometido nesta aproximacao
tende a zero mais rapidamente do que ||x p||.

Observacao: Escrevendo as equacoes do teorema em termos de h = (h1 , . . . , hn ) = x p, obtemos


f f R(p, h)
f(p + h) = f(p) + (p)h1 + + (p)hn + R(p, h), com lim = 0,
x1 xn h0 ||h||
isto e,
f f R(p, h)
f(p + h) f(p) = (p)h1 + + (p)hn +R(p, h), com lim = 0.
| {z } x1 xn h0 ||h||
V(h)
| {z }
T (h)

Essa equacao nos diz que a variacao V(h) = f(p+h) f(p) do valor da funcao f no ponto p pode ser aproximada
pela transformacao linear

T: Rn R
f f ,
(h1 , . . . , hn ) 7 T (h1 , . . . , hn ) = (p)h1 + + (p)hn
x1 xn
e que o erro R(p, h) = V(h) T (h) cometido nesta aproximacao tende a zero mais rapidamente do que ||h||. A
matriz associada a esta transformacao linear e dada por
[ ]
f f
(p) (p) ,
x1 xn 1n

de modo que
f f
T (h) = (p)h1 + + (p)hn
x1 xn

[ ] h1
f f
= (p) (p) ... .
x1 xn 1n
hn n1

Sendo assim, T e a melhor transformacao linear que aproxima a variacao de f perto do ponto p ou, equiva-
lentemente, l e a melhor funcao afim que satisfaz as condicoes:
l f l f
l(p) = f(p) e (p) = (p), . . . , (p) = (p).
x1 x1 xn xn

7
Funcoes Diferenciaveis (caso vetorial)

Definicao: Uma aplicacao f : U Rm , com U Rn aberto, e diferenciavel em a U quando cada uma


das funcoes coordenadas fi : U R e diferenciavel em a, para todo i = 1, . . . , m.

Considere a aplicacao
f: U Rn Rm
,
x = (x1 , . . . , xn ) 7 f(x) = (f1 (x), . . . , fm (x))
definida no aberto U Rn . Se f e diferenciavel em p U, entao ela tambem pode ser aproximada por uma
transformacao afim l na vizinhanca de p. O que vamos fazer e uma extensao imediata do teorema para funcoes
escalares.

Como f e diferenciavel em p, entao suas funcoes coordenadas f1 , . . . , fm tambem sao diferenciaveis em p. Logo,
podemos aplicar o teorema visto anteriormente e obter funcoes afins

f1 f1

l (x) = f1 (p) + (p)(x1 p1 ) + + (p)(xn pn )
1
x x


1 n

f2 f2

l2 (x) = f2 (p) + (p)(x1 p1 ) + + (p)(xn pn )
x1 xn

..




.



f f
lm (x) = fm (p) + m (p)(x1 p1 ) + + m (p)(xn pn )
x1 xn
que aproximam, respectivamente f1 , f2 , . . . , fm , nas proximidades do ponto p = (p1 , . . . , pn ). Mais especifica-
mente,

f1 f1

f1 (x) = f1 (p) + (p)(x1 p1 ) + + (p)(xn pn ) + R1 (p, x)

x1 xn



f2 f2

f2 (x) = f2 (p) + (p)(x1 p1 ) + + (p)(xn pn ) + R2 (p, x)
x1 xn

..




.



f f
fm (x) = fm (p) + m (p)(x1 p1 ) + + m (p)(xn pn ) + Rm (p, x)
x1 xn
Ri (p, x)
com Ri (p, x) = li (x) fi (x) e lim = 0, para todo i = 1, . . . , m.
xp ||x p||
Usando matrizes, as m igualdades acima ficam

f1 f1
(p) (p)
x1 xn



f1 (x) f1 (p) f2 f2 x1 p1 R1 (p, x)
f2 (x) f2 (p) (p) (p)
x1 xn

x2 p2 R2 (p, x)
.. = .. + .. + .. ,
. . .. .. .. . .
. . .
fm (x) fm (p) xn pn Rm (p, x)
| {z } | {z } | {z } | {z }
f(x) f(p)
f fm xp R(p,x)
m
(p) (p)
x1 xn
| {z }
Df(p)

de modo que, podemos escrever


R(p, x) f(x) l(x)
f(x) = f(p) + Df(p)(x p) +R(p, x), com lim = lim = 0.
| {z } xp ||x p|| xp ||x p||
l(x)

Em outras palavras, e possvel aproximar f na vizinhanca de p pela transformacao afim l e o erro R(p, x) =
f(x) l(x) cometido nesta aproximacao tende a zero mais rapidamente do que ||x p||. A equacao anterior pode
ser reescrita como
f(p + h) f(p) = Df(p) h +R(p, h).
| {z } | {z }
V(h) T (h)

8
Ela nos diz que a variacao V(h) = f(p + h) f(p) do valor da funcao f no ponto p pode ser aproximada pela
transformacao linear T : Rn Rm , definida por T (h) = Df(p) h, isto e,

f1 f1
(p) (p)
x1 xn


f2 f2 h1
(p)
x1 (p) xn h2
T (h) = T (h1 , . . . , hn ) =


..
.. .. .. .
. . .
hn
n1
f fm
m
(p) (p)
x1 xn mn

e que o erro R(p, h) = V(h) T (h) cometido nesta aproximacao tende a zero mais rapidamente do que ||h||.

A matriz associada a esta transformacao linear e dada por



f1 f1
(p) (p)
x1 xn


f2 f2
(p)
x1 (p) xn
Df(p) =


.. .. ..
. . .


f fm
m
(p) (p)
x1 xn mn

e e chamada matriz jacobiana de f no ponto p. A transformacao linear induzida por Df(p) e denominada
derivada de f no ponto p.

Novamente, T e a melhortransformacao linear que aproxima a variacao de f perto do ponto p, ou equivalente-


mente, l e a melhor transformacao afim que aproxima f perto do ponto p. Tambem, l e a unica transformacao
afim que satisfaz as condicoes
li fi
l(p) = f(p) e (p) = (p), para i = 1, . . . , m e j = 1, . . . , n.
xj xj

) (
x1 + x2 + x3
Exemplo: Considere a aplicacao f : R R , definida por f(x1 , x2 , x3 ) =
3 2
, x1 x2 x3 .
3
3
Calcule a transformacao afim que melhor aproxima f nas proximidades do ponto p = (1, 2, 4).

Solucao: As funcoes coordenadas de f sao


x1 + x2 + x3
f1 (x1 , x2 , x3 ) = e f2 (x1 , x2 , x3 ) = 3
x1 x2 x3 .
3
Logo, a matriz jacobiana f no ponto (x1 , x2 , x3 ) e
f f1 f1
1
(x1 , x2 , x3 ) (x1 , x2 , x3 ) (x1 , x2 , x3 )
x1 x2 x3
Df(x1 , x2 , x3 ) =
f f2 f2
2
(x1 , x2 , x3 ) (x1 , x2 , x3 ) (x1 , x2 , x3 )
x1 x2 x3 23
1 1 1

3 3 3
= ,
x2 x3 x1 x3 x1 x2
3 3 (x1 x2 x3 )2 3 3 (x1 x2 x3 )2 3 3
(x1 x2 x3 )2
23

logo, [ ]
1 1 1
3 3 3
Df(1, 2, 4) = .
2 1 1
3 3 6 23

9
( )
Alem disso, f(1, 2, 4) = 73 , 2 . Logo, a equacao da transformacao que melhor aproxima f na vizinhanca do
ponto p = (1, 2, 4), e dada por l(x) = f(p) + Df(p)(x p), ou seja,
[ ] [ 1 1 1 ] x 1
7 1
x2 2
3 3 3 3
l(x1 , x2 , x3 ) = +
2 2 1 1
3 3 6 x3 4
[ ] [ ]
7 x1 x2 x3 7
3 3 + 3 + 3 3
= + 2x1 x2 x3
2 3 + 3 + 6 2
[ ]
x1 x2 x3
3 + 3 + 3
= 2x1 x2 x3 .
3 + 3 + 6
( )
x1 + x2 + x3 2x1 x2 x3
Portanto, l(x1 , x2 , x3 ) = , + + .
3 3 3 6
Podemos usar a transformacao afim l para estimar o valor de f(x1 , x2 , x3 ) em pontos (x1 , x2 , x3 ) proximos de
(1, 2, 4). Por exemplo,
l(1.1, 1.9, 3.9) = (2.3, 2.016), enquanto que f(1.1, 1.9, 3.9) = (2.3, 2.012).

Observacao: Vimos que a matriz jacobiana Df(p) de uma funcao f no ponto p define a transformacao linear
que melhor aproxima a variacao da funcao perto deste ponto. Mas, o que aconteceria se a propria funcao ja
fosse uma transformacao linear? Lembre-se que uma transformacao linear T nada mais e do que uma funcao
vetorial definida por uma matriz: T (x) = A x. Ora, a melhor transformacao linear que aproxima a variacao
de uma transformacao linear e a propria transformacao linear. Como consequencia, a matriz jacobiana de uma
transformacao linear e igual a matriz que define a propria transformacao linear, isto e, DT (p) = A.

10
Regra da Cadeia

Definicao: Considere f : A B e g : C D com f(A) C. A funcao h : A D obtida aplicando-se


primeiro f a x A e entao aplicando-se g ao resultado f(x) e denominada a funcao composta de g e f e
denotada por g f:

(g f)(x) = g(f(x)).

A C D

f g
x f(x) g(f(x))

f(A)

g f

Exemplo 1:
A funcao h(x) = sen 2 (x) e resultado da composicao de g(x) = x2 com f(x) = sen (x).

A funcao h(x) = (x + 4)2 e resultado da composicao de g(x) = x2 com f(x) = x + 4.



A funcao h(x, y) = x2 + y2 e resultado da composicao de g(x) = x com f(x, y) = x2 + y2 .
Exemplo 2: Composicoes de funcoes aparecem naturalmente em modelos dinamicos, isto e, modelos para
os quais as variaveis dependem do tempo. Por exemplo, suponha que funcao de producao Cobb-Douglas
3 1
z = f(x, y) = 4x 4 y 4 represente a producao de uma empresa em funcao de seu capital x e seu trabalho y.
Suponha tambem que a curva parametrizada (t) = (x(t), y(t)) = (10000 + 100t, 625 + 5t) descreva como o
capital x(t) = 10000 + 100t e o trabalho y(t) = 625 + 5t desta empresa variam no tempo. Entao, se quisermos
estudar como a producao desta empresa varia no tempo, somos naturalmente levados a considerar a funcao
composta:
3 1
h(t) = (f )(t) = 4(10000 + 100t) 4 .(625 + 5t) 4 .

A Regra da Cadeia no Calculo 1

Considere f : Df R R e g : Dg R R duas funcoes de classe Ck com k > 1, tais que f(Df ) Dg .


Podemos entao construir a composicao h = g f : Dh = Df R R.
A regra da cadeia afirma que h tambem e uma funcao de classe Ck e que sua derivada h = (g f) pode
ser obtida em termos das derivadas f e g de f e g. Mais precisamente,

h (p) = (g f) (p) = g (f(p)).f (p).


Exemplo 3: A funcao h(x) = sen (x3 +4x) pode ser escrita como a composicao de duas funcoes: h(x) = (gf)(x),
com f(x) = x3 + 4x e g(z) = sen (z).
Como f e g sao funcoes de classe C segue que h tambem e uma funcao de classe C .
Vamos usar a regra da cadeia para calcular a derivada de h. Para isto, precisamos calcular as derivadas de f e
g. A derivada de g e g (z) = cos(z) e a derivada de f e f (x) = 3x2 + 4. Desta maneira, pela regra da cadeia, a
derivada de h e:
h (x) = g (f(x)).f (x) = cos(f(x)).f (x) = cos(x3 + 4x).(3x2 + 4)

11
A Regra da Cadeia no Calculo 2

A regra da cadeia em Calculo 2 e muito parecida com a regra da cadeia do Calculo 1 quando utilizamos a
notacao matricial.

Teorema: Considere f : Df Rn Rm e g : Dg Rm Rl duas funcoes de classe Ck tais que


f(Df ) Dg de modo que podemos construir a composicao h = g f : Dh = Df Rn Rl . Entao h
tambem e uma funcao de classe Ck e a matriz jacobiana de h em p e igual ao produto da matriz jacobiana
de g em f(p) pela matriz jacobiana de f em p:

Dh(p) = D(g f)(p) = Dg(f(p)).Df(p).

Ou, mais explicitamente, se


x = (x1 , . . . , xn ), y = (y1 , . . . , ym )

f(x) = (f1 (x), . . . , fm (x)), g(y) = (g1 (y), . . . , gl (y)),

entao a matriz jacobiana de h(x) = (h1 (x), . . . , hl (x) e dada por



h1 h1 g1 g1 f1 f1
(p) (p) (f(p)) (f(p)) (p) (p)
x1 xn y1 y x xn
m 1

.. .. .. .. .. .. .. .. ..
. . . = . . . . . .


hl hl gl gl fm fm
(p) (p) (f(p)) (f(p)) (p) (p)
x1 xn y1 ym x1 xn
| {z } | {z } | {z }
Dh(p) Dg(f(p)) Df(p)

Observe que Dh(p) e uma matriz lxn, Dg(f(p)) e uma matriz lxm e Df(p) e uma matriz mxn, de modo
que a multiplicacao de matrizes na expressao Dh(p) = D(g f)(p) = Dg(f(p)).Df(p) pode ser efetuada.

Uma demonstracao formal da regra da cadeia pode ser encontrada em [3, p. 256-261].

Justificativa informal: As variacoes de f em p e de g em f(p) podem ser aproximadas pelas transformacoes


lineares T e S definidas, respectivamente, pelas matrizes jacobianas Df(p) e Dg(f(p)). A composicao S T
destas transformacoes lineares deve fornecer uma boaaproximacao da variacao da composicao h = g f no
ponto p.
Sabemos que a composicao de duas transformacoes lineares e tambem uma transformacao linear e a matriz
associada a funcao composta nada mais e do que o produto das matrizes que definem cada transformacao linear
na composicao.
Desta maneira, e natural esperarmos que a matriz jacobiana Dh(p) seja dada pelo produto das matrizes jaco-
bianas Dg(f(p)) e Df(p).

Exemplo 1: Considere as funcoes vetoriais


f : R2 R2 g : R2 R3
e
(x, y) 7 f(x, y) = (x2 y2 , x.y) (u, v) 7 g(u, v) = (sen(u.v), u + v, u v)

(a) Encontre a matriz jacobiana da funcao composta h = g f : R2 R3 em um ponto p = (x, y) qualquer.


(b) Determine Dh(1,1).

Solucao (a):

Temos que Dh(x, y) = Dg(f(x, y)).Df(x, y). Veja que:



f1 f1
[ ]
x (x, y) y (x, y) 2x 2y

Df(x, y) = =
f2 f2 y x
(x, y) (x, y)
x y

12
e

g1 g1
(u, v) (u, v)
u v
v cos(u.v) u cos(u.v)
g2 g2

Dg(u, v) = (u, v) (u, v) = .
u v 1 1
1 1
g3 g3
(u, v) (u, v)
u v

Aplicando no ponto f(x, y) = (x2 y2 , xy) obtemos:



xy cos((x2 y2 )xy) (x2 y2 ) cos((x2 y2 )xy)
Dg(f(x, y)) = 1 1 .
1 1
Logo, efetuando a multiplicacao das matrizes Dg(f(x, y)).Df(x, y), obtemos:

(3x2 y y3 ) cos((x2 y2 )xy) (x3 3xy2 ) cos((x2 y2 )xy)
Dh(x, y) = 2x + y 2y + x .
2x y 2y x
Solucao (b):

Substituindo o ponto (1, 1) na matriz jacobiana de h, obtemos:


2 2
Dh(1, 1) = 3 1 .
1 3

Exemplo 2: A funcao f(x(t), y(t)) e uma funcao de R para R que pode ser descrita como a composicao das
funcao escalar z = f(x, y) de R2 para R com a curva parametrizada (t) = (x(t), y(t)) de R para R2 . Mais
formalmente, se z = h(t) = f(x(t), y(t)), entao h = f . Use a regra da cadeia para calcular a derivada desta
funcao. Assuma que f, x e y sejam funcoes de classe C1 .

Solucao:

Pela regra da cadeia, como f e sao de classe C1 , entao h tambem e de classe C1 e Dh(t) = Df((t)).D(t).
[ ] [ ]
x (t) f f
Como D(t) = e Df(x, y) = (x, y) (x, y) , segue que:
y (t) 21 x y 12

Dh(t) = Df((t)).D(t)
[ ] [ ]
f f x (t)
= ((t)) ((t)) .
x y 12
y (t) 21
[ ]
f f
= ((t)).x (t) + ((t)).y (t)
x y 11

Isto e, [ ]
f f
Dh(t) = (x(t), y(t)).x (t) + (x(t), y(t)).y (t) ,
x y 11

ou seja,
f f
h (t) = (x(t), y(t)).x (t) + (x(t), y(t)).y (t).
x y

Exemplo 3: A funcao f(x(u, v), y(u, v)) e uma funcao de R2 para R que pode ser descrita como a composicao
das funcao escalar z = f(x, y) de R2 para R com a funcao vetorial g(u, v) = (x(u, v), y(u, v)) de R2 para R2 .
Mais formalmente, se z = h(u, v) = f(x(u, v), y(u, v)), entao h = f g. Use a regra da cadeia para calcular as

13
derivadas parciais de primeira ordem desta funcao. Assuma que f, x e y sejam funcoes de classe C1 .

Solucao:

1 1
Pela regra da cadeia,
como f e g sao de classe
C , entao h tambem e de classe C e Dh(u, v) = Df(g(u, v)).Dg(u, v).
x x
(u, v) (u, v)
Como Dg(u, v) = u y
v
y com x = x(u, v) e y = y(u, v) as funcoes coordenadas de g, e
(u, v) (u, v)
u v 22

[ ]
f f
Df(x, y) = (x, y) (x, y) , segue que
x y 12

Dh(u, v) = Df(g(u, v)).Dg(u, v)



[ ] x x
f f u (u, v) v
(u, v)
= (g(u, v)) (g(u, v)) . y y
x y 12 (u, v) (u, v)
u v 22

Efetuando a multiplicacao de matrizes na expressao acima e lembrando que, por definicao:


[ ]
h h
Dh(u, v) = (u, v) (u, v) ,
u v 12
conclumos que
h f x f y
(u, v) = (g(u, v)). (u, v) + (g(u, v)). (u, v),
u x u y u
h f x f y
(u, v) = (g(u, v)). (u, v) + (g(u, v)). (u, v).
v x v y v

Observacao: A maioria dos livros de Calculo 2 nao enuncia a regra da cadeia com o uso da notacao matricial.
O que eles fazem e trocar a versao matricial vista acima da regra da cadeia por expressoes em termos das
entradas das matrizes envolvidas. Mais especificamente, a expressao matricial diz que o elemento da primeira
linha e primeira coluna da matriz jacobiana Dh(p) pode ser obtido multiplicando-se a primeira linha da matriz
jacobiana Dg(f(p)) pela primeira coluna da matriz jacobiana Df(p):

h g1 f1 g1 fm
m
g1 fk
(p) = (f(p)). (p) + + (f(p)). (p) = (f(p)). (p).
x1 y1 x1 ym x1 yk x1
k=1
Podemos obter kn expressoes deste tipo considerando-se os kn elementos da matriz jacobiana Dh(p), isto e,
para cada i = 1, , k e j = 1, , n o elemento da i -esima linha e j -esima coluna da matriz jacobiana Dh(p)
pode ser obtido pela multiplicacao da i -esima linha da matriz jacobiana Dg(f(p)) pela j -esima coluna da matriz
jacobiana Df(p):

hi gi f1 gi fm
m
gi fk
(p) = (f(p)). (p) + + (f(p)). (p) = (f(p)). (p).
xj y1 xj ym xj yk xj
k=1
Assim, o que a maioria dos livros de Calculo 2 faz e trocar uma unica equacao matricial (isto e, Dh(p) =
Dg(f(p)).Df(p)) pelas kn equacoes reais definidas na equacao acima.

As formulas dos exemplos (2) (3) apresentados anteriormente, utilizando as equacoes acima, podem ser obtidas
de acordo com os diagramas abaixo:

Regra Pratica do Calculo para o Exemplo (2):

dh f dx f dy
= . + .
dt x dt y dt

14
Regra Pratica do Calculo para o Exemplo (3):

h f x f y
= . + . ,
u x u y u
h f x f y
= . + . .
v x v y v
Exerccios:

(1) Suponha que um pato esteja nadando segundo a reta definida parametricamente por x = 3 + 8t e y = 3 2t.
A temperatura da agua e dada por T = x2 cos(y) y2 sen (x). Encontre a variacao da temperatura em funcao
do tempo, dT/dt, de duas maneiras:
(a) pela regra da cadeia
(b) expressando T em termos de t e entao derivando.
Indique explicitamente as funcoes que fazem parte da composicao, nao esquecendo de estabelecer as dimensoes
do domnio e do contradomnio de cada funcao envolvida.

(2) Verifique a regra da cadeia para a funcao abaixo. Indique explicitamente as funcoes que fazem parte
da composicao, nao esquecendo de estabelecer as dimensoes do domnio e do contradomnio de cada funcao
envolvida.

f(x, y) = (x2 + y2 ) ln x2 + y2 , com x = et e y = et .

Referencias
[1] Bortolossi, H. J., Calculo diferencial a varias variaveis: uma introducao a teoria de otimizacao, Rio de
Janeiro, Ed. PUC-Rio, 2002.
[2] Thomas, G. B., Calculo: volume 2, 12. ed, Sao Paulo: Pearson, 2012.

[3] Lima, E. L., Curso de analise vol. 2, 11. ed, Rio de Janeiro: IMPA, 2014.

15

Você também pode gostar