Você está na página 1de 119

Derivação da função composta

Seja g uma função de domı́nio A e contradomı́nio B e f uma função


de B em C e suponhamos que a função u resulta de compor f com
g . Supondo A, B, C subconjuntos de R, podemos designar as funções
anteriores, por exemplo, por

g : t −→ x, f : x −→ y ,

e
u = f ◦ g : t −→ y .

AM II-C 21 de Abril de 2021 1 / 119


Supondo g diferenciável em t0 ∈ A e f diferenciável em g (t0 ) tem-se,
como se sabe, que

(u 0 (t))t0 = (f ◦ g )0 (t)t0 = f 0 (g (t0 )) · g 0 (t0 )

ou
     
du df dg
= ·
dt t0 dx g (t0 ) dt t0

AM II-C 21 de Abril de 2021 2 / 119


ou ainda, com g (t0 ) = x0 , e de forma mais intuitiva

     
dy dy dx
= · .
dt t0 dx x0 dt t0

Esta é a regra de derivação da função composta de funções reais de


variável real. É esta regra que pretendemos generalizar para conjuntos
A, B e C em espaços euclidianos de qualquer dimensão. Para já
comecemos por considerar alguns casos mais simples desta regra.

AM II-C 21 de Abril de 2021 3 / 119


Teorema (Derivada da função composta)
Suponhamos que a função u resulta de compor a função z = f (x, y )
com x = φ(t), y = ψ(t). Suponhamos ainda que φ e ψ são
diferenciáveis em t0 e que f é diferenciável em (a, b) = (φ(t0 ), ψ(t0 )).
Nestas condições tem-se que
         
du ∂f dφ ∂f dψ
= +
dt t0 ∂x (a,b) dt t0 ∂y (a,b) dt t0

que se escreve, por vezes, na forma


         
dz ∂z dx ∂z dy
= + .
dt t0 ∂x (a,b) dt t0 ∂y (a,b) dt t0

AM II-C 21 de Abril de 2021 4 / 119


Demonstração:
Tem-se que
u(t) = f (ϕ(t), ψ(t))
e seja
(a, b) = (ϕ(t0 ), ψ(t0 )).
Então
u(t0 + h) − u(t0 ) = f (ϕ(t0 + h), ψ(t0 + h)) − f (ϕ(t0 ), ψ(t0 )).
Escrevendo
ϕ(t0 + h) − ϕ(t0 ) = ∆ϕ e ψ(t0 + h) − ψ(t0 ) = ∆ψ
vem
ϕ(t0 + h) = a + ∆ϕ e ψ(t0 + h) = b + ∆ψ
donde
u(t0 + h) − u(t0 ) = f (a + ∆ϕ, b + ∆ψ) − f (a, b).
AM II-C 21 de Abril de 2021 5 / 119
Como, por hipótese, f é diferenciável em (a, b), tem-se

f (a + ∆ϕ, b + ∆ψ) − f (a, b)


∂f ∂f
= (a, b)∆ϕ + (a, b)∆ψ + (∆ϕ, ∆ψ) k(∆ϕ, ∆ψ)k
∂x ∂y

com lim(∆ϕ,∆ψ)→(0,0) (∆ϕ, ∆ψ) = 0. Tendo em conta que

∆ϕ = ϕ0 (t0 )h + |h|1 (h), com lim 1 (h) = 0,


h→0
∆ψ = ψ 0 (t0 )h + |h|2 (h), com lim 2 (h) = 0
h→0
vem que
∂f
f (a+∆ϕ, b + ∆ψ) − f (a, b) = (a, b)(ϕ0 (t0 )h + |h|1 (h))
∂x
∂f
+ (a, b)(ψ 0 (t0 )h + |h|2 (h)) + (∆ϕ, ∆ψ) k(∆ϕ, ∆ψ)k .
∂y

AM II-C 21 de Abril de 2021 6 / 119


Então
u(t0 + h) − u(t)
u 0 (t0 ) = lim
h→0 h
0
∂f
∂x
(a, b)(ϕ (t0 )h + |h|1 (h)) + ∂f
∂y
(a, b)(ψ 0 (t0 )h + |h|2 (h))
= lim
h→0 h
(∆ϕ, ∆ψ) k(∆ϕ, ∆ψ)k
+ lim
h→0 h
∂f 0 ∂f
= (a, b)ϕ (t0 ) + (a, b)ψ 0 (t0 )
∂x ∂y
∂f ∂f
∂x
(a, b)|h|1 (h) + ∂y (a, b)|h|2 (h) + (∆ϕ, ∆ψ) k(∆ϕ, ∆ψ)k
+ lim .
h→0 h
Mostremos que esta última parcela é nula. Sabe-se que

( lim ∆ϕ = 0 ∧ lim ∆ψ = 0) ⇒ lim (∆ϕ, ∆ψ) = 0


h→0 h→0 h→0

AM II-C 21 de Abril de 2021 7 / 119


e consequentemente

lim (∆ϕ, ∆ψ) = 0.


h→0

Recordemos que se tem

∆ϕ = h(ϕ0 (t0 ) + E1 (h)), com lim E1 (h) = ± lim 1 (h) = 0,


h→0 h→0
0
∆ψ = h(ψ (t0 ) + E2 (h)), com lim E2 (h) = ± lim 2 (h) = 0
h→0 h→0

donde vem que


∂f ∂f
lim (a, b)|h|1 (h) + (a, b)|h|2 (h) = 0.
h→0 ∂x ∂y
Tem-se ainda
p
k(∆ϕ, ∆ψ)k = h2 (ϕ0 (t0 ) + E1 (h))2 + h2 (ψ 0 (t0 ) + E2 (h))2
p
=|h| (ϕ0 (t0 ) + E1 (h))2 + (ψ 0 (t0 ) + E2 (h))2

AM II-C 21 de Abril de 2021 8 / 119


donde
(∆ϕ, ∆ψ) k(∆ϕ, ∆ψ)k
lim
h→0 h
p
|h| (ϕ0 (t0 ) + E1 (h))2 + (ψ 0 (t0 ) + E2 (h))2
= lim (∆ϕ, ∆ψ) =0
h→0 h
e daqui se conclui que
∂f ∂f
u 0 (t0 ) = (a, b)ϕ0 (t0 ) + (a, b)ψ 0 (t0 ),
∂x ∂y
como pretendido.

AM II-C 21 de Abril de 2021 9 / 119


Teorema
Suponhamos que u resulta de compor a função z com as funções
x = ϕ(s, t), y = ψ(s, t), isto é, z = f (ϕ(s, t), ψ(s, t)); suponhamos
também que ϕ, ψ são diferenciáveis no ponto (s0 , t0 ) e que
z = f (x, y ) é diferenciável no ponto (x0 , y0 ) = (ϕ(s0 , t0 ), ψ(s0 , t0 )).
Nestas condições tem-se que
∂u ∂f ∂ϕ ∂f ∂ψ
(s0 , t0 ) = (x0 , y0 ) (s0 , t0 ) + (x0 , y0 ) (s0 , t0 )
∂s ∂x ∂s ∂y ∂s
e
∂u ∂f ∂ϕ ∂f ∂ψ
(s0 , t0 ) = (x0 , y0 ) (s0 , t0 ) + (x0 , y0 ) (s0 , t0 ).
∂t ∂x ∂t ∂y ∂t

Demonstração:
O resultado obtém-se fixando t = t0 (resp. s = s0 ) nas funções ϕ e
ψ e aplicando em seguida o último teorema.
AM II-C 21 de Abril de 2021 10 / 119
É usual apresentar o resultado deste último teorema na forma
matricial
∂ϕ ∂ϕ
 
   
∂u ∂u ∂f ∂f  ∂s ∂t 
=
∂s ∂t (s0 ,t0 ) ∂x ∂y (x0 ,y0 ) ∂ψ ∂ψ
 
∂s ∂t (s0 ,t0 )
e por vezes na forma mais intuitiva
∂x ∂x
 
   
∂z ∂z ∂z ∂z  ∂s ∂t 
=
∂s ∂x ∂y (x0 ,y0 ) ∂y ∂y
 
∂t (s0 ,t0 )
∂s ∂t (s0 ,t0 ).

AM II-C 21 de Abril de 2021 11 / 119


Exemplo
Seja F : R2 → R a função definida por

u(s, t) = F (s 2 − t 2 , t 2 − s 2 ).

Pretende-se mostrar que


∂u ∂u
t +s = 0.
∂s ∂t
Seja x = s 2 − t 2 e y = t 2 − s 2 . Tem-se
∂u ∂u ∂x ∂u ∂y ∂u ∂u
= + = (2s) + (−2s)
∂s ∂x ∂s ∂y ∂s ∂x ∂y
∂u ∂u ∂x ∂u ∂y ∂u ∂u
= + = (−2t) + (2t).
∂t ∂x ∂t ∂y ∂t ∂x ∂y

AM II-C 21 de Abril de 2021 12 / 119


Exemplo (continuação)
Então

   
∂u ∂u ∂u ∂u ∂u ∂u
t +s =t (2s) + (−2s) + s (−2t) + (2t)
∂s ∂t ∂x ∂y ∂x ∂y
∂u ∂u ∂u ∂u
= 2st − 2st − 2st + 2ts = 0,
∂x ∂y ∂x ∂y
o que prova o resultado pretendido.

AM II-C 21 de Abril de 2021 13 / 119


Generalização de alguns resultados anteriores a
funções definidas em Rn e com valores em Rm.

Seja f : D ⊂ Rn → Rm uma função definida num subconjunto de D


de Rn e com valores também num espaço euclidiano Rm ; trata-se de
uma função vectorial.
Os conceitos de limite e continuidade definem-se de forma análoga
aos das funções reais de variável real.
Dado a ∈ D, diz-se que limx→a f (x) = b se

∀δ > 0 ∃ε > 0 : ((∀x ∈ D ∧ ||x − a|| < ε) ⇒ ||f (x) − b|| < δ).

Dado a ∈ D, diz-se que f (x) é contı́nua em a se

∀δ > 0 ∃ε > 0 : ((∀x ∈ D ∧ ||x − a|| < ε) ⇒ ||f (x) − f (a)|| < δ).

AM II-C 21 de Abril de 2021 14 / 119


Fixada em Rn a base canónica {e1 , e2 , . . . , en }, designem-se por
x1 , x2 , . . . , xn as coordenadas de um ponto genérico deste espaço na
base considerada; analogamente fixada em Rm a base canónica
{1 , 2 , . . . , m }, designem-se por y1 , y2 , . . . , yn as coordenadas de um
ponto genérico deste espaço na base considerada.
A função
f : D ⊂ Rn → Rm
pode traduzir-se por y = f (x), com x = (x1 , x2 , . . . , xn ) e
y = (y1 , y2 , . . . , yn ) e, portanto,


 y1 = f1 (x) = f1 (x1 , x2 , . . . , xn )

y = f (x) = f (x , x , . . . , x )
2 2 2 1 2 n


 ...

ym = fm (x) = fm (x1 , x2 , . . . , xn ).

AM II-C 21 de Abril de 2021 15 / 119


Teorema
Seja f = (f1 , ..., fm ) : D ⊂ Rn → Rm , a ∈ D e b = (b1 , ..., bm ) ∈ Rm .
Então

lim f (x) = b se e só se lim fi (x) = bi , i = 1, 2, ..., m.


x→a x→a

Sendo f = (f1 , ..., fm ) : D ⊂ Rn → Rm , a ∈ int D e ~u ∈ Rn tal como


nas funções reais de n variáveis também se define neste caso
derivada de f no ponto a segundo o vetor ~u , ao limite

f (a + t~u ) − f (a)
lim ,
t→0 t
∂f
quando existe e representa-se por f~u0 (a) (D~u f )(a) ou (a)
∂~u
(observe-se que f~u0 (a) se trata-se de um vetor de Rm ).

AM II-C 21 de Abril de 2021 16 / 119


Na hipótese do limite anterior existir, este desdobra-se nas m
igualdades (uma para cada componente de f )
fi (a + t~u ) − fi (a)
(fi )~0u (a) = lim , i = 1, 2, ..., m.
t→0 t
Supondo que que cada fi é diferenciável no ponto a, dado ~u ∈ Rn foi
visto que
(fi )~0u (a) = (∇fi )(a) · ~u ,
o que permite escrever
∂f1 ∂f1 ∂f1  
 
 0 ··· u1
f1  ∂x1 ∂x2 ∂xn   
 ∂f2 ∂f2 ∂f2   u2 
 
 f2 
0
f~u (a) =  ..  (a) =  ∂x1
   ···  

.
. ∂x2 ∂xn  .
···

··· ···

···  .
.

fm ~u  ∂f
m ∂fm ∂fm 
 
··· un
∂x1 ∂x2 ∂xn
AM II-C 21 de Abril de 2021 17 / 119
A extensão do conceito de diferenciabilidade às funções vetoriais não
apresenta qualquer dificuldade.
Sendo f : D ⊂ Rn → Rm , a ∈ int D, diz-se que f é diferenciável no
ponto a se existir uma aplicação linear La : Rn → Rm tal que para
todo o h tal que a + h ∈ D, se tenha

f (a + h) − f (a) = La (h) + ||h||ε(h),

com limh→0 ε(h) = 0, ou equivalentemente, se existir uma matriz de


elementos reais,
 
α11 α12 · · · α1n
 α21 α22 · · · α2n 
L̃a =  ..
 
.. .. .. 
 . . . . 
αm1 αm2 · · · αmn
tal que
AM II-C 21 de Abril de 2021 18 / 119
f (a + h) − f (a) = L̃a h + ||h||ε(h),
com limh→0 ε(h) = 0 (observe-se que f (a + h) , f (a) , h e ε(h) são
matrizes coluna.)

Com f = (f1 , ..., fm ), a = (a1 , ..., an ) e h = (h1 , ..., hn ) em termos de


coordenadas, a última igualdade, escreve-se na forma

fi (a1 +h1 , ..., an +hn )−fi (a1 , ..., an )=αi1 h1 +...+αin hn +||h||εi (h1 , ..., hn ),

com limh→0 εi (h) = 0 para todo o i = 1, 2, ..., m, e a função f será


diferenciável no ponto a se e só se cada uma das suas funções
coordenadas fi o for.

AM II-C 21 de Abril de 2021 19 / 119


O que foi visto anterirmente para funções f : D ⊂ Rn → R, permite
concluir que
∂f1 ∂f1 ∂f1
 
  ···
α11 α12 · · · α1n  ∂x1 ∂x2 ∂xn 

 α21 α22 · · · α2n   ∂f2 ∂f2 ∂f2 

L̃a =  .. ···
..  =  ∂x1 ∂x2 .
   
.. .. ∂xn 
 . . . .   ··· ··· ··· ··· 

αm1 αm2 · · · αmn  ∂f
m ∂fm ∂fm 
···
∂x1 ∂x2 ∂xn (a)

Ainda na hipótese de f diferenciável no ponto a, à aplicação linear


La , chama-se derivada de f em a e representa-se, como é usual, por
f 0 (a).
À matriz L̃a , correspondente à aplicação linear La , chama-se matriz
jacobiana de f no ponto a e é usualmente representada por Jf (a) .

AM II-C 21 de Abril de 2021 20 / 119


Fixadas que estão em Rn e Rm as bases canónicas, existe uma
bijeção entre as aplicações lineares de Rn e Rm e as matrizes m × n
de coeficientes reais. É então usual identificar f 0 (a) com Jf (a) .
Sendo h um vetor arbitrário de Rn , ao valor da aplicação linear f 0 (a)
em h, f 0 (a)h, ainda se chama diferencial de f no ponto a relativo ao
vetor h, representa-se por df (a)h, e tendo em conta as igualdades

df (a)h = f 0 (a)h = f~h0 (a),

logo se vê que o diferencial de f em a relativo ao vetor h e a derivada


de f em a segundo o vector h são iguais e correspondem ao valor
derivada f 0 (a) em h.
Quando m = n a matriz jacobiana é quadrada podendo falar-se do
seu determinante, que é designado por Jacobiano e se representa por
∂(f1 , f2 , · · · , fm )
.
∂(x1 , x2 , · · · , xm )

AM II-C 21 de Abril de 2021 21 / 119


No caso particular, estudado anteriormente, em que f é uma função
real, a diferenciabilidade de f no ponto a escrita na forma

f (a + h) − f (a) = ∇f (a) · h + ||h||ε(h),

mostra que o gradiente de f em a não é mais do que a derivada de f


neste ponto, ou seja
∇f (a) = f 0 (a).

AM II-C 21 de Abril de 2021 22 / 119


Foi visto que era possı́vel existirem as derivadas Du~1 (a) e Du~2 (a) sem
que existisse Du~1 +u~2 (a), ou existindo, ter um valor diferente da soma
das duas derivadas anteriores. Tal não pode suceder se f for
diferenciável no ponto a. A igualdade

La (u) = D~u f (a),

mostra que D~u f (a) é uma função linear em ~u .

AM II-C 21 de Abril de 2021 23 / 119


Função composta – caso geral
Suponhamos que u resulta de compor f com g em que

g : A ⊂ Rn → Rm e f : B ⊂ Rm → Rp .

AM II-C 21 de Abril de 2021 24 / 119


Suponhamos que g (A) ⊂ B e que g e f são diferenciáveis. Tem-se
g = (g1 , g2 , . . . , gm ), f = (f1 , f2 , . . . , fp )
e, sendo x = (x1 , x2 , . . . , xn ), y = (y1 , y2 , . . . , ym )
 

 y1 = g1 (x) 
 z1 = f1 (y )

y = g (x) 
z = f (y )
2 2 2 2


 ... 

 ...
 
ym = gm (x), zp = fp (y ).

Sendo u = (u1 , u2 , . . . , up ) a função composta de f com g , vem que




 z1 = u1 (x) = f1 (g1 (x), g2 (x), . . . , gm (x))

z = u (x) = f (g (x), g (x), . . . , g (x))
2 2 2 1 2 m


 ...

zp = up (x) = fp (g1 (x), g2 (x), . . . , gm (x))
e
AM II-C 21 de Abril de 2021 25 / 119
 ∂u ∂u1 ∂u1 
1
···
 ∂x1 ∂x2 ∂xn 
 ∂u ∂u ∂u2 
 2 2
···

0
u (x) =  ∂x1 ∂x2 ∂xn 
 
··· ··· ··· ··· 
 
 ∂u ∂u ∂up 
p p
···
∂x1 ∂x2 ∂xn (p×n)
 
∂f1 ∂f1 ∂f1  ∂g1 ∂g1 ∂g1 
 ∂y1 ··· ···
 ∂y2 ∂ym 
  ∂x1 ∂x2 ∂xn 
 ∂f2 ∂f2 ∂f2   ∂g
 2 ∂g2 ∂g2 
··· ···
  
=
 ∂y1 ∂y2 ∂ym   ∂x1 ∂x2 ∂xn  .
  
··· ··· ··· ···   ···

··· ··· ··· 

 
 ∂fp ∂fp ∂fp   ∂g
m ∂g m ∂gm 
··· ···
∂y1 ∂y2 ∂ym (p×m) ∂x1 ∂x2 ∂xn (m×n)

AM II-C 21 de Abril de 2021 26 / 119


Ou na forma mais sugestiva

 ∂z ∂z1 ∂z1 
1
···
 ∂x1 ∂x2 ∂xn 
 ∂z ∂z ∂z2 
 2 2
· · ·

0
u (x) =  ∂x1 ∂x2 ∂xn 
 
··· ··· ··· ··· 
 
 ∂z ∂z ∂zp 
p p
···
∂x1 ∂x2 ∂xn (p×n)
 
∂z1 ∂z1 ∂z1  ∂y1 ∂y1 ∂y1 
 ∂y1 ··· ···
 ∂y2 ∂ym 
  ∂x1 ∂x2 ∂xn 
 ∂z2 ∂z2 ∂z2   ∂y
 2 ∂y2 ∂y2 
··· ···
  
=
 ∂y1 ∂y2 ∂ym   ∂x1 ∂x2 ∂xn  .
  
··· ··· ··· ···   ···

··· ··· ··· 

 
 ∂zp ∂zp ∂zp   ∂y
m ∂ym ∂ym 
··· ···
∂y1 ∂y2 ∂ym (p×m) ∂x1 ∂x2 ∂xn (m×n)

AM II-C 21 de Abril de 2021 27 / 119


Exemplo
Considerem-se as funções

g : R2 −→ R3
(ρ, θ) −→ (x, y , z) = (ρ cos θ, ρ sin θ, ρ)

f : R3 −→ R2
(x, y , z) −→ (u, v ) = (x 2 + y 2 , z)

Determine-se a matriz jacobiana de

h = f ◦ g.
Tem-se que

AM II-C 21 de Abril de 2021 28 / 119


Exemplo (continuação)

 ∂x ∂x
 
∂u ∂u ∂u  ∂ρ

∂u ∂u
 
 ∂y ∂θ 
 ∂ρ ∂θ  =  ∂x ∂y ∂z  ∂y 
h0 (ρ, θ) =  ∂v

 
∂v   ∂v ∂v ∂v   ∂ρ

∂θ 

 ∂z ∂z 
∂ρ ∂θ ∂x ∂y ∂z
∂ρ ∂θ
 
  cos θ −ρ sin θ
2x 2y 0  sin θ ρ cos θ 
=
0 0 1 (ρ cos θ,ρ sin θ,ρ)
1 0
 
2ρ 0
= .
1 0

AM II-C 21 de Abril de 2021 29 / 119


Exemplo
Considere-se a aplicação f : R+ 3
0 × [0, 2π[×R → R que a cada terno
(ρ, θ, z) faz corresponder (x, y , z) em que

x = f1 (ρ, θ, z) = ρ cos θ

y = f2 (ρ, θ, z) = ρ sin θ

z = f3 (ρ, θ, z) = z.

O Jacobiano é dado por


∂x ∂x ∂x
 
 ∂ρ ∂θ ∂z   
 ∂y cos θ −ρ sin θ 0
∂(f1 , f2 , f3 ) ∂y ∂y 

= det   = det  sin θ ρ cos θ 0 = ρ.

∂(ρ, θ, z)  ∂ρ ∂θ ∂z 
 ∂z ∂z ∂z  0 0 1
∂ρ ∂θ ∂z

AM II-C 21 de Abril de 2021 30 / 119


Teorema (Teorema dos acréscimos finitos)
Seja f uma função definida e continuamente derivável num conjunto
aberto e convexo D ⊂ R2 e (x0 , y0 ), (x0 + h, y0 + k) ∈ D. Então
existe θ ∈]0, 1[ tal que

∂f
f (x0 + h, y0 + k) − f (x0 , y0 ) = h (x0 + θh, y0 + θk)
∂x
∂f
+ k (x0 + θh, y0 + θk).
∂x

Demonstração. Seja (x, y ) tal que


(
x = g1 (t) = x0 + ht
t ∈ [0, 1].
y = g2 (t) = y0 + kt,

AM II-C 21 de Abril de 2021 31 / 119


Considere-se a função

ϕ(t) = f (g1 (t), g2 (t)) = f (x0 + ht, y0 + kt).

A função ϕ(t) está nas condições do teorema de Lagrange no


intervalo [0, 1], pelo que existe θ ∈]0, 1[ tal que ϕ(1) − ϕ(0) = ϕ0 (θ).
O resultado é agora imediato tendo em conta que
∂f dg1 ∂f dg2
ϕ0 (θ) = (x0 + θh, y0 + θk) (t) + (x0 + θh, y0 + θk) (t)
∂x dt ∂y dt
∂f ∂f
= (x0 + θh, y0 + θk)h + (x0 + θh, y0 + θk)k.
∂x ∂y

AM II-C 21 de Abril de 2021 32 / 119


O teorema anterior generaliza-se, sem qualquer dificuldade, ao caso
em que f é uma função definida e continuamente derivável num
conjunto aberto e convexo D ⊂ Rn . Com a = (a1 , a2 , ..., an ) e
h = (h1 , h2 , ..., hn ) tem-se que

f (a1 + h1 , · · · , an + hn ) − f (a1 , · · · , an )
∂f
= h1 (a1 + θh1 , · · · , an + θhn ) + · · ·
∂x1
∂f
+ hn (a1 + θh1 , · · · , an + θhn ), 0 < θ < 1.
∂x

AM II-C 21 de Abril de 2021 33 / 119


Diferenciais de ordem superior à primeira

Tal como foi visto, sendo f uma função real, definida num conjunto
D ⊂ R2 , diferenciável no ponto a ∈ int D, chamou-se diferencial da
função f no ponto a relativamente ao vetor u = (h, k) à soma

∂f ∂f
df (a)u := (a)h + (a)k.
∂x ∂y
Mostrou-se também que

df (a)u = f 0 (a)u = fu0 (a) = ∇f (a).u.

AM II-C 21 de Abril de 2021 34 / 119


Considere-se a função

fu0 : (x, y ) −→ fu0 (x, y ).

Sendo v = (s, r ) um vetor não nulo, ao limite

fu0 (a + tv ) − fu0 (a)


lim , t ∈ R, a ∈ int domfu0 ,
t→0 t
caso exista, chama-se derivada de segunda ordem de f segundo os
vetores u e v no ponto a e representa-se por fuv00 (a).

AM II-C 21 de Abril de 2021 35 / 119


Se f e fu0 são diferenciáveis no ponto a, tem-se que
∂f ∂f
fu0 (a) = (a)h + (a)k,
∂x ∂y
e
∂fu0 ∂f 0
fuv00 (a) = (a)s + u (a)r
∂x ∂y
   
∂ ∂f ∂f ∂ ∂f ∂f
= h+ k (a)s + h+ k (a)r
∂x ∂x ∂y ∂y ∂x ∂y
∂ 2f ∂ 2f ∂ 2f ∂ 2f
= 2 (a)hs + (a)ks + (a)hr + 2 (a)kr .
∂x ∂y ∂x ∂x∂y ∂y
Em particular quando u = v , tem-se que
∂ 2f ∂ 2f ∂ 2f ∂ 2f
fu002 (a) = 2 (a)h2 + (a)hk + (a)hk + 2 (a)k 2 .
∂x ∂y ∂x ∂x∂y ∂y

AM II-C 21 de Abril de 2021 36 / 119


Exemplo
Sendo
f (x, y ) = x 3 + xy
e u = (h, k) um vetor não nulo de R2 determine-se

fu002 (−1, 2).


Tem-se que

∂ 2f ∂ 2f
(−1, 2) = −6, (−1, 2) = 0,
∂x 2 ∂y 2
e
∂ 2f ∂ 2f
(−1, 2) = (−1, 2) = 1
∂x∂y ∂y ∂x
donde

fu002 (−1, 2) = −6h2 + 2hk.


AM II-C 21 de Abril de 2021 37 / 119
Chama-se diferencial de segunda ordem de f no ponto a
relativamente ao vetor u à derivada dirigida de segunda ordem fu002 (a)
e escreve-se

d 2 f (a)u 2 := fu002 (a).


Se f for de classe C 2 numa vizinhança do ponto a (que contenha
a + u), a expressão
d 2 f (a)u 2 = fu002 (a)
∂ 2f ∂ 2f ∂ 2f
= h2 2 (a) + 2hk (a) + k 2 2 (a)
∂x ∂x∂y ∂y
pode ser escrita, simbolicamente, como o desenvolvimento do
quadrado da soma
 2
∂ ∂
2 2
d f (a)u = fu002 (a) = h +k f (a).
∂x ∂y

AM II-C 21 de Abril de 2021 38 / 119


De modo análogo ao feito para a derivada de segunda ordem podem
definir-se derivadas de ordem n de f segundo um vetor não nulo u (f
de classe C n em alguma vizinhança de a que contenha a + u).
Podendo escrever-se simbolicamente
 n
n n (n) ∂ ∂
d f (a)u := fun (a) = h +k f (a).
∂x ∂y

Exemplo
Considere-se a função de classe C ∞ em R2 ,

f (x, y ) = e x + xy 4

e u = (h, k) um vetor não nulo de R2 . Determine-se

d 3 f (0, 1)u 3 .
Tem-se que
AM II-C 21 de Abril de 2021 39 / 119
Exemplo (continuação)
 3
3 3 ∂ ∂
d f (0, 1)u = h +k f (0, 1)
∂x ∂y
∂ 3 f (0, 1) 3
2 ∂ f (0, 1)
3
2 ∂ f (0, 1)
3
3 ∂ f (0, 1)
= h3 + 3h k + 3hk + k .
∂x 3 ∂x 2 ∂y ∂x∂y 2 ∂y 3
Tem-se que

∂ 3 f (0, 1) ∂ 3 f (0, 1)
= (e x )(0, 1) = 1; = 0,
∂x 3 ∂x 2 ∂y
∂ 3 f (0, 1) 2 ∂ 3 f (0, 1)
= (12y )(0, 1) = 12; = (24xy 2 )(0, 1) = 0,
∂x∂y 2 ∂y 3
donde

d 3 f (0, 1)u 3 = h3 + 36hk 2 .

AM II-C 21 de Abril de 2021 40 / 119


Fórmula de Taylor

Teorema (Teorema de Taylor)


Sejam, f : D ⊂ R2 → R uma função definida e continuamente
derivável até à ordem (n + 1) no conjunto aberto e convexo D e
(x0 , y0 ), (x0 + h, y0 + k) ∈ D. Então existe θ ∈]0, 1[ tal que
1 2
f (x0 + h, y0 + k) = f (x0 , y0 ) + df (x0 , y0 )(h, k) + d f (x0 , y0 )(h, k)2
2!
1 n
+··· + d f (x0 , y0 )(h, k)n + Rn+1 ,
n!
com
1
Rn+1 = d n+1 f ((x0 + θh, y0 + θk)(h, k)n+1
(n + 1)!

AM II-C 21 de Abril de 2021 41 / 119


Observe-se que

 m
m m ∂ ∂
d f (x0 , y0 )(h, k) = h +k f (x0 , y0 )
∂x ∂y
m
∂mf m
 
m∂ f m m−1 m∂ f
=h (x ,
0 0y ) + h k (x ,
0 0y ) + · · · + k (x0 , y0 )
∂x m 1 ∂x m−1 ∂y ∂y m
m  
X m m−j j ∂ m f
= h k m−j ∂y j
(x0 , y0 ), m = 1, 2, · · · , n.
j=0
j ∂x

AM II-C 21 de Abril de 2021 42 / 119


Demonstração. Considere-se a função continuamente derivável até à
ordem n + 1

ϕ(t) = f (g1 (t), g2 (t)) = f (x0 + ht, y0 + kt).

A fórmula de Mac-Laurin para funções reais de variável real aplicada


a ϕ(t), permite afirmar que existe θ ∈]0, 1[ tal que

1 00 1 1
ϕ(1) = ϕ(0) + ϕ0 (0) + ϕ (0) + · · · + ϕ(n) (0) + ϕ(n+1) (θ),
2! n! (n + 1)!

AM II-C 21 de Abril de 2021 43 / 119


Tem-se que
ϕ(1) = f (x0 + h, y0 + k) e ϕ(0) = f (x0 , y0 ),
de
∂f ∂f
ϕ0 (t) = h (x0 + ht, y0 + kt) + k (x0 + ht, y0 + kt),
∂x ∂y
vem que
∂f ∂f
ϕ0 (0) = (x0 , y0 )h + (x0 , y0 )k,
∂x ∂y
de
2
00 f 2∂ ∂ 2f
ϕ (t) =h (x0 + ht, y0 + kt) + 2hk (x0 + ht, y0 + kt)
∂x 2 ∂x∂y
2
2∂ f
+k (x0 + ht, y0 + kt),
∂y 2
vem que
2
00 2∂ f ∂ 2f 2
2∂ f
ϕ (0) = h (x0 , y0 ) + 2hk (x0 , y0 ) + k (x0 , y0 ).
∂x 2 ∂x∂y ∂y 2
AM II-C 21 de Abril de 2021 44 / 119
Genericamente

n
∂nf
 
(n) fn∂ n n−1
ϕ (t)=h (x0 + ht, y0 + kt)+ h k n−1 (x0 + ht, y0 + kt)
∂x n 1 ∂x ∂y
n
∂ f
+ · · · + k n n (x0 + ht, y0 + kt)
∂y
n  
X n n−j j ∂ n f
= h k n−j ∂y j
(x0 + ht, y0 + kt);
j=0
j ∂x

pelo que

n
∂nf
 
(n) f n∂ n n−1
ϕ (0) =h (x ,
0 0 y ) + h k (x0 , y0 ) + · · ·
∂x n 1 ∂x n−1 ∂y
n n  
n∂ f
X n n−j j ∂ n f
+k (x 0 , y 0 ) = h k (x0 , y0 ).
∂y n j=0
j ∂x n−j ∂y j

AM II-C 21 de Abril de 2021 45 / 119


Tem-se ainda que

∂ n+1 f
ϕ(n+1) (θ) =hn+1 (x0 + θh, y0 + θk) + · · ·
∂x n+1
∂ n+1 f
+k n+1 n+1 (x0 + θh, y0 + θk)
∂y
n
X n ∂nf

= hn−j k j n−j j (x0 + θh, y0 + θk).
j=0
j ∂x ∂y

Estas expressões, substituidas em

1 00 1 1
ϕ(1) = ϕ(0) + ϕ0 (0) + ϕ (0) + · · · + ϕ(n) (0) + ϕ(n+1) (θ),
2! n! (n + 1)!

conduzem à fórmula pretendida.

AM II-C 21 de Abril de 2021 46 / 119


Fazendo x − x0 = h e y − y0 = k em

∂f ∂f
f (x0 + h, y0 + k) = f (x0 , y0 ) + h (x0 , y0 ) + k (x0 , y0 )
∂x ∂y
2 2 2
 
1 2∂ f ∂ f 2∂ f
+ h (x0 , y0 ) + 2hk (x0 , y0 ) + k (x0 , y0 ) + · · ·
2! ∂x 2 ∂x∂y ∂y 2
1 n ∂nf ∂nf
 
n n−1
+ [h (x 0 , y 0 ) + h k (x0 , y0 ) + · · ·
n! ∂x n 1 ∂x n−1 ∂y
∂nf n
 
n n∂ f
+ hk n−1 (x ,
0 0y ) + k (x0 , y0 )] + Rn+1 ,
n−1 ∂x∂y n−1 ∂y n

obtém-se a fórmula de Taylor na forma

AM II-C 21 de Abril de 2021 47 / 119


∂f ∂f
f (x, y ) =f (x0 , y0 ) + (x − x0 ) (x0 , y0 ) + (y − y0 ) (x0 , y0 )
∂x ∂y
2
1 2 ∂ f ∂ 2f
+ [(x − x0 ) (x0 , y0 ) + 2(x − x0 )(y − y0 ) (x0 , y0 )
2! ∂x 2 ∂x∂y
2 n
2∂ f 1 n∂ f
+(y − y0 ) (x0 , y0 )] + · · · + [(x − x0 ) (x0 , y0 )
∂y 2 n! ∂x n
∂nf
 
n n−1
+ (x − x0 ) (y − y0 ) n−1 (x0 , y0 ) + · · ·
1 ∂x ∂y
∂nf
 
n
+ (x − x0 )(y − y0 )n−1 (x0 , y0 )
n−1 ∂x∂y n−1
n
n∂ f
+(y − y0 ) (x0 , y0 )] + Rn+1 ,
∂y n

AM II-C 21 de Abril de 2021 48 / 119


em que
1 ∂ n+1 f
Rn+1 = [(x − x0 )n+1 n+1 (x0 + θ(x − x0 ), y0 + θ(y − y0 ))
(n + 1)! ∂x
∂ n+1 f
+ · · · + (y − y0 )n+1 n+1 (x0 + θ(x − x0 ), y0 + θ(y − y0 ))],
∂y
que, de uma forma condensada, se escreve

k  
n X
X k ∂f
f (x, y ) = (x − x0 )j (y − y0 )k−j (x0 , y0 ) + Rn+1 .
k=0 j=0
j ∂x j ∂y k−j

É possı́vel mostrar que o resto Rn+1 é um infinitésimo de ordem


superior a ||(h, k)||n isto é,
Rn+1
lim = 0.
||(h,k)||→0 ||(h, k)||n

AM II-C 21 de Abril de 2021 49 / 119


Exemplo
Pretende-se desenvolver a função f (x, y ) = x 3 y 2 + 5xy − 1 em
potências de x e y − 1. Consideremos (x0 , y0 ) = (0, 1) e calculemos
as derivadas:
∂f ∂f
(0, 1) = −1, (0, 1) = 0,
∂x ∂y
2 2
∂ f ∂ f ∂ 2f
(0, 1) = (0, 1) = 0, (0, 1) = 5,
∂x 2 ∂y 2 ∂x∂y
∂ 3f ∂ 3f ∂ 3f ∂ 3f
(0, 1) = 6, 2 (0, 1) = (0, 1) = 3 (0, 1) = 0,
∂x 3 ∂x ∂y ∂x∂y 2 ∂x
4 4 4
∂ f ∂ f ∂ f ∂ 4f
(0, 1) = 12, (0, 1) = (0, 1) = (0, 1) = 0,
∂x 3 ∂y ∂x 4 ∂x 2 ∂y 2 ∂x∂y 3
∂ 5f
(0, 1) = 12.
∂x 3 ∂y 2

AM II-C 21 de Abril de 2021 50 / 119


Exemplo (continuação)
Então

f (x, y ) = −1 + (x · 5 + (y − 1) · 0)
1
+ [x 2 · 0 + 2x(y − 1) · 5 + (y − 1)2 · 0]
2!
1
+ [x 3 · 6 + 3x 2 (y − 1) · 0 + 3x(y − 1)2 · 0 + (y − 1)3 · 0]
3!
1
+ [x 4 · 0 + 4x 2 (y − 1) · 12 + 6x(y − 1)2 · 0
4!  
2 3 1 5 3
+4x(y − 1) · 0 + (y − 1) · 0] + x (y − 1)2 · 12
5! 3

isto é,

f (x, y ) = −1 + 5x + 5x(y − 1) + x 3 + 2x 3 (y − 1) + x 3 (y − 1)2 .

AM II-C 21 de Abril de 2021 51 / 119


Exemplo
Determine-se uma aproximação linear e quadrática do valor

(3.98 − 1)2
.
(5.97 − 3)2

Considere-se a função

(x − 1)2
f (x, y ) = .
(y − 3)3

Seja (x0 , y0 ) = (4, 6) e (h, k) = (−0.02, −0, 03).

AM II-C 21 de Abril de 2021 52 / 119


Exemplo
Para os valores de (x0 , y0 ) = (4, 6) e (h, k) = (−0.02, −0, 03), tem-se
que

(3.98 − 1)2
= f (x0 + h, y0 + k).
(5.97 − 3)2
A aproximação linear é
∂f ∂f
f (x0 , y0 ) + h
(x0 , y0 ) + k (x0 , y0 )
∂x ∂y
2 2
= 1 + (−0.02) − (−0.03) = 1.00666.
3 3

AM II-C 21 de Abril de 2021 53 / 119


Exemplo (continuação)
A aproximação quadrática é
∂f ∂f
f (x0 , y0 ) + h (x0 , y0 ) + k (x0 , y0 ) +
∂x ∂y
2
∂ 2f 2
 
1 2∂ f 2∂ f
h (x0 , y0 ) + 2hk (x0 , y0 ) + k (x0 , y0 )
2! ∂x 2 ∂x∂y ∂y 2
2 2 2 4
= 1 + (−0.02) − (−0.03) + (−0.022 ) − (−0.02)(−0.03) +
3 3 9 9
2 (−0.03)2
= 1.00674.
3 2

(3.98 − 1)2
O valor exato de , é
(5.97 − 3)2

(3.98 − 1)2
= 1.00675.
(5.97 − 3)2
AM II-C 21 de Abril de 2021 54 / 119
Funções implı́citas

Neste parágrafo iremos tratar de um assunto, usualmente referido


como funções implı́citas e cujo resultado central é o importante,
teorema das funções implı́citas. Para termos uma ideia do assunto a
tratar, iremos ver alguns exemplos. Comecemos por recordar o
conceito de função definida implicitamente por uma equação. Na
definição que se segue a função considerada é real e depende de duas
variáveis reais mas pode, com as adaptações óbvias, ser reformulada
para o caso da função ser real mas depender de mais do que de duas
variáveis reais.

AM II-C 21 de Abril de 2021 55 / 119


Definição
Seja F : U ⊂ R2 −→ R. Diz-se que a equação F (x, y ) = 0 define
implicitamente y como função de x numa vizinhança de (x0 , y0 ) ∈ U
tal que F (x0 , y0 ) = 0, se existirem dois intervalos I =]x0 − α, x0 + α[
e J =]y0 − β, y0 + β[ (α e β números reais positivos), com
I × J ⊂ U e uma função φ : I −→ J, tais que

∀(x, y ) ∈ I × J, F (x, y ) = 0 se e só se y = φ(x).

Também se diz que a função y = φ(x) é definida implicitamente por


F (x, y ) = 0 numa vizinhança de (x0 , y0 ).

AM II-C 21 de Abril de 2021 56 / 119


Exemplo
Considere-se a equação

f (x, y , z) = x + y 2 + z − 1 = 0.

É fácil verificar que a partir desta equação é possı́vel definir uma


função φ(x, y ), dada por

z = φ(x, y ) = 1 − x − y 2 ,

tal que para cada (x, y ) corresponde um único valor de z = φ(x, y )


tal que f (x, y , φ(x, y )) = 0.

AM II-C 21 de Abril de 2021 57 / 119


Exemplo
Considere-se a função

g (x, y ) = x 4 − y 2

e um ponto (x0 , y0 ) tal que g (x0 , y0 ) = 0.


Supondo que x0 6= 0 existe um retângulo I × J centrado em (x0 , y0 )
no qual a equação g (x, y ) = 0 pode ser univocamente resolvida em
ordem a y . Fica assim definida uma função y = f (x), tal que para
(x, y ) ∈ I × J as condições

g (x, y ) = 0 e y = f (x),

são equivalentes. Ter-se-á

y = f (x) = x 2 , se y0 > 0 e y = f (x) = −x 2 , se y0 < 0.

AM II-C 21 de Abril de 2021 58 / 119


Exemplo (continuação)
O que foi dito pode ser reformulado da seguinte forma. Se x0 6= 0,
existirão números positivos α e β, tais que, para cada

x ∈]x0 − α, x0 + α[,

corresponde um e um só valor de

y ∈]y0 − β, y0 + β[,

tal que para este par (x, y ) se verifica a igualdade g (x, y ) = 0.

AM II-C 21 de Abril de 2021 59 / 119


Exemplo (continuação)

Suponhamos agora que x0 = 0 (ter-se-á também que y0 = 0 uma vez


que g (x0 , y0 ) = 0).
Neste caso teremos que, quaisquer que sejam os números positivos α
e β haverá sempre valores de x no intervalo ] − α, α[ para cada um
dos quais a equação g (x, y ) = 0 não determinará univocamente um
valor de y no intervalo ] − β, β[.
Veremos posteriormente que este facto está relacionado com o
anulamento da derivada parcial de g em ordem a y no ponto (0, 0).

Vamos, em seguida, enunciar um teorema que nos dá condições


suficientes para que uma equação da forma F (x, y , z) = 0 defina
implicitamente z como função de x e y em alguma vizinhança de um
determinado ponto (x0 , y0 , z0 ).
AM II-C 21 de Abril de 2021 60 / 119
Teorema (da função implı́cita – Caso I)
Seja F : D ⊂ R2 × R −→ R, D um conjunto aberto, F ∈ C 1 (D) e
(x0 , y0 , z0 ) ∈ D. Suponhamos que:
∂F
1. F (x0 , y0 , z0 ) = 0, 2. (x0 , y0 , z0 ) 6= 0.
∂z
Nestas condições tem-se que

1. Existem intervalos I1 =]x0 − α1 , x0 + α1 [, I2 =]y0 − α2 , y0 + α2 [ e


J =]z0 − β, z0 + β[ (α1 , α2 e β números reais positivos), com
I1 × I2 × J ⊂ U e uma função φ : I1 × I2 −→ J, tais que

∀(x, y , z) ∈ I1 × I2 × J, F (x, y , z) = 0 se e só se z = φ(x, y ).

AM II-C 21 de Abril de 2021 61 / 119


Teorema (da função implı́cita – Caso I)
2. A função φ(x, y ) é de classe C 1 em I1 × I2 e tem-se que

∂F ∂F
(x0 , y0 , z0 ) ∂φ (x0 , y0 , z0 )
∂φ ∂y
(x0 , y0 ) = − ∂x ; (x0 , y0 ) = −
∂x ∂F ∂y ∂F
(x0 , y0 , z0 ) (x0 , y0 , z0 )
∂z ∂z
Observe-se que, em geral, não é possı́vel determinar a função
z = φ(x, y ) nem dizer qual a vizinhança onde está definida; no
entanto é possı́vel determinar as derivadas parciais desta função no
ponto (x0 , y0 ).

AM II-C 21 de Abril de 2021 62 / 119


Exemplo
Mostre que a equação

x + y + z − sin(xyz) = 0,

define numa vizinhança de (0, 0, 0) uma função z = φ(x, y ) e calcule


∂φ ∂φ
(0, 0) e (0, 0).
∂x ∂y
Comecemos por verificar as condições do teorema. A função
f (x, y , z) = x + y + z − sin(xyz) é de classe C 1 em R3 .
Tem-se também que:
1. f (0, 0, 0) = 0,
∂f
2. (0, 0, 0) = (1 − xy sin(xyz))(0,0,0) = 1 6= 0.
∂z

AM II-C 21 de Abril de 2021 63 / 119


Exemplo (continuação)
Então, pelo teorema anterior, podemos afirmar que existem intervalos
I1 =] − α1 , α1 [, I2 =] − α2 , α2 [ e J =] − β, β[ (α1 , α2 e β números
reais positivos) e uma função φ : I1 × I2 −→ J, tal que se tem
z = φ(x, y ), para todo (x, y ) ∈ I1 × I2 . Tendo em conta que
∂f ∂f
(0, 0, 0) = 1 e (0, 0, 0) = 1,
∂x ∂y
tem-se
∂f ∂f
(0, 0, 0) (0, 0, 0)
∂φ ∂φ ∂y
(0, 0) = − ∂x = −1 e (0, 0) = − = −1.
∂x ∂f ∂y ∂f
(0, 0, 0) (0, 0, 0)
∂z ∂z

AM II-C 21 de Abril de 2021 64 / 119


Exemplo (continuação)
Alternativamente, derivando

x + y + φ(x, y ) − sin(xy φ(x, y )) = 0

em ordem a x e a y , vem
∂φ ∂φ
1+ (x, y ) − (y φ(x, y ) + xy (x, y )) cos(xy φ(x, y )) = 0
∂x ∂x
∂φ ∂φ
1+ (x, y ) − (x φ(x, y ) + xz (x, y )) cos(xy φ(x, y )) = 0.
∂y ∂y

Fazendo (x, y ) = (0, 0) e resolvendo o sistema obtido em ordem a


∂φ ∂φ
(0, 0) e a (0, 0) vem, de novo, que
∂x ∂y
∂φ ∂φ
(0, 0) = (0, 0) = −1.
∂x ∂y
AM II-C 21 de Abril de 2021 65 / 119
Teorema (da função implı́cita – Caso II)
Seja F = (F1 , F2 ) : D ⊂ R3 × R2 −→ R2 , D um conjunto aberto,
F1 , F2 ∈ C 1 (D) e (a0 , b0 ) = (x0 , y0 , z0 , u0 , v0 ) ∈ D. Suponhamos que:

1. F1 (a0 , b0 ) = F2 (a0 , b0 ) = 0,
∂(F1 , F2 )
2. D = (a0 , b0 ) 6= 0.
∂(u, v )

Nestas condições tem-se que

1. Existem intervalos abertos I de R3 centrado em a0 = (x0 , y0 , z0 )


e J de R2 centrado em b0 = (u0 , v0 ), com I × J ⊂ D e uma função

φ = (φ1 , φ2 ) : I −→ J,

tais que
AM II-C 21 de Abril de 2021 66 / 119
Teorema (da função implı́cita – Caso II)

∀(x, y , z, u, v ) ∈ I × J, F1 (x, y , z, u, v ) = 0 ∧ F2 (x, y , z, u, v ) = 0

se e só se
u = φ1 (x, y , z) ∧ v = φ2 (x, y , z).
2. As funções φ1 (x, y , z) e φ2 (x, y , z) são de classe C 1 em I e

∂φ1 1 ∂(F1 , F2 ) ∂φ2 1 ∂(F1 , F2 )


(a0 ) = − (a0 , b0 ), (a0 ) = − (a0 , b0 ).
∂x D ∂(x, v ) ∂x D ∂(u, x)

∂φ1 ∂φ2 ∂φ1


Têm-se expressões análogas para (a0 ), (a0 ) e (a0 ),
∂y ∂y ∂z
∂φ2
(a0 ).
∂z

AM II-C 21 de Abril de 2021 67 / 119


Exemplo
Mostre que o sistema
(
uv − x 2 = 0
log(uv ) − 2y = 0

define implicitamente u e v como função de x e y numa vizinhança


∂u ∂v
do ponto (x0 , y0 , u0 , v0 ) = (1, 0, 1, 1). Determine (1, 0) e (1, 0).
∂y ∂y

Seja F = (F1 , F2 ) : D ⊂ R2 × R2 → R2 onde

F1 (x, y , u, v ) = u v − x 2 e F2 (x, y , u, v ) = log(uv ) − 2y .

AM II-C 21 de Abril de 2021 68 / 119


Exemplo (continuação)
As derivadas parciais de F1 e F2
∂F1 ∂F1 ∂F1 ∂F1
= −2x, = 0, = vu v −1 , = u v log(u),
∂x ∂y ∂u ∂v
∂F2 ∂F2 ∂F2 1 ∂F2 1
= 0, = −2, = , = ,
∂x ∂y ∂u u ∂v v

são contı́nuas no seu domı́nio, R2 ×]0, +∞[×]0, +∞[ que é um


conjunto aberto.
Tem-se que, F1 (1, 0, 1, 1) = 0 e F2 (1, 0, 1, 1) = 0, e
v −1 v
∂(F1 , F2 ) vu u log(u)
1 0
= 1

1 =
= 1 6= 0.
∂(u, v ) (1,0,1,1) 1 1


u v (1,0,1,1)

AM II-C 21 de Abril de 2021 69 / 119


Exemplo (continuação)
Pelo teorema anterior existem existem intervalos abertos I de R2
centrado em a0 = (1, 0) e J de R2 centrado em b0 = (1, 1) e uma
função
φ = (φ1 , φ2 ) : I −→ J,
continuamente derivável em I , tal que

u = φ1 (x, y ) e v = φ2 (x, y ), ∀(x, y ) ∈ I .

Tem-se ainda que

AM II-C 21 de Abril de 2021 70 / 119


Exemplo (continuação)

∂F1 ∂F1

∂y ∂v

∂F2 ∂F2 0 0

∂φ1 ∂y ∂v 2 1
(1, 0) = (1, 0, 1, 1) = = 0,
∂y ∂(F1 , F2 ) 1
∂(u, v )

∂F1 ∂F 1

∂u −
∂y

∂F2 ∂F2 1 0
∂u − ∂y

∂φ2 1 2
(1, 0) = (1, 0, 1, 1) = = 2.
∂y ∂(F1 , F2 ) 1
∂(u, v )

AM II-C 21 de Abril de 2021 71 / 119


Exemplo (continuação)
Alternativamente, derivando cada uma das equações
( v
u − x2 = 0
log(uv ) − 2y = 0

em ordem a y , vem que



∂u ∂v

vu v −1 + u v log u =0
∂y ∂y



∂u ∂v

 ∂y + ∂y = 2.



u v

AM II-C 21 de Abril de 2021 72 / 119


Exemplo (continuação)
Substituindo (x, y ) no ponto (1, 0) vem que

∂u
 (1, 0) = 0


∂y
∂u ∂v
 (1, 0) + (1, 0) = 2,


∂y ∂y

tal como já tinha sido obtido, quando foram utilizadas as expressões
das derivadas, referidas no teorema.

AM II-C 21 de Abril de 2021 73 / 119


Teorema (Teorema da função implı́cita – caso geral)
Seja F = (F1 , F2 , ..., Fm ) : D ⊂ Rn × Rm −→ Rm , D um conjunto
aberto, F1 , F2 , ..., Fm ∈ C 1 (D) e (a, b) = (a1 , ..., an , b1 , ..., bm ) ∈ D.
Suponhamos que:
1. F1 (a, b) = F2 (a, b) = ... = Fm (a, b) = 0,
∂(F1 , F2 , ..., Fm )
2. D = (a, b) 6= 0.
∂(y1 , ..., ym )

Nestas condições tem-se que

1. Existem intervalos abertos I de Rn centrado em a e J de Rm


centrado em b, com I × J ⊂ D e uma função

φ = (φ1 , φ2 , ..., φm ) : I −→ J,

tais que
AM II-C 21 de Abril de 2021 74 / 119
Teorema (continuação)
para todo (x1 , ..., xn , y1 , ..., ym ) ∈ I × J,

F1 (x1 , ..., xn , y1 , ..., ym ) = 0, ..., Fm (x1 , ..., xn , y1 , ..., ym ) = 0,

se e só se

y1 = φ1 (x1 , ..., xn ), ..., ym = φm (x1 , ..., xn ).

2. As funções φ1 (x1 , ..., xn ), ..., φm (x1 , ..., xn ) são de classe C 1 em I e

∂(F1 , F2 , · · · , Fm )
(a, b)
∂φi ∂(y1 , · · · , yi−1 , xj , yi+1 , · · · , ym )
(a) = − ,
∂xj ∂(F1 , F2 , · · · , Fm )
(a, b)
∂(y1 , y2 , · · · , ym )
com i = 1, · · · , m, j = 1, · · · , n.

AM II-C 21 de Abril de 2021 75 / 119


Teorema (da função inversa)
Seja D um conjunto aberto de Rn , F : D ⊂ Rn −→ Rn , uma
função de classe C 1 em D, definida pelas n condições
yi = Fi (x1 , ..., xn ), i = 1, ..., n.
∂(F1 , · · · , Fm )
Dado a ∈ D suponhamos que det(f 0 (a)) = (a) 6= 0.
∂(x1 , · · · , xm )
Nestas condições existem conjuntos abertos A ⊂ D e B ⊂ f (D) tais
que:
1. a ∈ A, f (a) ∈ B;
2. f/A (f restrita a A) é uma bijecção de A sobre B;
3. A função inversa de f/A é de classe C 1 em B;
4. (f −1 )0 (y ) = (f 0 (x))−1 , onde x = f −1 (y ), y ∈ B.

AM II-C 21 de Abril de 2021 76 / 119


Exemplo
Seja
F : D ⊂ R2 → R2
(x, y ) → (u, v ),
onde u = F1 (x, y ) = e x cos y e v = F2 (x, y ) = e x sin y . As derivadas
parciais
∂F1 ∂F2 ∂F1 ∂F2
= e x cos y , = e x sin y , = −e x sin y , = e x cos y
∂x ∂x ∂y ∂y

são de classe C 1 em R2 e dado (x0 , y0 ) ∈ R2 , tem-se que


x
e cos y −e x sin y
det(F 0 (x0 , y0 )) = = e 2x0 6= 0.


e x sin y e x cos y
(x ,y )
0 0

AM II-C 21 de Abril de 2021 77 / 119


Exemplo (continuação)

Pelo teorema da função inversa f é localmente injectiva em R2 , isto


é, dado (x0 , y0 ) ∈ R2 , existem abertos A e B tais que (x0 , y0 ) ∈ A,
F (x0 , y0 ) ∈ B e F é uma bijecção de A sobre B de classe C 1 , cuja
inversa (F −1 )/B ainda é de classe C 1 (isto é, é um difeomomorfismo
de de classe C 1 de A sobre B).
 π  π √ √ !
2 2
Dado 0, ∈ R2 , F 0, = , , tem-se que
4 4 2 2
√ √ 
2 2
 2 − 2 
 x 
0
 π e cos y −e x sin y
F 0, = x =
√ √  ,
4 e sin y e x cos y (0, π ) 2 2
4

2 2

AM II-C 21 de Abril de 2021 78 / 119


Exemplo (continuação)
e   π 
det F 0 0, ) = 1 6= 0.
4
Pelo teorema da função!inversa existem abertos A e B tais que
 π √ √
2 2
0, ∈ A, , ∈ B e a função F é um difeomomorfismo
4 2 2
de classe C 1 de A sobre B.
Calcule-se √ √ !
2 2
(F −1 )0 , .
2 2

AM II-C 21 de Abril de 2021 79 / 119


Exemplo (continuação)
Tem-se que

√ √ −1  √ √ 
2 2 2 2
√ √ 
−1

(F −1 )0 22 , 22 = F 0 0, π4 2 2   2 √2 
    
 √2 √2  =  −√2
=
2
.

2 2 2 2
Observe-se que a função F , não é no entanto, globalmente invertı́vel
em R2 uma vez que não é injectiva em R2 ; tem-se por exemplo que,
F (0, 0) = F (0, 2π).

AM II-C 21 de Abril de 2021 80 / 119


Extremos

Seja f : D ⊂ Rn → R e x0 ∈ int D. Diz-se que f (x0 ) é um mı́nimo


local ou relativo da função f , se existir B(x0 , δ) tal que

f (x0 ) ≤ f (x), ∀x ∈ B(x0 , δ).

Ao ponto x0 chama-se um minimizante local da função f .


Analogamente, diz-se que f (x0 ) é um máximo local ou relativo da
função f , se existir B(x0 , δ) tal que

f (x0 ) ≥ f (x), ∀x ∈ B(x0 , δ).

Ao ponto x0 chama-se um maximizante local da função f .


Diz-se que f (x0 ) é um extremo local ou relativo de f se for um
mı́nimo local ou um máximo local.

AM II-C 21 de Abril de 2021 81 / 119


Figura: Extremos locais.

AM II-C 21 de Abril de 2021 82 / 119


Seja f : D ⊂ Rn → R e x0 ∈ D. Diz-se que f (x0 ) é um mı́nimo
absoluto de f se
f (x0 ) ≤ f (x), ∀x ∈ D.
Analogamente, diz-se que f (x0 ) é um máximo absoluto de f se

f (x0 ) ≥ f (x), ∀x ∈ D.

Diz-se que f (x0 ) é um extremo absoluto de f se for um mı́nimo


absoluto ou um máximo absoluto.
Observe-se que os extremos absolutos, quando existem, também são
extremos locais.

AM II-C 21 de Abril de 2021 83 / 119


O teorema seguinte fornece uma condição suficiente para que uma
função real definida num subconjunto de Rn , tenha nesse conjunto
máximo e mı́nimo absolutos.

Teorema (Teorema de Weierstrass)


Seja D ⊂ Rn um conjunto fechado e limitado (compacto) e
f : D ⊂ Rn −→ R uma função contı́nua. Então f tem em D um
máximo e um mı́nimo.

Observe-se que o teorema de Weierstrass é apenas um teorema de


existência e não fornece qualquer processo para a determinação dos
extremos. O teorema também não permite concluir a unicidade de
qualquer dos extremos.

AM II-C 21 de Abril de 2021 84 / 119


Definição
Seja f : D ⊂ Rn → R, a ∈ int D. O ponto a diz-se um ponto crı́tico
ou de estacionaridade de f se:
∂f
1 Pelo menos uma das derivadas (a), i ∈ {1, · · · , n} não
∂xi
existir, ou
∂f
2 (a) = 0, ∀i ∈ {1, · · · , n}.
∂xi

Teorema
Seja f : D ⊂ Rn → R, a ∈ int D. Suponhamos que f tem um
extremo local no ponto a e que existem todas as derivadas parciais de
f no ponto a. Então a é ponto de estacionaridade de f .

AM II-C 21 de Abril de 2021 85 / 119


Demonstração. Suponhamos que a é um extremo relativo de f .
Dado i ∈ {1, · · · , n}, a função real de variável real ψ(t) = f (a + tei ),
definida para valores de t suficientemente pequenos de forma a que
(a + tei ∈ B(a, δ)), tem um extremo quando t = 0.
É um resultado conhecido das funções reais de variável real, que
nestas condições, ψ 0 (0) = 0; mas

ψ(h) − ψ(0) f (a + hei ) − f (a) ∂f


ψ 0 (0) = lim = lim = (a),
h→0 h h→0 h ∂xi
pelo que
∂f
(a) = 0, i ∈ {1, · · · , n}.
∂xi
É importante observar que o facto de as derivadas se anularem
(quando existem) no ponto a, é condição necessária, mas não
suficiente, para a existência de um extremo local no ponto a.
AM II-C 21 de Abril de 2021 86 / 119
Existem pontos de estacionaridade que não são extremos relativos,
isto é, pode acontecer que f tenha derivadas parciais todas nulas
num ponto a, mas em qualquer vizinhança de a exista, pelo menos
um ponto x1 tal que f (x1 ) < f (a) e exista um ponto x2 tal que
f (x2 ) > f (a). Estes pontos, quando existem, são designados por
pontos de sela.

Exemplo
1. Seja f (x, y ) = x 2 − y 2 e determinemos os seus pontos crı́ticos.
Tendo em conta que
 
∂f ∂f
, = (0, 0) ⇔ (2x, −2y ) = (0, 0)
∂x ∂y

conclui-se que (0, 0) é o único ponto crı́tico.

AM II-C 21 de Abril de 2021 87 / 119


Exemplo (continuação)
Considerando pontos da forma (x, 0), com x 6= 0, tem-se que
f (x, 0) = x 2 > 0 = f (0, 0); mas quando se consideram pontos da
forma (0, y ), com y 6= 0 vem que f (0, y ) = −y 2 < 0 = f (0, 0), o que
permite concluir que (0, 0) é ponto de sela.
2. Seja f (x, y ) = x 4 + y 4 − 4xy e determinemos os seus pontos de
estacionaridade. Tendo em conta que
 
∂f ∂f
, = (0, 0) ⇔ (4x 3 − 4y , 4y 3 − 4x) = (0, 0)
∂x ∂y

conclui-se que y = x 3 e x = y 3 , donde vem x 9 = x, isto é,


x(x 8 − 1) = 0. Esta equação tem três soluções reais, x = 0, x = 1,
x = −1 e os pontos de estacionaridade correspondentes são

(0, 0), (1, 1), (−1, −1).

AM II-C 21 de Abril de 2021 88 / 119


Exemplo (continuação)
3. Seja f (x, y ) = x 2 + y 2 . Admite apenas um ponto crı́tico, (0, 0),
que é mı́nimo local (de facto é mesmo mı́nimo absoluto) uma vez que

f (0, 0) = 0 ≤ x 2 + y 2 = f (x, y ), ∀(x, y ) ∈ R2 .

De um modo geral, o problema da determinação de extremos de


funções de várias variáveis pode ser extremamente complexo. Iremos,
em seguida, apresentar um método que dá uma condição suficiente
para a existência de extremos locais num dado ponto crı́tico.

AM II-C 21 de Abril de 2021 89 / 119


Definição
Seja f : D ⊂ Rn −→ R, D um conjunto aberto e a ∈ D. Supondo
que f ∈ C 2 em alguma bola centrada em a , chama-se matriz
hessiana de f no ponto a, à matriz quadrada n × n (simétrica)
 2
∂ 2f ∂ 2f

∂ f
 ∂x 2 ···
 21 ∂x1 ∂x2 ∂x1 ∂xn 
2
 ∂ f ∂ f ∂ 2f 
 ··· 
H(f )(a) =  ∂x
 2 1 ∂x ∂x 2
2 ∂x 2 ∂x  .
n
 ··· ··· ··· ··· 
 2 2

 ∂ f ∂ f ∂ 2f 
···
∂xn ∂x1 ∂xn ∂x2 ∂xn2 (a)
Ao determinante desta matriz chama-se o hessiano de f no ponto a e
representa-se por det H(f )(a) (ou |H(f )(a)|).

AM II-C 21 de Abril de 2021 90 / 119


Para se investigar a natureza dos pontos crı́ticos é frequente a
utilização de dois processos que envolvem a matriz hessiana.
1o Processo - Classificação dos pontos crı́ticos através dos valores
próprios da matriz hessiana.
1 Se todos os valores próprios de H(f )(a) são positivos a função
tem um mı́nimo local no ponto crı́tico a.
2 Se todos os valores próprios de H(f )(a) são negativos a função
tem um máximo local no ponto crı́tico a.
3 Se pelo menos dois valores próprios de H(f )(a) têm sinais
contrários (podendo ter, eventualmente, alguns valores próprios
nulos) a função não admite extremo no ponto a e este é um
ponto de sela.
4 Se pelo menos um dos valores próprios de H(f )(a) é nulo e os
restantes são todos do mesmo sinal, a natureza do ponto crı́tico
é inconclusiva por este processo.

AM II-C 21 de Abril de 2021 91 / 119


Os valores próprios da matriz H determinam-se, como se sabe, a
partir da equação |H − λI | = 0, onde I é a matriz identidade com a
mesma ordem que H.

2o Processo - Classificação dos pontos crı́ticos através dos menores


principais da matriz hessiana.
Os menores principais da matriz hessiana, são os determinantes das
submatrizes quadradas contendo a parte superior esquerda da
diagonal principal da matriz hessiana como sua diagonal principal.
Considerem-se os menores principais ∆i , 1, ..., n, da matriz hessiana
no ponto crı́tico a:

AM II-C 21 de Abril de 2021 92 / 119


∂ 2f ∂ 2f
 
∂ 2f  ∂x12 ∂x1 ∂x2 
∆1 = 2 (a), ∆2 = det   ∂ 2f
 ,
∂x1 ∂ 2f 
∂x2 ∂x1 ∂x22 (a)
 2
∂ 2f ∂ 2f

∂ f
 ∂x 2 ∂x1 ∂x2 ∂x1 ∂x3 
 1 
 ∂ 2f 2
∂ f 2
∂ f 
∆3 = det   , ..., ∆n = |H(f )(a)|.
 
 ∂x2 ∂x1 2
∂x2 ∂x2 ∂x3 
 2
∂ 2f ∂ 2f 

 ∂ f
∂x3 ∂x1 ∂x3 ∂x2 ∂x32 (a)

AM II-C 21 de Abril de 2021 93 / 119


1 Se os menores principais da matriz hessiana, no ponto crı́tico,
forem todos positivos, a função f tem nesse ponto um mı́nimo
local.
2 Se os menores principais (da matriz hessiana) de ordem ı́mpar
forem negativos e os de ordem par forem positivos, a função f
tem nesse ponto um máximo local.
3 Se se verificar uma das situações descritas no ponto 1. ou 2. até
certa ordem, mas a partir daı́ todos os menores são nulos, o
estudo da natureza do ponto crı́tico não é conclusivo através
deste processo.
4 Nos restantes casos, a função não admite extremo no ponto
crı́tico e este é um ponto de sela.
A classificação dos pontos crı́ticos através dos menores principais da
matriz hessiana para o caso das funções de duas variáveis reais
torna-se bastante simples e está sintetizado no teorema seguinte.

AM II-C 21 de Abril de 2021 94 / 119


Teorema
Seja f : D ⊂ R2 → R, (a, b) ∈ int D, e suponhamos que f é
continuamente derivável até à segunda ordem numa vizinhança de
(a, b). Suponhamos que (a, b) é um ponto de estacionaridade de f e
sejam
 2
∂ f ∂ 2f

∂ 2f  ∂x 2 ∂x∂y 
∆1 = 2 (a, b), ∆2 = det   ∂ 2f
 .
∂x ∂ 2f 
∂y ∂x ∂y 2 (a,b)

 

 ∆1 > 0, f tem um mı́nimo local em (a, b)
 ∆2 > 0
∆1 < 0, f tem um máximo local em (a, b)


∆2 < 0 f tem um ponto de sela em (a, b).

AM II-C 21 de Abril de 2021 95 / 119


Demonstração. Seja f continuamente derivável até a 2a ordem numa
vizinhança de (a, b). Pelo Teorema de Taylor existe 0 < θ < 1 tal que
∂f ∂f
f (a + h,b + k) − f (a, b) = h (a, b) + k (a, b)
∂x ∂y
2
1 ∂ f ∂ 2f
+ h2 2 (a + θh, b + θk) + 2hk (a + θh, b + θk)
2! ∂x ∂x∂y
∂ 2f
+ k 2 2 (a + θh, b + θk)

∂y
∂f ∂f
Como (a, b) é ponto de estacionaridade (a, b) = (a, b) = 0
∂x ∂y
pelo que
1 ∂ 2f
f (a + h, b + k) − f (a, b) = (h2 2 (a + θh, b + θk)
2 ∂x
∂ 2f ∂ 2
f
+2hk (a + θh, b + θk) + k 2 2 (a + θh, b + θk))
∂x∂y ∂y
AM II-C 21 de Abril de 2021 96 / 119
Como por hipótese f é de classe C 2 numa vizinhança de (a, b) o sinal
de
∂ 2f ∂ 2f 2
2∂ f
h2 (a+θh, b+θk)+2hk (a+θh, b+θk)+ k (a+θh, b+θk)
∂x 2 ∂x∂y ∂y 2
é o mesmo de

∂ 2f ∂ 2f 2
2∂ f
h2 (a, b) + 2hk (a, b) + k (a, b)
∂x 2 ∂x∂y ∂y 2
para valores de ||(h, k)|| suficientemente pequenos. Por uma questão
de simplicidade de escrita façamos

∂ 2f ∂ 2f ∂ 2f
r= (a, b), s = (a, b), t = (a, b).
∂x 2 ∂x∂y ∂y 2

AM II-C 21 de Abril de 2021 97 / 119


Com a designação considerada, o sinal de f (a + h, b + k) − f (a, b) é
o sinal do trinómio
h2 r + 2hks + k 2 t.
Vamos estudar o sinal deste trinómio considerando vários casos:
1. Se r = t = 0 e s 6= 0 o sinal de f (a + h, b + k) − f (a, b) é o sinal
de 2hks e portanto f não tem extremo no ponto (a, b).
2. Se t 6= 0 (para r 6= 0 o estudo é análogo) e supondo h 6= 0 vem
que
 2 !
2 2 2 k k
h r + 2hks + k t = h r + 2s + t .
h h
k
Designando α = o trinómio escreve-se na forma
h
h2 (r + 2sα + α2 t)

e os seus zeros são


AM II-C 21 de Abril de 2021 98 / 119
√ √
−2s ± 4s 2 − 4rt −s ± s 2 − rt
α= = .
2t t

Se
h = 0 ou s 2 − rt < 0,
o trinómio tem o sinal de t, pelo que:
se t > 0, f (a + h, b + k) − f (a, b) > 0 e f (a, b) é mı́nimo relativo;
se t < 0, f (a + h, b + k) − f (a, b) < 0 e f (a, b) é máximo relativo.
Se
s 2 − rt > 0,
o trinómio tem duas raı́zes distintas e f (a + h, b + k) − f (a, b) não
tem sinal constante qualquer que seja a vizinhança de (a, b) pelo que
f (a, b) não é extremo.
Se s 2 − rt = 0 o teorema é inconclusivo.
AM II-C 21 de Abril de 2021 99 / 119
Exemplo
Seja f : R2 → R definida por

f (x, y ) = x 3 + 3xy 2 − 15x − 12y .

Trata-se de uma função de classe C ∞ (R) e os extremos relativos, se


existem, são pontos de estacionaridade. Calculemos os pontos de
estacionaridade de f :
 
∂f ∂f
, = (0, 0) ⇔ (x 2 + y 2 − 5, xy − 2) = (0, 0).
∂x ∂y
2
De x 2 + y 2 = 5 e y = conclui-se que os pontos de estacionaridade
x
são
(−2, −1), (2, 1), (1, 2), (−1, −2).

AM II-C 21 de Abril de 2021 100 / 119


Exemplo (continuação)
Tem-se que

∆1 (x, y ) = 6x e ∆2 (x, y ) = 36(x 2 − y 2 ),

e
1 ∆2 (2, 1) = (36(x 2 − y 2 ))(2,1) = 108 > 0, pelo que f tem
extremo local em (2, 1). Como ∆1 (2, 1) = 12 > 0, f tem um
mı́nimo local em (2, 1) cujo valor é f (2, 1) = −28.
2 ∆2 (−2, −1) = (36(x 2 − y 2 ))(−2,−1) = 108 > 0, pelo que f tem
extremo local em (2, 1). Como ∆1 (−2, −1) = −12 < 0, f tem
um máximo local em (−2, −1) cujo valor é f (−2, −1) = 28.
3 ∆2 (1, 2) = ∆2 (−1, −2) = (36(x 2 − y 2 ))(2,1) = −108 < 0, pelo
que, os pontos (1, 2) e (−1, −2) não são extremos relativos da
função f .
AM II-C 21 de Abril de 2021 101 / 119
Extremos condicionados. Método dos
multiplicadores de Lagrange

Suponhamos que a função P(x, y , z) definida em R3 , representa a


pressão atmosférica no ponto do espaço e que pretendemos
determinar em que ponto de uma determinada superfı́cie a pressão é
máxima. Se a equação da superfı́cie for dada explicitamente por uma
equação da forma z = g (x, y ), bastará substituir em P(x, y , z) a
variável z por g (x, y ) e em seguida estudar os extremos da função
resultante.
O exemplo que se segue ilustra esta situação.

AM II-C 21 de Abril de 2021 102 / 119


Exemplo
Determine-se o ponto do plano de equação

2x + 3y − z = 1,

que está à menor distância da origem. Considere-se a função


f (x, y , z) = x 2 + y 2 + z 2 , que representa o quadrado da distância do
ponto (x, y , z) à origem (quando o quadrado da distância for mı́nimo
a distância também o será). Impondo a condição do ponto pertencer
ao plano obtém-se a função a minimizar

g (x, y ) = x 2 + y 2 + (2x + 3y − 1)2 .


 
1 3
O único ponto de estacionaridade é o ponto , e que
7 14
corresponde defacto a um  mı́nimo da função [verifique]. O ponto
1 3 1
pretendido é , ,− .
7 14 14
AM II-C 21 de Abril de 2021 103 / 119
O problema do exemplo anterior foi resolvido de forma relativamente
fácil uma vez que não houve qualquer dificuldade em escrever a
equação do plano na forma z = g (x, y ). O problema poder-se-ia
complicar muito se tal não tivesse sido possı́vel.
O problema da determinação de extremos sujeitos a restrições é em
geral muito complicado e não existe um método geral de o resolver.
Existem alguns métodos que permitem resolver este problema quando
se procuram extremos de funções com restrições a conjuntos com
uma estrutura relativamente simples, por exemplo, uma superfı́cie
como sucedeu no exemplo anterior.
No que se segue iremos considerar um processo que permite em
determinados casos resolver o problema e que é conhecido por
método dos multiplicadores de Lagrange.

AM II-C 21 de Abril de 2021 104 / 119


Teorema (Teorema dos multiplicadores de Lagrange)
Sejam f : A ⊂ Rn −→ R, g = (g1 , ..., gm ) : A ⊂ Rn −→ Rm , m < n
funções de classe C 1 no conjunto aberto A.
Sendo
B = {x ∈ A : g (x) = 0},
suponhamos que f admite um extremo no ponto a ∈ B e que

∂(g1 , · · · , gm )
(a) 6= 0.
∂(x1 , · · · , xm )

Então, existem m números reais, λ1 , ..., λm tais que a é ponto crı́tico


da função

F (x, λ1 , ..., λm ) = f (x) + λ1 g1 (x) + ... + λm gm (x).

À função F (x, λ1 , ..., λm ) chama-se função de Lagrange e às


constantes λ1 , ..., λm multiplicadores de Lagrange.
AM II-C 21 de Abril de 2021 105 / 119
A resolução de um problema de extremos condicionados utilizando o
teorema anterior, começa pela determinação dos pontos crı́ticos da
função de Lagrange F (x, λ1 , ..., λm ) através da resolução do sistema
de n + m equações

∂F

 = 0, i = 1, ..., n
∂xi

 ∂F

 = gi = 0, i = 1, ..., m.
∂λi
Determinados estes pontos, através da análise do problema em causa
deve justificar-se se os pontos determinados são ou não os extremos
procurados.

AM II-C 21 de Abril de 2021 106 / 119


Exemplo
Determinem-se os extremos da função

f (x, y ) = x + y ,

pertencentes à circunferência de equação, x 2 + y 2 = 1.

Figura: Método dos multiplicadores de Lagrange.


AM II-C 21 de Abril de 2021 107 / 119
Exemplo (continuação)
Pretende-se determinar os extremos da função f com uma única
restrição (g (x, y ) = x 2 + y 2 − 1 = 0).
A função de Lagrange para este problema é

F (x, y , λ) = x + y + λ(x 2 + y 2 − 1),

cujos pontos crı́ticos se obtêm a partir do sistema


∂F


 = 1 + 2λx = 0


 ∂x
∂F

= 1 + 2λy = 0

 ∂y
 ∂F = x 2 + y 2 − 1 = 0.



∂λ

AM II-C 21 de Abril de 2021 108 / 119


Exemplo (continuação)
A resolução do sistema conduz aos pontos
√ √ ! √ √ !
2 2 2 2
, e − ,−
2 2 2 2

que correspondem, respetivamente, ao máximo e mı́nimo pretendidos.

AM II-C 21 de Abril de 2021 109 / 119


Exemplo
Determine-se a menor das distâncias dos pontos da parábola de
equação y = 4x 2 aos pontos da reta de equação y = x − 1.
Trata-se de determinar o mı́nimo da função

d 2 (x, y , u, v ) = (x − u)2 + (y − v )2 ,

(função quadrado da distância de um ponto (x, y ) do plano a um


ponto (u, v ) do plano), com as duas restrições

g1 (x, y ) = y − 4x 2 = 0 e g2 (u, v ) = u − v − 1 = 0.

A função de Lagrange do problema é

F (x, y , u, v , λ1 , λ2 ) = (x −u)2 +(y −v )2 +λ1 (y −4x 2 )+λ2 (u −v −1),

cujos pontos crı́ticos se obtêm a partir do sistema


AM II-C 21 de Abril de 2021 110 / 119
Exemplo (continuação)
∂F


 = 2(x − u) − 8λ1 x = 0


 ∂x
∂F


= 2(y − v ) + λ1 = 0





 ∂y

 ∂F
= −2(x − u) + λ2 = 0



∂u
∂F
= −2(y − v ) − λ2 = 0


∂v





 ∂F
= y − 4x 2 = 0.


∂λ



 1

 ∂F
= u − v − 1 = 0.


∂λ2

AM II-C 21 de Abril de 2021 111 / 119


Exemplo (continuação)
Da segunda e quarta equações resulta que λ1 = λ2 . Usando em
seguida a primeira e terceira equações seguida da primeira equação
1 1
de ligação vem que, x = e y = . Usando em seguida, por
8 16
exemplo, as duas primeiras equações seguida da segunda equação de
19 13
ligação vem que, u = ev =− .
32 32
A distância mı́nima entre a parábola e a reta consideradas é
s 2  2
1 19 1 13 15 √
d= − + + = 2.
8 32 16 32 32

AM II-C 21 de Abril de 2021 112 / 119


Tal como no caso dos extremos relativos, existe um resultado que
permite decidir, em certos casos, se num problema de extremos
condicionados um ponto obtido pelo método dos multiplicadores de
Lagrange é extremo ou não e que tipo de extremos se trata. Apesar
de existir um resultado geral que se aplica a funções de n variáveis
sujeitas a m restrições (m < n), apenas iremos considerar o caso com
uma restrição.
Suponhamo-nos nas hipóteses do teorema de multiplicadores de
Lagrange (apenas com a restrição g (x1 , ..., xn )) e que

F (x1 , ..., xn ) = f (x1 , ..., xn ) + λg (x1 , ..., xn ),

é a função de Lagrange do problema.

AM II-C 21 de Abril de 2021 113 / 119


Chama-se matriz Hessiana orlada da função F à matriz
∂g ∂g ∂g
 
0 ...

 ∂x1 ∂x2 ∂xn  
2
 ∂g ∂ F ∂ 2F ∂ 2F 
 ··· 
 ∂x
 1 ∂x12 ∂x1 ∂x2 ∂x1 ∂xn 

2
H(f ) =  ∂g ∂ F ∂ 2F ∂ 2F  .
 
···
∂x22
 
 ∂x2 ∂x2 ∂x1 ∂x2 ∂xn 
 . .. .. ..
 ..

 . . . 

 ∂g ∂ 2F ∂ 2F 2
∂ F 
···
∂xn ∂xn ∂x1 ∂xn ∂x2 ∂xn2

Suponhamos que a partir do teorema dos multiplicadores de Lagrange


determinamos o ponto a = (x1 , ..., xn ) e o valor do multiplicador de
Lagrange λ. Considere-se a seguinte sucessão de determinantes
calculados em (a, λ)

AM II-C 21 de Abril de 2021 114 / 119


 
∂g ∂g
 0 ∂x1 ∂x2 
 
 ∂g ∂ 2F 2
∂ F 
∆3 = det  ,...,
 
 ∂x1 ∂x12 ∂x1 ∂x2 

∂ 2F ∂ 2F 
 
 ∂g
∂x2 ∂x2 ∂x1 ∂x22 (a,λ)
∂g ∂g ∂g
 
0 ...

 ∂x1 ∂x2 ∂xn  
 ∂g ∂ 2F ∂ 2F ∂ 2F 
 ··· 
 ∂x
 1 ∂x12 ∂x1 ∂x2 ∂x1 ∂xn 

∆n+1 = det  ∂g ∂ 2F ∂ 2F 2
∂ F 
 
···
∂x22
 
 ∂x2 ∂x2 ∂x1 ∂x2 ∂xn 
 . .. .. ..
 ..

 . . . 

2 2
 ∂g ∂ F ∂ F ∂ 2F 
···
∂xn ∂xn ∂x1 ∂xn ∂x2 ∂xn2 (a,λ)

AM II-C 21 de Abril de 2021 115 / 119


1 Se os determinantes ∆3 , ..., ∆n+1 são todos negativos, então a
função f tem em a um mı́nimo local relativo à restrição
considerada.
2 Se o primeiro determinante ∆3 for positivo e os seguintes
alternam o sinal, então a função f tem em a um máximo local
relativo à restrição considerada.
3 Se os determinantes são todos diferentes de zero mas não
verificam qualquer uma das duas condições anteriores, então a
função f tem em (a, f (a)) um ponto de sela.
4 Se algum dos determinantes for nulo o método é inconclusivo.

AM II-C 21 de Abril de 2021 116 / 119


Exemplo
Determine-se o triângulo de área máxima de entre todos os que têm
perı́metro 2p. Designando os lados do triângulo por x, y e z e sendo
1
p = (x + y + z) metade do perı́metro a área do triângulo é dada por
2
p
A(x, y , z) = p(p − x)(p − y )(p − z).

Maximizemos a função ”quadrado”da área com a restrição

g (x, y , z) = 2p − (x + y + z).

A função de Lagrange do problema é

F (x, y , z, λ) = p(p − x)(p − y )(p − z) + λ(2p − (x + y + z)).

cujos pontos crı́ticos se obtêm a partir do sistema

AM II-C 21 de Abril de 2021 117 / 119


Exemplo (continuação)
∂F


 = −p(p − y )(p − z) − λ = 0


 ∂x
∂F


= −p(p − x)(p − z) − λ = 0



∂y
∂F
= −p(p − x)(p − y ) − λ = 0





 ∂z
∂F


= 2p − (x + y + z).


∂λ
p3
 
2p 2p 2p
A resolução do sistema conduz a a = , , eλ=− .
3 3 3 9

AM II-C 21 de Abril de 2021 118 / 119


Exemplo (continuação)
Como n + 1 = 4 devemos calcular os determinantes ∆3 (a, λ) e
∆4 (a, λ). Tem-se que
 
0 −1 −1
2
∆3 (a, λ) = det −1 0 p 2 /3 = p 2 > 0,
3
−1 p 2 /3 0
e  
0 −1 −1 −1
−1 0 p 2 /3 p 2 /3 p4
∆4 (a, λ) = det 
  = − < 0.
−1 p 2 /3 0 p 2 /3 3
−1 p 2 /3 p 2 /3 0
O critério estabelecido permite concluir que de facto existe um
triângulo de área máxima. Trata-se do triângulo equilátero de lados
2p p2
x =y =z = , que tem por área A = √ .
3 3 3
AM II-C 21 de Abril de 2021 119 / 119

Você também pode gostar