Capítulo 2

Capítulo 2
Derivada Direcional, Gradiente, Máximos e Mínimos

CÁLCULO 2 – PÁGINA 2
Produto escalar
O produto escalar é uma operação entre vetores que produz um escalar. Essa operação é
bastante utilizada no cálculo de tamanhos ou ângulos entre vetores. O produto escalar pode ser
calculado através de duas fórmulas, dependendo das informações disponíveis:
• Se possuirmos as coordenadas dos vetores:
Considere os vetores u = ( x u , y u ) e v = ( x v , y v ) . A fórmula que calcula o produto escalar
entre esses vetores é dada por:
u ⋅ v = x u x v + yu yv
• Se possuirmos os tamanhos dos vetores e o ângulo entre eles:
Considere que os vetores u , de tamanho u , e v , de tamanho v , formem um ângulo θ
entre eles. O produto escalar entre esses vetores é dado por:
u ⋅ v = u v cos θ
Podemos utilizar a última fórmula para demonstrar que o produto escalar pode ser usado
quando desejamos calcular o tamanho de um vetor, dispondo apenas das suas coordenadas. Fazendo
o produto escalar do vetor u = ( x u , y u ) com ele mesmo:
2
u ⋅ u = u u cos 0 ∴ u ⋅ u = u
Observe que o ângulo entre o vetor u = ( x u , y u ) e ele próprio é zero já que os dois vetores
estão na mesma direção e sentido. O produto escalar que se encontra do lado esquerdo da igualdade
pode ser calculado por u ⋅ v = x u x v + y u y v .
Uma rápida introdução sobre vetores e retas

Considere que desejamos encontrar a equação de uma reta r que passa pelo ponto
P = ( x 0 , y 0 ) e é paralela ao vetor u = (a , b) conforme mostra a figura:
PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Desejamos encontrar neste momento as coordenadas de qualquer ponto A = ( x, y) sobre a

reta r. Conforme as considerações iniciais, o vetor PA = ( x − x 0 , y − y 0 ) é paralelo ao vetor
u = (a , b) . Podemos então dizer que as coordenadas PA são múltiplas das coordenadas do vetor u :
PA = t u
Substituindo as coordenadas de cada vetor:
( x − x 0 , y − y 0 ) = (at, bt )
Como os vetores são iguais, as suas coordenadas são iguais:
x − x 0 = at e y − y 0 = bt
Reorganizando:
x = x 0 + at e y = y 0 + bt
Essas expressões são chamadas de equações paramétricas da reta, pois ambas as equações
dependem apenas do parâmetro t.
Vamos mostrar que se o vetor u for unitário (tiver tamanho igual a 1) então o vetor PA terá
tamanho t. Os tamanhos dos vetores PA e u podem ser calculados aravés dos seguintes produtos
escalares:
2 2
PA = PA ⋅ PA e u = u⋅u
Podemos estabelecer a relação entre os tamanhos dos vetores PA e u , paralelos, sabendo

que PA = t u :
2
PA = (t u) ⋅ (t u)
2
PA = t 2 (u ⋅ u )
2 2
PA = t2 u
Extraindo a raiz quadrada de ambos os lados da igualdade:
PA = t u
Só é possível que o vetor PA tenha tamanho t se o tamanho do vetor u for igual a 1, ou

seja, se o vetor u for unitário. A função do vetor unitário u é indicar a direção da reta r, já que o
seu tamanho unitário não influencia em nada os cálculos.
Caso o vetor u não seja unitário basta normalizar o vetor, ou seja, tornar o seu tamanho
igual a 1 dividindo o vetor pelo seu tamanho original:
u
u unitário =
u
Derivada direcional
A derivada direcional é uma derivada parcial especial calculada na direção de um vetor
unitário u . A função da derivada direcional é medir a taxa instantânea de crescimento ou
decrescimento de uma função num ponto ( x 0 , y 0 ) segundo a direção de um vetor u unitário. A
∂z
derivada direcional é representada pela derivada parcial .
∂u

A medida da taxa instantânea de crescimento ou decrescimento de uma função é dada pela

inclinação da reta tangente à função no ponto ( x 0 , y 0 ) conforme mostra a figura a seguir:
Inclinação da reta tangente em

∂z
( x 0 , y 0 ) é dada por
∂u
PA = t
Na introdução do capítulo mostramos que se um ponto A = ( x, y) está sobre uma reta r,

paralela a um vetor unitário u = (a , b) , então podemos afirmar que x e y são dados por:
x = x 0 + at e y = y 0 + bt
Considerando uma função z = f ( x, y) em que x = g ( t ) = x 0 + at e y = h ( t ) = y 0 + bt ,
podemos aplicar a seguinte expressão da regra da cadeia:
dz ∂z dx ∂z dy
= +
dt ∂x dt ∂y dt
Sabemos que se:
dx
x = x 0 + at , então, =a
dt
dy
y = y 0 + bt , então, =b
dt
Substituindo na expressão da regra da cadeia:
dz ∂z ∂z
= a+ b
dt ∂x ∂y
dz
A derivada representa a taxa instantânea de crescimento ou decrescimento de z
dt
∂z
considerando a direção do vetor unitário u que, daqui por diante, representaremos por :
∂u
∂z ∂z ∂z
= a+ b
∂ u ∂x ∂y
Essa última expressão calcula a derivada direcional de z na direção do vetor unitário u .

Conforme a definição geométrica dada por limites, as derivadas parciais em relação a x ou a

y medem as inclinações das retas tangentes à superfície nas direções x e y conforme o gráfico:
∂z
Inclinação da reta =
∂y
∂z
Inclinação da reta =
∂x
r
A derivada parcial na direção do vetor u mede a inclinação da reta tangente à superfície na
r
direção do vetor u como mostra o gráfico a seguir:
∂z
Inclinação da reta = r
∂u
r
u
Podemos perceber no gráfico anterior que, passando pelo ponto P, existem infinitas retas
tangentes à superfície z = f ( x , y) cuja inclinações são dadas pelas respectivas derivadas direcionais.
A derivada direcional é o caso mais geral de derivação parcial, pois podemos obter as
r
derivadas parciais em relação a x e a y fazendo a direção do vetor unitário u coincidir com as
r r
direções dos vetores unitários i (direção x) e j (direção y).
A derivada de z na direção do vetor i = (1,0) é dada por:
∂z ∂z ∂z ∂z
= 1+ 0 =
∂ i ∂x ∂y ∂x

A derivada de z na direção do vetor j = (0,1) é dada por:

∂z ∂z ∂z ∂z
= 0+ 1=
∂ j ∂x ∂y ∂y
Note que, no cálculo da derivada de z na direção do vetor i = (1,0) , desconsideramos a
derivada parcial em relação a y. Isso acontece porque o vetor i = (1,0) está apontando na direção
do eixo x, então, devemos desconsiderar qualquer efeito da variação da função na direção y.
Raciocínio análogo se aplica ao cálculo da derivada da função z na direção do vetor j = (0,1) .
Por outro lado, se o vetor u apontar numa direção qualquer, diferente das direções dos eixos
x e y, devemos então considerar uma combinação das derivadas parciais em relação a x e a y, ou
seja, o resultado é uma combinação dos efeitos nas direções x e y.
Exemplo
Calcular a derivada da função z = f ( x , y) = x 3 y 2 na direção do vetor u = (3,4) calculando
a derivada no ponto ( x 0 , y 0 ) = (1,2) .
Solução
Vamos calcular o módulo do vetor u = (3,4) :
2
u = u ⋅ u = (3,4) ⋅ (3,4) = 9 + 16 = 25 ∴ u = 5
Observe que o vetor u = (3,4) não é unitário, devemos então dividí-lo pelo seu tamanho
para normalizá-lo:
u (3,4)  3 4 
u unitário = = = , 
u 5 5 5
Calcule o tamanho deste último vetor e verifique que o resultado é igual a 1.
A derivada de z na direção do vetor u (normalizado) é dada por:
∂z ∂z ∂z
= a+ b
∂ u ∂x ∂y
Onde:
∂z ∂z
= 3x 2 y 2 e = 2x 3 y
∂x ∂y
3 4
a= e b=
5 5
Substituindo os resultados temos que:
∂z 3 4 9 8
= (3x 2 y 2 ) + (2 x 3 y) = x 2 y 2 + x 3 y
∂u 5 5 5 5
Finalmente, calculando a derivada parcial no ponto ( x 0 , y 0 ) = (1,2) :
∂z 9 8 52
(1,2) = 12 2 2 + 13 2 =
∂u 5 5 5
A derivada direcional não é um vetor! A derivada direcional apenas utiliza a

direção do vetor u para calcular a taxa de crescimento/decrescimento instantânea nessa
direção cujo resultado é um escalar e não um vetor.

Definição formal de derivada direcional

Considere um vetor u = (a , b) paralelo a uma reta r que contém o ponto P = ( x 0 , y 0 ) e o
ponto A = (x, y) cujas coordenadas são desconhecidas. Suponha uma função z = f ( x , y) em que x
e y seguem a direção da reta r, ou seja, x = g ( t ) = x 0 + at e y = h ( t ) = y 0 + bt . A derivada
direcional é definida pela seguinte equação:
∂z f ( x , y) − f ( x 0 , y 0 ) f ( x 0 + at , y 0 + bt ) − f ( x 0 , y 0 )
= lim = lim
∂u t →0 t t →0 t
Graficamente estamos calculando a inclinação da reta tangente à curva obtida no limite
quando t→0 (quando PA → 0 ):
Propriedade da derivada direcional

A derivada direcional tem uma propriedade bastante especial. Quando invertemos o sentido
do vetor unitário a derivada direcional troca de sinal. Considere o vetor unitário u = (a , b) e o seu
vetor unitário oposto − u = (−a ,− b) . As derivadas parciais na direção de cada um desses vetores
são dadas por:
∂z ∂z ∂z ∂z ∂z ∂z
= a+ b e = ( −a ) + ( − b )
∂ u ∂x ∂y ∂ (− u ) ∂x ∂y
Podemos então dizer que:
∂z  ∂z ∂z  ∂z
= − a + b  = −
∂ (−u )  ∂x ∂y  ∂u
Essa equação nos revela que se em uma direção a função está crescendo, na direção
contrária a função deve decrescer.
Gradiente
É interessante notar que a expressão da derivada direcional pode ser representada como um
produto escalar entre dois vetores:
∂z ∂z ∂z  ∂z ∂z 
= a + b =  ,  ⋅ (a , b)
∂ u ∂x ∂y  ∂x ∂y 

Sabemos que o segundo vetor do produto escalar é u . O primeiro vetor é denominado

gradiente da função z = f ( x , y) e será representado pela notação ∇z ou grad(z).
Podemos então reescrever o produto escalar da seguinte forma:
∂z
= ∇z ⋅ u
∂u
O símbolo ∇ é chamado operador nabla
e, quando aparece ao lado da função, indica a
presença da derivação parcial em cada
coordenada do vetor gradiente.
O nome do símbolo do gradiente é
associado à um tipo de harpa hebraica que
possui esse formato conforme mostra a figura.
1911, Webster´s Dictionary
Exemplo
Calcule o gradiente da função:
z = f ( x , y) = x 3 y 4
Solução
O gradiente da função é dado por:
 ∂z ∂z 
∇z =  , 
 ∂x ∂y 
∇z = (3x 2 y 4 ,4 x 3 y 3 )
A palavra gradiente deriva do latim gradus (mesma origem das palavras gradual
e gradativo) que significa avançar passo-a-passo.
O significado do gradiente
A derivada direcional, sendo um produto escalar entre vetores, pode também ser calculada
da seguinte forma:
∂z
= ∇z ⋅ u = ∇z u cos θ
∂u
Como o vetor u é unitário, a derivada direcional se torna:
∂z
= ∇z ⋅ u = ∇z cos θ
∂u
Como − 1 ≤ cos θ ≤ 1 , o valor máximo e mínimo da derivada direcional é igual a:
∂z
= ∇z ⋅ u = + ∇z (máximo)
∂u
∂z
= ∇z ⋅ u = − ∇z (mínimo)
∂u
O valor máximo ocorre quando o ângulo θ entre o gradiente e o vetor u é igual a zero e o
valor mínimo ocorre quando o ângulo θ entre o gradiente e o vetor u é igual a 180o, ou seja,
quando o gradiente e o vetor u estão na mesma direção e no mesmo sentido, a derivada direcional é
máxima e tem valor igual a ∇z .

Por outro lado, quando o gradiente e o vetor u estão na mesma direção e sentidos
contrários, a derivada direcional é mínima e tem valor igual a − ∇z .
Podemos também afirmar que a derivada direcional é máxima quando o vetor u é igual a:
∇z
u=
∇z
Observe que a derivada direcional máxima ocorre quando o vetor u é o vetor unitário na
direção do gradiente da função.
O gradiente tem a finalidade de apontar para a direção de maior crescimento da função
conforme mostra a figura a seguir:
Direção de crescimento máximo

(derivada direcional máxima)
Direção de decrescimento máximo

(derivada direcional mínima)
Exemplo
Considere a função:
z = f ( x , y) = x 2 y
Determine o valor máximo da derivada direcional no ponto P = (2,1) , determinando o vetor
unitário na direção a qual a derivada direcional é máxima.
Solução
O vetor gradiente da função é dado por:
 ∂z ∂z 
∇z =  , 
 ∂x ∂y 
Onde:
∂z ∂z
= 2xy e = x2
∂x ∂y
Logo, o vetor gradiente no ponto P = (2,1) é igual a:
∇z(2,1) = (4,4)
O módulo do gradiente pode ser calculado pelo seguinte produto escalar:
2
∇z = ∇z⋅ ∇z = (4,4) ⋅ (4,4) = 16 + 16 = 32

∇z = 32 = 4 2
O valor máximo da derivada direcional pode ser calculado pela fórmula:
∂z
= + ∇z = 4 2
∂u
A derivada direcional é máxima quando o vetor u for igual a:
∇z  1 1 
(4,4)
u= = = , 
∇z 4 2  2 2
Curvas de nível
Os médicos recorrem à tomografia computadorizada quando desejam visualizar a imagem
do cérebro do paciente. Nesse tipo de exame, a imagem do cérebro do paciente é “fatiada” em
várias partes conforme mostram as figuras a seguir:
Em matemática, diríamos que cada “fatia” da tomografia computadorizada é uma curva de

nível da função.
Os engenheiros civis utilizam gráficos de nível, chamados mapas topológicos, para auxiliá-
los na construção de estradas e pontes. Na construção do gráfico de nível, o relevo da região é
“fatiado” em várias cotas (nível de altura) e desenhado num único mapa conforme mostra a figura:
Cada número que acompanha uma curva representa a altura da “fatia” do relevo. Por
exemplo, o ponto 1 e o ponto 2 mostrados na figura estão na cota 10, ou seja, possuem a mesma
altura igual a 10. No mapa topológico da região estão presentes as várias curvas de nível do relevo.

Os engenheiros mecânicos utilizam curvas de nível quando precisam selecionar bombas

d’água que funcionem com o maior rendimento possível. Podemos relacionar a altura de descarga, a
vazão e o rendimento de uma bomba d’água conforme a superfície a seguir:
Rendimento (%)
Altura de descarga (metros) Vazão (litros por segundo)
Os fabricantes apresentam as curvas de nível da superfície anterior no seguinte gráfico:
Curvas de rendimento constante

Altura (metros)
'
Vazão (litros por segundo)
As curvas de nível de uma função representam as diversas “fatias” do gráfico da função,
uma para cada valor escolhido da variável dependente z.
As figuras a seguir mostram os gráficos de funções e as suas curvas de nível:
Gráfico da função z = f ( x , y) = x 2 + y 2 Curvas de nível de z = f ( x , y) = x 2 + y 2

Gráfico da função z = f ( x , y) = sen ( x ) ⋅ sen ( y) Curvas de nível de z = f ( x , y) = sen ( x ) ⋅ sen ( y)
Observe que os pontos “mais altos” (maior valores de z) são mais claros e os
pontos “mais baixos” (menores valores de z) são mais escuros.
Uma curva de nível é uma curva no espaço IR 2 para um valor arbitrário de z, ou seja,
escolhemos um valor para z (fazemos z igual a uma constante genérica c) e descobrimos qual é a
característica das curvas de nível. Vale dizer que nem sempre é fácil imaginar o formato das curvas
de nível de uma função a partir das equações obtidas fazendo z = c .
A expressão matemática das curvas de nível da função z = f ( x , y) = x 2 + y 2 é dada por:
x 2 + y2 = c
Conforme a equação anterior, as curvas de nível são circunferências centradas na origem
com raios iguais a c .
Gradiente e curvas de nível

Considere as curvas de nível da função z = f ( x , y) = x 2 + y 2 :
u
u
u
u
Curvas de nível de z = f ( x , y) = x 2 + y 2
Suponha que o vetor u é tangente a uma das curvas de nível da função. Como todos os
pontos sobre uma curva de nível possuem a mesma “altura” z, a taxa de crescimento ou
decrescimento da função na direção tangente a qualquer curva de nível é igual a zero.

Fica mais fácil verificar a afirmação anterior na figura a seguir:
Ao longo da curva de nível não há

crescimento nem decrescimento da função já
que todos os pontos estão “à mesma altura”.
u
u u
A derivada na direção do vetor u tangente à curva de nível é igual a zero, ou seja:

∂z
=0
∂u
Sabemos que a derivada direcional é dada pelo seguinte produto escalar:
∂z
= ∇z ⋅ u
∂u
Logo, podemos afirmar que:
∇z ⋅ u = 0
O produto escalar anterior anterior é muito importante, pois indica que o vetor gradiente é
perpendicular ao vetor u que é tangente a qualquer curva de nível da função. A figura seguinte
mostra a configuração dos vetores u e ∇z sobre uma das curvas de nível da função:
∇z
Máximo, Mínimo e Ponto de Sela

Um ponto P = ( x 0 , y 0 ) é chamado de ponto crítico da função z = f ( x , y) se nesse ponto as
derivadas parciais em relação a x e em relação a y são ambas iguais a zero, ou seja, as inclinações
das retas tangentes à função z = f ( x , y) no ponto P devem ser iguais a zero.

Por exemplo, a figura a seguir mostra um ponto crítico da função. Observe que as derivadas
parciais em relação a x e em relação a y são ambas iguais a zero:
A inclinação da reta
∂z
tangente à curva: =0
∂x
A inclinação da reta
∂z
tangente à curva: =0
∂y
Sabemos que a segunda derivada de uma função fornece a sua concavidade. Na figura
mostrada anteriormente, a segunda derivada parcial em relação a x é negativa, pois a concavidade
da curva paralela ao eixo x é para baixo. Estamos então sobre o ponto mais alto da curva. Além
disso, a segunda derivada em relação a y também é negativa, indicando que a concavidade da curva
paralela ao eixo y também está voltada para baixo. Combinando as duas situações, podemos afirmar
que localizamos um ponto de máximo local.
Observe a figura a seguir:

Na figura anterior, a segunda derivada parcial em relação a x é positiva, pois a concavidade

da curva paralela ao eixo x é para cima. Estamos então sobre o ponto mais baixo da curva. Além
disso, a segunda derivada em relação a y também é positiva, indicando que a concavidade da curva
paralela ao eixo y também está voltada para cima. Combinando as duas situações, podemos afirmar
que localizamos um ponto de mínimo local.
Existe ainda um terceiro tipo de ponto crítico, denominado de ponto de sela, que ocorre
quando as derivadas parciais em relação a x e a y se anulam e, mesmo assim, não estamos nem
sobre um ponto de máximo, nem sobre um ponto de mínimo local. A figura seguinte ilustra um
ponto de sela da função:
Se apenas derivarmos uma função parcialmente em relação a x e em relação a y, igualando a

zero o resultado, não temos condições de afirmar que tipo de ponto crítico localizamos. Para
caracterizarmos qual dos três tipos de ponto crítico foi calculado devemos utilizar o determinante
Hessiano, ou simplesmente, Hessiano dado por:
∂ 2z ∂ 2z
2 ∂x∂y
H( x , y) = ∂x2
∂ z ∂ 2z
∂y∂x ∂y 2
As condições para a caracterização dos pontos críticos são apresentadas no quadro a seguir:
∂ 2z
• Se H( x 0 , y 0 ) > 0 e ( x 0 , y 0 ) > 0 , então, ( x 0 , y 0 ) será ponto de mínimo local.
∂x 2
∂ 2z
• Se H( x 0 , y 0 ) > 0 e ( x 0 , y 0 ) < 0 , então, ( x 0 , y 0 ) será ponto de máximo local.
∂x 2
• Se H( x 0 , y 0 ) < 0 , então, ( x 0 , y 0 ) será ponto de sela.
• Se H( x 0 , y 0 ) = 0 nada se pode afirmar.
Exemplo
Considere a função:
z = f ( x, y) = x 3 + y 3 − 3x − 3y + 4
Determine os pontos críticos da função e classifique os resultados em pontos de máximo,
mínimo ou de sela.

Solução
As derivadas parciais em relação a x e a y são dadas por:
∂z
= 3x 2 − 3
∂x
∂z
= 3y 2 − 3
∂y
Os pontos críticos da função podem ser encontrados anulando as derivadas parciais:
∂z
= 3x 2 − 3 = 0
∂x
∂z
= 3y 2 − 3 = 0
∂y
Temos então um sistema com duas equações e duas variáveis:
3x 2 − 3 = 0
 2
3y − 3 = 0
As soluções do sistema são os pontos:
(1,1) , (1,−1) , (−1,1) , (−1,−1)
Embora tenhamos encontrado os pontos críticos da função, ainda não sabemos que tipo de
ponto crítico é cada um dos pontos calculados. Para isso, precisamos da ajuda do determinante
Hessiano conforme as condições dadas no quadro mostrado anteriormente.
Vamos calcular as derivadas parciais presentes no Hessiano:
∂ 2z ∂ 2z
= 6x e = 6y
∂x 2 ∂y 2
∂ 2z ∂ 2z
= =0
∂x∂y ∂y∂x
Substituindo as derivadas parciais no Hessiano temos a seguinte expressão:
6x 0
H ( x , y) = = 36 xy
0 6y
Vamos analisar cada ponto crítico encontrado conforme as condições de caracterização
dadas anteriormente.
• Ponto (1,1) :
6 0 ∂ 2z
Como H (1,1) = = 36 e (1,1) = 6 , então, (1,1) é ponto de mínimo
0 6 ∂x 2
• Ponto (1,−1) :
6 0
Como H (1,−1) = = −36 , então, (1,−1) é ponto de sela
0 −6
• Ponto (−1,1) :
−6 0
Como H (−1,1) = = −36 , então, (−1,1) é ponto de sela
0 6
• Ponto (−1,−1) :
−6 0 ∂ 2z
Como H (−1,−1) = = 36 e (−1,−1) = −6 , então, (−1,1) é ponto de máximo
0 −6 ∂x 2

Observe o gráfico da função z = x 3 + y 3 − 3x − 3y + 4 e comprove os resultados obtidos:
(−1,1) é ponto de sela

( −1,−1) é máximo
(1,1) é mínimo
(1,−1) é ponto de sela
As curvas de nível e o campo de gradientes da função z = x 3 + y 3 − 3x − 3y + 4 são

mostrados nos gráficos a seguir:
3 2
1 3
Curvas de nível da função Campo de gradientes da função
Observe que o sentido das setas do campo de gradientes conduz aos pontos críticos, onde o
gradiente é zero. As setas podem convergir de todas as direções para um ponto de máximo (1) ou
divergir de um ponto de mínimo para todas as direções (2). Os pontos de sela (3) são caracterizados
pela convergência de setas numa direção e divergência de setas em outra direção.

Máximos e Mínimos Condicionados – Multiplicadores de Lagrange

O método dos multiplicadores de Lagrange consiste em maximizar ou minimizar uma
função z = f ( x, y) sujeita a uma condição (restrição) do tipo g ( x , y) = 0 . As curvas de nível de z,
segundo o gráfico a seguir, mostram os pontos “mais altos” (maiores valores de z) com tonalidades
de cinza cada vez mais intensas e os pontos “mais baixos” (menores valores de z) com tonalidades
de cinza cada vez mais fracas.
∇g ∇z
∇z
∇g
B
A
C
g ( x , y) = 0
Todos os pontos sobre a curva g ( x , y) = 0 que cruzam com as curvas de nível da função
z = f ( x, y) é uma possível solução ao problema:
Maximizar z = f ( x, y)
Sujeito à restrição:
g ( x , y) = 0
À medida que caminhamos ao longo de g ( x , y) = 0 do ponto A para o ponto B, a função
z = f ( x, y) aumenta de valor, pois a curva de nível em A possui “altura” menor que a curva de nível
em B. Se continuarmos caminhando em direção ao ponto C, podemos perceber que voltaremos ao
mesmo nível que o ponto A já que estamos sobre a mesma curva de nível. Podemos concluir que o
ponto B é o único ponto sobre a curva g ( x , y) = 0 em que a função assume o seu valor máximo.
Sabendo que os vetores gradientes são perpendiculares às suas curvas de nível, percebemos
que ∇z e ∇g são paralelos no ponto B. No ponto A, por exemplo, esses vetores estão separados
por um ângulo diferente de zero. Como os vetores ∇z e ∇g são paralelos no ponto B é possível
afirmar então que encontramos um ponto de máximo da função quando os dois gradientes são
múltiplos um do outro. A relação entre os gradientes é expressa da seguinte forma:
∇z = λ∇g no ponto B = ( x 0 , y 0 )
O método dos multiplicadores de Lagrange consiste em encontrar pontos sobre uma curva
g ( x , y) = 0 de maneira que exista proporcionalidade entre os gradientes ∇z e ∇g .
O método dos multiplicadores de Lagrange é válido desde que as coordenadas do vetor ∇g
sejam diferentes de zero.

Exemplo
Considere que desejamos maximizar a função:
z = f ( x, y) = xy
Sujeita à seguinte restrição:
g ( x , y) = x 2 + y 2 − 8
Solução
Devemos encontrar os gradientes ∇z e ∇g :
∇z = ( y, x ) e ∇g = (2x,2 y)
Conforme o método dos multiplicadores de Lagrange, existe um λ tal que:
∇z = λ∇g
Temos que:
y = λ 2x e x = λ 2 y
Isolando λ nas duas equações:
y x
λ= e λ=
2x 2y
Igualando os valores de λ:
x 2 = y2
Substituindo na curva g ( x , y) = 0 :
g ( x , y) = x 2 + y 2 − 8 = 0
2 x 2 − 8 = 0 ∴ x = ±2
Substituindo na expressão x 2 = y 2 temos que:
y = ±2
Os pontos a seguir são candidatos à maximizar a função z = f ( x, y) = xy :
(2,2) , (2,−2) , (−2,2) , (−2,−2)
Para sabermos qual dos pontos anteriores maximiza a função basta calcular o valor de z para
cada um dos pontos calculados:
( x , y) (2,2) (2,−2) (−2,2) (−2,−2)

z = xy 4 -4 -4 4
O valor máximo da função é 4 e ocorre nos pontos (2,2) e (−2,−2) . Por outro lado, a função
tem valor mínimo igual a -4 nos dois outros pontos encontrados.
Curva de nível z = 4
Restrição g ( x , y) = 0
Curva de nível z = −4

Projeto de Aplicação: Mínimos Quadrados

Suponha que tenhamos um conjunto de dados tabelados que foram obtidos de um
experimento qualquer com n valores de x e y:
x x1 x2 x3 ... xn
y y1 y2 y3 ... yn
Precisamos encontrar uma função f(x) que aproxime a tabela com o menor erro possível.
Graficamente, podemos ter uma idéia melhor do problema:
Podemos descobrir a função f(x) através do método dos mínimos quadrados. Quando as
quantidades envolvidas x e y são grandes em relação ao erro calculado, podemos facilmente
verificar que esse erro elevado ao quadrado é pequeno e ainda sempre positivo. Deste conceito
simples é que surge o método dos mínimos quadrados.
Considere o seguinte gráfico:
Para a abscissa xi podemos identificar dois valores de y: um corresponde ao valor tabelado yi

e o outro correspondente ao cálculo de f(xi), ou seja, substituindo xi na função que aproxima os
pontos tabelados. O erro entre o valor tabelado yi e o valor calculado f(xi) é igual a:
E = yi − f (x i )
O erro elevado ao quadrado é dado por:
E 2 = [y i − f ( x i )]2
Como f(x) depende de vários parâmetros (constantes), vamos chamar:
f ( x ) = f ( x , a , b, c,...)
Quando os valores de a, b, c, ... são conhecidos, a função possui apenas uma variável. Para o
nosso caso, conhecemos o valor de x e desconhecemos os valores das constantes. A função então
possui várias variáveis.

Vamos somar todos os erros cometidos para os valores de xi presentes na tabela. Dessa
maneira, a soma dos quadrados dos erros fica:
n
S(a , b, c,...) = ∑ [y i − f ( x i , a , b, c,...)]2
i =1
Para que o valor da soma seja mínimo, devemos calcular:
∂S(a , b, c,...) ∂S(a , b, c,...) ∂S(a , b, c,...)
= 0, = 0, = 0 , ...
∂a ∂b ∂c
Na forma desenvolvida:
∂S(a , b, c,...) n ∂f ( x i , a , b, c,...)
= ∑ [y i − f ( x i , a , b, c,...)] ⋅ =0
∂a i =1
∂ a
∂S(a , b, c,...) n ∂f ( x i , a , b, c,...)
= ∑ [y i − f ( x i , a , b, c,...)] ⋅ =0
∂b i =1
∂ b
∂S(a , b, c,...) n ∂f ( x i , a , b, c,...)
= ∑ [y i − f ( x i , a , b, c,...)] ⋅ =0
∂c i =1
∂c
E assim sucessivamente.
Vamos demonstrar a equação da reta que tenha o mínimo de erro ao aproximar um conjunto
de dados. A tabela será aproximada pela seguinte função:
y = f ( x , a , b) = ax + b
Observe que a equação da reta possui apenas duas constantes (a e b).
A soma dos erros elevados ao quadrado é dada por:
n
S(a , b) = ∑ [y i − f ( x i , a , b)]2
i =1
n
S(a , b) = ∑ [y i − (ax i + b)]2
i =1
As derivadas da função soma são iguais a:
n
∂S(a , b)
= −2∑ [y i − (ax i + b)] ⋅ x i = 0
∂a i =1
n
∂S(a , b)
= −2 ∑ [y i − (ax i + b)] ⋅ 1 = 0
∂b i =1
Ou melhor:
n n n
∑ x i yi − ∑ ax i2 − ∑ bx i = 0
i =1 i =1 i =1
n n n
∑ y i − ∑ ax i − ∑ b = 0
i =1 i =1 i =1
Ou ainda:
n n n
∑ x i y i − a ∑ x i2 − b∑ x i = 0
i =1 i =1 i =1
n n
∑ y i − a ∑ x i − nb = 0
i =1 i =1

Essas duas equações formam o seguinte sistema:

 n 2 n n
 ∑ i
a x + b ∑ i ∑ x i yi
x =
 i =1 i =1 i =1
 n n
 a ∑ x i + bn = ∑ y i

 i =1 i =1
Da segunda equação encontramos:
n n
∑ yi − a∑ x i
b = i =1 i =1
n
Substituindo na primeira equação:
n n
n ∑ yi − a∑ x i n n
a ∑ x i2 + i =1 i =1
∑ x i = ∑ x i yi
i =1
n i =1 i =1
n n n n
n ∑ yi ∑ x i a∑ xi ∑ xi
n
a∑ x i2 + i =1 i =1 − i =1 i =1 = ∑ x i yi
i =1
n n i =1
Multiplicando os dois membros por n:
n n n n n n
na ∑ x i2 + ∑ y i ∑ x i − a ∑ x i ∑ x i = n ∑ x i y i
i =1 i =1 i =1 i =1 i =1 i =1
 n  n  n n n
2
 2 
a n∑ xi − ∑ xi   = n ∑ x i yi − ∑ x i ∑ yi
   
 i =1  i =1   i =1 i =1 i =1
Enfim, o coeficiente a é encontrado a partir da seguinte fórmula:
n n n
n ∑ x i yi − ∑ x i ∑ yi
a = i =1 i =1 i =1
2
n  n 
n ∑ x i2 −  ∑ x i 
 
i =1  i =1 
Vejamos agora um exemplo numérico.
Exemplo
Suponhamos que um experimento tenha fornecido os seguintes dados:
i xi yi
1 1 3
2 2 4
3 3 2,5
4 5 0,5
Qual é a reta que melhor se ajusta aos dados anteriores ?

Solução
Primeiramente, devemos construir a seguinte tabela:
i xi yi (xi)2 xiyi
1 1 3 1 3
2 2 4 4 8
3 3 2,5 9 7,5
4 5 0,5 25 2,5
Σ 11 10 39 21
Para calcularmos os coeficientes a e b devemos apenas aplicar as fórmulas:

n n n
n ∑ x i yi − ∑ x i ∑ y i
4 ⋅ 21 − 11 ⋅10 84 − 110 26
a = i =1 i =1 i =1 ∴ a= = = −
n  n 
2
4 ⋅ 39 − 112 156 − 121 35
n ∑ x i2 −  ∑ x i 
 
i =1  i =1 
n n
∑ yi − a∑ x i  26 
10 −  −  ⋅11 10 + 286
b = i =1 i =1 ∴ b=  35  = 35 = 159
n 4 4 35
A equação da reta que aproxima a tabela com o menor erro é dada por:
26 159
y=− x+
35 35
O gráfico da função que aproxima os pontos tabelados com o menor erro conforme o
método dos mínimos quadrados é dada por:

Capítulo 2 - Gradiente e Derivada Direcional

Enviado por

Dados do documento

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Capítulo 2 - Gradiente e Derivada Direcional

Enviado por

Direitos autorais:

Formatos disponíveis

Derivada Direcional, Gradiente, Máximos e Mínimos

Uma rápida introdução sobre vetores e retas

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Desejamos encontrar neste momento as coordenadas de qualquer ponto A = ( x, y) sobre a

Podemos estabelecer a relação entre os tamanhos dos vetores PA e u , paralelos, sabendo

Só é possível que o vetor PA tenha tamanho t se o tamanho do vetor u for igual a 1, ou

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

A medida da taxa instantânea de crescimento ou decrescimento de uma função é dada pela

Inclinação da reta tangente em

Na introdução do capítulo mostramos que se um ponto A = ( x, y) está sobre uma reta r,

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Conforme a definição geométrica dada por limites, as derivadas parciais em relação a x ou a

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

A derivada de z na direção do vetor j = (0,1) é dada por:

A derivada direcional não é um vetor! A derivada direcional apenas utiliza a

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Definição formal de derivada direcional

Propriedade da derivada direcional

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Sabemos que o segundo vetor do produto escalar é u . O primeiro vetor é denominado

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Direção de crescimento máximo

Direção de decrescimento máximo

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Em matemática, diríamos que cada “fatia” da tomografia computadorizada é uma curva de

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Os engenheiros mecânicos utilizam curvas de nível quando precisam selecionar bombas

Altura de descarga (metros) Vazão (litros por segundo)

Os fabricantes apresentam as curvas de nível da superfície anterior no seguinte gráfico:

Curvas de rendimento constante

Gráfico da função z = f ( x , y) = x 2 + y 2 Curvas de nível de z = f ( x , y) = x 2 + y 2

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Gráfico da função z = f ( x , y) = sen ( x ) ⋅ sen ( y) Curvas de nível de z = f ( x , y) = sen ( x ) ⋅ sen ( y)

Gradiente e curvas de nível

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Fica mais fácil verificar a afirmação anterior na figura a seguir:

Ao longo da curva de nível não há

A derivada na direção do vetor u tangente à curva de nível é igual a zero, ou seja:

Máximo, Mínimo e Ponto de Sela

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Na figura anterior, a segunda derivada parcial em relação a x é positiva, pois a concavidade

Se apenas derivarmos uma função parcialmente em relação a x e em relação a y, igualando a

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Observe o gráfico da função z = x 3 + y 3 − 3x − 3y + 4 e comprove os resultados obtidos:

(−1,1) é ponto de sela

(1,−1) é ponto de sela

As curvas de nível e o campo de gradientes da função z = x 3 + y 3 − 3x − 3y + 4 são

Curvas de nível da função Campo de gradientes da função

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Máximos e Mínimos Condicionados – Multiplicadores de Lagrange

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

( x , y) (2,2) (2,−2) (−2,2) (−2,−2)

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Projeto de Aplicação: Mínimos Quadrados

Para a abscissa xi podemos identificar dois valores de y: um corresponde ao valor tabelado yi

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Essas duas equações formam o seguinte sistema:

Qual é a reta que melhor se ajusta aos dados anteriores ?

PROF. FÁBIO NOGUEIRA BATISTA (fbatista@bol.com.br)

Para calcularmos os coeficientes a e b devemos apenas aplicar as fórmulas: