Escolar Documentos
Profissional Documentos
Cultura Documentos
Capítulo 2 - Gradiente e Derivada Direcional
Capítulo 2 - Gradiente e Derivada Direcional
Produto escalar
O produto escalar é uma operação entre vetores que produz um escalar. Essa operação é
bastante utilizada no cálculo de tamanhos ou ângulos entre vetores. O produto escalar pode ser
calculado através de duas fórmulas, dependendo das informações disponíveis:
• Se possuirmos as coordenadas dos vetores:
Considere os vetores u = ( x u , y u ) e v = ( x v , y v ) . A fórmula que calcula o produto escalar
entre esses vetores é dada por:
u ⋅ v = x u x v + yu yv
• Se possuirmos os tamanhos dos vetores e o ângulo entre eles:
Considere que os vetores u , de tamanho u , e v , de tamanho v , formem um ângulo θ
entre eles. O produto escalar entre esses vetores é dado por:
u ⋅ v = u v cos θ
Podemos utilizar a última fórmula para demonstrar que o produto escalar pode ser usado
quando desejamos calcular o tamanho de um vetor, dispondo apenas das suas coordenadas. Fazendo
o produto escalar do vetor u = ( x u , y u ) com ele mesmo:
2
u ⋅ u = u u cos 0 ∴ u ⋅ u = u
Observe que o ângulo entre o vetor u = ( x u , y u ) e ele próprio é zero já que os dois vetores
estão na mesma direção e sentido. O produto escalar que se encontra do lado esquerdo da igualdade
pode ser calculado por u ⋅ v = x u x v + y u y v .
Derivada direcional
A derivada direcional é uma derivada parcial especial calculada na direção de um vetor
unitário u . A função da derivada direcional é medir a taxa instantânea de crescimento ou
decrescimento de uma função num ponto ( x 0 , y 0 ) segundo a direção de um vetor u unitário. A
∂z
derivada direcional é representada pela derivada parcial .
∂u
PA = t
∂z
Inclinação da reta =
∂y
∂z
Inclinação da reta =
∂x
r
A derivada parcial na direção do vetor u mede a inclinação da reta tangente à superfície na
r
direção do vetor u como mostra o gráfico a seguir:
∂z
Inclinação da reta = r
∂u
r
u
Podemos perceber no gráfico anterior que, passando pelo ponto P, existem infinitas retas
tangentes à superfície z = f ( x , y) cuja inclinações são dadas pelas respectivas derivadas direcionais.
A derivada direcional é o caso mais geral de derivação parcial, pois podemos obter as
r
derivadas parciais em relação a x e a y fazendo a direção do vetor unitário u coincidir com as
r r
direções dos vetores unitários i (direção x) e j (direção y).
A derivada de z na direção do vetor i = (1,0) é dada por:
∂z ∂z ∂z ∂z
= 1+ 0 =
∂ i ∂x ∂y ∂x
Exemplo
Calcular a derivada da função z = f ( x , y) = x 3 y 2 na direção do vetor u = (3,4) calculando
a derivada no ponto ( x 0 , y 0 ) = (1,2) .
Solução
Vamos calcular o módulo do vetor u = (3,4) :
2
u = u ⋅ u = (3,4) ⋅ (3,4) = 9 + 16 = 25 ∴ u = 5
Observe que o vetor u = (3,4) não é unitário, devemos então dividí-lo pelo seu tamanho
para normalizá-lo:
u (3,4) 3 4
u unitário = = = ,
u 5 5 5
Calcule o tamanho deste último vetor e verifique que o resultado é igual a 1.
A derivada de z na direção do vetor u (normalizado) é dada por:
∂z ∂z ∂z
= a+ b
∂ u ∂x ∂y
Onde:
∂z ∂z
= 3x 2 y 2 e = 2x 3 y
∂x ∂y
3 4
a= e b=
5 5
Substituindo os resultados temos que:
∂z 3 4 9 8
= (3x 2 y 2 ) + (2 x 3 y) = x 2 y 2 + x 3 y
∂u 5 5 5 5
Finalmente, calculando a derivada parcial no ponto ( x 0 , y 0 ) = (1,2) :
∂z 9 8 52
(1,2) = 12 2 2 + 13 2 =
∂u 5 5 5
Gradiente
É interessante notar que a expressão da derivada direcional pode ser representada como um
produto escalar entre dois vetores:
∂z ∂z ∂z ∂z ∂z
= a + b = , ⋅ (a , b)
∂ u ∂x ∂y ∂x ∂y
Exemplo
Calcule o gradiente da função:
z = f ( x , y) = x 3 y 4
Solução
O gradiente da função é dado por:
∂z ∂z
∇z = ,
∂x ∂y
∇z = (3x 2 y 4 ,4 x 3 y 3 )
A palavra gradiente deriva do latim gradus (mesma origem das palavras gradual
e gradativo) que significa avançar passo-a-passo.
O significado do gradiente
A derivada direcional, sendo um produto escalar entre vetores, pode também ser calculada
da seguinte forma:
∂z
= ∇z ⋅ u = ∇z u cos θ
∂u
Como o vetor u é unitário, a derivada direcional se torna:
∂z
= ∇z ⋅ u = ∇z cos θ
∂u
Como − 1 ≤ cos θ ≤ 1 , o valor máximo e mínimo da derivada direcional é igual a:
∂z
= ∇z ⋅ u = + ∇z (máximo)
∂u
∂z
= ∇z ⋅ u = − ∇z (mínimo)
∂u
O valor máximo ocorre quando o ângulo θ entre o gradiente e o vetor u é igual a zero e o
valor mínimo ocorre quando o ângulo θ entre o gradiente e o vetor u é igual a 180o, ou seja,
quando o gradiente e o vetor u estão na mesma direção e no mesmo sentido, a derivada direcional é
máxima e tem valor igual a ∇z .
Por outro lado, quando o gradiente e o vetor u estão na mesma direção e sentidos
contrários, a derivada direcional é mínima e tem valor igual a − ∇z .
Podemos também afirmar que a derivada direcional é máxima quando o vetor u é igual a:
∇z
u=
∇z
Observe que a derivada direcional máxima ocorre quando o vetor u é o vetor unitário na
direção do gradiente da função.
O gradiente tem a finalidade de apontar para a direção de maior crescimento da função
conforme mostra a figura a seguir:
Exemplo
Considere a função:
z = f ( x , y) = x 2 y
Determine o valor máximo da derivada direcional no ponto P = (2,1) , determinando o vetor
unitário na direção a qual a derivada direcional é máxima.
Solução
O vetor gradiente da função é dado por:
∂z ∂z
∇z = ,
∂x ∂y
Onde:
∂z ∂z
= 2xy e = x2
∂x ∂y
Logo, o vetor gradiente no ponto P = (2,1) é igual a:
∇z(2,1) = (4,4)
O módulo do gradiente pode ser calculado pelo seguinte produto escalar:
2
∇z = ∇z⋅ ∇z = (4,4) ⋅ (4,4) = 16 + 16 = 32
∇z = 32 = 4 2
O valor máximo da derivada direcional pode ser calculado pela fórmula:
∂z
= + ∇z = 4 2
∂u
A derivada direcional é máxima quando o vetor u for igual a:
∇z 1 1
(4,4)
u= = = ,
∇z 4 2 2 2
Curvas de nível
Os médicos recorrem à tomografia computadorizada quando desejam visualizar a imagem
do cérebro do paciente. Nesse tipo de exame, a imagem do cérebro do paciente é “fatiada” em
várias partes conforme mostram as figuras a seguir:
Cada número que acompanha uma curva representa a altura da “fatia” do relevo. Por
exemplo, o ponto 1 e o ponto 2 mostrados na figura estão na cota 10, ou seja, possuem a mesma
altura igual a 10. No mapa topológico da região estão presentes as várias curvas de nível do relevo.
Rendimento (%)
'
Vazão (litros por segundo)
As curvas de nível de uma função representam as diversas “fatias” do gráfico da função,
uma para cada valor escolhido da variável dependente z.
As figuras a seguir mostram os gráficos de funções e as suas curvas de nível:
Observe que os pontos “mais altos” (maior valores de z) são mais claros e os
pontos “mais baixos” (menores valores de z) são mais escuros.
Uma curva de nível é uma curva no espaço IR 2 para um valor arbitrário de z, ou seja,
escolhemos um valor para z (fazemos z igual a uma constante genérica c) e descobrimos qual é a
característica das curvas de nível. Vale dizer que nem sempre é fácil imaginar o formato das curvas
de nível de uma função a partir das equações obtidas fazendo z = c .
A expressão matemática das curvas de nível da função z = f ( x , y) = x 2 + y 2 é dada por:
x 2 + y2 = c
Conforme a equação anterior, as curvas de nível são circunferências centradas na origem
com raios iguais a c .
u
u
u
u
Curvas de nível de z = f ( x , y) = x 2 + y 2
Suponha que o vetor u é tangente a uma das curvas de nível da função. Como todos os
pontos sobre uma curva de nível possuem a mesma “altura” z, a taxa de crescimento ou
decrescimento da função na direção tangente a qualquer curva de nível é igual a zero.
u u
∇z
Por exemplo, a figura a seguir mostra um ponto crítico da função. Observe que as derivadas
parciais em relação a x e em relação a y são ambas iguais a zero:
A inclinação da reta
∂z
tangente à curva: =0
∂x
A inclinação da reta
∂z
tangente à curva: =0
∂y
Sabemos que a segunda derivada de uma função fornece a sua concavidade. Na figura
mostrada anteriormente, a segunda derivada parcial em relação a x é negativa, pois a concavidade
da curva paralela ao eixo x é para baixo. Estamos então sobre o ponto mais alto da curva. Além
disso, a segunda derivada em relação a y também é negativa, indicando que a concavidade da curva
paralela ao eixo y também está voltada para baixo. Combinando as duas situações, podemos afirmar
que localizamos um ponto de máximo local.
Observe a figura a seguir:
∂ 2z
• Se H( x 0 , y 0 ) > 0 e ( x 0 , y 0 ) > 0 , então, ( x 0 , y 0 ) será ponto de mínimo local.
∂x 2
∂ 2z
• Se H( x 0 , y 0 ) > 0 e ( x 0 , y 0 ) < 0 , então, ( x 0 , y 0 ) será ponto de máximo local.
∂x 2
• Se H( x 0 , y 0 ) < 0 , então, ( x 0 , y 0 ) será ponto de sela.
• Se H( x 0 , y 0 ) = 0 nada se pode afirmar.
Exemplo
Considere a função:
z = f ( x, y) = x 3 + y 3 − 3x − 3y + 4
Determine os pontos críticos da função e classifique os resultados em pontos de máximo,
mínimo ou de sela.
Solução
As derivadas parciais em relação a x e a y são dadas por:
∂z
= 3x 2 − 3
∂x
∂z
= 3y 2 − 3
∂y
Os pontos críticos da função podem ser encontrados anulando as derivadas parciais:
∂z
= 3x 2 − 3 = 0
∂x
∂z
= 3y 2 − 3 = 0
∂y
Temos então um sistema com duas equações e duas variáveis:
3x 2 − 3 = 0
2
3y − 3 = 0
As soluções do sistema são os pontos:
(1,1) , (1,−1) , (−1,1) , (−1,−1)
Embora tenhamos encontrado os pontos críticos da função, ainda não sabemos que tipo de
ponto crítico é cada um dos pontos calculados. Para isso, precisamos da ajuda do determinante
Hessiano conforme as condições dadas no quadro mostrado anteriormente.
Vamos calcular as derivadas parciais presentes no Hessiano:
∂ 2z ∂ 2z
= 6x e = 6y
∂x 2 ∂y 2
∂ 2z ∂ 2z
= =0
∂x∂y ∂y∂x
Substituindo as derivadas parciais no Hessiano temos a seguinte expressão:
6x 0
H ( x , y) = = 36 xy
0 6y
Vamos analisar cada ponto crítico encontrado conforme as condições de caracterização
dadas anteriormente.
• Ponto (1,1) :
6 0 ∂ 2z
Como H (1,1) = = 36 e (1,1) = 6 , então, (1,1) é ponto de mínimo
0 6 ∂x 2
• Ponto (1,−1) :
6 0
Como H (1,−1) = = −36 , então, (1,−1) é ponto de sela
0 −6
• Ponto (−1,1) :
−6 0
Como H (−1,1) = = −36 , então, (−1,1) é ponto de sela
0 6
• Ponto (−1,−1) :
−6 0 ∂ 2z
Como H (−1,−1) = = 36 e (−1,−1) = −6 , então, (−1,1) é ponto de máximo
0 −6 ∂x 2
(1,1) é mínimo
3 2
1 3
Observe que o sentido das setas do campo de gradientes conduz aos pontos críticos, onde o
gradiente é zero. As setas podem convergir de todas as direções para um ponto de máximo (1) ou
divergir de um ponto de mínimo para todas as direções (2). Os pontos de sela (3) são caracterizados
pela convergência de setas numa direção e divergência de setas em outra direção.
∇g ∇z
∇z
∇g
B
A
C
g ( x , y) = 0
Todos os pontos sobre a curva g ( x , y) = 0 que cruzam com as curvas de nível da função
z = f ( x, y) é uma possível solução ao problema:
Maximizar z = f ( x, y)
Sujeito à restrição:
g ( x , y) = 0
À medida que caminhamos ao longo de g ( x , y) = 0 do ponto A para o ponto B, a função
z = f ( x, y) aumenta de valor, pois a curva de nível em A possui “altura” menor que a curva de nível
em B. Se continuarmos caminhando em direção ao ponto C, podemos perceber que voltaremos ao
mesmo nível que o ponto A já que estamos sobre a mesma curva de nível. Podemos concluir que o
ponto B é o único ponto sobre a curva g ( x , y) = 0 em que a função assume o seu valor máximo.
Sabendo que os vetores gradientes são perpendiculares às suas curvas de nível, percebemos
que ∇z e ∇g são paralelos no ponto B. No ponto A, por exemplo, esses vetores estão separados
por um ângulo diferente de zero. Como os vetores ∇z e ∇g são paralelos no ponto B é possível
afirmar então que encontramos um ponto de máximo da função quando os dois gradientes são
múltiplos um do outro. A relação entre os gradientes é expressa da seguinte forma:
∇z = λ∇g no ponto B = ( x 0 , y 0 )
O método dos multiplicadores de Lagrange consiste em encontrar pontos sobre uma curva
g ( x , y) = 0 de maneira que exista proporcionalidade entre os gradientes ∇z e ∇g .
O método dos multiplicadores de Lagrange é válido desde que as coordenadas do vetor ∇g
sejam diferentes de zero.
Exemplo
Considere que desejamos maximizar a função:
z = f ( x, y) = xy
Sujeita à seguinte restrição:
g ( x , y) = x 2 + y 2 − 8
Solução
Devemos encontrar os gradientes ∇z e ∇g :
∇z = ( y, x ) e ∇g = (2x,2 y)
Conforme o método dos multiplicadores de Lagrange, existe um λ tal que:
∇z = λ∇g
Temos que:
y = λ 2x e x = λ 2 y
Isolando λ nas duas equações:
y x
λ= e λ=
2x 2y
Igualando os valores de λ:
x 2 = y2
Substituindo na curva g ( x , y) = 0 :
g ( x , y) = x 2 + y 2 − 8 = 0
2 x 2 − 8 = 0 ∴ x = ±2
Substituindo na expressão x 2 = y 2 temos que:
y = ±2
Os pontos a seguir são candidatos à maximizar a função z = f ( x, y) = xy :
(2,2) , (2,−2) , (−2,2) , (−2,−2)
Para sabermos qual dos pontos anteriores maximiza a função basta calcular o valor de z para
cada um dos pontos calculados:
O valor máximo da função é 4 e ocorre nos pontos (2,2) e (−2,−2) . Por outro lado, a função
tem valor mínimo igual a -4 nos dois outros pontos encontrados.
Curva de nível z = 4
Restrição g ( x , y) = 0
Curva de nível z = −4
x x1 x2 x3 ... xn
y y1 y2 y3 ... yn
Precisamos encontrar uma função f(x) que aproxime a tabela com o menor erro possível.
Graficamente, podemos ter uma idéia melhor do problema:
Podemos descobrir a função f(x) através do método dos mínimos quadrados. Quando as
quantidades envolvidas x e y são grandes em relação ao erro calculado, podemos facilmente
verificar que esse erro elevado ao quadrado é pequeno e ainda sempre positivo. Deste conceito
simples é que surge o método dos mínimos quadrados.
Considere o seguinte gráfico:
Vamos somar todos os erros cometidos para os valores de xi presentes na tabela. Dessa
maneira, a soma dos quadrados dos erros fica:
n
S(a , b, c,...) = ∑ [y i − f ( x i , a , b, c,...)]2
i =1
Para que o valor da soma seja mínimo, devemos calcular:
∂S(a , b, c,...) ∂S(a , b, c,...) ∂S(a , b, c,...)
= 0, = 0, = 0 , ...
∂a ∂b ∂c
Na forma desenvolvida:
∂S(a , b, c,...) n ∂f ( x i , a , b, c,...)
= ∑ [y i − f ( x i , a , b, c,...)] ⋅ =0
∂a i =1
∂ a
∂S(a , b, c,...) n ∂f ( x i , a , b, c,...)
= ∑ [y i − f ( x i , a , b, c,...)] ⋅ =0
∂b i =1
∂ b
∂S(a , b, c,...) n ∂f ( x i , a , b, c,...)
= ∑ [y i − f ( x i , a , b, c,...)] ⋅ =0
∂c i =1
∂c
E assim sucessivamente.
Vamos demonstrar a equação da reta que tenha o mínimo de erro ao aproximar um conjunto
de dados. A tabela será aproximada pela seguinte função:
y = f ( x , a , b) = ax + b
Observe que a equação da reta possui apenas duas constantes (a e b).
A soma dos erros elevados ao quadrado é dada por:
n
S(a , b) = ∑ [y i − f ( x i , a , b)]2
i =1
n
S(a , b) = ∑ [y i − (ax i + b)]2
i =1
As derivadas da função soma são iguais a:
n
∂S(a , b)
= −2∑ [y i − (ax i + b)] ⋅ x i = 0
∂a i =1
n
∂S(a , b)
= −2 ∑ [y i − (ax i + b)] ⋅ 1 = 0
∂b i =1
Ou melhor:
n n n
∑ x i yi − ∑ ax i2 − ∑ bx i = 0
i =1 i =1 i =1
n n n
∑ y i − ∑ ax i − ∑ b = 0
i =1 i =1 i =1
Ou ainda:
n n n
∑ x i y i − a ∑ x i2 − b∑ x i = 0
i =1 i =1 i =1
n n
∑ y i − a ∑ x i − nb = 0
i =1 i =1
Exemplo
Suponhamos que um experimento tenha fornecido os seguintes dados:
i xi yi
1 1 3
2 2 4
3 3 2,5
4 5 0,5
Solução
Primeiramente, devemos construir a seguinte tabela:
i xi yi (xi)2 xiyi
1 1 3 1 3
2 2 4 4 8
3 3 2,5 9 7,5
4 5 0,5 25 2,5
Σ 11 10 39 21