Você está na página 1de 9

Matriz Hessiana e Aplicaes

Sadao Massago Dezembro de 2010

Sumrio
1 Introduo 2 Matriz Jacobiana 3 Matriz hessiana 4 Taylor de primeira e segunda ordem 5 Classicao dos pontos crticos A Procedimeno da demonstrao do Teorema 5.5 B Taylor de ordem qualquer 1 1 2 2 3 7 8

1 Introduo
Sabemos que uma funo real de uma varivel poder ser aproximado por Taylor de segunda ordem na qual costuma apresentar uma preciso melhor do que o uso somente das primeiras derivadas. O Taylor de segunda ordem tambm permite obter critrios de classicao dos pontos crticos no degenerados atravs da segunda derivada. No caso das funes reais de vrias variveis tambm apresenta os resultados similares, mas a segunda derivada uma matriz, o que aumentar a complexidade.

2 Matriz Jacobiana
Dado uma funo vetorial de vrias variveis F : Rm Rn com F (X ) = (f1 (X ), . . . , fn (X )), a representao matricial da derivada, quando existe, denominada de matriz Jacobiana denido f1 f1 x f1 x1 m . . . .. . como sendo JF(x1 , . . . , xn ) = . . . . = . . . Quando m = n, a matriz jacobiana

fn

fn x1

fn xm

uma matriz quadrada e o seu determinante


(f1 ,...,fn ) (x1 ,...,xm )

. = det . .

f1 x1

.. .

f1 xm

denominado de

. . .

fn x m funo jacobiana. Os livros de clculo costumam designar a funo jacobiana simplesmente como jacobiana.

fn x1

Exemplo 2.1.

,x y . Obter a matriz jacobiana de F (x, y ) = x2 y, x y x2 y


x y

2xy
1 y

x2
x y2

Soluo: JF (x, y ) =

xy

Exemplo 2.2.

Obter a funo jacobiana de F (x, y ) = xy, x . y

Soluo: JF (x, y ) =

xy
x y

y
1 y

x
x y2

. Assim, a funo jacobiana

(xy, x y) (x,y )

= det JF (x, y ) =

det

y
1 y

x
x y2

x y

x y

2x . y

3 Matriz hessiana
Dada uma funo real de vrias variveis, f : Rn R, a matriz jacobinana (derivada) do gradiente (que funo vetorial) denominado de matriz hessiana de f . Assim, Hessf (x1 , . . . , xn ) = f 2 f 2f x1 x1 xn x1 x1 . . . .. . . J . = . . . . .
f x n xn A matriz hessiana sempre uma matriz quadrada. O determinante da matriz hessiana denominado de funo hessiana que no pode ser confundido com a matriz hessiana. Nos livros de clculo, a funo hessiana costuma ser referenciado simplesmente de hessiana. f xn f x1 xn
2

Exemplo 3.1.

Obter a matriz e a funo hessiana da funo f (x, y ) = x2 y 3 . 2xy 3 Soluo: f (x, y ) = (2xy 3 , 3x2 y 2 ) = e a matriz hessiana Hessf (x, y ) = J 3x2 y 2 . A funo hessiana det Hess(f )(x, y ) = det

2xy 3 3x2 y 2

2y 3 6xy 2 6xy 2 6x2 y 24x2 y 4 .


Observao

2y 3 6xy 2 6xy 2 6x2 y

= 12x2 y 4 36x2 y 4 =

3.2. Como conseqncia do Teorema de Schwartz, quando a matriz hessiana for contnua, ele ser uma matriz simtrica.

4 Taylor de primeira e segunda ordem


Seja f : Rn R, uma funo real de vrias variveis. O Taylor de ordem 2 (que pode ser obtido pelo uso de Taylor do caso de uma varivel sobre a reta P + t(X P )) dado por R2 1 f (P + H ) = f (P ) + f (P ), H + 2 hessf (P )H, H + R2 onde lim = 0 e H = X = n ||H ||2 X P = (x1 , . . . , xn ) um vetor. O resto do Taylor de segunda ordem envolve derivadas parciais de ordem 3, o que no entraremos em detalhes. No caso de uma varivel, o reso de Taylor de ordem n o (n + 1)-simo termo do Taylor, com a derivada calculado no ponto desconhecido entre P e P + H . Isto vale tambm para o caso de vrias variveis, mas os termos de Taylor de ordem maior ou igual a 3 requer o uso da forma combinatorial, enquanto que at a segunda ordem, poder ser escrito atravs da expresso vetorial e matricial. No caso da funo de uma varivel, o Taylor de primeira ordem 2

Hessf (ZH )H, H para algum ponto ZH no f (P + H ) = f (P ) + f (P ), H > +R1 com R1 = 1 2 segmento que liga P a P + H . No entanto, obter um bom limitante superior para R1 requer o uso da norma matricial.
Obter o Taylor de segunda ordem de f (x, y ) = exy sen(y x) em torno de (0, 0). Soluo: Como a funo tem as derivadas de qualquer ordem, a segunda derivada contnua e a matriz hessiana ser simtrica.

Exemplo 4.1.

f (0, 0) = 0

f (x, y ) = exy sen(y x) exy cos(y x), exy sen(y x) + exy cos(y x) = exy (sen(y x) cos(y x)) , exy (sen(y x) + cos(y x))
de modo que f (0, 0) = (0 1, 0 + 1) = (1, 1).

Hessf (x, y ) = (F (x, y )) =


Temos,
2f xx x y

exy (sen(y x) cos(y x)) exy (cos(y x) sen(y x))

(exy (sen(y x)cos(y x))) = = exy (sen(y x) + cos(y x))+exy ( cos(y x) + sen(y x)) = x 2e sen(y x). (exy (sen(y x)cos(y x))) 2f = = exy (sen(y x) cos(y x))+exy (cos(y x) + sen(y x)) = yx y 2exy cos(y x). 2f 2f = yx = 2exy cos(y x) por hessiana ser simtrica. xy Neste exemplo, temos que f = f (no vale no caso geral) e y x 2f yy

f y

f x = yx = 2exy sen(y x).

Assim, Hessf (x, y ) = Logo, Hessf (0, 0) =

2exy sen(y x) 2eyx cos(y x) 2exy cos(y x) 2exy sen(y x)

0 2 . 2 0 Assim, o Taylor de ordem 2 em (0, 0) dado por h k 0 2 2 0 , (h, k ) + R2 ento o polinmio h k , (h, k ) = 0 h + k +

hessf (0, 0) f (0 + h, 0 + k ) = f (0, 0) + f (0, 0), (h, k ) + 1 2


de Taylor de ordem 2 ser p2 (h, k ) = 0 + (1, 1), (h, k ) +
1 2 1 2

2k 1 , (h, k ) = h + k + 2 (2k, 2h), (h, k ) = h + k + 4hk e temos 2 2h p2 (h, k ) = h + k + 2hk . Como x = 0 + h e y = 0 + k , temos que h = x e k = y . Substituindo no polinmio, temos p2 (x, y ) = x + y + 2xy . Observe que importante deixar escrito em x e y em vez de h = x e k = y , pois a varivel da funo f x e y . Por exemplo, f (0.2, 0.3) = 0.2 + (0.3) + 2 0.2 (0.3) = 0.5 + 0.04 0.12 = 0.58.

5 Classicao dos pontos crticos


Como a funo cresce na direo do gradiente e decresce na direo oposta do gradiente, nos pontos de mximos e mnimos locais o gradiente ser nulo, caso exista. 3

Denio 5.1.

O ponto P tal que f (P ) = ou f (P ) = 0 denominado de ponto crtico de f . A imagem do ponto crtico denominado de valor crtico. Um ponto dito ponto regular se no for ponto crtico. O valor no crtico denominado de valor 1 regular. O valor regular requer cuidado. Um valor C regular se f (C ) = {X : f (X ) = C } no contm pontos crticos (no existe ponto crtico P tal que f (P ) = C ). Portanto, para ser um valor regular, no basta que seja imagem do ponto regular.

Exemplo 5.2.

Encontre os pontos crticos de f (x, y ) = x 3 y + 1 x.


3 (y +1)2

x Soluo: Temos que f (x, y ) = ( 3 y + 1 1, 3

Pontos crticos 1o.) f (P ) = Quando y = 1, independente de x ento (x, 1). 2o.) f (P ) = 0 Quando x = 0 e y = 0 (exerccio). Assim, os pontos crticos so (x, 1) e (0, 0).

Denio 5.3.

Seja P , um ponto do domnio de f : D Rn R.

O ponto P dito ponto de mnimo local se para todo ponto X = P sucientemente prximo de P , tem-se que f (X ) f (P ). Se a desigualdade for estrita (f (X ) > f (P )) ento dizemos que ponto de mnimo local estrito. No ponto de mnimo local estrito, a funo cresce em todas as direes. O ponto P dito ponto de mximo local se para todo ponto X = P sucientemente prximo de P , tem-se que f (X ) f (P ). Se a desigualdade for estrita (f (X ) < f (P )) ento dizemos que ponto de mximo local estrito. No ponto de mximo local estrito, a funo decresce em todas as direes. O ponto P dito ponto de sela quando tiver uma direo que cresce e outra direo que decresce. No deve confundir com o ponto planar na qual a funo mantm constante perto do ponto. Note que os valores calculados nos pontos de mximos e mnimos so denominados de valor de mximo e valor de mnimo, respectivamente. Seja P , um ponto crtico do tipo f (P ) = 0. Quando a matriz hessiana for matriz singular (det Hessf (P ) = 0), dizemos que o ponto crtico degenerado. Reciprocamente, um ponto crtico na qual det Hessf (P ) = 0 denominado de ponto crtico no degenerado. Para enunciar o teorema de classicao dos pontos crticos, precisamos de determinante dos menores principais que denido como a seguir. a1,1 a1,n . . .. . Denio 5.4. O determinante do menor principal de A = . . . . de ordem i denido

an,1 como i = i (A) = det

an,n

a1,1 a1,i . . .. . . . . . que o determinante do bloco de tamanho i i localizado ai,1 ai,i na posio superior esquerdo de A.
No caso de Hessf (X ) ser contnua em P , a matriz hessiana e simtrica e podemos mostrar que 4

Teorema 5.5.
1.

Seja

um ponto critico no degenerado da funo

f : Rn R (f (P ) = 0

det Hessf (P ) = 0)

com todas as derivadas parciais de segunda ordem so contnuas, ento se, e somente

i (Hessf (P )) > 0 para todo i = 1, . . . , n (todos i 's so estritamente positivos) se P ponto de mnimo local estrito (funo cresce em todas as direes).

2.

(1)i i (Hessf (P )) > 0 para todo i = 1, . . . , n (sinal de i alternado, comeando de negativo) se, e somente se, P o ponto de mximo local estrito (funo decresce em todas as direes).

3. Se for nenhuma das anteriores, ento o ponto de sela (tem direo em que a funo cresce e outra direo em que a funo decresce).

Observe que o critrio deve coincidir com o caso de uma varivel quando n = 1. Logo, 1 < 0 para mximo local. A demonstrao de 1 pode ser feita pela anlise do Taylor de segunda ordem atravs do Teorema Espectral que costuma ser estudado no segundo curso de lgebra Linear. Para completar a demonstrao, tambm vai precisar do Teorema sobre determinantes dos menores principais da matriz simtrica. Para parte de 2, observe que P um ponto de mximo local estrito se, e somente se f (x) < f (P ) para todos os pontos X = P , sucientemente prximos de P . Isto quer dizer que f (X ) < f (P ) para tais pontos. Assim, P ponto de mximo local restrito de f se, e somente se, P o ponto de mnimo local restrito de f . Como Hess(f )(P ) = Hessf (P ), temos que i (Hess(f )(P )) = (1)i (Hessf (P )). Logo, i (Hess(f )(P )) = (1)i (Hessf (P )) > 0 se, e somente se, P um ponto de mnimo local restrito de f , isto , um ponto de mximo local restrito de f . O caso do ponto de sela pela excluso, observando que no caso de det Hessf (P ) = 0, o ponto deve ser de mximo local restrito, mnimo local restrito ou de sela, como consequncia do Teorema A.2.
Observao

5.6. No caso do ponto crtico degenerado (det Hessf (P ) = 0), no podemos determinar o comportamento atravs do Teorema 5.5. Uma alternativa obter os auto valores da matriz hessiana e usar o Teorema A.2 na qual permite tirar concluses mesmo para alguns casos degenerados (det Hessf (P ) = 0). 5.7. No caso do domnio no ser aberto, o ponto regular ou o ponto de sela na fronteira pode tornar mximo ou mnimo local, o que aumenta a complexidade de estudos, mesmo considerando os gradientes e hessianas, estendidos para a fronteira. O mtodo de multiplicadores de Lagrange permite detectar possveis "pontos regulares" que tornaram pontos crticos na curva ou superfcies, mas anlise de mximos e mnimos locais sobre a curva e superfcies costumam ser omitidos nos cursos de clculo.

Observao

Exemplo 5.8.

Obter e classicar o ponto crtico de f (x, y ) = x2 + y 2 + z 2

2 0 0 Soluo: O ponto crtico exatamente (0, 0, 0) (exerccio) e Hessf (0, 0, 0) = 0 2 0 (exer0 0 2 ccio). Obtendo o determinante dos menores principais de 2 0 0 0 2 0 0 0 2
5

temos que 1 = 2 > 0, 2 > 0 e 3 = det Hessf (0, 0, 0) = 8 > 0. Logo, (0, 0, 0) um ponto de mnimo local. No exemplo acima, como f (0, 0, 0) = 0 e f (x, y, z ) 0 para todo (x, y, z ), (0, 0, 0) um ponto de mnimo global. 5.9. No caso da funo de vrias variveis, ter um nico ponto crtico e ele ser ponto de mnimo local no implica que um ponto de mnimo global. A funo f (x, y ) = x2 + y 2 (1 + x)3 tem um nico ponto crtico que a origem e um ponto de mnimo local, o que pode ser vericado facilmente pela matriz hessiana. No entanto, lim f (x, y ) = (exerccio). Logo, (0, 0) no um
Observao

ponto de mnimo global. Problemas similares ocorrem quando tenta generalizar os resultados da funo de uma varivel para caso das funes de vrias variveis. Alguns resultados continuam vlidos, outros precisam de condies adicionais ou ter resultados apenas parciais, enquanto que alguns no valem.

y =1 x

Exemplo 5.10.

Obter e classicar o ponto crtico de f (x, y ) = xy

Soluo: O ponto crtico exatamente (0, 0) (exerccio) e Hessf (0, 0) = Calculando os i 's de

0 1 1 0

(exerccio).

temos que 1 = 0 e 2 = det Hessf (0, 0) = 1. Como det Hessf (0, 0) = 0, um ponto de mximo local, mnimo local ou sela. Mas 1 = 0 e consequentemente, (0, 0) um ponto de sela.

0 1 1 0

Exemplo 5.11. Considere um ponto crtico P R3 na qual a funo tem segunda derivada contnua.
Em cada caso, efetue classicao, justicando devidamente. Note que 3 = det Hessf (P ) por ser de 3 variveis. 1. 1 = 1, 2 = 2 e 3 = 4. Soluo: como todos i so (estritamente) positivos, um ponto de mnimo local (estrito). 2. 1 = 1, 2 = 4 e 3 = 2. Soluo: como i 's tem sinais alternados e 1 < 0, um ponto de mximo local (estrito). 3. 1 = 2, 2 = 1 e 3 = 3. Soluo: Como 3 = det Hessf (P ) = 2 = 0 , ponto de minimo local, mximo local ou de sela. Os i 's tem sinais alternados, mas o primeiro (1 ) no negativo. Logo no ponto de mximo local. Como 2 = 1 < 0, no mnimo local. Logo, um ponto de sela. 4. 1 = 2, 2 = 1 e 3 = 2. Soluo: Temos que nem todas i 's so positivos, nem tem sinais alternados. Como 3 = det Hessf (P ) = 2 = 0, um ponto de sela. 5. 1 = 1, 2 = 0 e 3 = 2. Soluo: como 2 = 0, no pode ser mnimo local (no estritamente positiva), nem mximo local (sinal alternado). Como 3 = det Hessf (P ) = 2 = 0, s pode ser ponto de sela. 6. 1 = 2, 2 = 1 e 3 = 0. Soluo: como 3 = det Hessf (P ) = 0, nada pode ser concludo. 6

No caso da classicao dos pontos crticos no degenerados da funo real de duas variveis, a expresso de i relativamente simples. Por exemplo, O critrio para mnimo local restrito 2f 2f 2f f > 0 e 2 = det Hessf = xx xy > 0, Analogamente, o ponto de mximo caria1 = xx yy
f local restrito ((1)i i > 0) torna xx < 0 e det Hessf = 2 mesmo, podemos juntar e enunciar como sendo 2f 2f xx yy

2f xy

> 0. Como a parte de P

Teorema 5.12.
ento

Se

f : R2 R

tem segundas derivadas parciais contnuas e

um ponto crtico,

f f Se det Hessf (P ) > 0 ento xx > 0 implica que um ponto de mnimo local estrito, xx <0 f implica que um ponto de mximo local estrito e xx = 0 implica que ponto de sela.

Se det Hessf (P ) < 0, ento um ponto de sela.


f f f xy = 0), nada pode ser No caso do ponto crtico ser degenerado (det Hessf (P ) = xx yy armado. Esta uma das verses que mais aparece nos livros de clculo, mas no h anloga para o caso de Rn , pois i torna mais complexa e no consegue explicitar condies em poucas palavras.
2 2 2

5.13. A tcnica mais rpida e simples para determinar se i so todos positivos no caso da matriz simtrica de dimenso maior que 3 aplicar o mtodo de decomposio de Cholesky.
Observao

A Procedimeno da demonstrao do Teorema 5.5


Este apndice destina aos estudantes que j tenham algum conhecimento de lgebra linear, tais como base e auto valores. No estudo terico da funo real de vrias variveis com segundas derivadas parciais contnuas (logo, matriz hessiana simtrica), o Teorema Espectral (veja [4]) desempenha um papel importante. O Teorema Espectral garante que toda matriz simtrica tem uma base ortonormal de auto vetores. Usando uma base de auto vetores ortonormais da matriz hessiana, temos que

Teorema A.1.

P , ento existe uma base na qual a sries de Taylor de segunda ordem tem a forma f (P +H ) = f (P )+ f (P ), H + 1 2 (1 h2 1 + + n hn ) + R2 onde H = (h1 , . . . , hn ) e 1 , . . . , n so os auto valores de Hessf (P ). 2
Se tem segundas derivadas parciais contnuas no ponto

f : Rn R

A expanso do Taylor de segunda ordem em torno do ponto crtico f (P ) = 0 torna f (P + H ) = 1 2 f (P ) + 2 (1 h2 1 + + n hn ) + R2 que no depende da base, exceto nas coordenadas hi de H (pois os auto valores no dependem da base). Por ser uma soma dos mltiplos de quadrados das coordenadas, podemos usar a condio sobre o erro do Taylor e provar que

Teorema A.2.

Se

f : Rn R

tem segundas derivadas contnuas e

um ponto crtico. Ento

P um ponto de mximo local estrito se todos os autovalores da matriz hessiana forem estritamente negativos. P um ponto de mnimo local estrito se todos os auto valores da matriz hessiana forem estritamente positivos Se tiver algum auto valor estritamente positivo e algum auto valor estritamente negativo, ento P ser um ponto de sela.
7

O Teorema 5.5 uma consequncia do Teorema A.2 para o caso no degenerado. No caso da matriz simtrica, todos os auto valores so estritamente positivos se, e somente se, todos os determinantes dos menores principais so estritamente positivos (veja [4]). O Teorema 5.5 apropriado para analisar uma funo com expresso dada explicitamente e com poucas variveis, enquanto que o Teorema A.2 apropriado para os estudos tericos ou dos pontos crticos degenerados.

B Taylor de ordem qualquer


Este apndice destinado para quem precisar do Taylor de ordem maior que 2 que pode ser usado tanto no estudo terico como na implementao computacional. Dado f : Rn R, a expanso de Taylor de ordem N dado por N n n RN k f (P ) hi1 hik + RN com lim = 0. f (P + H ) = ||H || ||H ||N x x i i 1 k i1 =1 ik =0 k=0 Para facilitar no uso terico, assim como reduzir os nmeros de termos necessrios na implementao computacional, costuma usar a notao de multi ndices. Um multi ndice de dimenso n uma n-upla = (1 , . . . , n ) onde i so inteiros no negativos. O valor absoluto e o fatorial so denidos como sendo || = 1 + + n e a! = a1 ! n !, n 1 respectivamente. Dado uma n-upla x = (x1 , . . . , xn ), denimos a potenciao x = x 1 xn . A derivada parcial repetida tambm pode ser escrita em termos de multi ndices como sendo 1 n = onde xi a i-sima varivel da funo em n-variveis. x1 xn Com estas notaes, a expanso de Taylor de ordem N pode ser escrito simplesmente como sendo

F (P + H ) =
||N

f (P )H + RN = !

k=0 | |= k

f (P )H RN + RN com lim = 0, onde ||H || ||H ||N !

RN =
||=N +1

f (ZH )H !

com ZH pertencente ao segmento que liga P a P + H .

A expresso em termos de multi ndices permite usar resultados da teoria combinatorial no estudo dos problemas que envolvem o Taylor de ordem maior que 2. Tambm note que na notao de multi ndices, os termos repetidos j esto agrupados, tendo reduzido signicativamente os nmeros de termos da expresso original. A implementao computacional tpica percorre os possveis multi ndices de ordem k atravs do algoritmo combinatorial para obter termos de ordem k da expanso de Taylor.

Referncias
[1] Lima, Elon L., "Curso de Anlise vol. 2" (projeto euclides), IMPA, 1985. [2] Lang, Serge, "Clculo vol. 2", Ao Livro tcnico S/A, 1971. [3] Guidorizzi, Hamilton L., "Clculo vol. 1", LTC editora, 2001. [4] Homan, Kenneth e Kunze, Ray (traduo de Bergamasco, Adalberto P.), "lgebra Linear", Editora da USP, 1971.

[5] Wikipdia, http://en.wikipedia.org/wiki/Multi-index_notation, consultado em 2010.