Você está na página 1de 9

Extremos locais e absolutos

Comecemos por recordar algumas definições já referidas no Capı́tulo 2.

Definição 1. Sejam U ⊂ Rn, x0 ∈ U e f : U ⊂ Rn −→ R uma função diferenciável.


Dizemos que a função f

i. tem um máximo global em x0 se f (x0 ) ≥ f (x), ∀x ∈ U ;

ii. tem um máximo global estrito em x0 se f (x0 ) > f (x), ∀x ∈ U ;

iii. tem um mı́nimo global em x0 se f (x0 ) ≤ f (x), ∀x ∈ U ;

iv. tem um mı́nimo global estrito em x0 se f (x0 ) < f (x), ∀x ∈ U .

Definição 2. Sejam U ⊂ Rn, x0 ∈ U e f : U ⊂ Rn −→ R uma função diferenciável.


Dizemos que a função f

i. tem um máximo local no ponto x0 existir uma bola de centro x0 , Bδ (x0 ), tal que
f (x0 ) ≥ f (x), ∀x ∈ Bδ (x0 ) ∩ U ;

ii. tem um máximo local estrito no ponto x0 existir uma bola de centro x0 , Bδ (x0 ), tal
que f (x0 ) > f (x), ∀x ∈ Bδ (x0 ) ∩ U ;

iii. tem um mı́nimo local no ponto x0 existir uma bola de centro x0 , Bδ (x0 ), tal que
f (x0 ) ≤ f (x), ∀x ∈ Bδ (x0 ) ∩ U ;

iv. tem um mı́nimo local estrito no ponto x0 existir uma bola de centro x0 , Bδ (x0 ), tal
que f (x0 ) < f (x), ∀x ∈ Bδ (x0 ) ∩ U .

Um ponto do domı́nio de f em que a função atinge o valor máximo designa-se por


ponto de máximo ou ponto maximizante. De forma semelhante, um ponto do domı́nio de
f em que a função assume um valor mı́nimo designa-se por ponto de mı́nimo ou ponto
minimizante. Máximos e mı́nimos da função f dizem-se extremos de f e pontos onde a
função f assume esses valores designam-se por pontos de extremo de f .
De seguida recordemos o Teorema de Weierstrass, já enunciado no Capı́tulo 2.

Teorema 1 (Weierstrass). Se f : U ⊂ n → R R
for uma função contı́nua e X ⊂ U
um conjunto compacto (i.e., X é limitado e fechado), então f admite um máximo e um
mı́nimo em X.

Tal como no caso de funções reais de variável real, a derivada desempenha um papel
crucial na busca de extremos. Neste caso, como estamos a lidar com funções escalares1
escrevemos, como habitualmente, ∇f (a) para designar Dfa .
1
Note que não faria muito sentido definir extremo para uma função vectorial uma vez que (no sentido
usual) um ponto de extremo para uma das funções coordenadas em geral não seria ponto de extremo
para outra função coordenada

1
R
Definição 3. Sejam U ⊂ n um conjunto aberto e f : U ⊂ n −→ R
uma função R
diferenciável. Dizemos que o ponto x0 ∈ U é um ponto crı́tico da função f se ∇f (x0 ) = 0.

Teorema 2. Sejam U ⊂ n e f : n −→ R R R
uma função diferenciável. Se x0 for um
ponto extremo local de f , então x0 é um ponto crı́tico de f .

Demonstração. Suponhamos que x0 é um ponto de máximo (respectivamente de mı́nimo)


de f . Consideremos as funções ϕi (t) = f (x0 + tei ), i = 1, . . . , n. Concluı́mos que 0 é um
ponto de máximo (resp. de mı́nimo) para cada uma das funções ϕi . Assim, uma vez que
para que uma função real de variável real diferenciável ψ(t) tenha um extremo em t0 é
0
necessário que ψ (t0 ) = 0, concluı́mos que

∂f
(x0 ) = ϕ0i (0) = 0,
∂xi
 
∂f ∂f
para todo o i = 1, . . . , n. Assim ∇f (x0 ) = ∂x1 (x0 ), . . . , ∂xn (x0 ) = (0, . . . , 0).

Observações 1. Note que podemos ter uma função diferenciável f com ∇f (x0 ) = 0 sem
que x0 seja extremo de f , i.e., nem todos os pontos crı́ticos são extremos. Tal situação
não é surpreendente. Na verdade, já em R
o facto da derivada anular-se não garantia
a existência de extremo. Como exemplo podemos tomar a função real de variável real
dada por f (x) = x3 . Como f 0 (x) = 3x2 ≥ 0 para todo o x ∈ R
verifica-se que a função
f é crescente em R R
e assim não têm extremos em . Temos no entanto f 0 (0) = 0.
A função g :R 2 R
−→ dada por g(x, y) = xy verifica ∇g(0, 0) = 0 e no entanto (0, 0)
não é extremo. De facto temos ao longo da recta y = x, g(x, x) = x2 e concluı́mos assim
que em toda a bola Bδ ((0, 0)) existem pontos (x0 , y0 ) tais que f (x0 , y0 ) > 0 = f (0, 0).
Por sua vez, ao longo da recta y = −x, g(x, −x) = −x2 e concluı́mos assim que em toda
a bola Bδ ((0, 0)) existem pontos (x1 , y1 ) tais que f (x1 , y1 ) < 0 = f (0, 0). Logo g não tem
extremos.

Exemplo 1.

Seja f : R2 −→ R definida por f (x, y) = 13 x3y − 4yx. Atendendo a que
1 3
∇f (x, y) = x2 y − 4y, 3x − 4x , concluı́mos que

1
 
∇f (x, y) = (0, 0) ⇔ x y − 4y, x3 − 4x = (0, 0).
2
3
Temos consequentemente que resolver o sistema
2
(
 − 4) =
y(x 0 .
1 2
x 3x − 4 = 0
 √   √ 
As soluções do sistema anterior são os pontos crı́ticos de f : (0, 0), −2 3, 0 e 2 3, 0 .

2
R
Exemplo 2. Seja C = {(x, y, z) ∈ 3 : x > 0 ∧ z > 0} e seja f : C −→ R
a função
dada
 por f (x, y, z) = x +  (y − 1)(log z − x) − log x. Atendendo a que ∇f (x, y, z) =
1 y−1
2 − y − x , log z − x, z , concluı́mos que

1 y−1
 
∇f (x, y, z) = (0, 0, 0) ⇔ 2 − y − , log z − x, = (0, 0, 0).
x z
Obtemos portanto o sistema 
1
 2−y− x =0

logz − x = 0 ,
 y−1 = 0

z

que tem como solução o único ponto crı́tico da função: (1, 1, e).

Como observámos um ponto crı́tico não tem que ser um ponto de extremo. No
entanto, se a função é diferenciável, os pontos de extremo têm de ser pontos crı́ticos.
Fica portanto a pergunta:

Como podemos saber se um ponto crı́tico é um extremo?

A resposta a esta pergunta requer a análise de uma matriz contendo derivadas de segunda
ordem. Recordemos alguns conhecimentos de Álgebra Linear necessários para o estudo
dos pontos crı́ticos.

Definição 4. Dada uma matriz quadrada M , designamos o polinómio

det(M − λI)

por polinómio caracterı́stico da matriz M . Às raı́zes do polinómio caracterı́stico ( i.e.,


R
os números λ ∈ tais que det(M − λI) = 0) designamos por valores próprios da matriz
M.

Definição 5. Dizemos que a matriz quadrada M é

i. definida positiva se os valores próprios λi de M satisfazem λi > 0;

ii. definida negativa se os valores próprios λi de M satisfazem λi < 0;

iii. semidefinida positiva se os valores próprios λi de M satisfazem λi ≥ 0 e pelo menos


um deles é igual zero;

iv. semidefinida negativa se os valores próprios λi de M satisfazem λi ≤ 0 e pelo menos


um deles é igual zero;

v. indefinida se M tem valores próprios negativos e positivos.

Definição 6. Seja M uma matriz quadrada de ordem n. Chamamos determinante de


ordem k de M ao determinante da matriz Mk , onde Mk é a matriz de ordem k que se
obtêm da matriz M eliminando as últimas n − k linhas e as últimas n − k colunas.

3
Teorema 3. A matriz M é uma matriz
i. definida positiva se det M1 > 0, det M2 > 0, . . . , det Mn > 0;
ii. definida negativa se se verificar um dos seguintes casos
• n é impar e det Mn < 0;
• n é par e det M1 < 0, det M2 > 0, . . . , det Mn > 0.
Seja a ∈ U . A matriz que analisaremos para responder à pergunta feita anteriormente
é a matriz
∂2f ∂2f ∂2f
 
∂x 2 (a) ∂x ∂x (a) . . . ∂x ∂x (a)
 1 1 2 1 n 
Hf (a) = 
 .. .. .. .. ,

 . . . . 
2
∂ f 2
∂ f 2
∂ f
∂xn ∂x1 (a) ∂xn ∂x2 (a) . . . 2
∂ xn
(a)
que se designa por matriz hessiana de f no ponto a. Note que, de acordo com o Teorema
de Schwarz, se f for de classe C 2 esta matriz é simétrica.
R R
Definição 7. Sejam f : U ⊂ n −→ de classe C 2 e x0 ∈ U . Dizemos que o ponto x0
é um ponto de sela da função f se existem direcções ao longo das quais x0 é um ponto
de mı́nimo de f e direcções ao longo das quais é um ponto de máximo de f .
O teorema seguinte constitui uma resposta parcial ao problema de classificação de
extremos de funções.
Teorema 4. Sejam f : U ⊂ Rn −→ R de classe C 2 e xo ∈ U .
i. Se Hf (x0 ) for definida positiva, então x0 é um ponto de mı́nimo;
ii. Se Hf (x0 ) for definida negativa, então x0 é um ponto de máximo;
iii. Se Hf (x0 ) for indefinida, então x0 é um ponto de sela.
Nos restantes casos nada se pode concluir directamente a partir da matriz hessiana.
R
Exemplo 3 (Continuação do exemplo 1). Seja f : 2 −→ R definida por f (x, y) =
1 3
x y − 4yx
3 √
a função do exemplo 1. Os pontos crı́ticos de f são, como vimos, (0, 0),
R
  √
−2 3, 0 e 2 3, 0 e a respectiva matriz hessiana, num ponto genérico (x, y) ∈ 2 ,
é " #
2xy x2 − 4
Hf (x, y) = .
x2 − 4 0
Assim temos
 √ √
" # " #
0 −4    0 8
Hf (0, 0) = e Hf 2 3, 0 = Hf −2 3, 0 =
−4 0 8 0
 √   √ 
Os valores próprios de Hf (0, 0) são -4 e 4 e de Hf 2 3, 0 e Hf −2 3, 0 são -8 e
8. Assim todas as matrizes são indefinidas pelo que os pontos crı́ticos de f são todos
pontos de sela. Concluı́mos que f não tem extremos.

4
R
Exemplo 4 (Continuação do exemplo 2). Sejam C = {(x, y, z) ∈ 3 : x > 0 ∧ z > 0}
e f : C −→ R a função dada por f (x, y, z) = x + (y − 1)(log z − x) − log x. O único
ponto crı́tico de f é, conforme vimos, (1, 1, e). A matriz hessiana, num ponto genérico
(x, y, z) ∈ C, é 
1

x2
−1 0
1
Hf (x, y, z) =  −1 0 ,
 
z
1 y−1
0 z − z 2

donde, para (x, y, z) = (1, 1, e),


 
1 −1 0
Hf (1, 1, e) =  −1 0 1e  .
 
1
0 e 0

Atendendo a que n = 3 é ı́mpar e det Hf (e, 1, 1) = − e12 > 0, temos pelo teorema 4 que
(e, 1, 1) é ponto de máximo de f , sendo o máximo f (e, 1, 1) = e − 1.

Extremos condicionados

R
Sejam f : U ⊂ n −→ R
e g : n −→ R R
funções de classe C 2 . Suponhamos que o
R
conjunto de nı́vel k ∈ de g está contido no domı́nio de f , i.e.,

g −1 (k) = {x ∈ Rn : g(x) = k} ⊂ U .
Consideremos o seguinte problema:
Determinação de
max f (x) e min f (x), (1)
x x

entre todos os x ∈ U tais que g(x) = k.


Pretendemos, portanto, encontrar o máximo e o mı́nimo da função f restrita ao conjunto
de nı́vel k de g. O teorema seguinte fornece uma condição necessária para um ponto ser
solução do problema 1.

Teorema 5 (Multiplicadores de Lagrange). Sejam f : U ⊂ n −→ R R


e g : n −→ R R
2
funções de classe C . Se x0 ∈ U é uma solução do problema 1, então existe λ ∈ tal R
que ∇f (x0 ) = λ∇g(x0 ).

5
No caso em que n = 2, a condição ∇f (x0 ) = λ∇g(x0 ) significa que a superfı́cie de
nı́vel k de g é tangente à superfı́cie de nı́vel de f que passa no ponto x0 . Assim temos
uma forma geométrica de localizar as possı́veis soluções do problema 1. Analı́ticamente,
o teorema diz-nos que os pontos candidatos a solução do problema 1 têm que satisfazer
o seguinte sistema de n + 1 equações:
(
∂f ∂g
∂xi (x)
= λ ∂xi
(x), i = 1, 2, . . . , n
. (2)
g(x) = k

Consideramos duas situações.

O conjunto de nı́vel k de g é compacto Neste caso, o Teorema de Weierstrass ga-


rante que existe um ponto máximo e um ponto mı́nimo no conjunto de nı́vel k de
g. Assim, depois de encontradas as soluções do sistema de equações 2, basta de-
terminar quais as de valor máximo e mı́nimo para obtermos um máximo absoluto
e um mı́nimo absoluto para o problema 1.

O conjunto de nı́vel k de g não é compacto Neste caso vamos restringir o nosso


estudo à dimensão 2, i.e., fazemos n = 2. Apresentemos de de seguida uma função
auxiliar.

Definição 8. Designamos a função L : R2 × R −→ R definida por


L(x, y, λ) = f (x, y) + λ(k − g(x, y)),

por função lagrangiana de f e a variável λ por multiplicador de Lagrange.

Observe que um ponto (x0 , y0 , λ0 ) satisfaz o sistema de equações 2 se e só se

∇L(x0 , y0 , λ0 ) = 0,

ou seja, se e só se (x0 , y0 , λ0 ) é um ponto crı́tico de L.


O teorema seguinte fornece condições para existência de solução do problema 1.

Teorema 6. Sejam f : U ⊂ 2 −→ R R
e g : 2 −→ R R funções de classe C 2,
R
k, λ0 ∈ e (x0 , y0 ) ∈ g −1 (k) tais que ∇L(x0 , y0 , λ0 ) = 0.

i. Se det HL(x0 , y0 , λ0 ) > 0, então (x0 , y0 ) é um ponto de máximo local;


ii. Se det HL(x0 , y0 , λ0 ) < 0, então (x0 , y0 ) é um ponto de mı́nimo local.

Demonstração. Consideremos o problema de determinar o máximo (resp. mı́nimo).


∂g ∂g
Seja (x0 , y0 ) uma solução do sistema e ∂y (x0 , y0 ) 6= 0 (O que acontece se ∂y = 0?).
Aplicando o teorema da função implı́cita à função g, é possı́vel determinar uma
bola de centro x0 suficientemente pequena Bδ (x0 ) onde y = h(x). Desta forma o
problema 1 pode ser reescrito do seguinte modo:

6
Determinação de

max f (x, h(x)) (min f (x, h(x))) (3)


x x

entre todos os x ∈ Bδ (x0 ).

Assim, obtemos um problema de maximização (resp. minimização) de uma função


de uma variável e sabemos que o ponto x0 será um máximo (resp. mı́nimo) se
a segunda derivada da função H(x) = f (x, h(x)) for estritamente negativa (resp.
positiva). Com uma conta (não muito simples!!) mostra-se que esta condição é
equivalente à hessiana da função lagrangiana no ponto (x0 , y0 ) ter determinante
estritamente positivo (resp. negativo).

Exemplo 5. Determinemos os extremos absolutos da função f (x, y) = 3x2 +2y 3 no con-


R
junto C = {(x, y) ∈ 2 : x2 +y 2 = 4}. Na “linguagem” de 3 este problema corresponde a
R
determinar maxx f (x) e minx f (x), entre todos os x ∈ 2 tais que g(x, y) = x2 + y 2 = 4.
O sistema de equações 2 no nosso caso é
 ∂f ∂g

 ∂x (x, y) = λ ∂x (x, y)
  6x = λ2x

∂f ∂g
∂y (x, y) = λ ∂y (x, y)
⇔ 6y 2 = λ2y .
  x2 + y 2 = 4

g(x, y) = 4

Usando a primeira equação obtemos x = 0 ou λ = 3. A primeira condição, x = 0,


origina o sistema de equações (
6y 2 = λ2y
,
y2 = 4
com soluções (x, y) = (0, 2) e (x, y) = (0, −2) correspondentes, respectivamente, a λ = 6
e λ = −6. Fazendo agora λ = 3 obtemos o sistema
(
6y 2 = 6y
,
x2 + y 2 = 4
√   √ 
com soluções (x, y) = (2, 0), (x, y) = (−2, 0), (x, y) = 3, 1 e (x, y) = − 3, 1 .
Como pretendemos apenas os extremos absolutos e o conjunto √ C é compacto,
 √ basta

notar que f (0, 2) = f (0, −2) = 16, f (2, 0) = f (−2, 0) = 12 e f 3, 1 = f − 3, 1 =
11. Assim o máximo absoluto da função é 16 (correspondente aos pontos de máximo
(0, 2) e (0, −2)) e o mı́nimo absoluto da função é 11 (correspondente aos pontos de
mı́nimo (2, 0), (−2, 0)).

Vejamos agora um exemplo onde não há compacidade.

Exemplo 6. Determinemos os extremos absolutos da função f (x, y) = 2x2 + y 2 no


R
conjunto C = {(x, y) ∈ 2 : x = y}. Na “linguagem” de 3 este problema corresponde a

7
determinar maxx f (x) e minx f (x), entre todos os x ∈ R2 tais que g(x, y) = x − y = 0.
O sistema de equações 2 no nosso caso é
 ∂f ∂g

 ∂x (x, y) = λ ∂x (x, y)
  4x = λ

∂f ∂g
∂y (x, y) = λ ∂y (x, y)
⇔ 2y = −λ .
 
 x=y
g(x, y) = 0

Obtemos uma única solução (x, y) = (0, 0), correspondente a λ = 0.


Uma vez que não temos compacidade não podemos garantir imediatamente que temos
um extremo. No nosso caso temos L(x, y, λ) = 2x2 + y 2 − λ(x − y) e portanto
 
4 0 −1
HL(0, 0, 0) =  0 2 1  .
 
−1 1 0

Atendendo a que det HL(0, 0, 0) = −6 < 0, conclui-se pelo teorema 6 que o ponto (x, y) =
(0, 0) é ponto de mı́nimo local, correspondente ao mı́nimo local f (0, 0) = 0.
Note que o teorema 6 também pode ser usado em casos onde temos compacidade.
Exemplo 7 (Continuação do exemplo 5). Vimos no exemplo 5 que a função f (x, y) =
3x2 + 2y 3 tinha quatro pontos de extremo absoluto no conjunto C = {(x, y) ∈ 2 : R
x2 + y 2 = 4}: os pontos de máximo (absoluto) (0, 2) e (0, −2) aos quais correspon-
dia o máximo (absoluto) 16 e os pontos de mı́nimo (absoluto) (2, 0), (−2, 0) aos quais
correspondia o mı́nimo (absoluto) 11. √   √ 
Obtivemos também os candidatos a ponto de extremo 3, 1 e − 3, 1 correspon-
dentes a λ = 3, os quais não foi possı́vel classificar com recurso apenas ao Teorema de
Weierstrass (ainda que fossem extremos não eram extremos absolutos).
Neste caso temos L(x, y, λ) = 3x2 + 2y 3 + λ(4 − x2 − y 2 ) e portanto
 √ 
√  18 0 2 3
HL 3, 1, 6 =  √ 0 12 2 
 
2 3 2 0
e  √ 
 √  18 0 −2 3
HL − 3, 1, 6 =  0√ 12 2 .
 
−2 3 2 0
√   √ 
Obtemos det HL 3, 1, 6 = det HL − 3, 1, 6 = −216 < 0, pelo que, atendendo ao
√   √ 
teorema 6, se conclui que os pontos 3, 1 e − 3, 1 são pontos de mı́nimo local aos
√   √ 
quais corresponde o mı́nimo local f 3, 1 = f − 3, 1 = 11.

Juntando o tipo de análise feita para extremos livres e extremos condicionados, po-
demos em certas condições abordar o problema de determinar extremos absolutos em
regiões definidas por desigualdades.

8
Exemplo 8 (Continuação do exemplo 5). Vimos no exemplo 5 que a função f (x, y) =
3x2 + 2y 3 tinha quatro pontos de extremo absoluto no conjunto C = {(x, y) ∈ 2 : R
x2 + y 2 = 4}: os pontos de máximo (absoluto) (0, 2) e (0, −2) aos quais correspon-
dia o máximo (absoluto) 16 e os pontos de mı́nimo (absoluto) (2, 0), (−2, 0) aos quais
correspondia o mı́nimo (absoluto) 11.
Suponhamos agora que pretendemos determinar os extremos de f em D = {(x, y) ∈
R 2 : x2 + y 2 ≤ 4}. Resolvendo ∇f (x, y) = (0, 0) obtemos a solução (x, y) = (0, 0).

É fácil verificar que (0, 0) não é ponto de extremo. De facto ao longo da recta x = 0
temos que f (0, y) = 2y 3 . Assim se y > 0 temos f (0, y) > 0 = f (0, 0) e se y < 0 temos
f (0, y) < 0 = f (0, 0). Concluı́mos portanto que os extremos de f em D são apenas os
que já obtivemos no conjunto C = fr D.

Você também pode gostar