Escolar Documentos
Profissional Documentos
Cultura Documentos
Métodos Numéricos
para Otimização Irrestrita
Jaime A. Ramı́rez
Felipe Campelo
Frederico G. Guimarães
Lucas S. Batista
Ricardo H.C. Takahashi
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 1 / 94
Sumário
1 Introdução
2 Estrutura Básica
4 Método do Gradiente
5 Otimização Unidimensional
6 Aproximações Quadráticas
7 Gradientes Conjugados
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 2 / 94
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 3 / 94
Estrutura Básica
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 4 / 94
Estrutura Básica
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 5 / 94
Estrutura Básica
Método do Gradiente:
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 6 / 94
Estrutura Básica
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 7 / 94
Método de Busca em Direções Aleatórias
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 8 / 94
Método de Busca em Direções Aleatórias
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 9 / 94
Método de Busca em Direções Aleatórias
Problema Exemplo
Consideremos o problema:
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 10 / 94
Método de Busca em Direções Aleatórias
Problema Exemplo
4 1 0.5
0.3
40
2 0.1
x2
0
40
20
−2
−4
−6
−6 −4 −2 0 2 4 6
x1
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 11 / 94
Método de Busca em Direções Aleatórias
Problema Exemplo
30
25
20
f(x)
15
10
−5
0 5 10 15 20
iterações
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 12 / 94
Método do Gradiente
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 13 / 94
Método do Gradiente
Algoritmo
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 14 / 94
Método do Gradiente
Considerações práticas
Otimização unidimensional
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 15 / 94
Cálculo Numérico do Gradiente
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 16 / 94
Cálculo Numérico do Gradiente
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 17 / 94
Critérios de Parada
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 18 / 94
Critérios de Parada
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 19 / 94
Critérios de Parada
Outros:
Tempo de execução; kgg (xx k )k ≤ ǫ; número máximo de iterações, etc.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 20 / 94
Convergência
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 21 / 94
Problema de otimização unidimensional
Introdução
Definição
α∗ = arg min θ(α) ∈ R, α ∈ [0, +∞]
α
Exemplo
Determinar x1 que minimiza f (x) = 2x21 + x22 partindo de x0 = [1 1] na
direção d = −∇f (x0 ).
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 22 / 94
Problema de otimização unidimensional
Métodos de eliminação
Busca irrestrita;
Busca exaustiva;
Busca dicotômica;
Método de Fibonacci;
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 23 / 94
Problema de otimização unidimensional
Busca irrestrita
Versão melhorada:
Usar sk+1 = λsk , λ > 1, até “cercar” o intervalo que contém u ∗ ;
Feito isto, reduzir o intervalo até uma precisão desejada.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 24 / 94
Problema de otimização unidimensional
Busca exaustiva
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 25 / 94
Problema de otimização unidimensional
Busca dicotômica
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 26 / 94
Problema de otimização unidimensional
Busca da bisseção
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 27 / 94
Problema de otimização unidimensional
Método de Fibonacci
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 28 / 94
Problema de otimização unidimensional
Método de Fibonacci
ui = bi − F (bi − ai ) , vi = ai + F (bi − ai )
√
onde F = ( 5 − 1)/2 = 0.618.
O comprimento do intervalo após k iterações é:
Lk = (0.618)k (b0 − a0 )
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 31 / 94
Problema de otimização unidimensional
Algoritmo da Seção Áurea
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 32 / 94
Problema de otimização unidimensional
Métodos de interpolação
Método de Newton;
Método da Secante.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 33 / 94
Problema de otimização unidimensional
Método de interpolação quadrática
dq b
= b + 2cα = 0 , ou seja , ᾱ∗ = −
dα 2c
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 34 / 94
Problema de otimização unidimensional
Método de Newton
θ ′ (αk )
αk+1 = αk −
θ ′′ (αk )
|θ ′ (αk+1 )| ≤ ǫ
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 35 / 94
Problema de otimização unidimensional
Método de Newton
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 36 / 94
Problema de otimização unidimensional
Método da Secante
Métodos de interpolação:
Métodos de eliminação:
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 38 / 94
Problema de otimização unidimensional
Exemplo
Resp.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 39 / 94
Aproximações Quadráticas
Introdução
1
f (xx ) = f (xx 0 ) + ∇f (xx 0 )T (xx − x 0 ) + (xx − x 0 )T H(xx 0 )(xx − x 0 ) + O(3) (7)
2
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 40 / 94
Aproximações Quadráticas
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 41 / 94
Aproximações Quadráticas
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 42 / 94
Aproximações Quadráticas
Método de Newton
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 43 / 94
Aproximações Quadráticas
Método de Newton Modificado
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 44 / 94
Aproximações Quadráticas
Convergência do Método de Newton Modificado
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 45 / 94
Aproximações Quadráticas
Determinação Numérica da Hessiana
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 46 / 94
Aproximações Quadráticas
Construção da Hessiana
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 47 / 94
Aproximações Quadráticas
Construção da Hessiana
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 48 / 94
Aproximações Quadráticas
Construção da Hessiana
v i = x i − x i +1
(14)
r i = ∇f (xx i ) − ∇f (xx i +1 )
tem-se que:
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 49 / 94
Aproximações Quadráticas
Construção da Hessiana
HV = R (16)
Note que é possı́vel escolher vetores v i de tal forma que V seja
inversı́vel, o que permite fazer:
H = RV −1 (17)
Isso significa que, avaliando o gradiente da função f (xx ) em n + 1
pontos adequadamente escolhidos no espaço, é possı́vel
determinar a Hessiana dessa função.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 50 / 94
Aproximações Quadráticas
Construção da Hessiana
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 51 / 94
Aproximações Quadráticas
Correção de Posto 1
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 52 / 94
Aproximações Quadráticas
Correção de Posto 1
Hek+1 = Hek + αk z k z T
k (18)
sendo z k ∈ Rn e αk ∈ R.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 53 / 94
Aproximações Quadráticas
Correção de Posto 1
O termo αk z k z T
k é uma matrix n × n com posto no máximo igual a 1.
Hek+1r i = v i ∀ i = 1, . . . , k (19)
Essa relação é quase a mesma que (16), mas exige a igualdade apenas
para os pontos já avaliados, até o ı́ndice k.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 54 / 94
Aproximações Quadráticas
Correção de Posto 1
αk z k z T e
k r k = v k − Hk r k
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 55 / 94
Aproximações Quadráticas
Correção de Posto 1
rT T T v −H ek r k )
k (αk z k z k r k ) = r k (v k
(21)
αk (zz T 2 T T e
k r k ) = r k v k − r k Hk r k
1
Hek+1 = Hek + (vv k − Hek r k )(vv k − Hek r k )T (23)
rT −rT e
k vk k Hk r k
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 56 / 94
Aproximações Quadráticas
Correção de Posto 1
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 58 / 94
Aproximações Quadráticas
Correção de Posto 1
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 59 / 94
Aproximações Quadráticas
Convergência do Algoritmo de Correção de Posto 1
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 60 / 94
Aproximações Quadráticas
Métodos Quase-Newton
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 61 / 94
Aproximações Quadráticas
Métodos Quase-Newton
v kv T Hek r k r T e
k Hk
CkDFP = k
− (25)
vTk rk rT e
k Hk r k
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 62 / 94
Aproximações Quadráticas
Métodos Quase-Newton
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 63 / 94
Aproximações Quadráticas
Métodos Quase-Newton
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 64 / 94
Aproximações Quadráticas
Métodos Quase-Newton
3
4 10
0.5 40
0.1
5 1 0.3
2
20
40
x2
−2
−4
−6
−6 −4 −2 0 2 4 6
x1
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 66 / 94
Método dos Gradientes Conjugados
Introdução
Histórico
Apresentado pela primeira vez em 1908 por Schmidt, reinventado de
forma independente em 1948 e aprimorado nos anos 1950;
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 67 / 94
Método dos Gradientes Conjugados
Introdução
Ax = b
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 68 / 94
Método dos Gradientes Conjugados
Introdução
∇f (x) = Ax − b = 0
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 69 / 94
Método dos Gradientes Conjugados
Introdução
Assim:
dado xk ⇒ rk = b − Axk
xk+1 = xk + αk rk
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 70 / 94
Método dos Gradientes Conjugados
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 71 / 94
Método dos Gradientes Conjugados
Algoritmo para Otimização Linear
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 72 / 94
Método dos Gradientes Conjugados
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 73 / 94
Método dos Gradientes Conjugados
Algoritmo para Otimização Não Linear
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 74 / 94
Método dos Gradientes Conjugados
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 75 / 94
Método dos Gradientes Conjugados
Introdução
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 76 / 94
Métodos sem Derivadas
Método Hooke-Jeeves;
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 77 / 94
Métodos sem Derivadas
Motivação
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 78 / 94
Métodos sem Derivadas
Método Hooke-Jeeves
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 79 / 94
Métodos sem Derivadas
Método Hooke-Jeeves
y0 = xk+1 + α (xk+1 − xk )
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 80 / 94
Métodos sem Derivadas
Método Hooke-Jeeves
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 81 / 94
Métodos sem Derivadas
Método Hooke-Jeeves
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 82 / 94
Métodos sem Derivadas
Método Nelder-Mead Simplex
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 83 / 94
Métodos sem Derivadas
Método Nelder-Mead Simplex
Fecho convexo
O fecho convexo (ou invólucro convexo) de um conjunto A, denotado por
Ā, é definido como a interseção de todos os conjuntos convexos que
contêm A.
Politopo
O fecho convexo de um conjunto finito de pontos x1 , x2 , . . . , xk ∈ Rn é
chamado politopo.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 84 / 94
Métodos sem Derivadas
Método Nelder-Mead Simplex
Simplex
Se x2 − x1 , x3 − x1 , . . . , xk − x1 são vetores linearmente independentes,
então o fecho convexo desse conjunto de pontos é chamado simplex.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 85 / 94
Métodos sem Derivadas
Método Nelder-Mead Simplex
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 86 / 94
Métodos sem Derivadas
Método Nelder-Mead Simplex
xr = x̂ + α (x̂ − xw ) , α = 1
xe = x̂ + γ (x̂ − xw ) , γ = 2
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 88 / 94
Métodos sem Derivadas
Método Nelder-Mead Simplex
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 89 / 94
Métodos sem Derivadas
Método de Amostragens Aleatórias
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 90 / 94
Métodos sem Derivadas
Método de Amostragens Aleatórias
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 91 / 94
Métodos sem Derivadas
Método de Direções Aleatórias
Vantagens
Podem ser aplicados mesmo se a função objetivo é descontı́nua e
não-diferenciável em vários pontos.
c
J. A. Ramı́rez et al. (UFMG) ELE077: Otimização Irrestrita 94 / 94