Escolar Documentos
Profissional Documentos
Cultura Documentos
- Introdução
- Princípio da optimabilidade
Programação dinâmica 2
4. Programação dinâmica
4.1. Introdução
1 1
2 2
3 3
i-1 i
ri = ri (p,q) (4.1)
O problema consiste em tomar uma sequência de decisões em cada etapa, tal que
o valor final do resultado atinja o seu valor máximo.
N
R n = ∑ ri ( q i −1 , q i ) (4.2)
i =1
Resolução directa
Consiste em calcular o efeito de n passagens possíveis da etapa i-1 para a etapa
i e escolher a estratégia óptima. Para o processo em estudo haveria n N variantes
de passagens do ponto inicial até ao final.
Programação dinâmica 3
1 1 1 1 1
2 2 2 2 2
3 3 3 3 3
Figura 4.2. Sistema com 4 etapas e com 3 estados possíveis em cada etapa
Matriz 1 (N = 1)
estados 1 2 3
1 4 3 3
2 3 5 4
3 4 6 3
Programação dinâmica 4
Matriz 2 (N = 2)
estados 1 2 3
1 5 4 3
2 4 3 6
3 4 5 5
Matriz 3 (N = 3)
estados 1 2 3
1 5 6 3
2 3 6 3
3 3 5 2
Matriz 4 (N = 4)
estados 1 2 3
1 4 6 7
2 5 2 3
3 5 7 9
Para optimizar é necessário calcular o valor da função objectiva para cada valor
da variável de entrada, determinada pelo comando da última etapa e determina-se
o valor máximo dessa função objectiva.
A programação dinâmica recomenda a resolução da última etapa tendo como
dados os valores do sistema na etapa imediatamente anterior.
Para N = 4.
1 1
2 2
3 3
N=4
Para N = 3
1 1 1
2 2 2
7
3 3 9 3
N=3 N=4
qN-1(1) = 1 R = 5 + 7 = 12
qN-1(1) = 3 R = 9 + 3 = 12
qN-1(2) = 3 R = 9 + 3 = 12
qN-1(3) = 3 R = 9 + 2 = 11
De notar que o caminho na etapa N-2 → N-1 é obtida pela soma do valor actual da
função objectiva da passagem N-1 → N e o novo valor da passagem da etapa N-2
→ N-1 em cada estado possível e no fim escolhe-se o óptimo.
Para N = 2
Programação dinâmica 6
1 1 12 1 1
12
2 2 2 7 2
12
3 3 11 3 9 3
qN-2(1) = 1 R = 12 + 5 = 17
qN-2(2) = 3 R = 6 + 11 = 17
qN-2(3) = 2 R = 5 + 12 = 17
1 1 17 1 12 1 1
5
12
2 2 2 2 7 2
17 17
12
3 3 3 11 3 9 3
1 21
1 17 1 12 1 1
5
12
2 22 2 2 2 7 2
17 17
12
23
3 3 3 11 3 9 3
Estado 1: 1→1→1→3 R = 21
1→1→3→3 R = 21
Se é fixa no estado (2),
Estado 2: 2→3→3→3 R = 22
Se é fixa no estado (3),
Estado 3: 2→3→3→3 R = 23
Etapa:
É um elemento do processo em estudo, que se obtém por decomposição do
processo num certo intervalo de tempo, ao longo da evolução do processo, ou
numa área ao longo do espaço do processo. No primeiro caso corresponde a um
certo intervalo de desenvolvimento do processo no segundo caso corresponde a
Programação dinâmica 8
um aparelho ou um seu elemento.
O estado de cada etapa caracteriza-se pelas suas variáveis de saída ou de
estado. Sendo um processo com várias etapas em série, as variáveis de saída da
etapa anterior são as variáveis de entrada da etapa seguinte.
Definições Básicas
Si - Possível estado de partida do sistema numa etapa.
xj - Possível estado de chegada do sistema numa etapa - decisão a tomar Xj(s)
Fj(s,x) Valor da função objectiva na passagem do estado s até ao estado de
chegada x.
Cs,x - Valor da função objectiva na passagem de estado inicial "s" ao estado final
"x" considerando apenas dois estados adjacentes.
Etapa n=4
x4 f4 = Cs,x Decisão ptimo
s4 1 2 3 x4*(s) f4*(s,x)
1 4 6 3 3 7
2 5 2 3 1 5
3 5 7 9 3 9
Nesta etapa, o valor da funcao objectiva e dado apenas pelo valor da passagem
entre os estados de partida e de chegada.
Etapa n=3
x3 f3 = Cs,x+ f4*(s,x) Decisão Optimo
s3 1 2 3 x3*(s) f3*(s,x)
1 5+7 6+5 3+9 1;3 12
2 3+7 6+5 3+9 3 12
3 3+7 5+5 2+9 3 11
Etapa n=2
x2 f2 = Cs,x+ f3*(s,x) Decisão Optimo
Programação dinâmica 9
s2 1 2 3 x2*(s) f2*(s,x)
1 5+12 4+12 3+11 1 17
2 4+12 3+12 6+11 3 17
3 4+12 5+12 5+11 2 17
Etapa n=1
x1 f1 = Cs,x+ f2*(s,x) Decisão Optimo
s1 1 2 3 x1*(s) f1*(s,x)
1 4+17 3+117 3+17 1 21
2 3+117 5+17 4+17 2 22
3 4+17 6+17 3+17 2 23
Assim temos:
Estratégia óptima global consegue-se partindo do estado inicial (3):
(3,2,3,3,3) → R = 23
│ │ │
│LS1 │LS2 │LS3
│ │ │
│ ↓ │
água salgada┌──────┐ ┌──────┐ ┌──────┐
│ │ y1 │ │ y2 │ │ y3=0.0001
───────────→│ ├────────→│ ├───────→│ ├─────────→
y0=0.03 │ │ │ │ │ │G=1000kg/h
G=1000kg/h └──┬───┘ └──┬───┘ └──┬───┘
│ │ │
│x1 │ x2 │ x3
│Ls1 │ Ls2 │ Ls3
│ │ │
X3 = Ls3
y2 − y3
Ls 3 = G ⋅
X3
de acordo com a relação de equilíbrio x3 = 10.y3
e substituindo na relação anterior tomando em conta que y3 = 0.0001 resulta:
y2
L s 3 = G − 0.1 = 10 6 y 2 − 100
10 ∗ 0.0001
L*s 3 = Z 3 * = 10 6 ⋅ y 2 − 100
Z2 = Ls2 + Ls3*
L*s 2 = 10 4 y1 − 100
y 2 = 0.01 y1
= L s1 + 10 4 y1 + 10 6 y 2 − 200
= L s1 + 2.10 4 y1 − 200
Resultando que:
Gy 0 y0
y1 = =
G + 10 L s1 1 + 0.01Ls1
Programação dinâmica 12
y0
2
dF1 10 4 − 0.01y 0
= 1+ ⋅ =0
dL s1 y0 1 + 0.01L s1
1 + 0 L s1
Solução final:
1ª etapa: y1 = 0.0045
L*s1 = 569.4 kg de solvente puro
2ª Etapa 2: y2 = 0.00067
Ls2* = 569.4 kg de solvente puro
3ª Etapa: y3 = 0.0001
Ls3* = 569.4 kg de solvente puro
Conclusão:
Fazendo uma análise dos dois exemplos apresentados anteriormente pode-se
chegar-se às seguintes conclusões:
A estratégia óptima tem a propriedade de que qualquer que seja o estado inicial
Programação dinâmica 13
(0)
X 1 do processo com várias etapas em série, bem como o comando para a
primeira etapa X (1) 2, o conjunto de comandos das etapas posteriores X (1) 3
(i=1,2,3,...) corresponde à estratégia óptima UN-1 relativamente ao estado da 1ª
etapa.