Escolar Documentos
Profissional Documentos
Cultura Documentos
JSA D 22 00243 Traduzido
JSA D 22 00243 Traduzido
I. INTRODUÇÃO
E. Formulação do Problema
Uma vez que o problema pode ser considerado como a equação de Bellman,
uma abordagem de programação dinâmica pode ser adotada para derivar uma solução
ótima offline de nosso problema de migração de serviço e seleção de ponto de saída
DNN. Para facilitar a exposição, transformamos o problema de ótimo off-line em um
problema de caminho mais longo construindo um grafo acíclico direcionado (DAG).
Conforme mostrado na Fig. 2, construímos um gráfico G = (V, E) para
representar todas as decisões possíveis de migração de serviço e seleção de ponto de
saída DNN dentro de T intervalos de tempo. Cada vértice apresenta o estado (i, q, n)
que o usuário pode alcançar. Uma vez que a informação futura (trajetória do usuário e
frequência de solicitação) é conhecida, o ponto de saída n pode ser determinado
quando i e q são dados em cada estado. Observe que o vértice de origem S representa
o estado inicial (definimos como (0, 1, n)). Cada estado (exceto o estado inicial) é
transitado do estado anterior executando a decisão correspondente. O vértice de
destino E é um vértice auxiliar para garantir que um único caminho mais longo possa
ser encontrado. Cada peso de aresta no DAG entre dois estados representa a soma dos
utilitários de solicitação das decisões de execução, e as arestas que se conectam a E
têm peso zero. Vale a pena notar que, suponha que a decisão do usuário possa ser
concluída antes de T , podemos traçar uma aresta direcionada entre dois estados. No
entanto, se a decisão for concluída em um momento além de T , por exemplo, quando
um usuário no estado B1 em T4 executa a decisão de transferir para o estado B2.
Desenhamos uma aresta direcionada de B1 em T4 para o vértice auxiliar amarelo
correspondente B2. Assim, o peso da borda representa a soma das utilidades que o
usuário pode obter de T4 até o final. O peso da aresta que liga cada vértice de tempo T
aos vértices auxiliares amarelos é zero. Concluímos agora a construção do DAG.
Podemos derivar a estratégia ótima do usuário encontrando o caminho mais
longo de S a E. Especificamente, dadas todas as informações das atividades do usuário
em T intervalos de tempo, o peso de todas as arestas pode ser calculado. E o peso total
de um caminho do vértice de origem S ao vértice de destino E pode, portanto,
apresentar toda a utilidade ao longo do horizonte de tempo. Conseqüentemente, a
migração de serviço ideal e a estratégia de seleção do ponto de saída do modelo DNN
podem ser encontradas tomando o caminho mais longo de S para E. Conforme
mostrado na Fig. 2, damos o caminho mais longo para T = 5 com 3 BSs. Cada vértice
vermelho representa o estado do usuário no intervalo de tempo correspondente, e o
vértice apontado pela borda preta sólida é o estado do usuário após a decisão.
Obviamente, como esse problema de caminho mais longo possui uma propriedade de
subestrutura ótima, ele pode ser resolvido pela abordagem clássica de programação
dinâmica. O Algoritmo 1 mostra o pseudocódigo do nosso algoritmo de otimização que
utiliza programação dinâmica com memoização para descobrir as estratégias ótimas de
cada intervalo de tempo para um determinado horizonte de tempo finito. No
algoritmo, podemos obter o caminho mais longo (ou seja, a migração de serviço ótima
e a estratégia de seleção do ponto de saída do modelo DNN) para cada estado
resolvendo a equação de Bellman (ou seja, linha 6). Então podemos escolher o
caminho que contém o estado com a maior utilidade acumulada em T como o caminho
mais longo (ou seja, a linha 15), que é a solução ótima para o problema. Para pesquisar
o caminho mais longo, o algoritmo precisa enumerar no máximo B2 estados possíveis
em cada intervalo de tempo. Assim, para os intervalos de tempo T, a complexidade de
tempo do Algoritmo 1 é O(B2T).
V. MIGRAÇÃO DE SERVIÇO ONLINE E ALGORITMO DE SELEÇÃO DE PONTO DE SAÍDA
A. Configuração da Simulação
B. Esquemas de referência
Além disso, investigamos o impacto do erro de previsão e até que ponto olhar
para o futuro na eficiência do algoritmo. Usamos dois métodos de previsão para obter
as informações futuras. Um deles é a memória de longo prazo (LSTM) e o outro é o
modelo de média móvel integrado autorregressivo (ARIMA) [40]. A precisão de
previsão desses dois métodos é de 93,3% e 82,5%, respectivamente. Intuitivamente,
quanto mais precisas forem as previsões do modelo MPC, melhor será o desempenho
do algoritmo, e os dados experimentais confirmam essa intuição. Conforme mostrado
na Fig. 8, a eficiência do algoritmo baseado em LSTM é 5,3% maior do que o algoritmo
baseado em ARIMA em média.
VII. CONCLUSÃO