Escolar Documentos
Profissional Documentos
Cultura Documentos
acurácia esperada
Modelo do Sistema – Modelo de
Comunicação
• Acesso Múltiplo por Divisão de Tempo (TDMA) para transmissão dos parâmetros dos usuários
para as BSs
• Não se limita a isso, OFDMA tabém pode ser adotado
• A taxa de transmissão alcançável é , onde B é banda de transmissão, hi(t) é o
ganho de canal do usuário i no slot t, N0 é a potência do ruído e Pi(t) é a potência de transmissão
• O tempo de duração da atualização de mensagem de status Δs(t) para um gêmeo digital é
, onde |Δs(t)| é o tamanho do estado de atualização
• |Δs(t)| é um valor pequeno, logo Tupd é muito menor que o tempo de transmissão
• Nesse esquema só é considerado o tempo de transmissão
• Foi denotado tamanho dos parâmetros do modelo como wi(t) e ∇F(wi(t)) como Si(t), e
slots de tempo alocados para usuário i na iteração t por mi(t) (M slots no total).
• A limitação para o tempo de transmissão para o usuário i é com
• O consumo de energia para uma iteração é
Federated Learning Eficiente para DITEN - Otimização dos
Recursos de Comunicação
• Limitação de recursos gera necessidade de redução no consumo dos mesmos
• Problema combinatório com tradeoff entre acurácia de treinamento e eficiência no consumo de
recursos
• O custo total de tempo é
• O consumo total de energia
• O objetivo é aprender modelo federado ótimo que também minimize a função custo
• O problema pode ser formulado como:
• Beta e k são fatores de controle que decidem o tradeoff entre funções loss e cost, s é
o fator de delay e lambda é vetor de políticas de escalonamento de usuários
• O problema é não convexo. A minimização da função de loss é feita pelo algoritmo gradient
descent, e a acurácia é determinada pelo algoritmo de aprendizado e a qualidade dos dados locais,
então pode ser simplificado como:
• Solução f é decidida pelos usuários finais e lambda pelas BSs, então o objetivo usuários finais é
• Problema de controle do ciclo de CPU
• O objetivo para otimização da comunicação nas BSs é
• Eth é o consumo de energia esperado do total de usuários
Federated Learning Eficiente para DITEN - Agregação e
Atualização Assíncronas
• É feito de forma assíncrona para melhorar a eficiência do processo de comunicação e é utilizado DRL para achar
estratégias ótimas de escalonamento de usuários para aproximar a solução ótima do problema da BS
• Em esquemas síncronos, todos os usuários mandam seus parâmetros para um servidor central e espera o modelo
agregado
• Primeiro problema: usuários passam muito tempo esperando pelos usuários mais lentos e a agregação
• Segundo: a transmissão concorrente de parâmetros pdoe causar congestionamento na comunicação
• A proposta assíncrona é transmitir os modelos e recuperar o modelo global para reduzir tempo de espera e mitigar carga de
comunicação
• Cada usuário tem um índice próprio c que registra o progresso do processo de treinamento
• Em t=0 as BSs transmitem o modelo inicial para todos. Nas iterações seguintes, os usuários computam seu peso local e
transmitem para o servidor de borda
• Precisa ser aprovado oara alcançar a consistência entre os nós da blockchain
• Esse processo consome tempo e outros usuários não têm acesso ao peso imediatamente
• Foi introduzido um delay para mitigar o problema, onde na iteração t o modelo que o servidor transmite é o t-s, onde s é o fator de delay, designado de
acordo com o processo de agregação e verificação
• Os usuários também podem obter os modelos globais novos a partir de usuários próximos, reduzindo carga de comunicação para BS
• O modelo global na iteração t é definido , onde thetai = 1 se Δti ≤ Tp (intervalo de tempo de espera da
BS), ou thetai=0, do contrário
Federated Learning Eficiente para DITEN – Agente DRL para
Otimização da Transmissão
• Cada agente, presentes nas BSs, aloca seus recursos do espectro para os
usuários
• Em cada iteração, as ações de alocação de recurs (Lambda_t, m_t) são decididos
baseado nos estados atuais obtidosdos gêmeos digitais
• A performance da ação é quantificada pela função recompensa no final da iteração
• Estado:
• As métricas do estado refletem os estados atuais dos usuários, que é a base para as
decisões de escalonamento e alocação de recursos
• Ação: Escalonamento de usuários (Escolhe os usuários para transmissão) e
Alocação de espectro (número de slots de transmissão)
• Recompensa: , negativamente orrelacionada com o tempo
para completar a iteração
• Cada agente aprende a alcançar a recompensa cumulativa máxima
Blockchain Leve e FL para DITEN-
Consenso Distribuído para Aprendizado
• BSs múltiplas distribuídas para agregar os modelos locais
• Usa-se blockchain para sincronização desses modelos e alcançar consenso
• Já que há necessidade de confirmação do modelo na blockchain, a eficiênciada mesma
é de vital importância
• Esquema leve de verificação baseado em DPoS
• Verificadores são selecionados baseados em seus stakes
• No esquema proposto, stakes são adquiridos pela contribuição computacional para o modelo
global
• Os modelos agregados e modelos locais correspondentes são armazenados nas
transações da rede
• Diferentemente das verificações convencionais das transações, não são só verificados
os termos regulares, mas tambpem a qualidade dos modelos baseados no histórico de
modelos
Blockchain Leve e FL para DITEN- Consenso Distribuído para
Aprendizado
O processo de consenso consiste em 3 etapas
• Multi agregação: em cada iteração, as BSs participantes primeiro agregam os
modelos locais coletados, paralelamente
• Seleção de verificadores: os usuários blockchain (dispositivos iot) votam por sua
BSs preferida, de acordo com sua capabilidade de comunicação e computação
• Se houver mais BSs do que um limiar k, as k mais votadas são escolhidas, caso contrário
todas são
• Verificação do modelo: Cada BS manda seu modelo agregado para outros
verificadores, que além de realizar as checagens regulares também verificam os
modelos baseado em se o modelo contribui positivamente para atualizar o
modelo globa
• O verificador líder coleta os resultados da verificação e confirma as transações e empacota
as transações em um bloco candidato
• Os verificadores verificam os itens do bloco candidato, como formato e assinatura
Blockchain Leve e FL para DITEN- Integrando Blockchain
Permissionada na DITEN
• É utilizado gêmeo digital no plano de borda
• Para melhorar confiabilidade e segurança, há a integração de Blockchain
• É armazenado o modelo de gêmeo digital na blockchain e registrado o histórico de
mudança
• Armazenar o gêmeo ao invés dos dados originais pode reduzir dramaticamente a computação e
armazenamento da rede blockchain
• Os verificadores também verificam esses modelos como transações. O tempo no qual um
verificador i executa o processo de consenso é , onde |w| é o tamanho das
transações, f são os ciclos de CPU, d é o delay médio na transmissão da transação e N é o
número de verificadores
• A sincronização dos gêmeos com os dispositivos é conseguida usando contratos inteligentes
• QUando dados de atualização de estado são recebidos, os contratos são ativados para corresponder seu
gêmeo digital e performar analise dos dados atualizados
Resultados numéricos
• Performance do FL é testado no dataset MNIST e Fashion-MNIST
• O FL proposto é comparado com o convencional, onde todos os usuários
participam na agregação sincronamente, com espectro igualmente alocado
• Na comparação, há complexidade adicional, causada pelo algoritmo DRL
• Os algoritmos comparados atingem resultados comparáveis com alta
acurácia e baixa loss
• O algoritmo proposto reduz os custos significativamente