Você está na página 1de 10

1

Machine Learning: Aplicações em Smart Grid,


Aspectos Metodológicos, Estudos de Caso e
Discussão
Felipe C. Lucchese, Guilherme B. da Costa, Humberto Wickert, Marcelo A. Benetti, Rodinei Carraro

Abstract—O setor elétrico vem passando por um processo (IoT) consiste em um sistema ciber-físico, o que o torna
contínuo de transformação, que tem ocasionado profundas vulnerável a ataques cibernéticos. Portanto, sistemas de
mudanças em todo os seus segmentos. Essa transformação tem um proteção adequados são necessários para garantir a operação
carácter energético, cujo vetor são as fontes renováveis de geração
de energia elétrica, e também um carácter tecnológico, decorrente
segura da rede inteligente, a proteção dos dados, e impedir
de avanços em áreas como medição e comunicação. Como qualquer possibilidade de ataque à integridade do sistema
consequência, novas preocupações emergiram, sendo a segurança elétrico de potência [2], [3].
cibernética dos dados uma das principais. Adicionalmente, os Técnicas de ML, ou aprendizado de máquina, constituem-se
procedimentos de planejamento e operação dos sistemas elétricos em uma solução atraente para o processamento de grandes
de potência precisaram ser revistos, e muitas tarefas antes volumes de dados e para a implementação de soluções de
rotineiras têm se tornado complexas e desafiadoras. Neste cenário,
ferramentas baseadas em técnicas de Machine Learning (ML) vêm
segurança eficazes. Um desafio natural que surge com o big
ganhando destaque, em função de seu ecletismo e da sua data é a elaboração de um procedimento eficiente para analisá-
potencialidade. Portanto, o artigo detalha estas técnicas no los, extraindo-se informações valiosas. Pois sem a extração de
contexto de sistemas Smart Grid (SG), sendo empreendida uma informações úteis, os dados armazenados possuem pouco, ou
revisão bibliográfica acerca do tema, e abordados os seus aspectos nenhum valor. O termo ML se refere à aprendizagem e à
metodológicos e conceituais. Estudos de caso contendo aplicações realização de previsões (ou predições), a partir dos dados
de ML em sistemas SG são apresentados. Por fim, os aspectos mais
relevantes sobre o tema são discutidos e as principais conclusões
disponíveis de um sistema. Uma ML é composta por vários
apontadas. algoritmos que analisam os dados, através de um conjunto de
instruções, para produzir previsões e/ou decisões, orientadas
Index Terms—Machine Learning, Smart Grid, big data, Internet pelos dados [1].
of Things. As MLs podem ser empregadas em vários aplicativos para a
segurança de redes inteligentes. Pode-se verificar também que
I. INTRODUÇÃO o setor de energia renovável necessitará cada vez mais destas
técnicas, em função do aumento das incertezas nos modernos
O alto volume de dados de medições oriundas dos
modernos sistemas elétricos de potência, sintetizados com
o termo SG, torna bastante complexa a análise de tais dados.
sistemas elétricos de potência, ocasionado por este tipo de
energia. Com relação à segurança cibernética, as técnicas
Um gerenciamento dinâmico da energia é necessário para podem ser divididas em duas categorias principais: proteção e
processar a enorme quantidade de dados, a fim de que sejam detecção. As estratégias de proteção podem ser de hardware e
disponibilizadas aplicações, tais como: otimização do administrativas, juntamente com as proteções de software mais
planejamento eletro-energético, monitoramento do sistema, comuns. Já as estratégias de detecção podem ser realizadas
operação em tempo real, e planejamento da expansão. Dados de aplicando-se técnicas de ML, que podem prever ameaças e
tal magnitude, que não podem ser manipulados através de identificar anomalias de acordo com as características padrões
processos tradicionais, são denominados big data, termo que [4].
vem ganhando grande destaque na literatura [1]. As abordagens tradicionais de simulação no domínio do
Uma parte dos dados produzidos em um SG contém tempo, baseadas em modelos de sistemas de potência são, de
informações confidenciais de usuários individuais, que forma geral, computacionalmente intensivas e podem não
precisam estar protegidas por regulamentações legais. Além atender aos requisitos de aplicações em tempo real. Portanto, os
disso, os dados contêm informações sigilosas de organizações pesquisadores têm recorrido a técnicas de ML para a tomada de
privadas, de órgãos governamentais, e de sistemas interligados decisões em tempo real, ou quase real. A abordagem de ML
que envolvem um significativo número de agentes. Portanto, a apresenta uma capacidade de generalização, onde o modelo
manipulação de tais dados pode afetar a segurança operacional baseado em dados, se treinado adequadamente, pode fazer
de um sistema elétrico. Um SG integrado à Internet of Things previsões precisas, a partir de medidas para as quais não foi
2

exposto anteriormente [5]. baseadas em informação (Machine Learning, por exemplo)


Em termos operacionais, um aspecto crítico é a para a proposição de soluções tem tempo real. Neste contexto,
observabilidade do estado atual do sistema de potência. Ou seja, o trabalho aborda tais questões detalhando a aplicação de
o conhecimento dos valores complexos de tensão de todas as técnicas de ML em sistemas de SG. O trabalho está dividido da
barras do sistema, no menor tempo possível. Considerando-se seguinte forma. Na Seção II, tem-se uma revisão bibliográfica
as grandes dimensões dos sistemas interconectados de acerca do tema ML. A Seção III detalha os aspectos conceituais
transmissão, as medições do sistema SCADA (Supevisory e metodológicos do tema. Na Seção IV, casos de aplicação são
Control and Data Acquisition) têm ocorrido a partir de locais abordados, ilustrando-se o emprego de técnicas de ML para a
geograficamente cada vez mais distantes. Isto tem tornado solução de problemas em sistemas SG. Por fim, a Seção V traz
complexo o processo de tomada de decisões rápidas, devido à a discussão de questões relevantes sobre o tema e as conclusões
grande quantidade de medições a serem processadas em cada principais do trabalho.
período de varredura. Neste contexto, a tecnologia de medição
fasorial sincronizada, baseada em dados de PMU (Phasor II. REVISÃO BIBLIOGRÁFICA
Measurement Unit), oferece informações precisas, Este capítulo aborda aspectos históricos em conjunto com as
sincronizadas com a mesma etiqueta de tempo projeções do conceito de ML atualmente em diferentes áreas de
(independentemente do local geográfico), e com alta taxa de pesquisa. O conceito de aprendizado de máquinas representa
amostragem (taxas entre 30 e 240 amostras por segundo). Tais uma ferramenta recente que conquistou a imaginação diversos
características têm motivado a aplicação de abordagens grupos distintos de usuários, combinando estatística,
baseadas em técnicas de ML para o monitoramento das otimização e ciência da computação na resolução dos mais
condições operacionais dos sistemas [6]. variados problemas. O aprendizado de máquina é uma
Quanto ao seu desempenho, a eficácia de uma ferramenta de aplicação da Inteligência Artificial (IA) na qual as máquinas
ML depende da capacidade de reprodução do comportamento recebem acesso aos dados e, com base nesses dados,
do sistema conhecido, representado pelo conjunto de dados de “aprendem” sem serem explicitamente programadas.
treinamento. Portanto, as abordagens existentes de ML O aprendizado de máquina nasceu como um ramo dentro do
geralmente empregam um método de força-bruta para gerar a campo principal da IA, que também inclui outros, como
base de conhecimento, a partir de simulações baseadas em Representação do Conhecimento, Percepção e Criatividade. O
modelos do sistema físico. Devido à complexidade termo “aprendizado de máquina” foi criado por Arthur Samuel,
computacional decorrente da grande quantidade de simulações em 1952, criando o primeiro algoritmo com poder de jogar e
necessárias, uma única base de conhecimento (inalterada) é aprender o jogo de damas. O processo de “aprendizado”
geralmente utilizada muitas aplicações. As ferramentas de ML correspondia à atualização incremental de um banco de dados
treinadas dessa maneira são passivas e apresentam três com movimentos (posições do tabuleiro) e sua pontuação, de
desvantagens principais, quando incorporadas a aplicativos de acordo com a probabilidade de sucesso posterior em ganhar ou
tempo real [7], [8]: perder o jogo. Quanto mais o algoritmo trabalhou, mais sua
capacidade de ganhar o jogo aumentou. Sendo está
• O conjunto de treinamento inicial é formulado em uma provavelmente a versão mais antiga da aprendizagem por
determinada condição operacional do sistema físico. reforço [9].
Quando as atualizações subsequentes não são Durante as décadas de 1960 e 1970, muitos pesquisadores
consideradas, a ferramenta de ML pode falhar, à medida ficaram encantados com o conceito de uma máquina puramente
que as condições operacionais do sistema evoluem. lógica, mas as limitações de memória e processamento do
• Quando os modelos de ML são atualizados, sem a computador eram extremamente maiores que os dias de hoje. A
redução da quantidade de simulações necessárias, o crença de que a inteligência humana poderia ser representada
treinamento baseado no mesmo método de simulação de através da lógica era generalizada, naturalmente levando a uma
força-bruta atrasa a retomada do aplicativo de tempo ênfase em sistemas baseados em regras, representando
real. conhecimento por meio de lógica (booleanas) e processamento
• A base de conhecimento é criada exclusivamente com de linguagem natural, sendo um ponto de vista
base no modelo do sistema de potência. Portanto, “computacionalista” [10].
quando a fidelidade do modelo é questionável, a Paralelamente, outros pesquisadores acreditavam que o foco
precisão das previsões, oriundas das ferramentas de ML, deveria ser dado a neurobiologia do nosso cérebro, afim de
é afetada negativamente. replicá-la (um ponto de vista conexionista), ficando esse
movimento conhecido como Redes Neurais Artificiais (RNA).
Neste cenário, pode-se constatar que ML é um tema ainda em O primeiro exemplo mais conhecido foi representado pelo
investigação e aperfeiçoamento, que tem ganho crescente Perceptron, o qual aplica uma regra de limiar para uma função
relevância em função dos desafios operacionais decorrentes das linear, afim de discriminar uma saída binária. Entretanto a
fontes renováveis de energia, e da disponibilização de lógica RNA é limitada a problemas linearmente separáveis,
qualificadas infraestruturas de medição e comunicação (Smart enquanto que problemas reais são frequentemente
Grid). Isto, por um lado, produz uma elevada massa de dados inerentemente não-lineares em sua natureza. Essa característica
(big data). Por outro, possibilita o desenvolvimento de técnicas levou a uma década com virtualmente nenhuma pesquisa em
3

redes neurais, também conhecida como o "primeiro inverno subsequente [13].


IA". Durante o período de 1982 e 1985 outra aproximação foi
O terceiro tópico de pesquisa relevante das décadas de 1960 criada afim de resolver as teorias probabilísticas, fugindo da
e 1970 refere-se ao conceito de vizinho mais próximo (nearest mecanização do conhecimento humano por códigos e regras.
neighbor). Marcando efetivamente a criação do campo Esse conceito foi criado por Judea Pearl, sendo batizado de
“reconhecimento de padrões” e o nascimento do conhecido Bayesian Network (BN) onde o domínio do conhecimento
algoritmo K-vizinho mais próximo (K-NN). Seu princípio é continua sendo importante para as estruturas de relações das
simples: se tivermos um problema para resolver se procura por variáveis, mas com menos complexidade e rigidez. O intuito
situações mais semelhantes em banco de dados. Em outras do método é decompor o conhecimento em relações
palavras, dado um vetor de entrada (X), esse é classificado em individuais, inspiradas no conceito de casualidade e evidencia.
uma classe, para a variável alvo (Y) se tornar categórica. A peça Essas redes obtiveram sucesso particularmente na classificação
fundamental desse paradigma consiste em definir a de problemas e na geração automática de estruturas próprias
similaridade, que se resume à comparação de vetores. O desafio utilizando diferentes dados [14]
deste método é decidir o melhor número de exemplos Entretanto outra tendência ficou entre os anos 1980 e 1990,
semelhantes dos dados para usar no algoritmo, que devem ser com a criação do paradigma Kernel, mais especificamente com
determinados antes de seu treinamento [11]. o método Support Vector Machines (SVM). O algoritmo
Os anos 80 foi marcado pelo renascimento das RNAs com operado em sistema lineares e não lineares, separando as classes
poder computacional suficiente para permitir redes usando um hiperplano utilizando a função Kernel. Essa função
multicamadas e funções não-lineares. Utilizando uma função mapeia e transforma as variáveis de entrada em vetores com
sigmoide logística, afim de se obter um modelo de regressão variadas dimensões no espaço, onde após a classificação dos
logística, a base para o Multilayer Perceptron Algorith (MLP). dados de entrada, ocorre o treinamento do método, afim de se
O MLP está sempre totalmente conectado, ou seja, todos os moldar as estruturas capazes de classificar novos dados que
elementos em uma camada são conectados com todos os possam surgir. Cada variável nova é classificada de acordo com
elementos da camada subsequente. A com dois vetores de pesos os dados originais e projetada nos vetores de espaço, e sua
(W1 e W2) [12]. A ideia original do Perceptron pode ser distância maximizada na superfície de decisão entre as classes
observada na Figura 1 (A), enquanto sua evolução para [15].
multicamadas na Figura 1 (B). O aprendizado de máquinas apresentou altos e baixos ao
longo das décadas desde que foi concebida pela primeira vez,
mas finalmente seu progresso real pode transformar nosso
mundo. As principais razões para isso são O poder
computacional maciço está agora disponível a baixo custo e
pode ser provisionado na nuvem muito rapidamente. A
explosão na quantidade de dados (big data), juntamente com
uma capacidade de armazenamento quase ilimitada, onde esses
conjuntos de dados diversos fornecem material de treinamento
melhor para os algoritmos. E o aumento dos investimentos,
expandindo rapidamente a tecnologia utilizadas em diferentes
sistemas, superando humanos em tarefas como, por exemplo,
jogar xadrez, transcrever áudios, analisar imagens e
diagnosticar doenças.

A. Aplicação em Sistemas Elétricos de Potência


Nos últimos anos, várias aplicações utilizando ML foram
desenvolvidas, como modelos para classificar novas estruturas
astronômicas, detecção de transações bancárias fraudulentas,
sistemas de filtragem de informação que aprendem as
Fig. 1. Definição do Perpecptron (A) e sua evolução multicamadas (B). preferências de leitura do usuário, estudos neurobiológicos,
veículos autônomos. Ao mesmo tempo, houve um progresso
importante na base do aprendizado de máquina visando
A evolução do método MPL se deu a partir de 2010, com o sistemas elétricos e seu diverso campo de aplicações prontas
conceito Deep Neural Nets (DNN). Esse paradigma surgiu
para revolucionar a maneira como o setor de energia produz,
devido as novas arquiteturas sofisticadas, recursos
transmite e consome energia.
computacionais e quantidade de dados disponíveis. Por meio do aprendizado de máquina, as empresas de energia
Diferentemente de um MLP, que sempre tem uma camada, um
podem transformar seus dados, a fim de melhorar a tomada de
DNN pode ter múltiplas camadas, às vezes dezenas ou centenas. decisões tanto para a operação quanto para expansão do sistema
Apresentando frequentemente diferentes conjuntos de
elétrico. O grande volume de informações coletadas por
neurônios conectados a diferentes partes da camada
4

sensores inteligentes pode ser utilizado na análise e ação em preferências como o tipo de geração de energia, quanto
tempo real. Entretanto essas enormes quantidades de dados estão dispostos a pagar e seus padrões de consumo.
exibidas pela operação de sistemas SG são impossíveis de
serem processadas pelos operadores humanos em tempo hábil. A aplicação de ML ao setor elétrico abre uma ampla gama
Os avanços nos algoritmos de aprendizagem profunda se de possibilidades interessantes, impactando profundamente
apresentam como a solução para avaliação dos dados, toda a indústria. Evidências iniciais sugerem o aprendizado
possibilitando que a análise em tempo real dos valores lidos, de máquinas pode oferecer grandes benefícios para os
identificando padrões e anomalias nos conjuntos de dados e usuários. Entretanto a adesão atual do setor de permanece
permitindo que as concessionárias tomem decisões no local baixa, com poucas empresas implementando esses sistemas
sobre a melhor forma de alocar os recursos de energia. Esses em escala. Os EUA é um dos principais exemplos de
algoritmos de aprendizagem profunda tem o poder de investimentos para atualizar e modernizar a rede, onde o
revolucionar o lado da demanda e da oferta para a economia de departamento de energia investiu US$ 4,5 bilhões em
energia. Alcançando melhorias reais e mensuráveis em infraestrutura de rede inteligente. Isso inclui a instalação de
comparação aos métodos tradicionais. Muitos setores podem se mais de 15 milhões de medidores inteligentes para monitorar
beneficiar do aprendizado de máquina [16-19], como pode ser o uso de energia.
observado:
III. ASPECTOS METODOLÓGICOS
• Previsão de carga - As previsões de curto prazo são O termo ML (Machine Learning), ou Aprendizado de
vitais para as concessionárias, sendo que o aprendizado Máquina, consiste em um método de análise de dados que
de máquina pode ser usado para prever a oferta e a automatiza o desenvolvimento de modelos analíticos, por
demanda em tempo real e otimizar o despacho meio de algoritmos que aprendem interativamente a partir de
econômico de carga. dados, permitindo assim que os computadores encontrem
• Otimização de rendimento - Os provedores de energia insights ocultos sem serem explicitamente programados para
podem otimizar a eficiência de geração com ajustes em procurar algo específico [1], [3], [10], [11], [17].
tempo real em seus ativos e gerenciamento aprimorado As duas técnicas mais adotadas de ML são a aprendizagem
de recursos distribuídos, automaticamente libera energia supervisionada e a aprendizagem não supervisionada, porém
através da rede para fornecer energia mais confiável e existem outros tipos. Na sequência, estas e outras técnicas
maior escolha do cliente. são descritas.
• A manutenção preditiva - reforçada com drones para Aprendizagem supervisionada: Os algoritmos são
inspeções de ativos, substituindo inspeções manuais treinados por meio de exemplos rotulados, como uma entrada
demoradas e arriscadas, identificando automaticamente na qual a saída desejada é conhecida. Por exemplo, um
defeitos e falhas sem interromper as operações equipamento poderia ter pontos de dados rotulados como “F”
• Gerenciamento de demanda - automatizado e tornado (falha) ou “E” (executa). O algoritmo de aprendizado recebe
mais inteligente com o aprendizado de máquina um conjunto de entradas junto com as saídas corretas
• Roubo de energia - pode ser usado para detectar padrões correspondentes, e aprende ao comparar a saída real com as
de uso, histórico de pagamento e outros dados do cliente saídas corretas para encontrar erros. Ele, então, modifica o
que podem sinalizar um comportamento irregular modelo de acordo. Através de métodos como classificação,
• Gerenciamento de interrupção - utilizando modelos de regressão e gradient boosting, o aprendizado supervisionado
validação de análise para prever e identificar utiliza padrões para prever os valores de rótulos em dados
interrupções, permitindo gerenciamento de recursos, não-rotulados adicionais. O aprendizado supervisionado é
reduzindo o tempo de inatividade e melhorando a comumente empregado em aplicações nas quais dados
confiabilidade. históricos preveem eventos futuros prováveis. Por exemplo,
• Percepções dos clientes - permite que as concessionárias ele pode antecipar quando transações via cartão de crédito
criem preços de eletricidade que maximizem suas são passíveis de fraude ou qual segurado tende a reivindicar
margens criando ofertas e serviços individuais, sua apólice.
minimizando a rotatividade de clientes Aprendizagem não supervisionada: basicamente é usado
• Negociação de energia - viabiliza o comércio peer-to- contra dados que não possuem rótulos históricos. Ou seja, o
peer entre produtores e consumidores, combinando mais sistema não sabe a “resposta certa” nesse caso. O algoritmo
rapidamente os produtores com os consumidores deve descobrir o que está sendo mostrado e o objetivo é
• Agentes virtuais - capazes de responder às consultas dos explorar os dados e assim encontrar alguma estrutura neles.
consumidores e fornecer assistência instantânea. O aprendizado não supervisionado funciona bem em dados
podendo segmentar automaticamente os consumidores transacionais. Por exemplo, ele pode identificar segmentos
com base no histórico de serviços e fornecer um aviso de clientes com atributos similares que podem, então, ser
antecipado de dívidas incobráveis tratados de modo igualmente similar em campanhas de
• Seleção de fornecedores - pode ajudar os clientes a marketing; ou ele pode encontrar os principais atributos que
escolherem seu revendedor de energia, utilizando suas separam segmentos distintos de clientes. Técnicas populares
incluem mapas auto-organizáveis, mapeamento por
5

proximidade, agrupamento k-means e decomposição em A. Aprendizagem Supervisionada


valores singulares. Esses algoritmos também são utilizados A aprendizagem supervisionada usa técnicas de classificação
para segmentar tópicos de texto, recomendar itens e e regressão para desenvolver modelos preditivos [11]. As
identificar pontos discrepantes nos dados. técnicas de classificação predizem respostas discretas - por
Aprendizagem semi-supervisionada: geralmente é usado exemplo, se um email é genuíno ou spam, ou se um tumor é
para as mesmas aplicações que o aprendizado canceroso ou benigno. Modelos de classificação classificam os
supervisionado, porém ele pode usar tanto dados rotulados dados de entrada em categorias. Aplicações típicas incluem
quanto não marcados para o treinamento – normalmente uma imagens médicas, reconhecimento de fala e pontuação de
pequena quantidade de dados rotulados com uma grande crédito. A técnica de classificação deve ser utilizada se seus
quantidade de dados não rotulados (pois os dados não dados puderem ser marcados, categorizados ou separados em
rotulados são mais baratos e necessitam de menos esforço grupos ou classes específicos. Por exemplo, aplicativos para
para serem adquiridos). Esse tipo de aprendizagem pode ser reconhecimento de escrita manual usam classificação para
usado com métodos como a classificação, regressão e reconhecer letras e números. No processamento de imagens e
previsão. O aprendizado semi-supervisionado é muito útil visão computacional, técnicas de reconhecimento de padrões
quando o custo associado à rotulagem é muito alto para não supervisionadas são usadas para detecção de objetos e
permitir um processo de treinamento totalmente rotulado. Os segmentação de imagens.
primeiros exemplos disso incluem a identificação do rosto de Algoritmos comuns para a realização de classificação
uma pessoa em uma webcam. incluem máquinas de vetores de suporte (SVM), árvores de
Aprendizagem por reforço: essa opção é muitas vezes decisão reforçadas e ensacadas, k vizinhos mais próximos,
usado para a robótica, jogos e navegação. Com o aprendizado Naïve Bayes, análise discriminante, regressão logística e redes
por reforço, o algoritmo descobre por meio de tentativa e erro neurais. As técnicas de regressão predizem respostas contínuas
quais ações geram as melhores recompensas. Este tipo de - por exemplo, mudanças na temperatura ou flutuações na
aprendizado possui três componentes principais: o agente (o demanda de energia. Aplicações típicas incluem previsão de
aprendiz ou tomador de decisão), o ambiente (tudo com que carga de eletricidade e negociação algorítmica. Tais técnicas de
o agente interage) e ações (o que o agente pode fazer). O regressão são utilizadas quando se trabalha com um intervalo
objetivo é que o agente escolha ações que maximizem a de dados ou se a natureza da resposta for um número real, como
recompensa esperada em um período de tempo determinado. a temperatura ou o tempo até a falha de um equipamento.
O agente atingirá o objetivo muito mais rápido se seguir uma
boa política. Então o foco do aprendizado por reforço é
descobrir a melhor política. B. Aprendizagem Não Supervisionada
Na aprendizagem não supervisionada Clustering é a técnica
de aprendizado mais comum [11]. Ela é usada para análise
exploratória de dados para encontrar padrões ocultos ou
agrupamentos em dados. Aplicações para análise de cluster
incluem análise de sequência genética, pesquisa de mercado e
reconhecimento de objetos. Por exemplo, se uma empresa de
telefonia celular quiser otimizar os locais onde constroem torres
de telefonia celular, eles podem usar o aprendizado de máquina
para estimar o número de grupos de pessoas que dependem de
suas torres. Um telefone só pode falar com uma torre por vez,
então a equipe usa algoritmos de agrupamento para projetar a
melhor colocação de torres de celular para otimizar a recepção
de sinal para grupos ou clusters de seus clientes.
Algoritmos comuns para executar clustering incluem k-
meios e k-medoids, clustering hierárquico, modelos de mistura
gaussiana, modelos ocultos de Markov, mapas de auto-
organização, clustering f-c-means e clustering subtrativo.

IV. CASOS DE APLICAÇÃO


A. Previsão de estabilidade de tensão usando o Aprendizado
Ativo de Máquina
A operação da rede elétrica precisa de novos sistemas de
monitoramento que forneçam cada vez mais medições precisas
sobre o comportamento da rede para o operador [20].
A utilização de dados de novos equipamentos de subestações,
Fig. 2. Técnicas de Machine Learning.
6

como as PMUs, contribui para melhorar a tomada de decisões • A base de conhecimento é criada exclusivamente com
e a operação [21]. Como as medições são geralmente reunidas base no modelo do sistema de energia. Quando a
em alta velocidade e volume, torna-se imperativo explorar fidelidade do modelo do sistema é questionável, a
novas metodologias de análises de dados on-line com recursos precisão da previsão das ferramentas de aprendizado de
rápidos de processamento de dados. A abordagem de máquina é afetada negativamente.
aprendizado de máquina tem a capacidade de generalização em
que o modelo baseado em dados, se treinado adequadamente, O aprendizado ativo é empregado neste trabalho para lidar
pode fazer previsões precisas a partir de medidas para as quais com as desvantagens mencionadas. A Figura 3 mostra a
não foi exposto anteriormente. diferença entre a abordagem proposta e os algoritmos existentes
Embora os algoritmos de aprendizado de máquina sejam de aprendizado de máquina. A técnica de aprendizagem ativa
excelentes em sua rápida capacidade de tomada de decisão, está construindo iterativamente as bases de conhecimento, que
duas dificuldades técnicas ainda não foram totalmente são otimizadas para tamanho e precisão. Em vez de usar o
resolvidas: método de simulação exaustivo, ele seleciona interativamente
a) como atualizar os modelos de aprendizado de máquina os POs mais representativos ao criar o conjunto de dados de
quando as previsões contradizem as condições reais do sistema; treinamento. Em vez de confiar em simulações inclusivas
b) como preparar eficientemente os dados de treinamento baseadas em um modelo de sistema de energia, a abordagem
para eliminar simulações redundantes de sistemas de energia proposta procura ativamente os POs onde ocorrem previsões
off-line. imprecisas de aprendizado de máquina. Em seguida, ele executa
A estabilidade de tensão em um sistema de transmissão está simulações especiais para criar novos mapeamentos em torno
entre os principais desafios para a operação de uma rede dos POs identificados e os adiciona ao conjunto existente de
elétrica. Para eficiência e benefícios econômicos, os operadores conjunto de dados de treinamento. Isso ajuda a capturar o
de rede tendem a operar a rede perto de seus limites físicos. comportamento do sistema oculto não representado no processo
A capacidade de fornecer suporte à tomada de decisões em de treinamento anteriormente.
tempo real é desejada e pode melhorar muito a estabilidade,
segurança e confiabilidade de um sistema de energia.
A principal contribuição deste trabalho é a adaptação da
metodologia de aprendizagem ativa baseada em coleta de
medições do sistema de potência, como exemplo as
informações da Medição Fasorial Sincronizada dos dados PMU
usados para avaliar a estabilidade de tensão. Avaliando a
incerteza dos modelos de aprendizado de máquina e a carga
computacional de treinamento para previsão de instabilidade de
tensão. Fig. 3. Abordargem proposta versus abordagens existentes.
O desempenho de uma ferramenta de aprendizado de
máquina depende da capacidade do comportamento do sistema Na maioria dos casos, as simulações baseadas na modelagem
conhecido representado pelo conjunto de dados de treinamento. do sistema de potência são usadas para verificar a precisão da
Portanto, as abordagens existentes de aprendizado de máquina previsão e identificar quaisquer contradições entre a previsão
geralmente empregam um método de força bruta para gerar a da aprendizagem da máquina e o comportamento real do
base de conhecimento usando simulações baseadas em modelos sistema. Em alguns casos mais raros, tal contradição pode ser
de sistema físico. Devido à complexidade computacional da observada sem verificação de simulação. Quando o sistema de
grande quantidade de simulações necessárias, uma única base energia monitorado perdeu sua estabilidade de tensão, mas o
de conhecimento inalterada foi usada em muitas aplicações. As indicador de estabilidade de tensão ainda relata uma condição
ferramentas de aprendizado de máquina treinadas dessa estável é um bom exemplo de uma contradição óbvia.
maneira são “passivas” e sofrem de três principais A abordagem proposta também inclui essas contradições
desvantagens quando incorporadas em aplicativos on-line: observadas diretamente no conjunto de treinamento. O objetivo
é minimizar a influência negativa de modelos imprecisos de
• O conjunto de treinamento inicial é formulado em uma componentes do sistema de potência.
determinada condição de operação do sistema físico. Nossa abordagem é geral o suficiente para acomodar os
Quando as atualizações subsequentes não são modelos mais comuns de aprendizado de máquina, que podem
contabilizadas, a ferramenta de aprendizado de máquina funcionar como um classificador probabilístico. A incerteza de
pode falhar à medida que as condições operacionais do um classificador probabilístico é examinada para orientar a
sistema evoluem; criação da base de conhecimento.
• Quando os modelos de aprendizado de máquina são Em nosso trabalho, a abordagem proposta aplicada ao
atualizados, sem reduzir a quantidade de simulações problema de estabilidade de tensão ilustra o potencial de
necessárias, o treinamento baseado no mesmo método melhoria quantificando o desempenho de vários modelos
de simulação de força bruta atrasa muito a retomada do comuns de aprendizado de máquina em termos de tempo de
aplicativo on-line. treinamento, tempo de previsão e precisão. A margem de
7

estabilidade de tensão é computada para rotular cada PO como correspondente no barramento de carga. Quando o PO se move
estável ou instável, dado um estado do sistema de transmissão. para um ponto abaixo da VCP, consequências catastróficas
Com o aprendizado ativo baseado em sistema de podem ocorrer.
agrupamento, um conjunto de dados rotulados é criado a partir Para a aplicação da estabilidade de tensão em sistemas de
de um grande agrupamento de dados não rotulados usando transmissão foi considerado um problema de três classes, onde
“Simulação Baseada em Modelagem Detalhada do Sistema” yi = 1 representa POs com margens de estabilidade maiores que
que, com grande custo, produz um rótulo preciso. O termo o valor médio da margem de estabilidade de todos os POs,
“Simulação Baseada em Modelagem Detalhada do Sistema” yi = 2 para POs com uma margem de estabilidade no segundo
refere-se à simulação de estado estacionário ou dinâmica quartil, e yi = 3 se a margem de estabilidade estiver no menor
baseada em um modelo detalhado do sistema de potência. O quartil. O intervalo de VSM foi de 0,1% a 6%, e mais detalhes
conjunto de dados refere-se aos POs gerados pela simulação podem ser encontrados em [6].
baseada no modelo do sistema físico em várias condições Usando o conjunto de dados rotulados, é possível treinar um
operacionais do sistema. No trabalho apresentado, o PO modelo de aprendizado de máquina f, que pode então, para um
rotulado também pode ser o mapeamento conhecido entre PO xj invisível, fornecer uma aproximação da estabilidade de
medições em fluxo e comportamento real do sistema. O modelo tensão.
de aprendizado de máquina é então treinado para aproximar o A tarefa é construir uma base de conhecimento que leve ao
oráculo de uma maneira que minimize o número de consultas aprendizado ideal por PO rotulado. Dado o DU, o objetivo é
ao oráculo. O aprendizado ativo baseado em agrupamentos de encontrar subconjuntos DL incrementalmente maiores em
dados tem sido investigado com frequência em casos tamanho, o que otimamente aumenta a precisão de previsão de
semelhantes em que especialistas humanos fornecem rótulos um modelo de aprendizado de máquina treinado na DL atual.
para dados [22]. Essas abordagens são úteis devido à grande Esse problema imita a situação comum em um sistema de
diferença entre a velocidade com que o operador do sistema energia no qual a geração de POs em DL é computacionalmente
pode fornecer rótulos e a duração da fase de treinamento e cara, enquanto a obtenção de POs para DU é barata.
previsão do modelo de aprendizado de máquina.
Redes Neurais Artificiais
Estabilidade de tensão refere-se à capacidade de um sistema
de potência de manter tensões constantes em todos os A RNA foi treinada para prever um rótulo como uma saída
barramentos no sistema após ter sido sujeito a um distúrbio de contínua. Uma propriedade específica das RNAs usada para
uma dada condição inicial de operação [23]. Neste trabalho, classificação binária é que elas generalizam todo o espaço de
estudou-se a estabilidade de tensão a longo prazo de um sistema entrada, mesmo que apenas poucos POs sejam usados para
de transmissão de energia em resposta a condições de carga de treinamento. Uma boa abordagem heurística para resolver esse
variação lenta. Como mencionado anteriormente, os operadores problema envolve incluir pelo menos um PO de cada classe no
da rede tendem a operar a rede perto de seus limites físicos. conjunto de treinamento. As experiências foram realizadas
Quando esses limites são violados, o sistema pode experimentar usando o MATLAB Neural Network Toolbox.
várias formas de falhas em todo o sistema, incluindo o colapso Máquinas de Vetores de Suporte
de tensão. Durante a implantação de aplicativos que são baseados no
SVM para classificação, novos POs são classificados por este
modelo de acordo com sua similaridade com um conjunto de
POs escolhidos para representar um limite de decisão.
Árvores de Decisão
Em um conjunto como o RF, o número de árvores usadas dita
o número potencial de valores que podem ser obtidos como a
estimativa de probabilidade e é, portanto, mais adequado para
aprendizado ativo do que árvores de decisão pura. Uma porta
do pacote R randomForest foi usada para experimentos.
Aprendizagem Ativa
Ao invés de assumir que para todos os POs xi possuem o yi
Fig. 4. Magnitude da tensão x demanda de carga. apropriado, o conjunto de dados DL é inicialmente assumido
como vazio, ou apenas inicializado com um OP de cada classe.
O conhecimento de domínio pode normalmente ser usados para
A estabilidade de tensão pode ser aproximada calculando a fornecer vários OPs de cada estado de estabilidade para
distância do atual PO. Conforme indicado na Fig. 4, as inicializar o DL, mas esses OPs não podem ser confiáveis para
condições de instabilidade de tensão surgem quando a demanda previsões precisas.
de carga tenta ir além da potência máxima de entrega. Os Adicionar rótulos aos OPs no DU usando o “Simulação
sistemas normais POs estão acima do VCP, ao longo da linha Baseada em Modelagem Detalhada do Sistema” aumenta o
definida pela relação entre demanda e magnitude de tensão tamanho do DL. Esse conjunto pode ser usado para quantificar
8

o aumento na precisão, após cada OP rotulado, tanto para O experimento se concentra em prever as margens de
amostragem aleatória quanto para aprendizado ativo. estabilidade de tensão em uma rede de transmissão. A rede de
teste é o sistema WECC simplificado, que consiste em 29
Aprendizado Ativo Baseado em Sistema de Agrupamento
geradores, 179 ônibus, 263 linhas de transmissão, 42 derivações
Um agrupamento maior de dados não rotulados que e 104 cargas. A base de conhecimento preparada pela
representam as condições de operação do sistema de energia é “Simulação” inclui 5078 “estáveis”, 2540 “alertas” e 2529
rotulado iterativamente com um “Simulação Baseada em “críticos” POs rotulados. Um total de 256 canais de dados
Modelagem Detalhada do Sistema” para criar um conjunto de fasoriais simulados foram coletados, abrangendo 1.0147 OP
dados rotulados O modelo de aprendizado de máquina pode ser selecionados.
treinado. A incerteza do modelo de aprendizado de máquina é As seguintes conclusões foram alcançadas:
usada para selecionar pontos de dados para rotulagem pelo
oráculo. Em cada iteração, um classificador parcialmente • Foi identificada que os conjuntos de dados de treinamento
treinado escolhe um exemplo x* do conjunto de dados sem pode ser um ponto fraco, que muitas vezes são
rótulo sobre o qual o classificador é mais incerto. negligenciado na aplicação de problemas de aprendizado
Quando incorporado em aplicativos do sistema de energia de máquina aos sistemas de energia não conseguindo ser
on-line, o conjunto de dados sem rótulo se refere às medições sempre eficientes.
de séries temporais transmitidas para uma instalação central
• A abordagem de aprendizagem ativa proposta baseada em
onde reside o modelo de aprendizado de máquina. A técnica
agrupamento pode construir conjuntos de dados para um
proposta compara continuamente a previsão do modelo de
modelo de aprendizado de máquina para treinar de forma
aprendizado de máquina com o comportamento real do sistema.
mais eficiente.
Uma vez que uma contradição é identificada, o PO
• A abordagem descrita aprimora os modelos existentes de
correspondente é registrado. O “Simulação Baseada em
aprendizado de máquina, identificando os pontos
Modelagem Detalhada do Sistema” é usado para gerar um
operacionais nos quais as previsões do modelo
rótulo preciso para o OP através da simulação baseada em
contradizem a realidade e adicionando conjuntos de dados
modelo. No trabalho apresentado, o status de estabilidade de
rotulados em torno desses pontos à base de conhecimento.
tensão é determinado como um rótulo y * e atribuído ao OP. O
• A abordagem também acelera o processo de treinamento
novo OP rotulado agora pode ser incluído no pool de DL, para
off-line, reduzindo a quantidade de simulações baseadas
que possa ser usado na próxima iteração de aprendizado.
em modelos em torno de outros pontos operacionais, onde
Aprendizado Ativo em Sistemas de Potência previsões corretas foram feitas.
Como discutido anteriormente, no estudo da estabilidade de • A abordagem foi empregada para lidar com a estabilidade
tensão do sistema de transmissão, o VSM é usado como de tensão nos sistemas de transmissão. Desempenho
indicador ou rótulo. Para uma grande rede de energia, pode promissor foi alcançado.
levar horas para criar POs rotulados usando o cálculo de fluxo
de potência no modelo de sistema detalhado construído no B. Detecção de Injeção de Dados Falsos Usando Aprendizado
programa de estabilidade PSSE [6]. de Máquina em SG
A integração da abordagem de aprendizagem ativa proposta
De acordo com [22], o crescimento populacional trouxe
nas aplicações do sistema de potência. As medições dos
grandes desafios para o setor elétrico. Enfrentar esses desafios
Fasoriais Sincronizadas são transmitidas das PMU para o
requer mudanças profundas nos sistemas de energia
agrupamento não rotulado. Neste exemplo, a atividade não tradicionais.
ocorre simultaneamente. A Simulação Baseada em Modelo é O estimador de estado é uma maneira eficiente de
calibrado off-line, os dados no Conjunto sem rótulo podem ser monitoramento on-line dos estados da rede de energia. Para
históricos DT, RF ou SVM. A “Simulação Baseada no Modelo” estimar os estados de uma rede, os valores medidos de potência
é usado para rotular POs, que são então incluídos no Labelled ativa devem ser distribuídos coletivamente para um estimador
Label para o aprendizado. de estado central através de links de comunicação. Geralmente,
Ao fazer previsões sobre o agrupamento sem rótulo, os POs essas medições são coletadas por sensores instalados na
mais incertos são identificados. Os POs recebem então rótulos subestação. Os estados estimados são a base de referência usada
precisos pela “Simulação Baseada no Modelo” e são pelos centros de operação para manter a operação da rede
armazenados no conjunto rotulado para que possam ser usados elétrica em um modo seguro.
para aprendizado posterior. Medições de campo podem ser A infraestrutura de comunicação conecta as subestações aos
usadas para verificar e calibrar ferramentas de simulação centros de operação, porém aumenta os desafios referente a
durante a configuração inicial do sistema. segurança cibernética, pois os estimadores de estado são
A abordagem proposta é avaliada em experimentos potencialmente alvos de ataques cibernéticos.
utilizando dados sintéticos obtidos a partir de simulações no O trabalho em [23] analisa ataques maliciosos em três
modelo detalhado do sistema de potência. Seu desempenho é categorias diferentes com base nos objetivos de segurança da
quantificado em termos de previsão e tempo de treinamento e rede inteligente:
precisão de previsão.
9

1. Disponibilidade: Os ataques tentam atrasar, bloquear potência;


ou corromper a comunicação na rede inteligente • Como preparar eficientemente os dados de treinamento
(também chamada de ataque de negação de serviço). para eliminar simulações off-line redundantes.
2. Integridade: Um invasor tenta interromper ilegalmente
a troca de dados. Para a detecção de dados falsos injetados em sistemas SG
3. Confidencialidade: Um invasor tenta obter complexos e com grande volume de medições, os métodos
informações não autorizadas de recursos da rede. tradicionais são pouco eficientes. Já as técnicas de ML possuem
recursos de análise não-linear que se mostram efetivos na
Conforme [22], os custos gerais de monitoramento das redes detecção. Esta efetividade é particularmente importante em
inteligente serão reduzidos, mas, ao mesmo tempo, o risco de sistemas SG, devido à sua sensibilidade a atrasos, já que o
ataques cibernéticos serão aumentados. Recentemente, um sistema fica exposto a maiores riscos enquanto as ameaças
novo tipo de ataque, chamado ataque furtivo, foi introduzido. permanecem não detectadas.
Este ataque não pode ser detectado pela detecção tradicional de Pode-se constatar também que as técnicas de ML se mostram
dados incorretos usando estimadores de estado.
eficazes na seleção de grandes volumes de dados de SG. Desta
Para detectar tais ataques, os autores propõem o uso de dois
forma, informações úteis podem ser extraídas e empregadas em
métodos de Machine Learning. O primeiro método utiliza o
diferentes tarefas de planejamento e operação de sistemas
aprendizado supervisionado sobre os dados rotulados e treina
uma máquina de vetores de suporte, em inglês support vector elétricos de potência, tais como: identificação de padrões de
machine (SVM). O SVM é um conceito utilizado na ciência da geração e demanda, previsão da demanda a curto prazo, ajuste
computação para um conjunto de métodos do aprendizado dos parâmetros de controle, análise da segurança dinâmica de
supervisionado que analisam os dados e reconhecem padrões, grandes áreas, e planejamento da expansão do sistema.
sendo também usado para classificação e análise de regressão. Em sistemas SG, cada vez mais interconectados e integrados
Uma grande vantagem no uso de SVM é sua capacidade de tecnologicamente, todos os segmentos (geração, transmissão,
generalização. A capacidade de generalização de um distribuição e comercialização) estão expostos a significativos
classificador é medida por sua eficiência na classificação de riscos de ataques cibernéticos. Muitos ataques desta natureza
dados que não pertençam ao conjunto utilizado em seu foram inclusive já realizados. Portanto, a segurança dos dados
treinamento. é uma grande preocupação das redes inteligentes, sendo as
O segundo método usa o método não supervisionado, ou seja, técnicas de ML bastante contributivas, devido à capacidade de
não existem dados rotulados. O algoritmo baseado em manipularem grande volume de dados não-lineares.
estatística foi utilizado pelo método. O algoritmo aprende a
representar as entradas submetidas segundo uma medida de
qualidade. Desta forma, o algoritmo detecta o desvio nas B. Perspectivas Futuras
medições. Em ambos os métodos, a análise dos componentes Além das questões já apontadas na seção anterior, que devem
principais, em inglês principal component analysis (PCA), é ser aperfeiçoadas ao longo do tempo, tais como a não
usada para reduzir a dimensionalidade dos dados a serem correspondência entre as previsões e as condições atuais dos
processados, o que leva a menores esforços computacionais. sistemas, e a eliminação de simulações off-line redundantes,
Segundo os autores de [22], os resultados obtidos mostram a outras questões emergem. Um ponto que deverá ser
eficácia dos algoritmos propostos para a detecção da injeção aperfeiçoado são as garantias teóricas sobre a melhoria de
furtiva de dados falsos. desempenho dos algoritmos de ML, em termos de precisão e do
número de pontos de operação que precisam ser simulados.
V. DISCUSSÃO Outro ponto que certamente será melhorado são as estimativas
A partir de todo conteúdo abordado, podem ser empreendidas de incerteza dos modelos de ML, que invariavelmente são
algumas constatações sobre os pontos mais relevantes ao afetas por dados intencionalmente falsos, o que prejudica a
escopo do trabalho. Na sequência, tais constatações são precisão das previsões obtidas.
apresentadas e discutidas, sendo subdivididas em duas Pode-se verificar uma tendência de crescimento no uso de
categorias: aplicações baseadas em técnicas de ML, já que elas possibilitam
soluções promissoras no campo da defesa a vulnerabilidades
• Smart Grid e Machine Learning: estado atual e; cibernéticas, questão que ganha importância com os sistemas
• Perspectivas futuras. SG. Esta tendência se deve ao ecletismo das técnicas de ML que
podem ser aplicadas à maioria das tarefas de manipulação de
dados, tais como: classificação, detecção, identificação,
A. Smart Grid e Machine Learning: Estado Atual
regressão e previsão.
Enquanto os algoritmos de ML se destacam pela capacidade Especificamente uma tarefa que deve ter ganhos de
de tomarem rápidas decisões, pode-se verificar que duas desempenho com o emprego das técnicas de ML é a previsão
dificuldades técnicas não foram ainda totalmente resolvidas: de carga nas redes elétricas inteligentes. O reconhecimento do
uso irregular de padrões de energia em edifícios, por exemplo,
• Como atualizar os modelos de ML quando as previsões pode ser obtido pela detecção de outliers (valores anormais) e
não correspondem às condições atuais do sistema de por uma análise de agrupamento. Uma análise de correlação
10

pode também ser realizada para verificar-se o grau de aderência Transport Analytics,” C. Antoniou, L. Dimitriou, F. Pereira, Elsevier,
2019, pp.9-29. https://doi.org/10.1016/B978-0-12-812970-8.00002-
entre variáveis climáticas e o consumo de energia. 6.
[10] R. Boutaba et al. “A comprehensive survey on machine learning for
VI. CONCLUSÃO networking: evolution, applications and research opportunities,”,
Os sistemas elétricos de potência têm passado por um Journal of Internet Services and Applications, 2018, pp.9-16.
https://doi.org/10.1186/s13174-018-0087-2.
processo de transição energética e tecnológica irrevogável, que
[11] G, Shobha, S. Rangaswamy. “Handbook of Statistics – Machine
o levará a um outro paradigma em termos de planejamento e Learning,” V. Gudivada, C.R. Rao, Elsevier, 2018, pp.197-228.
operação. Energeticamente, a mudança ocorre em função do https://doi.org/10.1016/bs.host.2018.07.004.
aumento da participação de fontes renováveis nas matrizes [12] P. Iona et al. (2011). Making Smart Grids Smarter by Using Machine
energéticas dos países. Devido à sua característica intermitente Learning. Proceedings of the Universities Power Engineering
e distribuída, tais fontes aumentam o grau de incerteza em todos Conference. 2011. 1-5
https://www.researchgate.net/publication/258977475
os segmentos do setor elétrico. Tecnologicamente, a
[13] H. Xu, H. Huang, R. S. Khalid and H. Yu, "Distributed machine
possibilidade de medições remotas, sincronizadas e com alta learning based smart-grid energy management with occupant
taxa de amostragem, aliada à comunicação bidirecional em cognition," 2016 IEEE International Conference on Smart Grid
tempo real, ou quase real, tem impulsionado o desenvolvimento Communications (SmartGridComm), Sydney, NSW, 2016, pp. 491-
496 10.1109/SmartGridComm.2016.7778809
de novas aplicações no contexto dos sistemas SG.
Neste cenário, toda esta transição tem despertado [14] J. Carbonell, R. Michalski, T. Mitchell, " Machine Learning:A
Historical and Methodological Analysis," AI Magazine, V.4 1983.
preocupações com a segurança cibernética dos dados, que doi: NO0014-79-C-0661
ganham volume e importância em redes elétricas inteligentes. [15] R. Nawaz, M. A. Shahid, I. M. Qureshi and M. H. Mehmood,
Por outro lado, estas mudanças também têm aberto a "Machine learning based false data injection in smart grid," 2018 1st
possibilidade de emprego de novas técnicas matemáticas e International Conference on Power, Energy and Smart Grid
(ICPESG), Mirpur Azad Kashmir, 2018, pp. 1-6. doi:
computacionais, efetivas não somente no combate de ameaças 10.1109/ICPESG.2018.8384510
cibernéticas, mas também no planejamento e na operação dos
[16] A. Bagheri, M. H. J. Bollen and I. Y. H. Gu, "Big data from smart
sistemas de potência. As técnicas de ML se enquadram neste grids," 2017 IEEE PES Innovative Smart Grid Technologies
contexto, sendo bastante promissoras como ferramentas Conference Europe (ISGT-Europe), Torino, 2017, pp. 1-5. doi:
efetivas para a solução dos diversos problemas detalhados ao 10.1109/ISGTEurope.2017.8260155
longo deste trabalho. [17] A. Almalaq and G. Edwards, "A Review of Deep Learning Methods
Applied on Load Forecasting," 2017 16th IEEE International
Conference on Machine Learning and Applications (ICMLA),
Cancun, 2017, pp. 511-516. doi: 10.1109/ICMLA.2017.0-110
REFERÊNCIAS BIBLIOGRÁFICAS [18] C. Dong et al., "Forecasting Smart Meter Energy Usage Using
Distributed Systems and Machine Learning," 2018 IEEE 20th
International Conference on High Performance Computing and
[1] E. Hossain, I. Khan, F. Un-noor, S. S. Sikander, and S. H. Sunny,
“Application of Big Data and Machine Learning in Smart Grid , and Communications; IEEE 16th International Conference on Smart City;
IEEE 4th International Conference on Data Science and Systems
Associated Security Concerns : A Review,” IEEE Access, vol. 7, pp.
(HPCC/SmartCity/DSS), Exeter, United Kingdom, 2018, pp. 1293-
13960–13988, 2019.
1298. doi: 10.1109/HPCC/SmartCity/DSS.2018.00216
[2] F. Pallonetto, M. De Rosa, F. Milano, and D. P. Finn, “Demand
response algorithms for smart-grid ready residential buildings using [19] H. Yang, P. Li, A. Masood, Y. Xiao, B. Sheng and Q. Yu, "Smart
grid data analysis and prediction modeling," 2016 International
machine learning models,” Appl. Energy, vol. 239, no. January, pp.
Conference on Progress in Informatics and Computing (PIC),
1265–1282, 2019.
Shanghai, 2016, pp. 541-544. doi: 10.1109/PIC.2016.7949559
[3] K. A. P. da Costa, J. P. Papa, C. O. Lisboa, R. Munoz, and V. H. C.
de Albuquerque, “Internet of Things: A survey on machine learning- [20] T. Hong et al., “Guest editorial big data analytics for grid
modernization,” IEEE Trans. Smart Grid, vol. 7, no. 5, pp. 2395–
based intrusion detection approaches,” Comput. Networks, vol. 151,
2396, Sep. 2016.
pp. 147–157, 2019.
[21] B. Wang, B. Fang, Y. Wang, H. Liu, and Y. Liu, “Power system
[4] Y. T. Quek, W. L. Woo, and T. Logenthiran, “Smart Sensing of Loads
in an Extra Low Voltage DC Pico-Grid Using Machine Learning transient stability assessment based on big data and the core vector
machine,” IEEE Trans. Smart Grid, vol. 7, no. 5, pp. 2561–2570, Sep.
Techniques,” IEEE Sens. J., vol. 17, no. 23, pp. 7775–7783, 2017.
2016.
[5] T. Ahmad and H. Chen, “Potential of three variant machine-learning
[22] M. Esmalifalak, L. Liu, N. Nguyen, R. Zheng, Z. Han, Detecting
models for forecasting district level medium-term and long-term
energy demand in smart grid environment,” Energy, vol. 160, pp. Stealthy False Data Injection Using Machine Learning in Smart Grid,
IEEE Syst. J. 11 (2017) 1644–1652.
1008–1020, 2018.
doi:10.1109/JSYST.2014.2341597.
[6] V. Malbasa, C. Zheng, P. C. Chen, T. Popovic, and M. Kezunovic,
[23] W. Wang, Z. Lu, Cyber security in the Smart Grid: Survey and
“Voltage Stability Prediction Using Active Machine Learning,” IEEE
challenges, Comput. Networks. 57 (2013) 1344–1371.
Trans. Smart Grid, vol. 8, no. 6, pp. 3117–3124, 2017.
doi:10.1016/j.comnet.2012.12.017.
[7] S. Breker, J. Rentmeister, B. Sick, and M. Braun, “Hosting capacity
of low-voltage grids for distributed generation: Classification by
means of machine learning techniques,” Appl. Soft Comput. J., vol.
70, pp. 195–207, 2018.
[8] M. Esmalifalak, S. Member, L. Liu, and S. Member, “Detecting
Stealthy False Data Injection Using Machine Learning in Smart
Grid,” vol. 11, no. 3, pp. 1644–1652, 2017.
[9] F.C. Pereira, S.S. Borysov. “Mobility Patterns, Big Data and

Você também pode gostar