Escolar Documentos
Profissional Documentos
Cultura Documentos
O SIN (Sistema Interligado Nacional) brasileiro [1], Segundo a CCEE (Câmara de Comercialização de Energia
principalmente no que tange a oferta hídrica, pode ser Elétrica) [3], os preços futuros têm como principal indicador o
considerado único no mundo. Uma das constatações da PLD (preço da liquidação das diferenças), os quais são gerados
evolução desse sistema é o aumento da quantidade e a partir de considerações sobre o comportamento futuro da
complexidade das variáveis consideradas para a tomada de demanda de energia, projeções de afluências, que consideram
decisões por todos os diversos atores envolvidos no setor os resultados de diversos modelos de previsão de afluências e
elétrico brasileiro. finalmente dados referentes ao incremento da oferta de energia,
Segundo o IBGE [2], Estatística e um conjunto de técnicas, ou cronograma de obras futuras. Todos esses dados são
métodos de pesquisa e análise de dados que engloba o processados em uma cadeia de modelos de “otimização”, com
planejamento do experimento, a coleta qualificada dos dados, a inıcio no Modelo Estratégico de Geração Hidrotérmica a
inferência, o processamento, a análise e a disseminação das Subsistemas Equivalentes (NEWAVE) empregado no
informações. O desenvolvimento e o aperfeiçoamento de planejamento da operação interligada de sistemas
técnicas estatísticas de obtenção e análise das informações hidrotérmicos, que determina as metas de geração para cada
permitem o controle e o estudo adequado de fenômenos, fatos usina do subsistema, a cada intervalo de discretização
eventos e ocorrências em diversas áreas do conhecimento. considerado (mês).
Propõe-se neste documento, como resultado do projeto de Esse programa gera, dentre outras informações, uma função que
P&D, uma abordagem inovadora na análise dessa imensa massa traduz o impacto da utilização da água armazenada nos
de dados e das informações disponíveis, implementando uma reservatórios, a ser utilizada pelo modelo de curto prazo
visão distinta das usuais empreendidas pelo Setor de Energia (DECOMP), que representa o parque gerador (usinas
Elétrica, permitindo considerar na modelagem a estatística de hidráulicas e térmicas por subsistemas) de forma
previsão de preços a ser desenvolvida, além de fatos e individualizada. Ele tem como objetivo a determinação dos
conhecimentos oriundos dos Agentes do SIN. Dessa forma, o despachos de geração por usina hidráulica e térmica de cada
principal fator motivador do projeto é a construção de um submercado, e os custos marginais de operação (CMO) para
modelo preditivo para preços de energia (PLD - Preço de cada estágio por patamar de carga que, submetidos a valores
Liquidação das Diferenças) no mercado spot, considerando a máximos e mínimos, conforme regras de mercado, convertem-
fusão de novas variáveis as tradicionalmente conhecidas, sob o se em PLD’s.
enfoque da estatística Bayesiana.
III. METODOLOGIA
____________________
Antes do início do projeto, a previsão do PLD ou CMO era
Este artigo é resultado de um projeto de P&D, modelo Aneel, PD 0061- realizada, de forma complementar aos modelos oficiais do setor
0045/2014 desenvolvido pela empresa CESP – Companhia Energética de São
elétrico, através de um modelo desenvolvido segundo o
Paulo.
Remido, Victor de B., empresa Bayes, vdebuen@gmail.com trabalho de pós- doutorado de Lopes (2014). O modelo de
Luciano, Edson J.R., empresa CESP, São Paulo – Brasil, Lopes usa as seguintes variáveis:
edson.luciano@cesp.com.br
Zechinatto, Daniel S., empresa CESP, São Paulo – Brasil, EAR - Energia armazenada disponível num sistema de reservatórios.
daniel.zechinatto@cesp.com.br ENA - Energia natural afluente nos reservatórios.
mlt - Média de longo prazo. Histórico de oitenta e dois anos de vazões do ONS.
ENA(mlt) - ENA média a longo prazo
CargaPrev - Carga prevista Nesses modelos se utiliza o operador de defasagem B que é
Carga(P EN) - Carga do Plano Energético Nacional
aplicado a uma série temporal St e representa um retardo de uma
EARt−1 - EAR da semana anterior
EARt−2 - EAR de duas semanas anteriores unidade de tempo, ou seja,
Modelo multiplicativo: sua forma geral é: Se for aplicado duas vezes consecutivas, o operador de
defasagem é denotado:
O modelo utilizado foi um IMA, ou seja, o grau da parte AR do Tabela 2 Comparação dos modelos
ARIMA foi nula, e será incluído um parâmetro de escala na data
de introdução do CVAR, obtendo-se os parâmetros por
estimativa de máxima verossimilhança.
Na Figura 1, pode-se ver os resíduos do modelo CMO.LSS.02
comparados com o modelo CMO.MLE.01. Abordagem Bayesiana
O autocorrelograma dos resíduos mostra independência para os
mesmos, portanto são cumpridas todas as hipóteses do modelo, A abordagem Bayesiana é baseada na interpretação da
o que torna possível a realização da estimação por intervalos de probabilidade como a formalização da incerteza.
confiança que nos indica qual é o nível de incerteza, que Uma vez que isso é aceito, é natural considerar que a incerteza
aumenta conforme aumenta o horizonte de previsão. As sobre um parâmetro de um modelo pode ser descrita através de
previsões são muito parecidas, ao se levar em conta o alto nível uma função de probabilidade, seja a priori, ou a posteriori.
de incerteza ilustrado pelo intervalo de confiança, como se pode Inclusive, foi observado que distribuições de probabilidade a
ver na Figura 2. posteriori podem ser usadas como distribuições de
probabilidade a priori uma vez que novos dados são
incorporados à análise. Portanto, a distinção entre distribuição
a priori e a posteriori é puramente operacional, não em essência.
Por outro lado, é natural e intuitivamente aceitável que os
parâmetros desconhecidos tenham certas funções de
distribuição.
Ocasionalmente a reticência mostrada perante a análise
Bayesiana é focada na necessidade de se usar uma distribuição
Figura 1 Comparação dos resíduos dos modelos CMO.MLE.01 e CMO.LSS.02
a priori dos parâmetros.
A informação a priori, entra na análise estatística via o modelo
probabilístico escolhido e não dos dados a priori em si. Torna-
se evidente que, se existe informação a priori, então o resultado
obtido quando a usamos na inferência estatística de parâmetros
produz resultados melhores comparativamente. Caso contrário, dentre outros. A partir dessas análises foram obtidos os
é necessário o uso de distribuições probabilísticas não resultados apresentados na sequência.
informativas. Assim, num ponto de vista assintótico, qualquer
que seja a distribuição a priori, sua relevância diminui à medida IV. RESULTADOS
que a quantidade de dados aumenta.
O paradigma Bayesiano consiste em usar o teorema de Bayes Validação cruzada
como instrumento para toda inferência estatística. Consiste em observar as diferenças entre os dados reais e
Relembramos que o teorema de Bayes expressa o fato que a previstos para um intervalo de tempo que, no momento de
probabilidade condicional da ocorrência de um evento A, calcular essa previsão, eram desconhecidos. A validação
condicionado à ocorrência de um evento B (a probabilidade a cruzada foi realizada com dados previstos em 12/09/2015, junto
posteriori do evento A) é o produto da probabilidade de aos dados reais obtidos até 19/03/2016. Embora os dados sejam
ocorrência do evento B condicionado à ocorrência do evento A, estritamente conhecidos até 27/02/2016, foram usadas as
multiplicada pela probabilidade marginal (ou probabilidade a previsões do DECOMP para completar o intervalo até
priori ) da ocorrência do evento A, dividida pela probabilidade 19/03/2016.
de ocorrência do evento B. A seguir, são apresentados os gráficos de validação cruzada de
cada subsistema.
𝐵
𝑝(𝐴)
P (A/B) = P(A)
𝑝(𝐵)
Tendo em vista que 60.71% dos dados reais se encontram entre As publicações mais utilizadas para desenvolvimento do estudo
as bandas de confiança de 60%, ao redor das previsões extra final foram:
amostrais, é possível dizer que, efetivamente, as bandas de
confiança são efetivas, ou seja, o modelo dá uma medida BOX, G.E.P. and DRAPER, N.R. (1987) Empirical Model-
bastante confiável da incerteza associada ao fenômeno, mesmo Building and Response Surfaces (Wiley Series in Probability
que as previsões possam ser melhoradas no que diz respeito ao and Mathematical Statistics)
viés.
BURMAN, J.P. (1980) Seasonal Adjustment by Signal
Extraction. Journal of the Royal Statistical Society. Series A
(General) Vol. 143, No. 3, pp. 321-337
RENYI, A. (1987) A Diary on Information Theory (Wiley
Series in Probability and Mathematical Statistics)
CARLIN, BRADLEY P. and LOUIS, THOMAS A. (2009)
Bayesian Methods for Data Analysis.