TCC Eduardo Girardi

UNIVERSIDADE DO VALE DO RIO DOS SINOS – UNISINOS
UNIDADE ACADÊMICA DE GRADUAÇÃO

CURSO DE ENGENHARIA ELÉTRICA
EDUARDO GIRARDI
AVALIAÇÃO DO USO DE MINERAÇÃO DE DADOS NA OTIMIZAÇÃO DE

MEDIDORES DE ENERGIA REATIVA NAS REDES DE BAIXA TENSÃO
São Leopoldo
2009
EDUARDO GIRARDI
AVALIAÇÃO DO USO DE MINERAÇÃO DE DADOS NA OTIMIZAÇÃO DE

MEDIDORES DE ENERGIA REATIVA NAS REDES DE BAIXA TENSÃO
Trabalho de Conclusão de Curso

apresentado como requisito parcial para a
obtenção do título de Bacharel em
Engenharia Elétrica, pelo curso de
Engenharia Elétrica da Universidade do
Vale do Rio dos Sinos
Orientador: Profº João Olegário de Oliveira de Souza
São Leopoldo
2009
Dedico este trabalho aos meus pais, Valdir e Marlizete, e à
minha irmã, Talita, que por todos estes anos tem incentivado,
participado, e principalmente acreditado na concretização de
meus sonhos.
AGRADECIMENTOS
Agradeço ao Professor João Olegário de Oliveira de Souza que, como

orientador, colaborou com suas idéias e sugestões para o desenvolvimento do
presente trabalho, norteando e esclarecendo as idéias propostas e iniciativas
tomadas.
Agradeço também aos amigos e colegas pelo apoio e conhecimento

compartilhado de suas experiências profissionais.
Agradeço à AES Sul e aos colegas de trabalho, pelo apoio durante minha
formação como profissional e ao suporte oferecido durante o desenvolvimento deste
trabalho.
Especialmente agradeço à minha família pelo apoio contínuo, incentivo e

compreensão durante os anos aos quais me dediquei aos estudos.
“Por três meios podemos aprender a sabedoria: Primeiro, pela reflexão, que é
a mais nobre; Segundo, pela imitação, que é a mais fácil; e terceiro pela experiência,
que é a mais amarga”.
Confúcio
RESUMO
A distribuição de energia elétrica é um serviço básico e indispensável à população,

condição que torna essencial o uso racional e eficiente do sistema. O crescente
aumento do uso de motores e equipamentos elétricos remete a um aumento na
demanda de potência reativa nos sistemas elétricos. Este aumento na demanda
resulta em um maior fluxo de energia reativa nas redes e assim contribui para a
ineficiência do sistema elétrico. Os mecanismos de regulação do governo brasileiro
determinam os limites de energia reativa admissível e atribuem às concessionárias
de distribuição as diretrizes para efetuar as medições em unidades consumidoras.
Assim, o presente trabalho apresenta uma avaliação de dois métodos para otimizar
o remanejo de medidores trifásicos de energia elétrica reativa em redes de baixa
tensão, utilizando técnicas de mineração de dados. São apresentados os conceitos
regulatórios do emprego da medição de energia reativa em concessionárias de
distribuição de energia elétrica e os métodos de mineração de dados, com um
enfoque no uso das redes neurais e das árvores de decisão. Através da avaliação
destas técnicas e a aplicação em uma base de dados real da empresa AES Sul
Distribuidora Gaúcha de Energia S.A., demonstra-se então os potenciais ganhos
encontrados.
Palavras-Chaves: Árvores de Decisão. Classificação de Padrões. Energia Reativa.

Inteligência Artificial. Mineração de Dados. Redes Neurais.
ABSTRACT
Distribution of Electricity is a basic and indispensable service to the population, with

this condition becomes essential the rational and efficient use of the system. The
increasing use of engines and electrical equipments contribute to an increase in
demand for reactive power in electrical systems. This increase in demand results in
an increased flow of reactive power in networks and consequently contributes to the
inefficiency of the electric system. The mechanisms of regulation of Brazil’s
government determine the limits of permissible reactive power and set the guidelines
for distribution utilities to make the measurements in consuming units. This essay
presents an evaluation of two methods to optimize the reshuffling of reactive power
meters in low voltage networks, using data mining techniques. The regulatory
concepts of the use of reactive power measurement by distribution power utilities and
methods of data mining, with a focus on the use of artificial neural networks and
decision trees, are presented. Through the evaluation and application of these
techniques on a database from AES SUL Distribuidora Gaúcha de Energia S.A., the
potential gains are demonstrated.
Keywords: Pattern classification; Artificial intelligence; Data mining; Neural networks;

Decision tree; Reactive power.
LISTA DE FIGURAS
Figura 1 - Triângulo das potências ............................................................................22

Figura 2 – Visão geral do processo de descoberta do conhecimento .......................30
Figura 3 – Tarefa do aprendizado de máquina .........................................................35
Figura 4 – Exemplo de árvore de decisão.................................................................38
Figura 5 – Árvore de decisão de negociação salarial................................................43
Figura 6 – Árvore de decisão com a substituição de subárvores ..............................43
Figura 7 – Árvore de decisão ....................................................................................44
Figura 8 – Crescimento de subárvores .....................................................................44
Figura 9 – O limiar de disparo de um neurônio .........................................................47
Figura 10 – Modelo de neurônio artificial ..................................................................50
Figura 11 – Hiperplano demonstrando o limiar de decisão .......................................51
Figura 12 – Estrutura de um Perceptron com duas camadas ocultas .......................53
Figura 13 – Fluxo de sinais entre camadas...............................................................55
Figura 14 – Ambiente Clementine .............................................................................60
Figura 15 – Matriz de contingência ...........................................................................61
Figura 16 – Estrutura da tabela 01 ............................................................................68
Figura 19 – Tabela 01 de dados históricos de clientes da AES Sul ..........................71
Figura 22 – Estrutura final da tabela gerando o Arquivo 01 ......................................75
Figura 23 – Tela de inicialização do WEKA...............................................................78
Figura 24 – Arquivo 01 no formato ARFF..................................................................80
Figura 25 – Espaço de trabalho do módulo KnowledgeFlow.....................................80
Figura 26 – Fluxo de dados desenvolvido no WEKA ................................................82
Figura 27 – Configuração do bloco CrossValidationFoldMaker.................................83
Figura 28 – Fluxo de teste no KnowledgeFlow..........................................................84
Figura 29 – Configuração do bloco J48.....................................................................85
Figura 30 – Configuração do bloco Multilayer Perceptron.........................................89
Figura 31 – Opção Debug do bloco Multilayer Perceptron........................................91
Figura 32 – Representação da Árvore de Decisão....................................................95
LISTA DE GRÁFICOS
Gráfico 1 – Formas de onda da tensão e corrente ....................................................21

Gráfico 2 - Curva do consumo ativo e reativo de energia .........................................23
Gráfico 3 – Índice de preços reais de eletrodomésticos............................................25
Gráfico 4 – Forma de tensão e corrente de uma carga linear ...................................26
Gráfico 5 - Forma de tensão e corrente solicitadas por uma carga não linear ..........27
Gráfico 6 – Função Logística ou Sigmóide................................................................54
Gráfico 7 – Espaço de hipóteses de pesos e erros associados ................................57
Gráfico 8 – Plotagem da curva ROC .........................................................................63
Gráfico 9 – Influência do intervalo de confiança na árvore de decisão .....................86
Gráfico 10 – A influência das épocas sobre a AUC e a Taxa de Sucesso ................87
Gráfico 11 – Influência da Taxa de Aprendizado sobre a Taxa de Sucesso .............87
Gráfico 12 – Curva ROC com dois algoritmos...........................................................94
LISTA DE QUADROS
Quadro 1 - Fator de potências em vários países.......................................................23

Quadro 2 - Desempenho de motores de indução em função da tensão aplicada .....24
Quadro 3 – Influência dos harmônicos na corrente e fator de potência ....................27
Quadro 4 – Algoritmos e tarefas de mineração de dados .........................................33
Quadro 5 – Agrupamento de artefatos elétricos........................................................72
Quadro 6 – Tarefas e algoritmos de mineração de dados ........................................77
Quadro 7 – Matriz de contingência da rede neural....................................................92
Quadro 8 – Matriz de contingência da árvore de decisão .........................................92
SUMÁRIO
1 INTRODUÇÃO .......................................................................................................12
1.1 OBJETIVOS ........................................................................................................12
1.2 ESTRUTURA DO TRABALHO............................................................................14
1.3 RELAÇÃO COM DISCIPLINAS...........................................................................14
2 FUNDAMENTAÇÃO TEÓRICA .............................................................................15
2.1 O SETOR ELÉTRICO BRASILEIRO...................................................................15
2.1.1 A regulação do setor elétrico brasileiro .......................................................15
2.1.2 A medição eletrônica em clientes atendidos em baixa tensão ..................17
2.2 O FATOR DE POTÊNCIA ...................................................................................20
2.2.1 A influência do ambiente brasileiro para o fator de potência ....................25
2.3 O PROCESSO DE DESCOBERTA DO CONHECIMENTO ................................29
2.3.1 Inteligência artificial .......................................................................................31
2.3.2 Mineração de dados .......................................................................................32
2.3.2.1 Classificação de dados..................................................................................34
2.3.3 O aprendizado de máquina............................................................................34
2.3.3.1 Conjunto de treinamento e teste ...................................................................35
2.3.3.2 Árvores de decisão........................................................................................37
2.3.3.2.1 O algoritmo ID3 ..........................................................................................39
2.3.3.2.2 O ganho de informação e a entropia ..........................................................40
2.3.3.2.3 O algoritmo C4.5 ........................................................................................42
2.3.3.2.4 A poda da árvore de decisão......................................................................42
2.3.3.3 Redes neurais artificiais ................................................................................44
2.3.3.3.1 O modelo de neurônio biológico.................................................................45
2.3.3.3.2 Notas históricas sobre o desenvolvimento das redes neurais....................48
2.3.3.3.3 O neurônio artificial.....................................................................................49
2.3.3.3.4 Topologias de redes neurais artificiais .......................................................51
2.3.3.3.5 Algoritmos de aprendizado.........................................................................52
2.3.3.3.6 O Perceptron de múltiplas camadas utilizando backpropagation ...............52
2.3.3.3.7 O algoritmo de aprendizado backpropagation............................................55
2.3.4 Ferramentas de mineração de dados ...........................................................58
2.4 MÉTODOS DE ANÁLISE DE PERFORMANCE ................................................. 60
2.4.1 A taxa de sucesso ..........................................................................................60
2.4.2 A curva ROC e a área sob a curva ................................................................62
2.5 TRABALHOS RELACIONADOS .........................................................................64
3 DESENVOLVIMENTO ...........................................................................................66
3.1 DEFINIÇÃO DO ESCOPO DE TRABALHO ........................................................66
3.2 SELEÇÃO DOS DADOS .....................................................................................68
3.3 PREPARAÇÃO DOS DADOS .............................................................................69
3.3.1 Transformação dos dados.............................................................................70
3.3.2 Limpeza e organização dos dados ...............................................................73
3.3.3 Ruídos incorporados aos dados...................................................................76
3.3 ESCOLHA DA TAREFA DE MINERAÇÃO DE DADOS ......................................77
3.4 DETERMINAÇÃO DO ALGORITMO DE MINERAÇÃO DE DADOS...................77
3.5 O AMBIENTE DE DESENVOLVIMENTO DO WEKA..........................................78
3.6 IMPLEMENTAÇÃO DO FLUXO DE CONHECIMENTO NO WEKA....................79
3.6.1 Configuração do ambiente KnowledgeFlow do WEKA...............................82
3.6.1.1 Configuração da Árvore de Decisão..............................................................84
3.6.1.2 Configuração da rede neural artificial............................................................86
3.7 ANÁLISE DOS RESULTADOS ...........................................................................91
3.7.1 Análise da matriz de contingência................................................................91
3.7.2 Análise da curva roc e a área sob a curva (AUC) ........................................93
3.7.3 A representação da árvore de decisão.........................................................94
4 CONCLUSÃO ........................................................................................................96
4.1 COMPARATIVO ENTRE O MÉTODO ATUAL E O PROPOSTO .......................96
4.2 OPORTUNIDADES DE PESQUISA FUTURA ....................................................97
4.3 CONSIDERAÇÕES FINAIS E RECOMENDAÇÕES...........................................98
REFERÊNCIAS.........................................................................................................99
APÊNDICE A – CÓDIGOS SQL .............................................................................105
APÊNDICE B – REMANEJO DE MEDIDORES .....................................................122
12
1 INTRODUÇÃO
Neste capítulo abordam-se: o objetivo deste trabalho, os métodos

empregados na busca do objetivo, a estrutura do trabalho e a correlação entre os
conhecimentos aplicados e as disciplinas cursadas durante o curso de Engenharia
Elétrica da Universidade do Vale do Rio dos Sinos (UNISINOS).
1.1 OBJETIVOS
Após a reestruturação do setor elétrico brasileiro, iniciada na década de 90,

diversas mudanças regulatórias ocorreram, visando refletir as inovações
tecnológicas e as mudanças ocorridas desde então no mercado consumidor. Dentre
algumas das mudanças no ambiente de mercado estão a expansão da população, o
aumento do poder aquisitivo e a redução no custo de equipamentos elétricos. Estes
fatores contribuem para o aumento do consumo de bens, incorrendo assim na
ampliação das cargas com características indutivas, gerando um aumento na
demanda de potência reativa.
Pelo caráter regulatório adotado no Brasil, as concessionárias de energia

elétrica devem buscar os melhores métodos de investimento, a fim de obter a
máxima eficiência dos ativos elétricos bem como alcançar a modicidade tarifária.
A utilização de cargas com baixo fator de potência conectadas ao sistema

introduz perdas na rede elétrica apresentadas como o aquecimento de condutores, o
excesso de carregamento de transformadores, dentre outros efeitos. Essas perdas,
conhecidas como perdas técnicas, são antagônicas à modicidade tarifária e
implicam em excesso de investimentos, gerando acréscimos nas tarifas de energia
dos consumidores. Como forma de regulação o governo repassa às concessionárias
de energia elétrica a possibilidade de tarifar esta demanda excedente de energia
reativa.
13
Assim como a expansão do mercado e dos consumidores, os dados

disponíveis nos sistemas informatizados aumentaram consideravelmente e o
trabalho humano nas áreas de análise e estatística tem evoluído em sintonia com os
novos sistemas e tecnologias para depuração desses dados.
O presente trabalho atua nos propósitos da modicidade tarifária, buscando os

melhores métodos de aplicação dos ativos. Seu objetivo, como objeto final de
trabalho de conclusão de curso, se traduz pela avaliação de duas técnicas de
mineração de dados empregadas na identificação do perfil de clientes para a
otimização do remanejo de medidores de energia reativa nas redes de baixa tensão.
Essas duas técnicas, que serão abordadas durante este trabalho, são:
- a árvore de conhecimento;
- a rede neural artificial.
A otimização apresentada neste trabalho foi realizada através do uso do

cadastro de consumidores do grupo “B”, atendidos em baixa tensão cuja instalação
elétrica seja trifásica, e do cruzamento dos dados com outras informações do
sistema elétrico da empresa AES Sul Distribuidora Gaúcha de Energia S.A..
Através da avaliação do presente trabalho, será possível verificar se as duas

técnicas de mineração de dados selecionadas para a tarefa representam uma
melhor prática para o remanejo adequado e eficiente dos medidores de energia
reativa. A principal motivação na busca de um método mais eficiente é a
possibilidade de realizar um trabalho de conscientização e melhora do fator de
potência das redes de energia elétrica nos locais identificados, postergando assim
investimentos desnecessários em expansão do sistema e reduzindo a carga nas
tarifas dos consumidores.
14
1.2 ESTRUTURA DO TRABALHO
Este trabalho se fundamenta em quatro capítulos: o capítulo introdutório

apresenta uma abordagem inicial sobre o uso eficiente dos sistemas de energia e o
objetivo da otimização do remanejo dos medidores de energia reativa. No segundo
momento, estrutura-se a teorização, em que os tópicos centrais abordam questões
da regulação do setor elétrico, do conceito de fator de potência, e dos conceitos da
descoberta do conhecimento. A terceira etapa traz a aplicação da mineração de
dados, enquanto no quarto capítulo, são demonstradas as apurações, os resultados
dos testes e as conclusões alcançadas.
1.3 RELAÇÃO COM DISCIPLINAS
A determinação para o desenvolvimento deste trabalho surgiu de uma

necessidade interna da AES Sul, aliada aos trabalhos práticos desenvolvidos nas
disciplinas de Inteligência Artificial, Métodos de Otimização e Circuitos Elétricos. O
trabalho é direcionado à avaliação de duas técnicas da mineração de dados, para a
otimização do remanejo de medidores de energia reativa.
15
2 FUNDAMENTAÇÃO TEÓRICA
Este capítulo apresenta uma síntese da bibliografia utilizada como

fundamentação teórica do presente trabalho. Serão fornecidas breves descrições
dos instrumentos de regulação do setor da distribuição de energia elétrica, de
relevância para o estudo; alguns fundamentos da eficiência energética, sob o
aspecto do fator de potência; os principais conceitos da descoberta de conhecimento
em banco de dados; um breve relato de um método de avaliação das técnicas de
mineração de dados e, ao final, uma introdução a dois métodos de classificação: as
redes neurais artificiais e a árvore de decisão.
2.1 O SETOR ELÉTRICO BRASILEIRO
O setor elétrico brasileiro passou por diversas mudanças em seu modelo de

gestão e regulação, grande parte destas transformações se tornou necessária,
devido à contínua modificação do ambiente social, político e econômico brasileiro.
Portanto, inicia-se este tópico, com um breve histórico dos fatos relevantes ao
contexto deste trabalho, no setor elétrico nacional.
2.1.1 A regulação do setor elétrico brasileiro
Em 1995, o governo brasileiro, através da Lei das Concessões, criou as

concessionárias de distribuição de energia elétrica, delegando a exploração desse
serviço público à iniciativa privada. Um ano depois, o governo brasileiro determinou
a criação de uma autarquia ligada ao Ministério de Minas e Energia - a Agência
Nacional de Energia Elétrica (ANEEL) - com a função de regular e fiscalizar a
geração, transmissão, comercialização e distribuição de energia elétrica. Em 2000,
surgiu a necessidade de atualizar as principais normas de fornecimento da energia
elétrica e uma parte dessas mudanças foi implementada pela Resolução nº 456 da
ANEEL, sendo um de seus objetivos, o aprimoramento do uso do sistema elétrico.
16
Em seu artigo 64, a Resolução nº 456 da ANEEL estabelece em 0,92 o limite

mínimo permitido do fator de potência para as instalações dos consumidores,
indicando ainda as formas de atuação das concessionárias no sentido de contribuir
para a manutenção deste patamar. Algumas explicações sobre a forma de cálculo e
o significado da energia reativa serão abordadas no próximo tópico.
Estabelecido esse limite do fator de potência, era necessário estabelecer

quais seriam as penalidades, quando comprovada a ineficiência energética da
unidade consumidora. Nesse sentido, o Artigo 34 da Resolução ANEEL N.º 456 de
29 de Novembro de 2000 veio determinar que (BRASIL, 2000):
O fator de potência das instalações da unidade consumidora, para efeito de

faturamento, deverá ser verificado pela concessionária por meio de medição
apropriada, observados os seguintes critérios:
I – unidade consumidora do Grupo “A”: de forma obrigatória e permanente;
e
II – unidade consumidora do Grupo “B”: de forma facultativa, sendo admitida
a medição transitória, desde que por um período de 7 (sete) dias
consecutivos.
Cabe esclarecer as definições de grupo “A” e grupo “B”, que podem ser
encontradas na Resolução supracitada. Nesta Resolução é determinado que os
clientes atendidos em tensão de fornecimento igual ou superior à 2,3 kV, ou mesmo
os clientes com entrada de energia subterrânea e atendidos abaixo desta tensão,
sejam enquadrados como clientes do grupo “A”, salvo algumas exceções da norma,
irrelevantes para este trabalho.
Os clientes de baixa tensão, supridos em tensão abaixo de 2,3 kV e citados

na referida Resolução como clientes do grupo “B”, formarão o objeto de aplicação do
estudo deste trabalho, visto que não há obrigatoriedade de instalação da medição de
energia reativa em todos os clientes deste agrupamento.
A forma de cálculo para o faturamento dos clientes do grupo “B” é

determinada pelo Artigo 66 da Resolução ANEEL nº 456 e segue a seguinte
metodologia (BRASIL, 2000):
17
 0,92 
FER = CA − 1TCA
 fm 
Onde:
FER = valor do faturamento total correspondente ao consumo de energia

reativa excedente à quantidade permitida pelo fator de potência de 0,92, no período
de faturamento;
CA = consumo de energia ativa medida durante o período de faturamento;
fm = fator de potência indutivo médio das instalações elétricas da unidade
consumidora, calculado para o período de faturamento;
TCA = tarifa de energia ativa, aplicável ao fornecimento;
Com base no que foi exposto, verifica-se que a instalação de um medidor

eletrônico com capacidade de medição de energia reativa em todas as unidades
consumidoras do grupo “B”, poderia contribuir na identificação dos consumidores de
energia reativa. Contudo, como será abordado no próximo tópico, por se tratar de
um tema atual, ainda em discussão dentro dos fóruns do setor, essa solução não
conta com estudos conclusivos que possam demonstrar a viabilidade econômico-
financeira e fomentar as discussões que já se fazem presentes.
2.1.2 A medição eletrônica em clientes atendidos em baixa tensão
A fim de entender porque as concessionárias de energia, de um modo geral,

não possuem planos de adoção da medição eletrônica em larga escala, cujas
multifunções poderiam incluir a medição de energia reativa, é preciso analisar o que
é debatido, atualmente, nos fóruns do setor elétrico relativos a esse assunto. Este
histórico inicia na fundamentação dos contratos de concessão, nos quais foi
determinado como referência contábil, o manual de contabilidade do setor elétrico
que, atualmente, é emitido pela ANEEL (BRASIL, 2007). Neste documento, constam
as taxas de depreciação de diversos equipamentos e bens, dentre os quais figuram
os medidores de energia elétrica com uma taxa de depreciação fixada em 4% ao
18
ano independentemente da adoção de um modelo eletrônico ou mecânico de

medidor (BARUDI, 2004). O conceito de depreciação contábil pode ser definido,
segundo Iudícibus, Marion e Pereira (2003 apud MAGALHÃES; MELLO;
BITENCOURT, 2006, p. 9) como:
[...] o declínio no potencial de serviços do imobilizado tangível e de outros

ativos não correntes, em função de deterioração física gradual ou abrupta,
consumo dos potenciais de serviços por meio de uso, mesmo que nenhuma
mudança física seja aparente, ou deterioração econômica por causa da
obsolescência ou de mudança na demanda dos consumidores.
A depreciação dos ativos das empresas de distribuição de energia elétrica no

Brasil é remunerada através da tarifa de energia que é cobrada dos clientes.
Portanto, se um ativo tem uma taxa de depreciação menor do que prevê a
remuneração nas normas do setor, significa que, antes de receber o benefício
completo pela utilização do ativo, a empresa terá que efetuar a substituição do
mesmo (BRASIL, 2008). A corroborar com isso, cabe o exposto pelo Diretor de
Regulação do Grupo Energias do Brasil, Ramos (2009, p.1):
[...] sobre a implantação de medidores eletrônicos, a regulamentação atual

pressupõe que a vida útil de um medidor seja de 25 anos, estabelecida com
base na tecnologia eletromecânica, sem previsão de valor diferenciado para
o medidor eletrônico.
Ainda, a Nota Técnica nº 0013/2009-SRD/ANEEL esclarece que (BRASIL,

2009):
Tendo como base a experiência internacional, verifica-se que a falta de

regulamentação acerca do tema pode dificultar a disseminação da medição
eletrônica em baixa tensão. A obrigatoriedade e a forma de implantação dos
medidores eletrônicos, a maneira de remuneração dos investimentos
necessários, as grandezas e parâmetros que serão apurados e a vida útil
regulatória são exemplos de questões que provocam incertezas ao
empreendedor e que necessitam ser analisadas pelo regulador. [...] A grande
maioria dos medidores eletrônicos implantados no mundo está localizada nos
países de clima temperado. Nessas condições, os fabricantes esperam uma
durabilidade não inferior a 15 anos. Os medidores eletrônicos em
funcionamento no Brasil foram instalados recentemente, logo, nada se pode
concluir quanto à sua durabilidade no clima tropical.
19
Verifica-se, portanto, que as concessionárias de energia e os órgãos de

regulação do setor estão em debate acerca da adoção em larga escala dos
medidores eletrônicos. O regulador aposta nos benefícios dos medidores
eletrônicos, como por exemplo, uma rede integrada de teleserviços de medição ou
mesmo as tarifas diferenciadas por faixas de horário, enquanto as concessionárias
defendem o estudo da vida útil dos equipamentos e o reflexo na base de
remuneração (MATTAR, 2008).
O estado prematuro dos estudos de viabilidade para a aplicação de medidores

eletrônicos em larga escala inibe os investimentos na instalação de medidores
eletrônicos de energia reativa nos consumidores de baixa tensão. Neste sentido, se
faz necessário otimizar o uso do atual parque de medidores eletrônicos que, por
estarem disponíveis em menor escala, precisam ser constantemente remanejados a
fim de identificar os locais com maior consumo de energia reativa e, assim, mais
propensos a apresentarem ineficiência no sistema elétrico (METERING, 2008). Ainda,
no Apêndice B, pode-se visualizar, de maneira generalizada, o processo de remanejo
de medidores de energia reativa.
Este trabalho se propõe a desenvolver uma avaliação do uso de dois métodos

de mineração de dados na otimização do remanejo de medidores de energia reativa
em clientes de baixa tensão com conexão trifásica à rede elétrica. O
desenvolvimento do trabalho utilizou o banco de dados dos clientes da Empresa
AES Sul Distribuidora Gaúcha de Energia S.A. e este acesso foi possível, pois, o
autor trabalha nesta Empresa. Por uma questão interna, atualmente, a AES Sul só
utiliza medidores de energia reativa em uma parcela dos consumidores conectados
através de uma ligação trifásica, limitando, assim, o escopo do trabalho a estes
clientes. Ainda, é importante salientar que os dados de identificação dos clientes não
foram inclusos na base de dados, restando somente os itens essenciais para
possibilitar a análise. O presente trabalho possibilitará avaliar o uso das técnicas e
métodos descritos, permitindo assim que a identificação dos clientes com maior
potencial de aplicação da medição de energia reativa seja mais efetiva.
20
2.2 O FATOR DE POTÊNCIA
Neste tópico serão abordados os conceitos básicos que envolvem o fator de

potência e o seu impacto para o sistema elétrico. Iniciamos este tópico com uma
definição de potência, as características das cargas e as componentes da potência.
A potência pode ser definida como uma grandeza que mede quanto trabalho
(conversão de energia de uma para outra forma) pode ser realizado em certo
período de tempo (BOYLESTAD, 1998).
A energia consumida nas indústrias, residências, etc, é composta

basicamente por cargas com características resistivas, capacitivas ou indutivas. O
fator de potência pode ser descrito como a defasagem existente entre a tensão e a
corrente sob a influência destas cargas. Em um circuito puramente resistivo, a
tensão e a corrente estão em fase. Em um circuito capacitivo, a corrente está
adiantada em relação à tensão, enquanto que em um circuito contendo cargas
indutivas, o efeito é inverso, com a corrente atrasada em relação à tensão
(BOYLESTAD, 1998). A forma de onda da tensão e corrente nestes três tipos de
carga podem ser visualizados através do Gráfico 1. Ainda, o Parágrafo XX do Artigo
2º da Resolução ANEEL nº 456 (BRASIL, 2000) define o fator de potência como a
“razão entre a energia elétrica ativa e a raiz quadrada da soma dos quadrados das
energias elétricas ativa e reativa, consumidas num mesmo período especificado”.
21
Gráfico 1 – Formas de onda da tensão e corrente

Fonte: Elaborado pelo autor
A potência elétrica é constituída de duas componentes, a potência ativa e a

potência reativa. A potência ativa é a que efetivamente realiza o trabalho, gerando
calor, luz, movimento, etc. A demanda de potência ativa é medida em quilowatts
(kW). A potência reativa é utilizada para criar e manter os campos eletromagnéticos
dos equipamentos elétricos como, por exemplo, os motores indutivos. A demanda de
potência reativa é medida em quilovolt-ampère-reativo (kvar).
Os motores elétricos de indução possuem as características de indutores que

absorvem a energia da rede. No entanto, esta energia não desenvolve nenhum tipo
de trabalho, pois é utilizada para suprir os campos eletromagnéticos, permitindo que
a energia ativa realize o trabalho eletromecânico traduzido pelo eixo do motor
(WILDI, 2000, tradução nossa).
A potência aparente, resultado da composição entre a potência ativa e

reativa, quando consideramos o ambiente puramente senoidal e composto por
cargas lineares, pode ser representada pela relação geométrica que existe entre
22
elas (WILDI, 2000, tradução nossa). Esta forma, conhecida como o triângulo das
potências, pode ser vista na Figura 1.
Figura 1 - Triângulo das potências

Os lados deste triângulo são relacionados pelo ângulo Ф, sendo o cosseno de

Ф chamado de fator de potência e expresso como segue:
P
FP = cos φ =
P + Q2
2
Onde:
FP = fator de potência que é adimensional
P = potência ativa expressa em Watts [W]
Q = potência reativa expressa em Volt-ampère-reativo [var]
O consumo de energia ativa e reativa em um sistema de distribuição, pode

ser visualizado no Gráfico 2, onde o consumo de energia ativa é expresso em
megawatts-hora (MWh) e o consumo de energia reativa, em megavolt-ampère-
reativo-hora (Mvarh). O sistema de registro horário é feito através da integralização
das maiores demandas encontradas em um determinado período. Este método é
utilizado pelas concessionárias de energia para realizar a medição e o faturamento
de seus consumidores. Para maiores esclarecimentos sobre os métodos de medição
ativa e reativa e, ainda, sobre o sistema de medição horária, uma boa fonte de
consulta pode ser encontrada em Medeiros (1997) e Brasil (2000).
23
Consumo de Energia Ativa
Consumo de Energia Reativa
Gráfico 2 - Curva do consumo ativo e reativo de energia

Fonte: AES SUL (2009)
Conforme informado anteriormente, o fator de potência mínimo admissível no

sistema elétrico brasileiro foi fixado pela ANEEL em 0,92. Um estudo realizado em
2008, pela Associação Brasileira da Indústria Elétrica e Eletrônica (ABINEE), revela
que a alteração do fator de potência para 0,95 elevaria a capacidade de transmissão
da energia no Brasil em 3,25% e que os ganhos seriam próximos aos ganhos
auferidos pela adoção do horário de verão brasileiro (VIEIRA, 2008). Ainda, Amorim
(2008) defende que a elevação do fator de potência para 0,95 poderia causar a
liberação de aproximadamente 2.000 MVA de geração de energia. Também, o
mesmo trabalho elenca o fator de potência regulamentar de alguns países, a título
de comparação:
País FP
Coréia 0,93
França 0,93
Portugal 0,93
Bélgica 0,95
Argentina 0,95
Alemanha 0,95
Suíça 0,95
Quadro 1 - Fator de potências em vários países
Fonte: AMORIM (2008)
24
A demanda de energia reativa em excesso causa prejuízos não somente aos

equipamentos geradores desta demanda, como também, ao longo do sistema
elétrico. No lado da demanda (consumidores), constata-se um maior aquecimento, a
perda de potência útil e, inclusive, a redução da vida útil dos equipamentos. No lado
do suprimento (concessionárias), há o aumento das perdas e a sobrecarga de
equipamentos (transformadores, cabos) devido à ocupação da capacidade de
condução de corrente com uma parcela de energia que não gera trabalho útil
diretamente (SANTOS, 2001).
No caso específico dos motores de indução, o fator de potência é diretamente

dependente da tensão de fornecimento. Se o motor estiver operando em regime de
subtensão, ou seja, uma tensão de fornecimento menor do que a sua nominal, a
corrente absorvida aumentará para que o torque seja mantido. Isso poderia causar
uma elevação na temperatura devido à elevação das perdas no rotor e no estator.
Esta característica intrínseca dos equipamentos de potência constante, caso dos
motores de indução, também reage ao regime de sobretensão, pois a corrente de
magnetização aumenta com uma proporção, no mínimo, quadrática. Nesse caso, o
rendimento e o fator de potência estariam reduzidos, enquanto que a perda no ferro
aumentaria. O Quadro 2 mostra maiores informações sobre os efeitos da tensão de
fornecimento nos motores de indução e seu efeito correlato para o fator de potência
(SANTOS, 2001):
Variação da tensão nominal

Característica
Sobretensão (110%) Subtensão (90%)
Torque de partida Aumenta em 21% Reduz em 19%
FP em plena carga Reduz 3 pontos Aumenta 1 ponto
FP com metade da carga Reduz em até 6 pontos Aumenta até 5 pontos
Corrente em plena carga Reduz 7% Aumenta 11%
Temperatura Reduz até 4ºC Aumenta até 7ºC
Capacidade de sobrecarga Aumenta 21% Reduz 19%
Quadro 2 - Desempenho de motores de indução em função da tensão aplicada
Fonte: SANTOS (2001)
25
2.2.1 A influência do ambiente brasileiro para o fator de potência
Um estudo de Andrade e Lobão (1997) demonstra que os efeitos trazidos

pelas mudanças no ambiente socioeconômico do Brasil, seja o aumento da renda
per capita ou a redução no preço de eletrodomésticos, causou uma expansão no
consumo de energia elétrica. Esta queda de preços pode ser visualizada no Gráfico 3.
Gráfico 3 – Índice de preços reais de eletrodomésticos

Fonte: ANDRADE; LOBÃO (1997)
Em Santos (2001), algumas importantes conclusões sobre a expansão do

mercado de eletrodomésticos nas diferentes classes de consumo foram elencadas.
Citam-se aqui alguns exemplos:
- as altas temperaturas aliadas à utilização em massa de computadores e

condicionadores de ar, bem como a expansão dos shopping centers e outros
locais de concentração de pessoas influenciam diretamente no consumo e na
qualidade da energia elétrica da classe comercial;
- o aumento das atividades de extração mineral e construção causaram o

aumento da utilização de motores e controladores de velocidade (por
exemplo, inversores de frequência) têm impactado o setor industrial;
26
- e no setor residencial houve a expansão no número de equipamentos

(televisores, condicionadores de ar, eletrodomésticos, etc) aumentando
assim, a distorção harmônica e trazendo consigo consequências para o fator
de potência.
Conforme Santos (2001), as cargas lineares são assim definidas em função

da Lei de Ohm, onde a corrente elétrica é proporcional à tensão aplicada dividida
pela impedância da carga. Materiais que mantém esta relação entre tensão e
corrente são ditos cargas lineares, assim, no caso onde a tensão aplicada à carga
seja senoidal, a forma de onda da corrente também será senoidal. Podemos verificar
este comportamento no Gráfico 4.
Gráfico 4 – Forma de tensão e corrente de uma carga linear

Algumas cargas não-lineares possuem a característica de operarem em dois

estados: condução e bloqueio. Estas cargas não-lineares, cujo comportamento da
forma de onda pode ser visualizado no Gráfico 5, estão presentes em diversos
equipamentos eletroeletrônicos (SANTOS, 2001). Um trabalho prático para
caracterizar dispositivos elétricos (lâmpadas, eletroeletrônicos, motores, etc.) como
cargas lineares ou não-lineares, pode ser encontrada em Pires (2006).
27
Gráfico 5 - Forma de tensão e corrente solicitadas por uma carga não linear
Quando as cargas são mistas, ou seja, um sistema composto por cargas

lineares e não lineares, deve-se modificar a forma de cálculo do fator de potência
devido às componentes de distorção da onda adicionadas pelas cargas não-
lineares. No trabalho de Souza, F. (2000) são demonstradas as equações para o
cálculo do fator de potência sob o efeito de cargas não-lineares.
No Quadro 3 é possível verificar a relação entre a distorção harmônica -

também causada pela presença de cargas não-lineares que alteram a forma de
onda senoidal - e o fator de potência. Ou seja, o aumento dos dispositivos
eletrônicos de controle e a adoção de reatores nas lâmpadas fluorescentes têm
levado a um ganho da eficiência em troca do decréscimo do fator de potência
(PENNA et al. 2001).
Quadro 3 – Influência dos harmônicos na corrente e fator de potência

Fonte: PIRES (2006)
28
Ainda, o estudo realizado por Penna et al. (2001), em que foram investigados
os efeitos da redução da potência ativa através da substituição de lâmpadas
incandescentes por lâmpadas fluorescentes compactas, demonstra que, em
determinadas situações, existe a degradação do fator de potência e o aumento das
correntes harmônicas. Isto implica que, em alguns casos de aplicação dos
programas de eficiência energética, as medições da carga liberada no sistema
podem indicar um valor aquém do esperado.
Todos os fatos supracitados possuem um impacto direto na necessidade de

investimentos, dentre os quais podem-se citar alguns exemplos:
- obras de expansão do sistema para atender locais com transformadores

e/ou condutores em sobrecarga;
- instalação de bancos capacitores ao longo da rede;
- manobra de circuitos atendendo à demanda com sistemas em menor nível

de carregamento.
Em Amorim (2008) e Weg (2007) faz-se possível consultar referências sobre

como é realizado o procedimento de correção do fator de potência de uma rede
elétrica quanto às características indutivas ou capacitivas da instalação, seja uma
residência, uma indústria ou mesmo uma rede de distribuição de energia.
Ainda, conforme Santos (2001), as distorções e assimetrias do sistema não

são levadas em conta na equação de faturamento da energia reativa citada na
seção 2.1.1 do presente trabalho. Também, Ludovico (2009), informa que os atuais
medidores de energia reativa, empregados na medição de baixa tensão, não
absorvem os efeitos das distorções harmônicas, utilizando somente a componente
fundamental da onda senoidal pura para o registro.
29
2.3 O PROCESSO DE DESCOBERTA DO CONHECIMENTO
Desde que os sumérios – povo que vivia entre os rios Tigre e Eufrates, em
torno de 55.000 anos atrás - inventaram a inscrição de dados, através de gravações
em tábuas de barro, as pessoas vêm tentando compreender e tirar proveito da
coleta de dados (PYLE, 1999, tradução nossa). O advento dos meios de
armazenagem da informação trouxe consigo uma quantidade de dados, nunca antes
verificada na história, que variam desde uma simples transação em um
supermercado, até os registros das companhias aéreas sobre os destinos mais
frequentes de seus passageiros, fluindo para bancos de dados cada vez mais
poderosos. Contudo, essa massa digital tornou-se tão grande que, dificilmente,
algum analista poderia usufruir de toda a informação guardada. Neste ambiente de
contínuo desenvolvimento, o aumento do poder de processamento das informações
e os avanços dos métodos estatísticos trouxeram a combinação que resultaria nos
primórdios de mineração de dados1 para a descoberta de conhecimento2 (CIOS;
PEDRYCZ; SWINIARSKY, 1998, tradução nossa).
A primeira citação formal do conceito de descoberta do conhecimento é

atribuída a Frawley, Piatetsky-Shapiro e Matheus (1991 apud CIOS; PEDRYCZ;
SWINIARSKY, 1998, p. 2, tradução nossa) que estabelecem que “a descoberta do
conhecimento em banco de dados é o processo não trivial de identificar, nos dados,
padrões válidos, inéditos, potencialmente úteis, e entendíveis”.
Fayyad et al. (1996, tradução nossa) oferecem uma visão prática do processo
de descoberta do conhecimento em bancos de dados, conforme se evidencia na
Figura 2.
1
Termo na língua inglesa: data mining
2
Termo na língua inglesa: knowledge discovery
30
Interpretação
Avaliação
Mineração
Transformação Conhecimento
Limpeza
Seleção
Banco de dados
Figura 2 – Visão geral do processo de descoberta do conhecimento

Fonte: Adaptado de FAYYAD et al. (1996)
Ainda, através da análise da Figura 2, pode-se enumerar os passos básicos

do processo de descoberta do conhecimento (FAYYAD et al., 1996, tradução
nossa):
1) Determinar o domínio do problema, os objetivos do usuário e especificar

qual é o conhecimento prévio necessário para o escopo escolhido;
2) Selecionar os critérios e atributos disponíveis em uma determinada parcela

do banco de dados que seja relevante para a tarefa;
3) Através da formatação, limpeza e pré-processamento dos dados, é

possível analisar se há ocorrência de dados faltantes, tipos de ruídos nos
dados, etc.;
4) Uma etapa de redução de dados pode ser útil ou mesmo necessária,

aplicando técnicas como a redução das dimensões da base de dados ou os
métodos de transformação dos dados;
5) Neste passo é tomada a decisão de qual será a tarefa de mineração de

dados mais apropriada e o algoritmo a ser aplicado na base de dados. Após
31
definidos esses elementos, é realizada a aplicação das técnicas e, como

produto da mineração dos dados, tem-se a extração do modelo;
6) A interpretação e a avaliação dos padrões e/ou informações extraídos

podem levar à conclusão de que a repetição de todos os passos seja
necessária, aplicando assim mais uma iteração na tentativa de convergir à
solução adequada aos objetivos;
7) E, por fim, a consolidação do conhecimento pode ocorrer de diversas

maneiras: através da aplicação do conhecimento descoberto a um sistema;
através da documentação do processo; e/ou através da publicação para que a
comunidade tenha conhecimento dos resultados encontrados.
Desse modo, verifica-se que o processo de mineração de dados é uma etapa,

dentro do processo de descoberta do conhecimento. É importante observar que,
conforme citam Cios, Pedrycz e Swniarsky (1998, p. 3, tradução nossa), “os termos
de mineração de dados e a descoberta do conhecimento algumas vezes são
trocados”, contudo o processo de “[...] descoberta do conhecimento inclui os
métodos de mineração de dados como subprocessos [...]”.
2.3.1 Inteligência artificial
A inteligência artificial é um ramo de pesquisa que reúne diversas áreas do

conhecimento. Embora paralisada por muito tempo devido a insucessos ocorridos,
trouxe alguns importantes resultados nas últimas décadas.
Dois resultados importantes das pesquisas no campo da inteligência artificial

foram os sistemas especialistas e o aprendizado de máquina3. Estes sistemas,
embora não ofereçam uma visão clara do domínio de uso, podem ser reunidos como
aplicações dos sistemas de inteligência artificial.
3
Termo na língua inglesa: Machine Learning
32
O sistema especialista é um método desenvolvido para agrupar o

conhecimento de especialistas. Seu principal atributo é a fácil visualização das
regras que compõem seus critérios de decisão, entretanto, a difícil tarefa de
extração inicial do conhecimento dos especialistas humanos e a posterior
atualização deste conhecimento tornaram o sistema limitado. Neste sentido, as
pesquisas no campo dos sistemas de aprendizagem de máquina têm evoluído
constantemente (GONZÁLEZ, 2003).
Os algoritmos de aprendizagem de máquina são sistemas que utilizam os

métodos de aprendizagem artificial. Nos próximos tópicos este tema será abordado
de forma mais específica.
Conforme González (2003, p. 110) cita, buscando a interligação entre a

descoberta de conhecimento e a inteligência artificial, “estas duas grandes áreas
tem visões diferentes, mas não são dissociadas”. Enquanto o foco da inteligência
artificial é a busca de uma inteligência, a descoberta de conhecimento busca o
conhecimento das regras, padrões. Assim, estes métodos podem ser reunidos em
torno de ferramentas e, portanto, complementar-se (GONZÁLEZ, 2003).
2.3.2 Mineração de dados
De acordo com Weiss e Indurkhya (1998, tradução nossa), a definição de

mineração de dados é a procura de informações úteis em bases de dados de grande
escala, com uma sinergia entre os especialistas humanos, que são eficazes na
análise, e o processamento computacional, que tem a atribuição de movimentar um
grande volume de dados. Os métodos utilizados pela mineração de dados aplicados
à descoberta de conhecimento podem ser utilizados para dois objetivos: a predição
de dados ou a descrição de dados.
A predição de dados é utilizada quando o conhecimento característico de um

determinado padrão já é conhecido. Com esse perfil bem definido, o banco de dados
é analisado com o objetivo de descobrir outros casos similares e fornecer previsões
33
deste padrão conhecido. Algumas de suas aplicações são as detecções de fraudes

no sistema financeiro, a análise de investimentos e aplicações no sistema de saúde
(WEISS; INDURKHYA, 1998, tradução nossa). De forma análoga, Fayyad et al.
(1996, p. 12, tradução nossa) defendem que a “predição envolve o uso de algumas
variáveis ou campos do banco de dados para predizer valores desconhecidos ou
futuros de outras variáveis de interesse”. Uma abordagem mais profunda sobre a
predição de dados pode ser encontrada em Weiss e Indurkhya (1998).
A descrição de dados é utilizada, quando a aplicação ainda é imatura e se

desconhecem as correlações que permeiam os dados. Se uma grande quantidade
de conhecimento sobre os dados estiver disponível, uma busca através de
ferramentas estatísticas poderá levar a resultados satisfatórios; no entanto, quando
essas regras forem parcial ou totalmente desconhecidas, as aplicações das técnicas
de descoberta do conhecimento poderão levar a alguma inteligência sobre os dados.
Um exemplo clássico deste processo de descoberta do conhecimento é a
descoberta de padrões de consumo em clientes de supermercados, na busca de
associações entre produtos comprados ou não.
No Quadro 4, constam algumas das técnicas de mineração de dados e suas

aplicações nas diferentes tarefas da mineração de dados.
Algoritmo / Tarefa Classificação Estimativa Predição Agrupamento Descrição

Estatística aplicada X X X X X
Análise cesta de mercado X X X
Dedução baseada em memória X X X
Algoritmos genéticos X X
Detecção de agrupamentos X
Análise relacional X X
Árvore de decisão X X X X
Redes neurais X X X X
Quadro 4 – Algoritmos e tarefas de mineração de dados

Fonte: Adaptado de BERRY; LINOFF (1997)
Este trabalho, como será abordado posteriormente, utilizará os conceitos da

classificação de dados; como referência mais ampla sobre as tarefas da mineração
de dados pode-se pesquisar em Hand, Mannila e Smyth (2001).
34
2.3.2.1 Classificação de dados
A classificação consiste no aprendizado, através da classificação dos dados

em categorias (classes), baseado nas propriedades (atributos) comuns entre um
conjunto de objetos. Entre os métodos de classificação de dados, está uma área do
conhecimento conhecida como aprendizado de máquina que, através de diversas
técnicas, auxilia no processo de descoberta do conhecimento.
2.3.3 O aprendizado de máquina
O aprendizado de máquina é uma área de estudo e pesquisa que visa ao “[...]

desenvolvimento de métodos computacionais que implementem várias formas de
aprendizado, em particular mecanismos capazes de induzir conhecimento a partir de
exemplos ou dados” (MICHALSKI; BRATKO; KUBAT, 1998, p. 3, tradução nossa).
Para que se desenvolvam, neste trabalho, as técnicas do aprendizado de máquina,
cabe uma conceituação do que é o aprendizado.
O processo de aprendizagem é abordado por várias áreas do conhecimento

e, ainda hoje, é difícil definir o conceito do processo de aprendizagem. Dentre as
várias áreas interessadas estão: a psicologia, a educação, a engenharia, a
computação, a filosofia, a neurobiologia, etc. Assim, será adotado um conceito que
está no escopo deste trabalho, evidenciado por Mitchell (1997, p.2, tradução nossa):
Definição: Um programa de computador é dito que aprendeu de uma

experiência E com relação a alguma classe de tarefas T e à uma medida de
performance P, caso sua performance nas tarefas em T, como nas medidas
de P, tenha melhorado com a experiência E.
A tarefa de um sistema de aprendizado de máquina é descrever um conceito

a partir de um grupo de exemplos fornecido por um professor e através do
conhecimento adquirido previamente. Os conceitos podem ser positivos ou
negativos. É essencial que um sistema deste tipo possua a capacidade de aprender
35
a partir de uma base de dados que contenha ruídos (erros ou imperfeições) nos
dados. Na Figura 3, vê-se um diagrama do aprendizado de máquina, com suas
entradas (positivas ou negativas) e suas saídas (MICHALSKI; BRATKO; KUBAT,
1998, tradução nossa):
Figura 3 – Tarefa do aprendizado de máquina

Fonte: Adaptado de MICHALSKI; BRATKO; KUBAT (1998)
Para que se identifique que um sistema de aprendizado de máquina esteja

adquirindo experiência, a partir de um conjunto de exemplos (conhecido como
conjunto de treinamento), é necessário testá-lo com outro agrupamento de exemplos
(conhecido como conjunto de teste). No tópico que segue, observa-se como dividir
um conjunto de dados entre dados de teste e dados de treinamento.
2.3.3.1 Conjunto de treinamento e teste
Em problemas de classificação de dados, é natural definir a performance de

um método de aprendizado de máquina em termos de sua taxa de erro. Esta taxa de
erro é medida pela quantidade de erros de classificação sobre a quantidade total de
exemplos do banco de dados.
Contudo, depois de realizado o treinamento do sistema e conhecido os

padrões que regem os dados do conjunto de treinamento, é necessário avaliar a
performance do sistema em um conjunto de dados novos. Isto é necessário, pois,
avaliar um sistema utilizando os mesmos dados a partir do qual se obteve
experiência, refletirá uma taxa de erro muito otimista (WITTEN; FRANK, 2000,
tradução nossa).
36
Para determinar a taxa de erro em um sistema classificador, utiliza-se outro

conjunto de dados chamado de conjunto de teste. Geralmente, os sistemas de
mineração de dados, reservam dois terços da base de dados para ser utilizada no
treinamento do sistema de aprendizado de máquina e, outro um terço, no teste do
sistema. Este processo, ao escolher quais exemplos de uma base de dados serão
utilizados para treinamento ou teste, é realizado de forma aleatória e, é também,
conhecido como um procedimento de reserva dos dados4 (WITTEN; FRANK, 2000,
tradução nossa).
No entanto, ao realizar um procedimento de escolha aleatória dos dados,

existe o risco de uma ou mais classes serem excluídas do conjunto de teste ou do
conjunto de treinamento. Por exemplo, em um método para classificar a cor de
determinado objeto a partir de um conjunto de exemplos, o conjunto de treinamento
é selecionado pelo processo aleatório e a cor vermelha não é selecionada. O
resultado, quando aplicado o conjunto de teste, seria um acréscimo da taxa de erro
por um problema de distribuição das classes entre o conjunto de treinamento e teste.
Para que se possa distribuir, corretamente, os conjuntos de treinamento e

teste, é necessário realizar uma estratificação dos dados, de forma a garantir que a
distribuição das classes esteja uniforme entre o conjunto de teste e de treinamento.
Uma técnica estatística, conhecida como validação cruzada5, pode ser utilizada em
conjunto com a estratificação dos dados. Esta técnica geralmente é aplicada
utilizando dez partições6 e possui o seguinte algoritmo (WITTEN, FRANK, 2000,
tradução nossa):
1. Os dados são divididos randomicamente em dez partições;
2. Em cada partição, a classe é distribuída na mesma proporção da base de

dados completa;
4
Do inglês, holdout procedure, tradução nossa
5
Do inglês, Cross Validation, tradução nossa
6
Do inglês, Ten Fold Cross Validation, tradução nossa
37
3. Em um turno, uma partição é reservada e as outras nove partições são

utilizadas para o treinamento;
4. A taxa de erro é calculada sobre a partição que ficou de fora do processo

neste turno;
5. O algoritmo repete os passos 3 e 4 outras nove vezes, para que todas as

partições sejam aplicadas no conjunto de teste;
6. Ao totalizar dez turnos de treinamento, é calculada uma taxa de erro

médio do método de classificação dos dados.
Neste trabalho emprega-se o método das dez partições, com validação

cruzada e estratificação dos dados, buscando, assim, uma maior confiabilidade da
taxa de erro. Após a construção destes conjuntos de treinamento, validação e teste,
devem-se especificar quais técnicas serão utilizadas para a implementação. Dentre
os algoritmos mais utilizados para a classificação de dados, estão as árvores de
decisão e as redes neurais artificiais (SOUZA, M., 1998).
2.3.3.2 Árvores de decisão
Em algumas aplicações da mineração de dados, o que realmente importa é a

precisão do modelo, sendo relegada a um segundo plano, a forma como o modelo
alcança esta precisão. Um exemplo de uma aplicação em que é necessário
conhecer as regras que chegaram à determinada conclusão é a análise de crédito,
na qual se torna necessário saber o porquê, nos casos em que o crédito para
determinada pessoa não foi aprovado. As árvores de decisão7 fornecem, de maneira
clara e objetiva, as regras para a tomada de decisão. Nesta seção, estrutura-se uma
breve introdução ao método de composição das árvores de decisão, restringindo-se
aos algoritmos ID3 e C4.5 desenvolvidos por Quinlan (1993 apud CIOS; PEDRYCZ;
SWINIARSKI, 1998, tradução nossa) e utilizados neste trabalho. Para uma
7
Do inglês, Deciosion Trees, tradução nossa
38
abordagem mais ampla sobre os diferentes algoritmos disponíveis para o método

das árvores de decisão, uma boa fonte de informações pode ser encontrada em
Berry e Linoff (1997).
As árvores de decisão são representadas por uma raiz, nós, ramos e folhas,
conforme é possível verificar na Figura 4. A raiz, geralmente, é posicionada no topo
do gráfico e os ramos conectam a raiz à primeira camada de nós. O nó pode ser
visualizado como uma espécie de pergunta, que busca discriminar a base de dados
da melhor forma possível, através dos atributos contidos na base de dados. Os
ramos continuam crescendo a partir desses nós, e subdividindo esta árvore em
vários nós, até alcançar as folhas, na base do gráfico. As folhas são as classes e
podem ser entendidas como uma caixa, onde os casos estão classificados (BERRY;
LINOFF, 1997, tradução nossa).
Pressão
Sanguínea
Normal Alta
TESTE 1 TESTE 3
Presente Ausente Presente Ausente
TESTE 2 Negativo Negativo Positivo
Ausente Presente
Positivo Negativo
Figura 4 – Exemplo de árvore de decisão

Fonte: Adaptado de CIOS; PEDRYCZ; SWINIARSKI (1998)
39
2.3.3.2.1 O algoritmo ID3
O algoritmo ID38 foi desenvolvido com base no modelo psicológico, que

descreve os processos utilizados pelas pessoas quando aprendem conceitos
simples. Este modelo psicológico foi desenvolvido por Hunt et al. (1966 apud CIOS;
PEDRYCZ; SWINIARSKI, 1998, tradução nossa) e é conhecido como CLS9.
O algoritmo ID3 usa a entropia de Shannon como critério para achar as

características mais significantes ou mais discriminatórias na base de dados,
também conhecido como o método de Procura Espacial de Hipóteses10. Este
método realiza uma procura em todo o espaço de hipóteses, construindo árvores em
uma escala cada vez maior de complexidade, com a finalidade de acomodar todo o
conjunto de treinamento em seus ramos, nós e folhas (MITCHELL, 1997, tradução
nossa). Para listar os passos do algoritmo, supõe-se um conjunto de treinamento S,
contendo n exemplos que pertencem à C classes, contendo exemplos positivos e
negativos; o algoritmo tem por objetivo quebrar a base de dados em subdivisões
seguindo o seguinte procedimento, estruturado, hierarquicamente, conforme a
numeração:
1 - Criar o nó raiz contendo todos os exemplos da base de dados de

treinamento;
2 - Se todos os exemplos forem positivos ou todos forem negativos o

algoritmo para e cria uma árvore com somente um nó;
3 - Caso os exemplos contenham casos positivos e negativos, então:
3.1 - Seleciona-se o atributo F que tem o maior valor para o ganho de

informação;
3.2 - Para cada valor fi, do domínio de atributos F:

8
Sigla para Iterative Dichotomiser 3
9
Sigla para Concept Learning System
10
Do inglês, Hypothesis Space Search, tradução nossa
40
3.2.1 - Adiciona-se um novo ramo para este atributo F=fi;
3.2.2 – Localiza-se, no final deste ramo, um nó onde serão

armazenados todos exemplos que atendam F=fi;
3.2.3 - Se este nó estiver armazenando exemplos de uma só

classe (todos positivos ou todos negativos), então transforma-se
este nó em uma folha;
3.2.3.1 - Senão, adiciona-se um novo ramo a partir deste

nó e segue-se para o passo 3.
2.3.3.2.2 O ganho de informação e a entropia
Na teoria da informação, Shannon utiliza a entropia para definir a quantidade

de informação contida em uma mensagem (CHIU et al., 2001, tradução nossa).
Quinlan (1993 apud CIOS; PEDRYCZ; SWINIARSKI, 1998, tradução nossa) utilizou
esta medida para calcular o ganho de informação, ao separar a base de dados de
um conjunto de exemplos, através da discriminação de seus atributos. A entropia,
para um sistema com duas categorias de classificação, pode ser calculada como:
p p n n
entropia ( S ) = − log 2 − log 2
S S S S
Onde:
S são os exemplos da base de dados;
p são os exemplos positivos (categoria positiva)
n são os exemplos negativos (categoria negativa)
O ganho de informação mede a eficiência de um atributo calculando a

redução da entropia causada pelo particionamento da base de dados e é calculada
da seguinte forma:
41
SV
GI ( S , F ) = entropia( S ) − ∑ entropia( SV )
V S
Onde:
GI é o Ganho de Informação
F é um determinado atributo;
SV é um subconjunto de S onde F assume um determinado valor v
v é um valor assumido em um determinado atributo
Contudo, quando se avalia um determinado atributo que pode conter vários

valores diferentes e únicos, o critério do ganho de informação gera um elevado
número de ramificações desnecessárias. Como exemplo, cita-se o caso de um
banco de dados de um cinema onde, aplicado o critério do ganho de informação, o
primeiro nome das pessoas poderia levar a várias subdivisões de pouca importância.
Assim, Quinlan aprimorou seu código ID3, conhecido como C4.5, para incluir um
novo critério de discriminação de atributos (BERRY; LINOFF, 1997, tradução nossa).
Este novo critério ficou conhecido como a taxa de ganho de informação e, conforme
cita Mitchell (1997, p.57, tradução nossa), pode ser interpretado “[...] como uma
medida da impureza em uma coleção de exemplos de treinamento”. Este indicador
pode ser calculado pela equação (CIOS; PEDRYCZ; SWINIARSKI, 1998, p.251,
tradução nossa):
GI ( S , F )
TGI ( S , F ) =
S S
− ∑ V log 2 V
V S S
Onde:
TGI é a taxa de ganho de informação
GI é o Ganho de Informação
F é um determinado atributo;
SV é um subconjunto de S onde F assume um determinado valor v
v é um valor assumido em um determinado atributo
42
2.3.3.2.3 O algoritmo C4.5
O algoritmo C4.5 recebeu vários aprimoramentos além da adoção da Taxa de

Ganho de Informação, citada anteriormente. Dentre os aprimoramentos, o C4.5
possui a capacidade de montar a árvore de decisão mesmo quando existem valores
ausentes nos atributos e utiliza uma técnica chamada de windowing como forma de
reduzir a necessidade de memória alocada para o processo. A técnica de poda da
árvore, a ser abordada no próximo tópico, foi implementada para melhorar a
capacidade de generalização do algoritmo (CIOS; PEDRYCZ; SWINIARSKI, 1998,
tradução nossa).
2.3.3.2.4 A poda da árvore de decisão
Quando uma árvore de decisão é construída, dependendo da quantidade e da

distribuição dos dados, pode haver ramificações muito extensas e com pouca
capacidade de generalização. O algoritmo C4.5 realiza a eliminação de nós, método
também conhecido como poda, através de duas operações: a substituição de
subárvores11 e o crescimento de subárvores12.
A substituição de subárvores de uma árvore de conhecimento inicia das

folhas em direção à raiz. É um processo no qual um determinado ramo é substituído
por uma folha, que incorpora os casos que antes estavam distribuídos. Pode-se
comparar a Figura 5 e a Figura 6, que apresentam um exemplo de árvore de
decisão, e verificar que todo o ramo com a regra Aumento Salário ≤ 2,5% foi
substituído por uma simples folha chamada “Ruim”.
11
Do inglês, subtree replacement, tradução nossa
12
Do inglês, subtree raising, tradução nossa
43
Figura 5 – Árvore de decisão de negociação salarial

Fonte: Adaptado de WITTEN, FRANK (2000)
Figura 6 – Árvore de decisão com a substituição de subárvores

Fonte: Adaptado de WITTEN; FRANK (2000)
Já o crescimento de subárvores ocorre quando um determinado conjunto de

dados é reclassificado em outro nó da árvore. Verifica-se na Figura 7 e Figura 8, a
ação da técnica de crescimento de subárvores onde, os exemplos anteriormente
classificados como 1,2 e 3 na Figura 7, foram reclassificados, de foram a gerar os
44
três novos conjuntos da Figura 8, 1’, 2’ e 3’. Pode-se entender, conforme Witten e
Frank (2000, tradução nossa), que o ramo C cresceu, de forma a englobar o ramo B.
A A
B
C
4 5
C
1 2 3 1' 2' 3'
Figura 7 – Árvore de decisão Figura 8 – Crescimento de subárvores

Fonte: Adaptado de WITTEN; FRANK (2000) Fonte: Adaptado de WITTEN; FRANK (2000)
Para efetuar os procedimentos de poda de uma árvore de decisão, é

necessário adotar algum critério para que seja avaliado o desempenho das
mudanças efetuadas pelo algoritmo. O critério adotado pelo algoritmo C4.5 é a
estimativa da taxa de erro calculada sobre os dados de treinamento, através de um
dado intervalo de confiança, definido pelo operador do algoritmo.
2.3.3.3 Redes neurais artificiais
Embora a busca pelo conhecimento do cérebro humano tenha iniciado há

milhares de anos, a pesquisa moderna no campo das redes neurais teve seu início
em um trabalho publicado pelo psiquiatra McCulloch e pelo matemático Pitts, em
1943. Esse estudo foi baseado nas descrições da estrutura cerebral publicada por
Ramón e Cajál (1911 apud HAYKIN, 2001) que introduziu a idéia dos neurônios
como constituintes do cérebro. Aqui, destaca-se uma breve descrição da
composição básica de um neurônio biológico e, em seguida, um detalhamento da
teoria das redes de neurônios artificiais (HAYKIN, 2001).
45
2.3.3.3.1 O modelo de neurônio biológico
O sistema nervoso humano pode ser dividido através de três fases de

tratamento da informação, conforme demonstrado na Ilustração 1, na qual
identificam-se, através de um diagrama de blocos, as entradas (estímulos), as
saídas (respostas), assim como a interface responsável pela interpretação da
informação de entrada, resultando em um sinal de saída para os atuadores. Esta
interface, identificada pela rede neural é o cérebro humano (HAYKIN, 2001).
Ilustração 1 – Esquema básico do sistema nervoso

Fonte: Adaptado de HAYKIN (2001)
Embora, atualmente, haja uma vasta documentação do mapeamento cerebral

e sua forma de funcionamento, o tratamento computacional utiliza os modelos
básicos do neurônio, conforme verificado na Ilustração 2. Aí, tem-se a identificação
das sinapses, do axônio, dos dentritos e do corpo celular em uma representação
conhecida como célula piramidal, que é um dos tipos mais comuns de neurônios
corticais (HAYKIN, 2001).
Os dentritos compõem a camada de entrada de um neurônio e são

responsáveis por receber os sinais oriundos de outros neurônios e/ou de outras
células sensoriais através de uma membrana conhecida como membrana pós-
sináptica. A soma é o corpo celular que abriga o núcleo do neurônio, e onde,
efetivamente, é realizado o processamento como uma etapa decisória. Essa decisão
será processada com base nos sinais de entrada das células sensoriais. Sua
propagação, conhecida como impulsos nervosos ou potenciais de ação, é realizada
pelos axônios que são saídas ramificadas com terminações sinápticas. Alguns
46
desses axônios podem se estender ao longo do corpo humano atingindo vários

metros (HAYKIN, 2001).
Ilustração 2 – A célula piramidal

Fonte: HAYKIN (2001)
As sinapses são as unidades de conexão elementares para a mediação entre

os neurônios, e o tipo mais comum é a sinapse química em que ocorre um processo
entre duas membranas para a transmissão do sinal. Na região intersináptica, o
estímulo nervoso que chega através da membrana pré-sináptica, oriunda de outra
célula, é transferido à membrana pós-sináptica (dentritos) através de substâncias
conhecidas como neurotransmissores. O resultado é a alteração do potencial
elétrico da membrana dentrital que pode ocorrer em dois modos: excitação ou
inibição (KOVÁCS, 1996). Quando esta região intersináptica atinge seu equilíbrio
químico entre íons de sódio, potássio, cálcio e íons orgânicos negativamente
carregados, a membrana atinge um estado conhecido como potencial de repouso,
47
mantido por um processo conhecido como bomba de sódio e caracterizado por

apresentar um potencial elétrico de aproximadamente -70 mV entre a região interna
da membrana e a região externa (FREEMAN; SKAPURA, 1992, tradução nossa).
A condição de disparo ocorre quando um impulso nervoso excitatório

transmite uma despolarização suficientemente acentuada para cruzar o limiar de
disparo. A integralização das várias entradas do neurônio possui uma propriedade
conhecida por integração espacial-temporal dos estímulos. Na Figura 9 visualiza-se,
na parte superior, o efeito das várias entradas em um neurônio típico e na parte
inferior da figura é demonstrado o efeito das várias entradas até o cruzamento do
limiar de disparo (KOVÁCS, 1996).
Figura 9 – O limiar de disparo de um neurônio

Fonte: KOVÁCS (1996)
48
2.3.3.3.2 Notas históricas sobre o desenvolvimento das redes neurais
Nesta etapa da pesquisa, faz-se um breve relato dos principais

acontecimentos históricos, até o desenvolvimento do objeto de estudo deste
trabalho: a rede de múltiplas camadas alimentada adiante, utilizando o algoritmo de
retropropagação do erro.
O estudo moderno das redes neurais iniciou em 1943, com a teoria de

McCulloch-Pitts, pioneira ao descrever como uma rede neural funcionaria através de
cálculos lógicos. O trabalho destes dois cientistas despertou a pesquisa em diversas
áreas do conhecimento, como o trabalho desenvolvido em 1949, por Hebb, em seu
livro, The Organization of Behavior. Na obra, o autor sugere a resposta da pergunta:
como nós aprendemos? (FREEMAN; SKAPURA, 1992, tradução nossa). Nesse
trabalho, Hebb postula a primeira regra de aprendizado auto-organizado.
Em 1958, Rosenblatt propôs a utilização do Perceptron como o primeiro

modelo para a aprendizagem supervisionada (HAYKIN, 2001).
Em 1961, surgiu a primeira crítica consistente ao modelo do Perceptron de

Rosenblatt, através dos trabalhos de Minsky e Selfridge. A partir daí, Minsky e
Papert trabalharam na formulação matemática, publicada em 1969 no livro
Perceptrons: An Introduction to Computational Geometry, para provar
matematicamente as limitações do Perceptron quanto à sua incapacidade de
generalização. Um dos pontos abordados pelos autores, menciona que o Perceptron
poderia diferenciar somente padrões linearmente separáveis, atingindo assim
limitações na capacidade de resolução de problemas. No livro também foi sugerido
que os testes fossem estendidos às redes multicamadas, lançando várias dúvidas
quanto ao futuro das pesquisas na área de redes neurais (HAYKIN, 2001).
Somente a partir de 1980 as pesquisas com redes neurais foram retomadas,

ressurgindo com diversos trabalhos importantes como as redes de Hopfield em 1982
e as redes de Kohonen, neste mesmo ano. Em 1983, surgiu o desenvolvimento de
uma técnica chamada Recozimento Simulado, desenvolvida por Korkpatrick, Gelatt
49
e Vecchi. Formulada para resolver problemas de otimização, foi uma das alavancas
para o desenvolvimento de outros trabalhos importantes como a Máquina de
Boltzmann, de Ackley, Hinton e Sejnowski, em 1985, que demonstrava a falta de
embasamento no trabalho de Minsky e Papert e renovou a motivação na pesquisa
de redes neurais. Em 1986, o algoritmo de aprendizagem por retropropagação
(backpropagation) foi publicado por Rumelhart, Hinton e Williams atraindo a atenção
de diversas pesquisas para este campo (HAYKIN, 2001).
2.3.3.3.3 O neurônio artificial
Neste momento do trabalho, aborda-se a estrutura do neurônio artificial

proposto por McCulloch-Pitts com o modelo de aprendizagem de Rosenblatt, para
que, posteriormente, se contemplem as demais componentes das redes neurais
artificiais.
Conforme Freeman e Skapura (1992, p. 12, tradução nossa), a teoria de

McCulloch-Pitts está fundamentada em cinco premissas:
1. A atividade de um neurônio é um processo de tudo ou nada.

2. Um certo número fixo de sinapses (>1) precisa ser excitada em um
período latente de adição para um neurônio ser excitado.
3. O único atraso significativo em um sistema nervoso é o atraso sináptico.
4. A atividade de qualquer sinapse inibitória previne a excitação do neurônio
neste período.
5. A estrutura da rede de interconexão não muda com o tempo.
O processo de tudo ou nada identifica o neurônio como um operador binário,

capaz de produzir excitação ou inibição, embora possa ter inúmeras entradas. O
valor das entradas é processado pelo núcleo e propagado pela saída como um sinal
excitatório ou inibitório em um intervalo [0,1] ou [-1,1].
O modelo de neurônio artificial proposto por McCulloch-Pitts aparece na

Figura 10 e seu processamento pode ser descrito como uma equação generalizada
por (HAYKIN, 2001):
50
 m  
y k = ϕ   ∑ wkj x j  + bk 
 j =1 
  
Onde:
φ representa a função de ativação

xj representa as entradas que formam um vetor
bk representa o bias com a função de aumentar ou reduzir a entrada da
função de ativação
e wkj são os pesos que representam as sinapses
Figura 10 – Modelo de neurônio artificial

Rosenblatt demonstrou, através de seu teorema de convergência do

Perceptron, que a rede neural sugerida por McCulloch-Pitts alcançava a
convergência para a classificação quando os padrões de entrada eram linearmente
separáveis, reproduzindo assim as funções lógicas computacionais básicas. No
modelo utilizado por Rosenblatt a função de ativação apresentava um limiar de
decisão abrupto e descontínuo, representado na Figura 11, onde se detecta o limiar
de decisão formado para o caso de duas variáveis x1 e x2 e é possível identificar que
as classes apresentadas são linearmente separáveis (HAYKIN, 2001).
51
Figura 11 – Hiperplano demonstrando o limiar de decisão

Postas as definições do modelo de neurônio, cabe ainda apresentar a

estrutura básica que, segundo Cios, Pedrycz e Swiniarski (1998, p.309, tradução
nossa), compõe a especificação de uma rede neural artificial:
- pelo modelo de neurônio utilizado;

- pela topologia da rede;
- e pela regra de aprendizado.
2.3.3.3.4 Topologias de redes neurais artificiais
Conforme Cios, Pedrycz e Swiniarski (1998, p. 311, tradução nossa), a

topologia de redes neurais pode ser dividida em dois tipos:
- redes alimentadas adiante13: sem laços ou conexões entre a mesma

camada;
- e as redes recorrentes: com laços de retroalimentação.
13
Do inglês, feedfoward, tradução nossa
52
Neste estudo, aborda-se o tema das redes de múltiplas camadas alimentadas

adiante, utilizando o algoritmo de retropropagação dos erros14 devido à sua
característica de boa performance na detecção de padrões, defendida em trabalhos
como Cios, Pedrycz e Swiniarski (1998), Freeman e Skapura (1992) e Santos,
Carvalho e Riul (2006).
2.3.3.3.5 Algoritmos de aprendizado
Um algoritmo de aprendizado é definido por Haykin (2001, p.76) como “um

conjunto pré-estabelecido de regras bem definidas para a solução de um problema
de aprendizagem”. Durante o desenvolvimento das redes neurais artificiais surgiram
diversas ferramentas com diferentes métodos para implementar o ajuste dos pesos
sinápticos e, assim, causar o processo de aprendizagem da rede neural. Dentre os
conjuntos de algoritmos, citam-se (HAYKIN, 2001):
- o aprendizado por correção de erro;

- o aprendizado por retropropagação do erro (backpropagation);
- o aprendizado baseado em memória;
- a aprendizagem hebbiana;
- a aprendizagem competitiva;
- e a aprendizagem de Boltzmann.
Neste trabalho implementa-se uma rede neural utilizando o aprendizado por

retropropagação do erro.
2.3.3.3.6 O Perceptron de múltiplas camadas utilizando backpropagation
O Perceptron de múltiplas camadas (MLP – multilayer perceptron) é

estruturado, basicamente, em:
14
Do inglês, backpropagation multilayer perceptron
53
- um conjunto de unidades sensoriais que compõe a camada de entrada;

- uma ou mais camadas ocultas;
- e uma camada de saída.
São as camadas ocultas que realizam o processamento dos problemas de

maior complexidade, uma vez que adquirem progressivamente as características
das entradas. Este modelo de rede é caracterizado pelo alto grau de conectividade e
uma mudança nesta estrutura de conexões requer a atualização dos pesos e
conexões sinápticas. O sinal de entrada é propagado para frente, camada a
camada, até que o sinal de saída seja produzido em sua forma inibitória ou
excitatória. Um modelo generalizado desta estrutura está ilustrado na Figura 12.
Sinais de entrada
Sinais de saída
(resposta)
(estímulos)
Figura 12 – Estrutura de um Perceptron com duas camadas ocultas

Fonte: Adaptado de HAYKIN (2001)
O desenvolvimento de uma função que possibilitasse eliminar as limitações

do limiar de decisão abrupto sugerido por Rosenblatt deu uma maior amplitude ao
escopo de problemas solucionáveis pelas redes neurais. Uma função de ativação
não-linear que pode ser utilizada é a função logística, também conhecida como
função sigmóide devido ao formato de seu gráfico. Sua representação está
demonstrada no Gráfico 6 e definida como (HAYKIN, 2001):
54
1
yj =
1 + exp (− v j )
Onde:
vj é a soma ponderada pelo peso sináptico de todas as entradas acrescidas

do bias do neurônio j;
e yj é a saída do neurônio.
1,2
0,8
0,6
0,4
0,2
0
-10 -9 -8 -7 -6 -5 -4 -3 -2 -1 0 1 2 3 4 5 6 7 8 9 10
Gráfico 6 – Função Logística ou Sigmóide

Com esta estrutura multicamadas, surgiu a necessidade de desenvolver um

algoritmo que realizasse a atualização dos pesos sinápticos, ao longo da rede
compreendida por uma estrutura altamente complexa. Nesse sentido foi
desenvolvido o algoritmo chamado de retropropagação do erro e que consiste em
duas etapas básicas:
- a propagação: a rede inicialmente com pesos aleatórios, recebe os

estímulos de treinamento que são inseridos na camada de entrada e causam
a propagação até que uma resposta seja obtida na saída.
55
- e a retropropagação: obtida a resposta do passo anterior, esta é subtraída

da resposta desejada, produzindo um sinal de erro que é então
retropropagado em direção à entrada, atualizando os pesos sinápticos,
aproximando, estatisticamente, o próximo valor de saída para o valor-alvo.
Na Figura 13 temos a representação da direção dos sinais de entrada

disposto como uma linha contínua (sinais funcionais) e da retropropagação do erro
demonstrado em linhas pontilhadas (sinais de erro).
Figura 13 – Fluxo de sinais entre camadas

2.3.3.3.7 O algoritmo de aprendizado backpropagation
O algoritmo backpropagation, que é um algoritmo de aprendizagem

supervisionada, é basicamente uma generalização da Regra Delta também
conhecida como LMS15. Conforme Haykin (2001, p.187), nesta rede Perceptron
multicamadas, cada neurônio oculto ou de saída é projetado para realizar:
1. o cálculo do sinal funcional que aparece na saída de um neurônio, que é

expresso como uma função não-linear do sinal de entrada e dos pesos
sinápticos associados com aquele neurônio;
2. o cálculo de uma estimativa do vetor gradiente (i.e., os gradientes da

superfície de erro em relação aos pesos conectados às entradas de um
neurônio), que é necessário para a retropropagação através da rede.
15
Do ingles, Least Mean Square
56
O sinal funcional é o vetor de entrada da rede que se propaga para frente,

passando por cada neurônio, produzindo, assim, uma saída. Os sinais de erro
propagam-se para trás e são utilizados para o ajuste dos pesos (HAYKIN, 2001).
Ainda, Haykin (2001) faz uma abordagem muito detalhada sobre o algoritmo
backpropagation, demonstrando os passos para a atualização dos pesos em uma
rede de neurônios de múltiplas camadas. Também, no trabalho de Mitchell (1997,
tradução nossa), é abordado, de forma detalhada, o método da Regra Delta e do
algoritmo backpropagation. Nesta etapa do trabalho, realiza-se uma breve
abordagem deste algoritmo de aprendizagem, e seus componentes, sejam a taxa de
aprendizado e o termo momentum.
A topologia da rede utilizada neste trabalho é a rede com múltiplas camadas

alimentadas adiantes, onde todas as camadas são interconectadas. Conforme
Mitchell (1997, tradução nossa) os pesos iniciais de cada neurônio são inicializados,
geralmente, com pesos aleatórios variando de -0,05 a 0,05.
Conforme Freeman e Skapura (1992, tradução nossa), os passos básicos

para realizar o treinamento são:
1 – Aplica-se um vetor de entrada à camada de entrada da rede e calculam-

se os valores de saída correspondentes;
2 – Comparam-se as saídas obtidas com as saídas corretas e determina-se
uma medida do erro;
3 – Determina-se a direção (positivo ou negativo) para realizar o ajuste dos
pesos, objetivando a redução do erro;
4 – Determina-se o montante de ajuste de cada peso;
5 – Aplicam-se as correções aos pesos;
6 – Repetem-se os passos 1 a 5 com todos os vetores de treinamento até que
o erro seja reduzido a um valor aceitável.
Os passos refletem a busca em um espaço de hipóteses entre vetores de

pesos e quantidade de erro. O erro é determinado pela diferença entre o valor da
saída, devido a um vetor de entrada, e o valor esperado de uma determinada saída.
Cabe aqui exemplificar um espaço de hipóteses através do Gráfico 7.
57
Basicamente, o algoritmo de retropropagação busca, através do valor

negativo do cálculo do gradiente, encontrar o ponto mínimo do erro em função dos
pesos associados.
Gráfico 7 – Espaço de hipóteses de pesos e erros associados

Fonte: Adaptado de FREEMAN; SKAPURA (1992)
O tamanho de cada passo em direção à este mínimo é conhecido como a

taxa de aprendizagem. Geralmente esta taxa é positiva e menor do que 1, sendo
mais freqüente a utilização de valores entre 0,05 até 0,25. Um valor muito baixo para
a taxa de aprendizagem, pode levar a um elevado tempo de processamento, até a
rede encontrar seus mínimos de erro, enquanto que taxas maiores podem fazer com
que a rede não convirja para a solução (FREEMAN; SKAPURA, 1992, tradução
nossa).
Uma das maneiras de acelerar a convergência da rede, sem alterar sua taxa
de aprendizagem, é utilizar uma técnica chamada momentum, que consiste em
adicionar uma fração da última correção do peso. Assim, esta adição tende a manter
a correção do peso seguindo na mesma direção. Geralmente este termo possui
valores positivos e menores do que 1 (FREEMAN; SKAPURA, 1992, tradução
nossa).
58
2.3.4 Ferramentas de mineração de dados
Como o desenvolvimento de aplicações na área da mineração de dados,

geralmente, envolve o processamento de muitas informações, existem no mercado
ferramentas específicas para executar os mais variados algoritmos e técnicas.
Avaliações de ferramentas de mineração de dados são o foco de diversos

trabalhos como, por exemplo, em Elder e Abbot (1998, tradução nossa). Contudo,
com o ritmo acelerado no lançamento de novos aplicativos, outras fontes de consulta
disponíveis na Internet podem ser utilizadas como, por exemplo:
- Em KDnuggets (2009), verifica-se as diversas ferramentas existentes,

agrupando as mesmas conforme as técnicas e tarefas da mineração de dados.
Também oferece um vasto acervo de informações;
- Em Elder Research Inc (2009), encontram-se diversos artigos com
comparativos das principais ferramentas de mineração de dados, dentre outras
informações.
Para o desenvolvimento deste trabalho, a ferramenta escolhida foi o aplicativo

WEKA16 desenvolvido por Witten e Frank (2000, tradução nossa). Este aplicativo é
distribuído gratuitamente sob a licença “GNU General Public License” e citada em
diversos trabalhos acadêmicos.
O projeto é financiado pelo governo da Nova Zelândia desde 1993 e seu

objetivo é (PFAHRINGER, 2009, tradução nossa):
[...] construir um ambiente do estado-da-arte para desenvolver técnicas de

aprendizado de máquina e investigar a sua aplicação em áreas-chave da
economia da Nova Zelândia. Especificamente, vamos criar um ambiente de
trabalho para o aprendizado de máquinas, determinar os fatores que
contribuem para seu sucesso na aplicação em agroindústrias, e
desenvolver novos métodos de aprendizado de máquina e maneiras de
avaliar sua eficácia.
16
Sigla para Waikato Environment for Knowledge Analysis
59
Em 1993, foram criadas a interface, a infra-estrutura, a identificação com o

acrônimo WEKA e o formato de arquivo ARFF (Attribute Relational File Format). Em
1994, as primeiras versões beta foram liberadas e os algoritmos eram escritos na
linguagem de programação C. Em outubro de 1996 a primeira versão pública foi
liberada sob o rótulo de WEKA 2.1. Em Julho de 1997, já em sua versão 2.2, foram
dados os passos para o suporte às operações de larga escala e veio a decisão de
re-escrever o programa na linguagem JAVA. Em 1998 a versão 2.3 foi lançada e, em
1999 a primeira versão completamente escrita em JAVA foi liberada e apresentada
como WEKA 3 (PFAHRINGER, 2009, tradução nossa).
Ainda, para que fosse possível realizar um comparativo entre a ferramenta

WEKA frente a outro ambiente, também voltado à mineração de dados, optou-se
pela aplicação da mesma base de dados no software comercial Clementine. O
Clementine é desenvolvido e comercializado pela SPSS, empresa presente no Brasil
desde 1990 e que oferece várias soluções na área da mineração de dados e análise
estatística. Ainda, o Clementine está presente nas listas, citadas acima, que contém
ferramentas de mineração de dados, e oferece ao usuário o acesso a diversos
algoritmos em uma única ferramenta. O Clementine, dentre algumas de suas
características, possui uma boa integração com outros sistemas, facilitando assim
sua interconexão com bancos de dados ou sistemas de informação. Outra facilidade
oferecida é o ambiente de trabalho, que é visual, utilizando o modo de diagrama de
blocos para compor o fluxo de conhecimento. Este ambiente pode ser visualizado na
Figura 14.
60
Figura 14 – Ambiente Clementine

Fonte: ELETROPAULO (2009)
2.4 MÉTODOS DE ANÁLISE DE PERFORMANCE
Na aplicação de diferentes técnicas de mineração de dados, surge a

necessidade de adotar uma metodologia para a análise dos resultados, de modo a
fornecer uma base de decisão sobre a performance das técnicas avaliadas. Dentre
as técnicas desenvolvidas nos últimos anos, aborda-se neste estudo a Taxa de
Sucesso e a análise através da Curva ROC17. Ambas têm se destacado na área da
mineração de dados, sendo que a análise da Curva ROC é amplamente utilizada na
área médica.
2.4.1 A taxa de sucesso
O custo de um erro ou um acerto pode ser um importante fator a ser levado

em conta nas medições de performance dos classificadores de dados. Um exemplo
é o caso da detecção de incêndios. O erro de disparar um alarme falso (falso
positivo) possui um custo muito menor do que o erro da não-detecção do incêndio
17
Do ingles Receiver Operating Characteristics
61
(falso negativo). São quatro os conceitos utilizados no levantamento de acertos e

erros produzidos por classificadores (WITTEN; FRANK, 2000, tradução nossa):
- positivo verdadeiro (true positive ou TP): classificação correta de um

exemplo positivo; Exemplo: detecção do incêndio corretamente;
- negativo verdadeiro (true negative ou TN): classificação correta de um

exemplo negativo; Exemplo: não disparar o alarme pois não há incêndio;
- positivo falso (false positive ou FP): classificação incorreta de um exemplo

positivo; Exemplo: disparado alarme falso, não havia incêndio;
- e negativo falso (false negative ou FN): classificação incorreta de um

exemplo negativo. Exemplo: Não detectar o incêndio que está ocorrendo.
Quando se aplica o conjunto de teste em uma técnica de classificação de

dados previamente treinada o resultado pode ser descrito como uma matriz de duas
dimensões conhecida como a Matriz de Contingência18, exemplificada na Figura 15,
através da qual demonstra-se os quatro conceitos apresentados:
Figura 15 – Matriz de contingência

Fonte: SILVA (2006)
A partir dessa matriz, podem-se aplicar as seguintes equações, para

obtenção de importantes indicadores do modelo (SILVA, 2006):
- Taxa de acerto (TP rate): é a razão entre os positivos verdadeiros e o total

de exemplos positivos;
18
Do inglês, Confusion Matrix, tradução nossa
62
- Alarme falso (FP rate): é a razão entre os falsos positivos e o total de

exemplos negativos;
- Precisão (precision): Taxa de acerto dos exemplos positivos;
- Exatidão (accuracy): representa a taxa de acerto total (positivos e

negativos);
- Taxa de sucesso (success rate): é a razão entre a soma de todos os acertos

(TP+TN) pela soma de todos os casos analisados pelo algoritmo
(TP+FP+TN+FN).
A precisão está relacionada com a dispersão dos valores em sucessivas

observações enquanto a exatidão está associada à proximidade do valor verdadeiro
que se deseja representar.
2.4.2 A curva ROC e a área sob a curva
O método da curva ROC foi desenvolvido por Engenheiros Elétricos e

Engenheiros de Radar durante a segunda guerra mundial com o objetivo de avaliar a
capacidade dos operadores de radar em detectarem corretamente se um objeto era
uma nave aliada, inimiga ou simplesmente um ruído. A partir de 1970, seu uso se
intensificou na área médica, com a necessidade de avaliar a capacidade
discriminativa de um teste clínico ou um diagnóstico, ou seja, sua capacidade de
classificar corretamente a presença ou ausência de uma doença (CÂMARA, 2009).
O uso da análise da curva ROC na área do aprendizado de máquinas iniciou por
volta de 1989, quando Spackman demonstrou a importância da curva ROC na
avaliação e comparação de algoritmos (FAWCETT, 2004, tradução nossa).
63
Conforme Silva (2006, p.1) uma curva ROC é “uma técnica para visualizar,
avaliar, organizar e selecionar classificadores baseado em suas performances”.
Pode-se visualizar o gráfico da Curva ROC no Gráfico 8:
1
D
0,9
0,8
0,7
Taxa de acerto (TP rate)
C
0,6
0,5
0,4
0,3
0,2
0,1
0
0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1
Taxa de falsos positivos (FP rate)
Gráfico 8 – Plotagem da curva ROC

Fonte: Adaptado de SILVA (2006)
Através do Gráfico 8, visualiza-se que as curvas ROC são construídas em

duas dimensões, com a taxa de acerto no eixo das ordenadas e os alarmes falsos
no eixo das abscissas. É uma relação entre os benefícios (taxa de acerto) e os
custos (alarmes falsos). O ponto (0,0) indica um classificador que não comete
nenhum erro de alarme falso, contudo também não acerta nenhum exemplo positivo.
O ponto (0,1) indica um classificador perfeito, representado no Gráfico 8 pela letra D.
Observa-se, portanto, que um ponto na curva é melhor do que outro, quando a taxa
de acertos (TP rate) é maior do que os alarmes falsos (FP rate). A linha diagonal,
traduzida pela expressão y = x e presente no Gráfico 8, indica um limiar onde,
abaixo desta diagonal, o classificador é considerado pior do que um classificador
aleatório. Assim, a letra C no Gráfico 8 indica um classificador aleatório. Um fato
importante nas curvas ROC é que as mudanças na distribuição entre positivos e
negativos na base de dados não modifica a composição da curva ROC, visto que
seus eixos são compostos por taxas (SILVA, 2006).
Quando há necessidade de se comparar duas técnicas de mineração de

dados, é mais desejável obter um único número escalar como métrica de
performance. Assim, um método conhecido é o cálculo da área sob a curva ROC ou
64
AUC19. Conforme Fawcett (2004, p. 15, tradução nossa), este indicador possui uma
importante propriedade estatística:
“a área sob a curva de um classificador é equivalente à probabilidade que

este classificador irá categorizar um exemplo positivo escolhido
aleatoriamente mais alto que um exemplo negativo aleatoriamente
escolhido”.
Assim, a performance de um classificador pode ser avaliada através do

cálculo da área sob a curva ROC, em que, um classificador com um índice - igual ou
menor à 0,50 - é considerado igual ou pior à um processo aleatório de decisão
(BRAGA, 2000).
2.5 TRABALHOS RELACIONADOS
Uma etapa importante para o desenvolvimento deste trabalho foi a aplicação

do método de revisão bibliográfica que, segundo Martins (2003 apud MAGALHÃES;
MELLO; BITENCOURT, 2006):
[...] trata-se de estudo para conhecer as contribuições científicas sobre

determinado assunto. Tem como objetivo recolher, selecionar, analisar e
interpretar as contribuições teóricas já existentes sobre determinado
assunto.
Assim, neste tópico, cabe elencar alguns dos trabalhos que compartilham dos
métodos aplicados e, inclusive, serviram como referencial para compor o presente
trabalho.
Santos, Carvalho e Riul (2006) desenvolveram um classificador de líquidos,

capaz de identificar paladares doces e salgados. O trabalho utilizou as redes neurais
artificiais para realizar a tarefa de processamento dos dados obtidos através de
sensores. Estes dados foram submetidos à técnica de Validação Cruzada
19
AUC: Do ingles: Area Under Curve
65
(CrossValidation). Os algoritmos utilizados foram a retropropagação de erros

(backpropagation) e a retropropagação de erros com ajuste do termo momentum.
Durante o trabalho os autores trazem os conceitos de custo/benefício destes
classificadores.
Espíndola (2004) apresentou em sua tese de doutorado, a avaliação de um

algoritmo genético baseado em regras fuzzy. Para comparar os resultados de seu
modelo, o autor utiliza uma árvore de decisão baseada no algoritmo C4.5 e
implementada no programa WEKA. Para a avaliação dos algoritmos, foi utilizada a
análise das curvas ROC (ROC curves), da área sob a curva (AUC) e a avaliação da
média geométrica dos critérios de sensibilidade e precisão.
Tavares, Lopes e Lima (2007) realizaram a avaliação de diversos algoritmos

de aprendizado de máquina através da implementação destes no ambiente WEKA.
Foram utilizadas dez partições para a validação cruzada (Ten Fold CrossValidation).
Na discussão dos resultados obtidos, os autores citam a melhor performance das
redes neurais sobre os métodos da árvore de decisão.
Paixão (2008) aborda o uso das técnicas de mineração de dados para os

problemas da Engenharia Ambiental e utiliza a árvore de decisão, implementada
através do pacote WEKA, para a análise de dados ambientais em uma usina
termelétrica a gás natural.
Sovierzoski, Argoud e Azevedo (2008) utilizam a análise da curva ROC, da

sensibilidade e precisão e da matriz de contingência para avaliar uma rede neural
construída para operar como um classificador binário. O objetivo dos autores foi
fornecer a metodologia e as ferramentas para a avaliação e seleção de uma rede
neural binária.
Em Braga (2000) é realizada uma análise da curva ROC e suas variantes sob
o aspecto estatístico. A autora realiza uma dissertação sobre a aplicação e a
funcionalidade desta ferramenta e aborda o uso da curva ROC e da área abaixo da
curva (AUC) para a avaliação de diagnósticos médicos.
66
3 DESENVOLVIMENTO
Após a contextualização do trabalho e a fundamentação básica sobre os

elementos que o compõem, este capítulo estabelece o objetivo e os métodos, as
visões e as abordagens utilizadas em seu desenvolvimento e a aplicação.
Estruturam este capítulo: a etapa de definição do escopo, a preparação e
organização dos dados, a apresentação do software de mineração utilizado, a
aplicação dos algoritmos de mineração de dados e a análise e avaliação dos
resultados.
3.1 DEFINIÇÃO DO ESCOPO DE TRABALHO
A definição do escopo de trabalho deve ser realizada com o máximo de

informações disponíveis, sejam de sistemas, de especialistas ou de consultorias.
Neste trabalho, a utilização do conhecimento de especialistas foi utilizada e levada
em consideração na modelagem da base de dados. Os passos seguidos, desde a
identificação do potencial até a extração dos dados será o roteiro desta etapa do
estudo.
A quantidade disponível de medidores eletrônicos com capacidade de

medição da energia reativa na área de concessão da AES Sul é de,
aproximadamente, vinte e seis mil peças. Essa quantidade se mostra restritiva
quando comparada ao total de um milhão de clientes e, para garantir que estes
medidores não estejam sendo subutilizados, (por exemplo, instalados em locais que
tenham um bom fator de potência, deixando, assim, de identificar os consumidores
com maior consumo de energia reativa), mensalmente uma equipe realiza a análise
dos registros históricos de energia reativa e providencia as realocações. Atualmente,
na AES Sul, esta análise utiliza médias históricas de consumo de energia ativa e
segue procedimentos manuais para as análises.
67
Neste cenário, foi considerado que outras formas de análise poderiam ser
utilizadas a fim de identificar um padrão de clientes com consumo de energia reativa
e baixo fator de potência, gerando o faturamento de energia reativa. Através de
reuniões com especialistas e de pesquisa nos bancos de dados, foi verificado que,
além do histórico de energia ativa que já vinha sendo utilizada nos estudos,
poderiam ser utilizadas outras informações pertinentes, como, por exemplo:
- o cadastro de equipamentos elétricos instalados na unidade consumidora,

em que uma maior potência de certos tipos de equipamentos, como motores,
poderia indicar um baixo fator de potência;
- o nível de tensão do transformador que abastece cada cliente, o que
interfere diretamente no fator de potência de motores de indução, conforme
abordado nos tópicos anteriores;
- o histórico de energia reativa dos clientes, identificando cada cliente que já
possui medidor de energia reativa e seu respectivo consumo;
- e a classe do cliente (Industrial, Rural, Comercial, Residencial ou de
Serviços Públicos).
Contudo, uma maior quantidade de informações também traz um maior nível

de complexidade dos dados. Neste contexto, buscaram-se soluções na área da
mineração de dados aliada ao aprendizado de máquinas no intuito de encontrar uma
ferramenta que agregasse valor e competitividade ao processo de remanejo de
medidores de energia reativa como uma forma de otimizar esse processo. Uma vez
que o conhecimento das regras que indicam um consumo de energia reativa não
estava implícito através de regras ou estatísticas, optou-se pela aplicação de uma
ferramenta de descoberta de conhecimento baseada no aprendizado por exemplos.
Este trabalho contempla os testes realizados com duas destas técnicas: a árvore de
decisão e a rede neural artificial.
As redes neurais artificiais, conforme já mencionado, podem ser utilizadas

para a classificação dos dados e possuem uma grande imunidade a ruídos nos
dados. Sua grande desvantagem é a difícil extração de regras. As árvores de
decisão, dentre suas características já apresentadas anteriormente, foi escolhida
com o objetivo de fornecer um comparativo para a aplicação de uma rede neural
68
artificial. Além disso, a árvore de decisão fornece uma visão das regras que compõe
os dados analisados e que poderia revelar, em um futuro trabalho de análise e
validação dos resultados, em novas relações ocultas nos dados (MITCHELL, 1997,
tradução nossa).
3.2 SELEÇÃO DOS DADOS
Com base no exposto no tópico anterior, foram realizadas três extrações do

banco de dados da AES Sul. A tabela principal, denominada aqui de Tabela 01,
provém do cadastro dos clientes com medidor de energia reativa para o período
compreendido entre janeiro de 2007 e março de 2009. Sua estrutura original pode
ser visualizada na Figura 16. Nesta tabela foram selecionados 39.080 clientes,
totalizando 745.014 linhas.
Figura 16 – Estrutura da Tabela 01

A segunda tabela, também oriunda do cadastro de clientes, foi nomeada

Tabela 02, e traz os artefatos elétricos declarados por cada cliente. Nesta seleção
foram listados todos os clientes, com contrato ativo no mês de março de 2009, que
possuíam medidor de energia reativa e, no mínimo, um artefato elétrico cadastrado.
Pode-se observar sua estrutura original na Figura 17. Esta seleção trouxe um total
de 11.160 clientes, em um total de 63.851 linhas.
69

A terceira extração traz a Tabela 03, cuja estrutura está demonstrada na

Figura 18. Ela contém os níveis de tensão P.U. (por unidade) dos transformadores
de distribuição que atendem cada cliente, e é obtida com programas específicos de
fluxo de potência da rede elétrica. Os dados disponibilizados referem-se à última
base de cálculo do fluxo de potência da AES Sul, e fornecem o estado disponível
mais recente do nível de tensão nos pontos selecionados. A listagem trouxe 45.909
transformadores de distribuição da área de concessão da AES Sul.

Cada uma das tabelas apresentadas sofreu transformações em seus dados e

intersecções entre si, de modo a proporcionar o formato exigido para o
processamento final. Estas etapas de preparação serão abordadas na etapa
subseqüente.
3.3 PREPARAÇÃO DOS DADOS
A quantidade massiva de dados disponíveis torna impraticável sua análise

sem lançar mão de recursos computacionais. Nesta etapa de pré-processamento e
70
preparação dos dados foram utilizadas várias ferramentas, conforme será abordado
neste tópico.
De acordo com Hu (2002, p.2, tradução nossa), o pré-processamento dos

dados é uma etapa crítica para o sucesso da mineração de dados e, para reduzir um
conjunto de dados, pode-se utilizar a redução de suas dimensões (atributos) ou
atuar reduzindo suas classes, melhorando assim a performance e qualidade do
processamento posterior. Nesta etapa do trabalho, realizou-se uma primeira
transformação dos dados e, posteriormente, sua limpeza e organização.
3.3.1 Transformação dos dados
Com a disponibilização dos dados na forma de três tabelas, verificou-se que,

devido à disposição, ao formato e à quantidade dos dados, estes não poderiam ser
utilizados para a análise sem um pré-processamento. Assim, a primeira etapa foi de
limpeza, de formatação e de intersecção dos dados.
A limpeza foi realizada para eliminar dados duplicados, desnecessários ou

mesmo a ausência de informações. Na Figura 19 podemos verificar o formato inicial
no qual os dados estavam dispostos na Tabela 01, que continha um total superior a
745 mil linhas de dados.
71
Figura 19 – Tabela 01 de dados históricos de clientes da AES Sul

A primeira transformação efetuada na Tabela 01 foi a substituição do

conteúdo da coluna “NUC” por uma numeração crescente, a fim de garantir o sigilo
da identidade dos clientes listados.
Outra transformação necessária foi a remoção de refaturamentos existentes

nos dados. O refaturamento ocorre quando uma fatura de energia, por algum motivo,
é anulada e refaturada no mês posterior, gerando duas faturas no mesmo período.
Para este trabalho, foram desconsideradas as anulações.
A terceira transformação da Tabela 01 foi a remoção de colunas consideradas

desnecessárias para o propósito deste trabalho. A estrutura final da tabela pode ser
visualizada na Figura 20.
Figura 20 – Estrutura da tabela Tabela 01

72
A próxima etapa de transformação ocorreu com a Tabela 02. Primeiramente,

foi necessário criar uma generalização para os artefatos elétricos, reduzindo, com
isso, a quantidade de colunas necessárias. Os agrupamentos de artefatos elétricos
foram dispostos conforme indicado no Quadro 5 e as potências foram agrupadas e
somadas para cada cliente.
P-COM P-MOTOR P-MATESCR P-AR

Amaciador de Bifes Motor Mono/Bi/Trifásico 1,0CV Aparelho de Fax Ar Condicionado
Aparelhos de uso comercial Motor Mono/Bi/Trifásico 1,5CV Equipamentos de escritório Ar Condicionado 7.500 BTU
Balança Motor Mono/Bi/Trifásico 2,0CV Impressora Jato de Tinta Ar Condicionado 10.000 BTU
Batedeira Comercial Motor Mono/Bi/Trifásico 3,0CV Impressora Laser Ar Condicionado 12.000 BTU
Cilindro para Massa Motor Mono/Bi/Trifásico 4,0CV Impressora Matricial Ar Condicionado 15.000 BTU
Fatiadeira de Pão Motor Mono/Bi/Trifásico 5,0CV Máquina de Calcular Ar Condicionado 18.000 BTU
Fatiador de Friambes/Carne Motor Mono/Bi/Trifásico 6,0CV Máquina de Escrever Elétrica Ar Condicionado 21.000 BTU
Moedor de Carne Motor Mono/Bi/Trifásico 7,5CV Microcomputador Ar Condicionado 24.000 BTU
Motor Mono/Bi/Trifásico 10,0CV Microcomputador maior pot. Ar Condicionado 30.000 BTU
Motor Mono/Bi/Trifásico 12,0CV
P-SOLDA Motor Mono/Bi/Trifásico 12,5CV
Aparelho de Solda 150 Amp. Motor Mono/Bifás/Trif. 1,0HP P-MAQLAV P-AQUEC
Aparelho de Solda 250 Amp. Motor Mono/Bifás/Trif. 1,5HP Centrífuga Buffests Térmicos
Aparelho de Solda 300 Amp. Motor Mono/Bifás/Trif. 2,0HP LAVADORAS E SECADORES Forno Elétrico Comercial
Aparelho de Solda 400 Amp. Motor Mono/Bifás/Trif. 3,0HP Máquina de lavar louças Forno Elétrico Residencial
Motor Mono/Bifás/Trif. 4,0HP Máquina lavar c/água quente Fritadeira Elétrica
Motor Mono/Bifás/Trif. 5,0HP Máquina lavar roupa até 8 kg Microondas c/dourador
P-REFRIPQ Motor Mono/Bifás/Trif. 6,0HP Secadora de Roupas Microondas s/dourador
Freezer até 200 litros Motor Mono/Bifás/Trif. 7,5HP Tanquinho
Refrigeração e forno Motor Mono/Bifás/Trif. 10,0HP
Refrigerador Biplex Motor Mono/Bifás/Trif. 12,5HP
Refrigerador Simples Motor Monofásico 1/2CV P-VENT
Motor Monofásico 1/3CV Exaustor
Motor Monofásico 3/4CV Turbo Circulador acima 30cm
P-REFRIGD Motor Monofásico 1/2HP Turbo Circulador até 30cm
Balcão Frigoríf. 250 até 400 L Motor Monofásico 1/3HP Ventilador acima de 30cm
Balcão Frigoríf. acima 400 L Motor Monofásico 3/4HP Ventilador até 30cm
Balcão Frigoríf. até 250 L Motor Trifásico 15,0CV Ventilador de teto
Freezer acima de 200 litros Motor Trifásico 15,0HP Ventiladores e exaustores
Freezer Balcão Motor Trifásico 20,0CV
Refrigerador Comercial Motor Trifásico 20,0HP P-MAQELET
Motor Trifásico 25,0CV Lixadeira
Motor Trifásico 25,0HP Serra-fita simples
Motor Trifásico 30,0CV
Motor Trifásico 30,0HP
Motor Trifásico 40,0CV
Motor Trifásico 40,0HP
Motores Elétricos (CV)
Quadro 5 – Agrupamento de artefatos elétricos

Para exemplificar, analisa-se um cliente hipotético, cujo cadastro indica quatro

computadores com potência declarada de 400 W cada um, e dois equipamentos
condicionadores de ar com potência declarada de 1.350 W e 1.150 W. Logo, o
campo P-MATESCR conteria o valor 1.600, enquanto o campo P-AR conteria o valor
2.500.
73
Esta modelagem produziu onze grupos de artefatos elétricos e,

consequentemente, onze colunas na tabela final.
3.3.2 Limpeza e organização dos dados
Para a etapa de organização dos dados, optou-se por utilizar a linguagem de

consulta Structured Query Language (SQL), que está disponível no sistema
Microsoft Access 2003. Esta linguagem possibilita seleções através de várias
opções para a modelagem, utilizando para isso sintaxes específicas. No Apêndice A,
pode-se encontrar os seis códigos SQL utilizados para realizar a organização das
tabelas, inclusive a Tabela 01, alterada pelos códigos identificados como A.1, A.2,
A.3 e A.4. Esses quatro códigos definem com o valor zero as colunas que não
existem (valores em branco). Para exemplificar cita-se um determinado cliente,
hipotético, que inicia seu contrato na data de 01/01/2009. Este cliente não irá possuir
quaisquer dados de consumo ou mesmo de cadastro disponíveis em períodos
anteriores à data do início de seu contrato com a AES Sul. Neste caso, o código
SQL acrescenta zeros nos dados faltantes que, no caso deste trabalho, compreende
o período de janeiro de 2007 a março de 2009.
O Código A.1 realiza o processamento da coluna “kWh” gerando uma nova

tabela chamada Tabela 04, enquanto o Código A.2 processa a coluna “kVArh”
gerando outra tabela chamada Tabela 05 e, finalmente, o Código A.3 processa a
coluna “FER” gerando a Tabela 06. A união das tabelas 04, 05, 06 e 01 ocorreu
através do Código A.4.
Para que os métodos de aprendizado de máquina pudessem identificar

clientes com ou sem potencial de energia reativa, uma vez que o aprendizado dos
métodos escolhidos é realizado através de exemplos, foi adicionada à Tabela 01
uma coluna chamada “CLASS”, contendo os valores “yes” e “no”. O valor “yes”
identifica clientes que possuem medidor de energia reativa e estão apresentando
faturamento desta energia. O valor “no” identifica os clientes que também possuem
74
medidor de energia reativa, contudo não apresentam potencial de consumo para

faturamento da energia reativa em seu histórico. Lembra-se que os códigos SQL
acrescentaram zeros nos dados faltantes. Essa ação poderia causar impacto na
análise de histórico de consumo de cada cliente, demonstrando erroneamente, por
exemplo, que determinado cliente teria um consumo faturado baixo. Para eliminar
este risco, utiliza-se a média de faturamento da energia reativa. Caso o cliente
apresentasse uma média superior a zero, então, este possuía faturamento de
energia reativa e foi marcado como “yes”. Do contrário, no caso em que a média era
zero, a coluna CLASS recebeu o valor “no”.
O agrupamento de artefatos, encontrado no Quadro 5 gerou uma nova

estrutura, nomeada Tabela 07, que pode ser observada na Figura 21. O código
utilizado, para a geração desta nova estrutura, encontra-se no Código A.5.

Ainda, a tabela 03 foi modificada, selecionando somente dois patamares de

tensão. Foram mantidos os valores de tensão para os horários das 7 horas às 19
horas e das 19 horas às 21 horas, caracterizando assim, o horário comercial e o
horário de pico do sistema elétrico brasileiro.
Com os dados identificados, era necessário realizar a união entre as tabelas,

acrescentando-se as colunas que, conforme a análise do grupo de analistas, poderia
ser um indicativo de consumo de energia reativa e que seria o objeto de
processamento dos algoritmos de aprendizagem. Para tanto, foi realizada uma
75
intersecção dos dados das três tabelas que possuíam entre si uma coluna
identificadora em comum: a coluna “NUC”. O código SQL utilizado para realizar a
intersecção pode ser encontrado no Apêndice A, sob o rótulo Código A.6, gerando a
Tabela 08. Os comandos, os métodos e as estratégias para compor as consultas
SQL aplicadas neste trabalho podem ser pesquisados em Lans (2000, tradução
nossa).
Além destas modificações, o consumo de energia ativo foi modificado de

forma a contabilizar a média de consumo de cada cliente e as colunas de consumo
mensal foram substituídas pela coluna “Averange_kWh”. Além disso, com a inclusão
da coluna “CLASS”, os dados mensais de consumo de energia reativa e o valor
mensal faturado da energia reativa foram eliminados. Outras colunas, dispensáveis
sob o ponto de vista da mineração de dados, também foram eliminadas, restando,
ao final, a estrutura que pode ser visualizada na Figura 22. Esta composição gerou
um arquivo chamado Arquivo 01, contendo, devido às intersecções e limpezas das
bases de dados, um total de 10.714 clientes para aplicação nos algoritmos de
aprendizado de máquina.
Figura 22 – Estrutura final da tabela gerando o Arquivo 01

Embora os métodos de organização, limpeza e transformação dos dados

tenham sido realizados com a intenção de reduzir ao máximo os ruídos nos dados,
ainda existem outros fatores geradores de ruídos que fogem ao controle ou da ação
de medidas corretivas.
76
3.3.3 Ruídos incorporados aos dados
Raramente as distorções não farão parte da base de dados. Os processos de

pré-processamento são uma tentativa de reduzir essa quantidade de ruídos,
contudo, em algumas situações, as distorções estão embutidas nos dados e não são
compostas por variáveis controláveis. Esta fase do trabalho procura descrever as
imperfeições presentes nos dados utilizados neste trabalho.
Um dos ruídos que apresentam um risco à análise é o ruído presente no

campo CLASS, coluna que indica ao algoritmo de mineração de dados, em suas
etapas de treinamento e teste, quais são os clientes com potencial para faturamento
de energia reativa. Estas imperfeições nos dados originam-se a partir de ações
tomadas nas unidades consumidoras e que fogem do conhecimento das
concessionárias. Os clientes que possuem a classificação “no” - indicando a
ausência de faturamento de energia reativa - na verdade poderiam ter realizado a
correção do fator de potência através da instalação de bancos capacitores em suas
unidades. Assim, mesmo possuindo um perfil de equipamentos, média de consumo
ativo e tensão que levariam a classificar este caso como “yes”, devido à ação
externa deste cliente específico, a classificação resultou em “no”. O resultado seria a
redução da capacidade de classificação do modelo, reduzindo sua precisão.
Outra fonte de ruídos são as colunas TENSAO_HOR_719 e

TENSAO_HOR_1921. Os dados destas duas colunas são obtidos através de
métodos de cálculo do fluxo de potência e possuem um certo nível de erro
específico deste tipo de processo.
Outra fonte de incertezas é a entrada no mercado, nos últimos anos, de

eletrodomésticos modernos com um melhor índice de eficiência energética
(condicionadores de ar, refrigeradores, etc.). Quando o modelo realiza a análise da
quantidade e da potência destes equipamentos, pode significar um ruído já que a
base de estudo desconsidera este fator, levando em conta somente sua potência
total.
77
3.3 ESCOLHA DA TAREFA DE MINERAÇÃO DE DADOS
Dentre as tarefas de mineração de dados, já abordadas na seção 2.3.2, a

classificação de dados é a mais utilizada para a descoberta de conhecimento em
uma nova estrutura de dados. Esta tarefa pode revelar importantes relações ocultas
entre os dados (PAUL, 2000).
3.4 DETERMINAÇÃO DO ALGORITMO DE MINERAÇÃO DE DADOS
No Quadro 6 pode-se visualizar um comparativo de algumas técnicas de

mineração graduadas em notas específicas por seu desempenho nos seguintes
quesitos:
- Facilidade de entendimento: O quão fácil é entender como o modelo fez

suas decisões?
- Facilidade de treinamento: O quanto esforço é necessário para treinar o
modelo?
- Facilidade de aplicação: Após a geração do modelo, o quão fácil este é
aplicado em bases de dados?
- Generalização: O quanto a técnica pode ser aplicada a uma gama variada
de problemas?
- Utilidade: O quão bons são os resultados produzidos pela técnica?
- Disponibilidade: O quão fácil o modelo pode ser encontrado em pacotes de
programas? Há suporte para várias plataformas de sistemas?
Facilidade de Facilidade de Facilidade de

Algoritmo / Tarefa Generalização Utilidade Disponibilidade
entendimento treinamento aplicação
Estatística aplicada B B B B B A+
Análise cesta de mercado A A A+ D B B
Dedução baseada em memória A- B B A- A- C
Algoritmos genéticos B- C- A- B+ C C
Detecção de agrupamentos B+ B+ A- A- B- B
Análise relacional A- C B D B C+
Árvore de decisão A+ B+ A+ A A B+
Redes neurais C- B- A- A A A
Quadro 6 – Tarefas e algoritmos de mineração de dados
Fonte: Adaptado de BERRY; LINOFF (1997)
78
Dentre os algoritmos de mineração de dados utilizados para a classificação

de dados, estão as redes neurais e as árvores de decisão.
3.5 O AMBIENTE DE DESENVOLVIMENTO DO WEKA
Conforme já apresentado, o programa WEKA é distribuído gratuitamente

através de sua página na Internet. A razão da adoção deste programa está em sua
vasta utilização em trabalhos acadêmicos no mundo e, também, devido ao seu
regime de distribuição gratuita. Citado por diversos autores como Espíndola (2004),
Tavares, Lopes e Lima (2007), Paixão (2008) e Santos, Carvalho e Riul (2006), este
programa possui uma grande quantidade de informações disponíveis no ambiente
virtual.
A versão de programa utilizada neste trabalho é a versão 3.6 para usuários

finais. Há ainda, disponível na página da internet do WEKA uma versão para
desenvolvedores.
O WEKA possibilita o uso de diversas ferramentas para pré-processamento,

algoritmos de aprendizado e métodos de avaliação. A tela inicial do programa pode
ser visualizada na Figura 23, onde pode-se identificar a existência de quatro
módulos básicos, para o uso do WEKA como ferramenta de mineração de dados.
Figura 23 – Tela de inicialização do WEKA

Fonte: WITTEN; FRANK (2000) - WEKA v3.6.0
79
O módulo Explorer possibilita a utilização de diversos algoritmos de pré-

processamento, de aprendizado de máquina e de avaliações. É indicado para um
conhecimento mais detalhado das técnicas empregadas, contudo não possui uma
função para salvar as configurações realizadas pelo usuário.
O módulo Experimenter possui a capacidade de comparar diferentes métodos

de aprendizado, inclusive analisando os resultados do módulo Explorer. O módulo
KnowledgeFlow disponibiliza uma interface gráfica muito utilizada em programas de
mineração de dados comerciais. Esta abordagem oferece mais facilidades aos
usuários. O módulo SimpleCLI oferece uma interface de texto para utilizar o modo
de linha de comando.
Neste trabalho, utiliza-se o módulo KnowledgeFlow que oferece mais recursos

e uma visão gráfica do fluxo de dados e de processamento.
3.6 IMPLEMENTAÇÃO DO FLUXO DE CONHECIMENTO NO WEKA
Inicialmente, para que o WEKA pudesse carregar a base de dados preparada

conforme os procedimentos já descritos, foi necessário exportar a base de dados do
Microsoft Office Access 2003 para um arquivo com extensão CSV20 que, como a
tradução do nome revela, dispõe os dados separados através de vírgulas. Este
processo foi realizado com a ferramenta de exportação de tabelas disponível no
Microsoft Office Access 2003.
Uma vez exportados os dados, realizou-se uma edição para que fosse
adaptado ao formato ARFF, como se pode ver na Figura 24. Este formato foi
desenvolvido pelo Departamento de Ciência da Computação da Universidade de
Waikato especificamente para ser utilizado no WEKA. Maiores informações sobre
este formato podem ser encontradas em Witten, Frank (2000, tradução nossa).
20
Sigla para Comma Separated Values
80
Figura 24 – Arquivo 01 no formato ARFF

O módulo KnowledgeFlow é uma interface gráfica de blocos, pela qual ocorre

a interação do usuário diretamente com o fluxo do conhecimento, como o próprio
nome sugere. Na Figura 25 temos a tela de trabalho deste módulo.
Figura 25 – Espaço de trabalho do módulo KnowledgeFlow

81
Para o desenvolvimento do fluxo deste trabalho, foram utilizados os seguintes

blocos:
- Bloco ArffLoader: realiza a carga do banco de dados, já no formato ARFF,

para o ambiente do KnowledgeFlow e que, neste trabalho, totalizou 10.714
registros;
- Bloco ClassAssigner: determina qual é a classe alvo, determinando assim os

atributos de saída;
- Bloco CrossValidationFoldMaker: extrai do banco de dados uma amostra

para teste e outra para treinamento utilizando um processo aleatório. Outras
informações sobre este método foram abordadas no tópico 2.3.3.1;
- Bloco J48: utilizado para implementar o algoritmo C4.5 que compõe uma
árvore de decisão;
- Bloco Multi Perceptron: utilizado para implementar uma rede neural baseada
em perceptrons multi-camada utilizando o algoritmo de aprendizagem
backpropagation com ajuste de momentum;
- Bloco TextViewer: extrai informações sobre o processamento do algoritmo

classificador (J48 e Multi Perceptron) e também sobre o desempenho através
do bloco ClassifierPerformanceEvaluator;
- Bloco GraphViewer: compõe um gráfico com a árvore de decisão

implementada no bloco J48;
- Bloco ClassifierPerformanceEvaluator: calcula a tabela de contingência e

outros indicadores de desempenho;
- Bloco PerformanceChart: compõe o gráfico ROC para análise do

desempenho dos algoritmos.
82
O fluxo completo desenvolvido neste trabalho pode ser visualizado na Figura

26, através da qual verificamos os blocos e suas conexões para o processamento
das informações.
Figura 26 – Fluxo de dados desenvolvido no WEKA

3.6.1 Configuração do ambiente KnowledgeFlow do WEKA
A configuração de cada um dos blocos dentro do software WEKA foi realizada

com base na pesquisa bibliográfica organizada ao longo do segundo capítulo, e será
descrita neste tópico.
Após a organização do fluxo de conhecimento conforme disposto na Figura

26, foram necessários ajustes em cada um dos blocos, personalizando a aplicação
para a necessidade deste trabalho.
O primeiro passo na configuração do ambiente foi no bloco ArffLoader onde o

usuário necessita determinar o local e o arquivo que será utilizado como a base de
dados. O ajuste foi definido como C:\Arquivo01.arff.
No próximo bloco do fluxo de conhecimento, o ClassAssigner, é necessário

informar qual é a classe-alvo que será utilizada como referência para o treinamento,
teste e validação dos dados que, neste caso, foi definida como a classe CLASS
contendo valores nominais “yes” e “no”.
83
Em seguida, chega-se à configuração do bloco CrossValidationFoldMaker. As

únicas duas opções configuráveis deste bloco são o número de partições (Folds)
que serão realizadas nos dados e qual será a semente de geração do número
randômico (seed), conforme explicita a Figura 27. A informação inserida no campo
seed é processada de forma que as partições só serão diferentes quando o campo
seed é modificado. Cabe salientar que no WEKA, mantendo a mesma constante
para geração do número randômico, sempre se obtêm os mesmos dados dentro de
cada partição (REUTEMANN, 2008, tradução nossa).
Figura 27 – Configuração do bloco CrossValidationFoldMaker

Neste trabalho, utiliza-se a recomendação de Witten e Frank (2000, p. 126,

tradução nossa) que defendem o uso de dez partições nos dados, citando que:
Extensos testes em numerosas bases de dados diferentes, com diferentes

técnicas de aprendizagem, demonstraram que é de cerca de dez o número
certo de partições para obter a melhor estimativa de erro.
Inicia-se, em seguida, as configurações dos dois métodos de classificação, o

bloco J48, responsável por implementar o algoritmo C4.5, e o bloco Multilayer
Perceptron, que implementa uma rede neural com retropropagação dos erros e
ajuste de momentum.
As configurações expostas sequencialmente, foram obtidas a partir de

diversas iterações, buscando obter o melhor desempenho possível, conforme o
método aplicado por Santos, Carvalho e Riul (2006). Para isso, foi implementado no
WEKA um conjunto de várias redes neurais e várias árvores de decisão. Este
84
conjunto passou pelas etapas de treinamento e teste utilizando a mesma base de

dados e através do mesmo procedimento, salvo as configurações individuais de
cada bloco classificador.
Para exemplificar a capacidade do WEKA, podemos verificar na Figura 28 a

implementação deste conjunto, onde se observa o emprego de vários algoritmos
paralelamente. Este procedimento completou o ciclo de configuração, visto que, em
conjunto com o conhecimento adquirido antes e durante este trabalho, resultou em
ajustes específicos e customizados para a base de dados utilizada. Isto vem de
encontro com Cios, Pedrycz e Swiniarski (1998, prefácio, tradução nossa), que
defendem que, ao aplicar-se um método de mineração de dados que revelou um
conhecimento inútil, devemos voltar e refazer os ajustes e que isto pode ser feito
“[...] mudando o jeito do algoritmo ser usado (parâmetros, diferentes amostras, etc.),
ou usando outros métodos [...]”.
Figura 28 – Fluxo de teste no KnowledgeFlow

3.6.1.1 Configuração da Árvore de Decisão
Iniciando pela configuração da árvore de decisão, encontra-se uma janela de

configuração disposta como mostra a Figura 29. Cada parâmetro é comentado e, em
negrito, é informado o valor final utilizado para o modelo.
85
Figura 29 – Configuração do bloco J48

BinarySplits: esta opção faz o tratamento das entradas nominais para que o
algoritmo possa realizar os cálculos na forma numérica. True
ConfidenceFactor: esta opção determina o intervalo de confiança que é
aplicado ao cálculo da poda. Quanto menor o valor, maior a ação da poda. As
iterações demonstraram que o valor de 12%, abaixo do padrão do modelo
retornam um bom modelo; 0.12
Debug: esta opção retorna mais informações para o console; False
minNumObj: número mínimo de exemplos por folha; 10
numFolds: número de partições nos dados utilizadas para a opção reduced-
error prunning, seu funcionamento é similar ao bloco CrossValidation,
realizando um ciclo com uma partição utilizada para a poda enquanto o
restante é utilizada para o crescimento da árvore; 3
reducedErrorPrunning: esta opção separa algumas partições para realizar
uma estimativa do erro de uma maneira alternativa ao algoritmo C4.5; False
saveInstanceData: opção que armazena os dados de treinamento para
visualização; False
86
seed: semente para originar os processos aleatórios; 1

subtreeRaising: uma das técnicas de poda previamente descrita nos tópicos
anteriores; True
unpruned: opção para originar uma árvore sem ação da poda; False
useLaplace: método que evita a probabilidade zero quando uma determinada
classe está ausente; False
Para a definição de alguns parâmetros, foi necessário executar testes práticos,

através do treinamento e respectivos testes, na base de dados. O Gráfico 9 ilustra o
que ocorre com a taxa de sucesso e a área sob a curva (AUC) quando variamos o
intervalo de confiança.
68,0%
64,0%
60,0%
56,0%
52,0%
0,25 0,12 0,06 0,03
Intervalo de Confiança AUC Taxa Sucesso
Gráfico 9 – Influência do intervalo de confiança na árvore de decisão

3.6.1.2 Configuração da rede neural artificial
Depois de configurada a árvore de decisão, o último passo de ajustes dos

parâmetros do sistema é a configuração da rede neural artificial. O Gráfico 10
demonstra o resultado do treinamento de diversas configurações para as redes
neurais. Verificamos neste gráfico que, com o aumento contínuo das épocas de
treinamento, a Taxa de Sucesso e a Área sob a Curva ROC (AUC) começam a
decair quando a rede é treinada com um número superior a 1500 épocas. Esta
análise serviu como base para a seleção da quantidade de épocas de treinamento,
otimizada para a base de dados deste trabalho.
87
67,0%
66,6%
66,2%
65,8%
65,4%
65,0%
64,6%
500 700 900 1100 1300 1500 1700 1900
Épocas de treinamento AUC Taxa Sucesso
Gráfico 10 – A influência das épocas sobre a AUC e a Taxa de Sucesso
Ainda, para determinar qual seria a configuração ideal das camadas ocultas
da rede neural, utilizou-se o critério citado por Santos, Carvalho e Riul (2006) onde
foram implementadas duas redes neurais. A primeira, utilizando somente uma
camada oculta contendo a metade da soma das entradas e saídas da rede,
totalizando assim 10 neurônios na camada oculta. O segundo método utilizou duas
camadas ocultas, com a primeira contendo o mesmo número das entradas e a
segunda contendo a soma das entradas e saídas.
Os testes demonstraram que, para a base de dados e a metodologia utilizada

neste trabalho, a rede neural com duas camadas ocultas é superior à rede com uma
única camada de neurônios ocultos. Estes resultados podem ser evidenciados
através do Gráfico 11 onde i é representa a primeira camada oculta e j a segunda.
67,5%
67,0%
66,5%
Taxa de Aprendizado
66,0%
0,3 0,2 0,1
2 camadas ocultas 1 camada oculta

i= 19 j=21 i =10
Gráfico 11 – Influência da Taxa de Aprendizado sobre a Taxa de Sucesso

88
Outra informação que pode ser extraída do Gráfico 11 é sobre a taxa de

aprendizado - o valor de 0,1 demonstra ser superior em relação à seus pares. Este
fator motivou a adoção desta taxa.
Os testes realizados com o parâmetro momentum mostraram que, quanto

maior o incremento deste parâmetro, ou seja, quanto maior o esforço para a
convergência, pior se tornava a taxa de sucesso e a área sob a curva do modelo,
para a base de dados analisada. Neste sentido, adotou-se a taxa de aprendizado de
0,1 e o valor padrão do momentum de 0,2 como parâmetros da rede neural
implementada.
A partir destas constatações, a seguinte configuração foi efetuada para a rede

neural:
89
Figura 30 – Configuração do bloco Multilayer Perceptron

Autobuild: realiza automaticamente as conexões entre as camadas, evitando

assim o trabalho manual; True
Debug: retorna dados ao console do WEKA; False
Decay:realiza o decremento da taxa de aprendizado ao longo das épocas; False
HiddenLayers: são as camadas ocultas. Através da iteração realizada, pode-
se observar que a opção de uma rede com duas camadas ocultas (19
neurônios conectados a 21 neurônios da segunda camada); 19, 21
LearningRate: é a taxa de aprendizado adotada; 0.1
90
Momentum: conforme já descrito anteriormente, o valor do momentum leva a

rede à convergência através da carga da iteração anterior, neste caso foi
utilizado o valor padrão; 0.2
NominalToBinaryFilter: Converte todos os valores nominais em valores
binários; True
NormalizeAttributes: Realiza a normalização, inclusive dos valores nominais
caso estes tenham sido convertidos pela opção anterior; True
NormalizeNumericClass: Realiza a normalização das classes numéricas
para que fiquem entre 1 e -1; True
RandomSeed: semente para originar os pesos aleatórios; 0
Reset: reinicia os pesos quando há divergência; False
TrainingTime: número de épocas de treinamento; 1300
ValidationSetSize: tamanho do conjunto de validação (compara o erro deste
conjunto de validação e realizar uma parada antecipada ao número de
treinamentos definido na opção anterior, caso o erro esteja crescente). 0
ValidationThreshold: limiar para validação. Indica o quanto o erro do conjunto
de validação pode ficar pior até que o treinamento seja interrompido. 20
Neste bloco temos uma opção que possibilita a construção manual da rede
neural através da definição de camadas ocultas e conexões. Esta interface é
carregada após ser configurada a opção “GUI” com o valor “true”, e uma tela de
trabalho é inicializada, ilustrada pela Figura 31.
91
Figura 31 – Opção Debug do bloco Multilayer Perceptron

3.7 ANÁLISE DOS RESULTADOS
Após o planejamento, a elaboração e a execução dos procedimentos

descritos neste trabalho, resta realizar o comparativo dos resultados apresentados
pelas técnicas utilizadas e avaliar sua validade como uma ferramenta nos propósitos
deste trabalho.
3.7.1 Análise da matriz de contingência
As matrizes de contingência obtidas para cada uma das duas técnicas de

mineração de dados aplicadas estão dispostas nos Quadro 7 e Quadro 8.
92
yes no classificado como....

5924 911 yes
2592 1287 no
Quadro 7 – Matriz de contingência da rede neural
yes no classificado como....

6081 754 yes
2857 1022 no
Quadro 8 – Matriz de contingência da árvore de decisão
Através destas informações pode-se realizar alguns apontamentos sobre os

modelos adotados.
A rede neural artificial implementada obteve uma taxa de sucesso 67,31%,

contudo, 3503 exemplos foram classificados de forma incorreta, sendo que destes,
911 foram apontados como potenciais consumidores de energia reativa (yes),
embora na verdade não o fossem.
Para a árvore de decisão, obteve-se um ganho com relação à quantidade de

casos de falso positivo (754 casos), contudo, a taxa de sucesso obtida pelo modelo
apresentou um percentual inferior ao modelo da rede neural, com 66,30% de
sucesso. O total de casos classificados incorretamente foi de 3611 casos, número
superior ao obtido na rede neural, como já evidenciava a taxa de sucesso.
Pode-se proceder a uma análise quanto ao custo de um erro nesta matriz,

remetendo ao problema real que este trabalho se propunha a explorar. Para esta
análise, é preciso que a situação real seja analisada, ou seja, se o sistema indicasse
os locais com maior possibilidade de faturamento reativo, as equipes seriam
deslocadas para atuar nestes locais, remanejando os medidores. Com esta ótica, as
duas possibilidades de erro no problema da indicação - ou não - dos locais com
faturamento de energia reativa têm a seguinte análise:
- Falso Positivo: o falso positivo ocorre quando o método de mineração

indica determinado cliente com a marcação “sim”, significando que se trata de um
cliente com possibilidade de faturamento de energia reativa. No mundo real, ao
93
receber tal sinalização, uma equipe com um custo X teria que ser deslocada até a
unidade consumidora para efetuar a troca do medidor eletromecânico de energia
ativa por um medidor eletrônico com medição de energia reativa. Este medidor
eletrônico que previamente já fora retirado de algum outro cliente que não
apresentava faturamento de energia reativa voltará a não registrar faturamento
reativo. O custo do erro neste caso é uma instalação desnecessária além de utilizar
o medidor em um local sem faturamento.
- Falso Negativo: O falso negativo indicaria um cliente com sua classe “não”,
informando então que este cliente não teria possibilidade de apresentar faturamento
de energia reativa. O custo do erro neste caso compõe somente o valor de energia
que será deixada de registrar, uma vez que nenhuma equipe será enviada ao local.
Portanto, os modelos que apresentam, na matriz de contingência, um menor índice

de falsos positivos no escopo específico do remanejo de medidores de energia
reativa, poderiam ser considerados superiores, desde que seus outros indicadores
de acerto (positivo verdadeiro e negativo verdadeiro) tenham uma boa performance.
Neste quesito, o algoritmo da rede neural artificial demonstrou que possui uma maior
taxa de sucesso, contudo a presença de um maior custo custo com Falsos Positivos
representa uma dúvida sobre como determinar o melhor algoritmo. Neste sentido, a
análise da curva ROC e o indicador da área sob a curva ROC vêm para contribuir.
3.7.2 Análise da curva ROC e a área sob a curva (AUC)
Para a análise da curva ROC, foi obtido, através do ambiente WEKA, o

Gráfico 12 que expressa a curva ROC dos dois algoritmos classificadores. Nota-se,
portanto, o predomínio da rede neural sobre a árvore de decisão, com ambas as
soluções alcançando valores maiores do que o limiar de 50%.
94
Gráfico 12 – Curva ROC com dois algoritmos

O índice da área sob a curva apresentou pouca variação, frente aos vários
modelos treinados e testados em ambos os algoritmos, conforme observado nos
tópicos anteriores. Verificou-se que a rede neural artificial demonstrou ser superior
ao logo de toda a curva ROC, podendo-se afirmar que o modelo neural proposto é
um classificador superior à árvore de decisão implementada.
3.7.3 A representação da árvore de decisão
A árvore de decisão desenvolvida no ambiente WEKA, através do módulo

J48, oferece a possibilidade de visualização das regras, com as quais são realizadas
as classificações dos padrões neste algoritmo. Através da análise das regras, um
novo conhecimento sobre as relações que impermeiam os dados poderia ser
alcançado.
Cabe aqui, portanto, apresentar o resultado, a fim de possibilitar que futuras

aplicações façam uso de seu resultado:
95
Figura 32 – Representação da Árvore de Decisão

Na árvore, verificamos os processos de decisão, distribuídos nas linhas que

realizam a conexão entre os nós. As folhas são representadas através dos
retângulos que contém a indicação do número de exemplos classificados
corretamente (à esquerda) e incorretamente (à direita).
96
4 CONCLUSÃO
Neste capítulo são comentados os métodos desenvolvidos, os seus

resultados, as sugestões de trabalhos futuros e, ao final avalia-se o trabalho como
um todo.
4.1 COMPARATIVO ENTRE O MÉTODO ATUAL E O PROPOSTO
Conforme abordado ao longo deste trabalho, a necessidade de pesquisar

formas mais eficientes de remanejo de medidores de energia surgiu a partir de uma
necessidade interna na concessionária de energia elétrica AES Sul.
Atualmente a taxa de sucesso dos especialistas do processo está, em média,

em 52%. Ou seja, em 52% dos casos de remanejo os potenciais consumidores de
demanda reativa são identificados corretamente.
Neste trabalho, buscou-se identificar outras fontes de informação que

pudessem agregar valor à mineração de dados. Neste sentido, várias informações
foram inseridas para a análise e submetidas a dois algoritmos classificadores: uma
rede neural e uma árvore de decisão. A taxa de sucesso destes algoritmos,
conforme abordamos no tópico 3.7.1 foi de 67,31% para a rede neural artificial e
66,30% para a árvore de decisão, ambos implementados no ambiente WEKA. Já a
área sob a curva obtida foi de 0,671 para a rede neural e 0,620 para a árvore de
decisão.
Para que possamos realizar um comparativo, sem o intuito de realizar uma

análise de viabilidade, mas que ao mesmo tempo possa nortear as decisões e
validar o modelo de aprendizado de máquina, a mesma base de dados foi submetida
ao processamento no software comercial Clementine, alcançando taxas de sucesso
de 66,31% para a rede neural e 66,01% para a árvore de decisão. A área sob a
97
curva ROC para a rede neural processada no Clementine foi de 0,672 e para a
árvore de decisão foi de 0,650.
Através da análise destes percentuais de acerto, e da área sob a curva ROC,

pode-se avaliar que os métodos de aprendizado de máquina descritos neste
trabalho possuem um desempenho superior à técnica manual, atualmente utilizada,
e que uma solução de mineração de dados poderia contribuir, no sentido de agregar
valor e competitividade ao processo de remanejo de medidores. Contudo, este
trabalho não é, por si só, conclusivo, no sentido de que outras validações, métodos e
estudos podem ser aplicados.
4.2 OPORTUNIDADES DE PESQUISA FUTURA
Este trabalho adotou dois algoritmos de aprendizado de máquina: a árvore de

decisão e a rede neural artificial. Ambas foram implementadas através do ambiente
WEKA e comparadas com a performance de especialistas e de outro pacote
comercial, o Clementine. Entretanto, as soluções adotadas não foram esgotadas e
podem estender-se à outros trabalhos nesta área.
Como sugestões de trabalhos que poderão ser desenvolvidos futuramente,

podem ser listadas:
- A aplicação da técnica descrita neste trabalho em outras concessionárias de

energia elétrica;
- A avaliação de outros algoritmos que possam elevar o índice de acertos;
- Um estudo da viabilidade técnica e econômica da aplicação de medidores

eletrônicos em massa, com foco na integração de uma rede de serviços
remotos;
98
- Uma avaliação econômica da relação entre o ganho de acertividade e o

custo de implementação de um sistema de mineração de dados, em conjunto
com a avaliação amostral em campo dos dados processados pela rede neural
e pela árvore de decisão;
- O desenvolvimento de um sistema dedicado para o processo de remanejo

de medidores de energia elétrica;
- A avaliação do esforço computacional envolvido na tarefa de análise de todo

o banco de dados da AES Sul, com os algoritmos propostos;
- A extração das regras da rede neural artificial com uma avaliação frente às
regras fornecidas pelo algoritmo da árvore de decisão;
- A avaliação do impacto da distorção harmônica sobre o sistema de energia,

suas implicações face à atual regulação do setor e uma proposta de
adequação da regulação.
4.3 CONSIDERAÇÕES FINAIS E RECOMENDAÇÕES
Face à análise das informações presentes neste trabalho, pode-se identificar

que o objetivo foi alcançado, uma vez que os algoritmos de mineração de dados
demonstraram um perceptível ganho, sobre os processos manuais, no foco do
remanejo de medidores de energia reativa.
O presente trabalho também atua como um propulsor, para um debate interno

na AES Sul, sobre a adoção de um sistema de mineração de dados que possa
comportar, dentre outras aplicações, a otimização do remanejo de medidores de
energia.
99
REFERÊNCIAS
AES ELETROPAULO. Sistema Clementine. São Paulo, SP, 2009.
AES SUL. Sistema Notus: base de dados da Subestação Canoas. RS, 2009.
AMORIM, Edson. Efeitos da correção do FP na BT sob o ponto de vista da

eficiência energética. 2008. Disponível em: <http://www.tec.abinee.org.br/2008/
arquivos/20a2_1.pdf>. Acesso em: 07 abr. 2009.
ANDRADE, Thompson A.;LOBÃO, Waldir J. A. Texto para discussão Nº 489:

elasticidade renda e preço da demanda residencial de energia elétrica no Brasil.
1997. Disponível em: <http://www.ipea.gov.br/pub/td/td0489.pdf>. Acesso em: 04
mar. 2009.
BARUDI, Elias João Epifânio. Tombamento patrimonial nas empresas do setor

elétrico brasileiro. 2004. Monografia (Especialização em Consultoria em Cont.
Financeira e Controladoria) - Universidade Estadual do Oeste do Paraná, Foz do
Iguaçu, 2004. Disponível em: <http://www.fae.edu/publicacoes/pdf/art_cie/
art_35.pdf>. Acesso em: 10 jan. 2009.
BERRY, Michael J. A.; LINOFF, Gordon. Data mining techniques : for marketing,
sales, and customer support. New York: John Wiley & Sons, 1997.
BOYLESTAD, Robert L., Introdução à análise de circuitos. 8 ed. Rio de Janeiro:

Prentice-Hall, 1998.
BRAGA, Ana Cristina da Silva. Curvas ROC: aspectos funcionais e aplicações.

2000. 243 f. Tese (Doutorado em Engenharia de Produção) -- Universidade do
Minho, 2000. Disponível em: <http://repositorium.sdum.uminho.pt/bitstream
/1822/195/1/tese_doutACB.pdf>. Acesso em: 12 jan. 2009.
BRASIL. Ministério de Minas e Energia. AGÊNCIA NACIONAL DE ENERGIA

ELÉTRICA. Manual de Contabilidade do Serviço Público de Energia Elétrica.
Brasília, Janeiro de 2007. Disponível em: <http://www.aneel.gov.br/aplicacoes
/leitura_arquivo/ arquivos/Manual-jan-2007.pdf>. Acesso em: 30 mar. 2009.
100
BRASIL. Ministério de Minas e Energia. AGÊNCIA NACIONAL DE ENERGIA

ELÉTRICA. Resolução n º456, de 2000. Brasília, Disponível em:
<http://www.aneel.gov.br/ cedoc/res2000456.pdf>. Acesso em: 30 mar. 2009.
______. Ministério de Minas e Energia. AGÊNCIA NACIONAL DE ENERGIA

ELÉTRICA. Superintendência de Regulação dos Serviços de Distribuição. Nota
Técnica nº 0013/2009. Brasília, Janeiro de 2009. Disponível em:
<http://www.aneel.gov.br/aplicacoes/consulta_publica/documentos/Nota%20Técnica
%20n%2000132009-SRDANEEL.zip>. Acesso em: 25 mar. 2009.
______. Ministério de Minas e Energia. AGÊNCIA NACIONAL DE ENERGIA

ELÉTRICA. Por dentro da conta de luz: informação de utilidade pública. Brasília,
Outubro de 2008. Disponível em: <http://www.aneel.gov.br/arquivos/ PDF/
Cartilha_1p_atual.pdf>. Acesso em: 06 abr. 2009.
CÂMARA, Fernando Portela. Coluna Psiquiatria contemporânea: validação de

procedimentos pela curva ROC. Psychiatry on line Brasil. Volume 14. Número 4.
Abr. 2009. Disponível em: <http://www.polbr.med.br/ano09/cpc0409.php>. Acesso
em: 25 mar. 2009.
CHIU, Eugene et al. Mathematical theory of Claude Shannon. Disponível em:

<http://www.scribd.com/doc/16024/The-MAthematical-Theory-of-Claude-Shannon>.
Acesso em: 21 fev. 2009.
CIOS, Krzysztof J.; PEDRYCZ, Witold; SWINIARSKI, Roman W. Data mining :

methods for knowledge discovery. Boston: Kluwer, 1998.
ELDER RESEARCH INC. Tool Comparison. Disponível em:

<http://www.datamininglab.com/TOOLCOMPARISON/tabid/58/Default.aspx>.
Acesso em: 10 mar. 2009.
ELDER, John F. IV; ABBOTT, Dean W.. A comparison of leading data mining tools.
In: International Conference on Knowledge Discovery and Data Mining, 4th., 1998,
New York. Anais... New York, 1998. Disponível em: <http://datamininglab.com/
Portals/0/tool%20eval%20articles/kdd98_elder_abbott_nopics.pdf>. Acesso em: 13
mar. 2009.
ESPÍNDOLA, Rogério Pinto. Sistema inteligente para classificação de dados.

2004. 113 f. Tese (Doutorado em Engenharia Civil) -- Universidade Federal do Rio
de Janeiro, RJ, 2004. Disponível em: <http://www.anp.gov.br/CapitalHumano
/Arquivos/PRH02/Rogerio-Pinto-Espindola_PRH02_UFRJ-COPPE-PEC_D.pdf>.
Acesso em: 10 jan. 2009.
101
FAWCETT, Tom. ROC Graphs: Notes and practical considerations for

researchers. 2004. Disponível em: <http://home.comcast.net/~tom.fawcett/
public_html/papers/ROC101.pdf>. Acesso em: 12 jan. 2009.
FAYYAD, Usama M. et al. Advances in knowledge discovery and data mining.

Menlo Park: MIT, 1996.
FREEMAN, James A.; SKAPURA, David M. Neural networks: algorithms,

applications, and programming techniques. Reading: Addison-Wesley, 1992.
GONZÁLEZ , Marco Aurélio Stumpf. Aplicação de técnicas de descobrimento de

conhecimento em bases de dados e de inteligência artificial em avaliação de
imóveis. Novo Hamburgo: SGE, 2003.
HAND, David; MANNILA, Heikki; SMYTH, Padhraic. Principles of data mining.

Cambridge: MIT, 2001.
HAYKIN, Simon. Redes neurais: princípios e prática. 2. ed. Porto Alegre: Artes
Médicas, 2001.
HU, Xiaohua. DB-HReduction: A Data Preprocessing Algorithm for Data Mining

Applications. Disponível em: <http://www.cis.drexel.edu/faculty/thu/ research-
papers/aml3730.galley.pdf>. Acesso em: 12 fev. 2009.
KDNUGGETS. Software for data mining, analytics and knowledge discovery.

Disponível em: <http://www.kdnuggets.com/software>. Acesso em: 15 fev. 2009.
KOVÁCS, Zsolt László. Redes neurais artificiais: fundamentos e aplicações: um

texto básico. 2. ed. São Paulo: Collegium Cognitio, 1996.
LANS, Rick F. Van Der. Introduction to sql : mastering the relational database
language. 3rd. ed. Harlow: Addison-Wesley, 2000.
LUDOVICO, Hiago. Medidor eletrônico ELO 2106 [mensagem pessoal]. Mensagem

recebida por <eduardog.girardi@aes.com> em 2 jun. 2009.
102
MAGALHAES, Arthur Olivare; MELLO, Gilmar Ribeiro; BITENCOURT, Ana C.E. dos
Passos. DEPRECIAÇÃO: Analisando os livros de contabilidade para iniciantes.
CONGRESSO USP INICIAÇÃO CIENTÍFICA EM CONTABILIDADE, 3, 2006, São
Paulo. Pesquisa contábil e desenvolvimento econômico-social. Disponível em:
<www.congressouspfipecafi.org/artigos32006/310.pdf>. Acesso em: 18 jan 2009.
MATTAR, Carlos A. Calixto. PRODIST – Atualização da regulação para as

distribuidoras. In: METERING LATIN AMERICA, 6., 2008, Rio de Janeiro. Anais...
Rio de Janeiro, 2008. (Documento de distribuição restrita aos participantes do
evento)
MEDEIROS FILHO, Sólon de Medição de energia elétrica. 4. ed. Rio de Janeiro:

LTC, 1997.
METERING LATIN AMERICA, 2008, Rio de Janeiro, Anais... Rio de Janeiro, 2008.
(Documento de distribuição restrita aos participantes do evento)
MICHALSKI, Ryszard S.; BRATKO, Ivan; KUBAT, Miroslav; Machine learning and
data mining: methods and applications. Chichester: John Wiley & Sons, 1998.
MITCHELL, Tom Michael. Machine learning. Boston: McGraw-Hill, 1997.
PAIXÃO, Hudson de Oliveira. Indicadores de qualidade do ar como instrumento

de gestão ambiental em operação de unidades de geração termelétrica a gás
natural – estudo de caso da usina termelétrica mário lago. 2008. 177 f.
Dissertação (Mestrado em Engenharia Ambiental) -- Centro Federal de Educação
Tecnológica de Campos, RJ, 2008. Disponível em: <http://web0.cefetcampos.
br/observatorioambiental/publicacoes-cientificas/ dissertacoes/Tese-
Hudson_31_10_2008.pdf>. Acesso em: 10 jan. 2009.
PAUL, Celso Roberto. Descoberta de conhecimento em bases de dados

comerciais através da técnica de árvores de decisão. 2000. 88 f. Monografia
(Especialização em Sistemas de Informação) -- Universidade de Santa Cruz do Sul,
RS, 2000.
PENNA, Cristiane et al. O impacto dos programas de eficiência energética na

qualidade de energia elétrica. 2001. Disponível em: <http://www.aneel.gov.br
/biblioteca/Citenel2001/trabalhos%5C21.pdf>. Acesso em: 04 mar. 2009.
103
PFAHRINGER, Bernhard. Machine learning using WEKA. 2009. Disponível em:

<http://prdownloads.sourceforge.net/weka/Weka_a_tool_for_exploratory
_data_mining.ppt>. Acesso em: 26 mar. 2009.
PIRES, Igor Amariz. Caracterização de harmônicos causados por equipamentos

eletro-eletrônicos residenciais e comerciais no sistema de distribuição de
energia elétrica. 2006. 157 f. Dissertação (Mestrado em Engenharia Elétrica) --
Universidade Federal de Minas Gerais, RS, 2006. Disponível em:
<http://www.cpdee.ufmg.br/documentos/Defesas/606/versao FinalIgor.pdf>. Acesso
em: 15 mar. 2009.
PYLE, Dorian. Data preparation for data mining. San Francisco: Morgan
Kaufmann, 1999.
RAMOS, Dorel Soares. Contribuição da Energias do Brasil para a Audiência

Pública Nº 02/2009: manual de contabilidade patrimonial do setor elétrico.
Disponível em: <http://www.aneel.gov.br/aplicacoes/audiencia/
arquivo/2009/002/contribuicao/energias_do_brasil.pdf>. Acesso em: 03 mar. 2009.
REUTEMANN, Peter. Question about cross validation. Disponível em:

<http://www.nabble.com/Question-about-cross-validation-td18456623.html>. Acesso
em: 25 abr. 2009.
SANTOS, Afonso et al. Vários autores. Conservação de energia: eficiência

energética de instalações e equipamentos. 3. ed. Itajubá: FUPAI, 2001.
SANTOS, Pettras L. B.; CARVALHO, André C. P. L. F.; RIUL, Antonio J. Utilização

de redes neurais artificiais para classificação de diferentes soluções ultra-
diluídas. 2006. Disponível em: <http://www.sbc.org.br/
index.php?language=1&subject=101&content=article&option=pdf&aid=532>. Acesso
em: 05 fev. 2009.
SILVA, Felipe de Castro da. Análise ROC. São José dos Campos, SP, 2006.
Disponível em: <http://www.dpi.inpe.br/~felipe/works/inpe/spr/roc_analyzes.pdf>.
Acesso em: 15 jan. 2009.
SOUZA, Fabiana Pöttker. Caracterização de harmônicos causados por

equipamentos eletro-eletrônicos residenciais e comerciais no sistema de
distribuição de energia elétrica. 2000. 209 f. Tese (Doutorado em Engenharia
Elétrica) -- Universidade Federal de Santa Catarina, SC, 2000. Disponível em:
<http://www.ivobarbi.com/PDF/Teses/Tese_Fabiana%20Pottker.pdf>. Acesso em: 15
mar. 2009.
104
SOUZA, Mauro S. Ribeiro de. Mineração de dados: uma implementação

fortemente acoplada a um sistema gerenciador de banco de dados paralelo.
1998. 67 f. Tese (Mestrado em Engenharia de Sistemas da Computação) --
Universidade Federal do Rio de Janeiro, RJ, 1998. Disponível em: <
http://www.cos.ufrj.br/~marta/papers/TeseMauroS.pdf>. Acesso em: 23 jan. 2009.
SOVIERZOSKI, Miguel Antonio; ARGOUD, Fernanda Isabel Marques; AZEVEDO,

Fernando Mendes de. Avaliação do classificador neural binário com análise ROC.
CONGRESSO BRASILEIRO DE ENGENHARIA BIOMÉDICA, 21, 2008, Bahia.
Anais.... Disponível em: <http://www.sbeb.org.br/cbeb2008/
Intelig%EAncia%20Artificial%20e%20Redes%20Neurais/o_1117.pdf>. Acesso em:
10 fev 2009.
TAVARES, Leonardo G.; LOPES, Heitor S.; LIMA, Carlos R.E. Estudo comparativo
de métodos de aprendizado de máquina na detecção de regiões promotoras de
genes de escherina coli. SIMPOSIO BRASILEIRO DE INTELIGÊNCIA
COMPUTACIONAL, 1, 2007, Florianópolis. Anais... Disponível em:
<http://www.cpgei.ct.utfpr.edu.br/~hslopes/publicacoes/2007/sbic2007e.pdf>.
Acesso em: 05 mar. 2009.
VIEIRA, Sérgio. ENERGIA REATIVA: o que o consumidor paga e não sabe. Saber
Eletrônica On-Line, São Paulo, 10 jan. 2008. Disponível em:
<http://www.sabereletronica.com.br/secoes/leitura/353>. Acesso em: 22 mar. 2009.
WEISS, Sholom M.; INDURKHYA, Nitin. Predictive data mining: a practical guide.
San Francisco: Morgan Kaufmann, 1998.
WEG. Manual para correção do fator de potência. 2007. Disponível em:

<http://catalogo.weg.com.br/files/artigos/1-1770.pdf>. Acesso em: 05 mar. 2009.
WILDI, Theodore. Electrical machines, drives and power systems. 4. ed. Upper
Saddle River: Prentice Hall, 2000.
WITTEN, Ian H.; FRANK, Eibe. Data mining: practical machine learning tools and
techniques with java implementations. San Francisco: Morgan Kaufmann, 2000.
105
APÊNDICE A – CÓDIGOS SQL
Neste apêndice serão demonstrados os códigos SQL utilizados para

desenvolver uma base de dados consolidada, possibilitando sua posterior aplicação
em ferramentas de mineração de dados.
Código A.1: Energia ATIVA (Tabela 04)

SELECT [%$##@_Alias].nuc, Sum([%$##@_Alias].[k-2007-01]) AS [kWh-2007-01],
Sum([%$##@_Alias].[k-2007-02]) AS [kWh-2007-02], Sum([%$##@_Alias].[k-2007-03]) AS [kWh-
2007-03], Sum([%$##@_Alias].[k-2007-04]) AS [kWh-2007-04], Sum([%$##@_Alias].[k-2007-05]) AS
[kWh-2007-05], Sum([%$##@_Alias].[k-2007-06]) AS [kWh-2007-06], Sum([%$##@_Alias].[k-2007-
07]) AS [kWh-2007-07], Sum([%$##@_Alias].[k-2007-08]) AS [kWh-2007-08], Sum([%$##@_Alias].[k-
2007-09]) AS [kWh-2007-09], Sum([%$##@_Alias].[k-2007-10]) AS [kWh-2007-10],
2008-06]) AS [kWh-2008-06], Sum([%$##@_Alias].[k-2008-07]) AS [kWh-2008-07],
2009-03]) AS [kWh-2009-03] INTO ATIVA
FROM (SELECT nuc, kWh AS [k-2007-01], EXPR1002 AS [k-2007-02],EXPR1003 AS [k-
2007-03],EXPR1004 AS [k-2007-04],EXPR1005 AS [k-2007-05],EXPR1006 AS [k-2007-
06],EXPR1007 AS [k-2007-07],EXPR1008 AS [k-2007-08],EXPR1009 AS [k-2007-09],EXPR1010 AS
[k-2007-10],EXPR1011 AS [k-2007-11],EXPR1012 AS [k-2007-12],EXPR1013 AS [k-2008-
[k-2008-12],EXPR1025 AS [k-2009-01],EXPR1026 AS [k-2009-02],EXPR1027 AS [k-2009-03]
FROM(
SELECT nuc,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
where periodo=200701
group by periodo,nuc,kWh
106
union all
SELECT nuc,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
107
union all
SELECT nuc,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0,0
108
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0,0
FROM FER
109
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kWh
FROM FER
)
) AS [%$##@_Alias]
GROUP BY [%$##@_Alias].nuc;
110
Código A.2: Energia REATIVA (Tabela 05)

SELECT [%$##@_Alias].nuc, Sum([%$##@_Alias].[k-2007-01]) AS [kVArh-2007-01],
Sum([%$##@_Alias].[k-2007-02]) AS [kVArh-2007-02], Sum([%$##@_Alias].[k-2007-03]) AS [kVArh-
2007-03], Sum([%$##@_Alias].[k-2007-04]) AS [kVArh-2007-04], Sum([%$##@_Alias].[k-2007-05])
AS [kVArh-2007-05], Sum([%$##@_Alias].[k-2007-06]) AS [kVArh-2007-06], Sum([%$##@_Alias].[k-
2007-07]) AS [kVArh-2007-07], Sum([%$##@_Alias].[k-2007-08]) AS [kVArh-2007-08],
AS [kVArh-2009-02], Sum([%$##@_Alias].[k-2009-03]) AS [kVArh-2009-03] INTO energia_kvarh
FROM (SELECT nuc, kVArh AS [k-2007-01], EXPR1002 AS [k-2007-02],EXPR1003 AS [k-
2007-03],EXPR1004 AS [k-2007-04],EXPR1005 AS [k-2007-05],EXPR1006 AS [k-2007-
[k-2008-12],EXPR1025 AS [k-2009-01],EXPR1026 AS [k-2009-02],EXPR1027 AS [k-2009-03]
FROM(
SELECT nuc,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
group by periodo,nuc,kVArh
union all
SELECT nuc,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
111
FROM FER
union all
SELECT nuc,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
112
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0,0
FROM FER
113
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0,0
114
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,kVArh
FROM FER
)
) AS [%$##@_Alias]
Código A.3: Valor FER (Tabela 06)

SELECT [%$##@_Alias].nuc, Sum([%$##@_Alias].[F-2007-01]) AS [FER-2007-01],
Sum([%$##@_Alias].[F-2007-02]) AS [FER-2007-02], Sum([%$##@_Alias].[F-2007-03]) AS [FER-
2007-03], Sum([%$##@_Alias].[F-2007-04]) AS [FER-2007-04], Sum([%$##@_Alias].[F-2007-05]) AS
[FER-2007-05], Sum([%$##@_Alias].[F-2007-06]) AS [FER-2007-06], Sum([%$##@_Alias].[F-2007-
07]) AS [FER-2007-07], Sum([%$##@_Alias].[F-2007-08]) AS [FER-2007-08],
115

[FER-2009-02], Sum([%$##@_Alias].[F-2009-03]) AS [FER-2009-03] INTO valor_reativo
FROM (SELECT nuc, FER AS [F-2007-01],EXPR1002 AS [F-2007-02],EXPR1003 AS [F-
2007-03],EXPR1004 AS [F-2007-04],EXPR1005 AS [F-2007-05],EXPR1006 AS [F-2007-
06],EXPR1007 AS [F-2007-07],EXPR1008 AS [F-2007-08],EXPR1009 AS [F-2007-09],EXPR1010 AS
[F-2007-10],EXPR1011 AS [F-2007-11],EXPR1012 AS [F-2007-12],EXPR1013 AS [F-2008-
[F-2008-05],EXPR1018 AS [F-2008-06],EXPR1019 AS [F-2008-07],EXPR1020 AS [F-2008-
[F-2008-12],EXPR1025 AS [F-2009-01],EXPR1026 AS [F-2009-02],EXPR1027 AS [F-2009-03]
FROM(
SELECT nuc,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
group by periodo,nuc,fer
union all
SELECT nuc,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
116
union all
SELECT nuc,0,0,0,0,fer ,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
117
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0,0
FROM FER
union all
118
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0,0
FROM FER
119
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer,0
FROM FER
union all
SELECT nuc,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,0,fer
FROM FER
)
) AS [%$##@_Alias]
Código A.4: Primeira intersecção entre as tabelas 04, 05, 06 e 01

SELECT A.*, B.*, C.*, D.NUC, D.INSTALACAO, D.PER_INST, E.NUC, E.CLASSE, E.[NOME
CT] INTO PRIM
FROM ATIVA AS A, energia_kvarh AS B, valor_reativo AS C, DATA_INST AS D, CLASSE AS E
WHERE (((A.nuc)=[B].[nuc] And (A.nuc)=[C].[nuc]) AND ((C.nuc)=[D].[nuc]) AND
(D.NUC=E.NUC));
Código A.5: Transformação da Tabela 02 em Tabela 07

SELECT [%$##@_Alias].nuc, [%$##@_Alias].CIDADE, [%$##@_Alias].CKT,
[%$##@_Alias].ALIM, Sum([%$##@_Alias].[p-VEN]) AS [P-VENT], Sum([%$##@_Alias].[P-SOLD])
AS [P-SOLDA], Sum([%$##@_Alias].[P-REFRIP]) AS [P-REFRIPQ], Sum([%$##@_Alias].[P-
REFRIG]) AS [P-REFRIGD], Sum([%$##@_Alias].[P-MOTO]) AS [P-MOTOR],
Sum([%$##@_Alias].[P-MATESC]) AS [P-MATESCR], Sum([%$##@_Alias].[P-MAQLA]) AS [P-
MAQLAV], Sum([%$##@_Alias].[P-MAQELE]) AS [P-MAQELET], Sum([%$##@_Alias].[P-CO]) AS
[P-COM], Sum([%$##@_Alias].[P-A]) AS [P-AR], Sum([%$##@_Alias].[P-AQUE]) AS [P-AQUEC]
INTO ARTEFATOS
FROM (SELECT nuc, CIDADE, CKT,ALIM, POT AS [p-VEN], EXPR1005 AS [P-
SOLD],EXPR1006 AS [P-REFRIP],EXPR1007 AS [P-REFRIG],EXPR1008 AS [P-MOTO],EXPR1009
120
AS [P-MATESC],EXPR1010 AS [P-MAQLA],EXPR1011 AS [P-MAQELE],EXPR1012 AS [P-

CO],EXPR1013 AS [P-A],EXPR1014 AS [P-AQUE]
FROM(
SELECT nuc,CIDADE, CKT,ALIM,POT,0,0,0,0,0,0,0,0,0,0
FROM ARTEF
where GRUPO='VENT'
group by GRUPO,nuc,POT,cidade,ckt,alim
union all
SELECT nuc,CIDADE, CKT,ALIM,0,POT,0,0,0,0,0,0,0,0,0
FROM ARTEF
where GRUPO='SOLDA'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,POT,0,0,0,0,0,0,0,0
FROM ARTEF
where GRUPO='REFRIPQ'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,POT,0,0,0,0,0,0,0
FROM ARTEF
where GRUPO='REFRIGD'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,POT,0,0,0,0,0,0
FROM ARTEF
where GRUPO='MOTOR'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,0,POT,0,0,0,0,0
FROM ARTEF
where GRUPO='MATESCR'
union all
121
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,0,0,POT,0,0,0,0

FROM ARTEF
where GRUPO='MAQLAV'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,0,0,0,POT,0,0,0
FROM ARTEF
where GRUPO='MAQELET'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,0,0,0,0,POT,0,0
FROM ARTEF
where GRUPO='COM'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,0,0,0,0,0,POT,0
FROM ARTEF
where GRUPO='AR'
union all
SELECT nuc,CIDADE, CKT,ALIM,0,0,0,0,0,0,0,0,0,0,POT
FROM ARTEF
where GRUPO='AQUEC'
)
) AS [%$##@_Alias]
GROUP BY [%$##@_Alias].nuc, [%$##@_Alias].CIDADE, [%$##@_Alias].CKT,
[%$##@_Alias].ALIM;
Código A.6: Intersecção entre código A.4 e as Tabelas 03 e 07, gerando a

Tabela 08
SELECT A.*, B.*,C.* INTO TABELA 08
FROM PRIM AS A, ARTEFATOS AS B, TENSAO AS C
WHERE [A].[A_NUC]=[B].[NUC] AND [B].[NUC]=[C].[NUC];
122
APÊNDICE B – REMANEJO DE MEDIDORES
Este apêndice vem para exemplificar alguns aspectos importantes no

remanejo de medidores realizado na concessionária de distribuição AES Sul.
Primeiramente, são identificados os clientes que possuem medidores de

energia reativa e que não apresentam consumo elevado e faturamento desta
energia. Estes medidores eletrônicos são então retirados destes locais e testados
conforme as normas metrológicas específicas.
Em um terceiro momento, são identificados os locais com os maiores

consumos de energia ativa. Nestes locais são instalados os medidores eletrônicos
para a aferição de energia reativa.
No gráfico B.1 pode-se visualizar um exemplo do fluxo deste processo no

mapa de concessão da AES Sul.
Gráfico B.3 - Visão geral do processo de remanejo de medidores de energia reativa
Atualmente a Empresa conta com, aproximadamente, 26 mil medidores

eletrônicos de energia reativa instalados em sua área de concessão. O processo de
análise é realizado mensalmente através de planilhas e análise dos dados.

TCC Eduardo Girardi

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

TCC Eduardo Girardi

Enviado por

Direitos autorais:

Formatos disponíveis

UNIVERSIDADE DO VALE DO RIO DOS SINOS – UNISINOS

UNIDADE ACADÊMICA DE GRADUAÇÃO

AVALIAÇÃO DO USO DE MINERAÇÃO DE DADOS NA OTIMIZAÇÃO DE

AVALIAÇÃO DO USO DE MINERAÇÃO DE DADOS NA OTIMIZAÇÃO DE

Trabalho de Conclusão de Curso

Orientador: Profº João Olegário de Oliveira de Souza

Agradeço ao Professor João Olegário de Oliveira de Souza que, como

Agradeço também aos amigos e colegas pelo apoio e conhecimento

Especialmente agradeço à minha família pelo apoio contínuo, incentivo e

A distribuição de energia elétrica é um serviço básico e indispensável à população,

Palavras-Chaves: Árvores de Decisão. Classificação de Padrões. Energia Reativa.

Distribution of Electricity is a basic and indispensable service to the population, with

Keywords: Pattern classification; Artificial intelligence; Data mining; Neural networks;

Figura 1 - Triângulo das potências ............................................................................22

Gráfico 1 – Formas de onda da tensão e corrente ....................................................21

Quadro 1 - Fator de potências em vários países.......................................................23

Neste capítulo abordam-se: o objetivo deste trabalho, os métodos

Após a reestruturação do setor elétrico brasileiro, iniciada na década de 90,

Pelo caráter regulatório adotado no Brasil, as concessionárias de energia

A utilização de cargas com baixo fator de potência conectadas ao sistema

Assim como a expansão do mercado e dos consumidores, os dados

O presente trabalho atua nos propósitos da modicidade tarifária, buscando os

A otimização apresentada neste trabalho foi realizada através do uso do

Através da avaliação do presente trabalho, será possível verificar se as duas

1.2 ESTRUTURA DO TRABALHO

Este trabalho se fundamenta em quatro capítulos: o capítulo introdutório

1.3 RELAÇÃO COM DISCIPLINAS

A determinação para o desenvolvimento deste trabalho surgiu de uma

Este capítulo apresenta uma síntese da bibliografia utilizada como

2.1 O SETOR ELÉTRICO BRASILEIRO

O setor elétrico brasileiro passou por diversas mudanças em seu modelo de

2.1.1 A regulação do setor elétrico brasileiro

Em 1995, o governo brasileiro, através da Lei das Concessões, criou as

Em seu artigo 64, a Resolução nº 456 da ANEEL estabelece em 0,92 o limite

Estabelecido esse limite do fator de potência, era necessário estabelecer

O fator de potência das instalações da unidade consumidora, para efeito de

Os clientes de baixa tensão, supridos em tensão abaixo de 2,3 kV e citados

A forma de cálculo para o faturamento dos clientes do grupo “B” é

FER = valor do faturamento total correspondente ao consumo de energia

Com base no que foi exposto, verifica-se que a instalação de um medidor

2.1.2 A medição eletrônica em clientes atendidos em baixa tensão

A fim de entender porque as concessionárias de energia, de um modo geral,

ano independentemente da adoção de um modelo eletrônico ou mecânico de

[...] o declínio no potencial de serviços do imobilizado tangível e de outros

A depreciação dos ativos das empresas de distribuição de energia elétrica no

[...] sobre a implantação de medidores eletrônicos, a regulamentação atual

Ainda, a Nota Técnica nº 0013/2009-SRD/ANEEL esclarece que (BRASIL,

Tendo como base a experiência internacional, verifica-se que a falta de

Verifica-se, portanto, que as concessionárias de energia e os órgãos de

O estado prematuro dos estudos de viabilidade para a aplicação de medidores

Este trabalho se propõe a desenvolver uma avaliação do uso de dois métodos

2.2 O FATOR DE POTÊNCIA

Neste tópico serão abordados os conceitos básicos que envolvem o fator de

A energia consumida nas indústrias, residências, etc, é composta

Gráfico 1 – Formas de onda da tensão e corrente

A potência elétrica é constituída de duas componentes, a potência ativa e a

Os motores elétricos de indução possuem as características de indutores que

A potência aparente, resultado da composição entre a potência ativa e

Figura 1 - Triângulo das potências

Os lados deste triângulo são relacionados pelo ângulo Ф, sendo o cosseno de

O consumo de energia ativa e reativa em um sistema de distribuição, pode

Consumo de Energia Ativa

Consumo de Energia Reativa