Você está na página 1de 72

Revisão da Metodologia de Estabelecimento

dos Limites dos Indicadores Coletivos de


Continuidade
Documento Anexo à Nota Técnica n° 0028/2010-SRD/ANEEL, de 30/06/2010

Superintendência de Regulação dos Serviços de Distribuição – SRD

Brasília, Julho de 2010


Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Conteúdo

Lista de Abreviaturas e Siglas........................................................................................................ 3


1 Introdução ............................................................................................................................. 4
2 Metodologia Vigente ............................................................................................................. 6
3 Contribuições à Consulta Pública n.° 043/2009 e Demais Propostas Encontradas na
Literatura...................................................................................................................................... 11
3.1 Contribuições à Consulta Pública n.° 043/2009 ......................................................... 11
3.1.1 Atributos dos Conjuntos ......................................................................................... 11
3.1.2 Método de Classificação ........................................................................................ 12
3.1.3 Definição dos Limites para os Indicadores Coletivos ............................................. 13
3.2 Algumas Propostas Encontradas na Literatura .......................................................... 13
3.2.1 Proposta de procedimentos e metodologia para estabelecimento de metas de
qualidade (DEC e FEC) para concessionárias de distribuição de energia elétrica através da
análise comparativa (Tanure, 2004).................................................................................... 13
3.2.2 Classificação de conjuntos consumidores de energia elétrica via mapas auto-
organizáveis e estatística multivariada (Sperandio, 2004) .................................................. 14
3.2.3 Um modelo de análise envoltória de dados para estabelecimento das metas de
continuidade do fornecimento de energia elétrica (Pessanha, 2006).................................. 15
4 Metodologia Proposta ......................................................................................................... 17
4.1 Definição dos Atributos das Distribuidoras ................................................................. 18
4.1.1 Atributos analisados............................................................................................... 18
4.1.2 Análise fatorial dos atributos das distribuidoras ..................................................... 21
4.2 Agrupamentos das distribuidoras (pré-clusterização)................................................. 30
4.3 Atributos dos conjuntos .............................................................................................. 47
4.4 Agrupamentos dos conjuntos ..................................................................................... 50
4.4.1 Clusterização do Pré-Cluster (1) ............................................................................ 52
4.4.2 Clusterização do Pré-Cluster (2) ............................................................................ 54
4.4.3 Clusterização do Pré-Cluster (3) ............................................................................ 59
4.5 Definição dos Limites ................................................................................................. 61
5 Discussão ........................................................................................................................... 69
6 Referências ......................................................................................................................... 72
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Lista de Abreviaturas e Siglas


ANEEL Agência Nacional de Energia Elétrica
AT Alta tensão
BT Baixa Tensão
CCC Cubic Clustering Criterium
DEA Data Envelopment Analysis
DEC Duração equivalente de interrupção por unidade consumidora
DIC Duração de interrupção individual por unidade consumidora ou por ponto de
conexão
DMIC Duração maxima de interrupção continua por unidade consumidora ou por
ponto de conexão
DMU Decision Making Units
DNAE Departamento Nacional de Águas e Energia Elétrica
DNIT Departamento Nacional de Infraestrutura de Transportes
FEC Frequência equivalente de interrupção por unidade consumidora
FIC Frequência de interrupção individual por unidade consumidora ou por ponto de
conexão
IDH Índice de Desenvolvimento Humano
INMET Instituto Nacional de Meteorologia
INPE Instituto Nacional de Pesquisas Espaciais
MSA Medida de adequação da amostra
MT Média tensão
PNUD Programa das Nações Unidas para o Desenvolvimento
PRODIST Procedimentos de Distribuição de Energia Elétrica no Sistema Elétrico Nacional
SAS Statistical Analysis System
SE Subestação
SIN Sistema Interligado Nacional
SOM Self Organizing Maps
SRD Superintendência de Regulação dos Serviços de Distribuição
VIF Fator de Inflação de Variância
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

1 Introdução
A regulamentação da continuidade da energia elétrica no Brasil foi iniciada com a
Portaria DNAEE n° 046/78, de 17 de abril de 1978. Desde então, dois regulamentos da ANEEL
introduziram importantes aperfeiçoamentos sobre o assunto: a Resolução ANEEL n° 024/2000,
de 27 de janeiro de 2000, e o Módulo 8 dos Procedimentos de Distribuição de Energia Elétrica
no Sistema Elétrico Nacional – PRODIST.

A metodologia para o estabelecimento dos limites dos indicadores DEC e FEC por
análise comparativa vem sendo aplicada a cerca de dez anos. Durante este período, a
experiência acumulada nas diversas análises e as discussões com agentes interessados
permitiram a identificação de aperfeiçoamentos. Alternativamente, foram publicados alguns
trabalhos que trataram especificamente sobre o assunto, com contribuições acadêmicas
importantes.

Antes de proceder à revisão da metodologia, a ANEEL procurou analisar de forma bem


abrangente a regulamentação da continuidade do fornecimento de energia elétrica na
distribuição. Nesse sentido, a Consulta Pública n° 043/2009 disponibilizou a Nota Técnica n°
0064/2009-SRD/ANEEL, que apresentou diversos questionamentos sobre a regulação da
continuidade na distribuição de energia elétrica. Dentre esses questionamentos, foram
apresentados alguns especificamente relacionados à metodologia de estabelecimento dos
limites dos indicadores coletivos de continuidade, DEC e FEC.

O objetivo da presente consulta é receber contribuições sobre uma proposta de


metodologia para o estabelecimento dos limites dos indicadores de continuidade coletivos.
Diferentemente da Consulta Pública n° 043/2009, onde foram apresentados questionamentos
mais genéricos sem a intenção de polarizar a discussão, esta consulta tem um caráter mais
específico, apresentando uma proposta de metodologia. Ressalta-se que nada impede que
sejam apresentadas contribuições que indiquem outra alternativa, mesmo que envolva uma
completa reformulação das propostas aqui apresentadas.

Salienta-se que na maioria das análises apresentadas neste documento foram utilizados
os dados do Ofício Circular n° 0018/2009-SRD/ANEEL, de 26 de junho de 2009. Não foram
utilizados os dados enviados este ano pelas distribuidoras em atendimento ao PRODIST,
conforme disposto no art. 22 da Resolução Normativa n° 395/2009, pois os mesmos não
estavam disponíveis até o encerramento da análise apresentada neste documento. Deseja-se,
contudo, que apesar das diferenças que poderão ser observadas nos dados, o estudo que visa o
estabelecimento da metodologia não seja prejudicado.

Todos os dados utilizados, assim com os resultados obtidos, estão sendo


disponibilizados nesta consulta. Espera-se com isto que, na medida do possível, as contribuições
possam ser mais detalhadas, o que sugere que o tempo de contribuição a esta consulta seja
maior.

De posse das contribuições recebidas, a ANEEL finalizará a proposta de


aperfeiçoamento da metodologia a ser utilizada a partir de 2011, no 3º ciclo das Revisões
Tarifárias Periódicas. Ressalta-se que esta metodologia não será aplicada na redefinição dos
conjuntos de unidades consumidoras prevista para este ano. Apesar dessa redefinição levar ao

4
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

estabelecimento de novos limites para todos os conjuntos, os mesmos serão definidos


respeitando-se os limites globais vigentes das distribuidoras.

Este documento está organizado em seis seções. Após esta introdução, a Seção 2
apresenta um resumo da metodologia vigente. A Seção 3 apresenta uma revisão das
contribuições apresentadas na Consulta Pública n° 043/2009, além de três propostas
encontradas na literatura. A quarta seção apresenta a metodologia proposta. A seção seguinte
apresenta uma discussão sobre a metodologia proposta, ressaltando alguns pontos que devem
receber contribuições. A última seção apresenta as bibliografias utilizadas no desenvolvimento
deste texto.

5
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

2 Metodologia Vigente
Nesta seção será apresentada a metodologia utilizada pela ANEEL para o
estabelecimento dos limites dos indicadores coletivos, DEC e FEC. A ANEEL utiliza os
indicadores coletivos para analisar o desempenho dos conjuntos de unidades consumidoras,
além de analisar o desempenho das distribuidoras, estados, regiões e do país. Adicionalmente, é
através dos limites coletivos que se estabelecem os limites dos indicadores individuais, DIC, FIC
e DMIC.

Desde a Portaria DNAEE n° 046/78, os indicadores coletivos DEC e FEC são


acompanhados por conjuntos de unidades consumidoras. Isso possibilitou que, em 2000, no
momento da edição da Resolução n° 024/2000, a apuração dos indicadores no setor de
distribuição fosse uma prática consolidada, além da disponibilidade de um histórico de
informações.

Entretanto, a tarefa de atribuir limites aos conjuntos, e consequentemente à


distribuidora, não é trivial. Para ilustrar essa dificuldade, pode-se analisar o desempenho de um
conjunto como um sistema simples, com várias entradas e uma saída. As entradas xi são as
variáveis que, de alguma forma, se relacionam, resultando na saída y, e o mapeamento entre a
entrada e a saída é representado por f. Para o estabelecimento de limites dos indicadores
coletivos, as entradas são os atributos definidores dos conjuntos, e a saída é o desempenho do
indicador. A Figura 2.1 ilustra um exemplo.

Entrada

x1
Saída

x2
f y

xn

Figura 2.1: Mapeamento f entre entradas e saída de um sistema.

É difícil apresentar um modelo funcional para o sistema da Figura. Primeiramente, por


causa da incerteza associada aos parâmetros de entrada. Podem-se citar alguns não
determinísticos, com probabilidade associada, como eventos climáticos e falhas em
equipamentos. Outros parâmetros são altamente dependentes da gestão da distribuidora, como
eficiência das equipes de atendimento emergencial. Ademais, também há complexidade no
mapeamento entre a entrada e a saída das variáveis, ou seja, na forma de relacionamento dos
parâmetros com a saída do sistema.

A Tabela mostra a correlação entre alguns parâmetros que poderiam ser considerados
como entrada para f. Esses parâmetros se relacionam, de alguma forma, com o desempenho
dos conjuntos (Tanure, 2004). Foram utilizados os atributos dos conjuntos fornecidos pelas
distribuidoras à ANEEL referentes ao ano de 2007 (4007 conjuntos). Foi utilizado um

6
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

desempenho (DEC e FEC) médio de três anos (2005 a 2007), de forma a filtrar as variações
desses indicadores.
Tabela 2.1: Matriz de correlação entre os atributos e os indicadores coletivos.
ERP AREA PNI CMM NUC DEC FEC
ERP 1 0,185 0,293 0,190 0,250 -0,017 -0,039
AREA 0,185 1 0,028 -0,016 0,002 0,260 0,329
PNI 0,293 0,028 1 0,948 0,859 -0,180 -0,187
CMM 0,190 -0,016 0,948 1 0,891 -0,193 -0,191
NUC 0,250 0,002 0,859 0,891 1 -0,199 -0,196
DEC -0,017 0,260 -0,180 -0,193 -0,199 1 0,698
FEC -0,039 0,329 -0,187 -0,191 -0,196 0,698 1

Paradoxalmente, a Tabela mostra que os atributos têm baixa correlação com o


DEC/FEC apurado pelas distribuidoras. A aparente distorção pode ser explicada, dentre outros
fatores, pela ausência de algumas variáveis não consideradas nos atributos existentes, como a
gestão da distribuidora, além do não conhecimento da função que relaciona os atributos com o
desempenho (a correlação é uma indicação de relação linear entre cada atributo e cada
desempenho). Outro fator que pode prejudicar a análise da correlação dos atributos e
desempenho é a grande heterogeneidade verificada entre os conjuntos de unidades
consumidoras, ocorrida principalmente devido a regra de formação dos conjuntos variar muito
entre as distribuidoras. Essa questão será discutida adiante.

Tendo em vista a existência de um histórico de valores dos indicadores DEC e FEC, a


ANEEL estabeleceu, na Resolução n° 024/2000, uma metodologia comparativa que avalia o
desempenho dos conjuntos para propor limites adequados. A premissa básica da metodologia é
a seguinte:

Conjuntos semelhantes devem apresentar desempenho equivalente.

Desta forma, não é necessário conhecer o relacionamento entre as variáveis de entrada


e saída. O que se espera é que, uma vez definidos quais conjuntos são semelhantes, o
desempenho dos mesmos seja equivalente.

O método de comparação de desempenho baseia-se em uma técnica estatística de


formação de agrupamentos, denominados clusters, que permite identificar conjuntos com
características homogêneas. Esta técnica é utilizada quando não é possível estabelecer
deterministicamente os valores assumidos pelas variáveis de um determinado problema. A
aplicação dessa metodologia permite ao órgão regulador superar uma desvantagem natural,
decorrente da grande assimetria de informações em relação às distribuidoras, maximizando o
uso dos recursos disponíveis pelas distribuidoras. Além disso, o estabelecimento de limites por
comparação é adequado em segmentos considerados monopólios naturais, uma vez que
permite a emulação de um ambiente concorrencial que objetiva a melhoria da qualidade de
serviço das empresas.

Para a definição de semelhança entre conjuntos, são definidos atributos físico-elétricos


que os caracterizam. São eles:

• área (km2);

7
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

• extensão de rede primária (km);

• potência instalada (kVA);

• número de unidades consumidoras;

• consumo médio mensal (MWh).

Com base nos atributos, são formados agrupamentos (clusters) de conjuntos. Os


conjuntos de cada cluster apresentam atributos semelhantes, mas indicadores de desempenho
(valores verificados) diferentes, de forma que a metodologia define, para os conjuntos de cada
cluster, os limites futuros de DEC e FEC, dentro de um determinado espaço de tempo.

Para determinar os limites de cada cluster, é utilizada uma técnica conhecida como
Yardstick Competition. Esta técnica consiste em determinar a referência do cluster a partir de um
limite estatístico. No caso de conjuntos atendidos por sistemas isolados (não pertencentes ao
SIN) a referência adotada para o estabelecimento dos limites é a mediana do cluster, enquanto
que para os conjuntos pertencentes ao SIN é adotado como medida estatística o segundo decil
do cluster. Ou seja, para o sistema isolado, os limites para os indicadores são determinados pelo
valor observado no espaço amostral de 50% dos conjuntos do referido cluster, enquanto que
para o SIN os limites para os indicadores correspondem aos valores observados no limite do
espaço amostral de 20% (melhores) dos conjuntos daquele cluster.

Por fim, os limites para cada ano são definidos a partir de uma função exponencial
decrescente, para um intervalo de tempo estabelecido, partindo dos limites previamente
estipulados, chegando aos limites estabelecidos para o cluster. O período de transição foi
estabelecido levando em consideração as características de cada sistema e a variação de
desempenho requerida, adotando o período médio de duas revisões tarifárias: oito anos.

A Figura ilustra o estabelecimento de limites para um conjunto de um dado cluster, para


o indicador DEC. O mesmo procedimento é feito para o indicador FEC.

8
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

DEC

DECMAX

Distribuição Estatística do Histórico de DEC dos


Conjuntos do cluster i
CONJX

DEC50%
LIMITE

LIMITE i =
DEC 20%

DECMIN

0 t
ANO ANO ANO
0 1 8

Figura 2.2: Ilustração da definição do limite de DEC para um conjunto de um cluster.

Uma vez que os conjuntos de um mesmo cluster são semelhantes, poder-se-ia exigir o
mesmo desempenho para todos eles. Entretanto, sabendo-se que há algumas características
não capturadas pela metodologia comparativa, a adoção dos percentis 20 e 50, assim como o
horizonte de oito anos para cumprimento dos limites, são flexibilizações para garantir a coerência
do método.

Deve-se ressaltar que a metodologia é uma ferramenta para auxiliar o regulador na


definição do desempenho limite para as distribuidoras. É um ponto de partida para a discussão
do desempenho da distribuidora, e minimiza sobremaneira a assimetria de informações com os
regulados. Mesmo sendo a metodologia teoricamente consistente, não se deve utilizar seu
resultado como um valor final, acreditando rigorosamente que o procedimento incorporou todas
as variáveis para a decisão. A análise final é imprescindível e é realizada pelo regulador, onde se
abre espaço para a discussão com a distribuidora e seus consumidores, considerando as
especificidades regionais, os aspectos relativos às dificuldades de acesso em certas áreas, além
das condições geográficas e climáticas.

Atualmente a regulamentação sobre a qualidade da energia elétrica encontra-se


disposta no Módulo 8 do PRODIST. A Revisão 1 do PRODIST, aprovada pela Resolução
Normativa n° 395/2009, revogou a Resolução n° 024/2000 e estabeleceu novos critérios para a
formação dos conjuntos de unidades consumidoras.

Basicamente, o novo critério define as subestações de alta tensão como delimitadores


dos conjuntos, conforme disposto a seguir:

9
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

• O conjunto de unidades consumidoras é definido por subestação que possua


primário em AT e secundário em MT.

• A abragência do conjunto deve ser as redes MT a jusante da subestação e de


propriedade da distribuidora.

• Para as redes MT das distribuidoras que não possuam subestação com primário
em AT, o conjunto deve ser composto pelas redes em MT de sua propriedade
até o ponto de conexão com o agente supridor.

• Todas as unidades consumidoras atendidas em BT e MT deverão estar


classificadas no mesmo conjunto da subestação que as atendam.

Foi estabelecido que as distribuidoras deveriam enviar os atributos dos conjuntos


seguindo os novos critérios até 31 de março deste ano. A SRD já realizou uma avaliação prévia
desses atributos, e, através de parâmetros estatísticos, foram enviados questionamentos às
distribuidoras para os casos onde os conjuntos apresentaram atributos discrepantes. Após a
análise das respostas, serão redefinidos os conjuntos de todas as distribuidoras do país.

A aplicação dos critérios levará à revogação de todas as resoluções vigentes que


estabelecem limites de DEC e FEC para os conjuntos. Entretanto, a proposta é que sejam
mantidos os limites globais das distribuidoras. Ou seja, haverá uma “distribuição” dos limites
entre os novos conjuntos de forma a manter os limites globais já estabelecidos.

10
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

3 Contribuições à Consulta Pública n.° 043/2009 e Demais


Propostas Encontradas na Literatura
3.1 Contribuições à Consulta Pública n.° 043/2009
Nesta seção será apresentada uma compilação das contribuições apresentadas à
Consulta Pública n.° 043/2009, que visou obter subsídios e informações para o aprimoramento
da regulamentação sobre a continuidade do fornecimento de energia elétrica na distribuição. As
contribuições aqui apresentadas serão referentes apenas àquelas específicas à metodologia de
estabelecimento dos limites dos indicadores coletivos, uma vez que a Consulta Pública n.°
043/2009 versou sobre um tema mais amplo, a regulamentação da qualidade do fornecimento de
energia elétrica na distribuição.

Das questões apresentadas na referida consulta, serão aqui discutidas as relacionadas


aos seguintes temas:

a) Atributos dos Conjuntos

b) Método de Classificação

c) Definição dos Limites para os Indicadores Coletivos

Foram realizadas várias contribuições sobre esses temas. A Nota Técnica n.°
0138/2009-SRD/ANEEL apresentou um resumo das contribuições recebidas, reproduzido a
seguir.

3.1.1 Atributos dos Conjuntos

Com relação aos atributos dos conjuntos, as contribuições recebidas discorreram sobre
duas temáticas principais: necessidade de novos atributos e exclusão de algum atributo atual e
avaliação dos atributos com base nas correlações. As contribuições a respeito da necessidade
de aumentar o número de atributos de forma a representar melhor os conjuntos foram
convergentes. Os agentes concordam que os atributos precisam ser aperfeiçoados, de forma a
refletir as características técnicas e as especificidades da área de concessão.

Quanto às características que melhor descrevem os conjuntos com relação à


continuidade e os atributos que melhor refletem essas características, foram apresentadas várias
contribuições. Os principais fatores não gerenciáveis citados foram:

• Climáticos – índice ceráunico, índice pluviométrico, grau de salinidade e


poluição;

• Acesso – índice de infraestrutura viária, segregação dos atributos entre rural e


urbano, tempo médio de deslocamento, comprimento dos alimentadores e
dispersão dos clientes ao longo das redes e área efetiva de atendimento;

• Vegetação – tipo de vegetação e existência de áreas de preservação ambiental;

11
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

• Nível socioeconômico – índice de desenvolvimento humano, índice de


criminalidade, proporção de domicílios sub-normais (favelas e similares),
consumo médio e número de unidades consumidoras.

Das características intrínsecas do sistema, foram citadas:

• Tecnologia de rede – rede aérea (nua, isolada ou protegida) ou subterrânea e


rede malhada ou radial;

• Capacidade de manobra e proteção – potência instalada e quantidade de


cubículos que permitem transferência de carga;

• Pontos de suprimento – quantidade de pontos de suprimento e se pertence ao


sistema interligado, sistema isolado de pequeno porte ou sistema isolado de
grande porte;

• Investimentos – depreciação dos ativos do sistema de distribuição e despesa na


manutenção.

Alguns agentes concordam que a correlação entre os atributos não é muito relevante, e
afirmam que o importante é estabelecer atributos que possibilitem a formação de agrupamentos
homogêneos. Já outras contribuições afirmam que o efeito da correlação entre os atributos deve
ser avaliado no âmbito do método de agrupamento utilizado. Essa análise deve ser feita com
base na validação estatística do modelo.

Foi verificada uma baixa correlação entre os atributos e os indicadores DEC e FEC.
Algumas contribuições afirmam que o DEC e o FEC são conseqüências da gestão e não dos
atributos, razão da baixa correlação verificada. Já outros agentes opinaram que os indicadores
DEC e FEC devem ser refletidos nos atributos e a baixa correlação pode acarretar análises e
comparações distorcidas do desempenho das distribuidoras.

3.1.2 Método de Classificação

As contribuições convergem no sentido que o método atual pode ser aprimorado.


Algumas distribuidoras relataram que um dos principais problemas do método atual, o k-means,
é a necessidade de definir a priori a quantidade de agrupamentos que devem ser formados.
Tendo como objetivo dirimir este problema foi sugerida a utilização do método Ward. Outras
contribuições sugerem que a ANEEL utilize uma ferramenta estatística de mercado, de forma
que as empresas também realizem as simulações, aumentando a transparência do processo.

Ainda sobre o método de agrupamento, algumas contribuições expõem o fato da ANEEL


fixar os limites globais da distribuidora, porém os limites dos conjuntos podem ser ajustados, de
forma que dois conjuntos de um mesmo agrupamento podem ter seus limites ajustados em
direções contrárias.

Sobre o questionamento se a transformação dos atributos é recomendada para o


método de formação dos agrupamentos, algumas contribuições afirmam que a transformação é
necessária, pois permite a comparação de dados que seriam heterogêneos sem transformação.
Também comentam que a necessidade de transformação está associada à escolha do método.
Já outras contribuições afirmam que a ANEEL aplica a transformação logarítmica com objetivo

12
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

de melhorar a dispersão dos atributos, como conseqüência da aplicação dessa transformação,


conjuntos com características muito diferentes são aproximados, distorcendo a formação dos
agrupamentos.

3.1.3 Definição dos Limites para os Indicadores Coletivos

As contribuições se concentraram nos seguintes pontos:

• definição de limites a partir do valor apurado e da utilização do conceito de


Margem de Segurança, definido como a razão entre o limite tolerável de
desempenho de um conjunto e seu respectivo limite, para fixar os limites
toleráveis de desempenho;

• tratamento diferenciado para as interrupções programadas e não programadas;

• estabelecer os limites considerando a expectativa de melhoria versus custos


suportados pelos clientes;

• premiação por desempenho;

• utilização de outros métodos, como análise de eficiência;

• a consideração de recursos definidos na revisão tarifária periódica, como uma


variável ou como um limitante para o máximo decréscimo anual dos limites
coletivos.

De forma geral, os agentes consideram que as medidas de posição utilizadas, segundo


decil e mediana, não estão adequadas. Há uma sugestão de adoção de três alvos: o benchmark
do cluster, o padrão de rede e o critério de ”V8 flutuante” (V8 se refere ao limite final, obtido no
horizonte de 8 anos considerado pelo método atual).

3.2 Algumas Propostas Encontradas na Literatura


São encontrados alguns trabalhos na literatura especializada que apresentaram
propostas de aprimoramento à metodologia da ANEEL. Nesta seção serão apresentadas, de
forma resumida, algumas dessas propostas.

3.2.1 Proposta de procedimentos e metodologia para estabelecimento de metas de


qualidade (DEC e FEC) para concessionárias de distribuição de energia elétrica
através da análise comparativa (Tanure, 2004)

O trabalho desenvolveu metodologia para o estabelecimento de limites de qualidade


para os indicadores DEC e FEC dos conjuntos de unidades consumidoras. A abordagem é
baseada na técnica de análise de eficiência DEA, que é aplicada aos agrupamentos de unidades
consumidoras previamente selecionados pela técnica cluster dinâmico. Foram utilizados 924
conjuntos de sete distribuidoras.

Uma vez definidas as variáveis que representam as características dos conjuntos, foi
aplicada a técnica de cluster dinâmico para a definição dos conjuntos semelhantes. Essa técnica
permite que sejam analisados os conjuntos individualmente, definindo-se, para cada elemento,

13
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

quais conjuntos são semelhantes. O agrupamento é baseado em três critérios complementares,


sendo garantido o número mínimo de elementos considerados semelhantes. As variáveis
utilizadas para a classificação foram: área, número de unidades consumidoras e consumo total.

Após a formação dos agrupamentos, aplica-se a metodologia DEA para a obtenção dos
limites dos indicadores. O DEA é aplicado para cada agrupamento, sendo realizado para o DEC
e para o FEC. Os conjuntos são associados a um sistema de produção. Com este enfoque, a
distribuidora pode ser considerada um transformador de recursos de rede em indicadores de
qualidade. Os insumos considerados para a aplicação do DEA foram: comprimento de rede,
capacidade instalada e recursos reconhecidos para operação e manutenção (O&M). O produto
(output) é o desempenho dos conjuntos, expresso pelos indicadores DEC e FEC. Também foi
realizada uma análise utilizando apenas o O&M como insumo.

Foi considerado um ajuste gradual nos limites a serem estabelecidos no decorrer dos
anos, de acordo com a diversidade dos conjuntos nos agrupamentos. Tal ajuste objetiva atenuar
o decréscimo nos limites de conjuntos que não tiveram boas comparações.

3.2.2 Classificação de conjuntos consumidores de energia elétrica via mapas auto-


organizáveis e estatística multivariada (Sperandio, 2004)

O trabalho apresentou uma análise dos conjuntos de uma distribuidora brasileira, onde
foi possível avaliar diversos atributos além dos utilizados atualmente pela ANEEL. Ademais, o
trabalho propõe a utilização de outro método de classificação.

São estudados os atributos de 260 municípios, todos eles pertencentes à mesma


distribuidora. Percebe-se que o fato da análise ter se restringido a conjuntos de apenas uma
distribuidora ajudou nas conclusões do autor, pois foi mais fácil criticar os resultados dos
métodos com o conhecimento que se tem da região. Essa vantagem é ainda mais potencializada
pelo fato de a análise ser realizada por municípios.

Inicialmente é apresentada uma avaliação das variáveis relevantes para a continuidade.


As variáveis são divididas em dois grupos: Mercado e Sistema Elétrico.

As variáveis consideradas de mercado foram: Consumo Residencial (kWh/ano),


Consumo Industrial (kWh/ano), Consumo Rural (kWh/ano), Consumo Comercial (kWh/ano),
Consumo Público (kWh/ano), Área do Município (km2), Número de Consumidores Residenciais ,
Número de Consumidores Industriais, Número de Consumidores Rurais, Número de
Consumidores Comerciais, Número de Consumidores Públicos.

As seguintes variáveis foram consideradas do tipo Sistema Elétrico: Número de


Subestações (SEs), Número de Alimentadores, Número de Transformadores, Capacidade de
Manobra entre Alimentadores, Capacidade Instalada (kVA), Distância da Sede do Município à
SE (km), Extensão da Rede Aérea Primária (km).

A análise das variáveis foi realizada através de estatísticas descritivas, correlações e


análise fatorial. Após a análise, foram selecionadas as seguintes variáveis: Área do Município,
Consumo Industrial, Consumo Rural, Consumo Urbano (obtida da soma do consumo residencial,
comercial e público), Número de Consumidores Total, Número de Alimentadores, Capacidade de
Manobra entre Alimentadores, Distância da Sede do Município à SE e Extensão da Rede Aérea

14
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Primária. Entretanto, em uma análise posterior realizada com os resultados dos agrupamentos, o
autor decidiu excluir a variável Área do Município.

A análise de agrupamentos foi realizada através de uma metodologia de validação


cruzada, utilizando-se os métodos k-means e Self Organizing Maps (SOM). Foram realizadas
análises de agrupamentos separadamente para as variáveis do tipo Mercado e Sistema Elétrico.
Após a execução do procedimento, concluiu-se por seis agrupamentos para as variáveis do tipo
Mercado e dez para as do tipo Sistema Elétrico. Após o cruzamento desses agrupamentos,
verificou-se que os conjuntos se dividem em 30 agrupamentos.

O trabalho apresenta ainda uma análise do desempenho dos conjuntos face aos limites
estabelecidos pela ANEEL. Segundo o autor, a análise de violação dos limites com relação aos
agrupamentos das variáveis de Mercado e Sistema Elétrico permite inferir sobre a
responsabilidade da distribuidora pelo descumprimento dos limites ou o incorreto
estabelecimento dos limites por parte da ANEEL.

3.2.3 Um modelo de análise envoltória de dados para estabelecimento das metas de


continuidade do fornecimento de energia elétrica (Pessanha, 2006)

O trabalho propõe a aplicação da técnica de análise envoltória de dados (DEA) na


definição dos limites dos indicadores de continuidade coletivos. A proposta utiliza uma análise
em dois estágios. No primeiro, é realizada uma comparação entre as distribuidoras, definindo-se
limites globais dos indicadores para cada distribuidora. Partindo dos limites globais, os limites
dos conjuntos de cada distribuidora são definidos através de uma modelagem de otimização.

Foram analisadas as seguintes variáveis: número de unidades consumidoras, mercado


atendido (MWh), participações das classes de consumo (residencial, industrial, comercial e rural)
no mercado atendido, extensão da rede de distribuição (km), custo operacional (R$) e
indicadores globais de continuidade. Também foram calculados alguns indicadores definidos a
partir destas variáveis, tais como a razão entre o número de unidades consumidoras e a
extensão da rede de distribuição e a razão entre o consumo de eletricidade e o número de
unidades consumidoras. As variáveis foram obtidas de 45 distribuidoras, que abrangem cerca de
90% do consumo e 98% do número de unidades consumidoras do Brasil.

Após uma análise prévia das variáveis, identificou-se uma grande heterogeneidade entre
as distribuidoras. Portanto, para atender a hipótese de comparabilidade das DMUs assumida em
um modelo DEA, foi aplicada uma análise de agrupamentos para separar as distribuidoras em
clusters mais homogêneos. Os agrupamentos foram obtidos através da metodologia SOM.

Na análise dos agrupamentos foram utilizados oito atributos referentes ao tamanho,


concentração e composição do mercado. São eles: participação da classe residencial no
consumo, participação da classe comercial no consumo, participação da classe industrial no
consumo, tamanho da rede de distribuição, carregamento da rede, consumo médio residencial,
número de unidades consumidoras e energia elétrica distribuída. Foram utilizados dados do ano
de 2001, aplicando-se a padronização dos seus logaritmos com o objetivo de evitar que a
segmentação das distribuidoras se concentrasse apenas nas variáveis mais heterogêneas.

A análise de agrupamentos resultou em três clusters, conforme ilustra a Figura 3.1.

15
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 3.1: Agrupamentos das concessionárias de distribuição (Pessanha, 2006).

O modelo DEA utilizado tem orientação output. Desta forma, é utilizado um conjunto de
variáveis de entrada (inputs), a partir das quais a distribuidora busca o máximo desempenho na
continuidade (DEC e FEC). Os inputs utilizados foram a participação da classe industrial (%I), o
consumo por consumidor (CPC) e o carregamento (MWh/km). Como o DEC e FEC são saídas
indesejadas, o trabalho utilizou as razões Max(DEC)/DEC e Max(FEC)/FEC como outputs.

Após a definição dos limites globais para as distribuidoras, aplica-se uma modelagem de
programação linear para serem definidos os limites dos conjuntos de unidades consumidoras.

16
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

4 Metodologia Proposta
Na seção anterior foram apresentadas algumas contribuições sobre a metodologia de
estabelecimento dos limites de continuidade para os indicadores coletivos, DEC e FEC. Baseado
na análise das contribuições, apresenta-se nesta seção uma proposta de aperfeiçoamento para
a metodologia atualmente empregada pela ANEEL.

Para o desenvolvimento da metodologia procurou-se seguir as seguintes diretrizes


extraídas das contribuições analisadas:

• avaliação dos atributos que caracterizam os conjuntos;

• avaliação do método de comparação;

• avaliação do método de estabelecimento dos limites.

Uma das dificuldades de se realizar uma clusterização entre conjuntos de unidades


consumidoras é a obtenção de atributos que sejam confiáveis, do ponto de vista de sua
apuração, e que sejam representativos do fenômeno em estudo, a continuidade do serviço.
Características geográficas e climáticas, como densidade de raios, índice pluviométrico,
condições de acesso, bem como características socioeconômicas são difíceis de obter por
conjunto de unidades consumidoras.

Assim, uma alternativa viável para a ausência de algumas informações por conjunto de
unidades consumidoras é realizar uma pré-clusterização, comparando-se primeiramente as
distribuidoras, para as quais é mais fácil obter algumas variáveis que se relacionam com a
continuidade do serviço. Realizada a comparação entre empresas, o passo seguinte é comparar
os conjuntos das empresas consideradas semelhantes.

Uma vez obtidos os atributos para estudo, torna-se fundamental selecionar o menor
número possível de atributos que representem bem as características fundamentais que
diferenciam as distribuidoras em termos de continuidade do serviço. Para a etapa de análise de
clusters, deve-se evitar que atributos muito correlacionados entre si sejam utilizados na
comparação, pois assim estar-se-ia atribuindo mais peso para a característica representada por
esses atributos.

Uma técnica bastante utilizada para redução de variáveis é a análise fatorial, uma classe
de métodos estatísticos multivariados cujo principal objetivo é definir uma estrutura subjacente
em uma matriz de dados. A análise fatorial analisa a estrutura das inter-relações (correlações)
entre um grande número de variáveis, definindo um conjunto de dimensões latentes comuns,
denominadas fatores (Hair et al., 2005).

Uma vez determinados os fatores e a explicação de cada variável nesses fatores, pode-
se reduzir a quantidade de variáveis, na medida em que elas representem uma mesma
característica (compõem o mesmo fator) e possuam correlações elevadas entre si. Variáveis
altamente correlacionadas e membros do mesmo fator devem ter perfis semelhantes de
diferenças ao longo de grupos em análise de variância ou análise de discriminante. Assim, se
uma variável pertencente a um fator é incluída, torna-se menos importante incluir outras
pertencentes ao mesmo fator e altamente correlacionadas com a primeira, pois possuem menos

17
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

poder preditivo adicional do que variáveis pertencentes a outros fatores. Isso não significa que as
demais variáveis do fator sejam menos importantes que a primeira, mas sim que seu efeito já
está em grande parte representado pela variável do fator incluída (Hair et al., 2005).

A metodologia proposta está baseada nos seguintes passos, a serem apresentados nas
subseções a seguir:

A. identificação dos atributos que melhor representem as distribuidoras;

B. clusterização das distribuidoras (pré-clusterização);

C. análise dos atributos que melhor representem os conjuntos;

D. clusterização dos conjuntos das distribuidoras em cada pré-cluster;

E. definição dos limites para os indicadores DEC e FEC.

4.1 Definição dos Atributos das Distribuidoras

4.1.1 Atributos analisados

A partir de fontes de dados como o Programa das Nações Unidas para o


Desenvolvimento – PNUD, Instituto Nacional de Meteorologia – INMET, Departamento Nacional
de Infraestrutura de Transportes – DNIT, Instituto Nacional de Pesquisas Espaciais – INPE e das
próprias bases de dados da ANEEL, buscou-se obter o maior número possível de atributos para
comparar as distribuidoras. Algumas variáveis não estavam disponíveis por município ou
distribuidora, mas puderam ser obtidas por estado. Para essas variáveis, o valor obtido para o
estado foi aplicado às distribuidoras pertencentes a ele. A Tabela 4.1 apresenta todas as
variáveis obtidas para o estudo.
Tabela 4.1: Atributos das distribuidoras utilizados no estudo.
Atributo Descrição Unidade Fonte Observação
Percentual de
Relaciona-se com a presença do
pessoas que
estado como provedor de Atlas do Desenvolvimento
vivem em Dados por
serviços públicos, bem como com % Humano no Brasil, PNUD,
domicílios com Distribuidora
a capacidade de pagamento dos 2003
banheiro e água
habitantes.
encanada, 2000
Atlas do Desenvolvimento
Renda per Capita, Representa a renda média Dados por
R$ Humano no Brasil, PNUD,
2000 mensal dos habitantes. Distribuidora
2003
Índice de
Resume as condições de Atlas do Desenvolvimento Dados por
Desenvolvimento
longevidade, educação e renda - Humano no Brasil, PNUD, Unidade da
Humano
da população. 2003 Federação
Municipal, 2000
Atlas do Desenvolvimento Dados por
Índice de Gini,
Índice de desigualdade de renda. - Humano no Brasil, PNUD, Unidade da
2000
2003 Federação

18
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Atributo Descrição Unidade Fonte Observação


Índice O índice para unidade da
Pluviométrico federação foi obtido pela média
Anual - 1961 a aritmética das estações Dados por
1990 - média das disponíveis, utilizando-se a mm INMET Unidade da
estações normal climatológica da chuva Federação
disponíveis nos acumulada mensal de 1961 a
Estados 1990.
Mede a incidência de raios para a
terra, por km² de área. Para os
Estados RS, SC, PR, SP, RJ, ES,
Densidade de Dados por
MG, MS e GO foram utilizados INPE e Norma NBR
Descargas raios/km² Unidade da
dados do INPE do biênio 2007- 5419/2001
Atmosféricas Federação
2008. Para os demais, utilizou-se
o estabelecido na Norma NBR
5419/2001.
Densidade de Densidade de estradas calculada
Dados por
Estradas por: Metro Linear de Estradas
m/km² DNIT. Unidade da
Pavimentadas, Pavimentadas em 2007 por km²
Federação
2007 de Área.
Extensão de rede aérea com
tensão superior a 1 kV e inferior a ANEEL, Sistema de
Extensão de Rede Dados por
69 kV. Consiste na soma desse km Indicadores de Continuidade -
Aérea Primária Distribuidora
atributo para todos os conjuntos INDQUAL
da distribuidora.
Soma das áreas geográficas de ANEEL, Sistema de
Área da Dados por
todos os conjuntos da km² Indicadores de Continuidade -
Concessão Distribuidora
distribuidora. INDQUAL
Soma da potência instalada nos
ANEEL, Sistema de
Potência Nominal transformadores de distribuição Dados por
kVA Indicadores de Continuidade -
Instalada (MT/BT) de todos os conjuntos da Distribuidora
INDQUAL
distribuidora.
Soma do consumo médio de ANEEL, Sistema de
Consumo Médio Dados por
energia mensal de todos os MWh Indicadores de Continuidade -
Mensal Distribuidora
conjuntos da distribuidora. INDQUAL
Número de ANEEL, Sistema de
Total de unidades consumidoras Dados por
Unidades - Indicadores de Continuidade -
da distribuidora. Distribuidora
Consumidoras INDQUAL
ANEEL, Sistema de
Soma do consumo de energia
Consumo da Acompanhamento de
anual de todas as unidades Dados por
Classe MWh Informações de Mercado para
consumidoras da classe Distribuidora
Residencial Regulação Econômica -
residencial.
SAMP
ANEEL, Sistema de
Soma do consumo de energia
Acompanhamento de
Consumo da anual de todas as unidades Dados por
MWh Informações de Mercado para
Classe Industrial consumidoras da classe Distribuidora
Regulação Econômica -
industrial.
SAMP
ANEEL, Sistema de
Soma do consumo de energia
Consumo da Acompanhamento de
anual de todas as unidades Dados por
Classe Comercial, MWh Informações de Mercado para
consumidoras da classe Distribuidora
Serviços e Outras Regulação Econômica -
comercial, serviços e outras.
SAMP

19
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Atributo Descrição Unidade Fonte Observação


ANEEL, Sistema de
Soma do consumo de energia Acompanhamento de
Consumo da Dados por
anual de todas as unidades MWh Informações de Mercado para
Classe Rural Distribuidora
consumidoras da classe rural. Regulação Econômica -
SAMP
Percentual de consumo de ANEEL, Sistema de
Percentual de
energia anual de todas as Acompanhamento de
Consumo da Dados por
unidades consumidoras da classe % Informações de Mercado para
Classe Distribuidora
residencial em relação do Regulação Econômica -
Residencial
consumo total da distribuidora. SAMP
Percentual de consumo de ANEEL, Sistema de
Percentual de energia anual de todas as Acompanhamento de
Dados por
Consumo da unidades consumidoras da classe % Informações de Mercado para
Distribuidora
Classe Industrial industrial em relação do consumo Regulação Econômica -
total da distribuidora. SAMP
Percentual de consumo de
ANEEL, Sistema de
Percentual de energia anual de todas as
Acompanhamento de
Consumo da unidades consumidoras da classe Dados por
% Informações de Mercado para
Classe Comercial, comercial, serviços e outras em Distribuidora
Regulação Econômica -
Serviços e Outras relação do consumo total da
SAMP
distribuidora.
Percentual de consumo de ANEEL, Sistema de
Percentual de energia anual de todas as Acompanhamento de
Dados por
Consumo da unidades consumidoras da classe % Informações de Mercado para
Distribuidora
Classe Rural rural em relação do consumo total Regulação Econômica -
da distribuidora. SAMP
Número de ANEEL, Sistema de
Unidades Número de unidades Acompanhamento de
Dados por
Consumidoras – consumidoras da classe - Informações de Mercado para
Distribuidora
Classe residencial. Regulação Econômica -
Residencial SAMP
ANEEL, Sistema de
Número de
Número de unidades Acompanhamento de
Unidades Dados por
consumidoras da classe - Informações de Mercado para
Consumidoras – Distribuidora
industrial. Regulação Econômica -
Classe Industrial
SAMP
Número de ANEEL, Sistema de
Unidades Número de unidades Acompanhamento de
Dados por
Consumidoras – consumidoras da classe - Informações de Mercado para
Distribuidora
Classe Comercial, comercial, serviços e outras. Regulação Econômica -
Serviços e Outras SAMP
ANEEL, Sistema de
Número de
Acompanhamento de
Unidades Número de unidades Dados por
- Informações de Mercado para
Consumidoras – consumidoras da classe rural. Distribuidora
Regulação Econômica -
Classe Rural
SAMP
Consumo Médio ANEEL, Sistema de
por Unidade Consumo médio mensal por Acompanhamento de
Dados por
Consumidora da unidade consumidora da classe MWh Informações de Mercado para
Distribuidora
Classe residencial. Regulação Econômica -
Residencial SAMP
ANEEL, Sistema de
Consumo Médio
Consumo médio mensal por Acompanhamento de
por Unidade Dados por
unidade consumidora da classe MWh Informações de Mercado para
Consumidora da Distribuidora
industrial. Regulação Econômica –
Classe Industrial
SAMP

20
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Atributo Descrição Unidade Fonte Observação


Consumo Médio ANEEL, Sistema de
por Unidade Consumo médio mensal por Acompanhamento de
Dados por
Consumidora da unidade consumidora da classe MWh Informações de Mercado para
Distribuidora
Classe Comercial, comercial, serviços e outras. Regulação Econômica –
Serviços e Outras SAMP
ANEEL, Sistema de
Consumo Médio
Consumo médio mensal por Acompanhamento de
por Unidade Dados por
unidade consumidora da classe MWh Informações de Mercado para
Consumidora da Distribuidora
rural. Regulação Econômica –
Classe Rural
SAMP
Densidade de ANEEL, Sistema de
Total de unidades consumidoras Dados por
Unidades Unidades/km² Indicadores de Continuidade –
dividido pela área da concessão. Distribuidora
Consumidoras INDQUAL
Densidade de Consumo anual total da
Dados por
Consumo por km distribuidora dividido pela MWh/km ANEEL, INDQUAL e SAMP
Distribuidora
de Rede extensão de rede aérea primária.

4.1.2 Análise fatorial dos atributos das distribuidoras

Para a seleção das variáveis listadas na Tabela 4.1 o modelo fatorial escolhido foi a
análise de componentes principais, disponibilizada pelo software estatístico SAS® Enterprise
Guide 4.2.

Como o número de variáveis selecionadas na Tabela 4.1 (30) é elevado em relação à


quantidade de distribuidoras da amostra (63), optou-se por subdividir as variáveis em quatro
grupos. Em seguida, foi realizada a análise fatorial em cada subgrupo, buscando a redução de
variáveis. Finalizada essa etapa, as variáveis selecionadas em cada subgrupo foram submetidas
a uma análise fatorial geral de forma a capturar também as inter-relações existentes entre
variáveis de subgrupos distintos, obtendo-se um conjunto final de variáveis para a comparação
entre distribuidoras mediante clusterização. As variáveis Consumo Médio Mensal e Número de
Unidades Consumidoras não foram utilizadas a priori, pois estavam representadas pelas
variáveis subdivididas por classe (Consumo das Classes Residencial, Industrial, Comercial,
Rural e Número de Unidades Consumidoras – Classes Residencial, Industrial, Comercial e
Rural).

Assim, 28 variáveis foram analisadas, conforme os subgrupos a seguir:

A) Variáveis Socioeconômicas

1. Percentual de pessoas em domicílios com banheiro e água encanada -


perc_pes_dom_banh_agua

2. Renda per capita - renda_pc

3. Índice de Desenvolvimento Humano – IDH

4. Índice de Gini

B) Características da Área de Concessão

1. Índice Pluviométrico Anual - chuva_anual

21
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

2. Densidade de Descargas Atmosféricas - dens_raios

3. Densidade de Estradas Pavimentadas - dens_estradas

4. Densidade de Unidades Consumidoras - nuc_area

5. Área da Concessão - area

C) Características do Sistema Elétrico

1. Extensão de Rede Aérea Primária - erap

2. Potência Nominal Instalada - pni

3. Número de Unidades Consumidoras – Classe Residencial - nuc_r

4. Número de Unidades Consumidoras – Classe Industrial - nuc_i

5. Número de Unidades Consumidoras – Classe Comercial - nuc_com

6. Número de Unidades Consumidoras – Classe Rural - nuc_rur

7. Densidade de Consumo por km de Rede - mwh_km

D) Características do Mercado

1. Consumo da Classe Residencial - cons_r

2. Consumo da Classe Industrial - cons_i

3. Consumo da Classe Comercial - cons_com

4. Consumo da Classe Rural - cons_rur

5. Consumo Médio por Unidade Consumidora da Classe Residencial - cons_med_r

6. Consumo Médio por Unidade Consumidora da Classe Industrial - cons_med_i

7. Consumo Médio por Unidade Consumidora da Classe Comercial - - cons_med_com

8. Consumo Médio por Unidade Consumidora da Classe Rural - cons_med_rur

9. Percentual de Consumo da Classe Residencial - perc_cons_r

10. Percentual de Consumo da Classe Industrial - perc_cons_i

11. Percentual de Consumo da Classe Comercial - perc_cons_com

12. Percentual de Consumo da Classe Rural - perc_cons_rur

Em cada passo da análise de componentes principais, foram avaliados os valores de


medida de adequação da amostra (MSA), para cada variável e para o conjunto de variáveis. A

22
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

MSA é um índice que varia de 0 a 1, alcançando 1 quando cada variável é perfeitamente prevista
sem erro pelas outras variáveis. A medida pode ser interpretada com as seguintes orientações:
0,8 ou acima, admirável; 0,7 ou acima, mediano; 0,6 ou acima, medíocre; 0,5 ou acima, ruim; e
abaixo de 0,5, inaceitável (Hair et al., 2005).

O procedimento consiste em primeiramente examinar os valores de MSA de cada


variável. Caso haja variáveis com valor de MSA inferior a 0,5, a variável de menor valor deve ser
retirada da análise de componentes principais, pois não é suficientemente explicada pelas
demais, ou seja, representa uma característica dos dados que não está contida em outras
variáveis. Nesses casos, a variável com menor valor de MSA foi selecionada para a próxima
etapa do estudo. Esse procedimento é realizado sucessivamente, até que todas as variáveis
apresentem MSA igual ou superior a 0,5. Uma vez que isso ocorra, avalia-se o valor de MSA
global e toma-se a decisão de continuar ou não a análise fatorial.

Avaliada a MSA, passa-se à análise de componentes principais. Em todas as análises,


foi aplicada a rotação ortogonal de fatores VARIMAX. Essa rotação busca ajustar os fatores de
forma a maximizar as cargas fatoriais das variáveis em um único fator, minimizando as cargas
nos demais fatores. Essa característica da rotação VARIMAX facilita a análise, pois tende a
determinar claras associações positivas ou negativas (valores de carga fatorial próximos de +1
ou -1) e ausência de associações (valores próximo de zero) entre as variáveis e os fatores.

A seguir, será apresentada a análise propriamente dita. Os resultados detalhados


constam do Apêndice I deste documento.

Etapa 1: Análise fatorial realizada separadamente para os quatro subgrupos iniciais de


variáveis

Passo 1

A) Variáveis Socioeconômicas (Apêndice I - “Análise Fatorial 1 – Socioeconômicas”)

As variáveis foram reunidas em um único fator, com cargas elevadas e altas correlações
entre si. Assim, escolheu-se a variável “Renda per Capita” para representar as demais na análise
fatorial geral, em virtude de sua facilidade de compreensão e exatidão (disponível por município),
além de ser representativa da capacidade de pagamento dos consumidores, o que pode implicar
em maior ou menor disposição a pagar pela qualidade do serviço.

B) Características da Área de Concessão (Apêndice I - “Análise Fatorial 1 – Características da


Área de Concessão”)

Todas as variáveis apresentaram baixa MSA. Assim a MSA geral foi de apenas 0,386, o
que indica que as variáveis não são suficientemente correlacionadas a ponto de uma análise
fatorial ser utilizada para redução de variáveis. A variável “Área da Concessão” apresentou a
MSA mais baixa, sendo assim selecionada para a análise fatorial geral, e excluída do próximo
passo da análise deste subgrupo de variáveis.

C) Características do Sistema Elétrico (Apêndice I - “Análise Fatorial 1 – Rede”)

A análise fatorial resultou em dois fatores, sendo que o segundo apresentou apenas
uma variável com carga significativa (Densidade de Consumo por km de Rede). As variáveis de

23
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Número de Unidades Consumidoras apresentaram cargas elevadas apenas no 1º fator, todas


acima de 0,8. Realizando-se uma análise fatorial separada apenas para essas variáveis, esse
comportamento se manteve (Apêndice I - “Análise Fatorial 1 – NUC”). Assim, optou-se pela
utilização do Número de Unidades Consumidoras total da concessionária no próximo passo, ao
invés dos Números de Unidades Consumidoras por classe.

D) Características do Mercado (Apêndice I - “Análise Fatorial 1 – Mercado”)

A variável “Percentual de Consumo da Classe Rural” apresentou MSA abaixo de 0,5.


Desse modo, a variável foi selecionada para a análise fatorial geral, e excluída do próximo passo
deste subgrupo de variáveis.

Passo 2

A) Variáveis Socioeconômicas

Finalizado no Passo 1. Variável Selecionada: Renda per Capita.

B) Características da Área de Concessão (Apêndice I - “Análise Fatorial 2 – Características da


Área de Concessão”)

Todas as variáveis apresentaram baixa MSA, de modo que a MSA geral foi de apenas
0,476, o que indica que as variáveis não são suficientemente correlacionadas a ponto de uma
análise fatorial ser utilizada para redução de variáveis. A variável “Densidade de Estradas
Pavimentadas” apresentou a MSA mais baixa, sendo assim selecionada para a análise fatorial
geral, e excluída do próximo passo da análise deste subgrupo de variáveis.

C) Características do Sistema Elétrico (Apêndice I - “Análise Fatorial 2 – Rede”)

A variável “Densidade de Consumo por km de Rede” apresentou MSA abaixo de 0,5


(apenas 0,25). Assim, essa variável foi selecionada para a análise fatorial geral, e excluída do
próximo passo da análise deste subgrupo de variáveis.

D) Características do Mercado (Apêndice I - “Análise Fatorial 2 – Mercado”)

A variável “Consumo da Classe Rural” apresentou MSA baixa (0,48). Desse modo, a
variável foi selecionada para a análise fatorial geral, e excluída do próximo passo deste subgrupo
de variáveis.

Passo 3

B) Características da Área de Concessão (Apêndice I - “Análise Fatorial 3 – Características da


Área de Concessão”)

Com apenas três variáveis em análise, ainda assim o método selecionou dois fatores, os
quais explicaram menos de 80% da variância total. A variável “Densidade de Unidades
Consumidoras” dominou o 2º fator, enquanto “Índice Pluviométrico Anual” e “Densidade de
Descargas Atmosféricas” apresentaram cargas elevadas no 1º fator (0,839 e 0,796,
respectivamente). Entretanto, essas duas variáveis não apresentaram correlações muito

24
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

elevadas entre si (0,52). Assim, decidiu-se por utilizar as três variáveis na etapa de análise
fatorial geral.

C) Características do Sistema Elétrico (Apêndice I - “Análise Fatorial 3 – Rede”)

As três variáveis foram agrupadas em um único fator, com cargas elevadas. O fator
único explicou 86% da variância total dos dados. As variáveis “Potência Nominal Instalada” e
“Número de Unidades Consumidoras” apresentaram correlação muito elevada (0,94), de modo
que foi escolhida a variável “Número de Unidades Consumidoras” para a etapa de análise fatorial
geral, por ser mais confiável. Assim, a variável “Potência Nominal Instalada” foi excluída. Apesar
da alta correlação com o “Número de Unidades Consumidoras” (0,71), a variável “Extensão de
Rede Aérea Primária” também foi selecionada para a análise fatorial geral, uma vez que ambas
variáveis são utilizadas há bastante tempo pela ANEEL e possuem um histórico confiável.

D) Características do Mercado (Apêndice I - “Análise Fatorial 3 – Mercado”)

Foram determinados 3 fatores, com 81% da variância total. Após aplicação da rotação
ortogonal VARIMAX, os fatores apresentaram as seguintes cargas:
Tabela 4.2: Fatores obtidos das características de mercado
Rotated Factor Pattern
Factor 1 Factor 2 Factor 3
cons_r 0,94972 0,22648 0,08373
cons_com 0,93765 0,22835 0,13096
cons_i 0,91349 -0,0251 0,03448
perc_cons_r 0,12738 0,89373 -0,0427
perc_cons_com 0,31541 0,8002 0,31813
cons_med_i 0,00325 -0,5804 0,49389
perc_cons_i -0,0822 -0,944 0,10682
cons_med_r 0,29436 0,03931 0,80788
cons_med_rur -0,1459 -0,132 0,76573
cons_med_com 0,57469 0,20113 0,71094

Os atributos “Consumo da Classe Residencial”, “Consumo da Classe Comercial” e


“Consumo da Classe Industrial” apresentaram cargas altas no 1º fator, e têm correlações entre si
superiores a 0,8. Assim, optou-se por somar as três variáveis e formar uma nova variável,
“Consumo das Classes R, C e I”, para o próximo passo.

As variáveis “Percentual de Consumo da Classe Residencial” e “Percentual de Consumo


da Classe Comercial” têm correlação positiva média, e ambas têm correlação negativa alta e
média, respectivamente, com a variável “Percentual de Consumo da Classe Industrial”. Decidiu-
se por somar as variáveis “Percentual de Consumo da Classe Residencial” e “Percentual de
Consumo da Classe Comercial” para o próximo passo, formando a variável “Percentual de
Consumo das Classes R e C”, mantendo-se a variável “Percentual de Consumo da Classe
Industrial”. Decidiu-se manter também a variável “Consumo Médio por Unidade Consumidora da
Classe Industrial” para o próximo passo, uma vez que ela não tem correlações altas com as
variáveis do 2º fator.

25
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

As variáveis “Consumo Médio por Unidade Consumidora da Classe Residencial” e


“Consumo Médio por Unidade Consumidora da Classe Comercial” apresentaram cargas
semelhantes ao longo dos três fatores e possuem correlação média (0,64). Assim, decidiu-se por
manter apenas a variável “Consumo Médio por Unidade Consumidora da Classe Residencial”,
excluindo-se a variável “Consumo Médio por Unidade Consumidora da Classe Comercial”. A
variável “Consumo Médio por Unidade Consumidora da Classe Rural” foi mantida para o próximo
passo, uma vez que não tem alta correlação com as variáveis do 3º fator.

Passo 4

B) Características da Área de Concessão

Finalizado no Passo 3. Variáveis Selecionadas: Todas (Área da Concessão, Densidade


de Estradas, Índice Pluviométrico Anual, Densidade de Descargas Atmosféricas e Densidade de
Unidades Consumidoras).

C) Características do Sistema Elétrico

Finalizado no Passo 3. Variáveis Selecionadas: Extensão de Rede Aérea Primária,


Número de Unidades Consumidoras e Densidade de Consumo por km de Rede.

D) Características do Mercado (Apêndice I - “Análise Fatorial 4 – Mercado”)

Três fatores foram determinados no modelo. As variáveis “Percentual de Consumo da


Classe Industrial” e “Percentual de Consumo das Classes R e C” apresentaram cargas elevadas
e opostas no 1º fator (0,94 e -0,85), e cargas baixas nos demais. Além disso, as variáveis têm
alta correlação negativa, -0,86. Assim, retirar uma delas não acarreta em significativa perda de
explicação no modelo. Optou-se então por excluir a variável “Percentual de Consumo das
Classes R e C” para o próximo passo, uma vez que essa variável é a composição de duas,
sendo a variável “Percentual de Consumo da Classe Industrial” mais simples.

Passo 5

D) Características do Mercado (Apêndice I - “Análise Fatorial 5 – Mercado”)

A variável “Consumo das Classes R, C e I” apresentou o menor valor de MSA (0,43),


abaixo do mínimo aceitável. Portanto, a variável foi selecionada para a análise fatorial geral, e
excluída do próximo passo deste subgrupo de variáveis.

Passo 6

D) Características do Mercado (Apêndice I - “Análise Fatorial 6 – Mercado”)

Dois fatores foram determinados. No primeiro fator, apresentaram cargas elevadas as


variáveis “Percentual de Consumo da Classe Industrial” e “Consumo Médio por Unidade
Consumidora da Classe Industrial”. No segundo fator, tiveram cargas elevadas as variáveis
“Consumo Médio por Unidade Consumidora da Classe Rural” e “Consumo Médio por Unidade
Consumidora da Classe Residencial”. As variáveis do primeiro fator possuem correlação média,
0,55, bem como as do segundo fator, com correlação 0,41. Assim decidiu-se por utilizar as
quatro variáveis na etapa de análise fatorial geral.

26
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Resumo da Etapa 1 – Variáveis Selecionadas:


A) Variáveis Socioeconômicas

1. Renda per Capita

B) Características da Área de Concessão

1. Índice Pluviométrico Anual

2. Densidade de Descargas Atmosféricas

3. Densidade de Estradas Pavimentadas

4. Densidade de Unidades Consumidoras

5. Área da Concessão

C) Características do Sistema Elétrico

1. Extensão de Rede Aérea Primária

2. Número de Unidades Consumidoras

3. Densidade de Consumo por km de Rede

D) Características do Mercado

1. Consumo das Classes R, C e I

2. Consumo da Classe Rural

3. Consumo Médio por Unidade Consumidora da Classe Residencial

4. Consumo Médio por Unidade Consumidora da Classe Industrial

5. Consumo Médio por Unidade Consumidora da Classe Rural

6. Percentual de Consumo da Classe Industrial

7. Percentual de Consumo da Classe Rural

Etapa 2: Análise fatorial geral com todas as variáveis selecionadas na Etapa 1

Passo 1 (Apêndice I - “Análise Fatorial 1 – Geral”)

A variável “Densidade de Estradas Pavimentadas” apresentou a menor MSA (0,433).


Essa variável foi selecionada e separada da análise seguinte.

Passo 2 (Apêndice I - “Análise Fatorial 2 – Geral”)

27
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

A variável “Percentual de Consumo da Classe Industrial” apresentou a menor MSA (0,479). Essa
variável foi selecionada e separada da análise seguinte.

Passo 3 (Apêndice I - “Análise Fatorial3 – Geral”)

Foram selecionados quatro fatores, com 73% da variância total, conforme Tabela 4.3 (após
rotação VARIMAX).
Tabela 4.3 : Fatores selecionados do Passo 3.
Rotated Factor Pattern
Factor1 Factor2 Factor3 Factor4
nuc 0,89340 0,35166 -0,08064 0,03943
erap 0,87553 -0,18236 -0,10659 0,00332
cons_rur 0,86031 -0,29841 0,09002 -0,03141
Cons_RCI 0,80203 0,47196 0,14850 0,09001
area 0,55024 -0,18518 -0,15062 0,54192
mwh_km -0,08039 0,82405 0,44485 0,06071
nuc_area 0,08982 0,79598 0,24022 0,08939
cons_med_i -0,31043 0,41780 0,31606 -0,06774
perc_cons_rur 0,00438 -0,72383 0,06641 0,06261
cons_med_r 0,09688 0,23427 0,84333 0,23256
renda_pc 0,14730 0,36000 0,75677 0,02558
cons_med_rur -0,09032 0,05064 0,72124 -0,19781
chuva_anual -0,21744 -0,06500 0,63719 0,39611
dens_raios 0,01215 0,09870 0,14365 0,92612

No primeiro fator, destacaram-se as variáveis “Número de Unidades Consumidoras”,


“Extensão de Rede Aérea Primária”, “Consumo da Classe Rural” e “Consumo das Classes R, C
e I”. Na Tabela 4.4 seguem as correlações entre essas variáveis:
Tabela 4.4: Correlações das variáveis ERAP, NUC, Cons_RCI e Cons_RUR.
erap nuc Cons_RCI cons_rur
erap 1,00000 0,71328 0,52913 0,79180
nuc 0,71328 1,00000 0,92159 0,63761
Cons_RCI 0,52913 0,92159 1,00000 0,58108
cons_rur 0,79180 0,63761 0,58108 1,00000

Nota-se as altas correlações entre “Número de Unidades Consumidoras” e “Consumo


das Classes R, C e I” (0,92159); e entre “Extensão de Rede Aérea Primária” e “Consumo da
Classe Rural” (0,79180). Assim, decidiu-se por manter as variáveis “Número de Unidades
Consumidoras” e “Extensão de Rede Aérea Primária” para a próxima etapa, excluindo as outras
duas, uma vez que elas já estão fortemente explicadas pelas primeiras.

No segundo fator, destacaram-se as variáveis “Densidade de Unidades Consumidoras”,


“Densidade de Consumo por km de Rede” e “Percentual de Consumo da Classe Rural”. As duas

28
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

densidades destacam-se por sua correlação alta (0,724) e por cargas próximas nos fatores.
Assim, decidiu-se por manter a variável “Densidade de Unidades Consumidoras”, por ser mais
simples e mais correlacionada com DEC e FEC, excluindo-se a outra densidade.

No terceiro fator, destacaram-se as variáveis “Consumo Médio por Unidade


Consumidora da Classe Residencial”, “Renda per Capita” e “Consumo Médio por Unidade
Consumidora da Classe Rural”. As variáveis “Consumo Médio por Unidade Consumidora da
Classe Residencial” e “Renda per Capita” destacam-se por sua correlação (0,681) e por cargas
próximas nos fatores. Assim, decidiu-se por manter a variável “Consumo Médio por Unidade
Consumidora da Classe Residencial”, excluindo-se a outra, já que a variável de consumo médio
mostrou capturar bem as características da renda da população.

No quarto fator, apenas a variável “Densidade de Descargas Atmosféricas” apresentou


carga elevada, sendo mantida para o próximo passo.

Passo 4 (Apêndice I - “Análise Fatorial 4 – Geral”)

A variável “Consumo Médio por Unidade Consumidora da Classe Rural” apresentou a


menor MSA (0,446). Essa variável foi selecionada e separada da análise seguinte.

Passo 5 (Apêndice I - “Análise Fatorial 5 – Geral”)

Foram selecionados quatro fatores. As cargas fatoriais após rotação VARIMAX são
mostradas na Tabela 4.5 a seguir.
Tabela 4.5 : Fatores selecionados do Passo 5.
Rotated Factor Pattern
Factor1 Factor2 Factor3 Factor4
area 0,88165 0,11878 -0,24199 0,01947
erap 0,78984 -0,18962 0,17370 -0,28764
nuc 0,71038 -0,12356 0,57020 -0,14216
chuva_anual -0,22290 0,81891 0,03083 -0,00486
cons_med_r -0,06084 0,75528 0,43187 -0,00722
dens_raios 0,41207 0,70849 -0,16303 0,24020
nuc_area -0,01750 0,23744 0,77955 0,18097
cons_med_i -0,20932 0,13690 0,07645 0,80824
perc_cons_rur -0,03447 0,12550 -0,55793 -0,60326

No primeiro fator, destacam-se as variáveis “Área da Concessão”, “Extensão de Rede


Aérea Primária” e “Número de Unidades Consumidoras”. As variáveis “Extensão de Rede Aérea
Primária” e “Número de Unidades Consumidoras” têm correlação alta, 0,71. Entretanto, como
são variáveis relevantes e com grande histórico de utilização pela ANEEL, decidiu-se por mantê-
las no modelo. A variável “Área da Concessão” não tem correlação alta com as duas do mesmo
fator, pelo que se decidiu mantê-la.

29
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

As variáveis do segundo fator apresentam correlações médias e baixas entre si. Assim,
as três foram mantidas. O mesmo ocorre com as variáveis que têm cargas altas nos demais
fatores, sendo todas mantidas.

Resumo da Etapa 2 – Variáveis Selecionadas:

Finalizada a análise fatorial geral, 12 variáveis foram selecionadas para análise


comparativa entre distribuidoras. As 12 variáveis, que serão utilizadas na etapa de pré-
clusterização, são mostradas a seguir:

A) Variáveis Socioeconômicas

Nenhuma variável selecionada.

B) Características da Área de Concessão

1. Índice Pluviométrico Anual

2. Densidade de Descargas Atmosféricas

3. Densidade de Estradas Pavimentadas

4. Densidade de Unidades Consumidoras

5. Área da Concessão

C) Características do Sistema Elétrico

1. Extensão de Rede Aérea Primária

2. Número de Unidades Consumidoras

D) Características do Mercado

1. Consumo Médio por Unidade Consumidora da Classe Residencial

2. Consumo Médio por Unidade Consumidora da Classe Industrial

3. Consumo Médio por Unidade Consumidora da Classe Rural

4. Percentual de Consumo da Classe Industrial

5. Percentual de Consumo da Classe Rural

4.2 Agrupamentos das distribuidoras (pré-clusterização)


O objetivo desta seção é propor uma análise de agrupamentos por distribuidoras de
forma a contemplar todos os atributos selecionados pela análise fatorial. Uma vez estabelecidos
os agrupamentos das distribuidoras, os conjuntos de unidades consumidoras das distribuidoras
que fizerem parte de um mesmo cluster serão agrupados para posteriormente ser aplicada a
análise comparativa. Por haver duas etapas de clusterização na metodologia, a clusterização

30
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

das distribuidoras é denominada pré-clusterização sempre que necessário diferi-la da


clusterização posterior.

Finalizando a análise dos atributos é necessário verificar a colineariedade dos mesmos


antes de aplicá-los na pré-clusterização. A colinearidade indica a relação entre as variáveis
independentes em uma análise de regressão. Uma alta colineariedade é prejudicial em análise
de agrupamentos, pois equivale a aplicação de pesos diferenciados entre as características que
se analisa.

A maneira mais simples de identificar colinearidade é um exame da matriz de correlação


das variáveis. Segundo Hair et al. (2005) a primeira indicação de colinearidade é a existência de
altas correlações. A correlação entre as variáveis selecionadas são inferiores a 0,8. Porém, a
ausência de correlação elevada não indica ausência de colinearidade. A colinearidade pode
ocorrer devido ao efeito combinado de duas ou mais variáveis independentes. Uma medida
utilizada para verificar a existência de colinearidade é o Fator de Inflação de Variância (VIF).
Essa medida indica o grau que cada variável independente é explicada pelas demais variáveis
independentes. Segundo Hair et al. (2005) valores de VIF superiores a 10 indicam a existência
de colinearidade. Considerando as variáveis selecionadas da análise fatorial como
independentes e os valores de DEC apurados em 2008 como variável dependente, são
apresentados na Tabela 4.6 os valores de VIF. Como os valores do VIF são inferiores a 10
podemos confirmar que as variáveis selecionadas não são colineares.
Tabela 4.6 : Valores de VIF obtidos considerando o DEC apurado (2008) como variável dependente.
Atributo VIF Atributo VIF
Dens_Estradas 2,395 Perc_Cons_I 1,762
Chuva_Anual 2,192 Perc_Cons_Rur 1,258
AREA 2,832 Cons_Med_R 2,09
Dens_Raios 3,214 Cons_Med_I 1,946
ERAP 4,168 Cons_Med_Rur 1,919
NUC 4,596 NUC_AREA 1,869

Nas figuras a seguir são apresentados os box plots dos atributos obtidos da análise
fatorial por região do Brasil. O box plot, conforme apresentado na Figura 4.1, é um gráfico que
possibilita representar a distribuição de um conjunto de dados com base em alguns de seus
parâmetros descritivos, quais sejam: a mediana (Q2), o quartil inferior (Q1), o quartil superior
(Q3) e do intervalo interquartil (IQR=Q3-Q1) e outliers. Os outliers são os objetos que estão
acima da cerca superior ou abaixo da cerca inferior.

31
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.1 : Exemplo do Box plot

Em relação aos atributos característicos da área de concessão, Figura 4.2 a Figura 4.6
região cujos índices pluviométricos são mais elevados é a Norte. Já na região Centro-Oeste a
CEMAT e a Enersul são oultiers superior e inferior, respectivamente. A região que possui a
menor densidade de estradas pavimentadas também é a Norte. Como a densidade de estradas
pavimentadas foi obtida por estado, os valores das distribuidoras na região Sudeste ficaram
muito próximos, ficando a mediana igual ao Q1 e ao Q3.

A dispersão da área das distribuidoras na região Norte é elevada, a menor distribuidora


é a Manaus Energia e a maior é a CEAM. Recentemente foi oficializada a junção da Manaus
Energia e a CEAM, passando a Boa Vista a possuir a menor área. Nas regiões Centro-Oeste,
Sul e Sudeste são verificados como outliers superiores a CEMAT, COPEL-DIS, Eletropaulo,
CPFL-Paulista, ESCELSA e CEMIG. Em relação à concentração de unidades consumidoras por
quilômetro quadrado em todas as regiões são verificados outliers. Em relação a este atributo, a
Eletropaulo possui a maior concentração de unidades consumidoras.

Figura 4.2 : Box plot do índice pluviométrico por região.

32
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.3 : Box plot da densidade de raios por região.

Figura 4.4 :– Box plot da densidade estradas pavimentadas por região.

Figura 4.5 : Box plot área de concessão por região.

33
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.6 : Box plot concentração das unidades consumidoras por região.

Sobre as características do sistema elétrico, Figura 4.7 e Figura 4.8, com exceção da
região Nordeste, são verificados outliers em todas as regiões em relação ao número de
consumidores. Na região Centro Oeste a Chesp e a CELG-D são ouliers inferior e superior,
respectivamente. Já na região Norte a CELPA é outlier, na região Sudeste a CEMIG e a
Eletropaulo e na região Sul a COPEL-DIS Já para o atributo extensão de rede primária são
verificadores outliers nas regiões Nordeste (COELBA), Sul (COPEL-D) e Sudeste (CEMIG,
Elektro e CPFL-Paulista).

Figura 4.7 : Box plot unidades consumidoras por região.

34
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.8 : Box plot quilômetros de rede por região.

Os atributos relativos às características de mercado são apresentados na Figura 4.9 a


Figura 4.13. Os outliers da porcentagem do consumo da classe industrial são identificados nas
regiões Norte (Manaus Energia), Sul (EFLUL e DEMEI) e Sudeste (CJE). Já o consumo médio
da classe industrial possui outliers nas regiões Norte (Manaus Energia) e Sudeste (DMEPC).
Para a porcentagem do consumo da classe rural são identificados outliers nas regiões Nordeste
(COELCE) e Sul (UHENPAL), em relação ao consumo médio da classe rural, existem outliers em
todas as regiões Centro Oeste (CEB-DIS), Nordeste (CELPE), Norte (Manaus Energia), Sudeste
(CJE) e Sul (DEMEI). Sobre o consumo médio da classe residencial apenas a região Sul
(CELES-DIS) apresenta outlier.

Figura 4.9 : Box plot porcentagem do consumo da classe industrial por região.

35
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.10 : Box plot porcentagem do consumo da classe rural por região.

Figura 4.11 : Box plot porcentagem do consumo da classe residencial por região.

Figura 4.12 : Box plot consumo médio da classe industrial por região.

36
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.13 : Box plot consumo médio da classe rural por região.

Os resultados apresentados através do box plots confirmam a heterogeneidade entre as


distribuidoras, mesmo as localizadas em uma mesma região geográfica. Assim, a aplicação da
clusterização das distribuidoras é válida para segmentar as distribuidoras considerando os
atributos selecionados pela análise fatorial.

A definição da medida de similaridade entre os elementos é a primeira etapa para


aplicação da análise de agrupamentos. Existem várias medidas de similaridade disponíveis na
literatura, sendo a mais usual a distância Euclideana, cuja fórmula é apresentada na Equação
(4.1).
(4.1)

Como a quantidade de dados analisados é pequena, 63 distribuidoras, o método de


agrupamento hierárquico foi escolhido devido à facilidade na interpretação do dendrograma.
Outro motivo favorável à escolha do método hierárquico é a não necessidade de escolha do
número de agrupamentos a priori.

Existem dois tipos de procedimentos hierárquicos de agrupamentos – aglomerativo e


divisivo. O método divisivo inicia com um único agrupamento, em passos sucessivos as
observações mais diferentes entre si são separadas e transformadas em agrupamentos
menores. Já o método aglomerativo inicia considerando cada observação um agrupamento, nos
passos seguintes os agrupamentos mais semelhantes são combinados, reduzindo o número de
agrupamentos em uma unidade a cada passo. O resultado do método aglomerativo é
apresentado na forma de um dendrograma, que é um resumo gráfico da solução da análise de
cluster.

Os métodos aglomerativos são diferenciados em relação ao critério para estabelecer a


distância entre os clusters já formados e os remanescentes. Na pré-clusterização foi utilizado o
Método de Ward, que considera o somatório do quadrado da diferença entre cada elemento ou
cluster e o valor central de cada cluster já formado. Devido à minimização da variação interna
dos clusters este método também é denominado de variância mínima (Hair et al., 2005).

37
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

A medida de similaridade adotada, distância Euclideana, é sensível a diferentes escalas


ou magnitudes entre as variáveis, sendo necessária uma padronização dos dados (Gan et al.,
2007). A padronização adotada é o escore Z, obtido pela subtração da média e divisão do
desvio-padrão para cada variável.

Na Figura 4.14 é apresentado o dendrograma obtido da pré-clusterização utilizando o


método de Ward. Para as simulações foi utilizado o programa SAS® Enterprise Guide 4.2, cujos
resultados estão disponibilizados no Apêndice II.

Figura 4.14 : Dendrograma da pré-clusterização das distribuidoras com o método de Ward.

No dendrograma a distância entre os clusters é descrita utilizando o valor R quadrado


semi parcial. Esta medida indica a perda de homogeneidade devido à junção de dois clusters. No
estágio inicial cada distribuidora é um cluster, e a junção, por exemplo, da CEAL e da ESE
implica em uma mínima perda de homogeneidade. A cada nível, a junção dos clusters implica
em uma perda de homogeneidade maior.

Realizando uma análise visual do dendrograma, e considerando o critério que no mínimo


três distribuidoras devem fazer parte de um cluster, quatro agrupamentos foram inicialmente
selecionados. A distribuição das concessionárias é apresentada na Figura 4.15.

38
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.15 : Divisão das concessionárias nos quatro clusters.

O cluster (4) concentra as distribuidoras da região Norte, com exceção da Manaus


Energia que ficou no cluster (2). Já a CEMAR, que faz parte da região Nordeste e a CEMAT, da
região Centro-Oeste, foram alocadas no cluster (4). Ao todo, o cluster (4) possui 434 conjuntos
de unidades consumidoras.

O cluster (3) concentra as distribuidoras que possuem a maior densidade de unidades


consumidoras e quilômetro de rede, sendo verificadas distribuidoras de grande porte. Neste
cluster são identificados 1858 conjuntos de unidades consumidoras.

No cluster (2), são identificadas distribuidoras que possuem o maior percentual de


consumo de energia da classe industrial e o maior consumo médio de energia da classe
industrial. No cluster (2) são identificados apenas 40 conjuntos, o que irá dificultar a clusterização
por conjunto.

Já o cluster (1) concentra, em sua maioria, distribuidoras das regiões Sul e Nordeste.
Possui maior percentual de consumo de energia da classe rural e uma pequena concentração de
número de unidades consumidoras por área de concessão. Neste cluster são identificados 909
conjuntos.

Como o cluster (2) possui uma pequena quantidade de conjuntos é necessário diminuir o
número de clusters No próximo nível do dendrograma os clusters (1) e (2) serão agregados,
passando a existir apenas três clusters. A distribuição das concessionárias considerando três
clusters é apresentada na Tabela 4.7.
Tabela 4.7: Distribuição das concessionárias considerando três clusters.
Cluster Distribuidoras Conjuntos
(1) 40 949
(2) 14 1858
(3) 9 434

Na Figura 4.16 os três clusters são apresentados de acordo no mapa geográfico do


Brasil e na Tabela 4.8 a alocação das distribuidoras nos três clusters.

39
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.16 : Divisão dos três clusters obtidos com o método de Ward.

Tabela 4.8 : Pré-clusters da pré-clusterização de distribuidoras.


(1) (1) (2)
1 CLFM BANDEIRANTE CELTINS
2 CPEE CPFL- Piratininga ELETROACRE
3 CAIUA-D CELESC-DIS CEMAR
4 CLFSC ELEKTRO CEA
5 CNEE CPFL-Paulista CERON
6 EDEVP CELG-D CEAM
7 CEAL COPEL-DIS CELPA
8 ESE AMPLA BOA VISTA
9 CFLO LIGHT CEMAT
10 EFLJC CEB-DIS
11 CHESP CEMIG-D
12 EMG COELBA
13 CEEE-D DEMEI
14 RGE ELETROPAULO
15 CELPE
16 COELCE
17 CEPISA
18 EPB
19 ELETROCAR
20 ELFSM
21 UHENPAL
22 SULGIPE
23 COSERN
24 EBO
25 IENERGIA
26 AES-SUL
27 ESCELSA

40
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

(1) (1) (2)


28 ENERSUL
29 ENF
30 COCEL
31 FORCEL
32 CSPE
33 EEB
34 HIDROPAN
35 COOPERALIANCA
36 EFLUL
37 DMEPC
38 MUX-Energia
39 MANAUS-ENERGIA
40 CJE

Na Figura 4.17 a Figura 4.28 são apresentados os box plots obtidos com os três
clusters.

Figura 4.17 : Box plot do índice pluviométrico para os 3 clusters.

Figura 4.18 : Box plot da densidade de raios para os 3 clusters.

41
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.19 : Box plot da densidade estradas pavimentadas para os 3 clusters.

Figura 4.20 : Box plot concentração das unidades consumidoras para os 3 clusters.

Figura 4.21 : Box plot área de concessão para os 3 clusters.

42
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.22 : Box plot quilômetros de rede para os 3 clusters.

Figura 4.23 : Box plot unidades consumidoras para os 3 clusters.

Figura 4.24 : Box plot porcentagem do consumo da classe industrial para os 3 clusters.

43
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.25 : Box plot porcentagem do consumo da classe rural para os 3 clusters.

Figura 4.26 : Box plot consumo médio da classe residencial para os 3 clusters.

Figura 4.27 : Box plot consumo médio da classe industrial para os 3 clusters.

44
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.28 : Box plot consumo médio da classe rural para os 3 clusters.

Na Figura 4.29 e Figura 4.30 a média e a mediana dos atributos padronizados são
apresentadas, respectivamente, para os três clusters.

Figura 4.29 : Médias dos atributos padronizados dos clusters.

45
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.30 : Medianas dos atributos padronizados dos clusters.

Em relação às características da área de concessão, o cluster (3) possui os maiores


índices pluviométricos, densidades de raios e áreas de concessão. No índice pluviométrico a
Manaus Energia é outlier no cluster (1). Na densidade de raios os clusters (1) e (2) possuem
outliers (Manaus Energia e Eletropaulo). É também o cluster (3) que possui a menor densidade
de estradas pavimentadas, sobre este atributo são verificados outliers no cluster (3), CEMAR e
CELTINS. Já o cluster (2) possui a maior densidade de estradas pavimentadas, onde a mediana
da densidade de estradas pavimentadas do cluster é igual ao Q3 (percentil 75). O cluster (1)
possui as menores áreas de concessão. Em relação á área de concessão o cluster (1) possui
como outliers a Enersul, Cepisa, Coelce, AES-Sul, CELPE e RGE e o cluster (2) CEMIG e
COELBA.

Sobre as características do sistema elétrico, o cluster (1) possui as menores


quantidades de unidades consumidoras e quilômetros de redes. Já o cluster (2) possui as
maiores quantidades destes indicadores. São identificados outliers no atributo quilômetro de rede
no cluster (1), Enersul, CELPE e COELCE. Já em relação ao número de unidades consumidoras
apenas no cluster (1) são identificados outliers, COELCE e CELPE.

Como foi apresentado na subseção anterior, foram considerados cinco atributos


correlacionados com as características do mercado. O cluster (1) possui o maior consumo
percentual da classe rural e o menor consumo médio da classe residencial. Pode-se inferir que
no cluster (1) a classe rural impacta no consumo total do cluster (1) e que a média de consumo
da classe residencial é baixa. Já o cluster (2) possui o maior consumo médio da classe industrial,
ou seja, neste cluster existem indústrias que apresentam uma média de consumo alta. Pode-se
verificar que no cluster (3) o consumo médio da classe industrial e da rural são baixos. Em
relação a porcentagem de consumo de energia da classe rural o cluster (1) possui a UHENPAL
como outlier, já em relação a média do consumo da classe rural o cluster (1) possui como outlier

46
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

a CJE. Também são identificados outliers quando analisado o consumo médio da classe
industrial, no cluster (1) são as distribuidoras Manuas Energia e EMEPC, no cluster (3) a CELPA
e CERON.

4.3 Atributos dos conjuntos


Definidas as variáveis e os três clusters de distribuidoras na pré-clusterização, a próxima
etapa realizará a comparação entre os conjuntos de unidades consumidoras dentro de cada pré-
cluster. Para apresentar a metodologia, foram utilizados os dados das subestações com primário
em alta tensão e secundário em média tensão, enviados pelas distribuidoras em resposta ao
Ofício Circular nº 0018/2009-SRD/ANEEL, de 26 de junho de 2009. Esses dados não
representam os conjuntos definitivos a serem aprovados pela ANEEL em 2010, mas se
aproximam mais destes do que os atuais conjuntos de unidades consumidoras, que são
definidos apenas pelo critério geográfico de áreas contíguas.

Os atributos requisitados para cada subestação pelo Ofício Circular nº 0018/2009-


SRD/ANEEL são apresentados a seguir:

1. Extensão de Rede de Média Tensão Urbana

2. Extensão de Rede de Média Tensão Rural

3. Número de Unidades Consumidoras Urbanas

4. Número de Unidades Consumidoras Rurais

5. Consumo Médio Mensal

6. Potência Nominal Instalada

7. Área Retangular

Com os sete atributos acima, puderam ser definidos também atributos que são
combinações destes, chegando a um total de 12 atributos:

1. Consumo Médio Mensal por km de Rede de Média Tensão

2. Percentual de Unidades Consumidoras Urbanas

3. Percentual de Rede de Média Tensão Urbana

4. Consumo Médio Mensal por Unidade Consumidora

5. Número de Unidades Consumidoras por km de Rede de Média Tensão

O atributo Área Retangular acabou mostrando-se inadequado, pois devido à


superposição de áreas em localidades urbanas esse atributo culminava por tornar as áreas de
conjuntos urbanos maiores, levando-os a serem mais comparáveis com conjuntos de localidades
rurais. Assim, decidiu-se pela não utilização do mesmo neste estudo.

47
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Todas as distribuidoras encaminharam os dados relativos ao Ofício Circular nº


0018/2009-SRD/ANEEL, com exceção da CEA. Entretanto, as concessionárias CERR e CEPISA
apresentaram os dados de forma incompleta, e tiveram suas subestações excluídas do estudo.
Assim, de um total de 3298 subestações enviadas, foram utilizadas 3241.

Decidiu-se novamente pela análise fatorial dos atributos disponíveis, uma vez que se
deve evitar que variáveis representativas de uma mesma característica sejam utilizadas
conjuntamente, o que significaria atribuir mais peso para essa característica em detrimento das
demais.

Diferentemente da análise de clusterização apresentada para as distribuidoras (pré-


clusterização), as 11 variáveis dos conjuntos foram analisadas conjuntamente. Em cada passo
da análise, foram retiradas as variáveis redundantes e selecionadas aquelas que não são
representadas pelas demais. A seguir, são descritos os passos da análise. Os resultados
detalhados constam do Apêndice III deste documento.

Passo 1 (Apêndice III – “Análise Fatorial 1 – Conjuntos”)

As variáveis “Consumo Médio Mensal por km de Rede de Média Tensão” e “Consumo


Médio Mensal por Unidade Consumidora” apresentaram MSA abaixo de 0,5. Além disso, as duas
variáveis apresentam correlação muito elevada, de 0,987. Assim, optou-se por selecionar a
variável “Consumo Médio Mensal por Unidade Consumidora”, por ser mais simples, excluindo-se
a outra.

Passo 2 (Apêndice III – “Análise Fatorial 2 – Conjuntos”)

Após a retirada das duas variáveis no Passo 1, quatro fatores foram selecionados, e as
cargas fatoriais foram definidas após rotação VARIMAX conforme Tabela 4.9.
Tabela 4.9 – Fatores após a rotação – Passo 2.
Rotated Factor Pattern
Factor1 Factor2 Factor3 Factor4
pni_kva 0,90971 0,09314 0,05585 0,12204
cmm_mwh 0,90800 -0,08176 0,07742 0,11147
nuc_urb 0,86626 -0,13471 0,08000 0,14745
ermt_rur 0,10984 0,87515 -0,16577 0,03240
perc_ermt_urb 0,57533 -0,59454 0,36955 0,10299
nuc_ermt 0,56161 -0,65777 0,00547 -0,07870
perc_nuc_urb 0,51376 0,02613 0,74441 0,06174
nuc_rur 0,16133 0,45302 -0,73795 -0,00244
ermt_urb 0,19537 0,03764 0,03734 0,97611

As variáveis “Potência Nominal Instalada”, “Consumo Médio Mensal” e “Número de


Unidades Consumidoras Urbanas” apresentaram cargas elevadas no 1º fator e cargas baixas
nos demais fatores. Ademais, a correlação entre elas é elevada, conforme a Tabela 4.10.

48
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Tabela 4.10 : Correlação das variáveis com cargas elevadas no primeiro fator do Passo 2.
nuc_urb pni_kva cmm_mwh
nuc_urb 1,00000 0,73888 0,78470
pni_kva 0,73888 1,00000 0,90826
cmm_mwh 0,78470 0,90826 1,00000

Assim, optou-se por manter a variável “Número de Unidades Consumidoras Urbanas” e


excluir as demais.

No 2º fator, a variável “Extensão de Rede de Média Tensão Rural” apresenta carga


positiva elevada, enquanto as variáveis “Percentual de Rede de Média Tensão Urbana” e
“Número de Unidades Consumidoras por km de Rede de Média Tensão” apresentaram cargas
negativas. As duas últimas também mostraram cargas semelhantes no 1º fator e possuem
correlação de 0,708. Assim, optou-se por manter a variável “Percentual de Rede de Média
Tensão Urbana”, por ser mais correlacionada com os indicadores DEC e FEC, excluindo-se a
outra. As variáveis dominantes dos fatores 3 e 4 não apresentaram correlações importantes.

Passo 3 (Apêndice III – “Análise Fatorial 3 – Conjuntos”)

A variável “Extensão de Rede de Média Tensão Rural” apresentou MSA abaixo de 0,5.
Essa variável foi selecionada e excluída do próximo passo da análise fatorial.

Passo 4 (Apêndice III – “Análise Fatorial 4 – Conjuntos”)

A variável “Número de Unidades Consumidoras Rurais” apresentou MSA abaixo de 0,5.


Essa variável foi selecionada e excluída do próximo passo da análise fatorial.

Passo 5 (Apêndice III – “Análise Fatorial 5 – Conjuntos”)

Dois fatores foram determinados, conforme a Tabela 4.11.


Tabela 4.11 : Fatores após a rotação – Passo 5.
Rotated Factor Pattern
Factor1 Factor2
perc_ermt_urb 0,86815 0,06273
perc_nuc_urb 0,83832 0,05960
nuc_urb 0,76639 0,28593
ermt_urb 0,12819 0,98230

As variáveis dominantes no primeiro fator apresentam correlações médias entre si, como
mostra a Tabela 4.12 a seguir.
Tabela 4.12 : Correlação das variáveis com cargas elevadas no primeiro fator do Passo 5.
nuc_urb perc_nuc_urb perc_ermt_urb
nuc_urb 1,00000 0,51429 0,57962
perc_nuc_urb 0,51429 1,00000 0,61062
perc_ermt_urb 0,57962 0,61062 1,00000

49
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Decidiu-se então excluir a variável “Percentual de Rede de Média Tensão Urbana”, por
ser mais correlacionada com as demais, mantendo-se as outras duas.

No segundo fator, apenas a variável “Extensão de Rede de Média Tensão Urbana”


apresentou carga elevada, pelo que se decidiu mantê-la.

Como resultado da análise fatorial, as seguintes variáveis foram selecionadas:

1. Extensão de Rede de Média Tensão Urbana

2. Extensão de Rede de Média Tensão Rural

3. Número de Unidades Consumidoras Urbanas

4. Número de Unidades Consumidoras Rurais

5. Percentual de Unidades Consumidoras Urbanas

6. Consumo Médio Mensal por Unidade Consumidora

Essas seis variáveis foram utilizadas na análise comparativa entre os conjuntos de


unidades consumidoras (definidos por subestações), através de uma clusterização dos
conjuntos, a qual será apresentada na seção seguinte.

4.4 Agrupamentos dos conjuntos


As distribuidoras foram divididas em três clusters na etapa de pré-clusterização, na qual
foram avaliados os atributos por distribuidora ou por unidade da federação.

O primeiro passo da clusterização de conjuntos consistiu na padronização dos dados


dos atributos. Utilizou-se a padronização de média zero e desvio padrão um onde cada dado
padronizado é obtido pela subtração da média desse dado seguida pela divisão do resultado
pelo desvio padrão da população. Ressalta-se que esse procedimento foi realizado com todo o
universo dos 3.241 conjuntos analisados ao mesmo tempo, sem a separação deles nos pré-
clusters (1), (2) e (3).

O próximo passo foi a retirada das observações atípicas, denominadas outliers, de forma
a evitar que subestações atípicas formem clusters com quantidades de conjuntos muito
reduzidas. A análise de outliers foi realizada separadamente para cada um dos pré-clusters. O
critério para definição de outliers foi o mesmo apresentado na Figura 4.2.1.

Apenas para o atributo “Percentual de Unidades Consumidoras Urbanas” não foi


realizada a análise de outliers, uma vez que se trata de um atributo percentual, com grande
quantidade de subestações na faixa de 0 a 6,25% (290), como mostra a Figura 4.31 a seguir.
Grande parte dessas subestações seriam retiradas pela cerca inferior caso a mesma fosse
aplicada nos clusters (2) e (3).

50
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.31 : Distribuição de Frequência do Atributo “Percentual de Unidades Consumidoras Urbanas”.

A Tabela 4.13 apresenta as quantidades de conjuntos que passaram no critério de


outliers, bem como aqueles excluídos da análise. O grande número de outliers observado no
estudo tende a ser bastante reduzido quando os conjuntos definitivos forem formados, já que a
ANEEL avaliará os casos atípicos de forma a minimizar essa ocorrência. Os resultados do filtro
de outliers constam do Apêndice IV.
Tabela 4.13 : Quantidade de conjuntos utilizados com a retirada dos outliers.
“Pré-Cluster” (1) (2) (3) TOTAL
Subestações Excluídas 216 446 128 790
Subestações Utilizadas 733 1412 306 2451
Total de Subestações 949 1858 434 3241
Percentual de Subestações Excluídas 22,76% 24,00% 29,49% 24,38%

Retirados os outliers, passa-se à etapa de clusterização dos conjuntos. O software SAS®


Enterprise Miner Client 6.1 dispõe do método de clusterização não-hierárquico k-means, o qual
foi utilizado na análise. Um parâmetro a ser definido nesse método é o número de clusters. Um
método eficiente para se determinar o número ideal de clusters a ser adotado no k-means é
executar um método hierárquico previamente, adotar uma medida estatística para escolher o
número adequado de clusters (por exemplo, medidas como distância inter-cluster, estatísticas
pseudo-F, pseudo-T² e CCC) e então utilizar o resultado com o número de clusters definido no k-
means.

O software SAS® Enterprise Miner Client 6.1 adota uma medida estatística denominada
CCC (Cubic Clustering Criterium) para a definição do número ideal de clusters numa dada
amostra. O CCC foi proposto por Sarle em 1983, e seu valor é obtido comparando-se o valor
esperado do coeficiente R² (distância inter-cluster) com a aproximação do valor esperado de R²
sob a suposição de que os grupos são provenientes de uma distribuição uniforme p-dimensional.
Nesse caso, o CCC indicaria a presença de uma estrutura de agrupamento dos dados diferente

51
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

da partição uniforme. O número de grupos da partição final estaria relacionado com valores de
CCC maiores que três (Mingoti, 2007). O SAS® Enterprise Miner Client 6.1 escolhe como número
ideal de clusters aquele em que o gráfico do CCC apresenta um pico acima do valor mínimo
especificado (opção CCC cutoff), cujo valor padrão é três.

Os três métodos hierárquicos foram inicialmente utilizados, de forma a comparar seus


resultados. Em geral, os resultados do critério CCC foram consistentes para os métodos do
Centróide e da Média das Distâncias, com o método Ward diferindo dos demais. Assim, decidiu-
se pelo método do Centróide para definição do número de clusters do k-means.

4.4.1 Clusterização do Pré-Cluster (1)

Para o pré-cluster (1), com 733 conjuntos, adotou-se inicialmente 20 sementes para o
método hierárquico. O critério utilizado para a seleção das sementes iniciais foi o critério padrão
(default) do “SAS® Enterprise Miner Client 6.1”. A Figura 4.32 apresenta o gráfico do CCC, com
sete clusters selecionados pelo método. O valor do CCC para sete clusters foi de 7,62.

Figura 4.32 : Gráfico do CCC para o pré-cluster (1).

Selecionado o número de clusters pelo critério CCC, executa-se o método k-means com
sete clusters. A Figura 4.33 apresenta a distribuição de conjuntos nos sete clusters selecionados.

52
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.33 : Distribuição dos conjuntos nos clusters – pré-cluster (1).

A Tabela 4.14 mostra as estatísticas Pseudo-F, CCC e Distância Inter-Cluster (R²) para
a clusterização do pré-cluster (1).
Tabela 4.14 : Estatísticas da clusterização k-means no pré-cluster (1).
Pseudo-F 551,8076
CCC 41,26374
Distância Inter-cluster 82,0157%

A Tabela 4.15 apresenta as estatísticas para cada variável nos sete clusters do pré-
cluster (1). Ressalta-se que NUC = Número de Unidades Consumidoras; ERMT = Extensão de
Rede de Média Tensão (km) e CMM = Consumo Médio Mensal (MWh).
Tabela 4.15 : Estatísticas das variáveis nos clusters do pré-cluster (1).
NUC ERMT ERMT % NUC CMM /
Variável: NUC Rural
Urbano Rural Urbano Urbano NUC
Cluster 1.1
Mínimo 1 - 0,21 - 0% 0,03
Máximo 3.705 879 444,92 30,95 28% 0,78
Média 763 55 100,15 2,77 3% 0,22
Mediana 224 - 42,24 - 0% 0,12
Desvio Padrão 1.069 164 121,90 5,73 7% 0,21
Coeficiente de Variação 140% 297% 122% 207% 234% 98%
Cluster 1.2
Mínimo - 18.125 - 30,34 87% 0,10
Máximo 6.270 43.938 556,59 202,85 100% 0,75
Média 652 30.356 79,79 109,12 98% 0,37
Mediana 78 28.687 4,32 101,58 100% 0,35
Desvio Padrão 1.101 7.520 131,34 40,41 3% 0,16
Coeficiente de Variação 169% 25% 165% 37% 3% 44%
Cluster 1.3
Mínimo 5.479 7.509 191,98 14,76 45% 0,07

53
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

NUC ERMT ERMT % NUC CMM /


Variável: NUC Rural
Urbano Rural Urbano Urbano NUC
Máximo 12.679 32.599 1.565,05 184,18 79% 0,59
Média 8.742 14.316 847,87 59,11 61% 0,18
Mediana 8.618 12.628 796,35 48,97 60% 0,14
Desvio Padrão 1.720 5.235 312,62 34,32 8% 0,11
Coeficiente de Variação 20% 37% 37% 58% 12% 65%
Cluster 1.4
Mínimo - 1 - - 64% -
Máximo 2.533 18.150 868,96 157,66 100% 0,78
Média 681 7.074 191,47 41,00 89% 0,32
Mediana 560 6.175 146,93 33,37 90% 0,30
Desvio Padrão 598 4.646 162,91 31,70 9% 0,16
Coeficiente de Variação 88% 66% 85% 77% 10% 52%
Cluster 1.5
Mínimo 159 170 12,69 - 27% 0,01
Máximo 6.170 11.551 1.527,57 169,76 74% 0,76
Média 3.288 4.570 505,73 25,90 56% 0,23
Mediana 3.276 4.434 468,40 19,31 58% 0,19
Desvio Padrão 1.443 2.517 270,64 22,61 10% 0,16
Coeficiente de Variação 44% 55% 54% 87% 18% 68%
Cluster 1.6
Mínimo 3.237 - 76,21 - 0% 0,04
Máximo 11.729 7.161 1.716,60 119,16 52% 0,65
Média 7.362 3.922 814,04 29,67 33% 0,23
Mediana 7.327 4.317 791,47 23,86 36% 0,21
Desvio Padrão 1.897 2.097 390,67 22,85 14% 0,13
Coeficiente de Variação 26% 53% 48% 77% 41% 58%
Cluster 1.7
Mínimo 814 4.668 44,84 20,87 66% 0,06
Máximo 6.868 37.883 1.682,43 205,48 94% 0,79
Média 3.347 16.699 614,22 87,62 83% 0,30
Mediana 3.145 15.625 604,06 81,67 83% 0,28
Desvio Padrão 1.457 6.285 316,57 41,38 6% 0,15
Coeficiente de Variação 44% 38% 52% 47% 7% 52%

As tabelas com os dados completos dos conjuntos e os centróides dos clusters


encontram-se nas planilhas disponibilizadas em anexo nesta Consulta Pública.

4.4.2 Clusterização do Pré-Cluster (2)

Para o pré-cluster (2), com 1412 conjuntos, adotou-se inicialmente 50 sementes para o
método hierárquico. O critério utilizado para a seleção das sementes iniciais foi o critério padrão
(default) do SAS® Enterprise Miner Client 6.1. A Figura 4.34 apresenta o gráfico do CCC, com 20
clusters selecionados pelo método. O valor do CCC para 20 clusters foi de 3,71.

54
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Figura 4.34 : Gráfico do CCC para o pré-cluster (2).

Selecionado o número de clusters pelo critério CCC, roda-se o método k-means com 20
clusters. A Figura 4.35 apresenta a distribuição de conjuntos nos 20 clusters selecionados.

Figura 4.35 : Distribuição dos conjuntos nos clusters – pré-cluster (2).

A Tabela 4.16 mostra as estatísticas Pseudo-F, CCC e Distância Inter-Cluster (R²) para
a clusterização do pré-cluster (2).
Tabela 4.16 : Estatísticas da clusterização k-means no pré-cluster (2).
Pseudo-F 709,4517
CCC 72,8383
Distância Inter-cluster 90,6399%

A Tabela 4.17 apresenta as estatísticas para cada variável nos 20 clusters do pré-cluster
(2). Ressalta-se que NUC = Número de Unidades Consumidoras; ERMT = Extensão de Rede de
Média Tensão (km) e CMM = Consumo Médio Mensal (MWh).

55
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Tabela 4.17 : Estatísticas das variáveis nos clusters do pré-cluster (2).


NUC ERMT ERMT % NUC CMM /
Variável: NUC Rural
Urbano Rural Urbano Urbano NUC
Cluster 2,1
Mínimo 3.115 2.530 864,90 17,20 30% 0,09
Máximo 7.964 13.458 1.830,20 128,00 71% 0,87
Média 5.673 7.357 1.340,02 46,81 55% 0,19
Mediana 5.388 6.653 1.334,20 41,40 57% 0,16
Desvio Padrão 1.076 2.902 267,58 23,39 10% 0,14
Coeficiente de Variação 19% 39% 20% 50% 18% 70%
Cluster 2.2
Mínimo 736 2.952 892,80 19,60 61% 0,15
Máximo 4.925 14.134 1.817,10 164,14 89% 0,81
Média 2.526 8.651 1.262,40 57,46 77% 0,32
Mediana 2.387 8.458 1.208,00 48,00 76% 0,27
Desvio Padrão 896 2.895 254,65 27,40 6% 0,15
Coeficiente de Variação 35% 33% 20% 48% 8% 47%
Cluster 2.3
Mínimo 1.576 8.829 968,72 77,85 71% 0,18
Máximo 6.108 30.031 1.802,71 306,11 93% 0,52
Média 2.999 20.286 1.330,93 131,34 87% 0,33
Mediana 2.791 20.489 1.314,96 120,30 88% 0,30
Desvio Padrão 890 5.046 243,09 47,99 5% 0,10
Coeficiente de Variação 30% 25% 18% 37% 6% 29%
Cluster 2.4
Mínimo 1.841 31.368 765,96 140,40 84% 0,19
Máximo 7.432 58.386 1.835,87 313,69 95% 0,59
Média 3.760 40.084 1.288,67 210,96 91% 0,33
Mediana 3.541 38.859 1.276,40 195,50 92% 0,30
Desvio Padrão 1.318 7.020 300,53 44,86 2% 0,10
Coeficiente de Variação 35% 18% 23% 21% 2% 30%
Cluster 2.5
Mínimo 1.688 31.735 127,02 178,60 81% 0,17
Máximo 7.675 53.492 648,71 312,71 96% 0,76
Média 3.956 41.372 361,67 246,49 91% 0,37
Mediana 3.036 40.204 341,96 233,83 93% 0,38
Desvio Padrão 2.006 5.548 161,79 43,75 4% 0,13
Coeficiente de Variação 51% 13% 45% 18% 5% 36%
Cluster 2.6
Mínimo 3.881 2.513 156,12 5,90 29% 0,07
Máximo 8.008 11.039 1.004,50 110,88 60% 0,87
Média 5.593 4.984 567,72 35,77 46% 0,21
Mediana 5.392 4.602 564,61 31,22 48% 0,11
Desvio Padrão 1.148 1.917 214,44 22,61 8% 0,20
Coeficiente de Variação 21% 38% 38% 63% 18% 91%
Cluster 2.7
Mínimo - 3.482 - 21,50 87% 0,00
Máximo 2.242 25.482 492,50 226,87 100% 0,92
Média 304 15.474 74,48 84,99 98% 0,48
Mediana 50 15.512 12,26 80,34 100% 0,46

56
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

NUC ERMT ERMT % NUC CMM /


Variável: NUC Rural
Urbano Rural Urbano Urbano NUC
Desvio Padrão 449 5.110 112,01 37,50 3% 0,21
Coeficiente de Variação 148% 33% 150% 44% 3% 43%
Cluster 2.8
Mínimo 742 891 592,60 4,30 35% 0,11
Máximo 4.480 9.027 1.419,05 132,57 71% 0,88
Média 2.557 3.618 904,35 25,96 57% 0,32
Mediana 2.404 3.454 894,13 22,56 60% 0,26
Desvio Padrão 1.048 1.876 195,09 18,84 9% 0,18
Coeficiente de Variação 41% 52% 22% 73% 15% 57%
Cluster 2.9
Mínimo - - 0,06 - 0% -
Máximo 1.854 289 573,33 204,15 21% 0,92
Média 752 15 95,72 4,52 1% 0,23
Mediana 642 0 63,73 - 0% 0,14
Desvio Padrão 536 49 108,38 22,76 4% 0,22
Coeficiente de Variação 71% 329% 113% 504% 319% 98%
Cluster 2.10
Mínimo - 41.288 - 70,04 96% 0,11
Máximo 2.064 63.099 354,13 315,16 100% 0,92
Média 281 51.796 31,00 175,07 99% 0,33
Mediana 0 51.277 - 176,70 100% 0,30
Desvio Padrão 496 6.049 69,57 56,36 1% 0,14
Coeficiente de Variação 176% 12% 224% 32% 1% 41%
Cluster 2.11
Mínimo - 527 - 3,31 66% 0,07
Máximo 2.662 13.410 435,28 92,49 100% 0,91
Média 775 4.849 182,29 30,92 86% 0,33
Mediana 613 4.292 172,54 25,97 88% 0,30
Desvio Padrão 563 2.819 120,90 20,06 9% 0,21
Coeficiente de Variação 73% 58% 66% 65% 10% 63%
Cluster 2.12
Mínimo 372 1.202 109,55 125,50 76% 0,14
Máximo 2.772 11.077 1.023,16 292,29 90% 0,41
Média 938 4.691 588,61 209,20 83% 0,24
Mediana 737 3.367 595,92 202,26 84% 0,25
Desvio Padrão 597 2.708 263,31 54,11 4% 0,07
Coeficiente de Variação 64% 58% 45% 26% 5% 30%
Cluster 2.13
Mínimo 334 14.655 10,22 57,40 82% 0,13
Máximo 5.002 34.978 889,06 250,63 99% 0,91
Média 2.158 24.346 348,05 141,48 92% 0,40
Mediana 1.883 23.910 320,38 140,94 92% 0,35
Desvio Padrão 1.051 4.982 185,80 38,22 4% 0,18
Coeficiente de Variação 49% 20% 53% 27% 4% 47%
Cluster 2.14
Mínimo 436 347 16,44 2,37 28% 0,06
Máximo 3.682 5.755 682,10 116,52 68% 0,89
Média 2.130 2.446 281,34 24,83 51% 0,23

57
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

NUC ERMT ERMT % NUC CMM /


Variável: NUC Rural
Urbano Rural Urbano Urbano NUC
Mediana 2.222 1.931 262,03 19,40 53% 0,16
Desvio Padrão 874 1.484 146,60 22,64 12% 0,18
Coeficiente de Variação 41% 61% 52% 91% 23% 79%
Cluster 2.15
Mínimo 1.395 - 494,17 - 0% 0,05
Máximo 7.205 2.042 1.652,04 16,74 30% 0,83
Média 3.376 416 888,22 4,71 9% 0,27
Mediana 3.188 7 761,70 2,90 0% 0,23
Desvio Padrão 1.335 584 304,44 5,27 11% 0,20
Coeficiente de Variação 40% 140% 34% 112% 121% 75%
Cluster 2.16
Mínimo 2.604 - 20,03 - 0% 0,05
Máximo 7.822 1.520 580,30 81,85 26% 0,90
Média 3.936 195 234,42 5,39 4% 0,29
Mediana 3.445 2 217,90 0,13 0% 0,19
Desvio Padrão 1.434 392 129,38 15,14 8% 0,27
Coeficiente de Variação 36% 201% 55% 281% 187% 93%
Cluster 2.17
Mínimo 3.562 15.843 264,13 75,30 74% 0,15
Máximo 7.681 34.019 1.190,31 287,63 89% 0,74
Média 5.292 23.996 828,67 146,38 81% 0,36
Mediana 5.140 23.342 826,88 128,05 82% 0,33
Desvio Padrão 1.209 5.708 205,94 52,94 4% 0,16
Coeficiente de Variação 23% 24% 25% 36% 5% 46%
Cluster 2.18
Mínimo - 23.698 - 44,17 95% 0,12
Máximo 2.245 43.783 468,87 273,83 100% 0,90
Média 206 33.574 36,55 133,63 99% 0,43
Mediana 0 33.621 0,23 128,39 100% 0,42
Desvio Padrão 379 5.371 72,37 50,07 1% 0,17
Coeficiente de Variação 184% 16% 198% 37% 1% 40%
Cluster 2.19
Mínimo 323 1.036 266,34 10,92 68% 0,08
Máximo 3.075 18.878 960,85 122,70 94% 0,86
Média 1.530 7.855 599,59 48,58 82% 0,33
Mediana 1.448 7.138 551,20 41,77 82% 0,30
Desvio Padrão 619 3.827 166,22 25,06 7% 0,15
Coeficiente de Variação 40% 49% 28% 52% 8% 47%
Cluster 2.20
Mínimo 2.602 5.984 58,32 19,26 62% 0,09
Máximo 7.757 27.077 891,61 177,83 84% 0,90
Média 4.345 12.171 454,14 84,80 73% 0,27
Mediana 4.118 10.973 455,04 78,02 72% 0,22
Desvio Padrão 1.174 4.359 216,99 40,17 5% 0,16
Coeficiente de Variação 27% 36% 48% 47% 8% 60%

As tabelas com os dados completos dos conjuntos e os centróides dos clusters


encontram-se nas planilhas disponibilizadas em anexo nesta Consulta Pública.

58
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

4.4.3 Clusterização do Pré-Cluster (3)

Para o pré-cluster (3), com 306 conjuntos, adotou-se inicialmente 10 sementes para o
método hierárquico. O critério utilizado para a seleção das sementes iniciais foi o critério padrão
(default) do SAS® Enterprise Miner Client 6.1. A Figura 4.36 apresenta o gráfico do CCC, com
cinco clusters selecionados pelo método. O valor do CCC para cinco clusters foi de 8,55.

Figura 4.36 : Gráfico do CCC para o pré-cluster (3).

Selecionado o número de clusters pelo critério CCC, roda-se o método k-means com
cinco clusters. A Figura 4.37 apresenta a distribuição de conjuntos nos cinco clusters
selecionados.

Figura 4.37 : Distribuição dos conjuntos nos clusters – pré-cluster (3).

A Tabela 4.18 mostra as estatísticas Pseudo-F, CCC e Distância Inter-Cluster (R²) para
a clusterização do pré-cluster (3).

59
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Tabela 4.18 : Estatísticas da clusterização k-means no pré-cluster (3).


Pseudo-F 347,3534
CCC 14,28219
Distância Inter-cluster 82,1937%

A Tabela Tabela 4.19 apresenta as estatísticas para cada variável nos cinco clusters do
pré-cluster (3). Ressalta-se que NUC = Número de Unidades Consumidoras; ERMT = Extensão
de Rede de Média Tensão (km) e CMM = Consumo Médio Mensal (MWh).
Tabela 4.19 : Estatísticas das variáveis nos clusters do pré-cluster (3).
NUC ERMT ERMT % NUC CMM /
Variável: NUC Rural
Urbano Rural Urbano Urbano NUC
Cluster 3.1
Mínimo - 6.213 - 38,77 86% 0,09
Máximo 2.827 30.083 998,73 173,32 100% 0,53
Média 812 17.286 327,62 97,69 95% 0,28
Mediana 717 16.371 188,06 93,28 95% 0,28
Desvio Padrão 771 5.926 350,41 36,98 5% 0,12
Coeficiente de Variação 95% 34% 107% 38% 5% 42%
Cluster 3.2
Mínimo - 138 - 0,87 68% 0,03
Máximo 1.258 13.808 737,23 171,58 100% 0,45
Média 232 2.852 84,09 20,38 92% 0,20
Mediana 114 1.991 16,50 13,80 94% 0,18
Desvio Padrão 298 2.524 136,58 22,54 8% 0,07
Coeficiente de Variação 128% 89% 162% 111% 9% 37%
Cluster 3.3
Mínimo 61 - - - 0% 0,04
Máximo 5.420 193 492,60 12,46 32% 0,40
Média 758 8 36,74 0,43 1% 0,13
Mediana 322 0 2,12 - 0% 0,12
Desvio Padrão 1.200 33 101,03 1,95 5% 0,07
Coeficiente de Variação 158% 408% 275% 455% 493% 52%
Cluster 3.4
Mínimo 623 759 976,10 7,82 27% 0,11
Máximo 5.999 30.025 2.347,85 179,08 93% 0,55
Média 2.612 9.051 1.519,51 63,22 75% 0,26
Mediana 2.244 7.361 1.457,02 59,36 77% 0,24
Desvio Padrão 1.459 6.388 396,38 36,08 12% 0,11
Coeficiente de Variação 56% 71% 26% 57% 17% 41%
Cluster 3.5
Mínimo 185 363 15,80 4,45 33% 0,02
Máximo 6.418 18.308 1.044,12 84,53 80% 0,46
Média 2.505 4.965 446,08 29,45 64% 0,17
Mediana 2.049 3.530 413,75 23,89 66% 0,14
Desvio Padrão 1.668 4.116 257,09 19,71 11% 0,10
Coeficiente de Variação 67% 83% 58% 67% 17% 56%

60
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

As tabelas com os dados completos dos conjuntos e os centróides dos clusters


encontram-se nas planilhas disponibilizadas em anexo nesta Consulta Pública.

4.5 Definição dos Limites


As distribuidoras de energia elétrica atuam em um mercado caracterizado como
monopólio natural, não havendo a “pressão” para melhoria da qualidade do serviço existente nos
mercados abertos onde ocorre a livre concorrência de mercado. Com intuito de simular uma
concorrência, a Agência Reguladora adota uma metodologia de análise comparativa para
estabelecer os limites dos indicadores de continuidade, DEC e FEC.

A aplicação da análise comparativa parte do pré-suposto que os conjuntos localizados


em um mesmo agrupamento são semelhantes e, por conseqüência, a continuidade do
fornecimento de energia elétrica também deve ser semelhante. Nas seções anteriores foram
apresentadas metodologias que possibilitam o estabelecimento de agrupamentos de conjuntos
de unidades consumidoras semelhantes. Os conjuntos pertencentes ao mesmo cluster serão
comparados de forma a se estabelecer os limites de DEC e FEC.

Dos critérios de comparação existentes na literatura foram utilizados neste trabalho três
critérios. São eles:

1. percentil – o limite é um percentil (medida de posição) das distribuições


univariadas do DEC e do FEC;

2. benchmark – o limite é definido pelo conjunto com melhor desempenho;

3. análise envoltória de dados (DEA) – os limites são estabelecidos de acordo com


a eficiência de cada conjunto.

Diferentemente da média dos valores apurados para os três últimos anos, na base
utilizada para o presente estudo foram utilizados dados de DEC e FEC apurados apenas para o
ano de 2008. Para amenizar o efeito de eventuais valores apurados excessivamente baixos,
foram determinados o percentil cinco do DEC e do FEC dos conjuntos para cada pré-cluster de
distribuidoras, constantes da Tabela 4.20. Os conjuntos que apresentaram indicadores inferiores
aos mínimos estabelecidos não foram considerados na análise comparativa. A definição do
percentil 5 foi arbitrária, e necessária para amenizar o efeito da não aplicação da média no
histórico.
Tabela 4.20: Percentil cinco do DEC e FEC dos conjuntos das distribuidoras.
Conjuntos
Pré-cluster DEC FEC
Total Considerados
1 4,56 3,38 733 683
2 3,53 2,42 1412 1314
3 7,83 6,50 306 285

O DEA tem se tornado um dos métodos de análise comparativa mais utilizados pelos
reguladores (Simab et al., 2009). O DEA é um método não paramétrico que estima a eficiência
de uma unidade de produção, em termos comparativos aos melhores padrões de uma amostra
de unidades produtivas. A eficiência é uma relação entre insumos e produtos – quanto mais
produtos uma unidade produz para uma determinada quantidade de insumos (lógica do produto),

61
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

ou alternativamente, quanto menos insumos uma unidade gasta para obter alguma quantidade
fixa de produtos (lógica do insumo), mais eficiente é a unidade.

O modelo DEA aqui desenvolvido considera os conjuntos como unidades de produção,


que possuem como insumos seus atributos e como produto a qualidade do fornecimento de
energia elétrica. O objetivo é estabelecer qual seria a qualidade da continuidade do fornecimento
de energia elétrica, medida segundo os valores apurados dos indicadores DEC e FEC, se os
conjuntos de unidades consumidoras atuassem de forma eficiente dado os dispêndios de
insumos. Ou seja, quanto poderiam ser os produtos (DEC e FEC), dada a utilização atual de
insumos.

A qualidade do fornecimento é considerada como o produto do modelo DEA. Para


adequar o produto medido à lógica do DEA, foram considerados como produtos o inverso dos
indicadores, conforme as equações a seguir. Tal adequação também foi adotada no trabalho de
Pessanha (2006).
(4.2)

(4.3)

Onde,

DECapurado e FECapurado são os indicadores referentes ao ano de 2008 informados pelas


distribuidoras.

A lógica adotada no modelo DEA foi a do produto, já que o objetivo é obter a máxima
qualidade dado os insumos. Quanto ao tipo de rendimento de escala adotado no modelo, o
rendimento constante de escala é o mais adequado, já que os conjuntos já foram clusterizados e
são razoavelmente homogêneos quanto ao porte (Pessanha, 2006). Aplicando o retorno
constante de escala a eficiência obtida é a técnica. A medida de eficiência técnica orientada ao
produto propõe-se a responder a seguinte questão: “de quanto podem ser aumentadas
proporcionalmente as quantidades de produtos sem mudar as quantidades de insumos?”
(Ferreira et al., 2009)

Quanto maior o insumo, maior deve ser o produto da unidade de produção. Portanto, é
necessário identificar os atributos, cujos aumentos melhoram a qualidade da continuidade do
fornecimento. Nos trabalhos descritos na Seção 3.2 são propostos vários tipos de insumos, são
eles:

1. consumo por unidade consumidora;

2. mercado por extensão de rede;

3. extensão de rede;

4. potência instalada;

62
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

5. porcentagem de consumo da classe industrial;

6. número de transformadores;

7. número de chaves seccionadoras;

8. tipo de seccionadores;

9. valor gasto em operação e manutenção.

Dos insumos citados, os quatro primeiros estão disponíveis por conjunto de unidades
consumidoras. Para obter os insumos restantes será necessário solicitar tais informações às
distribuidoras.

As combinações de atributos realizas para selecionar os insumos são apresentadas na


Tabela 4.21. Tais combinações foram consideradas por distribuidora. Para cada pré-cluster a
eficiência técnica foi obtida considerando a combinação de insumos e o inverso do DEC e do
FEC como produto. A fronteira de eficiência, considerando cada combinação, praticamente não
varia e, por este motivo, a combinação CMM_NUC e NUC_ERMT foi selecionada de forma
arbitrária. Outra combinação pode ser escolhida, ou até mesmo alguma forma de combinação
dos resultados de vários modelos, como a média das eficiências considerando todas as
combinações.
Tabela 4.21 : Combinações de insumos.
Insumos
1 CMM_NUC e NUC_ERMT
2 PNI_NUC e NUC_ERMT
3 PNI_NUC e CMM_ERMT
4 CMM_NUC e PNI_ERMT
5 CMM_NUC e CMM_ERMT
6 PNI_NUC e PNI_ERMT

Para aplicação do DEA foi utilizado o pacote FEAR (Wilson, 2009) implementado para o
programa R 1 . No referido pacote a medida de eficiência é estimada com a função de distância
de Shephard (1970) – neste caso, para orientação a produto as eficiências são menores ou
iguais a um.

Os resultados da análise comparativa de todos os clusters encontram-se nas planilhas


disponibilizadas em anexo nesta Consulta Pública. Os valores de referência dos indicadores
variam de acordo com a análise aplicada. A seguir será apresentado, como exemplo, o resultado
obtido do Cluster 12 pertencente ao pré-cluster (2).

Do agrupamento (2) obtido da pré-clusterização das distribuidoras foram obtidos 20


clusters de conjuntos. Os insumos e produtos dos conjuntos do Cluster 5 são apresentados na

1
http://cran.r-project.org/

63
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Tabela 4.22. Os resultados obtidos do Cluster 12 são apresentados na Tabela 4.23 e Tabela
4.24.
Tabela 4.22 : Insumos e produtos dos conjuntos do Cluster 5.
Insumos Produtos

Distribuidora Conjunto CMM_NUC NUC_ERMT 1/DEC 1/FEC

AES-Eletropaulo AES-Eletropaulo_ITP 0,400 79,539 0,045 0,101

Bandeirante Bandeirante_BRR 0,417 65,184 0,060 0,134

Bandeirante Bandeirante_GUR 0,413 46,215 0,110 0,197

Bandeirante Bandeirante_JCE 0,371 67,227 0,081 0,159

Bandeirante Bandeirante_JNO 0,339 118,074 0,066 0,108

Bandeirante Bandeirante_PID 0,432 68,011 0,096 0,176

Bandeirante Bandeirante_SUZ 0,510 124,108 0,074 0,133

CELESC-DIS CELESC-DIS_PCS 0,215 79,459 0,117 0,137

CELESC-DIS CELESC-DIS_PLA 0,268 70,468 0,031 0,065

CELESC-DIS CELESC-DIS_TRO 0,365 83,892 0,164 0,138

CELG-D CELG-D_5001078 S2 0,231 64,189 0,091 0,099

CEMIG-D CEMIG-D_CRF 0,238 60,929 0,064 0,135

CEMIG-D CEMIG-D_IIGU 0,166 62,500 0,077 0,129

CEMIG-D CEMIG-D_NOG 0,381 62,957 0,057 0,141

COELBA COELBA_ALG 0,202 70,570 0,115 0,152

CPFL-Paulista CPFL-Paulista_AUS 0,445 85,470 0,159 0,164

CPFL-Piratininga CPFL-Piratininga_ITU 0,760 77,361 0,103 0,136

CPFL-Piratininga CPFL-Piratininga_PGO 0,383 96,887 0,100 0,107

Elektro Elektro_FRR 0,447 111,857 0,133 0,179

64
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Tabela 4.23 : Aplicação da análise comparativa do Cluster 5 (DEA).


Apurado Eficiente

Distribuidora Conjunto DEC FEC Eficiência DEC FEC

AES-Eletropaulo AES-Eletropaulo_ITP 22,119 9,906 43,610% 9,646 4,320

Bandeirante Bandeirante_BRR 16,710 7,477 60,640% 10,133 4,534

Bandeirante Bandeirante_GUR 9,125 5,079 100,000% 9,125 5,079

Bandeirante Bandeirante_JCE 12,310 6,290 76,800% 9,454 4,831

Bandeirante Bandeirante_JNO 15,190 9,280 42,210% 6,412 3,917

Bandeirante Bandeirante_PID 10,443 5,688 76,810% 8,021 4,369

Bandeirante Bandeirante_SUZ 13,563 7,509 41,450% 5,622 3,112

CELESC-DIS CELESC-DIS_PCS 8,560 7,325 95,800% 8,201 7,017

CELESC-DIS CELESC-DIS_PLA 32,001 15,476 36,920% 11,815 5,714

CELESC-DIS CELESC-DIS_TRO 6,090 7,264 100,000% 6,090 7,264

CELG-D CELG-D_5001078 S2 11,036 10,144 79,100% 8,729 8,024

CEMIG-D CEMIG-D_CRF 15,581 7,416 87,940% 13,702 6,521

CEMIG-D CEMIG-D_IIGU 13,036 7,737 100,000% 13,036 7,737

CEMIG-D CEMIG-D_NOG 17,603 7,078 68,760% 12,104 4,867

COELBA COELBA_ALG 8,723 6,562 100,000% 8,723 6,562

CPFL-Paulista CPFL-Paulista_AUS 6,270 6,100 91,720% 5,751 5,595

CPFL-Piratininga CPFL-Piratininga_ITU 9,750 7,370 55,900% 5,450 4,120

CPFL-Piratininga CPFL-Piratininga_PGO 9,970 9,380 56,170% 5,600 5,269

Elektro Elektro_FRR 7,529 5,598 66,520% 5,008 3,724

Tabela 4.24 : Aplicação da análise comparativa do Cluster 5 (benchmarck e percentil).

Critério DEC FEC

Benchmark 6,09 5,08

Percentil 20 8,66 6,21

Percentil 30 9,37 6,77

Mediana 11,04 7,37

Conjuntos que possuem eficiência 100% fazem parte da fronteira de eficiência e são
referência de produtividade para os conjuntos que não são eficientes. O conjunto CEMIG-D_CRF
possui 87,94% de eficiência, ou seja, considerando os insumos utilizados pelo conjunto é
possível aumentar a produção em 13,7% (1/0,8794=1,137). Para obter os valores de DEC e FEC
eficientes, basta multiplicá-los pelas as eficiências obtidas do modelo DEA. Na Tabela 4.24 são

65
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

apresentados os valores de referência do Cluster 12 considerando o benchmark, percentil 20,


percentil 30 e mediana.

A aplicação imediata de valores de referência é simples, mas é importante interpretar o


resultado do DEA, que define as eficiências com base nos insumos utilizados. Por esta razão,
não há um valor alvo para o DEC e FEC, mas sim um alvo para a eficiência: 100%. Percebe-se,
por exemplo, que o conjunto CEMIG-D_IIGU é eficiente apesar de apresentar alto DEC em
relação aos demais conjuntos do cluster.

A aplicação do benchmark parte do pré-suposto que os conjuntos de um agrupamento


são perfeitamente semelhantes. Porém, essa é uma suposição teórica que, na prática, pode não
ocorrer. Afinal, sempre haverá imprecisões na definição e apuração dos atributos dos conjuntos.
Esta é a motivação da aplicação dos percentis, que representam uma flexibilização devido às
imprecisões naturais da metodologia.

Tendo sido definidos os “valores alvo” de DEC e FEC para cada conjunto, deve-se
definir a trajetória de limites dos conjuntos anualmente. Não é apresentada nesta consulta uma
proposta fechada, sendo cogitadas algumas alternativas. A primeira seria uma trajetória linear
simples, partindo-se do limite vigente do conjunto (estabelecido em resolução) até o valor alvo
estabelecido por alguma das metodologias apresentadas. Neste caso, o valor alvo deveria ser
atingido no final do ciclo tarifário (que varia entre as distribuidoras de três a cinco anos).

Pode-se ainda adicionar algum limitante de decaimento dos limites baseado em


históricos de apuração dos conjuntos do cluster. Exemplificando, supondo que um conjunto de
um cluster tenha atingido uma melhora de desempenho de 15% ao ano nos últimos quatro anos.
Então essa taxa de decaimento seria um limitante a ser aplicado aos conjuntos demais conjuntos
do cluster. Partindo-se dos limites vigentes, define-se uma trajetória linear até o valor alvo,
limitada à taxa de 15% (no caso do exemplo).

Outra alternativa seria associar à trajetória alguma informação relacionada à qualidade


da clusterização em cada cluster. Em clusters menos homogêneos pode-se aplicar algum fator
de atenuação dos limites, evitando que sejam propostos limites rigorosos a conjuntos que não
possuem bons semelhantes.

Como uma última análise, são apresentados na Tabela os valores globais de DEC e
FEC apurados com os conjuntos considerados na análise, o número de conjuntos considerados
eficientes para cada distribuidora e sua porcentagem.
Tabela 4.25 : Valores globais de DEC e FEC apurados das distribuidoras e seus conjuntos eficientes.
Conjuntos Apurado
Distribuidora Cluster Utilizados Eficientes % DEC FEC
AES-SUL 1 50 0 0,00 19,09 11,50
CAIUA-D 1 8 0 0,00 7,22 6,83
CEAL 1 30 2 6,67 20,90 16,41
CEEE-D 1 48 0 0,00 25,62 17,40
CELPE 1 96 4 4,17 16,40 8,22
CFLO 1 1 1 100,00 20,06 8,52
CHESP 1 7 0 0,00 18,90 37,82

66
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

CLFM 1 5 0 0,00 7,63 7,09


CLFSC 1 17 1 5,88 8,48 9,54
CNEE 1 7 0 0,00 11,18 19,64
COCEL 1 4 0 0,00 12,06 8,54
COELCE 1 62 10 16,13 9,80 7,70
COSERN 1 48 0 0,00 14,79 8,37
CPEE 1 10 1 10,00 10,08 10,35
CSPE 1 8 1 12,50 10,19 8,84
EBO 1 6 0 0,00 15,57 11,18
EDEVP 1 9 2 22,22 7,13 7,47
EEB 1 4 0 0,00 14,86 13,50
EFLJC 1 1 0 0,00 8,74 10,00
Eletrocar 1 2 0 0,00 18,80 15,83
ELFSM 1 2 0 0,00 7,16 4,58
EMG 1 43 0 0,00 15,40 12,44
ENERSUL 1 19 1 5,26 11,17 8,22
ENF 1 5 0 0,00 20,83 22,62
EPB 1 65 2 3,08 36,98 18,70
ESCELSA 1 26 5 19,23 15,69 9,73
ESE 1 20 0 0,00 28,83 13,70
HIDROPAN 1 1 0 0,00 17,61 19,00
IENERGIA 1 1 0 0,00 7,66 11,48
MANAUS 1 3 0 0,00 33,84 23,40
MUX-Energia 1 1 0 0,00 5,11 5,48
RGE 1 69 3 4,35 14,88 9,36
SULGIPE 1 3 0 0,00 29,52 19,49
UHENPAL 1 2 0 0,00 9,55 8,54
Light 2 44 0 0,00 10,20 6,24
Elektro 2 99 14 14,14 8,21 6,05
DEMEI 2 1 0 0,00 13,67 10,60
CPFL-Piratininga 2 10 0 0,00 7,97 6,65
CPFL-Paulista 2 199 10 5,03 7,13 6,08
COPEL-DIS 2 77 1 1,30 10,49 9,26
COELBA 2 188 27 14,36 14,68 6,95
CEMIG-D 2 267 36 13,48 14,07 6,58
CELG-D 2 97 7 7,22 19,04 18,30
CELESC-DIS 2 99 2 2,02 13,93 9,92
CEB-DIS 2 15 0 0,00 16,50 17,19
Bandeirante 2 38 1 2,63 12,01 6,70
Ampla 2 103 0 0,00 14,02 10,98
AES-Eletropaulo 2 77 0 0,00 9,60 5,38
Eletroacre 3 8 3 37,50 13,02 13,18
CERON 3 32 3 9,38 38,73 49,56

67
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

CEMAT 3 46 5 10,87 35,34 32,56


CEMAR 3 39 9 23,08 27,33 15,87
CELTINS 3 14 4 28,57 43,71 27,38
CELPA 3 69 1 1,45 85,69 64,75
CEAM 3 77 1 1,30 97,22 99,65

As distribuidoras que possuem menor quantidade de conjuntos estão localizadas no pré-


cluster (1). A CFLO possui um conjunto que é eficiente, já a COELCE possui 62 conjuntos,
sendo 16,13% deles eficientes. Já no pré-cluster (2), a COELBA possui a maior porcentagem de
conjuntos eficientes, seguida da Elektro. O pré-cluster (2) possui a maior média dos insumos, e
por conseqüência, os conjuntos com menor densidade de consumidores por quilômetro de rede
ficaram eficientes apesar de apresentarem valores elevados de DEC e FEC. No pré-cluster (3) a
distribuidora que apresentou percentualmente mais conjuntos eficientes foi a Eletroacre, que dos
seus oito conjuntos, 37,50% são eficientes. Neste pré-cluster também são identificados
conjuntos com valores altos de DEC e FEC e que possuem poucos insumos.

68
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

5 Discussão
Apresentou-se na seção anterior uma proposta de metodologia para o estabelecimento
dos limites dos indicadores coletivos de continuidade, DEC e FEC. A metodologia foi dividida em
cinco tópicos, conforme ilustra a Figura 5.1.

Figura 5.1 – Etapas da metodologia proposta.

Inicialmente, apresentou-se uma análise de atributos apurados por distribuidora, para


então ser realizada uma pré-clusterização, que antecede a clusterização dos conjuntos.
Ressalta-se que a pré-clusterização foi a maneira encontrada para serem considerados diversos
novos atributos. Conforme apresentado na Seção 4, foram analisados 28 atributos que
representam diversas características.

Para a seleção dos atributos das distribuidoras, foi aplicada a técnica de análise fatorial,
que, conjuntamente com a análise das correlações, indica as variáveis que possuem informação
útil à análise. Buscou-se detalhar bastante o procedimento, com a descrição das etapas passo a
passo, facilitando assim as contribuições.

Outro ponto importante é relacionado à atualização das variáveis. Foram utilizados


dados do Ofício Circular nº 018-2009/SRD-ANEEL. Como a metodologia será aplicada apenas
no próximo ano, será possível a utilização dos atributos dos conjuntos a serem definidos neste
ano, fato que provavelmente levará a uma melhoria na qualidade dos dados.

Da primeira etapa são enumeradas as seguintes questões:

Q.1. Há necessidade de se estudar mais atributos?

Q.2. É necessário aprimorar o método utilizado para a seleção dos atributos?

Q.3. Das variáveis analisadas, existem variáveis que deveriam ter sido selecionadas
ou excluídas?

69
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Escolhidas as variáveis, foi realizada a clusterização das distribuidoras. O resultado da


clusterização hierárquica indicou a possibilidade de se formarem três ou quatro clusters, tendo
sido escolhida a primeira opção.

Avaliou-se como importante a etapa de pré-clusterização na metodologia. Percebe-se


pela quantidade reduzida de clusters que essa etapa funcionou basicamente como um filtro: foi
mais útil para separar as distribuidoras diferentes do que para de fato agrupar as distribuidoras
semelhantes. Isso garante que na etapa de clusterização dos conjuntos a chance de serem
comparados conjuntos com realidades geográficas distintas é pequena, mesmo que tenham
atributos semelhantes.

Algumas questões podem ser enumeradas nessa etapa:

Q.4. Há necessidade de se avaliar outros métodos de clusterização?

Q.5. A quantidade de clusters selecionada é adequada? Se não, qual deveria ser o


critério?

A análise dos atributos dos conjuntos foi semelhante à realizada para os atributos das
distribuidoras. Atributos mais relacionados ao sistema elétrico e ao mercado da distribuidora
foram predominantes, por serem mais facilmente obtidos em comparação aos geográficos e
sócio-econômicos.

O atributo Área Retangular foi uma tentativa de se obter um critério robusto para a
definição da área do conjunto, dificuldade enfrentada com o atributo vigente que representa a
área. Entretanto o atributo não demonstrou ser importante para a análise, e não foi selecionado.
Com o envio regular dos dados geo-referenciados pelas distribuidoras a partir do próximo ano,
novas análises poderão ser realizadas.

As questões relacionadas à análise das variáveis dos conjuntos são as mesmas já


listadas para a análise das variáveis das distribuidoras.

Após a análise das variáveis dos conjuntos, realizou-se a clusterização dos conjuntos
em cada pré-cluster. Nesta etapa foi realizada a análise dos conjuntos discrepantes (outliers).

Ressalta-se que sempre existirão conjuntos diferentes em relação à distribuição de suas


variáveis, e que a quantidade de outliers é diretamente proporcional à quantidade de atributos.
Apesar de ser normal a exclusão de outliers em análises estatísticas, em alguns casos é
reconhecido que estes podem permanecer na população em análise.

Dentre os métodos de clusterização disponíveis, a utilização da proposta de


clusterização dinâmica pode minimizar os efeitos dos outliers. Entretanto, esse método de
clusterização tem como desvantagem a dificuldade de análise dos agrupamentos e,
conseqüentemente, dos resultados – afinal, seria formado um cluster para cada conjunto.

Questionam-se os seguintes pontos sobre a clusterização dos conjuntos:

Q.6. A padronização das variáveis deve ser aplicada no universo de todos os


conjuntos, ou em cada pré-cluster existente?

70
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

Q.7. Deve ser realizada a exclusão dos outliers previamente à clusterização?

Q.8. Há necessidade de se avaliar outros métodos de clusterização?

Enfim, a última etapa da metodologia proposta é a definição dos limites dos indicadores
DEC e FEC para os conjuntos de unidades consumidoras. Foram apresentadas três formas
diferentes de definição dos limites: percentil, benchmark e DEA.

As duas primeiras propostas são bastante simples, e pode-se considerar o benchmark


uma espécie de percentil. O uso do percentil está relacionado a uma “flexibilização” no
estabelecimento dos limites, semelhante à definição de outlier – define-se que os n primeiros
integrantes da distribuição devem ser desconsiderados por alguma razão.

O método DEA tem tido aplicação crescente em regulação, e é uma técnica interessante
para se definir a eficiência dos conjuntos com relação à qualidade. O ranking das eficiências
obtido por este modelo é um diferente paradigma no estabelecimento dos limites, pois os valores
ideais (eficientes) de DEC e FEC para os conjuntos em um dado cluster não serão os mesmos,
mas sim proporcionais a seus atributos.

Possui como desvantagem a maior complexidade matemática do modelo, o que pode


dificultar a avaliação dos resultados obtidos. Devido à existência da assimetria de informações,
outra desvantagem da aplicação do DEA é que o modelo é mais sensível à variação dos
atributos. Pequenas imprecisões na apuração dos atributos significarão mudanças nos limites a
serem estabelecidos pelo DEA, mas provavelmente não alterariam o resultado da clusterização
e, conseqüentemente, dos limites fixados por percentis ou benchmark.

Uma vez estabelecida aplicação do DEA é necessário avaliar aplicação de novos


insumos e a possibilidade de utilizar uma média da eficiência obtida considerando outros
insumos, além da possibilidade de utilização de retornos variáveis.

Independentemente da estratégia a ser adotada na definição dos limites, é necessário


discutir uma trajetória para o alcance dos mesmos (valores alvo). A metodologia vigente prevê
um intervalo de oito anos para que o conjunto atinja os valores alvos. Propõe-se que não seja
fixado um intervalo, mas sim que sejam discutidos valores máximos de decréscimo para tornar o
cumprimento dos limites factível, partindo-se dos limites vigentes para cada conjunto. Ressalta-
se que a aplicação desse critério resolveria alguns problemas da aplicação do modelo DEA,
onde podem ser encontrados conjuntos muito ineficientes, com limites extremamente rigorosos.

Enumeram-se as seguintes questões relacionadas à definição dos limites:

Q.9. Qual estratégia é a mais indicada para a definição dos limites de continuidade?

Q.10. Optando-se pelo modelo DEA, questionam-se quais são os insumos


adequados?

Q.11. Independentemente da estratégia a ser adotada, deve-se avaliar os indicadores


DEC e FEC conjuntamente ou de forma separada?

Q.12. Qual seria a melhor forma de definir a trajetória para os conjuntos atingirem os
valores alvo?

71
Revisão da Metodologia de Estabelecimento dos Limites dos
Indicadores Coletivos de Continuidade
Documento Anexo à Nota Técnica nº 0028/2010-SRD/ANEEL

6 Referências
Ferreira, C. M. de C. e Gomes, A. P. (2009). Introdução à análise envoltória de dados – Teoria,
modelos e aplicações. Editora UFV, Viçosa-MG.

Gan, G., Ma, C. and Wu, J. (2007). Data Clustering Theory, Algorithms, and Applications,
Alexandria, ASA-SIAM Series on Statistics and Applied Probability, SIAM, Philadelphia, SAS.

Hair, J. F., Anderson, R. E., Tatham, R. L. e Black, W. C. (2005). Análise Multivariada de Dados,
5ª edn, Porto Alegre: Bookman.

Mingoti, S. A. (2007). Análise de dados através de métodos de estatística multivariada. Editora


UFMG, Belo Horizonte – MG.

Pessanha, J. F. M. (2006). Um Modelo de Análise Envoltória de Dados para Estabelecimento


das Metas de Continuidade do Fornecimento de Energia Elétrica. Tese de Doutorado.

Simab, M. e Haghifam, M. R. (2009). DEA Efficiency for the benchmarking of Iranian electric
distribution utilities. 20th International Conference on Eletricity Distribution. Prague.

Sperandio, M. (2004). Classificação de Conjuntos Consumidores de Energia Elétrica via Mapas


Auto-Organizáveis e Estatística Multivariada. Dissertação de mestrado.

Tanure, J. E. P. S. (2004). Proposta de Procedimentos e Metodologia para Estabelecimento de


Metas de Qualidade (DEC e FEC) para concessionárias de distribuição de energia elétrica
através da análise comparativa. Tese de doutorado.

Wilson, P. W (2009). FEAR 1.12 User’s Guide.

72

Você também pode gostar