Escolar Documentos
Profissional Documentos
Cultura Documentos
1 Introduo
Devido rpida difuso de tecnologias, a diferenciao entre os produtos ou
servios oferecidos por empresas concorrentes mnima. Com isso, as empresas tm que
encontrar novas formas de atrair e reter seus clientes. Disponibilizar atendimento
personalizado, que permita que os clientes se sintam nicos, tendo suas
particularidades respeitadas e evidenciadas, uma maneira de compensar a pouca
diferenciao do que oferecido por uma empresa em relao s concorrentes. nesse
contexto que entra a idia de marketing de Customer Relationship Management (CRM).
A aplicao do conceito de CRM exige que a empresa possua um banco de dados
central com informaes sobre seus clientes. a partir desses dados que se torna possvel
extrair conhecimento sobre os clientes utilizando tcnicas de Estatstica Multivariada e
Data Mining (DM).
Alguns autores definem o Data Mining (minerao de dados) como uma tcnica
que visa encontrar relacionamentos e padres globais, ainda no descobertos em um
banco de dados, que possam gerar respostas corretas para novos casos. possvel dizer,
ento, que esse processo transforma informaes em conhecimento. Desse modo,
possvel, utilizando essa ferramenta, caracterizar e segmentar os clientes de uma empresa.
O presente trabalho aborda duas reas distintas, marketing e minerao de dados.
O tema Customer Relationship Management (CRM) analtico; o sujeito de
estudo, anlise de agrupamentos; e o objeto de estudo, consumidores de energia eltrica.
Em adio, a anlise de agrupamentos para os consumidores de energia eltrica de uma
determinada empresa (que guarda o direito de no ser identificada) consiste no sujeito e o
objeto de estudo delimitado.
O objetivo do trabalho foi traar o perfil dos consumidores de energia eltrica
com o intuito de direcionar a estratgia de CRM da empresa fornecedora de energia
eltrica.
1
Ao trmino do trabalho, foi possvel classificar os clientes que podem ser alvo
prioritrio de ao de marketing e os que devem ter prioridade inferior.
importante ressaltar que o presente trabalho se aproximou ao mximo da
realidade, por meio de referncias bibliogrficas especializadas, base de dados verdica,
anlise de dados e extrao de conhecimentos.
Por meio da bibliografia especializada selecionada, foram desenvolvidas as sees
tericas sobre a evoluo do marketing, marketing de relacionamento, CRM e anlise
multivariada.
A parte emprica do trabalho refere-se aplicao ao banco de dados
(devidamente limpo) dos conceitos apresentados. Dessa forma, a abordagem
metodolgica terico-emprica.
2
propiciou o efeito de comoditizao de produtos e servios juntamente com a inexistncia
de interao entre cliente e empresa. Com os produtos e servios idnticos, os clientes
no tinham nenhuma razo, alm do preo, para serem fiis.
Com a ntida escassez de demanda no atendida, imprescindvel manter os
clientes por meio de relacionamentos intensos que visem a fidelizao. O nico meio de
aumentar a carteira de clientes atraindo os dos concorrentes. Sendo assim, as empresas
no podem mais focar somente em reduo de custos. O novo tipo de competio baseia-
se no marketing de relacionamento.
3
Outra forma de entend-lo encontrada em Greenberg (2002): uma estratgia que
tem como base a utilizao de ferramentas tecnolgicas para sua viabilizao. Em adio,
Plata (apud GARRAFONI et al, 2005) ressalta que CRM uma estratgia cujo propsito
transformar os processos de negcios para conservar e conseguir clientes.
Por ltimo, Cister (2005) destaca que CRM a infra-estrutura para implementar-
se a filosofia one-to-one (um a um) de relacionamento com os clientes.
Este trabalho pauta-se no CRM como uma estratgia que tem como objetivo reter,
ganhar clientes e maximizar a contratao de servios ou produtos oferecidos pela
empresa. A forma de se atingir esse objetivo antecipando e satisfazendo as expectativas
dos clientes por meio da anlise dos perfis de seu comportamento. Destaque-se que os
termos Customer Relationship Management e one-to-one marketing no so
considerados sinnimos. Isso por que nem todas as interaes com os clientes precisam
ser personalizadas. Ao contrrio, as interaes s sero personalizadas se os clientes
forem ou tiverem potencial de ser tornarem valiosos. Dessa forma, para a autora deste
trabalho, o one-to-one marketing uma ferramenta utilizada pelo CRM para reter os
clientes que trazem ou podem trazer retorno financeiro para a empresa.
Para se conseguir segmentar e caracterizar os clientes pelo perfil de
comportamento, de extrema relevncia utilizar ferramentas de Tecnologia da
Informao.
4
1.3.3 As etapas do CRM
Peppers e Rogers (1999) destacam que existem quatro etapas estratgicas bsicas
para a implementao do CRM: identificar, diferenciar, interagir e personalizar.
1.3.3.1 Identificar
Para iniciar uma relao com um cliente necessrio conhecer sua histria: sua
identidade, forma de contato preferida, todas as transaes e interaes realizadas com a
empresa, todas as reclamaes feitas e quais foram as providncias tomadas (Cister,
2005). a partir dessas informaes que se pode estabelecer quais os clientes
merecedores de relao personalizada. Desse modo, so atividades desenvolvidas nesse
estgio:
Coleta e expanso do banco de dados dos clientes;
Coleta de informaes adicionais sobre os clientes;
Atualizao de informaes sobre o cliente.
1.3.3.2 Diferenciar
fato que os clientes possuem necessidades distintas e valores diferentes para a
empresa. O principal objetivo dessa etapa encontrar os clientes de maior valor, os de
maior potencial, os intermedirios e os below zeros. Em adio, traar as necessidades
dos clientes com os quais valha pena intensificar a relao. Segundo Cister (2005),
preciso acumular e estudar os dados transacionais dos clientes para aprender com eles.
Sendo assim, so atividades dessa etapa:
Identificar os clientes mais valiosos, os que tm grande potencial e suas
respectivas necessidades;
Identificar os clientes intermedirios e suas necessidades;
Identificar os clientes below zeros;
A freqncia de reclamaes e quais formam feitas pelos clientes que
interessam;
A freqncia de compra e quais foram os servios ou produtos adquiridos
pelos clientes que interessam;
Criao de um ranking de clientes.
1.3.3.3 Interagir
Depois de conhecer os clientes que interessam, preciso incentiv-los a interagir
com a empresa. Quanto mais freqente for essa interao, mais a empresa ir saber sobre
os clientes podendo, assim, satisfazer suas necessidades e expectativas. De acordo com
Cister (2005), o objetivo final desenvolver uma relao de aprendizado, onde cada vez
mais os servios e produtos so personalizados para o cliente que ver convenincia em
continuar fiel empresa. Em complemento, para Lanini (2005), importante levar em
considerao todos os contatos feitos anteriormente e dispor das informaes em tempo
real para que o atendimento possa ser o mais personalizado possvel. Desse modo, as
atividades desta etapa consistem em:
Utilizar os contatos feitos pelos clientes como oportunidade de venda;
Avaliar o sistema automatizado de call-center;
Aperfeioar o fluxo de informaes do cliente dentro da empresa;
5
Intensificar a relao com os clientes mais valiosos e os que tm grande potencial;
Repassar as informaes adquiridas para o banco de dados.
1.3.3.4 Personalizar
A personalizao do servio a ltima e decisiva etapa. Com base nos
conhecimentos advindos das atividades anteriores, possvel adequar os servios e
produtos s necessidades dos clientes. So atividades desta etapa:
Dar prioridade de atendimento aos clientes mais valiosos e aos que tm
grande potencial;
Perguntar aos clientes como e quando desejam ser abordados;
Identificar o que os clientes desejam;
Preencher formulrios e questionrios especficos para os diferentes
grupos de clientes.
2 ANLISE MULTIVARIADA
H trs tipos de anlises estatsticas:
6
situaes nas quais a amostra pode ser dividida em grupos conhecidos com
base em uma varivel categrica dependente. O objetivo entender as
diferenas de grupos e prever a qual grupo um objeto ou indivduo ir
pertencer a partir de diversas variveis numricas independentes.
Anlise Multivariada da Varincia e Covarincia: A anlise multivariada
da varincia (MANOVA) uma tcnica estatstica que pode ser usada para,
simultaneamente, explorar a relao entre diversas variveis categricas
independentes e duas ou mais variveis numricas dependentes. J a anlise
multivariada da covarincia (MANCOVA) pode ser utilizada em conjunto
com a MANOVA para retirar um possvel efeito de uma varivel numrica
independente no controlada.
Anlise Conjunta: Especfica para um novo produto ou servio em
desenvolvimento, permitindo uma deciso realstica ao longo da evoluo
complexa de produtos ou servios. possvel que o pesquisador de marketing
tenha acesso importncia de atributos, assim como o nvel deles, enquanto
os consumidores avaliam apenas alguns aspectos que consistem na
combinao desses atributos.
Correlao Cannica: Pode ser entendida como a extenso lgica da
regresso mltipla. Enquanto a anlise de regresso mltipla envolve uma
nica varivel numrica dependente e vrias independentes, na correlao
cannica possvel correlacionar ao mesmo tempo diversas variveis
numricas dependentes e independentes. O objetivo obter pesos para as
variveis dependentes e independentes que propiciem a correlao simples
mxima entre os dois grupos de variveis.
Anlise de Cluster: uma tcnica analtica para criar subgrupos de
indivduos ou objetos. O objetivo classificar uma amostra entidades
(indivduos ou objetos) em grupos menores tendo por base semelhanas entre
elas. Ao contrrio da anlise discriminante mltipla, os grupos no so pr-
definidos. Esta tcnica utilizada exatamente para definir os grupos.
Escala Multidimensional: O objetivo transformar os julgamentos de
consumidores de produtos e servios em relao s similaridades e
preferncias em distncias representadas em espao multidimensional. Os
mapas de percepo resultantes mostram a posio de todos os objetos, mas
so necessrias anlises adicionais para descrever quais atributos influenciam
a posio de cada objeto.
Modelos Lineares de Probabilidade: Esta tcnica a combinao de
regresso mltipla e anlise discriminante mltipla. a anlise de regresso
mltipla em que uma ou mais variveis numricas independentes so usadas
para prever uma varivel categrica.
Modelagem de Equao Estrutural: Permite a separao das relaes para
cada grupo de variveis dependentes. Esta modelagem propicia a mais
apropriada e eficiente tcnica de estimao para uma srie de equaes de
regresso mltipla diferentes estimadas simultaneamente.
Data Mining (minerao de dados): Conjunto de tcnicas especficas para
extrair relacionamentos e padres existentes em banco de dados e
Datawarehouse que no podem ser vistos facilmente devido ao grande
7
nmero de informaes. O objetivo conseguir gerar respostas corretas para
novos casos. um processo que transforma informaes em conhecimento.
Bootstrapping (re-amostragem): Tcnica que elimina a necessidade de
preceitos estatsticos de distribuio de amostragem (como a normalizao)
por meio do computador para fazer a reamostragem da amostra original,
reorganizando e gerando um estimao emprica da distribuio da amostra.
Dado que o presente trabalho tem como meta dividir a carteira de clientes em
subgrupos que apresentem caractersticas semelhantes, as tcnicas multivariadas
utilizadas so: Componente Principal e Anlise de Fator Comum, Anlise de Cluster e
Data Mining. Deste modo, importante fazer algumas consideraes a mais sobre essas
tcnicas.
8
Figura 1: Agrupamento K-means.
9
dos ns que transforma todos os pesos de um n de entrada em um nico valor de
n de sada (funo de ativao).
III. O sistema de ns arrumados para transferir sinais dos ns de entrada para os de
sada, com alguns ns intermedirios: ns de entrada (inputs) que recebem os dados
iniciais de cada caso e os transmitem para a rede neural, os ns escondidos que
abrigam a camada escondida e a funo de ativao, quando existem relaes no
lineares, e ns de sada que recebem os dados dos ns de entrada e calculam um
valor de sada (Figura 2).
IV. A funo de aprendizado por meio dos erros: os pesos das conexes so a memria,
o melhor chute de como fazer as predies dos ns de sada. Uma vez que o valor
de entrada processado pelo sistema, ele pode ser comparado com o valor de sada.
Se houver alguma diferena entre o valor de entrada e o de sada (resduo), existe a
necessidade de melhorar o modelo com o intuito de minimizar o erro (HAIR et al,
1998).
= N = conexo
Ns de Ns Ns de
entrada escondidos sada
3 ESTUDO DE CASO
O estudo de caso do presente trabalho envolve a segunda etapa da estratgia de
CRM, que consiste em diferenciar os clientes. Sendo assim, foram utilizadas as tcnicas
de anlise de fator e anlise de cluster e, posteriormente, a rede neural. A utilizao da
rede neural teve como objetivo criar um cdigo capaz de classificar todos os clientes da
base de dados da empresa.
O banco de dados da empresa em questo abriga dois milhes de registros.
Entretanto, para diferenciar os clientes foi usada uma amostra representativa da base com
4934 registros, resultado da utilizao da tcnica bootstrapping.
Em adio, foi utilizado o intervalo de confiana de 95,5% e, conseqentemente,
um erro amostral de 1,42% (Equao 1).
Onde:
p a proporo (desconhecida) de elementos em uma populao apresentando
certa caracterstica de interesse contida numa amostra.
Z o valor correspondente do intervalo de confiana na distribuio N(0,1) que,
nesse caso, aproximadamente 2.
10
n o nmero de registros do banco de dados que, nesse caso, 4934.
Essa base contm as informaes de 22 variveis entre os anos de 2003 e 2005:
Numricas: consumo lido, quantidade de consumo em 30 dias, valor do
importe, valor do ICMS, valor do corte de reposio, valor total da fatura,
valor de dbitos, valor de interesses, valor do parcelamento, valor manual e
valor de aquisio.
Categricas: produtos adquiridos, reclamaes, situao do dbito
automtico, situao baixa renda, situao consulta diria de consumo dia-a-
dia, subclasse, segmentao, situao pr-pago, tipo de rede, tipo de
conexo e tarifa.
Ressalte-se que a empresa no informou as unidades e as definies das variveis.
importante destacar que para conseguir trabalhar de forma mais simples, para
cada cliente, em vez dos valores de cada varivel durante os trs anos considerou-se a
mdia deles. Desse modo foi possvel trabalhar apenas com um nico dado de uma
varivel para cada cliente. Alm disso, os valores das variveis foram normalizadas de
trs formas (as mais utilizadas):
Por padronizao: aplicou-se a mdia ponderada com intuito de trabalhar
com nmeros menores.
Por Log10: aplicou-se o logaritmo de base 10 nos valores das variveis
com intuito de trabalhar com nmeros menores.
Por LogN: aplicou-se o logaritmo neperiano nos valores das variveis com
intuito de trabalhar com nmeros menores.
Outro fato relevante que foram retirados da anlise todos os clientes com
valores das variveis consumo lido, consumo em 30 dias, importe e fatura total iguais a
zero. Com isso, o banco de dados analisado passou a ter 4181 registros.
11
Quadro 1: Resumo da segmentao dos clientes.
Atendimento
Residencial INTERMEDIRIOS a
E clientes e Seguro
Demais qualidade no energia
1 3,56% Classes 984,9 491,38 90 Trifsico fornecimento premiada
HEAVY
Demais USERS
Classes Qualidade no
2 0,19% 5485,47 5671,56 92 Trifsico atendimento Nenhum
CLIENTES POUCO
Residencial RENTVEIS E Faturamento
BELOW ZEROS e Seguro
qualidade do energia
3 95,74% 179,2 83,48 90 Monofsico fornecimento premiada
CLIENTES COM
Demais GRANDE
Classes POTENCIAL
4 0,5% 2792,38 1341,89 92 Trifsico Faturamento Nenhum
12
3.3 Rede Neural
Foram retirados, de forma aleatria, 119 registros do banco de dados base deste
trabalho, que apresenta 4181 registros. Os registros retirados foram utilizados para testar o
screening tool criado a partir da rede neural que apresentou o melhor desempenho.
importante ressaltar que a melhor rede neural corresponde que mais se
aproximou da classificao feita pelo agrupamento utilizando a anlise de cluster. Sendo
assim, foi usada a base de dados com 4181 registros e os clusters correspondentes. O
objetivo da utilizao da rede neural foi desenvolver um cdigo (funo) capaz de explicar
a classificao feita pela tcnica K-means. Em adio, para gerar a rede neural foram
usados os dados originais e no os normalizados.
3.3.1 Resultados
A matriz de confuso que mostra os casos onde os dados foram classificados
corretamente e incorretamente, de acordo com a classificao previamente existente, do
Quadro 2 mostra que a rede neural que melhor classifica os registros em relao da
tcnica K-means a MLP 6: 6-9-4: 1. O Quadro 3 de desempenho das redes neurais
resume a informao da matriz de confuso.
1 132 0 1 2
2 0 3 0 1
3 1 2 3092 0
RBF 6: 6-127-4: 1 4 0 0 0 18
1 133 0 0 2
2 0 5 0 0
3 0 0 3093 0
MLP 6: 6-7-4: 1 4 0 0 0 19
1 133 0 0 0
2 0 5 0 0
3 0 0 3093 0
MLP 6: 6-9-4: 1 4 0 0 0 21
1 132 0 1 0
2 0 5 0 0
3 0 0 3092 0
MLP 6: 6-7-7-4: 1 4 1 0 0 21
13
Quadro 3: Desempenho das Redes Neurais
MLP 6: 6-9-7-4: 1 RBF 6: 6-127-4: 1 MLP 6: 6-7-4: 1
Cluster Cluster Cluster
1 2 3 4 1 2 3 4 1 2 3 4
Total 133 5 3903 21 133 5 3903 21 133 5 3903 21
Acertos 133 3 3903 19 132 3 3902 18 133 5 3903 19
Erros 0 2 0 2 1 2 1 3 0 0 0 2
Desconhecido 0 0 0 0 0 0 0 0 0 0 0 0
Acertos (%) 100 60 100 90,5 99,3 60 100 85,7 100 100 100 90,5
Erros (%) 0 40 0 9,25 0,75 40 0,03 14,3 0 0 0 9,52
Desconhecido
(%) 0 0 0 0 0 0 0 0 0 0 0 0
MLP 6: 6-9-4: 1 MLP 6: 6-7-7-4: 1
Cluster Cluster
1 2 3 4 1 2 3 4
Total 133 5 3903 21 133 5 3903 21
Acertos 133 5 3903 21 132 5 3902 21
Erros 0 0 0 0 1 0 1 0
Desconhecido 0 0 0 0 0 0 0 0
Acertos (%) 100 100 100 100 99,3 100 100 100
Erros (%) 0 0 0 0 0,75 0 0,03 0
Desconhecido
(%) 0 0 0 0 0 0 0 0
RBF 6: 6-127-4: 1
Razo 2,29 2,12 2,07 2,11 2,74 1,64
Importncia 2 3 5 4 1 6
MLP 6: 6-7-4: 1
Razo 4,1 6,11 7,63 7,78 5,14 6,12
Importncia 6 4 2 1 5 3
MLP 6: 6-9-4: 1
14
Razo 10,64 6,08 9,21 12,89 8,25 7,94
Importncia 2 6 3 1 4 5
MLP 6: 6-7-7-4: 1
Razo 5,8 6,82 11,03 10,58 9,1 17,32
Importncia 6 5 2 3 4 1
4 CONSIDERAES FINAIS
Como ressaltado por Hair (1998), na grande maioria dos mercados no possvel
se guiar pelo pensamento simplista que considera os consumidores homogneos e
caracterizados por um pequeno nmero de variveis demogrficas. As empresas esto
atendendo cada vez mais segmentos de consumidores com diferentes caractersticas
demogrficas e comportamentais e inmeras implicaes legais, econmicas e
tecnolgicas. As tcnicas de anlise multivariada so a nica forma de entender e conhecer
as mltiplas relaes desse cenrio atual.
Alm disso, a tendncia a partir de agora que a eficincia e eficcia da estratgia
de CRM definam a nvel competitividade das empresas. Desse modo, imprescindvel que
as etapas da estratgia de CRM sejam muito bem planejadas e executadas. A primeira
etapa, que consiste na identificao dos clientes, crucial. Um banco de dados ou
Datawarehouse contendo poucas variveis demogrficas e, principalmente,
comportamentais afeta diretamente a etapa de diferenciao dos clientes e, possivelmente,
a eficcia da estratgia de CRM. Entretanto, muitas empresas ainda no tratam a questo
da identificao dos clientes com a seriedade que deviam.
Este trabalhou mostrou como algumas das tcnicas de anlise multivariada podem
e devem auxiliar administradores da rea de marketing. Conhecer e usar essas tcnicas so
imprescindveis para uma empresa que almeja ser competitiva.
15
5 BIBLIOGRAFIA
16