Você está na página 1de 16

DEFINIO DAS CARACTERSTICAS DO PERFIL DO CONSUMIDOR COM A

UTILIZAO DE REDES NEURAIS ARTIFICIAIS


Autoria: Angelo Maia Cister, Lucy Domingues Shehata

O presente trabalho foi desenvolvido dentro de uma empresa fornecedora de energia


eltrica que possui, atualmente, grande interesse em modificar sua estratgia de
relacionamento de seus clientes. Embora os clientes no tenham a opo de troca de
empresa (churn), a empresa fornecedora de energia entende que seu relacionamento vai
alm do simples fornecimento. Assim sendo, foi contratada a consultoria para delinear e
traar as novas diretrizes do perfil de seus clientes. Para tanto, foi exigncia da empresa
fornecedora de energia que tcnicas modernas e avanadas fossem utilizadas na
prospeco e perfil de seus clientes. Assim sendo, como estratgia de anlise muitos
conceitos de data mining foram utilizados e testados tendo-se a escolha natural a partir de
uma explicao razovel da modelagem matemtica utilizada na comparao com a
anlise de cluster convencional. Desta forma a escolha residiu nas tcnicas de
amostragem bootstrap e a utilizao de redes neurais artificiais com a calibragem de seus
parmetros. Conceitos como analise de confuso, anlise de sensibilidade, amostragem
bootstrap, anlise multivariada so citadas e explicadas sua utilizao no presente
trabalho assim como alguns conceitos de marketing de relacionamentos e CRM.

1 Introduo
Devido rpida difuso de tecnologias, a diferenciao entre os produtos ou
servios oferecidos por empresas concorrentes mnima. Com isso, as empresas tm que
encontrar novas formas de atrair e reter seus clientes. Disponibilizar atendimento
personalizado, que permita que os clientes se sintam nicos, tendo suas
particularidades respeitadas e evidenciadas, uma maneira de compensar a pouca
diferenciao do que oferecido por uma empresa em relao s concorrentes. nesse
contexto que entra a idia de marketing de Customer Relationship Management (CRM).
A aplicao do conceito de CRM exige que a empresa possua um banco de dados
central com informaes sobre seus clientes. a partir desses dados que se torna possvel
extrair conhecimento sobre os clientes utilizando tcnicas de Estatstica Multivariada e
Data Mining (DM).
Alguns autores definem o Data Mining (minerao de dados) como uma tcnica
que visa encontrar relacionamentos e padres globais, ainda no descobertos em um
banco de dados, que possam gerar respostas corretas para novos casos. possvel dizer,
ento, que esse processo transforma informaes em conhecimento. Desse modo,
possvel, utilizando essa ferramenta, caracterizar e segmentar os clientes de uma empresa.
O presente trabalho aborda duas reas distintas, marketing e minerao de dados.
O tema Customer Relationship Management (CRM) analtico; o sujeito de
estudo, anlise de agrupamentos; e o objeto de estudo, consumidores de energia eltrica.
Em adio, a anlise de agrupamentos para os consumidores de energia eltrica de uma
determinada empresa (que guarda o direito de no ser identificada) consiste no sujeito e o
objeto de estudo delimitado.
O objetivo do trabalho foi traar o perfil dos consumidores de energia eltrica
com o intuito de direcionar a estratgia de CRM da empresa fornecedora de energia
eltrica.

1
Ao trmino do trabalho, foi possvel classificar os clientes que podem ser alvo
prioritrio de ao de marketing e os que devem ter prioridade inferior.
importante ressaltar que o presente trabalho se aproximou ao mximo da
realidade, por meio de referncias bibliogrficas especializadas, base de dados verdica,
anlise de dados e extrao de conhecimentos.
Por meio da bibliografia especializada selecionada, foram desenvolvidas as sees
tericas sobre a evoluo do marketing, marketing de relacionamento, CRM e anlise
multivariada.
A parte emprica do trabalho refere-se aplicao ao banco de dados
(devidamente limpo) dos conceitos apresentados. Dessa forma, a abordagem
metodolgica terico-emprica.

1.1 A Evoluo do Marketing


De acordo com Churchill e Peter (2005), existem quatro orientaes tradicionais
de marketing, a saber:
I. Orientao para produo: Centra-se nos produtos e em como fabric-los
com eficincia. Entregam-se produtos em locais onde eles possam ser
comprados.
II. Orientao para vendas: Centra-se nas atividades de marketing para a venda
de produtos disponveis. normalmente utilizada quando a oferta de
produtos e servios maior que a demanda.
III. Orientao para marketing: Concentra-se em compreender as necessidades e
desejos dos clientes e construir produtos para satisfaz-los. Com isso,
possvel criar lealdade e competir de forma eficiente.
IV. Orientao voltada para valor: Concentra-se em desenvolver e entregar um
valor superior para os clientes como modo de alcanar os objetivos da
organizao.
fato que os avanos tecnolgicos e sociais acarretados pela revoluo industrial
possibilitaram a produo em massa com eficincia. Alm disso, devido abundncia de
demanda no atendida, o foco era na produo. A idia era que se os produtos fabricados
em escala, de maneira eficiente, fossem melhores, os clientes os comprariam.
Entretanto, no perodo de 1900 a 1950, por causa da eficincia adquirida, a
produo acabou superando a demanda. Com isso, a orientao mudou para vendas
(LANINI, 2005).
Em meados dos anos 1960, foi difundida a orientao de marketing. Em adio,
segundo Lanini (2005), os executivos de vendas passaram a se denominar gerentes de
marketing e as escolas de negcios passaram a ensinar os 4Ps (Produto, Ponto de
venda, Preo e Promoo).
Mais tarde, surgiu a orientao voltada para o valor, explicitada por muitos
autores como sendo uma orientao de marketing aprimorada. com essa orientao que
surge o marketing de relacionamento e, consequentemente, marketing direto e
Customer Relationship Manegement (CRM).
O passado recente e o cenrio atual caracterizam-se pela intensa competio
global que tende a diminuir a lucratividade das empresas. Com intuito de suprir essa
desvantagem, as empresas optaram por focar na reduo de custos, desencadeando a
competio baseada em custo. importante ressaltar que esse tipo de competio

2
propiciou o efeito de comoditizao de produtos e servios juntamente com a inexistncia
de interao entre cliente e empresa. Com os produtos e servios idnticos, os clientes
no tinham nenhuma razo, alm do preo, para serem fiis.
Com a ntida escassez de demanda no atendida, imprescindvel manter os
clientes por meio de relacionamentos intensos que visem a fidelizao. O nico meio de
aumentar a carteira de clientes atraindo os dos concorrentes. Sendo assim, as empresas
no podem mais focar somente em reduo de custos. O novo tipo de competio baseia-
se no marketing de relacionamento.

1.2 Marketing de Relacionamento


Grnoss (1997) define o marketing de relacionamento como um:

Processo de identificar e estabelecer, manter, aprimorar e, quando


necessrio, encerrar relacionamentos com clientes e outros
interessados, com lucro, de modo que os objetivos de todas as partes
envolvidas sejam alcanados e que isso seja feito pela oferta e
cumprimento mtuo de promessas.

Mas h outras definies:

Todos os esforos de marketing dirigidos ao estabelecimento e manuteno de trocas


relacionais bem sucedidas (MORGAN e HUNT, 1994).

Marketing de relacionamento trata-se de entender, criar e gerenciar a troca de


relacionamentos entre parceiros, fabricantes, provedores de servios, vrios membros do
canal e consumidores finais (MLLER e WILSON, 1995).

possvel perceber a partir das definies acima que o conceito de marketing de


relacionamento envolve todos os tipos de interaes que a empresa tem com o ambiente
externo. Essa nova viso de marketing surgiu como uma alternativa para tentar enfrentar
a cada vez mais acirrada concorrncia que oferece produtos e servios similares (efeito de
comoditizao). A idia criar vnculo com os clientes para que eles sejam fiis por se
sentirem importantes e nicos.
Na dcada de 1990, os holofotes foram todos voltados para o marketing de
relacionamento. Alguns autores consideram a existncia de duas linhas distintas do
marketing de relacionamento: para o consumidor e relacionamento e para as relaes
interorganizacionais (fornecedores, prestadores de servios, parceiros, governos).

1.3 Customer Relationship Management


Payne et al. (1999) salientam que o CRM uma estratgia que d nfase aos
efeitos da reteno de clientes na rentabilidade da empresa. Sendo assim, prega que
mais eficiente conservar o relacionamento com um cliente do que criar um novo.
Por outro lado, para Rese (2003), o CRM explicado como uma ferramenta
administrativa para entender e influenciar o comportamento dos clientes por meio de
comunicaes significativas para melhorar alm da reteno, as compras, lealdade e a
lucratividade.

3
Outra forma de entend-lo encontrada em Greenberg (2002): uma estratgia que
tem como base a utilizao de ferramentas tecnolgicas para sua viabilizao. Em adio,
Plata (apud GARRAFONI et al, 2005) ressalta que CRM uma estratgia cujo propsito
transformar os processos de negcios para conservar e conseguir clientes.
Por ltimo, Cister (2005) destaca que CRM a infra-estrutura para implementar-
se a filosofia one-to-one (um a um) de relacionamento com os clientes.
Este trabalho pauta-se no CRM como uma estratgia que tem como objetivo reter,
ganhar clientes e maximizar a contratao de servios ou produtos oferecidos pela
empresa. A forma de se atingir esse objetivo antecipando e satisfazendo as expectativas
dos clientes por meio da anlise dos perfis de seu comportamento. Destaque-se que os
termos Customer Relationship Management e one-to-one marketing no so
considerados sinnimos. Isso por que nem todas as interaes com os clientes precisam
ser personalizadas. Ao contrrio, as interaes s sero personalizadas se os clientes
forem ou tiverem potencial de ser tornarem valiosos. Dessa forma, para a autora deste
trabalho, o one-to-one marketing uma ferramenta utilizada pelo CRM para reter os
clientes que trazem ou podem trazer retorno financeiro para a empresa.
Para se conseguir segmentar e caracterizar os clientes pelo perfil de
comportamento, de extrema relevncia utilizar ferramentas de Tecnologia da
Informao.

Do ponto de vista tecnolgico, CRM envolve capturar os dados do


cliente ao longo de toda a empresa, consolidar todos os dados
capturados interna e externamente em um banco de dados central,
analisar os dados consolidados, distribuir os resultados dessa anlise
aos vrios pontos de contato com o cliente e usar essa informao ao
interagir com o cliente atravs de qualquer ponto de contato com a
empresa (CISTER, 2005).

1.3.2 CRM nas Atividades da Empresa


Segundo Greenberg (2002), o CRM deve estar presente em trs segmentos de
atividades da empresa, a saber:
I. CRM Analtico: Refere-se a coleta, processamento, organizao,
modelagem e anlise das informaes sobre o cliente (customer
intelligence). Isso torna possvel determinar os clientes que devem ser
tratados de forma personalizada (one-to-one) e os que merecem prioridade
inferior.
II. CRM Operacional: Cister (2005) afirma que esse segmento o foco da
maioria das empresas. Est relacionado automatizao da fora de
vendas, centros de atendimento a clientes (call-centers), sites de comrcio
eletrnico e sistemas automatizados de pedido. relevante lembrar que
essas atividades devem estar alinhadas com as necessidades e
convenincias dos clientes.
III. CRM Colaborativo: Foca na interao entre cliente e empresa. Sendo
assim, a aplicao da tecnologia de informao que permite a automao
e a integrao entre todos os pontos de contato do cliente com a empresa
(Cister, 2005). de extrema relevncia repassar as informaes levantadas
para os sistemas do CRM Operacional, possibilitando o enriquecimento de
dados para compor o perfil de comportamento dos clientes.

4
1.3.3 As etapas do CRM
Peppers e Rogers (1999) destacam que existem quatro etapas estratgicas bsicas
para a implementao do CRM: identificar, diferenciar, interagir e personalizar.

1.3.3.1 Identificar
Para iniciar uma relao com um cliente necessrio conhecer sua histria: sua
identidade, forma de contato preferida, todas as transaes e interaes realizadas com a
empresa, todas as reclamaes feitas e quais foram as providncias tomadas (Cister,
2005). a partir dessas informaes que se pode estabelecer quais os clientes
merecedores de relao personalizada. Desse modo, so atividades desenvolvidas nesse
estgio:
Coleta e expanso do banco de dados dos clientes;
Coleta de informaes adicionais sobre os clientes;
Atualizao de informaes sobre o cliente.

1.3.3.2 Diferenciar
fato que os clientes possuem necessidades distintas e valores diferentes para a
empresa. O principal objetivo dessa etapa encontrar os clientes de maior valor, os de
maior potencial, os intermedirios e os below zeros. Em adio, traar as necessidades
dos clientes com os quais valha pena intensificar a relao. Segundo Cister (2005),
preciso acumular e estudar os dados transacionais dos clientes para aprender com eles.
Sendo assim, so atividades dessa etapa:
Identificar os clientes mais valiosos, os que tm grande potencial e suas
respectivas necessidades;
Identificar os clientes intermedirios e suas necessidades;
Identificar os clientes below zeros;
A freqncia de reclamaes e quais formam feitas pelos clientes que
interessam;
A freqncia de compra e quais foram os servios ou produtos adquiridos
pelos clientes que interessam;
Criao de um ranking de clientes.

1.3.3.3 Interagir
Depois de conhecer os clientes que interessam, preciso incentiv-los a interagir
com a empresa. Quanto mais freqente for essa interao, mais a empresa ir saber sobre
os clientes podendo, assim, satisfazer suas necessidades e expectativas. De acordo com
Cister (2005), o objetivo final desenvolver uma relao de aprendizado, onde cada vez
mais os servios e produtos so personalizados para o cliente que ver convenincia em
continuar fiel empresa. Em complemento, para Lanini (2005), importante levar em
considerao todos os contatos feitos anteriormente e dispor das informaes em tempo
real para que o atendimento possa ser o mais personalizado possvel. Desse modo, as
atividades desta etapa consistem em:
Utilizar os contatos feitos pelos clientes como oportunidade de venda;
Avaliar o sistema automatizado de call-center;
Aperfeioar o fluxo de informaes do cliente dentro da empresa;

5
Intensificar a relao com os clientes mais valiosos e os que tm grande potencial;
Repassar as informaes adquiridas para o banco de dados.

1.3.3.4 Personalizar
A personalizao do servio a ltima e decisiva etapa. Com base nos
conhecimentos advindos das atividades anteriores, possvel adequar os servios e
produtos s necessidades dos clientes. So atividades desta etapa:
Dar prioridade de atendimento aos clientes mais valiosos e aos que tm
grande potencial;
Perguntar aos clientes como e quando desejam ser abordados;
Identificar o que os clientes desejam;
Preencher formulrios e questionrios especficos para os diferentes
grupos de clientes.

2 ANLISE MULTIVARIADA
H trs tipos de anlises estatsticas:

I. Anlise univariada: anlise da distribuio de uma nica varivel;


II. Anlise bivariada: anlise de duas variveis utilizando classificao cruzada,
correlao, varincia e regresso simples;
III. Anlise multivariada: anlise de mais de duas variveis.

Hair et al (1998) afirmam que qualquer anlise simultnea de mais de duas


variveis pode ser considerada anlise multivariada. Entretanto, para uma anlise ser
considerada verdadeiramente multivariada, preciso que todas as variveis sejam
randmicas e inter-relacionadas de forma que seus diferentes efeitos no possam ser
considerados separadamente.
Em muitas situaes, as tcnicas multivariadas so meios de elaborar uma nica
anlise que, se feita pela tcnica univariada, resultaria em diversas anlises, j que ter-se-
ia que analisar uma varivel por vez. Por outro lado, existem tcnicas multivariadas
especficas s questes multivariadas, que so listadas a seguir:

Componente Principal e Anlise de Fator Comum (Anlise de Fator):


Mtodo estatstico que pode ser usado para analisar as inter-relaes entre um
grande nmero de variveis e suas correlaes. O objetivo encontrar uma
forma de condensar a informao contida no nmero de variveis originais em
um grupo menor de variveis (fator) com perda mnima de informao.
Regresso Mltipla: Mtodo de anlise apropriado quando o problema
envolve uma nica varivel numrica dependente que se presume estar
relacionada a duas ou mais variveis numricas independentes. O objetivo
prever mudanas na varivel dependente em resposta a mudanas ocorridas
nas variveis independentes.
Anlise Discriminante Mltipla: Mtodo apropriado para situaes onde as
variveis so categricas, podendo ser dicotmicas (sim ou no, por exemplo)
ou multicotmicas (alto, mdio ou baixo, por exemplo). importante ressaltar
que assumido que as variveis independentes so numricas. Aplicvel em

6
situaes nas quais a amostra pode ser dividida em grupos conhecidos com
base em uma varivel categrica dependente. O objetivo entender as
diferenas de grupos e prever a qual grupo um objeto ou indivduo ir
pertencer a partir de diversas variveis numricas independentes.
Anlise Multivariada da Varincia e Covarincia: A anlise multivariada
da varincia (MANOVA) uma tcnica estatstica que pode ser usada para,
simultaneamente, explorar a relao entre diversas variveis categricas
independentes e duas ou mais variveis numricas dependentes. J a anlise
multivariada da covarincia (MANCOVA) pode ser utilizada em conjunto
com a MANOVA para retirar um possvel efeito de uma varivel numrica
independente no controlada.
Anlise Conjunta: Especfica para um novo produto ou servio em
desenvolvimento, permitindo uma deciso realstica ao longo da evoluo
complexa de produtos ou servios. possvel que o pesquisador de marketing
tenha acesso importncia de atributos, assim como o nvel deles, enquanto
os consumidores avaliam apenas alguns aspectos que consistem na
combinao desses atributos.
Correlao Cannica: Pode ser entendida como a extenso lgica da
regresso mltipla. Enquanto a anlise de regresso mltipla envolve uma
nica varivel numrica dependente e vrias independentes, na correlao
cannica possvel correlacionar ao mesmo tempo diversas variveis
numricas dependentes e independentes. O objetivo obter pesos para as
variveis dependentes e independentes que propiciem a correlao simples
mxima entre os dois grupos de variveis.
Anlise de Cluster: uma tcnica analtica para criar subgrupos de
indivduos ou objetos. O objetivo classificar uma amostra entidades
(indivduos ou objetos) em grupos menores tendo por base semelhanas entre
elas. Ao contrrio da anlise discriminante mltipla, os grupos no so pr-
definidos. Esta tcnica utilizada exatamente para definir os grupos.
Escala Multidimensional: O objetivo transformar os julgamentos de
consumidores de produtos e servios em relao s similaridades e
preferncias em distncias representadas em espao multidimensional. Os
mapas de percepo resultantes mostram a posio de todos os objetos, mas
so necessrias anlises adicionais para descrever quais atributos influenciam
a posio de cada objeto.
Modelos Lineares de Probabilidade: Esta tcnica a combinao de
regresso mltipla e anlise discriminante mltipla. a anlise de regresso
mltipla em que uma ou mais variveis numricas independentes so usadas
para prever uma varivel categrica.
Modelagem de Equao Estrutural: Permite a separao das relaes para
cada grupo de variveis dependentes. Esta modelagem propicia a mais
apropriada e eficiente tcnica de estimao para uma srie de equaes de
regresso mltipla diferentes estimadas simultaneamente.
Data Mining (minerao de dados): Conjunto de tcnicas especficas para
extrair relacionamentos e padres existentes em banco de dados e
Datawarehouse que no podem ser vistos facilmente devido ao grande

7
nmero de informaes. O objetivo conseguir gerar respostas corretas para
novos casos. um processo que transforma informaes em conhecimento.
Bootstrapping (re-amostragem): Tcnica que elimina a necessidade de
preceitos estatsticos de distribuio de amostragem (como a normalizao)
por meio do computador para fazer a reamostragem da amostra original,
reorganizando e gerando um estimao emprica da distribuio da amostra.

Dado que o presente trabalho tem como meta dividir a carteira de clientes em
subgrupos que apresentem caractersticas semelhantes, as tcnicas multivariadas
utilizadas so: Componente Principal e Anlise de Fator Comum, Anlise de Cluster e
Data Mining. Deste modo, importante fazer algumas consideraes a mais sobre essas
tcnicas.

2.1 Componente Principal e Anlise de Fator Comum (Anlise de Fator)


Como dito anteriormente, a anlise do componente principal e do fator comum
tem como principal objetivo reduzir o nmero de variveis que expliquem um
comportamento com o mnimo de informao perdida. Scremin (2003) afirma que as
componentes principais so constitudas de combinaes lineares das variveis originais,
so no correlacionadas entre si e retm o mximo da informao contida nos dados
originais. Alm disso, as varincias so ordenadas decrescentemente e as componentes
no so correlacionadas. O mesmo autor define a Anlise Fatorial como uma tcnica que
tem por objetivo definir o nmero e a natureza das variveis subjacentes a um grande
nmero de variveis. Ela procura descrever, quando possvel, a covarincia relacionada
entre muitas variveis observveis em funo de poucas variveis latentes (fatores).
A seleo das variveis, nesse caso, feita pelo mtodo Kaiser. Este mtodo
sugere que se consegue o nmero de fatores (grupo de variveis) ideal utilizando a matriz
de correlao, por meio do nmero de fatores cujos autovalores so maiores ou iguais a 1.
Em seguida, feita a anlise de comunalidade, que consiste em estipular uma
porcentagem mnima de explicao que cada varivel deve apresentar. Sendo assim, so
retiradas todas as variveis que no apresentarem a porcentagem mnima e se faz a
anlise de comunalidade novamente a fim de verificar se ainda existe alguma varivel
que no cumpre a exigncia. Esse processo repetido at que as variveis apresentem a
porcentagem mnima estabelecida.
O prximo passo gerar uma anlise da varincia (ANOVA) com o intuito de
explorar quanto da variao do modelo as variveis conseguem explicar.
Por ltimo, so analisadas as variveis de cada fator com o objetivo de separar as
mais significativas para agrupamento (anlise de cluster)

2.2 Anlise de Cluster


Aps definir, na anlise de componente principal e de fator, quais so as variveis
que mais explicam o comportamento do consumidor, estipula-se o nmero de subgrupos
a serem utilizados, que geralmente de 2 a 5. Neste trabalho, para clusterizar, utilizou-se
a tcnica K-means que agrupa registros (dados) com base no centride do grupo de
variveis escolhidas (Figura 1). Desse modo, o agrupamento feito a partir da distncia
dos registros aos centrides dos clusters.

8
Figura 1: Agrupamento K-means.

2.3 Data Mining


Segundo Coutinho (2003), data mining um:

... processo para extrair informao vlida, previamente


desconhecida e de mxima abrangncia a partir de grandes bases de
dados e/ou armazns de dados, denominados Datawarehouse (DW);
conjuntos de dados agrupados a partir de uma base de dados
qualquer, usando-as para um processo decisrio. O DM vai muito
alm da simples consulta a um banco de dados. Permite aos usurios
explorar e inferir informaes teis a partir dos dados, descobrindo
relacionamentos escondidos no banco de dados e buscando padres
vlidos. sem dvida, um conjunto de tcnicas utilizada para
descobrimento de conhecimento em base de dados robustas.

So tcnicas de minerao de dados:


Rede Neural.
rvores de Deciso.
Mapas Auto-Organizveis.
No presente trabalho optou-se por utilizar a Rede Neural.

2.3.1 Rede Neural


A rede neural uma tcnica que, ao invs de resolver um problema de forma
matemtica, utiliza a modelagem do crebro humano e sua estrutura para desenvolver
uma estratgia de processo. A questo chave da rede neural o aprendizado por meio do
qual os erros de resposta voltam para o sistema para serem reajustados de forma correta.
Esse processo repetido inmeras vezes para que se consiga aprender com os erros e
obter o melhor modelo possvel, podendo ser supervisionado ou no-supervisionado.
um processo seqencial que trabalha com um caso de cada vez. Existem quatro conceitos
utilizados pela rede neural:
I. Tipos de modelo da rede neural: Multilayer Perception (MLP), Radial Basis
Function (RBF) e Kohonen, apropriado apenas para problemas de agrupamento
(clusterizao).
II. As unidades individuais do processo (ns): so similares aos neurnios do crebro
humano, que recebe entradas (inputs) para depois criar sadas (outputs). Todas as
conexes entre ns tm um peso. Sendo assim, o primeiro passo da rede neural
processar os dados de entrada para criar um valor (peso) pelo qual cada sada ser
multiplicada. Esses pesos so ento processados por uma funo matemtica dentro

9
dos ns que transforma todos os pesos de um n de entrada em um nico valor de
n de sada (funo de ativao).
III. O sistema de ns arrumados para transferir sinais dos ns de entrada para os de
sada, com alguns ns intermedirios: ns de entrada (inputs) que recebem os dados
iniciais de cada caso e os transmitem para a rede neural, os ns escondidos que
abrigam a camada escondida e a funo de ativao, quando existem relaes no
lineares, e ns de sada que recebem os dados dos ns de entrada e calculam um
valor de sada (Figura 2).
IV. A funo de aprendizado por meio dos erros: os pesos das conexes so a memria,
o melhor chute de como fazer as predies dos ns de sada. Uma vez que o valor
de entrada processado pelo sistema, ele pode ser comparado com o valor de sada.
Se houver alguma diferena entre o valor de entrada e o de sada (resduo), existe a
necessidade de melhorar o modelo com o intuito de minimizar o erro (HAIR et al,
1998).

= N = conexo

Ns de Ns Ns de
entrada escondidos sada

Figura 2: Rede Neural

3 ESTUDO DE CASO
O estudo de caso do presente trabalho envolve a segunda etapa da estratgia de
CRM, que consiste em diferenciar os clientes. Sendo assim, foram utilizadas as tcnicas
de anlise de fator e anlise de cluster e, posteriormente, a rede neural. A utilizao da
rede neural teve como objetivo criar um cdigo capaz de classificar todos os clientes da
base de dados da empresa.
O banco de dados da empresa em questo abriga dois milhes de registros.
Entretanto, para diferenciar os clientes foi usada uma amostra representativa da base com
4934 registros, resultado da utilizao da tcnica bootstrapping.
Em adio, foi utilizado o intervalo de confiana de 95,5% e, conseqentemente,
um erro amostral de 1,42% (Equao 1).

p(1 p) 0.5 * 0.5


Equao 1: = z =2 = 0.0142 = 1.42%
n 4934

Onde:
p a proporo (desconhecida) de elementos em uma populao apresentando
certa caracterstica de interesse contida numa amostra.
Z o valor correspondente do intervalo de confiana na distribuio N(0,1) que,
nesse caso, aproximadamente 2.

10
n o nmero de registros do banco de dados que, nesse caso, 4934.
Essa base contm as informaes de 22 variveis entre os anos de 2003 e 2005:
Numricas: consumo lido, quantidade de consumo em 30 dias, valor do
importe, valor do ICMS, valor do corte de reposio, valor total da fatura,
valor de dbitos, valor de interesses, valor do parcelamento, valor manual e
valor de aquisio.
Categricas: produtos adquiridos, reclamaes, situao do dbito
automtico, situao baixa renda, situao consulta diria de consumo dia-a-
dia, subclasse, segmentao, situao pr-pago, tipo de rede, tipo de
conexo e tarifa.
Ressalte-se que a empresa no informou as unidades e as definies das variveis.
importante destacar que para conseguir trabalhar de forma mais simples, para
cada cliente, em vez dos valores de cada varivel durante os trs anos considerou-se a
mdia deles. Desse modo foi possvel trabalhar apenas com um nico dado de uma
varivel para cada cliente. Alm disso, os valores das variveis foram normalizadas de
trs formas (as mais utilizadas):
Por padronizao: aplicou-se a mdia ponderada com intuito de trabalhar
com nmeros menores.
Por Log10: aplicou-se o logaritmo de base 10 nos valores das variveis
com intuito de trabalhar com nmeros menores.
Por LogN: aplicou-se o logaritmo neperiano nos valores das variveis com
intuito de trabalhar com nmeros menores.
Outro fato relevante que foram retirados da anlise todos os clientes com
valores das variveis consumo lido, consumo em 30 dias, importe e fatura total iguais a
zero. Com isso, o banco de dados analisado passou a ter 4181 registros.

3.1 Anlise do Componente Principal e Anlise de Fatores


Para encontrar uma forma de condensar a informao contida no nmero de
variveis originais em um grupo menor de variveis, com perda mnima de
informao, utilizou-se o mtodo de extrao anlise do componente principal
(comunalidade) e o mtodo Kaiser (autovalor igual a 1). Foi estipulado que cada uma
das variveis a serem usadas para agrupar os clientes deveria explicar no mnimo
70% da variao de comportamento dos clientes. importante ressaltar que a anlise
do componente principal foi aplicada s variveis padronizadas, com logaritmo de
base decimal e com logaritmo neperiano. O tipo de normalizao das variveis que
apresentou a maior varincia total explicada foi usado para o agrupamento dos
clientes.

Os resultados da anlise do perfil dos consumidores esto resumidos no Quadro 1.

11
Quadro 1: Resumo da segmentao dos clientes.

Porcentagem Valor Tipo


de Consumo Total Tipo de de Tipo de Produtos
CLUSTER Clientes Classe Lido da Fatura Tarifa Conexo clientes Reclamaes Adquiridos

Atendimento
Residencial INTERMEDIRIOS a
E clientes e Seguro
Demais qualidade no energia
1 3,56% Classes 984,9 491,38 90 Trifsico fornecimento premiada

HEAVY
Demais USERS
Classes Qualidade no
2 0,19% 5485,47 5671,56 92 Trifsico atendimento Nenhum

CLIENTES POUCO
Residencial RENTVEIS E Faturamento
BELOW ZEROS e Seguro
qualidade do energia
3 95,74% 179,2 83,48 90 Monofsico fornecimento premiada

CLIENTES COM
Demais GRANDE
Classes POTENCIAL
4 0,5% 2792,38 1341,89 92 Trifsico Faturamento Nenhum

12
3.3 Rede Neural
Foram retirados, de forma aleatria, 119 registros do banco de dados base deste
trabalho, que apresenta 4181 registros. Os registros retirados foram utilizados para testar o
screening tool criado a partir da rede neural que apresentou o melhor desempenho.
importante ressaltar que a melhor rede neural corresponde que mais se
aproximou da classificao feita pelo agrupamento utilizando a anlise de cluster. Sendo
assim, foi usada a base de dados com 4181 registros e os clusters correspondentes. O
objetivo da utilizao da rede neural foi desenvolver um cdigo (funo) capaz de explicar
a classificao feita pela tcnica K-means. Em adio, para gerar a rede neural foram
usados os dados originais e no os normalizados.

3.3.1 Resultados
A matriz de confuso que mostra os casos onde os dados foram classificados
corretamente e incorretamente, de acordo com a classificao previamente existente, do
Quadro 2 mostra que a rede neural que melhor classifica os registros em relao da
tcnica K-means a MLP 6: 6-9-4: 1. O Quadro 3 de desempenho das redes neurais
resume a informao da matriz de confuso.

Quadro 2: Matriz de Confuso


Cluster 1 2 3 4
1 133 0 0 2
2 0 3 0 0
3 0 0 3903 0
MLP 6: 6-9-7-4: 1 4 0 2 0 19

1 132 0 1 2
2 0 3 0 1
3 1 2 3092 0
RBF 6: 6-127-4: 1 4 0 0 0 18

1 133 0 0 2
2 0 5 0 0
3 0 0 3093 0
MLP 6: 6-7-4: 1 4 0 0 0 19

1 133 0 0 0
2 0 5 0 0
3 0 0 3093 0
MLP 6: 6-9-4: 1 4 0 0 0 21

1 132 0 1 0
2 0 5 0 0
3 0 0 3092 0
MLP 6: 6-7-7-4: 1 4 1 0 0 21

13
Quadro 3: Desempenho das Redes Neurais
MLP 6: 6-9-7-4: 1 RBF 6: 6-127-4: 1 MLP 6: 6-7-4: 1
Cluster Cluster Cluster
1 2 3 4 1 2 3 4 1 2 3 4
Total 133 5 3903 21 133 5 3903 21 133 5 3903 21
Acertos 133 3 3903 19 132 3 3902 18 133 5 3903 19
Erros 0 2 0 2 1 2 1 3 0 0 0 2
Desconhecido 0 0 0 0 0 0 0 0 0 0 0 0
Acertos (%) 100 60 100 90,5 99,3 60 100 85,7 100 100 100 90,5
Erros (%) 0 40 0 9,25 0,75 40 0,03 14,3 0 0 0 9,52
Desconhecido
(%) 0 0 0 0 0 0 0 0 0 0 0 0
MLP 6: 6-9-4: 1 MLP 6: 6-7-7-4: 1
Cluster Cluster
1 2 3 4 1 2 3 4
Total 133 5 3903 21 133 5 3903 21
Acertos 133 5 3903 21 132 5 3902 21
Erros 0 0 0 0 1 0 1 0
Desconhecido 0 0 0 0 0 0 0 0
Acertos (%) 100 100 100 100 99,3 100 100 100
Erros (%) 0 0 0 0 0,75 0 0,03 0
Desconhecido
(%) 0 0 0 0 0 0 0 0

A anlise de sensibilidade das redes neurais do Quadro 4 permite avaliar o grau de


confiana dos resultados em situaes de decises incertas ou suposies sobre os dados e
resultados utilizados. Sendo assim, ela fundamental para investigar a heterogeneidade
entre os dados. Esta anlise semelhante anlise de comunalidade, onde se verifica a
importncia de cada varivel e sua contribuio no modelo proposto. Nesse caso, a
varivel que mais contribui para a rede neural MLP 6: 6-9-4: 1 o valor do ICMS.

Quadro 4: Anlise de Sensibilidade das Redes Neurais

Consumo Valor do Valor


Consumo em 30 Valor do Valor do Corte de Total
Lido dias Importe ICMS Reposio da Fatura
MLP 6: 6-9-7-4: 1
Razo 7,43 6,8 8,95 7,37 5,96 7,92
Importncia 3 5 1 4 6 2

RBF 6: 6-127-4: 1
Razo 2,29 2,12 2,07 2,11 2,74 1,64
Importncia 2 3 5 4 1 6

MLP 6: 6-7-4: 1
Razo 4,1 6,11 7,63 7,78 5,14 6,12
Importncia 6 4 2 1 5 3

MLP 6: 6-9-4: 1

14
Razo 10,64 6,08 9,21 12,89 8,25 7,94
Importncia 2 6 3 1 4 5

MLP 6: 6-7-7-4: 1
Razo 5,8 6,82 11,03 10,58 9,1 17,32
Importncia 6 5 2 3 4 1

4 CONSIDERAES FINAIS
Como ressaltado por Hair (1998), na grande maioria dos mercados no possvel
se guiar pelo pensamento simplista que considera os consumidores homogneos e
caracterizados por um pequeno nmero de variveis demogrficas. As empresas esto
atendendo cada vez mais segmentos de consumidores com diferentes caractersticas
demogrficas e comportamentais e inmeras implicaes legais, econmicas e
tecnolgicas. As tcnicas de anlise multivariada so a nica forma de entender e conhecer
as mltiplas relaes desse cenrio atual.
Alm disso, a tendncia a partir de agora que a eficincia e eficcia da estratgia
de CRM definam a nvel competitividade das empresas. Desse modo, imprescindvel que
as etapas da estratgia de CRM sejam muito bem planejadas e executadas. A primeira
etapa, que consiste na identificao dos clientes, crucial. Um banco de dados ou
Datawarehouse contendo poucas variveis demogrficas e, principalmente,
comportamentais afeta diretamente a etapa de diferenciao dos clientes e, possivelmente,
a eficcia da estratgia de CRM. Entretanto, muitas empresas ainda no tratam a questo
da identificao dos clientes com a seriedade que deviam.
Este trabalhou mostrou como algumas das tcnicas de anlise multivariada podem
e devem auxiliar administradores da rea de marketing. Conhecer e usar essas tcnicas so
imprescindveis para uma empresa que almeja ser competitiva.

15
5 BIBLIOGRAFIA

CHURCHILL, Gilbert A. Jr; PETER, J. Paul. Marketing: criando valor para os


clientes. Traduo BARTALOTTI, Ceclia Camargo; MOREIRA, Cidd Knipel.
So Paulo: Saraiva, 2005. 626 p.
CISTER, Angelo Maia. Minerao de dados para a anlise de atrito em
telefonia mvel. 2005. 150 f. Tese (Doutorado em Engenharia) Universidade
Federal do Rio de Janeiro, Instituto de Ps-Graduao em Engenharia COPPE-
UFRJ, Rio de Janeiro, 2005.
COUTINHO, Fernando V.; Datamining; www.dwbrasil.com.br/2003.
GARRAFONI, Atlio Jnior; SANTADE, Hlio Oliva; PIZZINATTO, Nadia
Kassouf; FARAH, Osvaldo Elias. CRM: conceitos e mtodos de aplicao no
marketing de relacionamento. Revista Gesto Industrial, Paran, v. 01, n. 03,
p.13-23, 2005.
GREENBERG, P. CRM at the Speed of Light: Capturing and Keeping
Customers in Internet Real Time. New York: McGraw-Hill, 2002.
GRNOSS, C. Value-driven relational marketing: from products to resources and
competencies. Journal of Marketing Management, U.K., v .13, p. 407-426, 1997.
HAIR, Joseph F. Jr.; ANDERSON, Rolph E.; TATHAM, Ronald L.; BLACK,
William C. Multivariate data analysis. New Jersey: Prentice-Hall, 1998. 730 p.
LANINI, Fabiano Duro. A Sofisticao da Gesto e o CRM em Agncias de
Viagens e Turismo Operando no Brasil. 2005. 158 f. Dissertao (Mestrado em
Administrao) Universidade Federal do Rio de Janeiro, Instituto de Ps-
Graduao em Administrao,
Rio de Janeiro, 2005.
MLLER, K.; WILSON, D.T. Business Marketing: an interaction and network
perspective. Kluwer Academic, Norwell, MA, 1995.
MORGAN, R.M.; HUNT, S.D. The commitment-trust theory of relationship
marketing. Journal of Marketing, ESTADO, v .58, p. 20-38, jul., 1994.
PAYNE, A.; CRISTOPHER, M.; CLARK, M.; PECK, H. Relationship marketing
for competitive advantage. Oxford: Butterworth Heinemann, 1999.
PEPPERS, Don; ROGERS, Martha. One to One Manager: Real World Lessons
in Customer Relationship Management. The New York: Currency/Doubleday,
1999.
PLATA, Sandra. De acordo com a vontade do cliente. Disponvel em:
http://www.intermanagers.com.br/archivo/nota.jsp?id=707. Acesso em: 10 out.
2003.
RESE, Mario. Relationship marketing and customer satisfaction: an information
economics perspective. Marketing Theory, v .3, n. 1, p. 97-117, 2003.
SCREMIN, Marcos Antnio Antonello. Mtodo para a seleo do nmero
decomponentes principais com base na lgica difusa. 2003 124 f. Tese
(Doutorado em Engenharia de Produo) Universidade Federal de Santa Catarina,
Programa de Ps-Graduao em Engenharia de Produo, Santa Catarina, 2003.

16

Você também pode gostar