Você está na página 1de 167

MINERAO DE DADOS PARA A ANLISE DE ATRITO EM TELEFONIA

MVEL
Angelo Maia Cister
TESE SUBMETIDA AO CORPO DOCENTE DA COORDENAO DOS
PROGRAMAS DE PS-GRADUAO DE ENGENHARIA DA UNIVERSIDADE
FEDERAL DO RIO DE JANEIRO COMO PARTE DOS REQUISITOS
NECESSRIOS PARA A OBTENO DO GRAU DE DOUTOR EM CINCIAS
EM ENGENHARIA CIVIL.
Aprovada por:
_______________________________________________________
Prof. Nelson Francisco Favilla Ebecken, D.Sc
_______________________________________________________
Prof
a.
Beatriz de Souza Leite Pires Lima, D. Sc.
_______________________________________________________
Prof. Alexandre Gonalves Evsukoff, D. Sc.
_______________________________________________________
Prof
a.
Helosa Mrcia Pires, D. Sc.
_______________________________________________________
Prof. Elton Fernandes, Ph. D.
_______________________________________________________
Prof. Estevam Raphael Hruschka Junior, D. Sc.
RIO DE JANEIRO, RJ - BRASIL
DEZEMBRO DE 2005















CISTER, ANGELO MAIA
Minerao de dados para a anlise de atrito em
telefonia mvel [Rio de Janeiro] 2005.
IX, 158 p. 29,7 cm (COPPE/UFRJ, D. Sc.,
Engenharia Civil, 2005)
Tese - Universidade Federal do Rio de Janeiro,
COPPE
1. Anlise de Atrito
2. Data Mining
3. Transformada Wavelet
I. COPPE/UFRJ II. Ttulo (srie)
























ii

AGRADECIMENTOS
Agradeo a Deus, sem cuja permisso nada teria sido iniciado quanto menos
concludo;
Agradeo ao Professor Nelson Ebecken por ter acreditado e confiado em mim e
num fim colimado dos estudos. Eu me lembro, quando bati a sua porta, h 5 anos eu s
o conhecia por seus trabalhos cientficos e disse que gostaria de fazer doutorado com
ele. E, pensando que fosse ter pela frente um grande no, ele simplesmente se virou e
me disse tudo bem !!!!! comeamos em maro. Durante esses anos minha admirao
e respeito pelo professor e cientista foi adicionado a admirao do amigo que convivi
durante esses quase 6 anos de estudo. Obrigado Nelson, espero ter correspondido as
expectativa.
Aos meus pais Gilda (minha primeira professora na Escola Municipal Bolvia)
e Carlos que nunca mediram esforos para atenderem aos seus filhos em qualquer
ocasio, incentivando tanto a mim quanto ao meu irmo o sentido do estudo e do caldo
cultural;
A minha Laura, Ah !! Laura, quanta pacincia voc demonstrou,
principalmente nos momentos de minhas crises existenciais. Obrigado pelo Amor e
Carinho a mim doados durante esses anos, principalmente nos dois ltimos anos;
Ao meu tcnico de prontido em informtica, meu irmo Ricardo, sempre
prestativo ao verificar os problemas da minha mquina;
A Sra. Fernanda, Sr.Manoel e a Andra (Mala) que sempre fizeram parte de
minha torcida;
Aos meus amigos do NTT, Guilherme com sua pacincia oriental sempre
prestativo a qualquer momento que se precisava dele, ao Fbio que no momento
encontra-se na Itlia e que mesmo l me ajudou com minha dvidas em relao ao
programa de gerao de regras;
Ao meu amigo de Guerra Marco Zarur, carinhosamente chamado por mim de
gordinho, quantas no foram as horas que perturbei ao meu amigo com dvidas mils;
iii

Ao Daniel, Valeria, Graziella e Renan que sempre estavam presentes no
cafezinho para aliviarmos as tenses acadmicas;
Aos membros da secretaria acadmica Jairo, Beth e Estela, pelas vezes que me
ajudaram nos problemas burocrticos;
Aos contribuintes brasileiros que atravs de seus impostos custearam todos os
meus estudos desde o incio, em que aprendi o b a ba, na Escola Municipal Bolvia,
mais tarde passando a se chamar George Sumner (Ilustre catedrtico do Colgio Pedro
II), indo em seguida para a escola Municipal Jos Verssimo, mais tarde o Colgio
Pedro II saindo direto para o Instituto de Fsica da UFRJ. Agradeo ao pagamento das
bolsas de estudo no mestrado da COPPE Sistemas, mais tarde a bolsa de estudo do
doutorado em controle estatstico da PUC Engenharia Eltrica. O pagamento integral
de meu salrio na Escola Superior de Guerra (ESG) e hoje, meu sustento no doutorado
na COPPE-Civil. Embora no tenha recebido, diretamente, bolsa financeira, por ser
funcionrio Pblico, seus impostos mantiveram os laboratrios da UFRJ e o meu salrio
mensal. Muito obrigado a cada cidado deste grande Brasil, espero poder pagar cada
centavo a mim investidos em prol de nossa amada terra do Brasil.
Se me esqueci de algum, peo desculpas, mas lembro aqui de cada aluno meu
da FACC/UFRJ, meus colegas da FACC, os funcionrios da COPPE.

A todos meu muito obrigado !!!!!!

iv

Resumo da Tese apresentada COPPE/UFRJ como parte dos requisitos necessrios
para a obteno do grau de Doutor em Cincias (D. Sc.)

MINERAO DE DADOS PARA A ANLISE DE ATRITO EM TELEFONIA
MVEL

Angelo Maia Cister

Dezembro/2005

Orientador: Nelson Francisco Favilla Ebecken
Programa: Engenharia Civil
O objetivo desta tese foi apresentar uma metodologia para minerao de dados
para a anlise de atrito em telefonia mvel.
Foi feito um estudo onde os conceitos de marketing, CRM, data mining e
filtros digitais (transformada wavelet) trabalham em conjunto para a extrao de
modelos. Tais modelos, trabalhados matematicamente, podem gerar informao para a
inferncia de clientes que possam desejar evadir da base de dados por atrito com a
empresa prestadora de servio de telefonia mvel.
A metodologia validada em um estudo real e ad hoc. Algumas concluses so
apresentadas e discutidas ao final do estudo.
v

Abstract of Thesis presented to COPPE/UFRJ as a partial fulfilment of the requirements
for the degree of Doctor of Science (D. Sc.)

DATA MINING FOR CHURN ANALISYS IN TELCOM MOBILE ENTERPRISE

Angelo Maia Cister

December/2005

Advisor: Nelson Francisco Favilla Ebecken
Department: Civil Engineering
The goal of this thesis is to introduce a methodology for churn analysis in telco
mobile enterprise.
It was done a study where the marketing concepts, CRM, datamining and
digital filters (wavelet transformed) work together for the model extraction. Such
model, treated mathematically, can generate information to forecasting which customer
wish to go out from the database belongs to telco mobile phone.
The validation of this methodology is done in a real and ad hoc study case. Some
conclusions are presented and discussed at the end of the study.
vi

NDICE
Resumo .............................................................................................................................v
Abstract ............................................................................................................................vi
INTRODUO..1
CAPTULO 1 ................................................................................................................... 4
1.1 Introduo............................................................................................................... 4
1.2 A funo do marketing ........................................................................................... 6
1.3 A evoluo do marketing........................................................................................ 8
1.4 Marketing Direto: conceitos elementares............................................................... 9
1.5 Marketing Direto ou Marketing do Relacionamento............................................ 11
1.5.1 A importncia do Marketing Direto: ............................................................. 11
1.5.2 Formas de marketing direto........................................................................... 12
1.6 Telecomunicaes no Brasil................................................................................. 13
1.6.1 Histrico ........................................................................................................ 13
1.6.2 Fase Atual do Mercado.................................................................................. 16
CAPTULO 2 Customer Relationship Management (CRM) ......................................... 18
2.1 Introduo............................................................................................................. 18
2.2 Arquitetura de um modelo de CRM..................................................................... 19
2.3 A Estratgia de CRM............................................................................................ 21
2.3.1 Identificar ...................................................................................................... 21
2.3.2 Diferenciar ..................................................................................................... 22
2.3.3 Interagir ......................................................................................................... 23
2.3.4 Personalizar ................................................................................................... 24
2.4 Implantando Sistemas de CRM............................................................................ 25
2.5 Reteno do Cliente.............................................................................................. 25
CAPTULO 3 ANLISE DE ATRITO......................................................................... 29
3.1 Definio .............................................................................................................. 29
3.2 Causas do Churn................................................................................................... 30
3.3 Implicaes........................................................................................................... 31
3.4 Modelo Preditivo de Churn .................................................................................. 36
3.5 Fidelizao............................................................................................................ 37
3.5.1 A lealdade e o renascimento do marketing.................................................... 39
3.5.2 A satisfao apenas o comeo .................................................................... 43
3.5.3 As tcnicas e os programas de fidelizao .................................................... 45
3.5.4 Implementando programas de fidelizao..................................................... 48
3.5.5 Importncia e aplicao do banco de dados no processo de fidelizao....... 51
3.6 Marketing de Nichos ou Segmentos..................................................................... 52
3.6.1 Como iniciar o marketing de nichos.............................................................. 54
vii

3.6.2 Como construir um banco de dados .............................................................. 56
3.6.3 Em busca de nichos: Onde procurar ? ........................................................... 58
3.6.4 Em busca de nichos: Dando seqncia a procura.......................................... 61
3.7 A segmentao do mercado como estratgia de marketing.................................. 62
CAPTULO 4 DATA MINING ..................................................................................... 69
4.1 Estado da Arte ...................................................................................................... 69
4.2 Prospeco de Conhecimento em Banco de Dados (KNOWLEDGE
DISCOVERY IN DATABASES KDD) ................................................................. 70
4.2.1 Seleo de Dados........................................................................................... 72
4.2.2 Limpeza e Enriquecimento............................................................................ 72
4.2.3 Transformao............................................................................................... 73
4.2.4 Interpretao.................................................................................................. 73
4.3 As bases do data mining....................................................................................... 73
4.3.1 Estatstica....................................................................................................... 74
4.3.2 Inteligncia Artificial..................................................................................... 74
4.3.3 Machine Learning.......................................................................................... 75
4.4 Principais tcnicas de Data Mining ...................................................................... 75
4.4.1 Redes Neurais................................................................................................ 75
4.4.2 A Induo de Regras ou Rule Induction........................................................ 77
4.4.3 rvores de deciso......................................................................................... 77
4.4.4 Anlise Estatstica de Sries Temporais........................................................ 78
4.4.5 Visualizao .................................................................................................. 78
4.5 Data Warehouse.................................................................................................... 79
4.5.1 Razes do porqu o data mining e o data warehouse tm se tornado
importantes nas empresas ....................................................................................... 80
4.5.2 Dificuldade para o uso de novas tecnologias................................................. 82
4.5.3 Altos Custos................................................................................................... 82
4.5.4 Necessidade de grandes volumes de dados ................................................... 82
4.5.5 Complexidade das Ferramentas..................................................................... 83
4.5.6 O desafio da preparao dos dados para a minerao ................................... 83
4.6 Implementao de projetos em DM...................................................................... 84
4.6.1 A regra 80/20................................................................................................. 84
4.6.2 Algumas aplicae de DM e DW.................................................................. 85
CAPTULO 5 Discusso qualitativa a respeito de tcnicas matemticas para a anlise
robusta de dados ............................................................................................................. 87
5.1 Anlise multivariada de dados.............................................................................. 87
5.2 Redes Neurais Artificiais...................................................................................... 88
5.2.1 Introduo...................................................................................................... 88
5.2.2 O Neurnio Biolgico ................................................................................... 88
5.2.3 Componentes dos Modelos Conexionistas.................................................... 90
5.2.4 Tipos de Funes de Ativao....................................................................... 92
5.2.5 Nveis de Treinamento para RNA................................................................. 94
5.2.6 Breve Histrico das RNA............................................................................ 103
5.3 Transformada Wavelet ....................................................................................... 106
5.3.1 Introduo.................................................................................................... 106
viii

5.4 Tcnicas de Anlise............................................................................................ 107
5.4.1 Anlise de Fourier ....................................................................................... 107
5.5 Transformada Wavelet Propriamente Dito......................................................... 109
5.5.1 Anlise Wavelet (Representao Tempo-Freqncia) ................................ 109
5.5.2 A Funo Inversa......................................................................................... 112
5.5.3 Princpio da Incerteza.................................................................................. 113
5.5.4 Propriedades da Transformada Wavelet...................................................... 116
5.6 Otimizaes utilizadas para modelo de classificao de churners..................... 116
CAPTULO 6 DESCRIO DO EXPERIMENTO.................................................... 120
6.1 Problema............................................................................................................. 120
6.2 Base de dados utilizando-se as mdias das variveis mensais (BDM) .............. 129
6.2.1 Anlise atravs de RNA para BDM............................................................ 129
6.2.2 Primeira Onda: Anlise para 12 meses das mdias das variveis (Mensal) 130
6.2.3 Segunda onda :Anlise para 11 meses das mdias das variveis (Mensal). 133
6.2.4 Terceira onda:Anlise para 10 meses das mdias das variveis (Bimestral)135
6.2.5 Anlise atravs de gerao de regras de associao. ................................... 136
6.2.6 Anlise para 12 meses ................................................................................. 140
6.3 Base de dados utilizando-se variveis isoladas ms a ms(BDV)...................... 142
6.3.1 Anlise da classificao gerada a partir da filtragem db2. .......................... 144
6.3.2 Anlise da classificao gerada a partir da filtragem db3. .......................... 146
6.4 Compilao dos resultados ................................................................................. 149
6.5 Viso geral da abordagem metodolgica............................................................ 149
CONCLUSO.............................................................................................................. 152
BIBLIOGRAFIA ..........................................................................................................150

ix

INTRODUO
Originalmente, o marketing foi concebido como ramo de aplicaes econmicas,
para estudar os canais de distribuio de produtos. Posteriormente, tornou-se uma
disciplina de gesto dedicada a incrementar as vendas. Mais tarde, passou a ser
considerado como cincia aplicada ao estudo do comportamento do cliente, a fim de
entender o processo de compra e venda, envolvido no marketing de produtos e servios.
Devido concorrncia e sofisticao do cliente, o conceito do marketing evoluiu
para uma orientao no sentido de satisfazer s necessidades do cliente. Sob este
conceito do marketing, oposto orientao tradicional para vendas, o produto uma
varivel a ser realizada e modificada em resposta s mudanas nas exigncias do cliente.
Assim sendo, as novas empresas, as marcadas pelos novos ventos da economia
globalizada, se vem obrigadas a mudar seu comportamento perante os novos e
exigentes consumidores.
A necessidade de disputar o consumidor e mant-lo fiel sua marca/produto fez
com que as empresas revissem seus conceitos, voltados quase que exclusivamente para
seu produto e/ou marca, e voltassem seus olhos mais atentamente para os consumidores.
Nunca conceitos, tais como CRM (Costumer Relationship Management), reteno de
clientes (lealdade de seus clientes), anlise de database marketing, data mining e
segmentao estiveram to em voga quanto nos dias de hoje.
Por essa razo, considera-se relevante pesquisar, analisar e discutir sistemas
integrados como alternativa para o crescimento e desenvolvimento empresarial.
Acredita-se que inovar pode, paradoxalmente, voltar ateno para o cliente em busca
de informaes que possam ampliar o negcio de empresa. Sabe-se ainda, que a
lealdade (fidelidade) um fator importante nesse mercado sem limites, uma vez que a
inteligncia e saber onde buscar a informao necessria so de fundamental
importncia.
1

Abordagem Metodolgica
O presente trabalho uni duas reas de conhecimento que so o marketing, na
concepo administrativa e quantitativa, e a rea de minerao de dados (datamining).
apresentado por tema o CRM analtico; como sujeito de estudo: anlise de
atrito (Anlise de Churn); delimitao do estudo: modelagem matemtica atravs do
uso de tcnicas de minerao de dados, para melhor compreenso do perfil do cliente,
campanhas de reteno do cliente e previso de evaso voluntria da base de dados das
empresas; objeto de estudo: anlise de atrito (Anlise de Churn) em uma empresa de
telefonia celular (Data Mining e CRM (Customer Relationship Management)).
Como objetivos a serem alcanados tem-se a classificao, previso e
identificao de clientes que por ventura possam evadir da base de dados, ocorrendo,
desta forma, desconforto financeiro para empresa.
Ao final deste trabalho ter-se- condies de propor uma forma de uso
sistemtico para a classificao e previso de clientes que possam ser alvos de ao de
marketing (ao de reteno), dentro da base de dados de qualquer empresa que possua
concorrentes a sua altura. O objetivo principal reconhecer clientes que, por
insatisfao com a empresa, desejam sair da mesma, ou, simplesmente, trocar de
empresa por no considerarem a atual digna de seus prstimos.
Este trabalho aproximou-se ao mximo da realidade, atravs de sugestes
bibliogrficas especializadas, base de dados verdadeira, anlise dos dados e definio
das diversas tcnicas para formatao dos dados e extrao de conhecimento.
As metodologias utilizadas para a classificao foram as tcnicas de Redes
Neurais, em seus diversos aspectos quanto a sua calibragem, assim como gerao de
regras de associao e filtragem dos dados atravs de transformada wavelet, como pr-
processamento dos dados. importante salientar que os dados filtrados atravs do
banco de filtros wavelet serviram para a entrada da rede neural.
Atravs de bibliografia especializada sugerida e selecionada, foram
desenvolvidos os primeiros captulos sobre estado da arte da telefonia no Brasil, teoria
2

de churn, minerao de dados e gerncia de relacionamento com o cliente (customer
relationship management -CRM).
Em seguida, o trabalho contar com a descrio do experimento de campo, onde
procurar aplicar os conhecimentos das tcnicas de cleaning (limpeza dos dados) e a
classificao dos dados.
A pesquisa foi realizada em uma base real de dados de uma empresa de telefonia
celular, que guarda o direito de no ser identificada, aps ter sido minuciosamente limpa
(processo de cleaning dos dados) e devidamente auditada quanto robustez dos dados e
sua veracidade no mercado. A amostra foi extrada atravs do processo amostral
bootstrap, garantindo, desta forma, uma perfeita copia do universo.
Foram selecionados 725 registros com suas respectivas variveis, que sero
definidas frente no captulo 6 . importante dizer que o tratamento dos dados com sua
devida filtragem e auditoria, representou a maior etapa da metodologia apresentada.
Aps a anlise dos resultados da pesquisa, foi feita uma avaliao de todo o
processo experimental, com o objetivo de levantar os pontos fracos e fortes, para ento
se chegar a concluses e recomendaes para futura aplicabilidade deste processo.
Estrutura da Tese
A tese tem por estrutura os captulos: Captulo 1 - apresenta o estado da arte do
mercado como um todo, ou seja, da telefonia no pas, assim como alguns aspectos legais
de mercado, alm de permear alguns conceitos de marketing para o entendimento futuro
de o porqu da tese; Captulo 2 - so apresentados os conceitos de CRM, a viso
sistmica; suas estratgias, as vises qualitativas e quantitativas; Captulo 3 fala a
respeito da teoria de atritos entre clientes e empresas (anlise de churn); Captulo 4
refere-se minerao dos dados e seus diversos aspectos quanto s tcnicas de
tratamento estatstico e de minerao de dados. No Captulo 5 - apresentado uma
viso conexionista a respeito de Redes Neurais e uma viso abrangente a respeito de
anlise multivariada e trata dos conceitos das transformada wavelet. Captulo 6 - retrata
o experimento e sua anlise, problemas apresentados e como foram resolvidos; e por
fim apresentado o captulo 7 com a concluso da anlise e sugestes para estudos
posteriores.
3

CAPTULO 1
1.1 Introduo
Inmeras so as obras literrias que fazem aluso a nova ordem poltico-
econmica imposta por diversos pases na ltima dcada do sculo XX. No presente
estudo terico, no cabe fazer crticas acirradas contra e, nem to pouco, a favor da nova
ordem econmica. A verdade que empresas dos diversos segmentos, principalmente
do segmento de servios, se viram obrigadas a modificar seu tratamento para com o
novo cliente que surgiu com o impacto da economia globalizada, ou mundializada,
como preferem os franceses.
O novo cliente tornou-se extremamente exigente, uma vez que todos os produtos
e muitos servios, dos mais diferentes pontos do mundo, batem-lhes porta oferecendo-
lhes verdadeiras maravilhas que tornaro suas vidas mais simples e fceis.
O novo cliente, o cliente globalizado, est se acostumando a ter sua necessidade
e satisfao executadas com rapidez e qualidade. Em pouco tempo os clientes
acosturam-se a ter qualidade e eficincia, fato esse que exigido a cada dia com mais
fervor e direitos.
Na era da globalizao, o poder no se encontra mais com quem possui o capital
e sim, com quem retm a informao. As grandes redes de computadores ligando
pontos, que antes eram extremamente longnquos, em todo mundo fez com que as
pessoas/clientes pudessem conhecer o que h de melhor e mais acessvel
financeiramente.
Assim sendo, as novas empresas, as marcadas pelos novos ventos da economia
globalizada, se vem obrigadas a mudar seu comportamento perante os novos e
exigentes consumidores.
A partir dessa nova viso, podemos ver o CRM como um conjunto de estratgias
quantitativas e qualitativas empresariais inovadoras - utilizadas para obter
benefcios e vantagens competitivas, gerando maiores lucros e adquirindo um maior
4

nvel de reteno dos clientes. A evoluo do mercado levou a necessidade de uma
evoluo do marketing e, como conseqncias deste, o marketing de relacionamento e a
fidelizao dos clientes.
Segundo alguns consultores, por exemplo, (CONTADOR, 1995), acrescenta
dizendo a respeito de fidelidade:
A fidelidade do cliente versus empresa e empresa versus
cliente deve ser parte integrante do relacionamento e relacionar
significa, aqui, desenvolver ferramentas e meios que permitam
um contato direto, quase ntimo, com o cliente, procurando
desenvolver-lhe uma psicologia de fidelidade com o
fornecedor..
Diante disso, pode-se dizer que as preocupaes com o cliente final e com sua
satisfao devam dominar, hoje, as estratgias das empresas. ratificado por
(Corra,1997) ao comentar que:
... os inquritos aos consumidores continuam a revelar uma
grande insatisfao da parte destes. Ironicamente, o que os
estrategistas de marketing tm feito por em ao, salvo raras
excees, mtodos que, infelizmente, s chateiam o cliente e
indispem progressivamente cada vez mais contra o marketing
direto e o telemarketing.
Certamente o autor refere-se que a realidade dos desejos do cliente est tendo
um viso, pelos executivos de marketing, voltada para empresa e no para o que
realmente o cliente deseja. Verifica-se que a cada dia joga-se no lixo um grande entulho
de propaganda, que se encontra em caixas de correio e a reao aos telefonemas de
promoo crescentemente intempestiva. O pior disso tudo que a porcentagem do
oramento anual desse tipo de ao transforma-se em desperdcio.
O modelo massacre ao cliente est se repetindo no prprio marketing direto,
feito atravs da Internet, utilizando-se o correio eletrnico. E, o mais agravante, muitos
dos grupos criados na rede de computadores no esto potencializados como
comunidades de interesse e grupos de discusso. Diante desse problema que o
presente estudo investiga, atravs de publicaes acadmicas e mercadolgicas, os
sistemas de CRM, suas vantagens e desvantagens, sua implantao e as mudanas
decorrentes, em seus aspectos econmico e social, com nfase em estudos de caso
5

sempre visando o consumidor final. Para tanto, utilizar-se- modelagem matemtica
para chegar-se a algumas das concluses ao fim do estudo.
1.2 A funo do marketing
Segundo um dos maiores pensadores do marketing, (KOTLER, 1998), o
marketing tem a funo de orientar a empresa para o cliente, porque considera os
clientes a razo de vida de um negcio (Grifo nosso).
O autor define marketing como concepo e entrega dos produtos que
satisfaam a exigncias do cliente. O enfoque da funo do marketing no est em
vender o que a manufatura fabrica, mas atender s necessidades dos clientes. Esse o
caminho para obter o maior dos produtos no mercado. Fato esse corroborado por
(RUST, 2000), que cita em sua obra a importncia do valor do cliente. Ainda segundo
(RUST, ib.), se uma determinada empresa, neste caso citando o ramo de supermercados,
no tiver o produto, por que no dizer ao cliente onde encontr-lo, mesmo que seja em
seu concorrente? Este fato faz com que seu cliente passe a ter um maior respeito pela
empresa, gerando autoconfiana e far com que ele, o cliente, retorne e crie um vnculo
de relacionamento.
Os objetivos, o foco, a abrangncia, as tcnicas, o conceito e a implantao do
marketing mudaram e continuam evoluindo de acordo com as mudanas do ambiente,
sejam pela velocidade dos avanos em tecnologia, evoluo dinmica das necessidades,
exigncias dos consumidores, pelas tendncias do mercado, ou novas formas de
organizao do trabalho
1
.
Originalmente, o marketing foi concebido como ramo de aplicaes econmicas,
para estudar os canais de distribuio de produtos. Posteriormente, tornou-se uma
disciplina de gesto dedicada a incrementar as vendas. Depois, passou a ser considerado
como cincia aplicada ao estudo do comportamento do cliente, a fim de entender o
processo de compra e venda, envolvido no marketing de produtos e servios (KOTLER,
1998).

1
interessante ver a maneira interdisciplinar com que Manuel Castells trata do assunto em A
Sociedade em Rede Vol. 1, Editora Paz e Terra, 1999.
6

Devido concorrncia e sofisticao do cliente, o conceito do marketing evolui
para uma orientao no sentido de satisfazer s necessidades do cliente. Sob este
conceito do marketing, como oposto orientao tradicional para vendas, o produto
uma varivel a ser realizada e modificada em resposta s mudanas nas exigncias do
cliente.
Correspondentemente, o foco do marketing mudou ao longo dos anos.
Inicialmente, o foco estava voltado para a produo e o produto. Esta fase caracterizou-
se porque a demanda excedia a oferta e todo produto fabricado era comercializado.
Entretanto, com o aumento da eficincia da fabricao, a oferta dos produtos excedeu a
demanda. Nesta situao, o foco estava concentrado nas vendas e na promoo (este
tipo de conceito ainda aplicado no mercado). A nfase do marketing estava no curto
prazo focalizado no processo de venda em si mesmo.
A necessidade de atender s exigncias do cliente leva a concentrar os esforos
na gesto tradicional mix marketing (produto, preo, promoo e distribuio). O ponto
de vista de curto prazo (ttico) foi substitudo por uma orientao estratgica em longo
prazo. A lucratividade est na satisfao do cliente em longo prazo e nos novos
conceitos sobre mercados-alvo, segmentao de mercado, posio do produto no
mercado e diferenciao do produto.
Assim, a funo do marketing deve fazer essencialmente mais do que encontrar
clientes para produtos e servios. Entre outras tarefas, o marketing deve se integrar com
os clientes. Isto envolve, alm da tradicional orientao para troca e vendas, considerar
os clientes parte integral do desenvolvimento e a fabricao e a entrega dos produtos
com atributos do seu interesse destes.
A estratgia do marketing focaliza a vantagem competitiva em longo prazo
como parte integral de uma estratgia de negcio, que serve como limite entre a
empresa e seus clientes, concorrentes e grupos de interesse. A estratgia est baseada na
anlise de clientes, dos concorrentes e grupos de interesse
2
.

2
Aqui se faz importante o conceito de Sistemas de Informao de Marketing SIM, intimamente
relacionado ao grupo de Inteligncia de Marketing das empresas. Ver Mattar, F. N., Pesquisa de
Marketing, vol. 1., ed. Atlas, p. 30, 1996.
7

1.3 A evoluo do marketing
As estratgias de marketing atuais ainda encontram-se baseadas, grande parte,
no conceito de marketing de massa, marketing este em que a empresa produz,
distribui e promove em massa um produto para todos os compradores. Porm, tal
conceito h muito tempo se revela inadequado para o novo cenrio.
O marketing est passando por uma reavaliao intensa luz de vastos desafios
globais, tecnolgicos, econmicos e sociais enfrentados pelas empresas atuais. Os
mercados de massa esto fragmentando-se em pequenos mercados. Canais mltiplos de
distribuio esto substituindo canais nicos; consumidores esto comprando
diretamente atravs de catlogos, telemarketing e compra eletrnica; preos com
descontos e promoo de vendas esto em ascenso, prejudicando a lealdade de marca;
mdias convencionais de propaganda esto atingindo menor nmero de consumidores
potenciais e custando mais.
Atualmente no h lugar no mercado para as empresas que procuram exercer
apenas um trabalho de bom nvel. Elas devem fazer um trabalho excelente, se quiserem
ser bem sucedidas nos mercados de crescente concorrncia global. Tais fatos
corroboram com a premissa: o sucesso de empresas rentveis est no conhecimento e
satisfao dos consumidores - alvo com ofertas competitivamente superiores. Para isso,
surge a necessidade de reformulao do conceito de marketing.
Segundo Kotler (1998), marketing nada mais do que a interpretao dos
desejos e necessidades das pessoas, traduzido uma esfera empresarial, com interesse
de realizar a troca de produtos oferecidos por capital, neste caso, o capital do
consumidor. Quando muitos produtos podem satisfazer certa necessidade, a escolha do
produto guiada pelos conceitos de valor, custo e satisfao. Estes produtos so obtidos
de diversas maneiras: autoproduo, coero, esmola e troca. A maioria das sociedades
modernas trabalha sob o princpio da troca. Pessoas especializam-se em produzir
produtos especficos e troc-los por outros objetos de que necessitam. Engajam-se em
transaes e construo de relacionamentos. Partindo desses princpios, Kotler define
mercado como um grupo de pessoas que compartilha uma necessidade similar, na qual o
marketing quem coordena as atividades envolvidas no trabalho com mercados, isto ,
tenta realizar trocas potenciais.
8

Estas e outras mudanas no mercado significam o porqu das empresas
reexaminarem seus conceitos fundamentais e, ainda, reverterem s premissas sobre as
quais constroem o sucesso de seus negcios.
Talvez, a transformao bsica do pensamento de marketing seja a mudana do
paradigma de fechar uma venda para criar um cliente. No passado, marketing era
largamente orientado para a transao. Hoje, est mais orientado para o relacionamento.
Alm de planejar o melhor composto de marketing para concluir uma venda, existe
crescente nfase para planejar o melhor composto de relacionamento para conquistar e
manter os clientes. Bons clientes representam um ativo que, quando bem administrado e
atendido, permanecer durante muito tempo gerando receita para a empresa. No
mercado intensamente competitivo, a primeira ordem da empresa manter a lealdade
dos clientes atravs de contnua satisfao de suas necessidades de maneira superior.
Praticar marketing de relacionamento no se limita apenas melhor vinculao
da empresa com seus clientes. As empresas vencedoras tambm desenvolvem
relacionamentos mutuamente rentveis com seus fornecedores e distribuidores. Se a
empresa comprime excessivamente o lucro de seus fornecedores, fora o produto sobre
seus distribuidores e ganha quando os participantes da cadeia de suprimentos perde,
certamente fracassar. J as empresas inteligentes associam-se a fornecedores e
distribuidores na tarefa de atender melhor seu consumidor final.
1.4 Marketing Direto: conceitos elementares
Atualmente muitos produtos so vendidos atravs de lojas, mas podemos
encontrar produtos e servios vendidos fora das lojas. O chamado varejo sem loja tem
crescido mais depressa que o varejo de loja.
Os varejistas sem loja vendem por catlogos, reembolso postal, telefone, canais
de compras pela TV, via internet, porta a porta, reunies de compras em casa e no
escritrio. Hoje, este tipo de venda corresponde, mais ou menos, 14% (KOTLER &
ARMSTRONG, 1997) de todas as compras dos consumidores. Certamente, com
9

impulso que vem tomando a internet e outros meios de mdia, esse percentual j chegou
em torno de 25 % ,aproximadamente.
Como exemplo de Varejo sem Loja pode-se citar:
1. Venda Porta a Porta: Pode-se destacar que mais de 600 empresas trabalham
com venda porta a porta nos EUA. Os pioneiros so: Electrolux (venda de
aspirador de p); empresas que vendem livros, como World Books; Avon,
no Brasil
1.1 Vantagens: convenincia para o cliente, pois recebe os vendedores em
sua prpria casa ou em reunies. Existe um lao de confiana com o
vendedor (relacionamento pessoal com os vendedores).
1.2 Desvantagens: Apresenta custos elevados para o treinamento,
remunerao e motivao de mo-de-obra. Devido aos avanos
tecnolgicos, os vendedores podem ser substitudos pelo telefone,
internet, carto de crdito e canais de TV.
1.2.1 Futuro Incerto: Devido quantidade de pessoas morando
sozinha, casais trabalhando e mulheres j empregadas, fica
difcil encontrar mo-de-obra e tempo para pessoas comprarem
os produtos.
1.2.2 Segurana: Devido aos altos ndices de violncia, as pessoas
no autorizam entrada de estranhos em sua residncia para
vender produtos. Isto dificulta bastante o acesso s donas de
casa que, com medo de assaltos, no abrem as portas.
2. Venda Automtica: A venda feita atravs de mquinas que disponibilizam
produtos de convenincia, como jornais, biscoito, revistas, refrigerantes ,
filmes e vdeo. As mquinas podem ser instaladas em escolas, empresas ou
shopping. Geralmente existe um acordo com a empresa que sede o espao e,
em troca, ganha uma porcentagem sobre as vendas.
3. Caixas automticos: Vendem os mesmos servios que os bancos: extrato,
saldos, retirada de dinheiro.
10

3.1 Vantagens: Encontram-se auto-servios 24 horas e menos produtos
danificados.
3.2 Desvantagens: Preos 15% a 20% mais caros, devido ao alto custo de
manuteno. Opes limitadas e dificuldade na devoluo dos
produtos.
1.5 Marketing Direto ou Marketing do Relacionamento
O Marketing Direto o uso de vrias tcnicas e processos de marketing que
visam aproximar a empresa de seus clientes e identific-los de forma individualizada,
com o objetivo de fixar a marca e criar servios adicionais que fidelizem a clientela,
tornando a vida til do consumidor maior do que o esperado, resultando,
conseqentemente, no aumento de vendas.
O Marketing Direto exige uma comunicao direta com consumidor. Tem-se
como funo, a conquista de nomes de pessoas e a manuteno do relacionamento
contnuo com as pessoas j conquistadas, no caso, os clientes.
1.5.1 A importncia do Marketing Direto:
cinco vezes mais barato manter um cliente do que adquirir um novo. Pesquisas
apontam que um pequeno percentual de clientes responsvel por um grande percentual
de vendas, por isso preciso identificar estes clientes especiais e dar um tratamento
compatvel com esta condio.
Com o Marketing Direto possvel transformar consumidores espordicos em
clientes fiis e fiis em defensores. So estes que iro defender sua empresa, mesmo
em situaes de crise.
Quem mais utiliza este tipo de servio?
Empresas que tenham o interesse de conhecer melhor seus clientes e que
queiram implantar, melhorar ou personalizar o relacionamento com seu pblico.
11

Importncia do tratamento individualizado a clientes: Conhecendo cada um dos
seus clientes, a empresa pode identificar suas necessidades e trat-los de forma
personalizada. Ignorar as diferenas de compra e comportamento, ou no saber quais
so, no as eliminam e no fazem com que os clientes tornem-se todos iguais e
igualmente satisfeitos.
Importncia da fidelidade do cliente: natural do comportamento do
consumidor experimentar novos produtos e servios, mudar de empresa ou fornecedor.
Satisfao no garante fidelidade, necessariamente. Clientes satisfeitos mudam desde
que no haja custo, perdas ou dificuldades nessa mudana. O que garante a fidelidade
a inconvenincia de mudar.
Banco de dados, o que tem a ver com o marketing direto?
a partir do banco de dados da empresa, que o marketing direto poder
identificar, quantificar e se comunicar da maneira mais eficaz com os clientes.
1.5.2 Formas de marketing direto
Muitos autores concordam que as principais formas de marketing direto so:
1. Mala direta: Resumidamente, envolve uma nica mala postal incluindo
cartas, amostras, anncios de produtos, folhetos. uma das melhores
maneiras que entidades assistenciais possuem para arrecadarem fundos
para suas obras. Esse mercado chegou a 35 bilhes de dlares, em 1993.
Acredita-se que nos dias de hoje j esteja na casa dos 65 bilhes de
dlares.
2. Marketing por catlogos: Como o prprio nome j diz, oferece produtos
e servios por catlogos. A grande vantagem dessa forma que se a
empresa possuir um banco de dados devidamente segmentado, poder ter
um lucro fabuloso. Nos Estados Unidos, cerca de 85 milhes de
catlogos so enviados anualmente, objetivando um pblico,
devidamente segmentado, de cerca de 170 milhes de clientes. Quase
toda a populao do Brasil referenciada pelo censo demogrfico de 2000.
12

3. Telemarketing: Tornou-se uma ferramenta extremamente importante nos
ltimos 10 anos. As empresas americanas despendem, atualmente, cerca
de 41 bilhes de dlares em ligaes telefnicas, oferecendo servios e
produtos. Segundo (KOTLER E ARMSTRONG, ibid.), a introduo das
ligaes grtis (toll-free) deu um grande impulso ao telemarketing.
4. Canais para venda direta: Programas voltados, nicos e exclusivamente,
para venda de produtos e servios.
5. Resposta direta de TV: O anunciante veicula o anncio, com uma
durao acima do normal, com o preo e o nmero de telefone. Quase
sempre um toll-free. Aps a veiculao, espera-se a resposta por parte
dos clientes. excelente para produtos, como: livros, CD,
eletrodomsticos e muitos outros.
1.6 Telecomunicaes no Brasil
1.6.1 Histrico
At os anos 50, as concesses dos servios de telecomunicaes, no Brasil, eram
distribudas pelos governos federal, estaduais e municipais, permitindo o surgimento e
expanso desordenada de empresas operadoras com custos onerosos e sem
compromisso com a qualidade. No final dessa dcada existiam, aproximadamente, 1000
companhias telefnicas, com grandes dificuldades operacionais e de interligao.
A aprovao pelo Congresso Nacional da Lei 4. 117, em 27 de agosto de 1962,
instituindo o Cdigo Brasileiro de Telecomunicaes, foi o primeiro passo para o
desenvolvimento ordenado das telecomunicaes no Brasil, acarretando a
transformao radical do panorama do setor, disciplinando os servios telefnicos e
colocando-os sob o controle da autoridade federal.
O Cdigo definiu a poltica bsica de telecomunicaes, a sistemtica tarifria e
o planejamento de integrao das telecomunicaes em um Sistema Nacional de
Telecomunicaes (SNT) e:
13

Criou o Conselho Nacional de Telecomunicaes, subordinado a
Presidncia da Repblica, com as atribuies de coordenar, supervisionar
e regulamentar o setor de telecomunicaes;
Autorizou a criao da EMBRATEL - Empresa Brasileira de
Telecomunicaes S/A, com a finalidade de implementar o sistema de
comunicaes a longa distncia, ligando, entre si, as capitais e as
principais cidades do Pas;
Instituiu o FNT - Fundo Nacional de Telecomunicaes, destinado a
financiar as atividades da Embratel.
Em 1967, foi aprovado o Decreto-Lei n. 200, que, entre outros dispositivos,
criou o Ministrio das Comunicaes.
No incio dos anos 70, o servio de telefonia de longa distncia apresentava um
bom nvel de qualidade, porm a telefonia urbana era deficiente. Como soluo, foi
autorizada a criao de uma sociedade de economia mista, atravs da Lei 5792, de 11 de
julho de 1972. Assim nascia a Telecomunicaes Brasileiras S/A - TELEBRS,
vinculada ao Ministrio das Comunicaes.
A Telebrs foi criada como uma empresa estatal, que seria controlada pelo
Ministrio das Comunicaes. A Lei que criou a Telebrs previa que ela incorporasse as
empresas prestadoras de servios, cujas licenas fossem expirando, e que ela pudesse
fazer, tambm, desapropriaes das empresas telefnicas privadas e transferir os ativos
para as suas subsidirias. A Telebrs foi criada como uma empresa holding, que tinha
por finalidade controlar uma operadora de cada estado do pas, alm de controlar a
Embratel.
A Embratel e a Telebrs representaram um papel importante na unificao e na
criao de uma rede bsica de telefonia para o pas. O processo de consolidao das
quase mil empresas que existiam anteriormente permitiu o alcance de grandes
economias de escala e a captao de recursos para investimentos no setor.
Ao final dos anos 80, este modelo estatal mostrava-se desgastado. O setor j se
encontrava em um ritmo acelerado de mudanas e precisava de agilidade para atender
crescente demanda por servios especializados. A Telebrs e suas subsidirias no
14

tinham condies de suprir estas necessidades, pois dependiam muito de decises
polticas do Ministrio das Comunicaes, o que fazia com que as mudanas fossem
sempre muito lentas e complicadas.
Em 1995, a Telebrs possua 13 milhes de linhas instaladas, controlando o
maior sistema de telecomunicaes da Amrica Latina e o 11 do mundo. Ela era um
holding puro, no exercendo nenhuma atividade operacional. As subsidirias da
Telebrs estavam divididas em vinte e seis operadoras, uma para cada estado, uma
operadora municipal e uma operadora de longa distncia, a Embratel.
Em 1997 foi aprovada a Lei Geral das Telecomunicaes, marcando a mudana
de postura do governo em relao ao setor de telecomunicaes. O Estado deixaria de
ser provedor dos servios de telecomunicaes e passaria a ser o rgo regulamentador
do setor. Os principais pontos desta lei eram a definio do princpio geral que rege os
servios de telecomunicaes, a criao da Agncia Nacional de Telecomunicaes
(Anatel), a organizao dos servios de telecomunicaes e a reestruturao e
privatizao do Sistema Telebrs.
Em abril de 1998 foi aprovada a ciso da Telebrs em doze companhias holding
e a data do leilo destas empresas foi marcada para julho. A privatizao do sistema
Telebrs, que antes era visto como algo praticamente impossvel, concretizou-se em
julho de 1998, s vsperas das eleies presidenciais. Na data prevista, em menos de
seis horas, todas as doze empresas j haviam sido leiloadas. O governo brasileiro
arrecadou, aproximadamente, US$19 bilhes, caracterizando a privatizao do sistema
de telecomunicaes brasileiro como uma das maiores de todo o mundo.
Logo aps a privatizao, foi introduzida a competio em cada rea de
concesso. Assim, a Anatel colocou em consulta pblica o edital de venda das
concesses das empresas que concorreriam com as recentemente privatizadas (as
chamadas empresas-espelho). Ocorreria, portanto, um duoplio entre 1998 e 2001, a
partir de quando no haveria mais nenhuma restrio quanto ao nmero de operadoras
de telefonia fixa e longa distncia em qualquer regio do pas.
15

1.6.2 Fase Atual do Mercado
Seis anos aps a privatizao do sistema Telebrs, a expectativa grande.
Do lado dos usurios, a esperada concorrncia no chegou, apesar da relativa
democratizao do acesso. O nmero de linhas mais do que triplicou de 27,7 milhes
(22,1 milhes fixos e 7,37 milhes de celulares, ao final de 1998) para 87,4 milhes
(49,4 milhes fixos e 38 milhes mveis em junho desse ano).
A competio, que poderia trazer o benefcio de preos mais justos para
consumidores e a possibilidade de diminuir a concentrao de empresas para os
investidores, s aconteceu na telefonia celular e na longa distncia.
Na telefonia fixa, a rivalidade ainda terica: a Telemar detm 97,5% das linhas
fixas na regio I (Norte/Leste) do Plano Geral de Outorgas. A Brasil Telecom
responsvel por 95,55% dos telefones instalados na regio II (Centro/Sul) e a Telefnica
ocupa 98,7% da regio III (estado de So Paulo).
Em nome do cumprimento das metas de universalizao, foram feitos vultosos
investimentos na telefonia fixa. Nos ltimos cinco anos, as empresas gastaram R$ 72,9
bilhes, a uma mdia anual de R$ 14,5 bilhes. O resultado, porm, decepcionou. No
total, 10,3 milhes de linhas ociosas, desligadas devido falta de capacidade da
populao de pagar pelo servio.
O nmero de linhas ativas alcana, ento, 39,1 milhes, pouco mais de um
milho acima da telefonia mvel.
justamente essa concorrncia, entre as fixas e as celulares, que promete ser o
pano de fundo dos prximos anos na telefonia.
De acordo com o suplemento da Pesquisa Anual de Servios Produto
divulgado pelo IBGE, o processo de inverso da importncia entre os setores j
comeou. A telefonia fixa gerou 34,1% da receita das empresas de telecomunicaes em
2001 (R$ 17,3 bilhes), contra 39% do ano anterior. J a telefonia celular registrou
participao de 24,3% (R$ 12,4 bilhes), contra 20,4% de 2000.
16

Para alguns analistas, porm, essa tendncia no ameaa a hegemonia das
empresas de telefonia fixa. A telefonia fixa no chegou a lugares onde no rentvel
chegar, dada exigncia por cabeamento. Por isso, o mercado do centro-oeste forte
em telefonia celular. Para a telefonia fixa chegar, mais difcil. E, sendo uma regio
com PIB alto, graas forte produo agrcola, a Tele Centro Oeste Celular sempre
registra balano com crescimento.
O que muda, vencidos os primeiros cinco anos da privatizao, a possibilidade
de venda das empresas fixas para novos participantes, ou players. A fuso entre as
empresas fixas j existentes s ser possvel, no entanto, mediante mudanas na Lei
Geral das Telecomunicaes (LGT, a Lei 9.472, de 16 de julho de 1997). As limitaes
atuais afastam os rumores especulados pelo mercado de fuso entre Brasil Telecom e
Telemar, por exemplo.
Alm disso, empresas que prestam o mesmo servio na mesma regio no
podem ter o mesmo controlador. Assim, a Brasil Telecom no pode adquirir a Global
Village Telecom (GVT), nem Telemar e Telefnica podem adquirir o controle da
Vsper nas suas reas de atuao.
De fato, os controles de Telemar, Brasil Telecom, Telefnica e Embratel passam
a ser alvos de grandes investidores estrangeiros. No caso da Embratel, a especulao
grande desde que a Telfonos de Mxico (Telmex), controladora do grupo Telecom
Amricas (Amrica Mvil), manifestou interesse em fazer novas aquisies na Amrica
Latina. A empresa mexicana adquiriu papis da dvida da MCI, controladora da
Embratel.
J esto praticamente definidos os players que vo continuar, fora a Telmex na
Embratel. No se v a possibilidade de um novo entrante a curto prazo. Se a deciso
final a respeito dos reajustes for a manuteno do IPCA, no lugar do IGP-DI, significar
quebra de contrato. Isso, para o investidor estrangeiro, difcil de aceitar.


17

CAPTULO 2
Customer Relationship Management (CRM)
2.1 Introduo
Embora mundialmente utilizado, o termo CRM nunca foi formalmente definido.
Assim, muitos fornecedores, aproveitando o movimento do mercado nessa direo,
chamam suas aplicaes de CRM (as mesmas que j existem h algum tempo).
Pode-se dizer que CRM a infra-estrutura para implementar-se a filosofia one-
to-one
3
(um a um) de relacionamento com os clientes. Segundo o Gartner Group,
CRM uma estratgia de negcio voltada ao entendimento e antecipao das
necessidades dos clientes atuais e potenciais de uma empresa.
Do ponto de vista tecnolgico, CRM envolve capturar os dados do cliente ao
longo de toda a empresa, consolidar todos os dados capturados interna e externamente
em um banco de dados central, analisar os dados consolidados, distribuir os resultados
dessa anlise aos vrios pontos de contato com o cliente e usar essa informao ao
interagir com o cliente atravs de qualquer ponto de contato com a empresa.
Os sistemas tradicionais geralmente so concebidos ao redor de processos ou de
produtos onde o cliente meramente um mal necessrio. Nos sistemas e processos que
so concebidos luz do CRM, o cliente o centro, e todos os relatrios e consultas tm
o cliente como porta de entrada.
Existe uma tendncia clara da migrao do foco em produtos para o foco em
clientes. Cada vez mais as empresas se organizam em funo dos vrios tipos de
clientes que possuem. Essa organizao permite a diferenciao dos clientes.
Primeiramente pelas necessidades dos vrios tipos de cliente e depois, por suas
necessidades individuais.
A melhor forma de se testemunhar essa mudana visitando os sites das
empresas na Web. Mais e mais se verifica que os sites esto mudando seus menus da

3
Marca registrada de Peppers and Rogers Group

18

orientao a produtos para a categorizao por tipo de cliente e/ou necessidade. Isso
facilita, de certa forma, o acesso a informaes e ofertas pertinentes s necessidades dos
clientes e tambm facilita o aprendizado da empresa a respeito das necessidades de seus
clientes.
Do ponto de vista dos sistemas, CRM a integrao dos mdulos de automao
de vendas, gerncia de vendas, telemarketing e televendas, servio de atendimento e
suporte ao cliente (SAC), automao de marketing, ferramentas para informaes
gerenciais, Web e comrcio eletrnico.
No se pode esquecer da integrao de todas essas aplicaes com os sistemas
de ERP ou com os sistemas transacionais, tambm chamados de sistemas de back office.
O crescimento e a qualidade da receita so os objetivos das organizaes e, por
isso, hoje CRM mais importante do que nunca, devendo, por esse motivo, ser
incorporado viso da organizao.
Pode-se concluir, ento, que CRM tem a ver com a captura, processamento,
anlise e distribuio de dados, com a total preocupao com o cliente e isso permitir
que a empresa venda mais seus produtos ou oferea produtos mais eficientes.
Talvez o dado mais revelador seja a expectativa de alta integrao entre as reas
de negcios (marketing, vendas, etc.) com a rea de tecnologia de informao (TI). Sem
dvida, impossvel implementar sistemas de CRM sem essa integrao. Essas reas no
passado eram quase que inimigas, com total divergncia de propsitos. Hoje, nas
empresas mais competitivas, cada vez mais se verifica a preocupao da rea de TI em
ser um meio para a realizao dos objetivos de negcio da empresa.
2.2 Arquitetura de um modelo de CRM
Poucas empresas, hoje, esto investindo na infra-estrutura necessria
implementao de sistemas de CRM, ver figura 2.1. Entretanto, sem essa estratgia
todos os outros esforos so nulos.
19


Figura 2.1: Diviso e classificao para CRM

CRM Analtico: Sua funo determinar quais so os clientes que devem ser
tratados de forma personalizada e quais os que devem ser deslocados para nveis de
prioridade inferior.
CRM Operacional: Foco da maioria das empresas. Sistemas, como
automatizao da fora de vendas, centros de atendimento a clientes (call - centers),
sites de comrcio eletrnico e sistemas automatizados de pedido. No que no seja
importante, mas muitas vezes essas iniciativas tm pouco ou quase nada a ver com as
necessidades ou com a convenincia do cliente. O objetivo racionalizar e otimizar
processos da empresa. claro que, quando bem implementadas essas iniciativas podem
trazer agilidade ao atendimento, o que pode, em ltima anlise, traduzir-se em benefcio
para o cliente, mas, na sua maioria, envolve mtricas que nada tm a ver com isso.
Para melhor ilustrao, pode-se usar o exemplo dos call centers. Tais servios
tm a ver com o tempo de cada ligao, quantidade de ligaes no atendidas, chamadas
20

por agente, chamadas especficas, entre outros. Porm, falta grande maioria das
empresas adicionar a tal servio o conceito da mais-valia, direcionando a clientes mais
preciosos tratamento diverso do oferecido a outrem menos valioso, claro, sem deixar de
oferecer o servio adequado a este.
CRM Colaborativo: a aplicao da tecnologia de informao que permite a
automao e a integrao entre todos os pontos de contato do cliente com a empresa.
Esses pontos de contato devem estar preparados para interagir com o cliente e
disseminar as informaes levantadas para os sistemas do CRM Operacional.
2.3 A Estratgia de CRM
Segundo Peppers e Rogers (1999), existem quatro estratgias bsicas do CRM:
Identificar os clientes, diferenciar os clientes, interagir com os clientes e personalizar o
relacionamento.
2.3.1 Identificar
A fim de iniciar uma relao um a um com seus clientes, necessrio,
primeiramente, identificar cada um deles, ou seja, conhecer sua identidade, forma de
contato preferida, todas as transaes e interaes realizadas com a empresa, todas as
reclamaes feitas e quais foram as providncias tomadas, conhecendo cada cliente e
sua histria, de forma individual. A relao um a um no para todos os clientes,
entretanto, sem identificar cada um deles impossvel saber quais so os clientes que
devero receber este tratamento diferenciado.
Com o intuito de implementar iniciativas um a um, at mesmo em negcios onde
a identificao do cliente no exigida, necessrio incentivar o cliente a identificar-se,
em outras palavras, pagar para que ele diga quem . Isso feito atravs de Programas
de Fidelidade, que na realidade deveriam ser chamados de Programas de Freqncia,
j que visam, atravs de algum tipo de atrativo, fazer com que o cliente se identifique
cada vez que realiza uma transao com a empresa.
21

2.3.2 Diferenciar
Logo aps a identificao, fundamental diferenciar os clientes para saber com
quais clientes vale a pena desenvolver uma relao de aprendizado. Os programas de
fidelidade no podem parar na simples expectativa de que os clientes sero fiis, porque
seus prmios so interessantes. necessrio acumular e estudar os dados transacionais
dos clientes para aprender com eles, tais como: Histria e transaes, receita e
lucratividade, reclamaes, canal de comunicao preferido, momento da vida, valor
real, potencial e estratgico, potencial de crescimento e risco.
Tais dados devem ser disponibilizados em todos os pontos de contato do cliente,
evitando com isso, que se faam as mesmas perguntas novamente.
Os clientes so diferentes em seu valor para a empresa e em suas necessidades.
Ignorar ou desconhecer essas diferenas no os tornam iguais.
O objetivo da diferenciao de clientes encontrar os clientes de maior valor
(CMV) e os clientes de maior potencial (CMP).
Quando fala-se de valor, deve-se sempre pensar em Valor Vitalcio, ou
Lifetime Value (LTV), que o valor que o cliente tem em toda sua histria transacional
com a empresa, as referncias que ele fez e que se transformaram em vendas, entre
outros. Deve-se sempre exprimir valor em termos de lucratividade. Portanto, a receita,
apesar de ser uma das mtricas mais utilizadas, no a mais adequada. Deve-se,
tambm, medir quanto custa para atender cada um dos clientes, pelo simples fato de que
os custos so diferentes de cliente para cliente.
A forma objetiva de medir LTV saber quantas vezes o cliente comprou ou
utilizou servios de um concorrente. claro que se o cliente compra com uma empresa,
mas tambm compra com concorrentes, este tem um potencial a ser desenvolvido pela
empresa. O valor real dividido pelo valor potencial equivale participao no cliente.
Outro tipo de valor, menos tangvel, o chamado valor estratgico. Ele no
medido, mas interpretado. Clientes que colaboram com a empresa com reclamaes,
sugestes, permitem e so usados como referncia, por exemplo, so clientes que tm
um valor distinto dos clientes que simplesmente so passivos. Embora seja difcil, esse
22

valor deve ser interpretado e armazenado na base de dados de clientes. Por ser
interpretado, o valor estratgico tem de ser refinado ao longo do tempo, medida que se
aprende mais a respeito dos clientes.
Resta agora, saber como se deve tratar os clientes que do prejuzo e no h
perspectiva de lucratividade para a empresa, aqueles chamados below zeros. A eles,
deve-se cobrar o valor real dos servios prestados e ainda suprimir seus nomes das listas
de mala direta e de outras iniciativas de contato, sem, entretanto, eliminar seus nomes
da base de dados. Em resumo, deve-se atend-los, cobrando o valor dos servios.
2.3.3 Interagir
Aps a descoberta dos clientes de maior valor e clientes de maior potencial o
prximo passo incentiv-los a interagir com a empresa. A interao a nica forma de
conhecer cada vez mais os clientes. O objetivo final desenvolver uma relao de
aprendizado, onde cada vez mais os servios e produtos so personalizados para o
cliente que ver convenincia em continuar fiel empresa. H uma relao ntima entre
a interao e a diferenciao. Na realidade, essas duas estratgias caminham juntas, pois
uma depende da outra.
Quando os clientes iniciam as interaes, elas tm um potencial muito maior que
as interaes iniciadas pela empresa. claro que quando o cliente liga para o call -
center, ele est em busca de atendimento e de algum servio. Nesse instante, ele est
disposio da empresa, com total ateno e essa uma excelente oportunidade para se
conhecer melhor o cliente.
Deve-se prestar bastante ateno quando for feita uma pergunta ao cliente, que
deve ver algum valor em respond-la, no se deve tentar vender nada que no tenha a
ver com as necessidades do cliente.
Cada nova pergunta respondida conhecimento acumulado a respeito do cliente
e os funcionrios que tm contato com o cliente devem ser treinados e incentivados a
conhecer melhor seus clientes e a registrar esse conhecimento nos bancos de dados de
clientes da empresa.
23

Quando a interao iniciada pela empresa, ela deve obedecer a duas regras
bsicas: deve utilizar o canal de comunicao preferido do cliente e deve ter a permisso
do cliente para utilizar esse canal. Uma mensagem da empresa enviada por correio
eletrnico a seus clientes, sem que eles tenham dado permisso, pode gerar uma
antipatia e fazer com que o cliente simplesmente feche esse canal de interao. Alm
dessas regras bsicas, as mensagens devem ter algo de valor para o cliente. Se apesar de
ter autorizado esse tipo de interao, insistentemente forem enviadas mensagens sem
nenhum contedo de valor, o cliente pode tambm cancelar a autorizao e nunca mais
abrir esse canal de comunicao.
2.3.4 Personalizar
Em relao a personalisar o tratamento do cliente, pode-se verificar a citao de
Peppers e Rogers (idem)
A partir do conhecimento das necessidades dos clientes, a
empresa deve personalizar os servios e produtos para fazer com
que a experincia de fazer negcios com a empresa seja nica.
Quando mais personalizada, mais valor entrega-se ao cliente, que
v convenincia em continuar com a empresa.
Criando um ciclo de personalizao e feedback, isso permitir
que cada vez mais se possa, entendendo o cliente, fornecer o que
ele espera e na forma que ele espera. Deve-se, ainda, adequar a
mensagem e o dilogo forma preferida pelo cliente. A
personalizao algo bem simples quando se conhecem as
necessidades e as preferncias do cliente, mas exige flexibilidade
da empresa e treinamento adequado das pessoas que tm contato
com o cliente. Elas devem estar preparadas para mudar seu
comportamento de acordo com cada cliente.
Se a empresa possui um site, a personalizao pode ser levada ao
extremo, com a disponibilizao de contedo que tenha a ver
exatamente com os gostos e preferncias de cada um de seus
clientes. Porm, importante ressaltar que o cliente espera essa
personalizao em todos os canais de contato com a empresa.
(Grifo nosso)
Quanto mais sucesso se tiver na personalizao, mais simples e conveniente para
o cliente fazer negcio com a empresa.
24

2.4 Implantando Sistemas de CRM
Apesar da implementao de sistemas de CRM no ser diferente da
implementao de outros sistemas de abrangncia corporativa, ela tambm pode falhar
ou ter problemas srios.
Essas falhas podem ser causadas pelo foco excessivo em tecnologia, aplicaes e
pouca preocupao com outros detalhes. No caso de iniciativas de CRM, o principal
detalhe o cliente.
O fato que o que est ao redor da maioria dos projetos de CRM pouco tem a
ver com o cliente. A empresa sempre est preocupada, inicialmente, em reduzir seus
custos ou em fidelizar o cliente, porque assim fica melhor e mais barato para a empresa.
A empresa no percebe o foco necessrio que seriam os benefcios para o cliente e estes,
conseqentemente, levariam os benefcios para a empresa.
Benefcios, estes que facilitariam os negcios com sua empresa, tais como:
acesso a informaes de melhor qualidade, facilidade de compra e de comunicao com
a empresa, economia de tempo e de dinheiro, eliminao de solicitaes de dados
redundantes, etc.
CRM tem a ver com um conceito mais profundo: cada cliente distinto,
diferente e deve ser tratado de forma diferente.
A implementao de projetos de CRM deve sempre ter como princpio bsico a
mudana nos processos que envolvem o cliente, ou seja, ver a empresa com os olhos
crticos dos melhores clientes. Sem isso, no se est implementando CRM e sim, mais
um pacote de software.
2.5 Reteno do Cliente
Em uma pesquisa realizada em 1987, pelo The Forum Group, empresa de
consultoria americana especializada em administrao, funcionrios de empresas
americanas e canadenses declararam que atrair clientes era considerado uma prioridade
25

em seus locais de trabalho, duas vezes mais importante do que conservar os que j
existiam. Esse pode ser um erro bem dispendioso.
Kotler & Armstrong (1997,p. 396-397), recomendam que seja dado um cuidado
todo especial com a perda de clientes. As perdas de clientes trazem grandes prejuzos s
organizaes e exigem medidas para reduzir o ndice de desero.
O motivo da perda de consumidores deve ser investigado, procurando-se corrigir
os rumos a fim de estancar o abandono. No h muito o que fazer com os clientes que se
mudaram, porm clientes que deixaram de comprar na empresa por motivo de
insatisfao so recuperveis, desde que se procure solucionar o problema atravs do
dilogo .
Atualmente, as empresas de maior destaque envidam todos os esforos para
manter seus clientes. Muitos mercados atingiram a maturidade e no h muitos clientes
novos para se captar. A competio cada vez maior e os custos para atrair novos
clientes sobem cada vez mais.
Um marketing agressivo custa mais do que um marketing defensivo, pois exige
um enorme investimento para afastar os clientes satisfeitos dos concorrentes e ganh-los
para a empresa (KOTLER & ARMSTRONG, ib.).
Segundo McKenna (1991), Reter clientes uma tima maneira de crescer.
Estudos mostram que o preo para adquirir novos clientes cinco vezes maior do que o
custo para reter clientes antigos.
de grande importncia acompanhar os clientes atuais. Reduzir o xodo de
clientes, at mesmo em 5% ao ano, provoca um crescimento nos lucros de at 85%. Na
rea de seguros, segundo a Life Insurance Marketing and Research Association, os
segurados mais antigos tm 50% mais chances de manter suas contas ativas do que os
recm-chegados . Corretores que se mantm em contato com seus melhores clientes
fazem novos negcios e tm menores probabilidades de fracassarem em suas tentativas
de vendas cruzadas. Outras empresas tambm podem se beneficiar.
Quanto mais antiga a relao com o cliente, melhor. Dados do escritrio de
consultoria Bain & Co, com sede em Boston, indicam que o lucro de 10%, resultante da
26

relao de um ano com um cliente, poder crescer at 60% quando se prolongar por
mais de sete anos.
Clientes fiis por muitos anos so mais propensos a recomendar a organizao
que os serve famlia e aos amigos. O mundo atual oferece inmeras opes aos
clientes. No setor de cartes de crdito, por exemplo, reduzir a desero de clientes em
apenas 20% significa o mesmo para o resultado final do que 10% de corte nos custos.
Desta forma, observar o processo de reteno fundamental e representa uma
fatia importante no processo de sobrevivncia da empresa. O gerenciamento do
relacionamento um processo assentado em trs pilares:
Do conhecimento refere-se quantidade e profundidade de informao
que se deve ter do cliente (CRM-Analtico).
Da tecnologia para colher e analisar informaes que permitam agilidade
na tomada de decises (CRM-Operacional).
Da construo do relacionamento - atravs da comunicao eficaz (CRM-
Colaborativo).
Os dois primeiros pilares podem ser resolvidos com uma certa tranqilidade.
Basta o empresrio cercar-se de fornecedores com competncia comprovada no assunto,
buscando referncias de empresas, bibliografias e participando de congressos , cursos e
eventos. O gargalo est no terceiro pilar, o da construo de relacionamentos. A
empresa precisa de gente treinada e motivada, pois relacionamento pressupe,
naturalmente, contato pessoal entre o representante da empresa e o cliente.
Investir em tecnologia... Sim.
A equipe tem que estar bem preparada para estabelecer relacionamentos com o
cliente baseado na confiana, uma vez que medir resultados obtidos pelas aes do
relacionamento com o cliente fator de sobrevivncia.
Por fim, h uma relao direta entre a taxa reteno de clientes e a mdia de seu
tempo de vida (LTV). Calcular o valor do tempo de vida de um cliente requer uma
estimativa do fluxo de caixa que o cliente deve proporcionar, caso atinja o nvel mdio
27

de fidelidade. Em outras palavras, se uma conta dura em mdia dez anos, preciso
calcular o valor atual lquido dos lucros que fluram desse cliente por mais de dez anos.
Assim, possvel calcular o impacto que o aumento da taxa de reteno de clientes teria
sobre a rentabilidade e, tambm, qual o efeito do aumento de tempo de vida de um
cliente. Essas informaes oferecem uma base segura para as tomadas de deciso
relacionadas a investimento de marketing. A figura, correspondendo a funo
matemtica (equao 1), abaixo, ilustra a relao entre a taxa de reteno e o tempo de
vida do cliente.
reteno de taxa
LTV
1
=
1 (eq. 2.1)


Figura 2.2: LTV versus taxa de Reteno
28

CAPTULO 3
ANLISE DE ATRITO
3.1 Definio
Estudar sobre churn extremamente importante, pois grande parte das
organizaes, telecomunicaes e informtica esto sob a mesma responsabilidade. E, a
cada dia que passa, fica mais difcil separ-las. Mas afinal, o que o churn?
Na informtica, churn utilizado, por alguns autores, para expressar a renovao
acelerada dos produtos ou a conhecida obsolescncia programada. Mas o churn, objeto
deste estudo, que tem como base o marketing, trata da perda de clientes sofrida por uma
empresa para a concorrncia, ou seja, uma medida da infidelidade dos clientes. Este
o conceito que est mais em pauta entre as empresas de telecomunicao ou em
qualquer outra empresa de servios. No Brasil, com a desregulamentao que as
telecomunicaes sofreram, este um dos setores que mais vive este fenmeno.
Outros setores da economia tambm tm que administrar o churn. Os bancos e
as administradoras de carto de crdito so dois exemplos bem conhecidos. Para os
consumidores, esta vasta gama de opes significa maior liberdade de escolha. Portanto,
seja na telefonia fixa, mvel, comunicao de dados ou internet, podem mudar de
fornecedor com facilidade.
Conseqentemente, os fornecedores trataro de traar estratgias especficas, de
acordo com o comportamento dos consumidores e tero que ir mais longe, atingindo
nveis maiores de segmentao e diferenciao, para alcanar seu objetivo de fidelidade.
Aplicaes de business intelligence e Customer Relantionship Management (CRM) so
estratgias para tais indstrias.
Para os consumidores, isso significa uma vitria. Hoje, podem comparar
propostas, exigir um tratamento de qualidade, ter um suporte e assistncia tcnica cada
vez melhores.
29

3.2 Causas do Churn
H trs tipos de churn: involuntrio, voluntrio e inevitvel.
Involuntrio - quando o usurio deixa de pagar pelo servio e tem seu
fornecimento cancelado. Os motivos pelos quais o cliente deixa de pagar podem ser os
mais diversos , como desemprego, falta de capital suficiente para se manter entre outros.
Voluntrio - quando o cliente decide mudar de fornecedor, seduzido por
campanhas de marketing e/ou promoes.
Inevitvel - quando o usurio vem a falecer ou muda-se para uma localidade no
atendida pelo fornecedor.
At h pouco tempo atrs, a cultura das empresas era conquistar o cliente a
qualquer preo. Atualmente, a cultura reter o cliente e, claro, conquistar o bom
cliente. Conquistar um cliente do tipo alta-rotatividade, com propenso compulsiva ao
churn pode no ser um bom negcio; melhor deix-lo com a concorrncia.
provado que o custo para se manter um cliente muito menor que o de se
conquistar um novo cliente. Para se evitar o churn, empregam-se ferramentas de
minerao de dados e estatstica multivariada. Estas ferramentas permitem que se
analise o banco de dados com informaes do perfil histrico de cada usurio e que se
determine quais clientes so leais, quais so propensos ao churn e quais so realmente
de alto valor para a empresa.
Com base nessas informaes, a empresa toma atitudes no s reativas, em
relao aos clientes que desistiram do servio, mas, principalmente, aes pr-ativas, ao
identificar os bons clientes e selecionar planos especiais para garantir sua fidelizao,
evitando, com isso, a evaso dos clientes que agregam altos valores para a empresa.
No se pode assumir automaticamente que uma taxa de churn alto ruim, bem
como uma taxa de churn baixa boa. Tudo depende do teatro de guerra onde se est
travando a luta de mercado. Em mercados altamente competitivos ou em transio,
quando se deseja manter uma participao elevada na publicidade, o churn alto pode ser
o custo de tal estratgia.
30

O baixo churn tambm deve ser considerado no contexto estratgico.
lucrativo, mas pode significar pouca agressividade de marketing, revelando-se (ou no)
prejudicial em longo prazo, j que tende a inibir a entrada de novos consumidores para
cobrir os cancelamentos naturais ao longo do tempo.
3.3 Implicaes
Atualmente, a anlise de churn tem se tornado um desafio para empresas de
vrios ramos, porm poucas reconhecem suas reais implicaes. O setor de
Telecomunicaes o pioneiro na busca por ferramentas e sistemas que ajudem nessa
anlise.
Como feita a anlise do churn? Basicamente, a anlise de churn uma anlise
de dados histricos que permite prever que clientes podero vir a deixar a empresa, com
tomada de aes, por parte da empresa, que evitem esse churn. Na maior parte dos
casos, o estudo concentra-se no comportamento e /ou perfil do cliente.
Quando se diz que a taxa de churn de uma empresa varia de 25% a 30%
anualmente, deseja-se realmente dizer que essa empresa est perdendo de 25% a 30%
dos clientes que se encontram na sua base de dados. Isso significa que ela est perdendo
clientes que fazem ou j fizeram negcios com ela e que, por algum motivo, no
ficaram satisfeitos e evadiram de sua base de dados.
Isso levanta dois pontos. O primeiro ponto que a anlise de churn tem que ser
detalhada o suficiente para descobrir as variveis que fazem com que esses clientes
insatisfeitos evadam-se e o porqu da insatisfao.
O problema dessa anlise que o volume de dados a ser analisado muito
grande e, normalmente, o banco de dados dessas empresas muito extenso, o que
dificulta ainda mais o acesso s informaes e consolidao dessas informaes num
sistema de maneira eficiente e rpida.
Aliado ao problema de volume de dados, tem-se, tambm, o problema da falta
de conhecimento, tanto terico quanto tcnico, por parte das empresas. A maioria das
31

empresas no possui o mnimo de conhecimento em explorao de dados e anlise
estatstica, pr-requisitos importantes para poder prever o churn. Uma vez descobertas
as variveis, as empresas podem tomar as devidas aes para evitar o churn.
Outro ponto que muitos desses clientes so clientes que tm um grande
potencial de gasto com a empresa. Portanto, so clientes valiosos que a empresa est
perdendo e que, provavelmente, nunca voltaro. Uma anlise detalhada do churn
permite s empresas determinarem aqueles clientes que apresentam um comportamento
que indica que eles podem se tornar churners e quais desses churners so clientes
que merecem uma ateno especial [CISTER e EBECKEN, 2002]. Essas informaes
contribuem para que as empresas melhorem os seus programas de fidelizao dos
clientes e reduzam os seus custos em marketing, uma vez que h queda no crescimento
do mercado e a alta competitividade.
Com o aquecimento da competio, operadoras de telefonia buscam, nas
solues de CRM, os caminhos para engordar a carteira de clientes e aumentar suas
receitas.
Com a abertura e a desregulamentao que as telecomunicaes sofreram,
mundialmente, este um dos setores que mais vivem o fenmeno churn. Outros setores
da economia j aprenderam a administrar o "churn" h tempos. Os bancos e as
administradoras de carto de crdito so dois exemplos bem conhecidos.
No Brasil, os clientes ainda no tm a mais vasta gama de opes, porm j
comeam a sentir a liberdade de escolha. Seja na telefonia fixa, mvel, comunicao de
dados, Internet, etc., troca-se de fornecedor com facilidade.
A grande migrao para os provedores de Internet gratuitos um exemplo
recente dessa facilidade. Muitas pessoas usam um "web-mail" para escolher e trocar de
provedor de acesso quando quiser e, como o comportamento das pessoas e das
corporaes diferente, os fornecedores vo traar estratgias especficas. Eles tero
que atingir nveis maiores de segmentao e diferenciao, para alcanar seu objetivo de
fidelidade. Os clientes devem se preparar para serem alvos de planos de marketing
bastante ousados.
32

Com isso, o cliente tem muito o que comemorar, pois viveu anos e anos sem
opes, com poucas empresas oferecendo produtos e servios to essenciais. Hoje se
pode comparar propostas, exigir um tratamento de qualidade, ter um suporte e
assistncia tcnica cada vez melhores. Muitos ainda tm contratos antigos e vnculos
fortes, mas, com o tempo, essa inrcia deve ser superada.
A possibilidade de uma migrao fcil manter os fornecedores em estado de
alerta. E, se mesmo assim, houver algum problema srio, seja de natureza tcnica ou
econmica, ou ainda por qualquer desgaste na relao, a resposta do cliente tem grandes
chances de ser: Adeus. Nesse caso, o maior desafio das empresas ser o de segurar e
manter o seu cliente na sua base de dados.
Hoje, a palavra relacionamento, ou seja, conhecer o usurio e possuir
alternativas de solues para ele. Antigamente, o atendimento se resumia, apenas, na
recepo ao cliente. Esse tipo de iniciativa, cujo objetivo aperfeioar os canais de
atendimento, representa apenas um dos elementos que compem uma poltica de CRM.
A primeira corrida das operadoras envolveu as centrais de atendimento devido s
exigncias da Anatel e, por isso, elas passaram a associar CRM somente ao call center.
Iniciar um projeto abordando os canais de atendimento timo, mas se no houver a
noo do todo, ele se torna ineficiente.
H dez anos, o call center era uma central de reclamaes e, agora, comea a
evoluir para um servio de interao. Uma postura como essa pode auxiliar as
operadoras a reduzir o nmero de queixas nos Procons. Quando a companhia estabelece
boa relao com seu cliente, em caso de algum problema, ele vai procurar os canais da
empresa antes de buscar os rgos de defesa do consumidor.
A integrao dos sistemas , portanto, um ponto-chave para o sucesso das aes
de CRM.
No Brasil, aproximadamente, um a cada oito projetos, no alcana bons
resultados. Os aspectos que exigem cuidado so a interligao com as diversas
arquiteturas da companhia e a personalizao do produto. O principal problema na
adoo dos processos de CRM a falta de iniciativas internas para a integrao entre os
canais de marketing, vendas e servios e, principalmente, entre os sistemas de back
office e front office das corporaes. Por isso, o foco das operadoras, hoje, a
33

integrao. Elas ainda no possuem arquiteturas interligadas, especialmente em funo
dos sistemas legados, gerando tambm perda operacional.
Mas os benefcios do CRM no se limitam conquista e reteno de clientes.
Eles tambm se traduzem em reduo de custos e aumento da receita mdia por
assinante. Com o conceito, a companhia economiza, porque atira no alvo certo. Alm
disso, a guerra de preos apresenta alguns limites, por isso, o diferencial ser o
atendimento.
As operadoras comearam a perceber a importncia dessa ao, principalmente
as de telefonia mvel. H uma certa acomodao por parte das prestadoras de servios
de linhas fixas e isso ocorre devido falta de concorrncia. Com o aumento da
competitividade, esse quadro ser alterado e todas correro em busca de solues de
CRM.
A previso de que, provavelmente, os clientes mudaro de fornecedor e a
determinao de incentivos eficazes, do ponto de vista de custo, para persuadi-los a
continuar so iniciativas muito difceis para a maioria das empresas de
telecomunicaes. Os volumes de dados necessrios so muito grandes, dependendo da
operadora, e, freqentemente, difceis de acessar e consolidar por meio de ferramentas
convencionais. Muitas razes levam um assinante a abandonar sua operadora de
telecomunicaes. Os custos para se conquistar um novo cliente j foram razoavelmente
dimensionados por estas empresas. Mas na telefonia fixa uma incgnita. Os business
plans das operadoras locais j esto sendo modificados para adicionar mais um campo
de custos: o custo do churn. Isto significa, a mdio prazo, uma diminuio da margem
de lucro operacional das empresas de telefonia local.
Alguns clientes buscam servios de melhor qualidade, novas tecnologias ou
servios avanados. Uma grande maioria procura as melhores tarifas, pois a tendncia
que cada dia haja menor diferenciao quanto qualidade de servio entre as
operadoras de telecomunicaes. Outros assinantes, simplesmente, mudam de
operadoras por no poderem pagar suas contas, clientes inadimplentes que do origem
ao churn involuntrio. Alguns so seduzidos por campanhas de marketing, promoes e
uma infinidade de prmios, at mesmo em dinheiro, pelas operadoras. Os trs ltimos
tipos de clientes so, efetivamente, os grandes responsveis pelo churn.
34

Do ponto de vista do consumidor brasileiro, que passou anos sem opes com
poucas empresas oferecendo produtos e servios to essenciais, a comemorao
inevitvel. Hoje, possvel comparar propostas e exigir um tratamento de qualidade,
sem falar no suporte tcnico cada vez melhor. verdade que muitos consumidores
ainda tm contratos antigos e vnculos fortes, mas, com o tempo, essa inrcia dever ser
superada. A possibilidade de uma migrao mais fcil manter os fornecedores em
estado de alerta. Se o consumidor tiver algum problema de natureza tcnica, econmica
ou, ainda, desgaste na relao (cliente-empresa), a deciso de deixar a empresa ser
muito mais fcil.
Predizer que provvel que clientes saiam e persuadir os "churners" a
permanecerem empreendimento extremamente difcil para a maioria das companhias
de telecomunicaes. Os volumes de dados necessrios so enormes e, freqentemente,
os data-marts foram segmentados para que cada setor possa ver seu cliente de uma
maneira, tornando a consolidao dos dados difcil. E o que faltando para muitas
organizaes se adequarem a essa nova postura do consumidor , simplesmente, a
percia para suportar a minerao complexa dos dados e as tarefas de anlise preditiva,
que so essenciais no churn.
A implementao do projeto, que demandou a estruturao de um departamento
de anlise, trabalhou no lanamento do Business Highway, que, voltado para os
pequenos negcios, oferece trs nmeros telefnicos em uma s linha. Dados sobre
clientes - alvo para o produto que estava espalhado entre diversos departamentos, o que
exigiu sua integrao em um novo data mart.
Comeou, ento, a fase de anlise e modelagem dos dados, na qual
identificaram-se questes relativas qualidade, e a equipe familiarizou-se com a
distribuio dos dados, eliminando atributos que no estavam fortemente vinculados
compra do Business Highway. No jargo do profissional que trabalha com banco de
dados, significa normalizar a base de dados, gerando chaves estrangeiras, possibilitando
uma maior facilidade na obteno dos dados, que se encontram em banco de dados
relacionais e/ou voltados para objetos. Dessa forma, um simples query, atravs de uma
linguagem apropriada (SQL), permite aos funcionrios levantarem a informao
necessria e a medirem a fora de cada atributo individual com relao propenso do
cliente - alvo de comprar o produto.
35

Depois da anlise, o time rapidamente construiu e testou uma srie de modelos
experimentais, a partir das rvores decisrias, e ofereceu aos departamentos de
marketing e vendas uma lista com os "melhores prospects", facilitando a identificao
dos clientes com maior potencial de rentabilidade e, tambm, aqueles que exigem muita
ateno, apesar de comprarem pouco. No futuro, a companhia poder buscar a definio
de padres indicadores de tendncia a churn.
3.4 Modelo Preditivo de Churn
A transformao de informao em conhecimento baseada em tcnicas
estatsticas. A informatizao dos setores de servios gerou grandes bases de dados, mas
a disponibilizao desta informao no significou, necessariamente, maior
conhecimento e qualidade nos servios.
Na era do conhecimento, a estatstica e a minerao de dados possuem papel
importante, alm de serem ferramentas poderosas, e passam a ser vistas como um
poderoso mtodo de gesto. O foco da qualidade est em constante evoluo. Passaram
a era dos produtos, dos processos, dos clientes. Hoje, o foco passa a ser o conhecimento
atravs de uma abordagem mais abrangente.
Os modelos matemticos so adotados sistematicamente no meio acadmico,
auxiliando na validao de hipteses, principalmente, no processo de induo. O
objetivo dos modelos matemticos tornar a pesquisa cientifica a mais eficiente
possvel.
O uso de modelos matemticos na indstria ocidental tem uma histria de altos e
baixos . Vistos muito mais como uma ferramenta, auxiliaram na indstria japonesa e,
posteriormente, na indstria ocidental. Porm, pouco influenciaram no comportamento
gerencial e na forma de gesto. A estatstica deveria ser vista como um meio para se
obter conhecimento e aumentar a chance de tomar decises corretas, auxiliando na
obteno de conhecimento sobre os processos, permitindo ver os mesmos sem
preconceitos, opinies ou pr-julgamentos.
36

O modelo preditivo de churn um modelo matemtico/estatstico construdo
com base em um grupo de variveis, que, por conhecimento prvio do negcio ou
estudo especfico, demonstraram ser relevantes para explicao do evento que se deseja
prever. um modelo baseado no comportamento do cliente, que exibe a probabilidade
de abandono e o valor que representa para empresa. Com esses dados, a operadora pode
fazer uma campanha de reteno com uma perda muito pequena, alm de exigir
investimentos menores nessa ao.
O principal objetivo da frmula atribuir, para cada varivel (ou categoria
desta), coeficientes (ou pesos) que esto relacionados ao poder que cada varivel possui
de explicar o evento em questo. Variveis muito importantes para a concluso do
modelo devem receber os maiores pesos, enquanto que as mais secundrias recebero
pesos inferiores.
Esta frmula matemtica pode ser delineada por conhecimento emprico do
negcio (pesos atribudos arbitrariamente), ou atravs de tcnicas estatsticas de
modelagem de dados ou, ainda, auxiliado pelo especialista. claro que, na maioria das
vezes, os modelos que usam tcnicas estatsticas possuem ndices de acerto maiores do
que aqueles que so baseados em conhecimentos e intuies pessoais. Esse fenmeno
deve-se a grande quantidade de dados a serem analisados. Em momento algum, pode-se
isolar especialista. O conhecimento que o especialista possui de fundamental
importncia, principalmente, para sistemas e/ou modelos matemticos hbridos.
3.5 Fidelizao
A fidelizao de clientes anda preocupando empresrios, executivos e
consultores de marketing. Aes, siglas e conceitos, como CRM, Marketing One-to-
One, Database Marketing, Programas de Fidelizao, Programas de Recompensa,
Datamarketing Behavior e tantos outros provocam mais confuso no mercado. A
confuso de conceitos real. H quem considere, por exemplo, que programa de
fidelizao e programa de recompensas (milhagem, cupom, etc.) so a mesma coisa.
Recompensa, como se sabe, baseada no princpio behaviorista de estmulo resposta,
uma vez cessado o estmulo, a resposta tende a desaparecer. Ao passo que fidelizao
37

construda sobre os alicerces do relacionamento e da confiana mtua, que pode se
utilizar ou no de programa de recompensas.
Quando se coloca para a empresa a questo do gerenciamento do relacionamento
com o cliente, no se est sugerindo mecanismos de estmulo-resposta e sim, maneiras
de compreender em profundidade as caractersticas, hbitos, desejos, necessidades e
potencialidades do cliente, com o objetivo de se desenvolver aes voltadas ao
fortalecimento dos vnculos de relacionamento, encant-lo e motiv-lo a manter-se
fiel ao seu negcio.
As empresas devem se preocupar em desenvolver estratgias de fidelizao de
clientes pelas seguintes razes:
A competio cada vez mais acirrada entre empresas, grupos e pases.
Qualidade e produtividade como fatores decisivos de competitividade.
Exigncia de agilidade nas decises.
1 Poder financeiro crescente dos consumidores.
2 Reduo da lealdade s marcas.
3 Importncia crescente dos servios.
4 Sociedade regida pela informao.
Diante desse quadro, no mais admissvel que a empresa fique margem do
que acontece com os seus clientes em geral e com cada grupo de clientes, em particular.
Ignorar o cliente, desconhecer as causas de seu comportamento e deixar de monitorar o
seu relacionamento com a empresa candidatar-se obsolescncia. Muitas empresas
gastam fortunas tentando escrever sua misso. preciso ficar claro que a principal
misso da empresa interferir na deciso do cliente em tornar-se fiel .
O que d vida ao modelo de empresa baseada na fidelidade no a
oferta de utilidades imediatas, mas a criao de valor para os
clientes, condio fundamental em todas as empresas bem-
sucedidas. Como efeito, a fidelidade mede de forma confivel se a
empresa gera valor: os clientes continuam comprando dela ou
preferem outra empresa. Como causa, a fidelidade aumenta as
38

receitas e a participao no mercado, o crescimento sustentvel
permite atrair e conservar os melhores funcionrios e os
investidores fiis viram scios. Frederick Reichheld
3.5.1 A lealdade e o renascimento do marketing
No contexto empresarial, cliente fiel aquele que se encontra envolvido,
presente, no muda de fornecedor e mantm o consumo freqente, optando por uma
organizao em particular, sempre que necessita de um determinado produto ou similar.
preciso que se considere a fidelidade como uma estratgia e no, uma ttica. A
fidelidade do cliente, a do funcionrio e a do investidor esto intimamente interligadas.
Portanto, para que o gerenciamento baseado na fidelidade produza frutos, necessrio
considerar todas as partes. As pessoas esto acima dos processos. O objetivo de um
negcio criar valor e no, apenas, produtos. Ao observar a conduta dos clientes, dos
funcionrios e dos investidores se permanecem ou no fiis empresa, possvel
concluir a quem se fornece valor e, por extenso, se a empresa est cumprindo a misso
de criar um valor duradouro.
Em outras palavras, a fidelidade proporciona um padro para medir o
desempenho, alm de um ponto de referncia para alcan-lo. A prioridade ser muito
cuidadoso no processo de seleo, tanto de clientes como de funcionrios e investidores,
e pensar nessa escolha como num investimento em longo prazo. Se os funcionrios
estiverem orgulhosos e os clientes satisfeitos, eles agiro em benefcio da empresa. O
gerenciamento baseado na fidelidade consiste, portanto, em considerar todas as relaes
que uma organizao estabelece e no apenas com os acionistas, como defende o
gerenciamento baseado na lucratividade.
De acordo com Bogmann (op.cit,p. 21), cliente fiel aquele que sempre volta
organizao por ocasio de uma nova compra ou transao , por se encontrar satisfeito
com o produto ou com o servio. Segundo esse autor, fidelizao o processo pelo qual
um cliente se torna fiel.
A fidelizao do cliente integra o processo filosfico do marketing de
relacionamento. Desde a preocupao com o cliente interno (quadro funcional da
39

empresa), passando pela qualidade total do servio, o ps-marketing atua como fator
importante para a conquista da fidelidade do cliente externo, conclui Bogmann (idem).
O assunto conduz a que seja precisada a noo de marketing de relacionamento.
Esse essencial ao desenvolvimento da liderana no mercado, rpida aceitao de
novos produtos e servios e consecuo da fidelidade do consumidor. A criao de
relaes slidas e duradouras tarefa rdua, de difcil manuteno, como adverte
Bogmann (ibidem).
O cliente e ser fiel tanto maior e melhor for o seu relacionamento com ele.
Seno, vejamos: o cliente que reclama e atendido, volta a fazer negcios com a
empresa uma segunda vez. O que reclama e no atendido, muda para a concorrente.
Aquele que no reclama, tambm muda para uma outra marca. Quer mais? Experimente
oferecer aquilo que voc acha que ele quer sem perguntar se ele quer mesmo, ou ento,
suba seus preos. Ele talvez no falar nada e muito menos reclamar diretamente a
voc, mas, com certeza, ir buscar algo semelhante em outro lugar.
Saber tirar proveito de hbitos e preferncias outra mxima. E a vai uma dica:
Os homens, quando saem de casa e vo ao shopping sozinhos, na maioria das vezes,
sabem o que vo comprar e onde. Em geral, pagam mais caro e dificilmente trocam de
marca. As mulheres, mais espertas, saem de casa j sabendo quanto podem ou querem
pagar por alguma coisa ou servio que resolva um problema (alis, produto ou servio
s tem razo de existir se resolverem algum problema). Por isso, as mulheres pesquisam
mais, pechincham mais, mudam de marca com mais freqncia e so mais exigentes
quanto qualidade dos servios prestados, principalmente, no aspecto ambientao,
layout, limpeza e higiene existentes no local ou ponto de venda.
A gesto baseada na lealdade, que pretende conservar clientes e empregados
para melhorar a rentabilidade, vai alm das tpicas pesquisas de satisfao do cliente. O
xito dessa estratgia baseia-se em compreender que os clientes satisfeitos no so
necessariamente leais. Em toda estratgia baseada na lealdade, a meta de marketing
deve ser posicionada "desero zero", alm de ser possvel medi-la em termos de cash
flow, dada a estreita relao que existe entre lealdade, valor e lucros.
A situao atual do marketing. At pouco tempo atrs, o marketing era o motor
que impulsionava os negcios, a disciplina que integrava as reas funcionais da empresa
40

para satisfazer as necessidades do cliente. Achava-se que jogava um papel chave no
xito de uma companhia. Hoje, os departamentos de marketing, de todo o mundo, lutam
para sobreviver com menor estrutura corporativa e menos funcionrios, porque as
demisses referem-se, precisamente, aqueles que no podem justificar sua contribuio
aos lucros corporativos.
Alguns departamentos tm considerado que a sua funo o servio ao cliente.
Outros desenvolveram pesquisas sobre a satisfao do cliente e muitos recorreram a
artifcios promocionais ou programas de correio direto. Sem dvida, as demisses e
cortes oramentrios continuam. Seu declnio um fato lamentvel porque o marketing
, na verdade, a essncia das foras que acionam o xito e os lucros das empresas. O
nosso trabalho demonstra que as empresas mais bem sucedidas so aquelas que
cultivam e se preocupam com a lealdade dos clientes, empregados e investidores. O
verdadeiro inimigo dos lucros a rotatividade das pessoas, que se manifesta em clientes
muito sensveis ao preo, empregados que mudam de trabalho e especuladores que
buscam o lucro fcil. Nessa perspectiva, a tarefa fundamental do marketing deve ser o
de desenvolver a lealdade do cliente, para o qual dever abranger a fundo a relao que
existe entre a lealdade dos clientes, os empregados e os investidores. E para ser eficaz,
o pessoal de marketing dever incorporar a lealdade ao contexto da misso da empresa.
O pensamento tradicional assinala que o propsito da empresa maximizar o
valor que os acionistas recebem. Sem dvida, essa viso simplista incompleta. A
busca desta meta nica pode destruir uma empresa. A verdadeira misso de uma
empresa deve ser criar valor para os trs integrantes-chave de um sistema de negcios:
clientes, empregados e investidores. O processo de criao de valor para essa trilogia de
partes interessadas a essncia de todo empreendimento bem sucedido, porque justifica
a sua existncia. Cada integrante da trilogia contribui com tempo, dinheiro, energia e
conhecimento tcnico. Para ter xito, a empresa, em troca, dever gerar mais valor. A
rentabilidade se maximiza criando e atribuindo valor com o objetivo de minimizar a
rotatividade do sistema de negcios, porque a aprendizagem e a confiana necessrias
para sustentar a criao de valor no podem sobreviver em um sistema instvel de alta
rotatividade.
O empregado leal aprende com o tempo a atender o cliente e o cliente leal
aprende a concordar (consentir) com o sistema de negcios, de tal maneira a facilitar o
41

servio que recebe. O acionista leal aprende a antecipar os altos e baixos do negcio e
no alimenta comportamentos que destruam o valor de longo prazo para assegurar os
ganhos contbeis em curto prazo. Um negcio bem sucedido , na realidade, uma
sociedade integrada por clientes, empregados e investidores. E como em qualquer
sociedade, as atividades de uma empresa devem ser mutuamente benficas porque, do
contrrio, ela acabar fracassando. Quando qualquer um dos participantes sai dos seus
limites, o sistema sucumbe. Mesmo quando os integrantes devem ser bem atendidos, os
clientes so os "primeiros entre iguais", porque a lealdade do cliente algo que deve se
ganhar todos os dias. Dos trs grupos, este o mais escorregadio: geralmente os
clientes tm um mnimo de capital emotivo e financeiro investido na companhia e
podem ir at o outro lado com o mnimo de esforo.
Embora os estudos de fluxo de caixa dos contadores costumem passar por cima
deste fato transcendental, o certo que o cash flow se origina no dinheiro do cliente. O
marketing tem o desafio de alimentar este manancial de vida de lealdade, assegurando
que a empresa atraia os clientes adequados - cuja lealdade pode conquistar e preservar-,
e de garantir que os clientes recebem dela sempre um valor superior. esta a tarefa que
coloca o marketing no centro do processo de criao de valor e gerao de cashflow.
O marketing dever recuperar a sua envergadura passada e se converter em uma
disciplina diferente quando encarar a misso de avanar at a desero
4
zero.
Sem dvida, o pessoal de marketing, por si s, no tem as ferramentas
adequadas para esta tarefa. Seu sistema de avaliao ignora o cash flow, concentrando-
se em variveis, como a participao no mercado ou os ndices de satisfao, e est
muito na retaguarda dos sistemas de contabilidade financeira que rastreiam o valor
criado para os investidores.
Os controles contbeis influem na maioria das decises da empresa e, uma vez
que a contabilidade perde de vista muitas das conseqncias econmicas da lealdade,
sistematicamente falta-lhe qualidade e ocorre a sub-administrao.

4
Pode-se entender anlise de deseres, como anlise de churn (troca) quando se sabe que a
empresa em questo possui concorrncia. Desta forma, para efeito de estudos, entende-se que houve
a troca para uma de suas concorrentes.

42

Ainda que as declaraes de misso corporativas assinalem para metas elevadas,
como "dispensar o melhor valor ao cliente" ou "oferecer o melhor ambiente de
trabalho", os sistemas de controle de avaliao existentes so inadequados para manejar
o valor que se est entregando a clientes e empregados. Conseqncia: os mercados de
capital, que deveriam se ver regidos pelo interesses de longo prazo, se vem acionados
pelas foras opostas.
3.5.2 A satisfao apenas o comeo
Alguns peritos em marketing viram o que o defeito zero fez pela fabricao e
compreenderam que "medio equivalia a gesto". Ento, foi natural que recorressem
s pesquisas de satisfao.
Estas ferramentas brindam resultados mensurveis e se baseiam em tcnicas de
pesquisa de mercado conhecidas. Sem dvida, se tudo se limita a medir a satisfao, os
resultados que se obtm com o tempo so insatisfatrios. Sem dvida, os clientes que se
dizem satisfeitos no so, necessariamente, leais, como j dito anteriormente. Na
maioria das empresas, 60 a 80% dos clientes que se distanciaram, disseram que estavam
"satisfeitos" ou "muito satisfeitos" na pesquisa anterior sua desero. No tempo que
transcorre entre uma coisa e outra, algo freqentemente acontece: os concorrentes
mudam as suas ofertas, o cliente passa a ter novas exigncias e comea a buscar
alternativas ou, ento, outros fatores desconhecidos intervm. Medir a satisfao
enganoso. Isto significa um esforo para medir um estado mental quando o que
importa, na realidade, a conduta.
As medies de reteno, tais como o ndice anual de reteno, a freqncia das
compras e a participao no dinheiro do cliente, indicam o verdadeiro objetivo: o
comportamento do cliente demonstra que est sendo convencido de que deve continuar
participando da empresa. Ele compra, de fato, a proposta de valor (qualidade) da
empresa e, provavelmente, retornar para comprar novamente.
O marketing dever recuperar o seu prestgio do passado e ir transformar-se
numa disciplina diferente quando encarar a misso de avanar at a desero zero. A
lealdade pode ser base de uma nova cincia de gerenciamento, porque, primeiramente,
43

pode ser medida em termos de manuteno dos clientes e, depois, dos empregados e
investidores.
As "foras da lealdade" se medem em termos de cash flow dados relao que
existe entre lealdade, valor e ganhos. Como efeito de primeira ordem, a lealdade mede,
de maneira fidedigna, se foi criado um valor superior no fato concreto de que os
clientes retornam ou no, produzindo logo uma srie de efeitos de segunda ordem que
so canalizados atravs do sistema de negcios da seguinte maneira: A receita e a
participao de mercado crescem medida que os melhores clientes passam a ser parte
da atividade comercial da empresa, repetindo as suas compras e recomendando a
empresa para outros. Os melhores clientes so aqueles que tm a lealdade inerente mais
alta, porque compreendem e aceitam a proposta de valor da empresa.
O marketing, por si s, no pode criar uma lealdade sustentvel. Os clientes
continuam sendo fiis, no pelas promoes e os programas de marketing, e sim pelo
valor que recebem. O valor acionado por uma srie de atributos, tais como a qualidade
do produto, o servio, o suporte de vendas e a disponibilidade. A tarefa do marketing
consiste em assegurar a coordenao de esforos entre todos os departamentos at uma
proposta de valor nica e eficaz, que assegure um valor superior e, desse modo, garanta
a lealdade do cliente. O marketing conceitualiza a proposta de valor e vislumbra como
apresent-la em termos que resultem compreensveis para o cliente. Porm, para coloc-
la em marcha, necessria a colaborao de todas as funes restantes da empresa. Sem
dvida, a influncia indireta no implica falta de impacto.
Considera-se, por exemplo, o peso indireto mais significativo do departamento
de finanas nos ganhos, atravs de seus sistemas de medio, preparao do oramento,
determinao de metas e as ferramentas analticas restantes. Atuando isoladamente, o
departamento de finanas no pode gerar lucros sustentveis, mas as suas ferramentas
de medio lhe do uma influncia enorme. A funo de marketing pode ser to
poderosa como a das finanas e inclusive, mais eficaz, porque utiliza quatro ferramentas
bsicas para desenvolver a lealdade. So elas:
Sistemas de medio baseados na economia de manuteno.
Identificao de clientes sobre a base de seu valor perene.
44

Anlise de deseres.
Reviso e renovao da proposta de valor.
Os custos se reduzem medida que baixam os gastos de aquisio e ateno a
novos clientes para substituir os anteriores. Os clientes de muito tempo so mais fceis
de serem atendidos, porque conhecem o sistema e como utiliz-lo, e tm desenvolvido
boas relaes com os empregados leais. Aumenta o ndice de manuteno de
empregados porque melhoram o orgulho e a satisfao pela tarefa que cumprem,
gerando um circuito que fortalece a manuteno dos clientes atravs da familiaridade e
um melhor servio. Quando aumenta o perodo de permanncia dos empregados,
aumenta tambm a produtividade da empresa, como resultado da aprendizagem
contnua dos empregados ao acumular experincia na criao de valor para os clientes.
medida que baixam os custos e aumentam as entradas, produz-se um aumento dos
ganhos como efeito de terceira ordem da lealdade. Isso oferece os recursos a serem
investidos em remuneraes maiores aos empregados e em novas atividades que
melhoram o valor que o cliente recebe. Os lucros e o crescimento impulsionam o ganho
dos acionistas e reduzem o custo de capital, melhorando, desse modo, a capacidade da
empresa em oferecer valor (qualidade).
Embora a lealdade seja um padro de comportamento nobre na maioria dos
aspectos da vida humana, a sua importncia na rea dos negcios vai alm do
altrusmo.
3.5.3 As tcnicas e os programas de fidelizao
Muitas empresas do setor de servios, nos ltimos dez anos, passaram a se
preocupar com fidelizao para agregar mais valor a seus clientes.
Segundo Nascimento (1996, p. 15), os programas de fidelizao surgiram como
ferramenta do atual marketing de relacionamento e permitem tangibilizar aos olhos do
cliente as vantagens que a empresa oferece.
Em essncia, fidelidade significa que se est dispostos a sacrificar pelo menos
por um tempo - nossos interesses, porque o sucesso da relao que se constri em longo
prazo mais importante que qualquer benefcio imediato. A satisfao est
45

estreitamente relacionada com a maneira como o consumidor se sente em determinado
momento. Medir a satisfao til, mas no se deve transform-la na ferramenta
central. Muitas vezes, pessoas que disseram estar satisfeitas com um produto no
voltaram a comprar porque acharam o de outra marca mais valioso.
O conceito desses programas envolve uma troca: a empresa oferece as vantagens
e benefcios a quem d preferncia a seus produtos e servios.
Para Nascimento (idem), os Programas de fidelizao fundamentam-se em uma
filosofia empresarial voltada para o cliente, sendo utilizados para reforar a crena do
consumidor de que determinada empresa oferece melhores produtos e servios que a
concorrncia.
Rocha e Veloso (1999,p. 56), reafirmam a declarao: Fidelizao no
promoo. A princpio, o perfil muito parecido com algumas promoes, pois para o
desenvolvimento e manuteno de um programa de fidelizao, so utilizadas muitas
ferramentas promocionais. Entretanto, no se deve confundir as duas coisas.
Alguns truques de marketing podem ajudar a transformar um comprador
freqente num comprador fiel, mas muitos profissionais se confundem e procuram
alici-lo. O argumento o seguinte: Se ele comprar mais produtos e gerar mais lucros
para a empresa, ns o premiaremos com uma parte desses lucros. Esses prmios no
so o prato principal, mas o acompanhamento. Consegue-se fidelidade quando
realmente se oferece mais valor, o melhor produto e o melhor servio.
A base de um programa de fidelizao reside no conhecimento dos clientes,
geralmente, armazenados em bancos de dados. No possvel beneficiar todos os
clientes em virtude do custo elevado. A empresa deve agir de acordo com o que a sua
receita permite, gerando um valor agregado, por meio de benefcios tangveis para os
melhores clientes.
Aquilo que uma empresa decide medir denota o valor, direciona o pensamento
dos funcionrios e fixa as prioridades da gerncia. Mas a grande maioria das
mensuraes que as empresas utilizam mostra apenas uma dimenso do setor de
atividade: os resultados do ano corrente. At agora houve poucos avanos para medir,
46

especificamente, o andamento dos processos e o nvel de qualidade. O mesmo acontece
com a fidelidade.
indispensvel entender a relao entre fidelidade e criao de valor. Nessa
relao preciso considerar os trs atores j mencionados anteriormente: clientes,
funcionrios e acionistas. Portanto, est se trabalhando na criao de um novo enfoque
de medio, que usar dois informes bsicos para cada setor. O primeiro anlogo ao
balano da contabilidade financeira, mas levar em conta o capital humano. O segundo
no s medir a corrente de valor que se dirige para os acionistas e investidores, mas,
tambm, as que movem o balano do capital humano: o valor que flui da empresa para
seus clientes e funcionrios e o que flui dos clientes, dos funcionrios e dos acionistas
para a empresa. Esse sistema integrado de medidas vincula cada setor aos outros e
permite organizao gerir o novo enfoque de medio da fidelidade, que usar um
informe anlogo ao balano financeiro, levando em conta o capital humano.
As medies de fidelidade, hoje, no so muito bem utilizadas, principalmente
quando os segmentos de clientes so muito distintos. O mesmo acontece com as mdias
que incluem clientes de tendncias diferentes, embora dentro de um mesmo segmento.
As empresas tm de examinar separadamente cada segmento de novos clientes, pelo
menos durante os cinco primeiros anos, porque nesse perodo as taxas de desero so
mais altas. Misturar todos os novos segmentos de clientes para calcular uma taxa mdia
de reteno pode turvar a viso e ocultar as contribuies mais valiosas das medidas de
fidelidade. Porm, se a empresa analisar o comportamento dos clientes antes de se
afastarem, poder identificar os padres de desero e, assim, evitar que se repitam em
outros compradores, ou reter quem estiver a ponto de partir. Desta forma, pode-se
prever essa desero de clientes.
Como esclarece Bogmann (op.cit.,p. 89),
O marketing com banco de dados mais facilmente adotado por
empresas do setor de servios, pois pela prpria caracterstica de
inseparabilidade (consumo no momento da produo), as empresas
dispem de maior volume de informaes sobre seus clientes e
assim, maiores recursos para atingi-los.
Nascimento (apud BOGMANN,idem), define o trabalho com banco de dados
como a arte de conquistar e manter clientes, travando um relacionamento direto com
47

cada um deles. A insero de um cliente em um banco de dados vai depender do seu
envolvimento com a empresa. Os programas de fidelizao seguem a famosa filosofia
de Vilfredo Pareto, economista e socilogo italiano, conhecido pela sua filosofia dos
80/20, traduzida como 80% de seus negcios vm de 20% de seus clientes. Ou seja, os
programas so elaborados voltados para fidelizar 20% dos clientes mais lucrativos para
a empresa (BOGMANN, idem)
Constituem pr-requisitos para a implantao de um programa de fidelizao:
1. Os programas de fidelizao devem ter apoio da cpula.
2. As estratgias de marketing devem estar focadas no consumidor.
3. O programa deve ser percebido como uma vantagem competitiva.
4. A responsabilidade pelo programa deve ser centralizada.
3.5.4 Implementando programas de fidelizao
A implementao de um programa de fidelizao requer anlise e estudos
profundos, pois, cada empresa ter necessidades diferentes, devendo obedecer a normas
e procedimentos j existentes.
A fidelidade a marca de uma grande liderana. Se voc obtm resultados
financeiros com o esforo de todos, mas muitos abandonam a empresa na primeira
oportunidade que aparece, seu trabalho como lder falhou. Quem tem poder pode abusar
das pessoas para conseguir seus objetivos, mas no ir muito longe. Mas, se, ao
contrrio, usar de autoridade para ajudar as pessoas a conseguir as coisas, todos se
beneficiaro.
Na hora de contratar preciso ser muito seletivo: incorporar pessoas que tenham
os mesmos valores da empresa e possuam o talento e as habilidades necessrios para
alcanar os nveis de produtividade que uma carreira satisfatria de longa durao
exige. Depois, preciso esforar-se para que os funcionrios entendam os clientes e
aprendam com o feedback dado por eles. Alm disso, preciso montar um sistema de
prmios, segundo o qual sejam os clientes e no, os gerentes, quem determina as
recompensas.
48

O primeiro passo encontrar os melhores clientes: os que produzam um fluxo
constante de recursos financeiros e sejam lucrativos no futuro; clientes cuja fidelidade
se possa ganhar e conservar. As empresas baseadas na fidelidade devem lembrar-se de
trs regras bsicas: alguns clientes so intrinsecamente revisveis e fiis; alguns so
mais rentveis que os outros; e, por ltimo, alguns acharo que os produtos e servios
da empresa so mais valiosos que os de seus concorrentes. Nenhuma empresa pode
satisfazer todas as necessidades de todos os consumidores. Portanto, preciso
concentrar-se em determinados clientes e fazer todo o possvel para conserv-los
elaborando polticas de preos, linhas de produtos e nveis de servio voltados para o
crescimento de sua fidelidade. Ao mesmo tempo, os executivos tm de fazer com que
cada funcionrio entenda que sua nica razo de existir encontrar um cliente que
queira pagar por seus servios, que pense que sua empresa a melhor do mundo e que
fique satisfeito com seus produtos. Mede-se a fidelidade observando quantos clientes
voltam a comprar e quantos compram mais, ano aps ano.
Segundo Rocha e Veloso (idem), existem, entretanto, alguns procedimentos
bsicos que podem ajudar a formatar um programa de fidelizao. So eles:
1 Determinar verbas e equipe de implantao;
2 Analisar o ambiente e as bases do programa;
3 Definir conceitos e caractersticas;
4 Calcular valores para a pontuao;
5 Escolher prmios adequados e obter aprovaes;
6 Desenvolver a estrutura de suporte;
7 Preparar os sistemas;
8 Desenvolver mecanismos de avaliao;
9 Viabilizar materiais de comunicao com caractersticas especiais;
10 Treinar as equipes envolvidas;
11 Fazer ajustes finais .
49

Os autores acima citados explicam que, cumpridas as onze etapas, certamente,
tero sido levantados e observados os principais pontos para que um programa de
fidelizao funcione.
Abaixo encontram-se seis modelos aceitos no mercado para fidelizao de
clientes
1. Modelo de recompensa programas que procuram recompensar o
relacionamento do cliente e a repetio da compra por meio de prmios,
bnus, incentivos, pontuaes, entre outros.
2. Modelo educacional programas que buscam manter um ciclo de
comunicao interativa com o cliente, fornecendo informaes e
alimentando o banco de dados com as respostas obtidas;
3. Modelo contratual utiliza o bom nome da empresa e o banco de dados
dos consumidores para ofertar a entrega peridica de um produto ou
servio.
4. Modelo de afinidade rene grupos de consumidores que compartilham
de algum interesse comum relacionado ao produto, trazendo alto nvel de
resposta.
5. Modelo de servio de valor agregado envolve servios agregados aos
produtos, que representem valor para o cliente, podendo variar de
negcio para negcio.
6. Modelos de alianas ou complementar fundamentados em alianas
entre empresas, em virtude da complementaridade de produtos e
negcios.
Observando quantos clientes voltam a comprar e quantos compram mais, ano
aps ano - Existem muitas maneiras de conhecer a conduta e as atitudes dos clientes,
mas tudo depende do feedback que se queira obter. A Internet uma boa ferramenta,
porque facilita o contato direto com os clientes.
50

3.5.5 Importncia e aplicao do banco de dados no processo de
fidelizao
A evoluo do database tem permitido experimentar cada vez mais novas
tcnicas de comunicao e vendas, com resultados bastante significativos. A utilizao
dessa ferramenta j considerada obrigatria para as empresas que pretendem aumentar
sua competitividade no mercado.
De acordo com Vavra (op.cit., p. 77), o banco de dados de clientes o segundo
fator mais importante para a prestao da maioria dos servios financeiros. Apesar de se
encontrarem familiarizados com essa tecnologia, poucas empresas de servios
financeiros tm explorado verdadeiramente o potencial de marketing de um banco de
dados de clientes em seus negcios. No setor de bens de consumo tambm. Ainda so
poucas as empresas que tm, pelo menos, considerado a possibilidade de instituir um
banco de dados de clientes.
Em um mercado em que informaes caminham to rapidamente, o sucesso das
empresas no depender to somente da extenso pela qual as empresas coletam
informaes sobre seus clientes atuais, mas, tambm, pela forma como usam essas
informaes coletadas.
Como esclarece Bogmann (op.cit., p. 68):
Empresas que vendem itens de grande valor e que coletam
rotineiramente informaes de seus clientes podem adaptar-se ao
novo marketing de informao intensiva com relativa facilidade.
Empresas que vendem itens de pouco valor, como, por exemplo,
fabricantes de bens de consumo, tendero a encontrar maior
dificuldade na adaptao. De qualquer forma, os esforos de ambos
os tipos de empresa em implantar bancos de dados de clientes sero
recompensados pelo aumento da lealdade da prpria clientela.
Vavra (idem) identifica um grande potencial no banco de dados de clientes. Os
concorrentes podem aumentar os gastos em propaganda, reduzir os preos e intensificar
a distribuio, mas a empresa que estabelecer forte relacionamento com seus clientes
atuais em um banco de dados, certamente no vir a se tornar vulnervel a curto prazo .
importante que se diga algumas palavras sobre o papel dos intermedirios para
a sade da empresa. Na medida em que os intermedirios proliferam, separando a
51

empresa de seu cliente, menor ser a identificao do consumidor com o fabricante que
deu origem aos bens e servios.
Em canais mais estreitos, a empresa e um intermedirio podem se encontrar em
contato relativamente prximo, o que possibilita que o intermedirio se identifique , de
alguma maneira , com o fabricante .
Segundo Vavra (ibidem):
A maioria das empresas tem numerosas oportunidades mo para
coletar informaes de seus clientes, sem instituir estudos especiais e
sem comprar bancos de dados caros. Qualquer interao com seus
clientes pode ser uma oportunidade para coletar informaes. A
organizao tpica de marketing tem incontveis oportunidades para
responder s perguntas de seus clientes.
O database marketing ou marketing fundamentado em banco de dados tem como
ferramenta fundamental um conjunto organizado de dados abrangentes sobre clientes
ativos , potenciais ou provveis . Esse conjunto atual, acessvel e acionvel para
propsitos de marketing, como gerao e qualificao de interessados, tem como
objetivo a venda de um produto ou servio ou manuteno de relacionamento.
3.6 Marketing de Nichos ou Segmentos
Por anos seguidos, as empresas encararam seus clientes como se fossem todos
iguais. No importava se eram consumidores assduos ou espordicos, se consumiam
muito ou pouco. Todos eram iguais.
O produto era criado por uma empresa para ser consumido por todos os tipos de
consumidores. Homens adultos, mulheres solteiras, adolescentes, velhos, negros,
brancos, ricos e pobres eram todos iguais. As peculiaridades de cada grupo de pessoas,
que se ligavam intrinsecamente por caractersticas encontradas em cada uma delas, de
uma forma geral, eram ignoradas.
Para o marketing de massa, um produto deveria penetrar em todas as esferas do
mercado. No havia a preocupao em desenvolver produtos cujas caractersticas
fossem relevantes para cada grupo de consumidores.
52

Com o passar dos anos, as empresas sentiram a necessidade de estudar estes
grupos e entender melhor como eles se formavam e por quais caractersticas estavam
ligados. Passaram a ser chamados de segmentos de mercado. Ou seja, cada grupo de
consumidores passou a ser identificado, analisado, acompanhado e, acima de tudo,
ouvido.
Desta maneira, com o mercado dividido em nichos especficos, tornou-se mais
fcil saber quais eram as caractersticas que cada grupo considerava relevantes nos
produtos que consumia ou que gostaria de consumir. Com isso, a velha concepo de se
lanar um produto para o consumidor mdio mostrou-se ineficaz. Isto porque este
consumidor mdio no existe. No imagine que se uma pesquisa indica que metade de
seus clientes preferem que a embalagem do seu produto seja branca e a outra metade
que seja preta, ento basta lanar o produto com a embalagem marrom que o cliente
mdio ser atingido. O que provavelmente ir acontecer que os dois grupos
identificados pela pesquisa no estaro satisfeitos.
Para que todos estes grupos de consumidores sejam identificados e os produtos
sejam adaptados para eles, ou novos produtos sejam criados com as caractersticas
desejadas por cada um, que se criou o marketing de nichos. Tambm conhecido como
marketing-alvo, segmentao do mercado, micromarketing ou marketing regional a
ferramenta ideal para que os nichos sejam identificados e acompanhados.
A abrangncia do marketing de nichos ser to grande quanto for necessidade
da empresa. Com ele possvel identificar a demanda por diferentes verses de um
mesmo produto. Como exemplos, podemos citar os refrigerantes diet e os carros
populares. Estes produtos so variaes de outros j existentes no mercado, mas
identificou-se a demanda por novas verses deles, adaptadas para determinados grupos
de pessoas.
Com a mudana da era do marketing de massa para a era do marketing de
nichos, a teoria dos 4 Ps, de Jerome McCarthy, orientada mais para produto do que
para clientes, d lugar para a teoria dos 4 Cs,de Lauterborn, voltada para o cliente:
Cliente: Substitui o produto. O produto deixado de lado e
toda ateno dada para o estudo das necessidades e
53

vontades do cliente. Significa vender o que algum quer
adquirir.
Custo: O custo possvel para o cliente, substitui o preo.
Compreenda o custo para o consumidor - satisfazer sua
vontade ou necessidade (Schultz et alli, 1994:14).
Convenincia: Substitui praa (place). A ateno voltada
para a convenincia de comprar, sob o ponto de vista do
cliente.
Comunicao: Substitui a promoo. A palavra de ordem da
dcada de 90 a comunicao.
Em suma, com esses 4 Cs tm-se um foco voltado para o cliente, um custo
aceitvel por esse cliente, a convenincia de atender e entregar melhor, conquistando
sua fidelidade atravs da comunicao.
O lema da era dos fabricantes, caveat emptor - deixe que o
comprador cuide -, foi substitudo por cave emptorum -cuidado com
o comprador
Para um marketing de nichos realmente eficaz, existem alguns pontos bsicos a
serem seguidos. Primeiro, necessrio que haja um bom relacionamento entre a
empresa e os nichos atendidos por ela. Isto quer dizer que a fidelidade ao nicho deve ser
entendida como fator preponderante para a sua manuteno e seu desejvel crescimento.
Tambm importante lembrar que explorar diferentes nichos de mercado consome
maiores recursos do que o marketing de massa, mais planejamento, produtos ou
servios, canais de distribuio, campanhas promocionais e representantes de vendas. E
tudo isso tem que estar coordenado, integrado e controlado. Alm de que o
desenvolvimento de uma estratgia de marketing passa a ser mais complexo, pois h a
necessidade de se ligar os vrios nichos de mercado.
3.6.1 Como iniciar o marketing de nichos
Primeiramente, importante manter o foco no seu nicho. No h como manter-
se no mercado se no houver uma poltica de satisfao constante para este nicho.
54

Lembre-se que a segmentao do mercado possibilita a canibalizao entre as empresas,
haja vista que a concorrncia entre elas passa a ter um alvo especfico e bem conhecido.
No marketing de nichos proibido ficar vagando sem objetivo. preciso
conhecer o territrio onde se est atuando. Como disse Michael Roach, diretor de
marketing e pesquisa da Provident Life and Accident:
O marketing de nicho completamente diferente do marketing de
massa. Fracassa quem tenta abordar o marketing de nicho sob o
ponto de vista do marketing de massa. Suponhamos que voc sempre
tenha trabalhado com um mtodo voltado para o marketing de
massa. Abandone tudo o que sabia sobre o mercado e comece da
estaca zero. O marketing de massa serve para atrair mltiplos
segmentos com uma nica oferta. Porm, o marketing de nicho exige
uma compreenso mais profunda do mercado. Digamos que voc vai
dividir o mercado de massa em cinco segmentos. Ter que examinar
com cuidado cada um dos cinco segmentos, o que realmente implica
fazer bastante pesquisa de mercado.
Deve-se pesquisar os clientes, pois no existe fonte de informao melhor do
que eles. Embora, tradicionalmente, os profissionais de Marketing deleguem a pesquisa
de marketing a responsabilidade de reunir informaes sobre os clientes, os
profissionais de marketing de nicho precisam se aproximar pessoalmente do mercado.
Mitchel Scott, gerente de marketing e de desenvolvimento de clientes das
Armstrong World Industries, explicou como a Armstrong consegue que a administrao
se interesse por conhecer os clientes.
As pessoas que dirigem o negcio precisam ter grande contato
direto com os clientes. No o tipo de coisa para o qual seja possvel
designar uma empresa de pesquisas e obter um relatrio.
imprescindvel sentir as coisas para poder mudar o jeito de
administrar a empresa.
Utilizam-se pessoas que dirigem as empresas e os principais funcionrios de
apoio em equipes funcionais cruzadas. Na verdade, eles mesmos fazem uma alta
porcentagem da pesquisa. Falam pelo telefone, ou pessoalmente, com consumidores e
usurios finais. Essas equipes analisam as informaes. Dessa maneira, todos os
gerentes importantes, tanto de assessoria quanto de linha, tm acesso direto s
informaes, sem filtragem.
55

Alm de pesquisar o cliente, examinar os arquivos da empresa tambm uma
boa prtica para quem quer buscar informaes importantes sobre os seus clientes. Os
arquivos das empresas esto repletos de dados documentando as mudanas econmicas,
demogrficas e de estilo de vida que afetam nossa sociedade. O que raro, hoje em dia,
uma anlise profunda dos problemas e uma busca para ver se uma interpretao
cuidadosa e criativa dos dados existentes pode fornecer a maior parte das respostas
antes de ser tomada a deciso de sair em campo e coletar dados novos.
As fontes secundrias no substituem o contato pessoal. Mesmo assim, as
associaes de classe, as agncias governamentais e as publicaes comerciais e
industriais so boas fontes de informaes sobre o mercado, a indstria, os ndices
financeiros e os concorrentes. Estas fontes secundrias proporcionam um meio rpido
de obter informaes, mas, como a anlise de dados internos, nunca fornecem as
mesmas informaes obtidas no contato direto com as pessoas no campo.
Em resumo, pode-se afirmar que a nica forma de ser um bom profissional de
marketing de nichos estar constantemente coletando dados. Quanto mais informao
tiver sobre o mercado em que atua, melhores sero os resultados obtidos.
3.6.2 Como construir um banco de dados
Estar coletando dados no encerra em si as necessidades de informaes sobre o
mercado. necessrio saber como coletar estes dados e como armazen-los para serem
utilizados com inteligncia e eficcia.
Muitas empresas possuem os mais variados dados sobre seus clientes, mas no
sabem como utiliz-los em seu prprio benefcio.
Para a criao eficaz de um banco de dados deve-se seguir algumas regras
bsicas. A primeira ser voc mesmo o chefe. Ou seja, no delegue aos outros o papel
mais importante no processo de criao do banco de dados, que definir quais so as
informaes necessrias e de que maneira acess-las.
Forme o banco de dados em torno do mercado. Para conseguir estimular a
demanda entre os membros do canal de distribuio e os usurios finais, preciso saber
56

quem so eles. Sem dvida, a melhor fonte de informaes sobre novas oportunidades
vem dos clientes atuais. Mas os no-usurios tambm devem ser includos.
Amplie a viso do produto de convenincia. Os bancos de dados so quase
sempre orientados para nmeros absolutos porque fcil registrar a quantidade de
compras realizadas pelos clientes. Mas tambm possvel determinar o porqu e
acrescent-lo ao registro. Inclua as razes por que os clientes especficos compram o
produto. Ou, melhor ainda, por que e como os consumidores usam os seus produtos.
Inclua a anlise de lucros no banco de dados. O fato de poucos bancos de dados
terem informaes de lucros por produtos e servios, canais de distribuio e mercados-
alvo surpreendente. Sem essas informaes fica difcil ser um profissional de
marketing de nicho. Com uma abordagem de marketing de massa, relativamente poucos
produtos e servios atendem a relativamente poucos mercados. Mesmo que as cifras dos
lucros sejam apenas aproximaes, ainda assim do alguma idia (s vezes, uma idia
muito boa) a respeito de quais produtos, servios e mercados so os mais rentveis.
Colete dados de modo que possibilite a anlise das tendncias. Formar um banco
de dados que permita a anlise de tendncias um trabalho rduo e exige planejar alm
de um perodo oramentrio. Assim como o problema da alocao de custos, talvez a
alocao de verbas na empresa tenha que ser revista, a fim de financiar pesquisas de
profundidade de longo prazo.
Inclua a concorrncia no banco de dados. Para o marketing de nichos, so vitais
as informaes sobre os concorrentes.
Faa com que o banco de dados o ajude a entender melhor as relaes cliente-
empresa. No apenas questo de saber que voc tem tantos clientes, que compram
tanto em determinado trimestre. Ou tantos clientes em diferentes categorias de renda.
Ou, ainda, determinados clientes que tm certas caractersticas psicolgicas. preciso
saber reagir a esses dados. necessrio um sistema para lhe dizer que, se este nicho tem
essas caractersticas, ento deve ser tratado de acordo com essas caractersticas.
Estabelea uma central de coleta de dados. Muitas vezes perdem-se informaes
apenas porque as pessoas no sabem para onde envi-las.
Para comear, analise primeiro os dados que tem mo.
57

3.6.3 Em busca de nichos: Onde procurar ?
Talvez seu mercado atual deva ser redefinido em segmentos menores. possvel
crescer mais, fazendo-se menor. Com toda a probabilidade, sua base de clientes no
homognea. Elimine o conceito de nosso cliente mdio. Se 20% compram toda
semana e 80%, s de vez em quando digamos a cada trs meses -, isso significa que
seu cliente mdio compra uma vez a cada trs semanas?
Eis doze perguntas para testar se sua atual estratgia de segmentao adequada
a determinado produto ou servio:
Quem so seus consumidores ou clientes de peso? Segundo o princpio 80-20,
sabemos que 20% dos clientes so responsveis por 80% do seu negcio. Mas devemos
descobrir quais, entre estes 20%, realmente seriam os maiores consumidores dos seus
produtos ou servios.
Quem so seus consumidores ou clientes de pouco peso?(essa pergunta igual
pergunta anterior) Com freqncia, os lderes de mercado menosprezam os pequenos
compradores que so, ou poderiam tornar-se, os segmentos de mercado de crescimento
mais rpido. Pois, as pessoas mudam, ficam mais velhas, mais sofisticadas, adotam
novos passatempos, seguem as ltimas novidades, ou, simplesmente, no tm uma razo
para comprar muito de seu produto ou servio. Porm, ignorando-os, voc jamais
convencer os usurios de pouco peso a aumentarem as compras.
Quais consumidores ou clientes esto ampliando as compras? Se, de repente,
alguns clientes comeam a comprar mais, talvez indiquem novos mercados. Assim,
quando um de seus produtos ou servios mostrar ganhos inesperados, no se limite a
recostar-se e sorrir. Descubra quem o est comprando e por qu. Talvez as respostas o
ajudem a transformar admiradores eventuais em pretendentes de primeira qualidade.
Quais os consumidores ou clientes que esto reduzindo as compras? Quando
bons clientes comeam a gastar menos descubra por qu. Em princpio, talvez voc no
sinta a falta deles, em especial, se a estabilidade total das vendas mascara o declnio de
suas compras. Mas voc acabar sentindo a falta deles. possvel que uma pequena
mudana no produto ou servio traga-os de volta. Ou quem sabe voc precise fazer uma
grande mudana. Todavia, pense duas vezes antes de fechar os olhos a clientes que
58

comeam a no comprar seu produto ou servios. Conservar um cliente custa menos do
que conseguir outro.
Quais consumidores ou clientes voc pode servir com mais lucros? Descubra
quais so os hbitos de compras de seus clientes e desenvolva produtos especficos para
atend-los.
Seus consumidores ou clientes tm diferentes sensibilidades a preos? Com
muita freqncia, existe grande amplitude de sensibilidade a preos dentro da base de
consumidores de uma empresa. Assim, olhe para seus clientes e verifique suas
sensibilidades a preos. Isto pode revelar alguns nichos.
O que seus consumidores ou clientes realmente valorizam? provvel que
dentro da sua base de clientes variem os motivos principais de compra. Analise os
clientes de acordo com as oito dimenses de benefcios, a seguir, percebidas do
produto/servio.
Desempenho: O desempenho de um produto ou servio envolve
caractersticas de uso bsicas.
Aspecto: O aspecto de um produto ou servio inclui caractersticas que
suplementam as caractersticas de uso bsicas.
Confiabilidade: A confiabilidade o funcionamento de um produto ou
servio dentro de uma estrutura de tempo especfica, tal como o tempo
mdio at a primeira falha, o tempo mdio entre falhas e o ndice de falhas
por unidade de tempo.
Especificaes: At que ponto o desenho e as caractersticas de
funcionamento satisfazem os padres estabelecidos? Na rea de servio, a
especificao refere-se exatido e pontualidade .
Durabilidade: A durabilidade a medida do uso que o consumidor obtm
antes que um produto quebre e a substituio seja considerada necessria.
Atendimento: As pessoas tm padres diferentes sobre o que constitui um
servio aceitvel e diferentes limites de tolerncia para avarias.
59

Aparncia e esttica: A esttica puramente subjetiva.
Qualidade percebida: A impresso que o consumidor tem de seu produto
ou servio muito importante quando se trata de compradores espordicos
ou que adquirem o produto ou servio pela primeira vez, que no sabem
medir o desempenho com exatido e quando os produtos e servios so
direcionados. Os compradores pagam apenas pelo que acreditam ser
qualidade, mas suas percepes de qualidade podem ser o resultado dos
sinais que voc lhes d. De um modo ou de outro, os sinais que sua firma
envia definem o valor para seus clientes. Os sinais abrangem: A reputao
e a imagem da firma, a importncia da lista de clientes renomados, a
preponderncia e/ou estabilidade percebidas do produto ou servio, a
embalagem do produto ou servio, a aparncia da propaganda e folhetos,
nvel da fora de vendas e presteza, o preo (onde o preo seja indicador
de produto ou servio superior), o tamanho e a estabilidade financeira da
empresa e a adequao das instalaes.
Seus consumidores ou clientes compram com a mesma freqncia? provvel
que voc tenha um grupo de clientes que compra seu produto apenas esporadicamente,
mas se voc tem alguns compradores freqentes, provvel que possa aumentar o
nmero deles.
Que promoo mais atrai seus diversos consumidores ou clientes? Alguns de
seus clientes preferem a abordagem de pessoa a pessoa? Para outros, um mtodo de
promoo de vendas diferente, como uma concorrncia de mala direta, surtir mais
efeito? Quando clientes diferentes tm motivos principais de compra diferentes, quase
sempre preciso variar os esforos promocionais.
Quem decide a compra? Verifique sua base de clientes. Talvez voc no tenha
as informaes sobre os influenciadores e melhor descobri-las. Pode ser um meio de
encontrar um daqueles nichos ocultos.
Todos os consumidores ou clientes compram sua linha completa de produtos e
servios? Voc tem alguns clientes que compram sua linha completa de produtos e
servios? Tem outros que compram apenas um ou dois itens escolhendo-os a dedo?
Se for assim, voc tem nichos diferentes com diferentes motivos principais de compra.
60

3.6.4 Em busca de nichos: Dando seqncia a procura
O melhor lugar onde procurar nichos de mercado ocultos , com certeza, seu
prprio quintal, com os mercados-alvo de produtos e servios que j conhece.
Mas o nico lugar no o melhor lugar. Se voc no consegue enxergar alm da
base de clientes atuais, voc pode esquecer. No existe futuro para seus clientes e,
tampouco, para o seu negcio.
Abaixo, descreve-se sete files de novos nichos de mercado.
Detecte os consumidores ou clientes que usam a mesma categoria de
produtos ou servios, mas no a sua marca. Verifique mais uma vez a
categoria (ou categorias) de seus produtos ou servios. H clientes
comprando os produtos ou servios de seu concorrente apenas porque no
existem alternativas? Por que ningum reconheceu suas necessidades
nicas? Se for assim, voc est com meio caminho andado. J conhece o
territrio.
Detecte os consumidores ou clientes que no usam a mesma categoria de
seus produtos ou servios, mas que poderiam us-la. Talvez haja clientes
em potencial nos quais voc nunca pensou, nem os concorrentes. Encontre-
os. Talvez os atuais produtos e servios no sejam ou no estejam sendo
percebidos como bastante apetitosos, ou bastante saudveis, ou bastante
fceis de usar. Solucione esses problemas e tanto voc quanto os clientes
sairo ganhando.
Planeje criar novos produtos ou servios em uma velha categoria.
Enquanto algumas empresas procuram fazer melhorias nos produtos e
servios existentes, outras adotam uma nova atitude, procurando encontrar
novas solues para velhos problemas. Seus profissionais de marketing
acreditam no haver mercado maduro. O que h so produtos e servios
cansados.
61

Analise a tecnologia dentro da empresa. provvel que voc j tenha a
tecnologia para atender a novos nichos de mercado, mas talvez no saiba.
Porm, sua tecnologia tem de ser usada de modo a satisfazer os motivos
principais de compra dos usurios consumidores.
Analise as habilidades de marketing dentro da empresa. Talvez uma das
foras da sua empresa seja o marketing. Nesse caso, deve utilizar essas
habilidades para atender a novos nichos de mercado.
Detecte a diversificao. Voc detecta mercados atraentes, mas no tem a
tecnologia, nem as habilidades de marketing para explor-los? Ento,
procure a diversificao.
Detecte os mercados emergentes. Analise os nichos e tente descobrir que
produtos e servios voc poderia oferecer a esses mercados que esto
surgindo.
3.7 A segmentao do mercado como estratgia de marketing
O ponto crtico no planejamento de marketing , sem dvida, a identificao dos
alvos de mercado. Uma das solues que se apresenta como ponto de apoio e que
subsidiar a tomada de deciso do administrador , sem dvida, o processo de
segmentao de mercado. A segmentao tem sido definida como estratgia de
marketing, de fundamental importncia para o sucesso de uma empresa.
O fundamento da segmentao de mercado relativamente simples. Baseia-se
na idia de que um produto comum no pode satisfazer necessidades e desejos de todos
os consumidores. O motivo simples: os consumidores so muitos, dispersos em
diversas regies; tm hbitos de compra variados, gostos diferenciados e variam em
suas necessidades, desejos e preferncias. Assim sendo, no se pode tratar todos da
mesma forma, bem como no se pode tratar todos de forma diferente. O que se pode
62

fazer tentar reunir grupos de pessoas com caractersticas, preferncias e gostos
semelhantes e trat-los como se fossem iguais.
Como se percebe, o centro de toda a discusso que existem diferenas entre os
consumidores. Diferenas essas que devem ser consideradas no processo decisrio da
empresa. Da a importncia da segmentao de mercado como instrumento estratgico,
que comea a ganhar fora a partir da publicao do artigo de Wendell Smith (1956), no
Journal of Marketing, EUA, intitulado: "Diferenciao do Produto e Segmentao de
Mercado como Alternativas de Estratgia Mercadolgica". Nesse clssico do marketing,
Smith v a segmentao como condio indispensvel para o crescimento da empresa.
Diz, ainda, que a segmentao baseada em desdobramentos do lado da oferta de
mercado, representa um ajuste mais racional e preciso de produto e o esforo
mercadolgico s exigncias do consumidor.
Muito se escreveu sobre o assunto at os dias de hoje. Defende-se a adoo da
segmentao para maior sucesso, no atingimento dos objetivos da empresa, incluindo-a
nas consideraes estratgicas do marketing mix. Kotler (1960), citado em Kotler
(1997, p.177), reconhece que a segmentao de mercado est no cerne da estratgia de
marketing. Segundo ele, a segmentao de mercado, a idia mais recente para orientar a
estratgia, comea no com a distino de possibilidades de produto, mas sim, com a
distino de interesses ou de necessidades de clientes. A segmentao a subdiviso do
mercado em subconjuntos homogneos de clientes, em que qualquer subconjunto pode,
concebivelmente, ser selecionado como meta de mercado a ser alcanada com um
composto de marketing distinto.
O modelo quantitativo, contribuio multidisciplinar vindo da estatstica,
ganhou fora como ferramenta auxiliar no processo de medir, agrupar e segmentar
mercados. Outras disciplinas tm contribudo de maneira significativa para os estudos
de segmentao de mercado, como o caso da Sociologia e da Psicologia. Em 1977, um
artigo de Schwitzer props a adoo da segmentao psicogrfica para maior alcance da
audincia de veculos. A segmentao psicogrfica enfoca o estudo do comportamento
do consumidor e divide o mercado em segmentos com estilo de vida homogneo, entre
si, e heterogneo, em relao aos demais segmentos.
63

Na reviso da literatura sobre o assunto, verifica-se que a maioria das
contribuies ao estudo de segmentao mantm suas bases nos escritos de Smith
(1956). Segundo ele, a segmentao consiste em se ver um mercado heterogneo, com
determinada quantidade de mercados homogneos menores, em resposta a diversas
preferncias de produtos entre importantes segmentos de mercados. Ela se baseia no
desdobramento do lado da demanda e representa ajuste racional e mais preciso do
produto e do esforo de marketing s exigncias do consumidor ou usurio.
A primeira vista, a segmentao de mercado no tarefa difcil. Por muito
tempo, foi entendida como um conceito que consistia apenas em dividir o mercado em
segmentos. Depois, os tericos e executivos perceberam que a segmentao de mercado
constitui poderosa arma estratgica, cujas implicaes decorrem da escolha de
segmentos bem definidos para o delineamento de estratgias competitivas. Primeiro,
segmenta-se o mercado; em seguida, escolhe-se o alvo com que se quer trabalhar,
diferenciando-se produtos e servios de modo a atender necessidades e desejos do
pblico-alvo e, posteriormente, posiciona-se o produto como forma de expressar as
diferenas existentes. Como se pode perceber, a segmentao, no conjunto, a base de
toda a estratgia de marketing.
A segmentao estratgia que auxilia a empresa a penetrar em focos
escolhidos, facilitando o acesso ao consumidor por intermdio do ajuste da oferta
demanda e do produto ao mercado. importante observar que o conceito de
segmentao tem relao direta com o mercado. Segmenta-se o mercado e no setores
de atividades, produtos e canais de distribuio. Os produtos e canais de distribuio so
ajustados em decorrncia do alvo escolhido.
Ao decidir segmentar o mercado, a empresa dispe de poucas variveis que
esto sob controle do administrador de marketing. Segundo Richers (1991, p. 22), a
empresa deve enfocar suas opes de segmentao sob quatro ngulos distintos: o do
setor, que problema de concorrncia; o dos segmentos, que problema de
oportunidade; o dos produtos, que problema de adaptao; o de distribuio e
comunicao, que problema de escolha. Dessas quatro variveis, somente as duas
ltimas se prestam manipulao e devem, portanto, ser exploradas como as primeiras
a ter-se em vista.
64

O objetivo bsico da segmentao concentrar esforos de marketing em
determinados alvos, que a empresa entende como favorveis para serem explorados
comercialmente, em decorrncia de sua capacidade de satisfazer a demanda dos focos,
de maneira mais adequada. Cada segmento dever ser constitudo por grupos de
consumidores que apresentem o mnimo de diferenas entre si, do ponto de vista das
caractersticas adotadas, e o mximo de diferenas em relao aos demais segmentos.
Por meio da segmentao de mercado, pode-se conhecer melhor as necessidades
e desejos dos consumidores. Tal conhecimento se aprofunda, medida que novas
variveis de segmentao so combinadas entre si, proporcionando conhecimento mais
individual do consumidor.
Segundo Richers (199l, p.17), com a segmentao de mercado, a empresa
procura obter uma srie de vantagens sinrgicas. Essas vantagens incluem:
Domnio de tecnologia capaz de produzir bens preferidos por certas
classes de compradores;
Maior proximidade ao consumidor final;
Possibilidade de oferecer bens e servios a preos altamente
competitivos;
Disponibilidade de pontos de venda adequados a seus produtos ou
servios;
Existncia de veculos de publicidade que se dirijam direta e
exclusivamente aos segmentos visados, etc.
A alocao de recursos de forma adequada, no citada de forma especfica por
Richers, um dos pontos chaves da segmentao de mercado, diminuindo, com isso, os
riscos associados ao desempenho das atividades empresarias.
Esse conjunto de vantagens propicia empresa melhores condies para
localizar e avaliar as oportunidades de marketing, assim como para auxiliar o
administrador de marketing na avaliao das foras e vulnerabilidade da concorrncia, e
65

com isso tomar decises que possam minimizar os pontos fracos da empresa e otimizar
seus pontos fortes.
Os segmentos de mercado podem ser identificados quando se aplicam tcnicas
sucessivas para subdividi-lo. Para isso, h procedimento formal para identificar os
principais mercados. Desta forma, sugere-se algumas formas de segmentao com as a
seguir:
a) Identificao de diferentes oportunidades de marketing e estabelecimento
de prioridades entre elas;
b) Eficiente alocao de recursos para os focos escolhidos. Kotler (1997,
p.323) identifica trs etapas: estgio de levantamento, estgio de anlise e
estgio de desenvolvimento de perfil.
Na segmentao de mercado, o administrador de marketing deve levar em conta
o comportamento do consumidor. Isso porque os compradores so pessoas com
necessidades e desejos diversos e o mesmo produto no pode mais atrair todo o mundo.
Deve-se, portanto, conhecer o comportamento, as atividades, as motivaes, os
benefcios e as vantagens que os diferentes grupos de consumidores, relativamente
homogneos, esto procurando.
Para conhecer os consumidores, o administrador precisa reuni-los em grupos, os
mais homogneos possveis. Para tanto, ele pode fazer uso das variveis de
segmentao, as quais procuram revelar certas caractersticas geogrficas, scio-
econmicas, de personalidade e comportamentais. Essas variveis podem ser
decompostas em diversas outras, que por sua vez podem ser empregadas
individualmente ou interrelacionadas com as demais.
O elenco de variveis que se apresenta como critrios para segmentar mercado
muito amplo. Existem milhares de maneiras para segmentar determinado mercado,
principalmente, se a empresa pretende combinar vrias de suas formas.
Os segmentos geralmente so identificados a partir de duas correntes. Na
primeira, atravs das caractersticas dos consumidores, independentemente do produto,
66

utilizam-se as variveis geogrficas, demogrficas e psicogrficas. Na segunda, a
identificao feita por meio das respostas do consumidor diante do produto, como
benefcios procurados, ocasies de uso e lealdade marca.
As modalidades constitudas pelas variveis geogrficas, demogrficas e scio-
econmicas so usuais e mais comuns, pelo fato de terem caractersticas conciliveis e
complementares entre si, cujos dados no dependem de pesquisas de campo e podem
ser, facilmente, encontrados a partir de fontes secundrias.
O mesmo no ocorre com as variveis de segmentao por padres de consumo,
por benefcios procurados, por estilo de vida e por tipos de personalidades, as quais,
geralmente, dependem de pesquisa de campo para se conhecer aspectos especficos das
pessoas e de seus comportamentos.
O processo de segmentao de mercado objetiva a determinao de diferenas
significativas entre grupos de compradores, separando-os em conjuntos diferenciados,
para que a empresa possa selecionar segmentos que se apresentem mais favorveis
concentrao de esforos.
A escolha desses segmentos de forma eficaz, conjugada com a avaliao dos
elementos do ambiente em que a empresa desenvolve suas atividades, deve ser
precedida de certas caractersticas fundamentais. Kotler (1992, p. 339) apresenta
algumas contribuies inovadoras e importantes que devem ser observadas: a
mensurabilidade, a substancialidade, a acessibilidade e a operacionalidade. Sem que o
segmento apresente essas caractersticas, parece imprudente alimentar decises
especficas do composto de marketing voltadas a esses compradores.
A segmentao de mercado a concentrao, consciente e planejada, de uma
empresa em parcelas especficas de seu mercado. A empresa opta voluntariamente por
concentrar todos os esforos de marketing em determinados segmentos de mercados,
possivelmente abandonando outros, mesmo que constituam potencial.
Dessa forma, a funo da segmentao de mercado agrupar indivduos, cujas
aes esperadas aos esforos de marketing sejam semelhantes, ao longo de determinado
perodo. Objetiva, ainda, a determinao de diferenas significativas entre grupos de
compradores, separando-os de forma a possibilitar empresa a seleo daqueles, nos
67

quais parea mais conveniente concentrar esforos. Com isso, aumenta a
competitividade da empresa em relao aos concorrentes. Essa prtica tem, como
principal objetivo, descobrir as diferenas realmente importantes entre os consumidores
e reuni-los em grupos relativamente homogneos quanto a certas caractersticas
objetivas e subjetivas. A partir da, o administrador pode posicionar seus produtos e
dedicar seus esforos de marketing, visando escolha e ao atendimento daqueles
segmentos mais lucrativos, determinando, assim, a estratgia que, convenientemente
conduzida, iniba a reao da concorrncia e gere lucros satisfatrios para a empresa.
68

CAPTULO 4
DATA MINING
4.1 Estado da Arte
Com o progresso da cincia e indstria eletrnica que nos possibilita, nos dias de
hoje, possuir processadores cada vez mais rpidos, limite de memria randmica
extremamente grande, discos rgidos de 400 Gbytes, ou at maiores, sem falar dos
pesquisadores de engenharia de software que desenvolvem bancos de dados para
armazenamentos incrveis, hoje j possvel ter-se nada mais nada menos que uma base
de dados com dois milhes de cliente de um banco comercial em um desktop isolado
(fora de uma rede de computadores). Com todo esse espao de memria e rapidez de
processamento, os dados a serem manipulados cresceram vertiginosamente a ponto de
se ter um verdadeiro caos de dados para ser processado.
Gerar informao a partir desse estado catico faz com que o minerador de
dados, nos dias atuais, seja extremamente requisitado na busca de reconhecimento de
padres vlidos, a ponto de se tornarem verdadeiros profissionais de lapidao dos
dados. Nunca se ouviu falar tanto em termos, como: extrao de conhecimento,
descobrimento de informao, arqueologia de dados, minerao de textos, minerao de
sites (web mining), entre outros.
Segundo Coutinho [2003] data Mining (ou minerao de dados) um processo
para extrair informao vlida, previamente desconhecida e de mxima abrangncia a
partir de grandes bases de dados e/ou armazns de dados, denominados Datawarehouse
(DW); conjuntos de dados agrupados a partir de uma base de dados qualquer, usando-as
para um processo decisrio. O DM vai muito alm da simples consulta a um banco de
dados. Permite aos usurios explorar e inferir informaes teis a partir dos dados,
descobrindo relacionamentos escondidos no banco de dados e buscando padres
vlidos. sem dvida, um conjunto de tcnicas utilizada para descobrimento de
conhecimento em base de dados robustas (KDD - Knowledge Discovery in Databases).
Talvez, uma das definies mais completas a respeito de datamining tenha sido
elaborada por Usama Fayyad (FAYYAD et al., 1996, p.6, traduo livre):
69

"..o processo no-trivial de identificar, em dados, padres vlidos,
novos, potencialmente teis e ultimamente compreensveis "
As origens do DM encontram-se nos idos de 60, quando a anlise de dados
basicamente era oferecida atravs de anlise estatstica. Segundo muitos autores, DM
no passava de rotinas estatsticas clssicas, incluindo nesse conjunto de rotinas, a
estatstica multivariada.
Com o passar dos anos, novas tcnicas foram sendo agregadas estatstica.
Surgem os conceitos de Lgica Nebulosa (Fuzzy Logic), Redes Neurais Artificiais
(Artificial Neural Networks), rvores de deciso (Decision Tree). Todavia, no passado,
muitos dos pesquisadores no sabiam classificar, com exatido, em que rea de
conhecimento essas tcnicas poderiam ser agregadas. A melhor tentativa de
classificao destas tcnicas surge no incio da dcada de 1990, onde grande parte dos
pesquisadores concordaram classific-las como sendo tcnicas de Inteligncia Artificial.
Atualmente, costuma-se dizer que DM uma rea de conhecimento
interdisciplinar, que envolve uma srie de tcnicas emprestadas de outras reas de
conhecimento. Para os puristas, pode parecer uma heresia chamar DM de uma rea de
conhecimento, uma vez que um conjunto de tcnicas que permitem descobrir
conhecimento e informao. Todavia, a especializao de diversos pesquisadores
oriundos de outras reas de conhecimento, tornou-a to robusta, que chamar DM de
uma rea de conhecimento j no ofende a muitos pesquisadores dessa interdisciplinar
rea de conhecimento.
4.2 Prospeco de Conhecimento em Banco de Dados
(KNOWLEDGE DISCOVERY IN DATABASES KDD)
importante frisar que o conceito de DM utilizado por estatsticos e analistas
de informao, enquanto o termo KDD mais aceito pela comunidade da rea de
inteligncia artificial (FAYYAD, idem, p.4). Como dito no pargrafo anterior, ser
aceito nesta tese o conceito de interdisciplinaridade, no ferindo, desta forma, a
qualquer profissional que queira ingressar nessa rea com qualquer base (handcup) de
conhecimento.
70

Todo o processo de KDD (figura 4.1) depende de ferramentas e tcnicas de
anlise de dados e envolve diversas etapas. A principal, que forma o ncleo do processo
e que muitas vezes confunde-se com prprio conceito de DM, busca o processamento de
padres de dados, arqueologia de dados ou colheita de informao (information
harvesting).
O processo de KDD um conjunto de atividades contnuas que compartilham o
conhecimento descoberto, a partir de bases de dados muito grandes. Esse conjunto
composto de etapas, que so: seleo de dados; pr-processamento e limpeza (cleaning);
transformao; data mining (minerao dos dados) e interpretao. Somente aps a
interpretao das informaes obtidas encontrar-se-a o conhecimento necessrio.
Uma diferena significante entre DM e outras ferramentas de anlise est na
maneira como exploram as inter-relaes entre os dados. As diversas ferramentas de
anlise disponveis utilizam um mtodo baseado na verificao, isto , o usurio
constri hipteses sobre inter-relaes especficas e, ento, verifica ou refuta, atravs do
sistema. Esse modelo torna-se dependente da intuio e habilidade do analista em
propor hipteses interessantes, em manipular a complexidade do espao de atributos e
em refinar a anlise, baseado nos resultados de consultas ao banco de dados
potencialmente complexos. J o processo de Data Mining fica responsvel pela gerao
de hipteses, garantindo mais rapidez, preciso e completude aos resultados. Mas como
se d essa garantia de rapidez e completude dos resultados? A resposta encontra-se em
muitos livros de DM. Todavia, a que mais chama a ateno, a que diz que DM gera
por si s um modelo (modelagem matemtica), determinando, dessa forma, padres a
partir de dados observados. O perfeito ajuste desse modelo de fundamental
importncia no que se refere ao descobrimento de conhecimento. Se o modelo
representa (ou no), o conhecimento buscado depender do analista/especialista que
interage a todo o momento com os processos KDD. importante ratificar que o
processo KDD no independente de um especialista humano, uma vez que ser ele o
responsvel pela validao, ou no, do conhecimento extrado. Somente o especialista
possui o sentimento e a sensibilidade de sua rea de conhecimento, tornando-se , deste
modo, parte essencial na modelagem KDD.
71

A ttulo de compilao de idias, apresentada uma figura (figura 4.1)
esquemtica (remodelada), exibida em Fayyad [1996, p.10]. A figura mostra os passos
seguidos pelo KDD para descobrimento do conhecimento

Figura 4.1- processo KDD
4.2.1 Seleo de Dados
Uma vez definido o domnio sobre o qual se pretende executar o processo de
descoberta, o prximo passo selecionar e coletar o conjunto de dados ou variveis
necessrias. A maioria das empresas j possui bases de dados (dados secundrios)
porm, nem sempre todos os dados necessrios esto disponveis nestas bases, o que
exige um trabalho de compatibilizao e unio.
4.2.2 Limpeza e Enriquecimento
Entende-se que limpeza dos dados seja a atividade pela qual os rudos, dados
estranhos ou inconsistentes so tratados e onde so estabelecidas as estratgias para
resolver os problemas de ausncia de dados. As causas que levam situao de ausncia
de dados so a no disponibilidade do dado ou a inexistncia do mesmo. Uma situao
de no disponibilidade ocorre quando da no divulgao do dado, como, por exemplo,
dados de renda da pessoa fsica em funo da obrigatoriedade de sigilo. A inexistncia
do dado ocorre quando so necessrios dados sobre determinados municpios, includos
72

no domnio do processo KDD que, no momento de organizao da base de dados
original, ainda no haviam sido criados.
4.2.3 Transformao
Nessa fase, o uso de DW se expande consideravelmente, j que nessas estruturas
as informaes esto alocadas da maneira mais eficiente. Em DW, os dados so no-
volteis, classificados por assunto e de natureza histrica, tendendo, portanto, a se
tornarem grandes repositrios de dados extremamente organizados. Entretanto, em
algumas aplicaes de DM mais especficas, ferramentas avanadas de representao de
conhecimento podem descrever o contedo de um banco de dados por si s, usando esse
mapeamento como uma meta-camada para os dados.
4.2.4 Interpretao
Os resultados do processo de descoberta do conhecimento podem ser mostrados
de diversas formas. Porm, estas formas devem possibilitar uma anlise criteriosa para
identificar a necessidade de retornar a qualquer um dos estgios anteriores do processo
de KDD.
Esta apresentao das atividades pode sugerir que exista uma trajetria linear do
processo KDD. No entanto, isso geralmente no se verifica, uma vez que em cada etapa
pode ser identificada a necessidade de retorno para cada uma das etapas anteriores. Por
exemplo, se na atividade de codificao, ou mesmo na de Data Mining, identificado
que os dados no estejam plenamente consistentes, ou se for verificada a necessidade de
um dado que no havia sido previsto anteriormente, isso pode levar ao retorno fase de
consistncia ou mesmo de seleo dos dados.
4.3 As bases do data mining
Coutinho [2003] apresenta de maneira didtica do DM:
73

4.3.1 Estatstica
O Data Mining descende fundamentalmente de trs linhagens. A mais antiga
delas a estatstica clssica. Sem a estatstica no seria possvel termos o DM, uma vez
que a base da maioria das tecnologias a partir das quais o DM construdo.
A Estatstica Clssica [JONHSON, 1992] envolve conceitos, como distribuio
probabilstica, mdia, mediana, moda, varincia, covarincia, assimetria, curtose,
correlao, anlise de resduos, anlise de conjuntos e intervalos de confiana, todos
usados para estudar dados e os relacionamentos entre eles.
Essas so as pedras fundamentais onde as mais avanadas anlises estatsticas se
apiam. E ,sem dvida, no corao das atuais ferramentas e tcnicas de DM, a anlise
estatstica clssica desempenha um papel fundamental. [ COUTINHO, 2003]
4.3.2 Inteligncia Artificial
A segunda linhagem do DM a Inteligncia Artificial (IA). Essa disciplina, que
construda a partir dos fundamentos da heurstica, em oposto estatstica, tenta imitar
a maneira como o homem pensa na resoluo dos problemas estatsticos.
Em funo dessa abordagem, ela requer um impressionante poder de
processamento, que era impraticvel at os anos 80, quando os computadores
comearam a oferecer um bom poder de processamento a preos mais acessveis.
A IA desenvolveu algumas aplicaes para o alto escalo do governo/cientistas
americanos, sendo que os altos preos no permitiram que ela ficasse ao alcance de
todos. As notveis excees foram, certamente, alguns conceitos de IA adotados por
alguns produtos de ponta, como mdulos de otimizao de consultas para SGBD
(Sistemas de Gerenciamento de Banco de Dados) [ COUTINHO, 2003]
Todavia, o custo/benefcio das atuais aplicaes so acessveis para uma grande
maioria das empresas, principalmente no Brasil. Atualmente, pequenas e mdias
brasileiras j dispem de softwares de IA para descobrimento de conhecimento,
principalmente no que tange ao descobrimento do perfil de clientes inseridos em base de
dados ou prospects.
74

4.3.3 Machine Learning
E a terceira e ltima linhagem do DM a chamada machine learning, que pode
ser melhor descrita como o casamento entre a estatstica e a IA. Enquanto a IA no se
transformava em sucesso comercial, suas tcnicas foram sendo largamente cooptadas
pela machine learning, que foi capaz de se valer das sempre crescentes taxas de
preo/performance oferecidas pelos computadores nos anos 80 e 90, conseguindo mais e
mais aplicaes devido s suas combinaes entre heurstica e anlise estatstica. A
machine learning tenta fazer com que os programas de computador aprendam com os
dados que eles estudam, tal que esses programas tomem decises diferentes baseadas
nas caractersticas dos dados estudados, usando a estatstica para os conceitos
fundamentais e adicionando mais heurstica avanada da IA e algoritmos para alcanar
os seus objetivos.
De muitas formas, o DM fundamentalmente a adaptao das tcnicas da
Machine Learning para as aplicaes de negcios. Desse modo, podemos descrev-lo
como a unio dos histricos e dos recentes desenvolvimentos em estatstica, em IA e
Machine Learning. Essas tcnicas so usadas juntas para estudar os dados e achar
tendncias e padres nos mesmos. Hoje, o DM tem experimentado uma crescente
aceitao nas cincias e nos negcios, que precisam analisar grandes volumes de dados
e achar tendncias que eles no poderiam achar de outra forma. [ COUTINHO, 2003]

4.4 Principais tcnicas de Data Mining
4.4.1 Redes Neurais
Segundo Coutinho [2003] Essa tecnologia a que oferece o mais profundo
poder de minerao, mas , tambm, a mais difcil de se entender. As redes neurais
tentam construir representaes internas de modelos ou padres achados nos dados, mas
essas representaes no so apresentadas para o usurio. Com elas, o processo de
75

descoberta de padres tratado pelos programas de DM dentro de um processo caixa-
preta.
Embora seja verdadeiro que as redes neurais apresentem o mais avanado poder
de minerao, muitos analistas de negcio no podem fazer uso delas porque os
resultados finais no podem ser explicados.
Estruturalmente, uma rede neural consiste em um nmero de elementos
interconectados (chamados neurnios), organizados em camadas que aprendem pela
modificao da conexo firmemente conectando as camadas. Geralmente, constroem
superfcies equacionais complexas atravs de interaes repetidas, cada hora ajustando
os parmetros que definem a superfcie. Depois de muitas repeties, uma superfcie
pode ser internamente definida e se aproxima muito dos pontos dentro do grupo de
dados.
A funo bsica de cada neurnio : (a) avaliar valores de entrada, (b) calcular o
total para valores de entrada combinados, (c) compara o total com um valor limiar, (d)
determinar o que ser a sada. Enquanto a operao de cada neurnio razoavelmente
simples, procedimentos complexos podem ser criados pela conexo de um conjunto de
neurnios. Tipicamente, as entradas dos neurnios so ligadas a uma camada
intermediria (ou vrias camadas intermedirias) e esta conectada camada de sada.
Para construir um modelo neural, primeiramente, "adestra-se" a rede em um
dataset de treinamento e, ento, usa-se a rede j treinada para fazer predies. O dataset
pode ser monitorado durante a fase de treinamento para checar seu progresso.
Cada neurnio, geralmente, tem um conjunto de pesos que determina como o
neurnio avalia a combinao dos sinais de entrada. A entrada para um neurnio pode
ser positiva ou negativa. O aprendizado se faz pela modificao dos pesos usados pelo
neurnio em acordo com a classificao de erros que foi feita pela rede como um todo.
As entradas so, geralmente, pesadas e normalizadas para produzir um procedimento
suave.
76

4.4.2 A Induo de Regras ou Rule Induction
A induo de regras refere-se deteco de tendncias dentro de grupos de
dados, ou de regras sobre o dado. As regras so, ento, apresentadas aos usurios
como uma sta no encomendada.
4.4.3 rvores de deciso
As rvores de deciso so uma evoluo das tcnicas que apareceram durante o
desenvolvimento das disciplinas de machine learning. Elas cresceram a partir da
aproximao de uma anlise, chamada Deteco de Interao Automtica, desenvolvida
na Universidade de Michigan. Essa anlise trabalha, testando automaticamente, todos os
valores do dado para identificar aqueles que so fortemente associados com os itens de
sada selecionados para exame. Os valores que so encontrados com forte associao
so os prognsticos chaves ou fatores explicativos, usualmente chamados de regras
sobre o dado.
As rvores de deciso so meios de representar resultados de DM na forma de
rvore, e que lembram um grfico organizacional horizontal. Dados um grupo de dados
com numerosas colunas e linhas (registros com as devidas variveis), uma ferramenta
de rvore de deciso pede ao usurio para escolher uma das colunas como objeto de
sada, e a mostra o nico e mais importante fator correlacionado com aquele objeto de
sada, como o primeiro ramo (n) da rvore de deciso. Os outros fatores so
subseqentemente classificados como ns do(os) n(s) anterior(es). Isso significa que o
usurio pode, rapidamente, ver qual o fator que mais direciona o seu objeto de sada e
entender o porqu do fator ter sido escolhido. Uma boa ferramenta de AD vai, tambm,
permitir que o usurio explore a rvore de acordo com a sua vontade, do mesmo modo
que ele poder encontrar grupos alvos que lhe interessem mais, e a, ampliar o dado
exato associado ao seu grupo alvo. Os usurios podem, tambm, selecionar os dados
fundamentais em qualquer n da rvore, movendo-o pra dentro de uma planilha ou outra
ferramenta para anlise posterior.
As rvores de deciso so, quase sempre, usadas em conjunto com a tecnologia
de Induo de Regras, mas so nicas no sentido de apresentar os resultados da Induo
de Regras num formato com priorizao. Ento, a regra mais importante apresentada
77

na rvore como o primeiro n e as regras menos relevantes so mostradas nos ns
subseqentes. As vantagens principais das rvores de deciso so que elas fazem
decises levando em considerao as regras que so mais relevantes, alm de serem
compreensveis para a maioria das pessoas. Ao escolher e apresentar as regras em
ordem de importncia, as rvores de deciso permitem aos usurios ver, na hora, quais
fatores mais influenciam os seus trabalhos.
4.4.4 Anlise Estatstica de Sries Temporais
A estatstica a mais antiga tecnologia em DM e parte da fundao bsica de
todas as outras tecnologias. Ela incorpora um envolvimento muito forte do usurio,
exigindo engenheiros experientes que construam modelos que descrevam o
comportamento do dado atravs dos mtodos clssicos de matemtica. Interpretar os
resultados dos modelos requer expertise especializada. O uso de tcnicas de estatstica
tambm requer um trabalho muito forte de mquinas/engenheiros.
A anlise de sries temporais um exemplo disso, apesar de freqentemente ser
confundida como um gnero mais simples apesar de freqentemente ser confundida
como um gnero mais simples de DM, chamado forecasting (previso).
Enquanto a anlise de sries temporais um ramo altamente especializado da
estatstica, o forecasting de fato uma disciplina muito menos rigorosa, que pode ser
satisfeita, embora com menos segurana, atravs da maioria das outras tcnicas de DM.
4.4.5 Visualizao
As tcnicas de Visualizao so um pouco mais difceis de definir, porque
muitas pessoas a definem como complexas ferramentas de visualizao, enquanto
outras, como simplesmente a capacidade de gerao de grficos.
Nos dois casos, a Visualizao mapeia o dado sendo minerado de acordo com
dimenses especificadas. Nenhuma anlise executada pelo programa de DM, alm de
manipulao estatstica bsica. O usurio, ento, interpreta o dado enquanto olha para o
monitor. O analista pode pesquisar a ferramenta depois, para obter diferentes vises ou
outras dimenses.
78

4.5 Data Warehouse
Sabe-se que os bancos de dados so de vital importncia para as empresas e
tambm esto cientes de que sempre foi difcil analisar os dados neles existentes. Tudo
isso porque, geralmente, as grandes empresas detm um volume enorme de dados, em
diversos sistemas diferentes, espalhados por ela. No era possvel buscar informaes
que permitissem tomar decises embasadas num histrico dos dados. Em cima desse
histrico, tendncias podem ser identificadas e a empresa posicionada estrategicamente
para ser mais competitiva e, conseqentemente, maximizar os lucros, diminuindo o
ndice de erros na tomada de deciso. Pensando nisso, introduziu-se um novo conceito
no mercado, o Data Warehouse (DW), que consiste em organizar os dados corporativos
da melhor maneira, para dar subsdio de informaes aos gerentes e diretores das
empresas para tomada de deciso. Tudo isso num banco de dados paralelo aos sistemas
operacionais da empresa.
Para organizar os dados, so necessrios novos mtodos de armazenamento,
estruturao e novas tecnologias para a gerao e recuperao dessas informaes.
Essas tecnologias j esto bem difundidas, oferecendo muitas opes para o
cumprimento de todas essas etapas. Essas tecnologias diferem dos padres operacionais
de sistemas de banco de dados em trs maneiras:
Dispem de habilidade para extrair, tratar e agregar dados de mltiplos sistemas
operacionais em data marts ou data warehouses separados. Armazenam dados
frequentemente em formato de cubo (OLAP) multidimensional, permitindo rpido
agregamento de dados e detalhamento das anlises (drilldown). Disponibilizam
visualizaes informativas, pesquisando, reportando e modelando capacidades que vo
alm dos padres de sistemas operacionais frequentemente oferecidos.
Um DW permite a gerao de dados integrados e histricos, auxiliando os
diretores decidirem embasados em fatos, e no em intuies ou especulaes, reduzindo
a probabilidade de erros e aumentado a velocidade na hora da deciso. Cerca de 88%
dos diretores admitem que dedicam quase 75% do tempo s tomadas de deciso,
apoiadas em anlises subjetivas (Aspect International Consulting, 1997),
menosprezando o fato de que por volta de 100% deles tem acesso a computadores.
Conhecer mais sobre essa tecnologia permitir aos administradores descobrire novas
79

maneiras de diferenciar sua empresa numa economia globalizada, deixando-os mais
seguros para definirem as metas e adotarem diferentes estratgias em sua organizao,
conseguindo assim, visualizar, antes de seus concorrentes, novos mercados e
oportunidades, atuando de maneiras diferentes, conforme o perfil de seus consumidores.
4.5.1 Razes do porqu o data mining e o data warehouse tm se
tornado importantes nas empresas
A crescente disponibilizao de informaes, que tem surgido medida que
mais e mais organizaes utilizam-se das ferramentas de Business intelligence, est
fazendo com que apaream, tambm, novas necessidades de anlise das informaes
disponibilizadas.
Para atender essas novas necessidades, as ferramentas de SAD tm sido
incrementadas com sofisticadas funes, tais como a anlise OLAP (On Line Analitical
Processing), formataes de relatrios cada vez mais flexveis, visualizao 3D, filtros,
classificaes, alertas, entre outros.
De todas essas funes, a OLAP , sem discusso, a mais sofisticada, na medida
em que possibilita aos usurios estudar os dados de maneira multidimensional, de modo
que os mesmos podem perfurar os dados at os seus detalhes (funo comumente
chamada de drill down), ou ainda ver pores sumarizadas desses dados (funo
slice-and-dice), do ponto de vista que desejarem, enquanto perseguem as respostas
que procuram. Assim, essa funo permite que o usurio veja os dados de vrias e
diferentes perspectivas e a numerosos nveis de detalhe ou agregao.
Comparativamente, o DM apresenta um mtodo alternativo e automtico de
descobrir padres nos dados. Alternativo porque ele trabalha diretamente contra todos
os dados de um grupo, ao invs de se ater a seguir determinado caminho ao longo de
alguns dados e perfurar (ou executar um drill down) em busca de detalhes. E
automtico em sua execuo devido ao fato que a ferramenta, por ela mesma, estuda o
dado e apresenta os seus achados aos usurios. Apesar de o usurio ter que tomar o
cuidado de fornecer dados teis ferramenta, uma vez isso feito, ela pega o comando e
tritura o grupo de dados ao seu modo.
80

Devido a essas duas caractersticas, o DM extremamente adequado para
analisar grupos de dados que seriam difceis de analisar usando apenas a funo OLAP,
visto que esses grupos so grandes demais para serem navegados, ou explorados
manualmente, ou ainda porque contm dados muito densos ou no-intuitivos para serem
compreendidos.
O DM no requer que o usurio pilote a ferramenta ao longo do processo de
anlise dos dados ou que administre o processo ao longo de seu andamento. Fornecidos
dados adequados no incio do processo, o DM pode trazer sentido a grupos de dados,
achando tendncias ou padres escondidos nos mesmos, e apresent-los ao usurio
num formato compreensvel.
Assim, a diferena bsica entre OLAP e DM est na maneira como a explorao
dos dados realizada. Na anlise OLAP, a explorao feita atravs da verificao, isto
, o analista conhece a questo, elabora uma hiptese e utiliza a ferramenta pra refut-la
ou confirm-la. Com o DM, a questo total ou parcialmente desconhecida e a
ferramenta utilizada para a busca de conhecimento.
E essa capacidade claramente agrega valor a solues de apoio e deciso. Em
muitos casos, os resultados apresentados pelo DM fazem surgir interessantes questes
sobre os dados originais ou que tenham alguma relao com os mesmos no DW. Esse
um outro exemplo de como o DM agrega valor aos SAD.
Quando os resultados do DM propem questes adicionais, os usurios podem
procurar por mais respostas em tempo real, simplesmente rodando uma nova consulta
na base de dados e minerando de novo, ou se desejarem, podem usar os resultados de
uma minerao como guia para ajud-los a pesquisar mais dados, usando a anlise
OLAP. Muitas vezes, os usurios percebem que esto usando um processo interativo de
consultas, DM e OLAP, ao conseguir obter as informaes que mais lhes interessam, ao
mesmo tempo em que podem formatar os relatrios da maneira mais conveniente.
Dessa forma, o DM est se tornando um componente essencial de anlise para os
sistemas de apoio deciso, complementando as funes j existentes. [ COUTINHO,
2003]

81

4.5.2 Dificuldade para o uso de novas tecnologias
Houve no passado (e ainda h, de certa forma) muitas barreiras para o DM se
tornar uma funo essencial dos SAD. As mais importantes tm sido ultrapassadas, mas
outras ainda se mantm.
Fundamentalmente, as mais importantes foram: alto custo das solues;
necessidade de grandes volumes de dados armazenados em poderosos servidores; a
pouca amigabilidade das ferramentas de DM para pessoas que no fossem altamente
especializadas.
Outras que se podem citar so: o desafio de preparar os dados para minerao; as
dificuldades em se obter uma anlise custo/benefcio bem fundamentada antes do incio
do projeto; a preocupao quanto viabilidade de muitos dos fornecedores dessas
ferramentas. [ COUTINHO, 2003]

4.5.3 Altos Custos
O alto custo da maioria das ferramentas faz com que fique difcil a
disseminao das mesmas entre as corporaes. Certos fornecedores dessas ferramentas
tm introduzido produtos com custo mais baixo, mas mesmo assim o preo continua
limitando o uso em larga escala. Evidentemente, os custos por usurio precisam ser
reduzidos antes que os benefcios desta tecnologia possam atingir a massa de usurios.
[ COUTINHO, 2003]
4.5.4 Necessidade de grandes volumes de dados
O maior obstculo ao DM, no passado, foi a necessidade de armazenar e
administrar montanhas de dados e/ou servidores. Isso por si s j dificultava bastante o
crescimento do mercado de DM.
aceita pelo mercado a afirmao de que 80% do valor de um determinado
grupo de dados podem ser encontrados em 20% dos dados que o compem. Ento,
82

claro que os fornecedores vo fazer de tudo para achar esses 20% e miner-los. [
COUTINHO, 2003]
4.5.5 Complexidade das Ferramentas
Mas mesmo com ferramentas, que permitem a minerao em moderados
grupos de dados, uma terceira barreira ainda permanece: a grande maioria das
ferramentas ainda continua incompreensvel para os usurios comuns.
Isso significa que o DM ainda tem que ser feito no contexto da rea de sistemas,
a quem os usurios tm que submeter as suas solicitaes, esperar por dias, ou semanas,
enquanto um expert processa os dados, para, ento, receberem e examinarem a sada
sumarizada. Se os resultados no satisfizerem os usurios, todo processo tem que ser
recomeado. [ COUTINHO, 2003]
4.5.6 O desafio da preparao dos dados para a minerao
A preparao dos dados para se realizar a minerao envolve muitas e
trabalhosas tarefas num projeto de DM, sendo considerada como 80% do trabalho.
Os dados devem ser relevantes para as necessidades dos usurios, limpos
(livres de erros lgicos ou de entrada de dados), consistentes e livres de excessivas
nulidades.
Estimar a taxa de retorno do investimento de um projeto de DM complicado,
devido ao fato que, como o objetivo da tecnologia descobrir tendncias (em dados)
que no seriam visveis de outra maneira, torna-se dificil estimar tal taxa a partir de algo
que desconhecido. [ COUTINHO, 2003]
Finalmente, a viabilidade de mercado da maioria das ferramentas uma
preocupao das empresas que procuram uma ferramenta confivel, para hoje e para o
futuro. O mercado est abarrotado de fornecedores, desde pequenas empresas que
comercializam apenas este produto, at grandes companhias cuja ferramenta de DM
apenas mais uma das que produz. Assim como qualquer nova tecnologia, a escolha do
fornecedor to importante quanto a escolha da ferramenta.
83

4.6 Implementao de projetos em DM
4.6.1 A regra 80/20
Os analistas concordam, que por dentro de qualquer grande grupo de dados,
80% da informao podem ser encontrados dentro de 20% dos dados. Essa regra fora a
reduo do tamanho do grupo de dados a ser analisado.

Quando se tenta minimizar o tamanho dos grupos de dados, importante ter em
mente que um nmero mnimo de registros necessrio para se ter viabilidade
estatstica. Em geral, um mnimo de 200 registros pode ser analisado de maneira a se
obter resultados estatisticamente viveis, pois um bom tamanho dentro do escopo de
dados de negcio.
No contexto dos negcios, o DM encontra aplicaes adequadas para estudar
aspectos especficos do negcio, o que se pode chamar de Escopo de Anlise. Grandes
quantidades de dados, neste caso, no so necessrios para se chegar a bons resultados.
Os dados de negcio apresentam oportunidades nicas para minerar.
Comparados com outros tipos de dados, como os cientficos, atuariais ou estatsticos,
eles so mais homogneos e intuitivos, alm de proporcionar mais facilidades de
agregao, que podem muitas vezes reduzir o volume de dados crus necessrios para
uma dada operao.
A possibilidade de se fazer previses o fator chave para que os dados de
negcio sejam mais minerveis. Eles so coletados dentro do sistema de um negcio
particular, descrevendo, por exemplo, os clientes daquele negcio. Dados de negcio
limpos tendero a conter valores que se incluiro em certas escalas cabveis. Devido a
eles terem menos excees, mais fcil ao usurio do DM reconhecer tendncias ou
padres. Valores fora do comum em um grupo de dados fazem com que seja mais difcil
minerar. Usando os termos de DM, esses valores excepcionais so chamados de
rudo.
84

A natureza intuitiva dos dados de negcio um outro facilitador para o DM.
Enquanto o dado cientfico normalmente contm valores impenetrveis e muitas
mincias, o dado de negcio est de um lado diametralmente oposto.
Dados de negcio descrevem negcios e so nomeados e guardados pelas
pessoas de negcio. O fato dos dados de negcio serem intuitivamente compreensveis
s pessoas de negcio uma grande vantagem para realizar DM, pois consegue levantar
muitos novos conhecimentos a partir de pequenos ou mdios grupos de informaes. Na
linguagem do DM, essa caracterstica de dados intuitivos chamada de percepo
nativa dos dados.
Os dados de negcio so freqentemente armazenados em formatos agregados.
Esses formatos podem ser muito mais fceis de minerar do que dados crus. Por outro
lado, dados que no so de negcio suportam muito menos sumarizaes desse modo.
Essas agregaes permitem uma minerao proveitosa num grupo de dados muito
menor do que seria possvel com dados cientficos. Minerando agregaes, os usurios
de negcio podem descobrir tendncias em seus negcios, em qualquer nvel que eles
desejem.
Uma outra vantagem importante dos dados de negcio que eles so, quase
sempre, coletados, mantidos e apropriados pelas mesmas pessoas que os usam, isto ,
pelas pessoas de negcio. [ COUTINHO, 2003]
4.6.2 Algumas aplicae de DM e DW
Uma das maiores redes de varejo dos Estados Unidos descobriu, em seu
gigantesco armazm de dados, que a venda de fraldas descartveis estava associada de
cerveja. Em geral, os compradores eram homens, que saam noite para comprar fraldas
e aproveitavam para levar algumas latinhas para casa. Os produtos foram postos lado a
lado. Resultado: a venda de fraldas e cervejas disparou.
O banco Ita, pioneiro no uso de data warehouse no Brasil, costumava enviar
mais de 1 milho de malas diretas para todos os correntistas. No mximo 2% deles
respondiam s promoes. Hoje, o banco tem armazenada toda a movimentao
financeira de seus 3 milhes de clientes nos ltimos 18 meses. A anlise desses dados
85

permite que cartas sejam enviadas apenas a quem tem maior chance de responder. A
taxa de retorno subiu para 30%. A conta do correio foi reduzida a um quinto.
Assim sendo, pode-se perceber que data mining vem sendo aplicado cada vez
mais, onde satisfaz as organizaes, atuando com suas bases de dados, muitas vezes
imensas e repletas de informaes teis para futuras aplicaes, as quais cada vez mais
necessitam de agilidade e confiana para tomadas de decises futuras, tanto a curto
como a longo prazo.
Assim sendo, o interesse por data mining, em particular em dependncias
funcionais, tem aumentado recentemente, principalmente por causa da alta demanda por
transformar grandes quantidades de dados em informaes teis, aonde vem
demonstrando ser uma ferramenta muito importante, aprimorando e objetivando aes
futuras.
86

CAPTULO 5
Discusso qualitativa a respeito de tcnicas
matemticas para a anlise robusta de dados
5.1 Anlise multivariada de dados
As indagaes cientficas so processos de aprendizagem interativa. Os
objetivos de interesse sejam para fenmenos sociais ou fsicos, necessitam ser
especificados e testados a partir de uma amostra de dados. Todavia, a complexidade da
maioria dos fenmenos requer do investigador uma coletnea de dados com muitas
variveis. Devido a estes dados inclurem muitas variveis, o cerne desta metodologia
de estudo conhecido por anlise multivariada.
A necessidade de se compreender a relao existente entre muitas variveis
torna a anlise multivariada um assunto de extrema complexidade. Necessita-se lanar
mo a uma srie de procedimentos matemticos para conseguir inferir alguma coisa a
respeito de um determinado fenmeno.
A anlise multivariada uma mistura de tcnicas estatsticas. Em alguns
momentos buscam-se tcnicas de classificao de dados para se estudar a
interdependncia das variveis, em outros momentos busca-se a classificao de grupos
para se estudar o caso comportamental. Porm, os objetivos dos estudos de investigao
para a anlise de dados multivariada podem-se reduzir a:
1. Reduo da gama de dados ou simplificao estrutural. O fenmeno
a ser estudado representado parcimoniosamente sem o sacrifcio da
perda de informao.
2. Classificao ou agrupamentos. Grupos de objetos similares ou
variveis so criados baseados em suas caractersticas de medidas
estatsticas. Alternativamente, regras para classificao de objetos so
bem definidas para a criao de grupos.
3. Investigao da dependncia entre variveis. A natureza de
dependncia entre variveis objeto de estudo e interesse. Todas as
87

variveis mutuamente independentes so de interesse de investigao
com o propsito de entendimento do fenmeno.
4. Predio. A relao entre variveis pode ser determinada com o
propsito de predizer os valores de uma ou mais variveis baseado na
observao de outras variveis.
5. Elaborao de hipteses e/ou testes. Hipteses estatsticas
especficas, formuladas em termos de parmetros de populao
multivariada, so testadas com o objetivo de validar suposies ou at
mesmo reforar suposies a priori.
Pode-se concluir esta breve viso geral dizendo que o principal objetivo da
anlise multivariada simplificar seus dados sem perda de generalidades para que se
possa extrair o mximo de informao para tomadas de deciso.
5.2 Redes Neurais Artificiais
5.2.1 Introduo
As Redes Neurais Artificiais (RNA) fazem parte do campo de pesquisa em
Inteligncia Artificial. O intuito deste item, no esgotar o assunto, ou seja, ser to
completo teoricamente quanto a um livro texto, porm, mostrar algumas de suas
propriedades e em particular, alm de comentar um pouco sobre seu histrico e algumas
de suas aplicaes no dia a dia do pesquisador e/ou usurio e algumas tcnicas de
aprendizagem.
5.2.2 O Neurnio Biolgico
Pode-se dizer que o estudo das RNA se adequa ao que os pesquisadores
intitulam Modelo Conexionista.
Seus estudos fundamentam-se na estrutura do Crebro Humano, tentando emular
sua forma ''inteligente'' de processar a informao.
88

O Crebro Humano possui cerca de 10
14
neurnios operando em paralelo e
distribuidamente, e cada uma destas clulas esto interconectadas atravs de 10
3
a 10
4

sinapses em mdia.
As sinapses so interaes entre neurnios. O tipo mais comum de sinapse a
chamada sinapse qumica, que se processa da seguinte forma: O processo pr-sinptico
libera uma substncia chamada de substncia transmissora, que se espalha pelas junes
sinpticas entre os neurnios. Neste momento, ou seja, na transmisso de um neurnio a
outro, a sinapse qumica convertida em sinal eltrico, e novamente, isto , j dentro do
outro neurnio, em sinal qumico [SHEPHERD, 1990]. Tudo isso ocorre pela nica
sada (axnio), na qual pode se ramificar em muitas outras ligaes colaterais. O final
do axnio se conecta com os dendritos. Os dendritos so, na verdade, o nvel mais baixo
de comunicao entre os neurnios. Aqui est a explicao do porqu o Homem,
quando recebe um choque eltrico, permanece com sua memria intacta. O
processamento interno ao neurnio qumico no podendo ser perturbado pelo choque
eltrico.
Uma sinapse pode ser classificada como excitatria ou inibitria, admitindo-se
que no pode acontecer ambos os fenmenos num mesmo neurnio.
A tabela 5.1 apresenta um estudo comparativo entre as RNA com o Crebro
Humano.
Tabela 5.1 - Diferenas entre o computador e o crebro humano.

Todo processamento em cada unidade completamente local, isto , depende
somente dos sinais de entrada, que chegam a cada neurnio atravs das conexes,
armazenando o conhecimento emprico necessrio.
89

O conhecimento adquirido, pela rede, atravs do Processo de Aprendizagem.
A eficincia da conexo interneuronial conhecida como peso sinpticos sendo usada
para armazenar o conhecimento [HAYKIN, 1994].
O processo de aprendizagem chamado de algoritmo de aprendizagem e pode
ser classificado como aprendizagem supervisionada e no-supervisionada.
A modificao dos pesos sinpticos uma abordagem tomada emprestada da
teoria de filtros lineares adaptativos, que um campo de pesquisa bem-sucedido da rea
de comunicaes. Como exemplo, temos: Radar, Sonar, Sismologia e a Engenharia
Biomdica.

Figura 5.1 - O neurnio biolgico.
5.2.3 Componentes dos Modelos Conexionistas
Para se modelar um neurnio Biolgico, segundo Rummelhart, defini-se uma
nomenclatura e formalismos capazes de homogeneizar linguagem. Nem todos os
pesquisadores a utilizam, porm, se mostrou extremamente didtica.
Um neurnio uma unidade de processamento de informao que fundamental
para o desempenho da RNA. Na figura 5.2, fica claro que pode-se diferenciar trs tipos
de elementos que compem o modelo:
90

1. O conjunto das sinapses ou conexes (comprimento de conexo). Cada
conexo caracterizada por um peso. Especificamente, um sinal x
i
na
entrada da sinapse j conectada ao neurnio k multiplicado por um peso
sinptico w
kj
. Em nosso estudo, admitimos a seguinte norma. O ndice k
refere-se ao neurnio em questo e o ndice j refere-se a sinapse de
entrada.
2. Um Somatrio que responsvel por todas dos sinais de entrada, com seus
respectivos pesos. A operao descrita constitui uma combinao linear.
3. Uma funo de Ativao que responsvel pela limitao da amplitude de
sada do neurnio de sada. Muitos autores referem-se funo de
Ativao como funo limite, pois limita a amplitude de sada a valores
finitos. Geralmente, utiliza-se o intervalo [0,1] ou como alternativa o
intervalo [-1,1]. Em nosso experimento, utilizamos o segundo intervalo
para melhor visualizar a generalizao de RNA.

Figura 5.2 - Modelo de Neurnio Artificial.
O modelo mostrado na figura 5.2 , tambm, apresenta um valor limite,
conhecido por threshold

, que tem como sua funo, principal, balizar a entrada da


rede junto a funo de ativao. Como uma negativa ao threshold, podemos empregar a
bias, que faz com que a entrada da rede, junto funo de ativao, cresa.
Pode-se representar os termos matematicamente como segue:

=
=
p
j
j k k
x w u
1

e
y u
k k
= ( )
k

91

onde:
x
1
, x
2, ,
x
p
so sinais de entrada;
w
k1
, w
k2, ,
w
kp
so os pesos sinpticos do neurnio k;
u
k
, a combinao linear da sada;

k
, o threshold;
(.), a funo de ativao e,
y
k
, o sinal de sada do neurnio de sada da rede.
Logicamente, essa no a nica maneira de representar uma RNA, porm,
uma das mais utilizadas didaticamente.
A combinao linear (completa), i. e., expressa em funo do threshold :
v u
k k
=
k

5.2.4 Tipos de Funes de Ativao
As funes de ativao, como dito anteriormente, tm como finalidade balizar,
ou seja, limitar os valores de sada da funo. Alguns autores, tambm, referem-se s
funes como neurnios. Abaixo, damos alguns exemplos de neurnios utilizados em
diversos experimentos.
5.2.4.1 Neurnio Lgico (Funo de McCulloch e Pitts)
Para este tipo de funo, temos:

<
=
0 ; 1
0 ; 0
) (
v
v
v j
Correspondentemente, temos como sada

<
=
0 ; 1
0 ; 0
k
k
k
v
v
y
92

onde:
v w x
k kj j
j
p
k
=
|
\

|
.
|
=

1
-

Este modelo baseia-se no fato de que, em um dado instante de tempo, o neurnio
ou est disparando ou est inativo; desta forma, um tratamento discreto binrio dado.
O neurnio, ento, foi definido como tendo dois estados, disparando ou inativo,
correspondendo ao verdadeiro ou falso, 0 ou 1 do clculo da lgica proposicional de
ordem zero.
MCulloch chamou a esta lei do tudo-ou-nada devido ao fato de que em um dado
momento, o neurnio est disparando ou inativo.
5.2.4.2 Neurnio Semilinear
Para a funo semilinear, descrita abaixo, se tem como valor para fator de
amplificao dentro da regio de processamento, 1.
A funo semilinear pode ser interpretada de duas maneiras:
1. Combinao Linear crescente se a regio linear de processamento for
mantida fora da regio de saturao, ou ento;
2. A funo decresce e reduz-se ao seu valor limite (threshold) se o fator de
amplificao da regio linear for definido infinitamente grande.
( )
;
;
;
v
v
v v
v
=
<



<


5.2.4.3 O Neurnio No-linear
sem dvida a mais difundida das funes na modelagem de RNA. Ela
definida como uma funo estritamente crescente que exibe suavidade e propriedades
assintticas. Como exemplo, temos a funo tangente hiperblica, utilizada por ns em
nosso experimento, definida por:
93

( ) tanh
exp
exp
v
v
v
=
|
\

|
.
| =

2
1
1
v
( ) ( ) = v v

A funo hiperblica foi usada por ns para mapear um neurnio cujo intervalo
(-, +) para outro domnio de intervalo (-1,1). A vantagem, desta, que ela
totalmente diferencivel fazendo com que os clculos para o treinamento da rede sejam
melhores aproveitados, melhorando o desempenho da RNA do tipo backpropagation.
Segundo Haykin [1994], verificou-se que o algoritmo de treinamento perceptron
Multicamadas com erros retro propagveis , em geral, muito mais rpido (logicamente
em termos de interaes exigidas pelos algoritmos) com uma funo de ativao
assimtrica do que com funes simtricas, em termos matemticos, a relao :

Alm disso, vale ressaltar, que existem evidncias [HAYKIN, 1991] de que os
fenmenos naturais neurofisiolgicos se comportam de maneira assimtrica tal qual
nossa funo.
5.2.5 Nveis de Treinamento para RNA
Toda caracterstica importante as RNA reside no fato de como feita sua
aprendizagem. Certamente, ainda um fato obscuro, dentro das reas que estudam das
RNA, como feito o processamento da aprendizagem.
Logicamente, sabe-se como classificar o aprendizado e a que nveis acontecem.
Em Pessoa [1990], apresentado os Paradigmas de Aprendizagem que se
dividem em:
i) Auto-associador;
ii) Associador de Padres;
iii) Classificador;
iv) Detector de Regularidades.
94

As trs primeiras classificaes, segundo Pessoa [1990], foram tidas por
Rumelhart como sendo aprendizado associativo, e a quarta como detetor de
regularidades, propriamente dito. No detector de regularidades, o padro de sada no
apresentado a rede tendo ela mesma que descobrir. No caso Associativo, tanto os dados
de entrada quanto os de sada so dados que a rede ter de mape-los da melhor forma
possvel.
Quanto ao nvel de Aprendizagem, podemos classifica-lo como:
i) Supervisionado - Os resultados a serem obtidos pela rede so fornecidos
integralmente. Por exemplo, em um associador de padres os resultados, ou
seja, os padres de sada so dados ao sistema para que a rede aprenda
associar os estmulos corretamente.
ii) No-supervisionado - Nenhum tipo de sinal ou informao fornecido ao
sistema. O sistema aprende por si as propriedades interessantes dos
estmulos de entrada. O treinamento no-supervisionado mais plausvel em
sistemas de aprendizagem cujo o sistema biolgico. Desenvolvido por
Kohonen e outros pesquisadores, o sistema no necessita de vetores alvos
(target). Nenhuma comparao predeterminada para sada. O conjunto de
treinamento consiste, somente, nos vetores de entrada. O algoritmo de
treinamento modifica seu peso sinpticos para produzir os vetores de sada
que so consistentes, i.e., mapeiam vetores que so suficientemente similares
produzindo, ento, os padres de sada [WASSERMAN,1989].
5.2.5.1 Algoritmo com Aprendizagem Supervisionada
Ser discutido, nessa seo, basicamente, trs tipos de algoritmo
supervisionados. Na realidade, veremos que os Perceptrons, a Regra Delta (Regra de
Widrow-Hoff) e o algoritmo Backpropagation (Perceptron com multicamadas e erros
retropropagveis) so generalizaes em torno de uma mesma idia.
Os algoritmos Perceptron e Regra Delta no sero discutidos em profundidade,
pois fugiria da linha de raciocnio. Ser apresentaredo somente o conceito bsico. O
leitor interessado em se aprofundar nos conceitos, pode l-los em [HAYKIN, 1991]
95

5.2.5.2 Perceptron
O perceptron foi idealizado por Rosemblatt, no final da dcada de 50. uma das
formas mais simples de RNA, possui uma nica camada (camada de sada) que pode ser
treinada, atravs das variaes dos pesos sinpticos e suas bias, para convergir para o
vetor alvo (target) quando apresentado o correspondente vetor de entrada.
A prova de convergncia do algoritmo conhecida como Teorema de
Convergncia do Perceptron [HAYKIN, 1991]. O teorema prova que, caso os padres
sejam linearmente separveis, eles sero divididos por um hiperplano em duas classes
distintas.
O perceptron , basicamente, um classificador de padres devido a sua singular
camada de neurnios.
Classe C
1
Classe C
2
x
1
x
2
0
w
1
x
1
+ w
2
x
2
- = 0

Figura5 3 - Classificao bi-dimensional de duas classes de padres com sua condio
de contorno.
5.2.5.3 Algoritmo do Perceptron
O algoritmo do Perceptron , basicamente, uma combinao linear de suas
entradas com seus pesos sinpticos.
Observando a figura 5.3, podemos descrever, de maneira simples, o algoritmo da
seguinte maneira:
Passo 1: multiplicado cada uma das entradas (x
i
) com seus pesos
respectivos (w
i
);
96

Passo 2: Aps ter sido feitas todas as respectivas multiplicaes,
efetuado o somatrio e subtrado o valor de threshold ();
At agora em termos matemticos, tem-se:

Passo 3: O resultado do passo 2, aplicado a uma funo limitadora que
verificar se o neurnio produziu um resultado +1 ou -1, para
poder ser tomada a deciso de qual das duas classes ser
classificado aquele sinal de entrada.
No caso de perceptron elementar, haver somente duas classes C
1
e C
2
(figura
5.3) que sero separadas em duas regies de deciso, divididas por um hiperplano
definido por:
w x
i i
i
p
=
=

1
0

Minsky e Papert [1969] provaram que o perceptron de Rosemblatt era limitado.
Provaram, com slidos conhecimentos matemticos, que o perceptron no era capaz de
calcular o XOR (ou exclusivo) e outras generalizaes, porm, em seu ltimo captulo,
foi formulada uma conjectura, em que dizia que os problemas do perceptron poderiam
ser resolvidos, caso fossem feitas algumas modificaes.
Com a variante conjecturada por Minsky, foi dada a origem as Redes Neurais
com Multicamadas.
5.2.5.4 Regra Delta ( Regra da Mnima Mdia Quadrtica -LMS)
O elemento Adaptativo linear (ADALINE - Adaptive Linear Element), foi
desenvolvido por Widrow e Hoff, no incio da dcada de 60. uma mquina de
classificao de padres adaptativa que utiliza o Algoritmo LMS [HAYKIN,1991], que
tem por caracterstica principal a minimizao do quadrado dos erros de sada.
Uma outra caracterstica importante que a sada do sistema ADALINE do
tipo analgica e no mais binria, como sugerido, originalmente, por McCulloch e Pitts.
97

Pode-se definir o algoritmo ADALINE da seguinte forma, como proposto por
[HAYKIN,1991] Given a set of input patterns and the associated desired outputs, find
the optimum set of synaptic weights w
1
, w
2 . . . . .
w
p
, and threshold , to minimize the
mean-square value of the actual error e.
Esta classe de redes importante por trs razes:
A primeira, que sua origem terica advm do estudo de filtros lineares
adaptativos; em segundo lugar, foi um estudo pioneiro na dcada de 60 e, finalmente,
por ter dado desenvolvimento terico culminando na classe mais geral de RNA
conhecidas por multicamadas, incluindo elementos no-lineares.
Em conseqncia ao desenvolvimento do algoritmo LMS, seu conceito foi
estendido para solucionar problemas de equalizao adaptativa para telefonia,
suprimindo ecos ao longo de circuitos de comunicao distncia.
5.2.5.5 Perceptrons Multicamadas com Erros Retro-propagveis
(feedforward backpropagation networks)
Nesta seo, ao contrrio das duas precedentes, ser esminuciado o conceito
terico do algoritmo de retropropagao de erro sem redes do tipo multicamadas.
Um perceptron multicamadas tm por caracterstica um conjunto de sensores,
que constituem uma camada de entrada de dados (alguns autores, no contabilizam
como sendo uma camada, alegando no haver processamento); uma ou mais camadas
escondidas e uma camada de sada por onde dada a resposta final e/ou parcial dos
resultados.
O sinal, a partir da camada de entrada, propagado camada por camada, sempre
no sentido frente, da o termo em ingls, feedforward direction.
O algoritmo de retropropagao de erros tem sido apresentado como soluo de
diversos problemas e trabalha de maneira supervisionada.
Este algoritmo baseado na Regra de Aprendizagem por correo de erros, ou
seja, uma generalizao da Regra Delta que utiliza o algoritmo LMS, para ir
minimizando seus erros a partir de um vetor alvo (objetivo final); da o fato de ser
tratado por aprendizagem supervisionada.
98

5.2.5.6 Uma Viso geral do Algoritmo
O processamento do algoritmo dividi-se em dois passos:
Passo Frente (feedforward pass)
O sinal de entrada (dados de entrada) transmitido camada a
camada, sendo processado pelos neurnios, para se conseguir
descobrir uma determinada caracterstica para aquele padro
(sinal). Ao chegar, na camada de sada, o conjunto de
caractersticas comparado com o valor desejado gerando, ento, o
erro. Geometricamente, podemos entender o erro como sendo
distncia entre dois pontos.
medida que o sinal transmitido pela rede, os pesos sinpticos
so fixados constantes e aleatrios;
Passo para Trs ( Backward pass)
Quando o conjunto de caractersticas comparado, na camada de
sada e supondo-se ainda, um erro grande, todos os pesos sinpticos
so ajustados (em cada camada), e o erro, ento, retropropagado,
isto , contra as conexes sinpticas, camada a camada.
5.2.5.7 Caractersticas de um Perceptron Multicamadas
Os perceptrons multicamadas possuem trs camadas, cuja a combinao forma a
habilidade da rede aprender caractersticas inerentes ao padro de entrada (Vetores de
Entrada).
As Caractersticas so:
A funo de ativao no-linear
A caracterstica da no-linearidade fato marcante, uma vez que a
funo contnua, e conseqentemente diferencivel; em oposio
a funo de teste de Rosemblat que era discreta.
99

Sua importncia reside na relao de entrada e sada, permitindo
maior generalizao na sada, no ficando restrita a valores
discretos.
Camadas Escondidas
A rede possui uma ou mais camadas de neurnios escondidas,
responsveis pelo processamento do algoritmo, ou seja, possuem
habilidade de extrair caractersticas do padro de entrada (vetores
de dados na camada de entrada).
Alto Grau de Conectividade
Toda rede conectada pelas sinapses neuroniais. Isto significa que
todos os neurnios se conectam um a um, logicamente, com a
camada posterior.
Todavia, da mesma forma que as caractersticas acima facilitam o aprendizado,
tambm podem prejudicar.
O conhecimento ainda se apresenta restrito, quanto ao comportamento dos dados
no processamento das camadas internas. A no-linearidade e a alta conectividade da
rede fazem com que a anlise terica e matemtica da rede se torne, extremamente,
difcil. Alm disso, o uso dos neurnios escondidos torna o aprendizado da rede uma
caixa preta sem que consigamos entender como a rede consegue agrupar certas
caractersticas que a ''olho nu'' no se v. (Problema caracterstico em nosso
experimento).[HAYKIN,1991]

Figura5.4 - Exemplo de Perceptron Multicamada com alta conectividade
100

5.2.5.8 Algoritmo Backpropagation
Adotar-se- a notao utilizada por Haykin [1991].
Consideremos uma Rede cuja camada de entrada se encontra esquerda e a de
sada direita. Sejam:
i, j, k Z* onde o neurnio i se encontra esquerda do neurnio j e, por sua
vez, o neurnio j se encontra a esquerda do neurnio k;
A interao n se refere ao n-simo padro de treinamento apresentado pela
rede;
a soma do erro quadrtico para cada interao n, sendo que sua mdia
sobre todos os valores de n (conjunto total de treinamento) produz o erro
mdio quadrtico, designado aqui por
( ) n

av
n ( ) ;
e
j
(n), o erro do sinal, na sada do j-simo neurnio para a interao de n;
d
j
(n), o valor esperado (desejado), para a sada do neurnio j e utilizada
para calcular e
j
(n), na interao de n;
y
j
(n), o sinal funo, i.e.,o sinal de sada do neurnio j e de entrada para o
neurnio k na n-sima interao;
, peso sinptico entre os neurnios j e k na n-sima interao. A correo
aplicada para esse peso denotado por
w
ji
w n
ji
( ) ;
v
j
(n), denotado como sendo o nvel de atividade interna do neurnio na n-
sima interao, constituindo assim um sinal aplicado. A no-linearidade
(funo custo), em conjunto com o neurnio j na interao n;
(.), a funo de atividade que descreve a funo relacional entre a entrada
e sada, associada ao neurnio j;

j
,


o

threshold

aplicado

ao

neurnio j. Para efeito de representao pode ser
denominado por w
oj
=
j
= -1;
101

O i-simo elemento do vetor de entrada (padro) denominado por x
i
(n);
O k-simo elemento, sobre todos os elementos do vetor de sada
denominado por o
k
(n);
o parmetro conhecido por razo de aprendizagem.
5.2.5.9 Algoritmo Backpropagation propriamente dito
Passo 1: Iniciar a configurao da rede, pesos sinpticos e valores de
threshold, com valores pequenos e distribudos
uniformemente aleatrio, para que no haja saturao no
momento do treinamento;
Passo 2: Apresentar os padres de treinamento. necessrio, neste
momento, apresentar os vetores de treinamento, com seus
respectivos valores alvos (target). A Quantidade de vezes que
ser apresentado, um determinado padro ou o conjunto
chamado de poca.A cada poca, interessante que o vetor de
treinamento seja misturado, ou em ltima instncia, a
primeira vez somente. Isso pode ser feito para que a rede no
vicie na apresentao contnua de um mesmo padro. Aps,
Calcular a Sada.
Passo 3: Calcular_Sada (Processamento Frente - Forward
Computation).
Camada a camada, a partir da primeira, calcule os valores de
sada at atingir a camada de sada, quando ento ajustado o
peso da camada.
Passo 4: Ajuste dos Pesos (Camada de Sada)
Para cada neurnio da camada de Sada, ajuste o peso
onde:
w
ji
ji j i
; com

j j j
y d
j j
y y =

onde d
j
o valor da sada desejado.
w y =
( )( ) 1 ;
102

Passo 5: Ajuste dos Pesos (Camada Escondida - Backpropagation
Computation)
Atualize o peso do neurnio n w
w y =
w
ji

i
da camada escondida, que
est ligado a outro neurnio n
k
na camada anterior.


onde y
ki kj k
rj i i
y y = ( ) 1
k
a sada de n
k
que estimula n
i
via e o erro
relativo do neurnio n
ji rj
i
representado por:



Uma vez que todas as camadas tenham sido ajustadas,
conexo a conexo, cheque a magnitude do erro. (Clculo do
Erro)

ij j
w

Passo 6 Clculo do Erro


H varias formas de se verificar a magnitude do erro.
Em nosso caso especfico (experimento desenvolvido), foi
adotado a abordagem do clculo do erro global. Definimos
um erro desejado SE alcanado Ento houve aprendizado
SENO volte ao passo 1.
5.2.6 Breve Histrico das RNA
Uma vez definida as caractersticas bsicas e atuais, interessante verificar
como ocorreu a concepo e aperfeioamento desta tcnica.
Ao final do sculo XIX e o incio do sculo XX, S. Freud e William James
estudam o funcionamento do sistema neurolgico dos Seres Vivos e, em particular, dos
Seres Humanos.
Em 1945, Surgiu a ciberntica. McCulloch e Pitts modelam o primeiro
Neurnio.
103

Pitts com o neurnio lgico mostrou como as redes poderiam e conhecer
padres.
Donald Hebb, 1950, definiu uma teoria, ainda que especulativa, sobre o
aprendizado a nvel molecular (sinptico). Esses princpios foram utilizados por Marvin
Minsky na construo do Snark, primeiro neurocomputador de que se tem notcia.
Por volta de 1957, Frank Rosemblatt concebeu um dispositivo denominado
PERCEPTRON, ou seja, uma RN automatizada capaz de aprender de acordo com as
regras propostas por Hebb (renasce a ciberntica).
Mais tarde, Minsky mostrou que os perceptrons s aprendiam relaes lineares,
o XOR (ou exclusivo) no podia ser aprendido pela rede. Neste momento, comea um
certo desprendimento, ou melhor, desinteresse pelo estudo das RNA.
Os pesquisadores passaram a investir nos smbolos (Lgica). Em 1980, os
simbolistas (grupo de pesquisadores que se opunham aos conceitos do paradigma
conexionista) atingem uma assntota terica. Passaram a questionar o que havia (ou no
havia) no paradigma simbolista que impedia a realizao de tarefas inteligentes,
eficientemente, mesmo com crescimento de processamento dos computadores
(velocidade).
Neste momento, ressurgem os conexionistas afirmando que era preciso estudar a
estrutura do processamento da informao inteligente, ou seja, os ncleos cerebrais.
A grande questo conexionista era entender os processos computacionais
realizados pelas redes neurais.
Hopfield, em 1984, definiu uma rede cujo processo computacional era claro,
determinstico e ligado memria humana. Com este resultado, Hopfield voltou
pesquisa intensa sobre o crebro/conexionista.
5.2.6.1 Mas para que servem as Redes Neurais Artificiais?
As aplicaes em Redes Neurais so inmeras. Muitas pessoas recebem suas
primeiras informaes a respeito de RNA lendo a respeito de tcnicas de aplicaes em
predies no mercado financeiro. Muitas das atuais tcnicas de anlise Financeira esto
sendo executadas por RNA.
104

Uma outra aplicao se encontra na linha de pesquisa para reconhecimento
ptico de Caracteres.
Na rea bancria, se tem conhecimento da instalao de RNA para deteco de
Cartes de Crdito falsos, como o caso do Banco Mellon nos Estados Unidos.
Na medicina, as RNA tm sido usadas para tomada de decises no diagnstico
de pacientes, que apresentam um mesmo histrico de sintomas.
Alm dessas aplicaes poderamos ainda citar:
Controle de processo industrial;
Validao e Classificao de Dados;
Reconhecimento da Fala e da Voz;
Reconhecimento de fonemas;
Restaurao de Imagens;
Classificao de Objetos;
Reconhecimento de Assinaturas;
Anlise de Sinais;
Filtros contra Rudos Eletrnicos (Smoothing).
Logicamente, a lista no esgota aqui, aparecendo a cada dia novas aplicaes
para RNA.
105

5.3 Transformada Wavelet
5.3.1 Introduo
A transformada Wavelet um dos aspectos importantes do presente estudo, uma
vez que esse conceito foi utilizado no pr-processamento do estmulo dos registros da
base de dados.
O objetivo pura e simplesmente apresentar o contedo essencial de maneira
didtica, demonstrando algumas de suas vantagens e desvantagens em comparao a
outras tcnicas, inclusive secular transformada de Fourier.
O leitor interessado no assunto ter o mnimo de informao necessria, nesta
moderna tcnica, capacitando-o a buscar e compreender textos mais complexos como
[VETTERLI,1995].
Como dito por Masters em [1994], caracteriza-se a transformada wavelet da
seguinte forma: If one needed to characterize wavelet in one word, a good candidate
for that single word would be scale. Como veremos, tudo o que diz respeito a wavelet,
sem dvida alguma, est relacionado escala. Inclusive, quando falo de algumas
caractersticas da cclea, fao analogias com a funo wavelet, sendo uma delas, o
escalonamento freqencial ao receber o estmulo sonoro.Na tentativa de suprir este
problema, surge a necessidade de analisar o sinal, tanto no domnio temporal quanto
freqencial, isto , a anlise deveria ter uma boa resoluo tempo-freqncia.
H divergncias entre os diversos autores quanto a primeira meno sobre
Wavelet. Segundo Vetterli, em [idem], a primeira meno aparece no apndice da tese
de A. Haar (1909). Outros autores mencionam os trabalhos de Lusin e Calderon, 1930,
como os primeiros. O importante que uma das caractersticas da Wavelet de Haar o
suporte compacto, o que implica dizer que qualquer ponto fora do intervalo especificado
para funo ser nulo. o conceito de suporte compacto que permite a transformada
Wavelet levar do domnio temporal para o domnio tempo-freqencial. Infelizmente, as
Wavelets de Haar no so continuamente diferenciveis, o que limita algumas de suas
aplicaes.
106

J.Morlet, geofsico francs, a partir de estudos anteriores, criou uma funo que
multiplicava uma funo harmnica complexa com uma funo gaussiana, a qual
chamou de analisante (funo janela). A funo analisante pode ser ajustada - dilatada
ou contrada (desta forma, quanto maior a largura da janela, menor os picos de
freqncia; em conseqncia, maior resoluo temporal. E quanto menor sua largura,
maior e melhor a resoluo freqencial).
Posteriormente, Yves Meyer, matemtico francs, reconhece trabalho de Morlet,
como sendo parte do campo de estudos em anlise harmnica, apresentando uma srie
de famlias de funes Wavelet, que provaram ser mais eficiente para a modelagem de
fenmenos complexos.
A pesquisa de Meyer foi comprovada por dois pesquisadores americanos,
Sthephane Mallat, da Universidade de Nova York, e Ingrid Daubechies, dos laboratrios
Bell.[VETTERLI,1995]
Muitas das famlias de funes apresentadas por Meyer apresentam
propriedades, como, por exemplo, ortogonalidade, que a funo de Morlet no possui.
5.4 Tcnicas de Anlise
5.4.1 Anlise de Fourier
Geralmente, muitos autores descrevem as tcnicas de anlise espectral (baseados
nas Tcnicas de Fourier) em conjunto ou como uma preparao para se introduzir as
tcnicas de anlise Tempo-freqncia (TW).
A todo instante, levar-se- em considerao que a representao de Fourier para
funes, como uma superposio de senos e cosenos, tem se apresentado, em todas as
partes, como soluo, tanto numrica como analtica, de equaes diferenciais e,
tambm, para anlise e tratamento de sinais de comunicao. As anlises de Fourier e
Wavelet apresentam uma ligao muito forte, como veremos adiante.
As tcnicas baseadas na anlise de Fourier so:
107

A Transformada de Fourier;
A Transformada de Fourier Discreta;
A Transformada de Fourier com Janela Deslizante;
A Transformada Rpida de Fourier.

Figura 5.5 - A Transformada de Fourier para sinais com freqncia varivel
108


Figura 5.6 - Transformada de Fourier com Janela Deslizante.
5.5 Transformada Wavelet Propriamente Dito
5.5.1 Anlise Wavelet (Representao Tempo-Freqncia)
Quando se deseja a expanso de um sinal, a idia principal, dada as funes
Bases a localizao no tempo e na freqncia. Na Transformada de Fourier, por
exemplo, as funes utilizadas na anlise so infinitamente precisas no que tange a
109

localizao freqencial, porm, muito pobre no que diz respeito ao tempo, devido a sua
extenso infinita.
Ao criar-se uma funo, ou melhor, uma famlia de funes que pudesse-nos dar
localizao precisa no tempo e na freqncia seriam necessrias, entre algumas
caractersticas que veremos, duas principais.
Translao
Uma translao no tempo de , resulta na multiplicao por um fator de
fase no domnio freqencial, isto :


t
0
t ( ) f t
0
f ( )
e F

Convencionalmente, uma translao na freqncia resulta num fator de
fase, ou modulao por uma exponencial complexa, no domnio
temporal.


w
jwt
0
( )
F w w e
jw t
0
t ( )
0

Escalonamento
No tempo, resulta em um escalonamento inverso na freqncia, como
dada na seguinte transformada:

f at ( )
1
0
a
F
w
a
a
|
\

|
.
| ;

A partir dessas duas caractersticas fundamentais, podemos definir uma
famlia de funes do tipo:


a
t b
a
a b ; ,

|
\

|
.
| 0 R
a b
t
,
( ) =
1


Onde chamada Wavelet me ou Wavelet base, que tem sua
110

localizao tanto no tempo quanto na freqncia. ( ) t
H
, geralmente,
um filtro passa-banda. Quando a muito grande (a >> 1) corresponde a
uma funo cuja tendncia possuir muitos termos para serem
analisados.

Para pequenos, as (0 < a < 1) tendem a ter termos menores no
comportamento do sinal.

Tudo isso, levar a seguinte concluso: escala proporcional a durao
das funes bases usadas na expanso do sinal. Matematicamente, tem-
se:



onde { completo em H* (Espao de Hilbert).

No presente trabalho, considera-se somente o fato de quando { for
uma base, isto , os vetores
{ } f i
i i
i
=

; Z;
i
}
i
}
i

i
so linearmente independentes (LI).


Uma funo f(t) definida em R dita uma funo no espao quadrtico-
integrvel, ou seja, no espao de Hilbert L
2
(R), se f t ( )
2
integrvel,
isto ., f(t)
2
dt <
R t

, onde seu produto interno em L


2
(R) definido
por < >=

f
t
,
R
f g t g t dt ( ) ( ) e sua norma, distncia, definida por
f f =< f f t
t
2
>=

, (
R
dt )
2


Neste contexto, define-se a Transformada Wavelet Contnua de uma
funo f L
2
(R) como:

111


Tf a b f
a
f t
t b
a
dt
a b
( , ) , ( )
,
=< >=

|
\

|
.
|

a b ,
eq.(5.4.1.1)

Aqui, desempenha o mesmo papel que e
iwt
, na Transformada de
Fourier.

Observe que se a for constante, pode-se interpretar (eq. 5.4.1.1) como
uma convoluo da funo f (t) ,com a analisante
a b ,
.

Desta forma, a representao final da transformada Wavelet uma
sucesso de convolues da funo f, com uma analisante, cuja largura,
tamanho da janela, varivel.

I. Daubechies apresenta a forma discretizada dos parmetros a e b.

a a ( largura da janela)

(deslocamento da janela)
m
=
0
b nb a
m
=
0 0
C
w
dw

()
= <

$
2

Note a dependncia do deslocamento em relao largura da janela.


5.5.2 A Funo Inversa
H maneiras de achar a funo inversa da transformada Wavelet
[VETTERLI,1995], porm, ser adotada a primeira utilizada.
A fim de reconstruir-se um sinal ou uma funo f que tenha sido transformada
por uma transformada wavelet, defini-se uma constante (condio de admissibilidade).
eq (5.4.1.2)
A finitude dessa constante, restringe algumas funes L
2
(R) que podem ser
usadas como Wavelet mes ou Wavelet bsicas.
112

Em particular, se uma funo analisante, com energia finita,
conseqentemente, L

+
$

+
C
2
(R). Assim temos:
()dt <


Desta forma, temos que uma funo contnua em R e , a partir de (eq. 2)
verifica-se que anula-se na origem, ou seja, .
$
()dt =

0
Assim, o grfico da wavelet me, uma pequena onda (da o nome wavelet -
ondinha). Com a constante , segue a reconstruo da frmula.

f t
C
t a
t b
a
dadb
a
f
a b
( ) ( ) , =
|
\

|
.
|

1
1
2
2

R
2
R
Observe que o mesmo ncleo a
t b
a

|
\

|
.
|
1
2

, com exceo do complexo


conjugado, usado para definir ambas as frmulas, ou seja, o clculo da transformada
wavelet e sua inversa.
Desde que
a b ,
t ( ) possa ser chamado de ''dual'' (recproco) da wavelet me,
logicamente, no se pode esperar que esse ''dual'' (recproco) seja nico. Logo, h vrias
maneiras de se calcular a TW
-1
.
5.5.3 Princpio da Incerteza
Neste momento, interessante definir alguns parmetros de forma a mostrar que
a funo analisante possui rea constante com dimenses variveis [CISTER,1995].
Por definio, existe o centro temporal e o comprimento radial de dados,
respectivamente, por:
t t g t
*
( ) =

dt
+
2

g c
t t g t dt
2
=

( ( )
)
2
+

113

Isso s possvel devido ao princpio de Incerteza de Heisenberg.
Suponha g(t) como uma funo e T[g] sua transformada de Fourier sendo t seu
centro temporal e
*

g
seu raio temporal. T[g] possui w
*
seu centro freqencial e
seu raio freqencial.
T[ ] g
O que se tem at agora :

t b
a
g

a
t t at b
g
1
1
= = +
* *
; eq.(5.4.1.3)

t b
a
g

a
t t at b
g
2
2
= + = + +
* *
; eq.(5.4.1.4)
(t
1
-b)/a (t
2
-b)/a t*
g g
-
-
-
-
-
-
-
-
-
-
-
-
Tempo
F
r
e
q

n
c
i
a

Figura 5.7 - Janela Temporal
Desta forma, a janela temporal vai ser formada pelo par ordenado
, com seu centro e sua largura
.
[ , ] [ , ] t t at b a at b a
g 1 2
= + + +
t t a
g 2 1
2 =
* *
g

*
( )
( ) at b +
Sabe-se que TF g
t b
a

`
)

(
w
1
w
2
proporcional aw, por isso, tem-se os extremos
para freqncias iguais a e a .
aw w w
w
a a
g
g
1 1
= =
|
\

|
.
|
|
\

|
.
|
*
$
$


*
eq.(5.4.1.5)
aw w w
w
a a
g
g
2 1
= + =
|
\

|
.
| +
|
\

|
.
|
*
$
*
$

eq.(5.4.1.4)
114

aw
2
w*
g/a g/a
aw
2
-
-
-
-
-
-
-
-
-
-
-
-
^ ^
Freqncia
T
e
m
p
o

Figura 5.8 - Janela Freqencial
Assim, temos o lado da janela na freqncia, dado por
[ , ] ,
$ $
w w
w
a a
w
a a
g
1 2
=
|
\

|
.
|
|
\

|
.
|
|
\

|
.
| +
|
\

|
.
|

(

* *
g
, centrada em
w
a
*
e sua largura dada por
2
$ g
a

[( , ) ( , )] t t w w x
.
Desta maneira, pode-se definir, geometricamente, a janela como
.
1 2 1 2
Observe que sua rea dada por 2 2 4 a
a
g
g
g g


$
$
= que independe do
parmetro de escala a. Em outras palavras, se um dos lados da janela cresce, o outro,
necessariamente, decresce em proporo para manter a rea da funo analisante
constante (Figura 5.9).
--------
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
-
--------------------
-
-
-
-
-
-
-
-
t
1
w
1
t
2
w
2
Tempo
F
r
e
q

n
c
i
a

Figura5. 9 - Proporcionalidade entre as janelas tempo e freqncia
115

5.5.4 Propriedades da Transformada Wavelet
A transformada wavelet apresenta algumas propriedades que so interessante
citar.
Linearidade
TW TW TW [ ( ) ( )] [ ( )] [ ( )] s t y t s t y t + = +
Translao no tempo
se TW[ ( )]
,
s t S
a b
=
ento TW[ ( ) s t t ( , ) S a b t =
0 0

Relao de Energia da Transformada de Wavelet
A energia do sinal na transformada de wavelet dada por:

E
C
S a b
a
dadb =

1 1 2
2

( , )
R
2


onde C a condio de Admissibilidade.

Transformada Wavelet Inversa


A Transformada Wavelet admite uma transformada inversa, porm no
de forma biunvoca, isto , existem vrias frmulas de reconstruo do
sinal.
5.6 Otimizaes utilizadas para modelo de classificao de
churners
Para o presente estudo foram utilizados dois tipos de otimizao para gerao do
modelo de classificao a ser proposto ao final do estudo. Para ambas as otimizaes
foram utilizados os valores default do software. Portanto, coube ao pesquisador,
116

somente, a anlise dos resultados finais gerados. Tais otimizaes foram: algoritmo
gentico que possibilitou a otimizao do modelo em redes de base radial (RBF) e o
valor entrpico da informao, para o caso da escolha e otimizao das redes
multicamadas do tipo perceptron
O algoritmo gentico fez a busca do vetor soluo (strings) atravs de uma
populao inicial escolhida aleatoriamente e modificada atravs de operaes genticas
tais como a mutao, crossover e operadores genticos em analogia como o processo
natural de seleo. Como ser visto no captulo 6, descrio do experimento, tal
otimizao foi to importante que todas as redes neurais escolhidas para a modelagem
do modelo, recaram nas redes neurais do tipo RBF. Embora, o conceito de entropia da
informao tambm seja uma otimizao robusta, para certos modelos, principalmente
os estatsticos, nenhuma escolha, entre as redes de mais alta taxa de acerto, recaiu nas
redes multicamadas do tipo perceptron.
As redes de funo de base radial (RBF radial basis function) assim como as
redes MLP so supervisionadas e ambas consideradas aproximadores universais e
possuem algoritmo backpropagation todavia, diferem quanto sua arquitetura e
caractersticas.
A construo de uma RBF, envolve trs camadas que se diferenciam entre si. A
primeira camada, camada de entrada, formada por unidades sensoriais, ou seja, ns
que conectam a rede ao seu ambiente. A segunda camada a nica camada escondida
na rede. a segunda camada que a responsvel pela aplicao no-linear do espao
de entrada para o espao oculto que quase sempre possui uma alta dimensionalidade. A
terceira camada a camada de sada e totalmente linear. A terceira camada a
responsvel pela resposta da rede ao padro inserido na camada de entrada. Segundo
Cover (1965, apud HAYKIN, 1991, p. 284) ... um problema de classificao de
padres disposto em um espao de alta dimensionalidade tem maior probabilidade de
ser linearmente separvel do que em um espao de baixa dimensionalidade da a
razo e justificativa matemtica para uma estratgia de uma transformao no-linear
seguida de uma transformao linear. Um outro ponto muito importante para o uso de
uma RBF que o fato de se estar trabalhando com uma dimenso grande na camada
oculta viabiliza uma melhor aproximao para o mapeamento de entrada-sada suave.
117

Segundo Mhaskar (1996, apud HAYKIN, 1991, p. 284) quanto maior for a dimenso do
espao oculto, mais precisa se a a aproximao do padro de entrada classificao.
A presente seo no visa apresentar o conceito de uma RBF to precisamente
quanto a um livro didtico, todavia no pode-se esquecer de que as redes do tipo RBF
so rigorosamente definidas matematicamente atravs do Teorema de Cover, que trata
da separabilidade de padres. O Teorema de Cover descreve que para um RBF realizar
uma tarefa complexa de classificao de padres, o problema transformar no-
linearmente, a partir de uma espao de alta dimensionalidade, at a aproximao final
do padro de entrada.
Para efeito de compilao de idias, a tabela 5.x apresenta uma comparao
para ambas as arquiteturas.
Tabela 5.2 Tabela comparativa entre as redes MLP e RBF

De maneira geral, a aproximao de um mapeamento de entrada sada no-linear
exige um nmero menor de parmetros para as redes do tipo MLP comparada a
aproximao pela RBF e um mesmo grau de preciso. As caractersticas lineares da
RBF esto mais prxima, em semelhana, as redes de Rosenblatt do que com o
perceptron multicamadas. Mas as RBF conseguem uma melhor aproximao do
118

mapeamento entrada-sada, em relao as MLP, devido as transformaes no-lineares
arbitrrias impostas ao espao de entrada.

119

CAPTULO 6
DESCRIO DO EXPERIMENTO
6.1 Problema
O experimento visou classificar/predizer clientes que possuam inclinao e/ou
tendncia a evadirem da base de dados de uma empresa de telefonia mvel. A
populao composta por determinado segmento de clientes. Esses clientes possuem
perfil de pessoa jurdica e que possuem, em mdia 4 linhas telefnicas mveis e so
considerados heavy users , isto , clientes que retm um alto ndice de minutagem ao
ms.
O experimento inicia com a busca ideal da amostra. Para tanto foram feitos
vrios ensaios com tcnica de amostragem bootstrap, que buscou entre as variveis
escolhidas, a mdia ideal, ou seja, a que refletisse os mesmos parmetros da populao.
Foram considerados os valores de parmetros para a amostra o intervalo de confiana de
95,5% e 2% de erro amostral. Esses valores foram distribudos proporcionalmente para
ambos os extratos. Assim sendo, a probabilidade de se achar um ativo dentro do grupo
eram de 93% contra 7% de se achar um inativo. O rigor da escolha do erro amostral
deveu-se ao problema de se retirar da base comportamentos exprios e/ou fraudulentos.
A escolha das variveis foi sugesto do especialista snior que possui elevado
conhecimento do mercado e experincia acima de 15 anos na rea de telefonia. A
populao para esse segmento maior que 10000 clientes, sendo portanto, para fins de
clculos amostrais, uma populao infinita.
As variveis tinham por definio a seguinte descrio:
V1: Adicional em roaming - O cliente paga ao receber ligao;
V2: Chamada internacional em roaming;
V3: De mvel para fixo;
V4: De mvel para mvel mesma operadora;
V5: De mvel para mvel de outras operadoras;
V6: De mvel para fixo efetuando DDD;
120

V7: De mvel para outro mvel mesma operadora em roaming;
V8: De mvel para mvel corporativo;
V9: De mvel para mvel de outras operadoras em roaming;
V10: Servios diversos 0800, 0300, auxlio a lista.
O tamanho da amostra foi de 817 registros (IC 95,5% e erro de 2,0 %). Aps a
devida limpeza nos dados, a quantidade de registros caiu para 722 registros (IC de
95,5% erro de 1,89%).
A estratgia de escolha dos registros foi a de escolher 12 meses completos sendo
tirado a fotografia de status, ativo ou inativo, no 13 ms. Dessa forma, a massa de
dados foi escolhida entre os meses de agosto de 2004 a julho de 2005, tendo sido
retirado o status ativo ou inativo, para o ms de agosto de 2005.
A primeira preocupao foi a limpeza (cleaning) da massa de dados. Embora se
tenha buscado a amostra ideal isso no impossibilitou a vinda de registros sujos. Uma
dessas sujeiras era definir o que era um comportamento de evaso (atrito/churn) ou um
comportamento de fraude (risco), ou mesmo o retrato de clientes entrantes entre os
meses selecionados para o estudo.
A limpeza dos dados foi auxiliada pelo especialista que mostrou um possvel
comportamento de fraude. Os registros de clientes fraudulentos no tinham os doze
meses completos com as devidas minutagens. Seu comportamento, em geral, ter um
alto consumo nos meses anteriores ao cancelamento da conta. O cancelamento do
nmero telefnico se d em mdia aps trs meses de uso sem o devido pagamento de
contas anteriores. Assim sendo, esses registros contriburam para o clculo do cmputo
final da amostra. Para essa base tambm foram retirados clientes inadimplentes. Para a
anlise de inadimplncia interessante ver Pinheiro (2005).
Uma vez tendo sido limpa a amostra, excluindo os clientes com perfil de fraude,
buscou-se retirar da massa de dados os clientes entrantes para aqueles meses escolhidos
de estudo.
Tendo sido retirado os fraudadores e clientes entrantes, buscou-se analisar o
comportamento descritivo da base de dados. A base foi extrada atravs da mdia
mensal das variveis descritas. Assim sendo, para o ms de agosto de 2004, as variveis
121

que compunham aquele ms, foram somadas e retiradas a sua mdia. Assim foi feito
para todos os meses de estudo. Conseqentemente, apareceram dados exprios
(outliers) que se mostraram indesejados. No se deve esquecer que existe um grupo de
pesquisadores, principalmente em Estatstica, que consideram uma aberrao a retirada
de pontos exprios. Segundo esse segmento de pesquisadores a retirada de um dado
exprio geraria um outro dado exprio, e assim por diante a ponto sacrificar a amostra
em relao ao seu erro amostral e intervalos de confiana.
Para presente estudo, achou-se por bem retirar os dados exprios, mesmo porque
tratava-se de um problema extremamente desbalanceado. A proporo entre clientes
ativos e inativos muito grande, como pode ser observado. Desta forma, acatou-se o
direito de retirar os dados fora de padro, segundo tcnicas estatsticas. Todavia, a regra
no foi a mesma para ambos os extratos. Penalizou-se mais o extrato de clientes ativos.
O corte considerado foi retirar registros que estivessem acima de 2 desvios padres, em
relao aos valores mximos. Para essa extrao foram consideradas as mdias ms a
ms. Portanto, poderia existir um outlier para o ms de setembro de 2004 e nenhum
outro outlier para os demais meses. Assim mesmo, esse registro foi retirado. O critrio
de se retirar um registro significa ter um outlier ao menos considerado para todo o
extrato de clientes ativos. Quanto aos valores mnimos optou-se retirar os 15 % dos
registros do 1. quartil. Tal escolha deve-se ao comportamento dos dados. Os valores
mnimos eram mais comportados (homogneos), que os valores superiores.
Quanto a base dos inativos, no foi feito nenhum tipo de limpeza devido a ter
um nmero registros muito inferior aos dos ativos. Correu-se o risco de ter que ser
gerada toda base outra vez, por uma srie de razes, inclusive a no convergncia das
funes que por ventura pudessem classificar os registros e interpretar o fenmeno.
Logo no incio da anlise dos dados, aps a anlise descritiva. Foi verificado que
o comportamento dos dados no permitiriam uma classificao, no mnimo aceitvel
todavia, esse fenmeno foi explicado pela desproporo dos dados em sua origem e no
pela limpeza de dados proporcionada para o desenvolvimento do experimento.
Foi gerada uma anlise de fatores utilizando a tcnica de componentes principais
[JOHNSON, 1992] para verificar se seria possvel uma reduo da quantidade de
variveis, e em seguida uma anlise de agrupamentos (anlise de cluster), e a surpresa
122

veio tona ao mostrar que a classificao era muito ruim. De pronto foi descartada a
idia de se gerar uma nica regra de classificao. Na tabela 6.1 pode-se observar os
valores de comunalidade das variveis e em seguida, nas tabelas 6.2 e 6.3 sua analise de
varincia total no rotacionada. As variveis SOMAT indicam a mdia aritmtica das
variveis de V1 at V10 para cada respectivo ms. Assim sendo, a varivel
SOMAT-08 indica a mdia aritmtica de V1 at V10 para agosto/2004;
SOMAT-09 indica a mdia aritmtica de V1 at V10 para setembro/2004;
SOMAT-10 indica a mdia aritmtica de V1 at V10 para outubro/2004;
SOMAT-11 indica a mdia aritmtica de V1 at V10 para novembro/2004;
SOMAT-12 indica a mdia aritmtica de V1 at V10 para dezembro/2004.
Aps finalizar o ano de 2004 as variveis reiniciam os ndices. A escolha de
indexao das variveis deve-se ao fato de ratificar o incio de um outro ano. Desta
forma, as variveis de manipulao para o ano de 2005 ficaram:
SOMAT-01 indica a mdia aritmtica de V1 at V10 para janeiro/2005;
SOMAT-02 indica a mdia aritmtica de V1 at V10 para fevereiro/2005;
SOMAT-03 indica a mdia aritmtica de V1 at V10 para maro/2005;
SOMAT-04 indica a mdia aritmtica de V1 at V10 para abril/2005;
SOMAT-05 indica a mdia aritmtica de V1 at V10 para maio/2005;
SOMAT-06 indica a mdia aritmtica de V1 at V10 para junho/2005;
SOMAT-07 indica a mdia aritmtica de V1 at V10 para julho de 2005
123

Tabela 6.1: Valores de comunalidade
Comunalidades
Inicial Extrao
Somat-08 1 0,611
Somat-09 1 0,710
Somat-10 1 0,745
Somat-11 1 0,680
Somat-12 1 0,722
Somat-01 1 0,680
Somat-02 1 0,649
Somat-03 1 0,616
Somat-04 1 0,753
Somat-05 1 0,778
Somat-06 1 0,713
Somat-07 1 0,974
Mtodo de extrao: PCA

Tabela 6.2 Total da varincia explicada no rotacionada
Autovalores
Iniciais
Extrao
da soma
dos
quadrados
Total % de Var % Acumul. Total % de Var % Acumul.
6,33 52,79 52,79 6,33 52,79 52,79
1,27 10,61 63,4 1,27 10,61 63,4
1,02 8,52 71,92 1,02 8,52 71,92
0,71 5,91 77,83
0,50 4,18 82,01
0,42 3,5 85,51
0,36 2,99 88,50
0,33 2,77 91,26
0,31 2,60 93,86
0,26 2,19 96,50
0,24 2,03 98,08
0,23 1,92 100
4
5
Componentes
1
10
11
12
6
7
8
9
2
3



124

Tabela 6.3 - Total da varincia explicada rotacionada
Total da varincia explicada
Soma dos quadrados rotacionados
Total % da Var % Acuml.
4,75 39,66 39,66
2,83 23,63 63,29
1,04 8,63 71,92
Mtodo de extrao: PCA

Em funo dos valores de comunalidades da tabela 6.1 foram geradas as tabelas
6.2 e 6.3 apresentando o total da varincia explicada para os valores no rotacionados e
rotacionados, respectivamente, assim como as tabelas 6.4 e 6.5 apresentam os
componentes residentes em cada matriz de fator, rotacionado e no rotacionado.
Tabela 6.4: Componetes da matriz de fatores rotacionada
Componentes da matriz rotacionada
Componente 1 2 3
Somat-10 0,840
Somat-09 0,822
Somat-12 0,804
Somat-11 0,785
Somat-08 0,764
Somat-01 0,748
Somat-02
Somat-03
Somat-05 0,842
Somat-04 0,823
Somat-06 0,780
Somat-07 0,985
Mtodo de Rotao: Varimax Kaiser
Mtodo de extrao: PCA.
Convergncia: 4 interaes

125

Tabela 6.5: Componente da matriz de fatores no rotacionada
Componentes da matriz
Componentes 1 2 3
Somat-12 0,82
Somat-01 0,81
Somat-10 0,81
Somat-02 0,80
Somat-11 0,79
Somat-09 0,79
Somat-03 0,77
Somat-08 0,73
Somat-05
Somat-06
Somat-04
Somat-07 0,97
Mtodo de extrao: PCA.
3 componentes extrados.

Tabela 6.6: Anlise da comunalidade com valores de extrao acima de 0,7.
Comunalidade
Inicial Extrado
Somat-09 1 0,786
Somat-10 1 0,845
Somat-12 1 0,740
Somat-04 1 0,754
Somat-05 1 0,808
Somat-06 1 0,747
Somat-07 1 0,979
Mtodo de extrao: PCA.

Usando de rigor na anlise multivariada, foram retiradas todas as variveis
abaixo de 0,70 de explicao. Busca-se dessa forma melhorar o nvel de explicao do
modelo matemtico. Foram retiradas as variveis somat-08 , somat-11, somat-01,
somat-02, somat-03. Desta forma, a tabela 6.6 apresenta os valores da nova anlise de
comunalidades em seguida a tabela 6.7 e tabela 6.8 indica o total da varincia explicada
para o modelo na configurao no rotacionada e rotacionada.
126

Tabela 6.7: Total da varincia explicada no rotacionada para valores acima de 0,7

Total da varincia explicada
Autovalores iniciais Extrao da soma dos quadrados
Componentes Total % of Var % Acumul. Total % of Var % Acumul.
1 3.54 50.61 50.61 3.54 50.61 50.61
2 1.11 15.84 66.45 1.11 15.84 66.45
3 1.01 14.42 80.87 1.01 14.42 80.87
4 0.41 5.90 86.76
5 0.39 5.58 92.34
6 0.29 4.19 96.53
7 0.24 3.47 100.00
Mtodo de extrao: PCA
Tabela 6.8: Total da varincia explicada rotacionada para valores acima de 0,7.

Soma dos quadrados rotacionados
Total % of Var % Acumul
2.37 33.84 33.84
2.26 32.27 66.11
1.03 14.75 80.87
Chama-se a ateno para incremento do valor total da varincia. Na tabela 6.3 o
valor para a explicao do modelo era de aproximadamente 72% contra o valor da
tabela 6.8 de 81%. Um ganho de 10% na explicao do modelo matemtico,
considerado por muitos especialistas um incremento significativo. As tabelas 6.9 e 6.10
apresentam os valores para a matriz no rotacionada e rotacionada para valores acima de
0,7.
Tabela 6.9: Matriz de componentes dos fatores no rotacionada para valores acima de 0,7
Componentes da matriz
Component 1 2 3
Somat-10 0,80
Somat-12 0,78
Somat-05 0,77
Somat-09 0,77
Somat-06 0,75
Somat-04 0,73
Somat-07 0,91
Mtodo de extrao: PCA
3 componentes extrados.

127

Tabela 6.10: Matriz de componentes dos fatores rotacionada para valores acima de 0,7
Componentes da matriz rotacionadas
Component 1 2 3
Somat-10 0,89
Somat-09 0,86
Somat-12 0,81
Somat-05 0,87
Somat-04 0,83
Somat-06 0,80
Somat-07 0,99
Mtodo de extrao: PCA
Mt. de rotao: Varimax c/ norm Kaiser .
Convergncia: 4 interaes.

Uma vez tendo verificado que as variveis selecionadas explicavam 80% do
modelo matemtico, tentou-se explicar a classificao do modelo atravs da tcnica k-
means [JOHNSON, 1992]. A priori, sabe-se que a massa de dados possui apenas dois
grupos e na proporo de 93% contra 7%, ou seja, um grupo teria 643 clientes ativos e o
outro de 82 clientes inativos. Todavia quando analisado os resultados, foi verificado que
a classificao atravs do mtodo multivariado no correspondia a verdadeira natureza
do fenmeno. A tabela 6.11 apresenta o resultado final da classificao.
Tabela 6.11: classificao para os estratos de ativo e inativo
Num de casos por grupos
Grupos 1 (AT) 416
2 (IN) 309
Validos 725
Faltantes 0

Matematicamente, o resultado para a classificao da base de dados ficou muito
diferente, como comprovado na tabela 6.11. Desta forma, buscou-se solucionar o
problema atravs de tcnicas mais robustas envolvendo tanto modelos lineares quanto
no lineares como no caso as redes neurais artificiais alm do pr-processamento da
amostra atravs de filtragem wavelet. Buscou-se tambm, verificar se existiria algum
tipo de regra de associao que pudesse auxiliar no entendimento do fenmeno.
Assim sendo, utilizou-se uma base de dados (BDV) com as variveis em aberto,
ms a ms, e uma outra base de dados com as mdias mensais (BDM) das variveis para
os meses correspondentes. Portanto, para elucidar obteve-se uma matriz BDV com 725
128

(clientes) linhas por 120(variveis) colunas e uma matriz BDM com 725 (clientes)
linhas por 12 (variveis) colunas.
As 120 variveis de BDV correspondem as 10 variveis repetidas ms a ms.
Formadas as duas bases de dados, buscou-se ento solues alternativas que
viabilizassem o entendimento do fenmeno. Para a base BDV utilizou-se um pr-
processamento, atravs de filtros wavelet. Para a base BDM foram buscadas trs
tcnicas para a anlise:
1. Redes Neurais Artificiais (com otimizao atravs de algoritmo gentico
e amostragem bootstrap);
2. Gerao de regras de associao;
3. Pr-processamento wavelet e redes neurais.
6.2 Base de dados utilizando-se as mdias das variveis mensais
(BDM)
6.2.1 Anlise atravs de RNA para BDM
Uma vez que a base encontrava-se desbalanceada, logo de incio foi tomada a
deciso de que a anlise deveria ser feita atravs de validao cruzada. Portanto, para
uma mesma tcnica foram gerados 7(sete) modelos e escolhidos os 5 (cinco) que
apresentavam o menor erro.
Buscou-se, tambm, analisar e interpretar se haveria alguma relao entre o
tempo e o possvel perfil de um cliente que fosse classificado como um churner em
potencial.
Dessa forma, foram feitas anlises para 12 meses, com o retrato do status no 13.
ms, 11 meses o retrato do status no 13. ms, 10 meses com o retrato do status no 13.
ms e mais uma tentativa para 9 meses o retrato do status no 13. ms.
129

A busca de uma classificao/previso correlata ao tempo muito interessante,
pois se souber que um determinado cliente deseja evadir da base de dados com uma
probabilidade alta, o grupo de inteligncia de marketing poder ter um prazo maior para
conseguir a reteno desse cliente sem correr o risco de perd-lo dado o prazo curto.
De qualquer forma, o prazo mnimo estipulado pela pesquisa foi de 30 (trinta)
dias a contar da data do estudo. Esses 30 (trinta) dias no so considerados um prazo
inconveniente pelo mercado, mas se puder ter um prazo maior a equipe de inteligncia
de marketing poderia gerar programas de fidelizao ou campanhas publicitrias para
atingir um determinado nicho de evasores.
6.2.2 Primeira Onda: Anlise para 12 meses das mdias das variveis
(Mensal)
Para a primeira onda de anlise foram geradas 7 redes cujas caractersticas
encontram-se na tabela 6.12 . Note que os campos hachurados, nas respectivas tabelas,
correspondem aos modelos no utilizados para o cmputo final de acertos para ambos
os extratos.
Tabela 6.12 Arquitetura das redes neurais para 12 meses
Arquitetura
Erro de
Trein.
Erro de
seleo
Erro de
Teste
Membros Ent
Cam
(1)
RBF 12:12-29-1:1 0.2008 0.2195 0.2411 KM,KN,PI 12 29
RBF 12:12-25-1:1 0.2136 0.2191 0.2466 KM,KN,PI 12 25
RBF 12:12-44-1:1 0.1967 0.2189 0.2230 KM,KN,PI 12 44
RBF 9:9-25-1:1 0.1799 0.2181 0.2459 KM,KN,PI 9 25
RBF 12:12-38-1:1 0.2116 0.2174 0.2028 KM,KN,PI 12 38
RBF 7:7-25-1:1 0.2287 0.2158 0.2262 KM,KN,PI 7 25
RBF 12:12-25-1:1 0.2142 0.2113 0.2223 KM,KN,PI 12 25

Foram retiradas da anlise das redes 2 (RBF 12:12-25-1:1) e rede 4 (RBF 9:9-
25-1:1) por apresentarem maior erro no cmputo de acertos. O cmputo de acerto foi
analisado verificando qual rede teve melhor desempenho. Assim foram contabilizados
os acertos para as 7 redes e retirados da validao as duas que erraram.
130

Ressalta-se neste instante, que a preocupao de se ter um bom nmero de
acertos sempre residiu no estrato de INATIVOS. Buscou-se a mesma idia da teoria de
hiptese estatstica, ou seja, o que seria pior:
1. Erro Tipo I: Dizer que um cliente propenso a evadir e ele
PERMANECE na base; ou
2. Erro Tipo II: Dizer que um cliente no vai evadir e ele EVADE no ms
seguinte.
Tendo por base essas duas hipteses, buscou-se sempre controlar o erro no
extrato de INATIVOS. Para um grupo de inteligncia de marketing prefervel errar no
extrato dos ativos, dizer que o cliente sair, a ter que errar no extrato dos INATIVOS,
dizendo que o cliente no evadir da base, quando na realidade existe a propenso do
cliente sair.
O teste considerado para a deciso quanto a classificao dos clientes foi
verificar a quantidade de acertos na linha para cada cliente e somando ao final a
quantidade de acertos. Se a soma de acertos fosse maior que dois, ento seria
considerada a classifico para ativo ou inativo dependendo do extrato. As tabelas 6.13 e
6.14 mostram para ambos os extratos a totalizao de acertos.
Tabela 6.13 Acertos para o extrato inativo sem considerar RNA6 e RNA7
RNA1 RNA2 RNA3 RNA4 RNA5 RNA6 RNA7 Acertos CNT
55 53 58 51 57 54 56 72 82
Acerto 0,8780

Tabela 6.14 Acertos para o extrato ativo sem considerar RNA6 e RNA7
RNA1 RNA2 RNA3 RNA4 RNA5 RNA6 RNA7 Acertos CNT
630 632 639 640 634 630 638 639 643
Acerto 0,9938

A tabela 6.15 apresenta anlise de sensibilidade para cada uma das redes.
131

Tabela 6.15 Analise de sensibilidade

RNA 1 RNA 2 RNA 3 RNA 4 RNA 5 RNA 6 RNA 7
Somat-08 12 3 7 8 12
Somat-09 11 7 10 9 8
Somat-10 10 10 5 9 11 10
Somat-11 6 11 9 4 11
Somat-12 4 8 8 6 3 6 9
Somat-01 7 9 4 7 7 5 4
Somat-02 5 12 11 5 12 4 5
Somat-03 3 5 8 3 6 3 3
Somat-04 2 2 2 2 2 2
Somat-05 9 6 6 8 10 2 7
Somat-06 8 4 3 4 5 7 6
Somat-07 1 1 1 1 1 1 1
Como pde ser observado, a taxa de acerto para o grupo de inativos (churners)
foi de 87.80%, verificado com um ms de antecedncia.
Uma caracterstica importante a todos os ensaios da pesquisa, que os grupos de
treinamento, validao e teste foram retirados a partir de amostragem bootstrap e com
otimizao para cada arquitetura de rede atravs de algoritmo gentico. Foi de
fundamental importncia o tratamento amostral bootstrap pois o software dividia a
massa de dados em blocos contguos. Dessa maneira, a contribuio do extrato de
clientes ativos pesaria muito na deciso das redes neurais. A ttulo de exemplo
apresentado, amostralmente, os elementos escolhidos para treinamento, validao e teste
na tabela 6.16.







132

Tabela 6.16 Exemplo de escolha dos registros

ID status RNA1 RNA2 RNA3 RNA4 RNA5 RNA6 RNA7
1 A Teste Teste Treinam. Seleo Treinam. Teste Seleo
2 A Treinam. Teste Treinam. Teste Teste Teste Treinam.
3 A Teste Seleo Teste Seleo Seleo Treinam. Treinam.
4 A Teste Treinam. Teste Seleo Treinam. Treinam. Teste
5 A Seleo Seleo Teste Seleo Seleo Teste Teste
6 A Treinam. Seleo Treinam. Seleo Teste Treinam. Treinam.
7 A Treinam. Seleo Seleo Treinam. Seleo Treinam. Teste
8 A Treinam. Treinam. Seleo Treinam. Seleo Teste Treinam.
9 A Teste Treinam. Seleo Treinam. Seleo Seleo Treinam.
10 A Teste Treinam. Treinam. Treinam. Treinam. Teste Seleo
717 I Treinam. Teste Treinam. Treinam. Seleo Seleo Treinam.
718 I Teste Seleo Teste Seleo Treinam. Treinam. Teste
719 I Treinam. Seleo Seleo Treinam. Teste Treinam. Treinam.
720 I Seleo Teste Seleo Teste Treinam. Treinam. Treinam.
721 I Seleo Teste Teste Treinam. Seleo Seleo Teste
722 I Seleo Treinam. Teste Seleo Treinam. Treinam. Teste
723 I Seleo Teste Seleo Teste Treinam. Treinam. Treinam.
724 I Treinam. Treinam. Teste Treinam. Treinam. Treinam. Seleo
725 I Treinam. Treinam. Seleo Teste Treinam. Teste Seleo
726 I Teste Treinam. Treinam. Seleo Treinam. Seleo Treinam.
727 I Treinam. Seleo Treinam. Seleo Treinam. Seleo Seleo
6.2.3 Segunda onda :Anlise para 11 meses das mdias das variveis
(Mensal)
Como comentado anteriormente a classificao/previso de um cliente com
potencial de evaso com 30 (trinta) dias considerado pelo mercado algo significativo.
Mas, no presente estudo, levantou-se a possibilidade de conseguir-se obter resultado
com um maior intervalo de tempo. Assim sendo, foram testados modelos para 11(onze)
meses com o retrato da planta da base de dados para o 13
o
. ms. Como resultado foram
obtidos dados a seguir. A tabela 6.17 apresenta as caractersticas para as 7(sete)
melhores redes.


133

Tabela 6.17 Arquitetura das redes neurais para 11 meses

Arquitetura
Erro de
treinament
o
Erro de
Seleo
Erro de
Teste
Membros
Entrada
Camada
RNA 1 RBF 11:11-39-1:1 0.2484 0.2559 0.2727 KM,KN,PI 11 39
RNA 2 RBF 7:7-40-1:1 0.2136 0.2545 0.2748 KM,KN,PI 7 40
RNA 3 RBF 11:11-30-1:1 0.2410 0.2519 0.2583 KM,KN,PI 11 30
RNA 4 RBF 11:11-38-1:1 0.2168 0.2486 0.2953 KM,KN,PI 11 38
RNA 5 RBF 11:11-40-1:1 0.2505 0.2458 0.3112 KM,KN,PI 11 40
RNA 6 RBF 8:8-40-1:1 0.2090 0.2399 0.3056 KM,KN,PI 8 40
RNA 7 RBF 11:11-42-1:1 0.2438 0.2331 0.2751 KM,KN,PI 11 42

Com a reduo de 1 ms os valores de acerto para ambos os extratos so
mostrados nas tabelas 6.18 e 6.19, respectivamente. Observe que os valores de acerto
diminuem em funo do tempo. Na tabela 6.20 apresentada anlise de sensibilidade
para o modelo de 11(onze) meses.
Tabela 6.18 - Acertos para o extrato inativo sem considerar RNA3 e RNA7
RNA1 RNA2 RNA3 RNA4 RNA5 RNA6 RNA7 Acertos CNT
67 64 63 60 66 63 62 66 82
Acerto 0,8049

A tabela 6.19 apresenta a anlise de sensibilidade para o modelo de 11 meses.
Tabela 6.19 - Acertos para o extrato ativo sem considerar RNA3 e RNA7

134

Tabela 6.20 Anlise de sensibilidade para 11 meses

RNA 1 RNA 2 RNA 3 RNA 4 RNA 5 RNA 6 RNA 7
Somat -08 5 6 4 8 8
Somat -09 10 7 9 11 5 10
Somat -10 4 5 11 6 7 4 5
Somat -11 9 7 8 9 3 6
Somat -12 3 5 9 5 9
Somat -01 7 10 5 3 8 7
Somat -02 11 4 4 3 7 6 3
Somat -03 2 2 2 7 2 7 2
Somat -04 1 1 1 2 1 1 1
Somat -05 8 6 8 1 11 2 11
0Somat-06 6 3 3 4 4
6.2.4 Terceira onda:Anlise para 10 meses das mdias das variveis
(Bimestral)
O terceiro modelo foi gerado a partir de 10 meses passado, ou seja, verificando o
comportamento do consumidor para 10 meses e retirando o status da planta para o 13.
ms. As tabelas 6.21 e 6.21 apresentam total de acerto para cada um dos estratos.
Tabela 6.21- Acertos para o extrato inativo sem considerar RNA2 e RNA6
RNA1 RNA2 RNA3 RNA4 RNA5 RNA6 RNA7 Acerto CNT
52 51 54 57 52 48 53 55 82
Acerto 0,6707

Tabela 6.22 - Acertos para o extrato inativo sem considerar RNA2 e RNA6
RNA1 RNA2 RNA3 RNA4 RNA5 RNA6 RNA7 Acerto CNT
556 557 556 542 536 588 568 566 643
Acerto 0,8802

Levando-se em considerao a regresso temporal, verifica-se claramente que a
medida que o tempo recua para o passado, menos precisa fica a taxa de acertos,
principalmente para o estrato de inativos. As tabelas 6.23 e 6.24 apresentam as
configuraes de rede para o modelo de 10 meses, assim como a anlise de
sensibilidade, respectivamente.
135

Tabela 6.23: Arquitetura das redes neurais para 10 meses

Arquitetura
Erro de
treinamento
Erro de
Seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF 5:5-32-1:1 0,2371 0,2711 0,2741 KM,KN,PI 5 32
RNA 2 RBF 5:5-28-1:1 0,2557 0,2708 0,3051 KM,KN,PI 5 28
RNA 3 RBF 5:5-27-1:1 0,2363 0,2698 0,2928 KM,KN,PI 5 27
RNA 4 RBF 5:5-28-1:1 0,2469 0,2647 0,3221 KM,KN,PI 5 28
RNA 5 RBF 5:5-29-1:1 0,2219 0,2610 0,3104 KM,KN,PI 5 29
RNA 6 RBF 5:5-28-1:1 0,2201 0,2576 0,3335 KM,KN,PI 5 28
RNA 7 RBF 5:5-25-1:1 0,2525 0,2502 0,2991 KM,KN,PI 5 25
Tabela 6.24 Anlise de sensibilidade para 10 meses
Rank.1 Rank.2 Rank.3 Rank.4 Rank.5 Rank.6 Rank.7
med-0809 3 5 2 3 2 5 5
med-1011 4 3 4 4 4 4 4
med-1201 5 4 5 5 5 3 2
med-0203 2 2 3 2 3 2 3
med-0405 1 1 1 1 1 1 1

6.2.5 Anlise atravs de gerao de regras de associao.
As caractersticas para a anlise e gerao das regras de associao mantiveram-
se as mesmas, quanto anlise em relao ao tempo. Assim sendo, tambm foram
analisados os comportamentos dos registros para 12 meses, 11 meses e 10 meses.
A gerao das regras de associao teve por princpio a discretizao dos dados.
Para tanto, foram utilizadas as medidas de posicionamento descritivo estatstico. Desta
forma, foram calculados dos valores mximos e mnimos, valores da mediana e do
primeiro e terceiro quartis. As tabelas 6.25a e 6.25b mostram os valores dos limites em
valores percentuais assim como em valores absolutos so vistos visto nas tabela 6.26a e
tabela 6.26b.
136

Tabela 6.25a: Valores percentuais dos limites

Tabela 6.25b: Valores percentuais dos limites posicionais descritivos

Tabela 6.26a: Valores absolutos dos limites posicionais descritivos

Tabela 6.26b: Valores absolutos dos limites posicionais descritivos

As tabelas 6.27a e 6.27b apresentam, respectivamente os valores freqnciais
para cada uma das classes e variveis.
137

Tabela 6.27a: Distribuio frequencial para cada uma das classes

Tabela 6.27b: Distribuio frequencial para cada uma das classes

Os registros aps discretizados foram utilizados para gerar as regras . Buscou-se,
com a utlizao das regras de associao, a relao entre os registros de clientes que
compunham o arquivo. A descoberta de tais regras poderiam facilitar a tomada de
deciso em relao as classificaes dos clientes, principalmente no que se concerne aos
churners. Segundo Liu [2000] cada registro poderia ser representado por um vetor
booleano. O vetor booleano utilizado para representar padres nos registros e auxiliar
em sua descoberta atravs de regras de associao.Ainda em Liu (2000), tais regras so
divididas por partes das quais podem ser escritas como antecedentes (A) e conseqentes
(C).
Pode-se entender a regra a partir de conceitos da lgica matemtica que
apresenta com clareza o conceito. O texto abaixo apresenta-se identado,
propositalmente.
Assim, tem-se: SE (A)
ENTO (C)
FIM-SE
Segundo Liu (2000), uma regra quando gerada agrega em sua estrutura
parmetros que ajudaram ao tomador de deciso a avaliar se tal regra importante ou
no para sua base de dados. Os parmetros associados so:
138

1. Suporte: que reflete a clareza da regra. Ajuda a entender a relao de
conseqncia entre o antecedente e o conseqente. Ter um valor de 25% de
suporte implica em dizer que se 25% dos registros atingirem uma
determinada taxa (antecedente) tambm 25% dos registros tendem a
deflagrar o valor do conseqente. Pode-se entender o suporte como sendo a
quantidade que ocorreu (A), tambm ocorreu (C);
2. Confiana: um valor probabilstico que representa a P[(C)] na certeza de
ter ocorrido o evento (A). Falar de 95 % de confiana implica em dizer que
95 % das conseqncias aconteceram dado que com certeza o antecedente
ocorreu.
Muito se tem falado a respeito das regras de associao. Tais regras podem ser
retiradas atravs de observao do especialista, o que se torna quase que impraticvel,
ou atravs de extrao automtica. A busca do melhor equilbrio o objetivo de muitos
pesquisadores. Entre alguns desses otimizadores para a busca do equilbrio encontra-se
o algoritmo a prori desenvolvido por Agrawal e Srikant [1994].
Para o presente experimento, buscou-se analis-lo com os valores de 25% de
suporte e 95% de confiana, Dando-se prioridade ao suporte e depois a confiana. Para
alguns pesquisadores esses limites so extremamentes rgidos, pois podem no gerar
regra alguma dada a rigidez dos valores. Embora, entenda-se que o experimento em
questo seja desbalanceado e conseqentemente uma anlise mais conservadora deveria
ser feita trabalhando-se, por exemplo, com intervalos para ambos os parmetros. Porm,
justamente por se tratar um problema desbalanceado, deve-se evitar incorrer em erros
grosseiros como j especificado anterormente.
As regras analisadas seguiro o padro estipulado por Liu (2000). Desta forma,
suas estruturas sero:
REGRA #
(A) (C)
( S% C% s s)
onde ,
S , representa o valor percentual do suporte, i.e., [P (A U C)]
C, representa o valor percentual da confiana, i.e., [P (de ocorrer C, na certeza de ter
139

ocorrido A]
s, o valor suporte da regra expresso em nmero de vezes que ocorre A ou C;
s, o nmero de vezes em que os dois itens A e C ocorrem simultaneamente.
6.2.6 Anlise para 12 meses
Para a anlise de 12 meses, foram geradas as seguintes regras apresentadas na
tabela 6.28. A regra 30 aparece em negrito como exemplo de regra a ser excluda
seguindo os critrios adotados no experimento.
Tabela 6.28: Regras de classificao para o intervalo de 12 meses

Regra 27:
ativo = S
Regra 23:
ativo = S
Regra 35:
ativo = S
Regra 26:
ativo = S
Por ordem de Suporte-Confiana
(25,13% 97,81% 183 179)
(25,13% 92,90% 183 170)
S03 > 1225 = S
1126_S07_1590 = S
666_S04_1009 = S
(25,00% 96,70% 182 173)
S06>1264 = S
(25,00% 96,70% 182 173)
Para a taxa de acertos envolvendo os inativos obteve-se o valor de 95 %, ver tabela 6.29
e para os ativos obteve-se o valor de 7 %, ver tabela 6.30.
Tabela 6.29: Taxa de acertos para o extrato inativo

Regra 27 Regra 23 Regra 35 Regra 26 Acertos CNT
79 69 76 75 78 82
Acerto 0,9500
140

Tabela 6.30: Taxa de acertos para o extrato ativo

Regra 27 Regra 23 Regra 35 Regra 26 Acertos CNT
178 170 175 173 42 643
Acerto 0,070
Embora possa parecer que o resultado tenha sido muito bom para o extrato de
inativos, na verdade no o que acontece. O fato de ter acertado muito nos inativos
parece mostrar que as regras geradas s tendem para o erro, ou seja, se a maioria de
ativos, conseqentemente deveria se ter um maior acerto para ativos. Como esse fato
no ocorreu, ainda que para valores considerados altos para suporte e confiana, achou-
se por bem, no aceitar a esse tipo resultado uma vez que pode induzir ao tomador de
deciso uma dvida quanto a calibragem do modelo matemtico. Note que todas as
regras foram em funo do extrato ativo. Note, tambm que todas as regras foram em
funo do extrato ativo.
Buscou-se, ento o comportamento para 11 meses. Todavia, as regras geradas
para esse intervalo de tempo apresentaram-se, abaixo das expectativas impostas pelos
limites exigidos pelo experimento, ver tabela 6.31.
Tabela 6.31: Valores de suporte e confiana para o intervalo de 11 meses

Regra 26:
m12 at 602 = S
ativo = S
Regra13:
m08 at 634 = S
ativo = S
Regra 35:
m11 at 657 = S
ativo = S
(16,48% 94,17% 120 113)
(16,20% 94,07% 118 111)
m03 at 574 =S
Por ordem de Suporte-Confiana
(17,85% 91,54% 130 119)
m12 at 602 =S
m03 at 574 =S
141

Atente o leitor para os valores de suporte e confiana grifados em negrito. Por
um critrio especificado para o experimento essas regras no podem ser utilizadas. Uma
vez tendo-se os valores para 12 meses, como dito, ruins, esses valores certamente no
respondero a regras bem comportadas e conseqentemente, no classificaro a base de
dados.
O mesmo ocorreu para a anlise de 10 meses. A tabela 6.32 apresenta as regras
obtidas para o intervalo de 10 meses e abandonadas pelas mesmas razes apresentadas
para a anlise de 11 meses.
Tabela 6.32: Valores de suporte e confiana para o intervalo de 10 meses

Regra 01:
ativo = S
Regra 02:
m050607>1289
ativo = S
Regra 03:
913_m020304_1256
ativo =S
Regra 04:
1009_m050607_1289
ativo =S
Por ordem de Suporte-Confiana
(24,86% 92,82% 181 168)
766_m060607_1008
(25,00% 96,15% 182 175)
(25,00% 96,00% 182 165)
(25,00% 93,96% 182 171)
6.3 Base de dados utilizando-se variveis isoladas ms a ms(BDV)
Para esse ensaio foram utilizadas a variveis em seus valores absolutos e como
se apresentavam mensalmente. Assim sendo, tinha-se para o primeiro estudo dez
variveis que repetiam o seu escopo mensalmente ao longo do s 12 meses de estudo.
142

Buscou-se nesse ensaio verificar se o comportamento dos dados pudesse
aparentar uma srie temporal/sinal. Para isso, foi feito um pr-processamento utilizando
os conceitos de filtro de digitais de quadratura espelhada, e de maneira especfica o
desenho do filtro baseou-se na multiresoluo wavelet.
Foram testadas duas funes escalveis e com a propriedade de ortogonalidade.
As funes escolhidas foram as funes daubechies 2 (db2) e daubechie 3 (db 3). Tais
funes foram escolhidas aps estudos tericos em que se apresentavam propcias a
deteco de transientes que a olho nu no poderia-se observar. A funo db2 muito
utilizada para o processamento de sinais e descoberta de rudos para sinais em geral. A
db3 tem por propriedade emprica um comportamento, muito bom, para sries
financeiras.
A proposta, ento, a de se analisar as variveis como srie temporal tendo-se
para isso os seus valores filtrados como entrada para a rede neural. Diga-se de
passagem, que um sinal aps sua filtragem perde a caracterstica do que vem a ser
aquele valor, ou seja, os valores aps a filtragem passam a ser coeficientes dos filtros.
A transformada wavelet possui uma caracterstica interessante, vide captulo 5,
ela apresente seus valores no domnio tempo-freqencial. Por ser uma filtragem
multidimensional, precisa-se passar o sinal pelo filtro (janelas deslizantes) n vezes a
critrio do pesquisador.
Por se tratar de uma filtragem baseada em filtros de quadratura espelhado, a cada
passagem da janela pelo sinal buscado um valor de transiente. Para cada passeio da
janela no sinal, o valor do sinal divido por dois. Assim sendo, se desejar-se passar o
sinal 5 vezes e tendo-se em mente que esse sinal possui 120 elementos, o sinal filtrado
ser dividido da seguinte maneira: 60, 30, 15, 8,4, mais um rudo de detalhe do sinal;
Tal rudo de detalhe se faz necessrio para a reconstruo ( transformada inversa) do
sinal. Desta forma, um sinal que apresente 120 componentes aps filtrado, poder
apresentar mais do que 120 coeficientes de filtro.
A seguir sero apresentados os valores obtidos para cada um dos filtros db2 e db
3. Suas sadas sero utilizadas para a entrada da rede neural e sero analisados da
mesma maneira que preconiza o estudo portanto, para cada filtro sero analisadas as
dependncias temporais, isto , 10, 11 e 12 meses respectivamente. Para todos os
143

resultados, buscou-se tambm, analisar atravs de validao cruzada. Para cada filtro e
cada intervalo de tempo foram gerada 7 redes, sendo retirada as duas piores em acerto.
A otimizao gentica e no caso das multicamadas, anlise entrpica foram parmetros
padres a todos os ensaios do experimento. importante tambm saber que as
otimizaes utilizadas no software foram automticas, portanto sem a interveno do
pesquisador.
6.3.1 Anlise da classificao gerada a partir da filtragem db2.
Para 12 meses a tabela 6.33 apresenta as caractersticas dos principais
parmetros das redes neurais.
Tabela 6.33: Caractersticas das arquiteturas para db 2 e 12 meses

Arquitetura
Erro de
treinament
o
Erro de
Seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF11 5:115-14-1:1 0,1199 0,1248 0,1337 KM,KN,PI 14 32
RNA 2 RBF11 5:115-9-1:1 0,1091 0,1236 0,1706 KM,KN,PI 9 28
RNA 3 RBF11 5:115-12-1:1 0,1034 0,1203 0,1585 KM,KN,PI 12 27
RNA 4 RBF11 5:115-18-1:1 0,1266 0,1117 0,1562 KM,KN,PI 18 28
RNA 5 RBF11 5:115-19-1:1 0,1365 0,1026 0,1003 KM,KN,PI 19 29
RNA 6 RBF11 5:115-15-1:1 0,1571 0,0951 0,1594 KM,KN,PI 15 28
RNA 7 RBF11 5:115-19-1:1 0,1449 0,0865 0,0827 KM,KN,PI 19 25
As redes 1 e 2 esto grifadas pois no cmputo dos erros foram as que
apresentaram maior taxa de erros.
As taxas de acerto para os extratos inativos e ativos so apresentados nas tabelas
6.34 e 6.35, respectivamente. Chama-se a ateno que o critrio de uso das avaliaes
para os ativos est em funo do extrato inativo. Em outras palavras o que foi escolhido
para os inativos tambm o ser para os ativos.
Tabela 6.34: Taxa de acertos para o extrato inativo intervalo de 12 meses e db2

144

Tabela 6.35: Taxa de acertos para o extrato ativo intervalo de 12 meses e db2

Para 11 meses os valores das taxas de acertos para os extratos inativo e ativo
encontram-se nas tabelas 6.36 e 6.37, respectivamente. A tabela 6.38 apresenta as
caractersticas paramtricas das redes otimizadas.
Tabela 6.36: Taxa de acertos para o extrato ativo intervalo de 11 meses e db2

Tabela 6.37: Taxa de acertos para o extrato ativo intervalo de 11 meses e db2

Tabela 6.38: Caractersticas paramtricas para as arquiteturas otimizadas para 12 meses

Arquitetura
Erro de
treinamento
Erro de
Seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF37:37-9-1:1 0,2503 0,2782 0,2751 KM,KN,PI 37 9
RNA 2 RBF37:37-15-1:1 0,2842 0,2777 0,2735 KM,KN,PI 37 15
RNA 3 RBF37:37-14-1:1 0,2365 0,2770 0,2727 KM,KN,PI 37 14
RNA 4 RBF37:37-21-1:1 0,2236 0,2670 0,2410 KM,KN,PI 37 21
RNA 5 RBF37:37-18-1:1 0,2476 0,2669 0,2628 KM,KN,PI 37 18
RNA 6 RBF37:37-25-1:1 0,2016 0,2514 0,2852 KM,KN,PI 37 25
RNA 7 RBF37:37-9-1:1 0,2392 0,2419 0,2512 KM,KN,PI 37 19
Para 10 meses as caractersticas das arquiteturas e os valores das taxas de acertos
para os extratos inativo e ativo encontram-se nas tabelas 6.39, 6.40 e 6.41
respectivamente.


145

Tabela 6.39: Caractersticas paramtricas para as arquiteturas otimizadas de 10 meses

Arquitetura
Erro de
treinamento
Erro de
Seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF29:29-18-1:1 0,2614 0,3248 0,2631 KM,KN,PI 29 18
RNA 2 RBF29:29-15-1:2 0,2754 0,3180 0,3089 KM,KN,PI 29 15
RNA 3 RBF29:29-9-1:3 0,2474 0,3097 0,3044 KM,KN,PI 29 9
RNA 4 RBF29:29-21-1:4 0,2209 0,3037 0,3838 KM,KN,PI 29 21
RNA 5 RBF29:29-16-1:5 0,2765 0,2992 0,2593 KM,KN,PI 29 16
RNA 6 RBF29:29-20-1:6 0,2479 0,2871 0,2753 KM,KN,PI 29 20
RNA 7 RBF29:29-25-1:7 0,2623 0,2734 0,2730 KM,KN,PI 29 25

Tabela 6.40: Taxa de acertos para o extrato inativo intervalo de 10 meses

RBF1 RBF2 RBF3 RBF4 RBF5 RBF6 RBF7 Acerto CNT
50 47 50 51 54 53 52 54 82
Acerto 0,6585
Tabela 6.41: Taxa de acertos para o extrato ativo intervalo de 10 meses

RBF1 RBF2 RBF3 RBF4 RBF5 RBF6 RBF7 Acerto CNT
540 522 547 572 537 551 530 517 561
Acerto 0,8730
6.3.2 Anlise da classificao gerada a partir da filtragem db3.
Para a filtragem db3 foram utilizada as mesmas condies utilizadas no ensaio
para db2 com a exceo de se deixar gerar somente as 5 melhores redes. Esta deciso
pesou em funo do tipo processamento. De qualquer forma, essa deciso foi baseada
assumindo valores default nos softwares. Assim sendo, nesta seo sero apresentadas
somente as tabelas para cada um dos intervalos de tempo respectivamente.
Para o intervalo de 12 meses tem-se:

146

Tabela 6.42 Caractersticas paramtricas para o intervalo de 12 meses com db3

Arquitetura
Erro de
treinamento
Erro de
seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF 57:57-48-1:1 0,1992 0,2608 0,2946 KM,KN,PI 57 48
RNA 2 RBF 57:57-62-1:1 0,2418 0,2549 0,2778 SS,KN,PI 57 62
RNA 3 RBF 57:57-58-1:1 0,2229 0,2482 0,2958 SS,KN,PI 57 58
RNA 4 RBF 57:57-61-1:1 0,2243 0,2420 0,2608 SS,KN,PI 57 61
RNA 5 RBF 57:57-63-1:1 0,2582 0,2405 0,2752 SS,KN,PI 57 63
Tabela 6.43: Taxa de acertos para o extrato inativo intervalo de 12 meses com db3

RBF1 RBF2 RBF3 RBF4 RBF5 Acerto CNT
58 57 54 60 58 58 82
0,7073
0,7317
Acerto absoluto
Acerto da melhor rede
Tabela 6.44: Taxa de acertos para o extrato ativo intervalo de 12 meses com db3
RBF1 RBF2 RBF3 RBF4 RBF5 Acertos CNT
602 609 605 603 607 611 643
Acertos 0.9502

Para o intervalo de 11 meses.
Tabela 6.45 Caractersticas paramtricas para o intervalo de 11 meses com db3

Arquitetura
Erro de
treinamento
Erro de
seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF 52:52-25-1:1 0,2440 0,2923 0,2733 KM,KN,PI 52 25
RNA 2 RBF 52:52-21-1:2 0,2670 0,2702 0,3021 KM,KN,PI 52 21
RNA 3 RBF 52:52-21-1:3 0,2441 0,2670 0,2912 KM,KN,PI 52 21
RNA 4 RBF 52:52-22-1:4 0,2280 0,2501 0,2933 KM,KN,PI 52 22
RNA 5 RBF 52:52-21-1:5 0,2440 0,2503 0,3061 KM,KN,PI 52 21
Tabela 6.46: Taxa de acertos para o extrato inativo intervalo de 11 meses com db3
RBF1 RBF2 RBF3 RBF4 RBF5 Acerto CNT
57 56 51 55 50 55 82
0.6707
0.6951 Acerto da melhor rede
Acerto Absoluto

147

Tabela 6.47: Taxa de acertos para o extrato ativo intervalo de 11 meses com db3
RBF1 RBF2 RBF3 RBF4 RBF5 Acerto CNT
565 549 556 593 576 589 643
0.916
0.9222 Acerto da melhor rede
Acerto Absoluto

Para o intervalo de 10 meses.
Tabela 6.48: Caractersticas paramtricas para o intervalo de 10 meses com db3

Arquitetura
Erro de
treinamento
Erro de
seleo
Erro de
teste
Membros Entrada Camada
RNA 1 RBF 113:113-5-1:1 0,2838 0,2967 0,32 KM,KN,PI 113 5
RNA 2 RBF 113:113-3-1:1 0,322 0,2872 0,3394 KM,KN,PI 113 3
RNA 3 RBF 113:113-6-1:1 0,3417 0,2803 0,3274 KM,KN,PI 113 6
RNA 4 RBF 113:113-4-1:1 0,3029 0,3029 0,3409 KM,KN,PI 113 4
RNA 5 RBF 113:113-4-1:1 0,2996 0,2926 0,3534 KM,KN,PI 113 4
Tabela 6.49: Taxa de acertos para o extrato inativo intervalo de 10 meses com db3
RBF1 RBF2 RBF3 RBF4 RBF5 Acerto CNT
41 38 44 44 42 41 82
Acerto Absoluto 0,5000
Acerto melhor rede 0,5365

Tabela 6.50: Taxa de acertos para o extrato ativo intervalo de 10 meses com db3
RBF1 RBF2 RBF3 RBF4 RBF5 Acerto CNT
41 38 44 44 42 506 643
463 450 467 510 524 0,7869
Acerto melhor rede 0.8149

Chama-se a ateno que para o intervalo de 10 meses apareceu uma taxa
chamada por acerto da melhor rede. Enquanto nos demais ensaios a validao cruzada
sempre apresentava uma taxa superior s taxas isoladas de cada rede neural. No presente
ensaio o cmputo total apresentou um valor menor que a melhor performance de uma
determinada rede. Desta forma, poderia-se utilizar a melhor rede para a classificao
dos registros.
148

6.4 Compilao dos resultados
A presente seo visa compilar e resumidos resultados obtidos pela pesquisa. Na
tabela 6.51 apresentado os resultados utilizando-se as mdias das variveis para cada
ms.
Tabela 6.51: Resultados comparativos de acertos entre tcnicas e intervalos de tempo
Redes Neurais (RBF) Regras de Associao
Inativos Ativo Inativos Ativo
12 meses 0,8780 0,9938 0,9500 0,0700
11 meses 0,8094 0,9409 No gerado No gerado
10 meses 0,6707 0,8802 No gerado No gerado
Na tabela 6.52 apresentado os valores comparativos utilizando-se os valores
absolutos das variveis para cada ms.
Tabela 6.52: Resultados comparativos de acertos entre os filtros db2 e db3 em intervalos
de tempo

Filtragem db2 Filtragem db3
Inativos Ativo Inativos Ativo
Absoluto/Relativo Absoluto/Relativo
12 meses 0,9268 0,9953 0,7073 / 0,7317 0,9502 / N. Observado
11 meses 0,7439 0,9393 0,6707 / 0,6951 0,9160 / 0,9222
10 meses 0,6585 0,8730 0,5000 / 0,5365 0,7869 / 0,8149
Pode-se perceber que o resultado para a previso/classificao utilizando-se a
metodologia de filtragem digital ( filtro db2) apresentou significativa taxa de acertos
para inativos.
6.5 Viso geral da abordagem metodolgica
Os dados utilizados para o presente trabalho apresenta uma formato cbica,
tendo-se em mente que para cada cliente, possuia-se uma viso temporal, espao do
tempo e, ao mesmo tempo uma viso no espao das variveis.
149

Buscou-se contornar tal problema, viso cbica dos dados, com a projeo dos
comprtamentos em duas dimenses. As anlises foram divididas, portanto, em duas
abordagens a conhecer : 1) cliente vesrsus comportamento temporal; e 2) cliente versus
comportamento em relao as variveis descrito na seo 6.1. Os modelos matemticos
sempre tiveram por objetivo a parcimnia dos parametros e a minimizao do erro.
Inicialmente, no espao das variveis, buscou-se verificar como as variveis se
comportavam quanto as suas correlaes e explicaes do modelo. Foi gerado, a partir
das variveis, uma anlise de fatores atravs do algoritmo de componentes principais. A
cada modelo gerado o controle da baixa comunalidade das varivel foi analisado,
sempre tendo em mente a retirada da mesma a partir do corte de 0,7, ou mais baixo,
objetivando um ganho variacional para explicao do modelo.
Verificado as principais variveis do modelo (drivers), buscou-se a clssificao
atravs do algoritmo clssico do k-means, utilizando-se rotao ortogonal (Varimax).
Foi verificado que o modelo no era classificado de maneira esperado. A explicao
para o fenmeno foi atribuda a no linearidade do comportamento dos clientes assim
como a descompensao da quantidade de clientes ativos e inativos que era da orde de
93 % de clientes ativos contra 7% de clintes inativos.
A anlise teve por objetivo verificar o comportamento dos clientes atravs dos
meses de utilizao dos servios de telefonia. Iniciou-se com a anlise para 12 meses de
prestao de servio tendo-se como alvo o status do cliente para o 13
o
. Ms. A partir
dessa abordagem, foram retiados os trs ltimos meses para verifcar se existiria uma
correo da variavl em relao ao tempo. Verificou-se dessa menira que o o acerto do
status para o 13
o
ms era correlato a medida em que o tempo retroagia. Desta forma,
verificou-se que a medida que o tempo recuava o percentual de acaerto diminuia.
A segunda abordagem buscou-se o comportamento do cliente atravs do
comportamento temporal. Para essa viso, utilizou-se como pr-processamento a
transformada wavelet. Foram gerados dois modelos, o primeiro utilizando-se uma pr-
filtragem com a funo daubechies 2 (db2) e a segunda utilizando-se a funo
daubechies 3(db3). Dada as caractersticas da funo db2, consegui-se uma melhor
performance para o modelo tendo-se obtido 92 % de acerto para clientes propensos a
sair da base de dados e para 12 meses de anlise. Mais uma vez foi verificado a
150

correlao de acertos em funo do tempo. Quanto maior o histrico de comportameto
do cliente melhor a taxa de acerto apresentada pelo modelo. Para tanto, utilizando-se a
segunda abordagem com pr-filtragem, tambm foram gerado modelos para 12, 11 e 10
meses.
151

CONCLUSO
O presente estudo apresentou resultados satisfatrios, tanto academicamente
como no dia a dia do mercado. Mesmo tendo-se uma base de dados extremamente
desbalanceada. Todavia, chama-se a ateno de ter sido escolhida uma base verdadeira,
quanto ao comportamento e dimenso exigido para o mercado.
Ficou contundente a dependncia temporal da classificao/previso em relao
ao tempo, ou seja, a medida que se retroagia temporalmente os resultados respondiam
com uma taxa menor de acertos. Sem dvida ficou claro que uma equipe de inteligncia
corporativa necessitar fazer controles ms a ms ganhando-se, dessa forma, maior
tempo de planejamento e estratgia para a reteno dos clientes que se mostrem
propcios a evadirem da base de dados.
Em relao a comparao das tcnicas escolhidas verifica-se com clareza que a
rede neural, independente do pr-tratamento dos dados mostrou-se extremamente eficaz
para a resoluo do problema. A escolha do software em utilizar as redes RBF no
causou espanto na pesquisa. Sabe-se que as RBF trabalham no linearmente na
aproximao de funes, principalmente quando existem transientes tratados
(suavizados) atravs de uma tcnica de suavizao. Para o experimento foi utilizado a
transformada wavelet que possui uma excelente resoluo tempo-freqencial.
Numa comparao em que se utilizaram as mdias das variveis, a gerao de
regras de associao apresentou o pior resultado. Acredita-se mais uma vez, dado o
desbalanceamento dos dados, que as regras geradas tenham entrado em conflito dado o
algoritmo ou at mesmo em relao comportamental dos dados. O fato que entre as
tcnicas escolhidas para a anlise do problema, foi a que pior respondeu as expectativas.
Em alguns casos, os parmetros impostos como os parmetros de suporte e confiana
no foram atingidos, mesmo se fosse levado em considerao uma abordagem mais
convencional que levaria em considerao a anlise de um intervalo matemtico,
considerado bom para alguns pesquisadores.
152

Levando-se em conta as mdias das variveis e seus valores absolutos que
sofreram pr-processamento wavelet, as taxas de acertos foram melhores na massa de
dados pr-processadas.
Em resposta a filtragem, mostrou-se que o filtro db2, que tem uma melhor
resoluo na busca de transientes, respondeu as expectativas. Ainda que no se consiga,
a olho nu, ver tais transientes, os mesmos foram detectados pela filtragem que deu um
excelente input gerando uma rede neural que respondeu de maneira muito boa aos
acertos dos inativos.
Levando-se em conta todas as comparaes de resultados apresentados pelo
estudo, resta-se to somente escolher a tcnica ou a melhor taxa de acerto. Sem dvida a
melhor taxa de acerto apresentou-se com o pr-processamento db2 e reposta atravs de
redes neurais, todavia conhecendo o mercado e sabendo o quanto importante aliar o
estudo acadmico, dando solues de mercado, a escolha reside na tcnica de redes
neurais atravs de validao cruzada.
Tal escolha deve-se ao fato de que no dia a dia das empresas suas bases giram
em torno de milhes de registros. Se tiver que analisar clientes propcios a evaso da
base seria necessrio filtrar-se a toda base para ento colocar seu pr-processamento em
uma rede neural j treinada. Este fato se torna quase que impossvel, pois estar-se-ia
promovendo um censo mensalmente. No h verba suficiente para esse tipo de trabalho,
ou pelo menos no condiz o gasto com as estratgias e planejamentos das empresas.
Todavia, a escolha residindo numa anlise amostral, ainda que se tenha uma taxa
menor de acerto como mostrada na seo de compilao de resultados, estaria
promovendo um estudo baseado em filtros a posteriori, conhecido no mercado por
screening tool [CISTER e EBECKEN, 2003]. Tal procedimento apresenta-se de
maneira recompensadora em relao ao tempo de resposta que o mercado exige.
Levando-se em considerao o custo/benefcio de tal procedimento, toda e qualquer
empresa possuir um instrumento poderoso para tomada de deciso. O presente estudo
no visou o desenvolvimento de um screening tool, todavia fica a sugesto para outros
pesquisadores implementar tal instrumento de tomada de deciso.
Tendo-se por base a abordagem metodolgica e verificando os resultados
obtidos, pode-se dizer que o presente estudo teve seus objetivos alcanados,
153

principalmente no que tange a contribuio dos resultados e anlises ao Mercado e a
Academia. Os conceitos utilizados para o desenvolvimento da pesquisa esto
atualizados e em consonncia com resultados e estudos internacionais. A metodologia
cientfica preconizada para o estudo se mostrou eficiente em relao a organizao e
levantamento cognitivo para produo e desenvolvimento de pesquisa de base.
Como sugesto para estudo futuro fica a idia de se trabalhar, mais
profundamente, com o conceito de entropia de informao. O Conceito de entropia
dentro da teoria da informao de extrema importncia em relao ao controle
estatstico e a manipulao de funes de densidade probabilstica. Tal conceito tomado
emprestado da Termodinmica se mostra a cada dia mais poderoso para a anlise e
validao dos tomadores de deciso do mercado internacional.

154

BIBLIOGRAFIA
1. AGRAWAL, R.,SRIKANT, R. ,.Fast algorithms for mining association rules,
VLDB-94/1994.
2. BERRY, Michael; LINOFF, Gordon - Mastering Data Mining - New York:
Willey (2000).
3. BOGMANN, Itzhak Meir. Marketing de Relacionamento.So Paulo: Nobel, 2000.
4. CISTER, Angelo M.; GALANTE, Glria ; SLAMA, Jules - Processamento de
Sinais Acsticos Utilizando Transformada Wavelet - Proceedings of XV
Congress of the Brazilian Computer Society, agosto/1995.
5. CISTER, Angelo M.; GALANTE, Glria - Speech Recognition by Neural
Networks and Pre-processing Wavelet - Proceedings of Internacional Society for
Optical Engineering -San Diego, USA/1997.
6. CISTER, Angelo M.; EBECKEN, Nelson F. F. - CRM through DM: a case
study Third International Conference on Data Mining- DATA MINING III,
Bolongna, Italy-2002.
7. CISTER, Angelo M.; EBECKEN, Nelson F. F. - A screening tool based on
neural networks Conference on Data Mining- DATA MINING IV, Rio de
Janeiro, Brazil-2003.
8. CONTADOR, Jos Celso - Planejamento estratgico: recomendaes sobre os
ambientes externo e interno. - Revista de administrao de empresas, Maro/Abril
1995b.
9. CORRA, H. L.; GIANESI, I.G.N.; CAON, M. Planejamento, programao e
controle da produtividade: MRPII/ERP conceitos, uso e implantao. So Paulo:
Ed. Atlas S.A., 1997.
155

10. COUTINHO, Fernando V.; Datamining; www.dwbrasil.com.br/2003.
11. FAYYAD, Usama; et al - Advances in Knowledge Discovery and Data Mining -
Mit Press 1a. Ed. 1996.
12. GROTH, Robert Data Mining: Building Competitive Advantage Prentice Hall
PTR , 2000
13. HAN, Jiawei; KAMBER, Micheline, - Data Mining: Concepts and techniques-
Morgan Kaufmann publishers, San Francisco CA, 2001.
14. HAYKIN, Simon - Neural Networks - A comprehensive Foundation -
Macmillam College Publishing company, Inc., 1994.
15. HAYKIN, Simon - Adaptive Filter Theory - Englewood Cliffs, 2
a
. ed., NJ -
Prentice Hall 1991.
16. JONHSON, R. A., WICHERN, D. Applied Multivariate Statistical Analysis,
Prentice Hall: Upper Saddle River, New Jersey, 3
a.
ed. .
17. KOTLER, P. & ARMSTONG, G. - Princpios de Marketing. - 7 ed. Rio de
Janeiro: Prentice Hall do Brasil, 1997.
18. KOTLER, Phillip. - Administrao de marketing: anlise, planejamento
Implementao e controle. - 8. ed., SP: Atlas, 1998.
19. LIU, B., HSU, W., CHEN, S., MA, Y., 2000 Analyzing the subjective
interestingness of association rules, IEEE Intelligent Systems, National
University of Singapore.
20. MASTERS, Timothy - Signal and Image Processing With Neural Networks - A
C++ Source- John Willey & Sons, Inc., 1994.
21. MATTISON, Rob. Telecom Churn Management: The Golden Opportunity
APDG Plubkishing, 2001.
156

22. MCKENNA, Regis. - Marketing de Relacionamento: estratgias bem sucedidas
para a era do cliente - 1 ed. Rio de Janeiro: Campus. (1993). (trabalho original
publicado em 1991).
23. MINSKY, M. L., PAPERT, S. A - Percptrons - Cambridge, MA, MIT Press,
1969.
24. NASCIMENTO, Jos Augusto. Programa de Fidelizao e Clube de clientes. So
Paulo: 1996 (seminrio diretorial)
25. NOGUEIRA, Carlos F., - Metodologia de Valorizao de Clientes Utilizando
Minerao de Dados - Tese de Doutorado, COPPE-Cvil/UFRJ Programa de
Engenharia Cvil, jun. 2004.
26. PEPPERS, Don ; ROGERS, Martha. -One to One Manager: Real - World Lessons
in Customer Relationship Management - The. New York:
Currency/Doubleday,1999.
27. PESSOA, Luis Adauto F. C. - Aprendizado No-supervisionado em Redes
Neurais - Dissertao de Mestrado, COPPE-Sistemas/UFRJ - Programa de
Engenharia de Sistemas, 1990.
28. PINHEIRO, Carlos A. R. Redes Neurais para prevenso de inadimplncia em
Operadoras de Telefonia Tese de Doutorado, COPPE-Cvil/UFRJ Programa
de Engenharia Cvil, jul. 2005.
29. ROCHA, Telma e VELOSO, Andr. A hora da recompensa. So Paulo: Cobra,
1999.
30. RUST, Roland T.; ZEITHAML, Valarie A.; LEMON, Katherine N. Driving
Customer Equity: How Customer lifetime Value is Reshaping Free Press, 2000
31. SHEPHERD, G.M. e KOCH, C., - Introduction to Synaptic Circuits in the
Synaptic Organization of Brain - (G.M. Shepeherd, ed.), Oxford University
Press - NY -1990.
157

32. SHEPPARD, David Associates Inc.- The New Direct. Marketing: How to
implement a profit-driven Database Marketing Strategy - a Handbook for Direct
Marketing Company and Users of Direct Marketing Methods. Homewood, IL.
Dow Jones-Irwin., 1990
33. VAVRA, Terry G. Marketing de Relacionamento. So Paulo: Atlas, 1996.
34. VETTERLI, M., KOVACEVIC, J. - Wavelets and Subband Coding- Prentice
Hall PTR, Englewood Cliffs, N.J., 1995.
35. WASSERMAN, P. D. - Neural Computing - Theory and Pratice - Van Nostrand
ND Reinhold, N.Y. 1989.
158