Escolar Documentos
Profissional Documentos
Cultura Documentos
Resumo
Este trabalho tem como foco o marketing de relacionamento na sua primeira etapa: a
segmentação de clientes. Seu principal objetivo é discutir o modelo de segmentação baseado
em recência, freqüência e valor, utilizando-se três técnicas de segmentação distintas: CHAID,
Cluster e análise categórica de RFV e comparando-se os resultados em termos de capacidade
de formação de grupos diferenciados. Inicialmente, há um breve histórico do marketing de
relacionamento e uma explicação sobre cada técnica utilizada para análise dos resultados.
Dados secundários de uma instituição financeira de grande porte foram usados para a
segmentação de 7.787 clientes da região metropolitana de São Paulo. Aplicadas as três
técnicas de segmentação, foi possível comparar os resultados a partir da formação de 27
segmentos. Foi detectado que, geralmente, uma das variáveis do RFV tem maior capacidade
de discriminação. Usando-se técnicas em que não haja categorização – cluster e CHAID – as
variáveis com maior amplitude acabam direcionando a formação dos grupos, o que é atenuado
ao se utilizar a técnica de análise categórica.
Introdução
O ambiente empresarial contemporâneo caracteriza-se pelo acirramento da
concorrência global, pelo direcionamento de ações que foquem o cliente e pela crescente
diversidade de produtos e serviços (MC KENNA, 1992; VAVRA, 1994; RAPP e COLLINS,
1996). Esse cenário mercadológico traduz-se numa necessidade de coletar, armazenar e
processar informações sobre o cliente, utilizando-se, para tal, de recursos de tecnologia de
informação, cujos investimentos devem ser constantes, agravados pela elevada taxa de
obsolescência. Assim, soluções de CRM (Customer Relationship Management) tornaram-se
comuns em organizações de médio e grande portes, no intuito melhor conhecer o cliente.
O CRM pode ser entendido como o conjunto de processos capazes de viabilizar a
filosofia do marketing de relacionamento. Nesse sentido, o conceito de marketing de
relacionamento não consiste em CRM. Kalakota (2002, p.168) reduz o conceito de CRM em
software que “ajuda as organizações a melhor gerenciar o relacionamento com os clientes
acompanhando as interações de clientes de todos os tipos”. Marketing de Relacionamento é
uma abordagem mercadológica mais ampla, focada na descoberta das expectativas e
necessidades individuais dos clientes e no direcionamento de produtos e serviços de maneira
que possam atendê-los de forma personalizada. Essa abordagem é antagônica ao Marketing de
Transações, ou seja, o marketing massificado.
Segundo Bretzke (2002), CRM consiste numa das estratégias mais eficientes para
fidelizar o cliente, pois a empresa tem a possibilidade de aumentar a rentabilidade dos clientes
atuais a partir de informações de relacionamento que são compiladas no momento de contato
entre este e aquela.
Diversos autores que estudam o fenômeno de inserção do CRM nas empresas
comparam o custo em reter um cliente e conquistar um novo. Para Bretzke (2000), atrair e
obter um novo cliente é seis vezes mais caro que manter um. De acordo com Scott (2001) e o
Eisenfeld (2002), o custo de conquistar um cliente sobe para 10 vezes quando comparado ao
trabalho de reter um já satisfeito.
2
demográficas de fora dos sistemas da empresa e permitir a análise comparando-as com seus
próprios dados de cobrança para discernir sobre as preferências de compra da sua base de
clientes” (BROWN, 2001. p.206).
Além do Data Warehouse, alguns pesquisadores apontam outras técnicas para criar
um banco de dados com objetivo de interagir com clientes, como o Database Marketing, o
Data Mart e o OLAP (On-line Analytical Processing) (SERRA, 2002; LAUDON, 2002;
KOTLER, 2000).
O objetivo de muitas empresas quando ingressam em um projeto de Data Warehouse é
focar em necessidades especiais de pequenos grupos dentro da organização. Esses pequenos
armazenamentos de dados são denominados Data Marts. Serra (2002) define Data Marts
como pequenos Data Warehouses que fornecem suporte à decisão de um pequeno grupo de
pessoas. Os Data Marts podem servir como veículo de teste para empresas que desejam
explorar os benefícios do Data Warehouse. Entre as principais vantagens, Serra (2002) aponta
a diminuição drástica do custo de implementação, a manutenção de sistemas de apoio à
decisão e a possibilidade de aquisição de um número muito maior de corporações, além da
rapidez em ser desenvolvido e a concentração de esforço/time já que possuem o escopo mais
limitado e são mais identificados com grupos de necessidades de usuários.
O Database Marketing consiste numa abordagem interativa para o marketing, cujo uso
está mais focado em canais e meios de comunicação de marketing. Tal banco de dados
registra e mantém uma memória eletrônica de dados de clientes, clientes potenciais e todos os
contatos comerciais e de comunicação. Serra (2002) aponta como o principal objetivo do
Database Marketing a melhoria de atendimento nos contatos futuros e um planejamento mais
realista de todo o marketing. Segundo Serra (2002) há dois usos principais para o Database
Marketing: marketing para clientes, onde se mantém um relacionamento estreito com clientes,
com a possibilidade de oferecer serviços especiais, o que pode resultar em fidelidade,
aumento de vendas e redução de “attrition”; e marketing para não-clientes (prospects), cujo
objetivo é identificar os clientes potenciais a partir da compreensão das motivações do
consumidor o que resultará na expansão da base de consumidores com custos decrescentes.
Numa arquitetura de aplicação de análise multidimensional de dados como o OLAP
(On-line Analytical Processing) os dados são representados em diferentes dimensões. De
acordo com Singh (2001), ferramentas OLAP fornecem meios tecnológicos para análise
completa do negócio possibilitando aos usuários analisar e navegar os dados para detectar
tendências, exceções e obter detalhes para entender a evolução da empresa. Inmon, Welch e
Glassey (1999) conceituam OLAP como uma extensão do Data Warehouse. Alguns aspectos
merecem maior importância, como a possibilidade de personalização no nível departamental e
“o preço da criação para o processamento OLAP ser pago apenas uma vez” (INMON et al.,
1999, p. 187).
Análise de Cluster
O princípio da técnica é a divisão baseada em uma medida de similaridade ou
distância para a criação de grupos homogêneos ou clusters. Os casos são individualizados no
começo do processo, passando a se juntar apenas no decorrer da aplicação, de acordo com a
similaridade apresentada em relação a certas variáveis (FREITAS e HEINECK, 2001). A
análise de cluster é uma das técnicas multivariadas mais utilizadas pelos autores da área de
marketing e segmentação (FREITAS e HEINECK, 2001), cujo objetivo principal é a redução
do número de casos sob análise.
Ao contrário de outras técnicas, o cluster não necessita calcular uma matriz de
proximidade como um passo intermediário. A técnica de cluster permite formar grupos
homogêneos, desconsiderando os casos perdidos ou missing. Cada grupo possui números de
clientes diferentes, mas com características semelhantes. Isso porque ao analisar os dados
contidos num banco, é possível verificar que muitos deles são complementares, sendo
necessária mais de uma característica para formar os segmentos.
A redução da população em grupos é a base principal da técnica de cluster. O primeiro
passo numa segmentação por Cluster é definir a estrutura dos dados alocando as ocorrências
semelhantes num mesmo grupo. Para saber como medir a semelhança entre as variáveis
podem ser utilizados métodos diversos, como correlação entre objetos, distâncias euclidianas
e, ainda, e proximidades entre ocorrências parecidas (HAIR et al., 1998).
Também é preciso saber quantos grupos serão formados. Enquanto o número de
grupos diminui, reduz também a sua homogeneidade. É do pesquisador a decisão sobre o
número de grupos a serem formados.
Malhotra (2001) classifica os processos de aglomeração para formação dos clusters em
dois: hierárquico e não-hierárquico. A aglomeração hierárquica se caracteriza pelo
estabelecimento de uma hierarquia, ou estrutura em forma de árvore. Já os métodos não-
hierárquicos, chamados também de K-means clustering consistem em centros, onde todos os
objetos a menos de um valor pré-determinado a contar do centro são agrupados juntamente.
As árvores de decisão dividem os dados em grupos com base no valor das variáveis
que são classificadas de acordo com os resultados potenciais das decisões. Para Gordon
(2001), as ferramentas que usam árvores de decisão categóricas têm dificuldades em
manipular conjuntos contínuos de dados, como idade do cliente e vendas. Na técnica de
CHAID, os resultados são visualizados na forma de um diagrama em árvore, como divisões
progressivas em pequenos ramos. A princípio, toda população é considerada, sendo
progressivamente dividida, por meio da utilização de variáveis que melhor explicam a sua
variação. (FREITAS e HEINECK, 2001).
Os diagramas da técnica de CHAID devem ser pensados como um “tronco de árvore”,
com divisões progressivas em ramificações menores. Assim funciona a técnica: o tronco
inicial consiste em todas as variáveis importantes para a segmentação. Uma série delas é
estudada e avaliada para iniciar o processo de distribuição a fim de conduzir a uma
discriminação estatisticamente significante de variáveis dependentes. A segunda ramificação
é formada por variáveis mais significantes da primeira amostra que foi dividida. Para cada
novo grupo que é formado é verificada a possibilidade de formar novos subgrupos tomando
por base variáveis dependentes. Ao término do processo, o resultado é um desenho de
ramificações, cada qual especificando mais o grupo a ser segmentado. A cada etapa são feitos
testes estatísticos com o objetivo de verificar se cada variável realmente pode oferecer um
subgrupo homogêneo.
Freitas e Heineck (2001) citam entre as principais vantagens na utilização do método,
a possibilidade de utilização de variáveis dependentes e independentes em diferentes formatos
e de várias bases para a segmentação buscando-se a homogeneização dos segmentos criados,
a possibilidade dos valores faltantes serem tratados pelos softwares disponíveis, sendo
agregado ao grupo que mais se assemelhar a ele ou isolado em uma categoria distinta e,
também, a não necessidade de estabelecer provisoriamente uma ou mais variáveis como base
para segmentação.
Método
Quadro 1 – Variáveis
Variável Escala Descrição
CODAG Nominal Código de Agência
CODCLI Nominal Código do Cliente
RENTB Métrica de razão Margem de contribuição gerada pelo cliente mensalmente
RENDA Métrica de razão Renda média que o cliente possui mensalmente
SENIOR Métrica de razão Tempo, em anos, que o cliente é correntista do banco
QSDEBAUT Métrica de razão Quantidade de saques de débito automático
QTMOV Métrica de razão Quantidade de movimentação de débitos e créditos efetuados
VLMOV Métrica de razão Somatório dos valores de débitos e créditos
QTCHEQ Métrica de razão Quantidade de cheques emitidos
Para isso, foram analisadas aquelas que pudessem ser úteis para a geração de novas
variáveis com o enfoque RFV de segmentação. Para construir grupos baseados em RFV, é
preciso levantar dados que apresentem a recenticidade do cliente. A Recência traduz em
números quando foi o último contato do cliente com a empresa. Quanto mais recente maior
será o valor a ele atribuído. Em termos estratégicos de marketing, o cliente recente é um bom
candidato a voltar e fazer novas compras.
Dentre as variáveis acima descritas, nenhuma apresenta características para ilustrar a
recentidade dos casos. Por este motivo, foi necessária a composição de duas variáveis para
gerar uma terceira capaz de oferecer subsídios para o entendimento do conceito. Optou-se,
dado o caráter contínuo do consumo de serviços em um banco, por utilizar-se o inverso da
senioridade <sênior>, conforme fórmula 1.1. Assim:
RECÊNCIA = ____1___
SENIOR (1.1)
Como pode ser observado, para todas as técnicas foram utilizadas as proxies de
recência, freqüência e valor a fim de possibilitar a comparação mais precisa entre as mesmas.
É importante lembrar que, com a criação das proxies acima descritas e da tabulação dos
dados, as três técnicas estão utilizando o mesmo conjunto de variáveis para viabilizar a
comparabilidade dos resultados a serem obtidos.
O tratamento dos dados foi realizado por meio do software SPSS (Statiscal Package
for Social Sciences), versão 11.5. Optou-se por analisar os dados pelo mesmo modelo de
9
Análise Descritiva
A análise descritiva tem o objetivo de apresentar as estatísticas a respeito de cada
variável representativa de recência, freqüência e valor. Neste caso disponibiliza-se a média,
desvio padrão, valor máximo e mínimo e coeficiente de variação.
De acordo com a tabela 1, é possível perceber que a variável “Valor” assume uma
amplitude muito grande, sendo o valor máximo superior a 1.700.000,00 e o mínimo zero,
assim como um desvio-padrão avantajado. Analisando o coeficiente de variação, pode-se,
também, observar que a variável “recência” é a mais homogênea e o “valor”, a mais dispersa.
Aplicação de CHAID
A terceira e última técnica a ser analisada foi CHAID. Como foi descrita por Freitas e
Heineck (2001), a imagem é de uma árvore. Cada ramificação é uma nova categoria formada.
A técnica de CHAID permite ao usuário contar a freqüência de casos em cada classe.
No presente estudo, a variável dependente (y) foi os 27 grupos formados pela técnica de
Cluster. A partir daí, os grupos foram subdivididos categoricamente usando basicamente
variáveis determinantes. Praticamente, as variáveis recência e freqüência não entram na
estrutura do modelo.
A categorização de variáveis, característica forte da técnica de CHAID, permitiu
formar outros 27 grupos com características diferentes dos inicialmente formados pela técnica
de Cluster.
Análise de Correlação
A correlação entre as três variáveis está expressa na tabela 3, evidenciando valores
significativos para p<0,01, embora a maior interação se dê entre recência e freqüência.
Cluster
A técnica de Cluster, a primeira a ser realizada, formou 27 grupos distintos entre si.
No entanto, na Análise de Variância (ANOVA) e Teste de Scheffe que serão descritas a
seguir, vê-se que alguns clusters podem ser reagrupados pela semelhança ainda existente entre
os mesmos.
Vale ressaltar um certo desequilíbrio entre os grupos extremos, como, por exemplo, o
cluster 20 que possui poucos clientes e as maiores quantias na variável “valor” e o 19, que é o
maior em termos de quantidade de casos (1614 casos), embora apresentem baixos valores de
freqüência e valor. O grupo mais recente é o de número 20 e aquele com maior freqüência, o
de número 3.
A fim de confirmar e validar externamente o modelo criado foi realizada uma Análise
de Variância (ANOVA) da variável rentabilidade que não entrou no modelo. O valor de F foi
de 61,92, p<0,001.
Analisando-se os resultados providos pelas variáveis que entraram no modelo –
recência, freqüência e valor, adotou-se testes ANOVA e Scheffe. Este último visa a identificar
os segmentos menos distintos, a fim de formar um menor número de grupos. Para o
profissional de marketing é mais viável trabalhar com grupos mais homogêneos, que
geralmente implica maior quantidade de grupos, dificultando o estabelecimento e a
manutenção de estratégias distintas, dada a complexidade gerencial que proporcionará.
No presente estudo, a variável recência não se mostrou significativamente distinta
entre os 27 grupos criados (F=0,946 e p<0,543). No entanto há diferenças nas variáveis
Freqüência e Valor entre os grupos. Pelo teste de Scheffe, recência reagrupa os clusters em
um único grupo, ou seja, não há diferenças, enquanto a variável freqüência forma 3 grupos
distintos. Por fim, o teste de Scheffe não acrescentou mudanças quanto à variável valor. Os 27
clusters não foram reagrupados. Isso porque a variável em questão tem alto poder
discriminatório, como foi visto na análise de variância. Cada um dos 27 clusters possui
características próprias capazes de justificar a sua formação.
O profissional de marketing deve ser capaz de perceber as peculiaridades de cada
grupo formado e a partir daí formular estratégias de marketing direcionado, como propõe
autores como Bretzke (2000) e Vavra (1993). O cluster com características de menor
freqüência e valor deve ser cuidadosamente analisado. No presente estudo este cluster é o de
número 19. Como é o que possui mais casos (1614), não pode simplesmente ser descartado,
mas trabalhado. Clientes fiéis e de elevado valor como é o caso dos 22 clientes do cluster 20
devem ter um tratamento diferenciado. E, na era do marketing de relacionamento, deve-se
aplicar um tratamento personalizado e capaz de atender às suas necessidades específicas.
CHAID
A técnica CHAID formou igualmente 27 grupos tomando como ponto de partida os 27
clusters. A cada nível a técnica separava os clusters em outros com características
semelhantes. Surgiram 27 novos grupos cuja variável com maior poder de discriminação foi o
valor. Por meio da Análise de Variância (ANOVA), percebe-se que, como na técnica de
Cluster, a recência não exerce influência na formação de segmentos. E, o montante é capaz de
diferenciar os grupos entre si.
O teste de Scheffe reagrupou os 27 grupos em 2, levando em consideração a variável
recência. Já quando a variável testada foi freqüência, o número de grupos formados foi 8. E, o
“valor” originou 24 grupos. Coincidentemente à técnica de Cluster, o CHAID apresentou
como variável de diferenciação mais forte, “valor”. A recência, por sua vez, apresentou maior
dispersão que na técnica de Cluster, formando mais dois novos grupos.
Para formulação de estratégias de marketing, a técnica CHAID permite visualizar os
clientes de forma genérica e, de acordo com o negócio, agrupa-los diante de características
semelhantes. A técnica de CHAID, considerando a distribuição das três variáveis, induz a
criação de alguns poucos grupos com muitos casos, por exemplo, os grupos 24,25 e 26 que
representam 50% da amostra, aproximadamente, dada a forte dispersão existente na variável
que tem o maior poder discriminante, isto é, “valor”.
13
Conclusão
A filosofia de marketing de relacionamento aponta a retenção de clientes como fator
essencial para manutenção da posição competitiva de algumas empresas em setores
concorrenciais e orientados à fidelização. O marketing de relacionamento tem o papel de
conhecer os clientes e trata-los individualmente. Conhecer significa obter o maior número de
informações a respeito do cliente. A partir daí, é preciso agrupa-los de acordo com as
características semelhantes entre eles, a partir de modelos e técnicas de segmentação de
clientes.
Modelos RFV são relativamente simples de serem implementados e permitem
conhecer o cliente em termos de comportamento de consumo, naquelas variáveis que são mais
consideradas como determinantes de repetição de compra.
A presente pesquisa buscou comparar a aplicação de três técnicas de segmentação –
CHAID, Cluster e Análise Categórica em um modelo de segmentação baseado em RFV, no
intuito de evidenciar diferentes formas de se implementar um modelo RFV. Também buscou-
se apresentar a capacidade distinta de discriminação de variáveis utilizadas no modelo, dado o
seu nível de dispersão.
Como direcionamentos para futuros trabalhos podem ser sugeridos: a) a aplicação de
modelos RFV longitudinais, onde o efeito da rentabilidade se dá ao longo do tempo, e não
simultaneamente, com a recência e a freqüência; b) a aplicação em mercados de produtos, ao
invés de serviços, uma vez que há maior clareza no conceito de recência nesse tipo de
negócio; c) a avaliação a posteriori dos efeitos trazidos pelo uso de estratégias baseadas em
variáveis de recência, freqüência e valor.
Como limitações do trabalho, deve-se salientar que os resultados obtidos referem-se ao
caso específico utilizado, não podendo ser generalizado para outras instituições financeiras e
setores. Também é necessário realçar a limitação metodológica de utilizar como variável
categórica, na técnica CHAID, o grupo criado pelo cluster, e o uso de tercis, ao invés de
quartis, na técnica de análise categórica de RFV.
Referências Bibliográficas
AAKER, David A.; KUMAR, V.;DAY, George S. Pesquisa de Marketing. São Paulo: Atlas,
2001.
BRETZKE, Miriam. Marketing de Relacionamento e Competição em Tempo Real (Com
CRM). São Paulo: Atlas, 2000.
BRETZKE, Miriam. O Customer Relationship Management (CRM) na era da competição em
tempo real. Disponível em http://www.itcom.com.br. Acesso em 14.11.2002.
BROWN, Stanley A. CRM – Costumer Relationship Management: uma ferramenta
estratégica para o mundo e-business. São Paulo: Makron Books, 2001.
DUFFY, Dennis L. Do something! Guia prático para fidelização de clientes. São Paulo:
Fábrica Comunicação Dirigida, 2002.
EISENFELD, Beth. The Economics Justification of IT: Exploiting Technology for Business
Advantage – CRM 101: The basics. The Gartner´s Group Summit. In 6º Annual CRM User
Fórum. Setembro/2002.
ENGEL, James F.; BLACKWELL, Roger D.; MINIARD, Paul W. Consumer Behavior.
Orlando: The Dryden Press, 1995.
FREITAS, Ana Augusta Ferreira; HEINECK, Luiz Fernando Mahlmann. Metodologia de
segmentação de mercado pela associação direta entre produtos e clientes. In: ENCONTRO
ANUAL DA ASSOCIAÇÃO NACIONAL DOS PROGRAMAS DE PÓS-GRADUAÇÃO
14
i
Conhecido assim por formar o desenho semelhante a uma árvore
ii
Chi-Square Automatic Interaction Detection