Utilização e Análise de Técnicas Alternativas para A Elaboração de Segmentos RFV

Utilização e Análise de Técnicas Alternativas para a Elaboração de Segmentos RFV
Autoria: Maria Carolina Barbosa Dantas, Fernando de Rosa
Resumo
Este trabalho tem como foco o marketing de relacionamento na sua primeira etapa: a
segmentação de clientes. Seu principal objetivo é discutir o modelo de segmentação baseado
em recência, freqüência e valor, utilizando-se três técnicas de segmentação distintas: CHAID,
Cluster e análise categórica de RFV e comparando-se os resultados em termos de capacidade
de formação de grupos diferenciados. Inicialmente, há um breve histórico do marketing de
relacionamento e uma explicação sobre cada técnica utilizada para análise dos resultados.
Dados secundários de uma instituição financeira de grande porte foram usados para a
segmentação de 7.787 clientes da região metropolitana de São Paulo. Aplicadas as três
técnicas de segmentação, foi possível comparar os resultados a partir da formação de 27
segmentos. Foi detectado que, geralmente, uma das variáveis do RFV tem maior capacidade
de discriminação. Usando-se técnicas em que não haja categorização – cluster e CHAID – as
variáveis com maior amplitude acabam direcionando a formação dos grupos, o que é atenuado
ao se utilizar a técnica de análise categórica.
Introdução
O ambiente empresarial contemporâneo caracteriza-se pelo acirramento da
concorrência global, pelo direcionamento de ações que foquem o cliente e pela crescente
diversidade de produtos e serviços (MC KENNA, 1992; VAVRA, 1994; RAPP e COLLINS,
1996). Esse cenário mercadológico traduz-se numa necessidade de coletar, armazenar e
processar informações sobre o cliente, utilizando-se, para tal, de recursos de tecnologia de
informação, cujos investimentos devem ser constantes, agravados pela elevada taxa de
obsolescência. Assim, soluções de CRM (Customer Relationship Management) tornaram-se
comuns em organizações de médio e grande portes, no intuito melhor conhecer o cliente.
O CRM pode ser entendido como o conjunto de processos capazes de viabilizar a
filosofia do marketing de relacionamento. Nesse sentido, o conceito de marketing de
relacionamento não consiste em CRM. Kalakota (2002, p.168) reduz o conceito de CRM em
software que “ajuda as organizações a melhor gerenciar o relacionamento com os clientes
acompanhando as interações de clientes de todos os tipos”. Marketing de Relacionamento é
uma abordagem mercadológica mais ampla, focada na descoberta das expectativas e
necessidades individuais dos clientes e no direcionamento de produtos e serviços de maneira
que possam atendê-los de forma personalizada. Essa abordagem é antagônica ao Marketing de
Transações, ou seja, o marketing massificado.
Segundo Bretzke (2002), CRM consiste numa das estratégias mais eficientes para
fidelizar o cliente, pois a empresa tem a possibilidade de aumentar a rentabilidade dos clientes
atuais a partir de informações de relacionamento que são compiladas no momento de contato
entre este e aquela.
Diversos autores que estudam o fenômeno de inserção do CRM nas empresas
comparam o custo em reter um cliente e conquistar um novo. Para Bretzke (2000), atrair e
obter um novo cliente é seis vezes mais caro que manter um. De acordo com Scott (2001) e o
Eisenfeld (2002), o custo de conquistar um cliente sobe para 10 vezes quando comparado ao
trabalho de reter um já satisfeito.
2
Para a implantação de CRM, o primeiro passo a ser considerado é a segmentação de

clientes. Mas, para que isso ocorra é importante que a empresa possua um banco de dados
capaz de fornecer, se não todos, pelo menos os dados mais importantes dos clientes.
A segmentação de clientes é o ponto essencial deste trabalho. Dados demográficos,
geográficos, geodemográficos, psicográficos, socioculturais, comportamentos de consumo e
benefícios esperados podem ser importantes para a formulação do perfil do cliente e seu
posterior agrupamento em segmentos de acordo com as similaridades percebidas. Além disso,
transações históricas de compras ou até mesmo a procura por um SAC (Serviço de
Atendimento ao Consumidor) também podem ser arquivados como insumos para a
segmentação.
Kotler (2000) observa que alguns pesquisadores tentam formar segmentos observando
as características dos consumidores: geográfica, demográficas, psicográficas e
comportamental. Nos últimos anos, há uma tendência de identificar os segmentos observando
os dados comportamentais a partir das respostas dos consumidores aos benefícios procurados,
ocasiões de uso ou marcas.
Engel (1995) sugere para uma segmentação muitas variáveis. Mas, os dados mais
usados são das seguintes categorias: geográficas, demográficas, psicográficas e
comportamentais. Esta última inclui benefícios procurados, extensões de uso e lealdade e
situação de uso.
Dentre os diversos critérios de se praticar a segmentação, tem se destacado o
comportamental de consumo. Uma maneira extremamente simples de se praticar essa
segmentação está baseada no clássico uso dos conceitos de recência, freqüência e valor
(RFV), algo facilmente aplicável a empresas de pequeno e médio portes.
Os modelos de segmentação baseados em recência, freqüência valor são muito
utilizados em estratégias de marketing de relacionamento por fornecer informações para
construção e manutenção de relacionamentos duradouros e lucrativos. A recência indica há
quanto tempo ocorreu a última transação do cliente. A freqüência é a assiduidade de um
cliente em efetuar suas transações (HUGHES, 1998).
A categorização por RFV, segundo Hughes (1998), é um método de dividir em
categorias os registros presentes em um banco de dados a fim de conhecer quem são os
compradores mais recentes, os que compram com mais freqüência e quem são os que mais
gastam com os produtos ou serviços da empresa. O autor alerta que tal método só pode ser
utilizado na carteira de clientes da empresa e é o método mais confiável de previsão de
retorno conhecido pelos profissionais de marketing. “Porque o RFV é uma medida de
comportamento, e comportamento é justamente o que se pretende prever” (HUGHES, 1998,
p. 90).
Esta pesquisa tem o propósito de apresentar três técnicas alternativas – CHAID,
Cluster e Categorização de RFV – para implementar segmentações baseadas em atributos de
recência, freqüência e valor.
Há vantagens no uso de cada uma das técnicas? Os resultados encontrados são
convergentes? Em quais condições específicas recomenda-se o uso de cada uma das técnicas?
Conhecer os clientes a partir da segmentação

Tratar clientes individualmente não é novidade em empresas de marketing direto
tradicional, ou seja, aquelas especialistas em vendas por mala-direta. Tais empresas testam a
todo o momento todas as suas estratégias e ofertas para, assim, conhecer, dentro de um
intervalo de confiança estatística, exatamente quanto de um produto ou serviço venderão
usando cada uma das ofertas testadas em um contexto de mercado mais amplo (VAVRA,
1993).
3
Em tempos de grande transformação no mundo empresarial, conhecer o cliente

significa ter o “grande trunfo”. Mas, não basta apenas conhecer suas necessidades e
expectativas, é preciso prever a sua opção de compra futura a fim de voltar-se aos clientes
mais rentáveis.
Vavra (1993) descreve as empresas de marketing direto tradicional como decididas ao
registrar resultados. Assim, elas não apenas sabem com precisão o número de vendas que
realizaram, mas também quais os clientes de seu banco de dados compraram ou não,
complementando com um histórico completo das respostas anteriores de cada cliente. “Para
campanhas futuras, os clientes podem ser segmentados por interesse, rentabilidade ou nível de
atividade de compra. Essa atenção para o detalhe é análoga à perspectiva das empresas de
venda industrial ou business to business, para as quais um banco de dados de clientes e um
conhecimento preciso de suas necessidades individuais têm sido sempre o meio normativo
para conduzir negócios” (VAVRA, 1993, p.49).
A tríade segmentação, seleção do mercado-alvo e posicionamento representa a base
para as ações de marketing de uma empresa. A segmentação de clientes professa a separação
do conjunto total dos consumidores em grupos menores, nos quais os mesmos possuem
necessidades e desejos homogêneos (TAM e BORGES, 2001). Um dos objetivos mais
importantes dessa segmentação é estimar qual o valor que o cliente pode agregar.
Inicialmente a segmentação considerava dados demográficos e geográficos como os
mais importantes. Hoje, percebe-se um avanço na busca de informações adicionais sobre o
cliente (aspectos psicográficos, comportamentais de consumo, benefícios esperados, entre
outros), que confere ao instrumento de segmentação uma maior precisão no efetivo
conhecimento do cliente.
O primeiro passo para a segmentação de clientes é a criação do banco de dados,
geralmente oriundos de múltiplas fontes. O processo de criação do banco de dados combina
conjuntos de dados em registros de marketing utilizáveis. Toda a transação, ou contato com o
cliente ou prospect é uma oportunidade para reunir dados, investir no relacionamento com o
cliente e construir um valor mútuo. Assim, o banco de dados deverá reunir informações ideais
para viabilizar a realização da segmentação. A empresa precisa diferenciar os clientes
primeiro pelo valor que eles representam e então por suas necessidades ou psicografias, em
vez de confiarem em padrões históricos ou demográficos (BROWN, 2001).
A tecnologia de banco de dados é capaz de auxiliar na conquista e manutenção de
clientes. O banco de dados coleta informações, endereça benefícios específicos para clientes
selecionados e fornece meios para medir precisamente os resultados (AAKER et al., 2001).
As tendências de banco de dados, de acordo com Laudon (2002) incluem o crescimento de
bancos de dados distribuídos, cujo armazenamento pode ser em mais de um local físico, e o
surgimento de bancos de dados orientados a objetos, que armazena os dados e os
procedimentos como objetos que podem ser facilmente recuperados e compartilhados, e
orientados com hipermídia, cuja característica principal é a capacidade que o usuário tem em
escolher seu próprio caminho.
Existem diversas alternativas de organização de dados e de representação dos
relacionamentos entre os dados em um banco de dados. O banco de dados para fins de
segmentação de clientes pode ser construído de diversas maneiras. O mais arrojado é o Data
Warehouse (DW), conhecido como um banco de dados corporativo, orientado a assuntos,
histórico, capaz de desenvolver a memória institucional. Ele contém informações sobre os
clientes de uma organização, sobre seus produtos e sobre o mercado, além de diversos outros
assuntos de interesse corporativo. Caracteriza-se por ser fruto de um processo organizado de
extração de dados de fontes internas e externas, de transformação desses dados em
informações úteis, de armazenamento em diversos níveis de agregação e de acesso e
recuperação fáceis. No contexto de CRM, “o Data Warehouse pode coletar informações
4
demográficas de fora dos sistemas da empresa e permitir a análise comparando-as com seus
próprios dados de cobrança para discernir sobre as preferências de compra da sua base de
clientes” (BROWN, 2001. p.206).
Além do Data Warehouse, alguns pesquisadores apontam outras técnicas para criar
um banco de dados com objetivo de interagir com clientes, como o Database Marketing, o
Data Mart e o OLAP (On-line Analytical Processing) (SERRA, 2002; LAUDON, 2002;
KOTLER, 2000).
O objetivo de muitas empresas quando ingressam em um projeto de Data Warehouse é
focar em necessidades especiais de pequenos grupos dentro da organização. Esses pequenos
armazenamentos de dados são denominados Data Marts. Serra (2002) define Data Marts
como pequenos Data Warehouses que fornecem suporte à decisão de um pequeno grupo de
pessoas. Os Data Marts podem servir como veículo de teste para empresas que desejam
explorar os benefícios do Data Warehouse. Entre as principais vantagens, Serra (2002) aponta
a diminuição drástica do custo de implementação, a manutenção de sistemas de apoio à
decisão e a possibilidade de aquisição de um número muito maior de corporações, além da
rapidez em ser desenvolvido e a concentração de esforço/time já que possuem o escopo mais
limitado e são mais identificados com grupos de necessidades de usuários.
O Database Marketing consiste numa abordagem interativa para o marketing, cujo uso
está mais focado em canais e meios de comunicação de marketing. Tal banco de dados
registra e mantém uma memória eletrônica de dados de clientes, clientes potenciais e todos os
contatos comerciais e de comunicação. Serra (2002) aponta como o principal objetivo do
Database Marketing a melhoria de atendimento nos contatos futuros e um planejamento mais
realista de todo o marketing. Segundo Serra (2002) há dois usos principais para o Database
Marketing: marketing para clientes, onde se mantém um relacionamento estreito com clientes,
com a possibilidade de oferecer serviços especiais, o que pode resultar em fidelidade,
aumento de vendas e redução de “attrition”; e marketing para não-clientes (prospects), cujo
objetivo é identificar os clientes potenciais a partir da compreensão das motivações do
consumidor o que resultará na expansão da base de consumidores com custos decrescentes.
Numa arquitetura de aplicação de análise multidimensional de dados como o OLAP
(On-line Analytical Processing) os dados são representados em diferentes dimensões. De
acordo com Singh (2001), ferramentas OLAP fornecem meios tecnológicos para análise
completa do negócio possibilitando aos usuários analisar e navegar os dados para detectar
tendências, exceções e obter detalhes para entender a evolução da empresa. Inmon, Welch e
Glassey (1999) conceituam OLAP como uma extensão do Data Warehouse. Alguns aspectos
merecem maior importância, como a possibilidade de personalização no nível departamental e
“o preço da criação para o processamento OLAP ser pago apenas uma vez” (INMON et al.,
1999, p. 187).
Técnicas para segmentação

As técnicas utilizadas por profissionais de marketing para segmentar os clientes de
uma organização, hoje, são diversas. Segundo Ross apud Gordon (2001), as principais
técnicas são: redes neurais, árvores de decisão, análise multivariada e indução de regras.
Laudon (2002) acrescenta entre as técnicas, a lógica fuzzy, os algoritmos genéticos e os
agentes inteligentes.
Malhotra (2001) aponta a análise de conglomerados, ou Cluster, como técnica
importante de segmentação. Vavra (1993) completa com a abordagem de segmentação
baseada nas categorias de RFM (Recência, Freqüência e valor Monetário). Outros autores
como Duffy (2002), falam de RFV, substituindo M de monetário por V de Valor.
5
Em geral as técnicas são aplicadas segundo um modelo conceitual de segmentação que

embasa a criação dos grupos de elementos similares. São diversos os modelos existentes, mas
Miglautsch (2002) considera aqueles baseados na abordagem de RFV como os mais utilizados
nas segmentações do marketing direto por décadas. Por outro lado, alerta para as limitações
do método, como o foco excessivo nos melhores clientes e a inadequação no uso da variável
recência em empresas novas com crescimento rápido.
Neste trabalho, o modelo de RFV será tratado por três técnicas: Cluster, CHAID ou
árvores de decisão categórica e categorização por RFV.
Análise de Cluster
O princípio da técnica é a divisão baseada em uma medida de similaridade ou
distância para a criação de grupos homogêneos ou clusters. Os casos são individualizados no
começo do processo, passando a se juntar apenas no decorrer da aplicação, de acordo com a
similaridade apresentada em relação a certas variáveis (FREITAS e HEINECK, 2001). A
análise de cluster é uma das técnicas multivariadas mais utilizadas pelos autores da área de
marketing e segmentação (FREITAS e HEINECK, 2001), cujo objetivo principal é a redução
do número de casos sob análise.
Ao contrário de outras técnicas, o cluster não necessita calcular uma matriz de
proximidade como um passo intermediário. A técnica de cluster permite formar grupos
homogêneos, desconsiderando os casos perdidos ou missing. Cada grupo possui números de
clientes diferentes, mas com características semelhantes. Isso porque ao analisar os dados
contidos num banco, é possível verificar que muitos deles são complementares, sendo
necessária mais de uma característica para formar os segmentos.
A redução da população em grupos é a base principal da técnica de cluster. O primeiro
passo numa segmentação por Cluster é definir a estrutura dos dados alocando as ocorrências
semelhantes num mesmo grupo. Para saber como medir a semelhança entre as variáveis
podem ser utilizados métodos diversos, como correlação entre objetos, distâncias euclidianas
e, ainda, e proximidades entre ocorrências parecidas (HAIR et al., 1998).
Também é preciso saber quantos grupos serão formados. Enquanto o número de
grupos diminui, reduz também a sua homogeneidade. É do pesquisador a decisão sobre o
número de grupos a serem formados.
Malhotra (2001) classifica os processos de aglomeração para formação dos clusters em
dois: hierárquico e não-hierárquico. A aglomeração hierárquica se caracteriza pelo
estabelecimento de uma hierarquia, ou estrutura em forma de árvore. Já os métodos não-
hierárquicos, chamados também de K-means clustering consistem em centros, onde todos os
objetos a menos de um valor pré-determinado a contar do centro são agrupados juntamente.
CHAID (Árvore de decisão)

CHAID objetiva agrupar um conjunto de dados baseado na simplificação do número
de variáveis discriminantes que melhor explicam os segmentos gerados. O método de árvores
de regressãoi, ou Detecção de Interação Automática do Qui-Quadrado – CHAIDii - consiste
em análises de freqüência de categorias procedidas com o objetivo de explicar a
heterogeneidade de uma variável dependente qualitativa.
O modelo das árvores cria distinção e segmentos estatisticamente significantes. Cada
segmento tem um único perfil. A porcentagem da amostra populacional neste segmento é
depois comparada com os resultados de toda a população. Isto permite ao analista de
marketing rever quais segmentos consomem acima ou abaixo de um dado padrão.
6
As árvores de decisão dividem os dados em grupos com base no valor das variáveis
que são classificadas de acordo com os resultados potenciais das decisões. Para Gordon
(2001), as ferramentas que usam árvores de decisão categóricas têm dificuldades em
manipular conjuntos contínuos de dados, como idade do cliente e vendas. Na técnica de
CHAID, os resultados são visualizados na forma de um diagrama em árvore, como divisões
progressivas em pequenos ramos. A princípio, toda população é considerada, sendo
progressivamente dividida, por meio da utilização de variáveis que melhor explicam a sua
variação. (FREITAS e HEINECK, 2001).
Os diagramas da técnica de CHAID devem ser pensados como um “tronco de árvore”,
com divisões progressivas em ramificações menores. Assim funciona a técnica: o tronco
inicial consiste em todas as variáveis importantes para a segmentação. Uma série delas é
estudada e avaliada para iniciar o processo de distribuição a fim de conduzir a uma
discriminação estatisticamente significante de variáveis dependentes. A segunda ramificação
é formada por variáveis mais significantes da primeira amostra que foi dividida. Para cada
novo grupo que é formado é verificada a possibilidade de formar novos subgrupos tomando
por base variáveis dependentes. Ao término do processo, o resultado é um desenho de
ramificações, cada qual especificando mais o grupo a ser segmentado. A cada etapa são feitos
testes estatísticos com o objetivo de verificar se cada variável realmente pode oferecer um
subgrupo homogêneo.
Freitas e Heineck (2001) citam entre as principais vantagens na utilização do método,
a possibilidade de utilização de variáveis dependentes e independentes em diferentes formatos
e de várias bases para a segmentação buscando-se a homogeneização dos segmentos criados,
a possibilidade dos valores faltantes serem tratados pelos softwares disponíveis, sendo
agregado ao grupo que mais se assemelhar a ele ou isolado em uma categoria distinta e,
também, a não necessidade de estabelecer provisoriamente uma ou mais variáveis como base
para segmentação.
Análise Categórica de Recência, Freqüência e Valor (RFV)

A técnica de categorização por RFV permite dividir em categorias os registros
presentes em um banco de dados, de forma a conhecer quem são os compradores mais
recentes, os que compram com mais freqüência e quem são os que mais gastam com produtos
e serviços. Essa técnica só pode ser utilizada para clientes da carteira da empresa ou
organização e trata-se do método mais eficiente e menos oneroso de se direcionar mala direta
para maximizar lucros (HUGHES, 1998).
A Recência é a mais poderosa das três unidades. Hughes (1998) aconselha a usar a
data da última compra para investir no cliente. Segundo ele, “nesse rápido instante de
entusiasmo pelo novo produto e pela sua empresa, é bem possível que o consumidor venha a
comprar mais alguma coisa”. Os compradores mais recentes são os consumidores de maior
potencial de retorno. É importante ressaltar que em empresas de serviço a idéia de recência
acima descrita pode não ser válida, pois o consumo é contínuo. É possível, por exemplo,
medir a recência numa empresa de serviço pela relação entre o tempo e a freqüência com que
o cliente utiliza o serviço. Pela mesma linha de raciocínio é possível verificar que se o cliente
tem muito tempo de empresa e pouco utiliza, sua recência pode ser baixa, já o contrário indica
uma recência com valor mais alto. Em geral, pode-se afirmar, que quanto mais recentemente o
cliente visitou a empresa, maior a chance de retornar.
O segundo fator de maior impacto no comportamento de consumo do cliente é a
freqüência, ou seja, o número de vezes que uma pessoa adquire produtos ou serviços de uma
organização. A freqüência deve ser combinada com a recência, a fim de compreender de
modo adequado, o comportamento do consumidor. Segundo Duffy (2002), a freqüência pode
7
ser mensurada de duas maneiras: a média de transações em um determinado período ou o

tempo médio entre transações. Por fim, valor representa o montante gasto por um cliente em
um determinado período de tempo.
A terceira unidade é criada pelo cálculo do valor obtido de cada cliente, desde a
ocasião em que passaram a fazer parte do banco de dados da empresa. Aqueles clientes que
gastam mais têm um retorno melhor (HUGHES, 1998). Contudo, o valor não tem o mesmo
“poder de fogo” da recência ou da freqüência.
Para cada uma das variáveis é calculado um valor. Quando o banco de dados é
dividido em quartis, o cliente mais recente recebe o valor 4. O mais freqüente, também recebe
valor 4. E, o que mais gasta também é 4. Assim, o cliente ideal é o 4-4-4. Já o cliente 1-1-1
está numa situação que não compra com freqüência, gasta pouco e não vem comprando
recentemente. Miglautsch (2002), aconselha a criação de variáveis adicionais ao grupo a fim
de obter informações internas de compra. Este último geralmente é o maior grupo e representa
um baixo potencial para a organização.
Método
Pesquisa, população e amostra

Quanto aos fins, trata-se de pesquisa descritiva (GIL, 1996), cujo objetivo primordial é
a descrição das características de uma determinada população ou fenômeno ou, então o
estabelecimento de relações entre variáveis. Quanto aos procedimentos técnicos utilizados, o
trabalho reúne pesquisa bibliográfica, desenvolvida a partir de material já elaborado,
constituída, principalmente, de livros e artigos científicos, assim como modelagem e
tratamento analítico de dados (GIL, 1996).
A população original da presente pesquisa consiste em aproximadamente 902 mil
clientes de um grande banco de varejo situados na região metropolitana de São Paulo.
A amostra utilizada é proveniente de uma pesquisa de satisfação de clientes realizada
pelo banco de varejo no ano de 2000. Esta pesquisa consistiu em entrevistar e agregar dados
de transações de 7.787 clientes identificados por um código padrão da empresa. Para efeito
deste trabalho, foram considerados apenas os dados transacionais dos clientes. Os dados
relativos à satisfação não tiveram utilidade neste trabalho.
A partir desses dados secundários e para atingir os objetivos propostos anteriormente,
foi necessário realizar um tratamento mais elaborado dos dados.
Primeiramente, foram apurados e suprimidos mais 87 casos de outliers. Para alcançar
este número, foi preciso a padronização das variáveis (z). Todos os casos com z 5 e z -5
foram desconsiderados. Restaram, portanto, 7.700 casos. Mas, para “tratar” todo o banco, foi
necessário, também, suprimir os casos considerados missing values, ou seja, aqueles que
apresentavam campos em branco nas três variáveis de interesse. Ao todo, 409 casos
encontravam-se nessa situação. Ao final, a amostra tratada apresentou 7.291 casos de clientes.
São esses os clientes que serão segmentados em grupos, de acordo com cada uma das três
técnicas: CHAID, Cluster e RFV.
Operacionalização das variáveis

Inicialmente, as variáveis apresentadas eram nove (Quadro 1). Porém, houve a
necessidade em criar novas variáveis, a partir das anteriores, que melhor atendessem ao
requisito de recência, freqüência e valor, devido ao modo como foi composto o trabalho.
8
Quadro 1 – Variáveis
Variável Escala Descrição
CODAG Nominal Código de Agência
CODCLI Nominal Código do Cliente
RENTB Métrica de razão Margem de contribuição gerada pelo cliente mensalmente
RENDA Métrica de razão Renda média que o cliente possui mensalmente
SENIOR Métrica de razão Tempo, em anos, que o cliente é correntista do banco
QSDEBAUT Métrica de razão Quantidade de saques de débito automático
QTMOV Métrica de razão Quantidade de movimentação de débitos e créditos efetuados
VLMOV Métrica de razão Somatório dos valores de débitos e créditos
QTCHEQ Métrica de razão Quantidade de cheques emitidos
Para isso, foram analisadas aquelas que pudessem ser úteis para a geração de novas
variáveis com o enfoque RFV de segmentação. Para construir grupos baseados em RFV, é
preciso levantar dados que apresentem a recenticidade do cliente. A Recência traduz em
números quando foi o último contato do cliente com a empresa. Quanto mais recente maior
será o valor a ele atribuído. Em termos estratégicos de marketing, o cliente recente é um bom
candidato a voltar e fazer novas compras.
Dentre as variáveis acima descritas, nenhuma apresenta características para ilustrar a
recentidade dos casos. Por este motivo, foi necessária a composição de duas variáveis para
gerar uma terceira capaz de oferecer subsídios para o entendimento do conceito. Optou-se,
dado o caráter contínuo do consumo de serviços em um banco, por utilizar-se o inverso da
senioridade <sênior>, conforme fórmula 1.1. Assim:
RECÊNCIA = ____1___
SENIOR (1.1)
A segunda unidade da abordagem RFV, freqüência, é o número de vezes que um

cliente adquire algo da empresa (Hughes, 1998). A maneira mais simples para calcular este
valor é somando quantas vezes o cliente teve contato com o banco. Optou-se pela variável de
quantidade de movimentações <qtmov> dividida pelo tempo de relacionamento <sênior>,
para estimar-se a quantidade de interações com o banco em um dado período de tempo, de
acordo com a fórmula 1.2.
FREQUÊNCIA = QTMOV / SENIOR (1.2)
O valor a ser utilizado na técnica de segmentação é o mesmo levantado pelo banco de

dados: o volume de movimentação do cliente <vlmov>, ou seja, o valor total de suas
transações (fórmula 1.3). Segundo Hughes (1998), aqueles que gastam mais têm um retorno
melhor. Dada as diferenças de margens de contribuição geradas por diversos tipos de
produtos, preferiu-se o montante de transações à margem de contribuição, que também
costuma ser usada como estimador de valor ou montante.
VALOR = VLMOV (1.3)
Como pode ser observado, para todas as técnicas foram utilizadas as proxies de
recência, freqüência e valor a fim de possibilitar a comparação mais precisa entre as mesmas.
É importante lembrar que, com a criação das proxies acima descritas e da tabulação dos
dados, as três técnicas estão utilizando o mesmo conjunto de variáveis para viabilizar a
comparabilidade dos resultados a serem obtidos.
O tratamento dos dados foi realizado por meio do software SPSS (Statiscal Package
for Social Sciences), versão 11.5. Optou-se por analisar os dados pelo mesmo modelo de
9
segmentação baseada em recência, freqüência e valor por oferecer a possibilidade de

comparar as três técnicas utilizando os mesmos parâmetros.
Análise Descritiva
A análise descritiva tem o objetivo de apresentar as estatísticas a respeito de cada
variável representativa de recência, freqüência e valor. Neste caso disponibiliza-se a média,
desvio padrão, valor máximo e mínimo e coeficiente de variação.
De acordo com a tabela 1, é possível perceber que a variável “Valor” assume uma
amplitude muito grande, sendo o valor máximo superior a 1.700.000,00 e o mínimo zero,
assim como um desvio-padrão avantajado. Analisando o coeficiente de variação, pode-se,
também, observar que a variável “recência” é a mais homogênea e o “valor”, a mais dispersa.
Tabela 1 – Análise Descritiva

N Mínimo Máximo Média Desvio Padrão Coeficiente de variação
Recência 7291 0,04 3,00 0,34 0,33 0,971
Freqüência 7291 0 1.366,40 100,15 148,53 1,483
Valor 7291 0 1.731.206,69 77.662,00 137.324,21 1,768
Aplicação de Análise Categórica de RFV

Na técnica de RFV, as três variáveis (recência, freqüência, valor) foram categorizadas
e distribuídas em tercis, ou três partes iguais. Hughes (1998) aconselha dividir o banco de
dados em quintis, ou cinco partes iguais por apresentar um número suficiente de combinações
para o estudo das estratégias de marketing. Com quintis, (5x5x5), haveria 125 combinações,
com quartis (4x4x4), o número de combinações diminui para 64. “Quanto menos
combinações, maior a probabilidade de se misturarem comportamentos diferentes de
consumidores, perdendo assim, a precisão acurada que você pode obter com um número
maior”.(HUGHES, 1998).
Nesta pesquisa, além da amostra ser considerada pequena (7.787), a distribuição do
banco em quintis ou quartis tornaria muito complexa a comparação entre as técnicas. Por este
motivo, optou-se por dividir o banco em tercis (3x3x3), possibilitando o surgimento de 27
grupos. Os clientes 3-3-3 são considerados os clientes mais fiéis e rentáveis.
Aplicação de Análise de Cluster

Os 7.291 casos foram distribuídos, inicialmente, em 54 centros. Considerou-se este
número por tratar do dobro do número de grupos formados pela técnica de RFV. A partir daí,
foi possível tratar os grupos a fim de torna-los mais homogêneos. A técnica de Cluster foi
realizada pelo método não-hierárquico K-means com fixação de centróides passo-a-passo
(stepwise). O objetivo foi compor igualmente 27 grupos.
No primeiro passo, após a formação dos 54 centros, foram eliminados todos os grupos
que possuíam de 1 a 2 casos. Assim, restaram 42 centros. É válido ressaltar que os casos
eliminados foram inseridos em novo centro de acordo com a similaridade existente entre este
e aquele.
As ocorrências que possuíam 3 a 6 casos foram suprimidas e introduzidas em outros
centros com características semelhantes. Reduziu-se o número para 31 centros. O mesmo
processo foi efetuado a fim de obter maior homogeneidade dentro dos grupos. Para isso,
centros que apresentavam até 14 casos foram eliminados, gerando os 27 grupos desejados.
Ao final, os 7.291 clientes foram distribuídos em 27 clusters. Os clusters ficaram
distribuídos de acordo com a Tabela 2.
10
Tabela 2 – Quantidade de casos nos 27 clusters formados

Cluster nº Qtd casos Cluster nº Qtd casos
1 1133 16 27
2 496 17 32
3 29 18 388
4 114 19 1614
5 16 20 22
6 184 21 24
7 233 22 314
8 31 23 56
9 57 24 23
10 82 25 1386
11 40 26 23
12 27 27 142
13 757
14 17 Valid 7291
15 24 Missing 0
Aplicação de CHAID
A terceira e última técnica a ser analisada foi CHAID. Como foi descrita por Freitas e
Heineck (2001), a imagem é de uma árvore. Cada ramificação é uma nova categoria formada.
A técnica de CHAID permite ao usuário contar a freqüência de casos em cada classe.
No presente estudo, a variável dependente (y) foi os 27 grupos formados pela técnica de
Cluster. A partir daí, os grupos foram subdivididos categoricamente usando basicamente
variáveis determinantes. Praticamente, as variáveis recência e freqüência não entram na
estrutura do modelo.
A categorização de variáveis, característica forte da técnica de CHAID, permitiu
formar outros 27 grupos com características diferentes dos inicialmente formados pela técnica
de Cluster.
Análise dos Resultados
Análise de Correlação
A correlação entre as três variáveis está expressa na tabela 3, evidenciando valores
significativos para p<0,01, embora a maior interação se dê entre recência e freqüência.
Tabela 3 – Análise de Correlação
Recência Freqüência Valor

Recência Pearson Correlation 1,000 0,621 -0,031
Sig. (2-tailed) - 0,000 0,008
Freqüência Pearson Correlation 0,621 1,000 0,253
Sig. (2-tailed) 0,000 - 0,000
Valor Pearson Correlation -0,031 0,253 1,000
Sig. (2-tailed) 0,008 0,000 -
** Correlation is significant at the 0.01 level (2-tailed).
11
Discussão sobre a criação dos grupos
Cluster
A técnica de Cluster, a primeira a ser realizada, formou 27 grupos distintos entre si.
No entanto, na Análise de Variância (ANOVA) e Teste de Scheffe que serão descritas a
seguir, vê-se que alguns clusters podem ser reagrupados pela semelhança ainda existente entre
os mesmos.
Vale ressaltar um certo desequilíbrio entre os grupos extremos, como, por exemplo, o
cluster 20 que possui poucos clientes e as maiores quantias na variável “valor” e o 19, que é o
maior em termos de quantidade de casos (1614 casos), embora apresentem baixos valores de
freqüência e valor. O grupo mais recente é o de número 20 e aquele com maior freqüência, o
de número 3.
A fim de confirmar e validar externamente o modelo criado foi realizada uma Análise
de Variância (ANOVA) da variável rentabilidade que não entrou no modelo. O valor de F foi
de 61,92, p<0,001.
Analisando-se os resultados providos pelas variáveis que entraram no modelo –
recência, freqüência e valor, adotou-se testes ANOVA e Scheffe. Este último visa a identificar
os segmentos menos distintos, a fim de formar um menor número de grupos. Para o
profissional de marketing é mais viável trabalhar com grupos mais homogêneos, que
geralmente implica maior quantidade de grupos, dificultando o estabelecimento e a
manutenção de estratégias distintas, dada a complexidade gerencial que proporcionará.
No presente estudo, a variável recência não se mostrou significativamente distinta
entre os 27 grupos criados (F=0,946 e p<0,543). No entanto há diferenças nas variáveis
Freqüência e Valor entre os grupos. Pelo teste de Scheffe, recência reagrupa os clusters em
um único grupo, ou seja, não há diferenças, enquanto a variável freqüência forma 3 grupos
distintos. Por fim, o teste de Scheffe não acrescentou mudanças quanto à variável valor. Os 27
clusters não foram reagrupados. Isso porque a variável em questão tem alto poder
discriminatório, como foi visto na análise de variância. Cada um dos 27 clusters possui
características próprias capazes de justificar a sua formação.
O profissional de marketing deve ser capaz de perceber as peculiaridades de cada
grupo formado e a partir daí formular estratégias de marketing direcionado, como propõe
autores como Bretzke (2000) e Vavra (1993). O cluster com características de menor
freqüência e valor deve ser cuidadosamente analisado. No presente estudo este cluster é o de
número 19. Como é o que possui mais casos (1614), não pode simplesmente ser descartado,
mas trabalhado. Clientes fiéis e de elevado valor como é o caso dos 22 clientes do cluster 20
devem ter um tratamento diferenciado. E, na era do marketing de relacionamento, deve-se
aplicar um tratamento personalizado e capaz de atender às suas necessidades específicas.
Categorização por RFV

A distribuição dos casos em tercis (3x3x3) possibilitou a formação de 27 grupos. É
possível perceber, de acordo com a Tabela 4, que o número de grupos 1-1-1 (menor recência,
freqüência e valor) foi superior aos 3-3-3 (maior recência, freqüência e valor). Um grupo que
se destaca por possuir menor número de casos entre todos os analisados é o 1-3-2 (menor
recência, maior freqüência e médio montante).
12
Tabela 4 – Distribuição de freqüência de grupos RFV

RFV Qtd Casos RFV Qtd Casos
111 770 223 270
112 435 231 30
113 203 232 351
121 49 233 583
122 356 311 257
123 575 312 19
132 1 313 8
133 47 321 262
211 569 322 102
212 104 323 44
213 65 331 194
221 299 332 589
222 474 333 635
Como a técnica RFV exige categorizar as variáveis, houve um estreitamento na

dispersão dos grupos. A Análise de Variância (ANOVA) demonstrou que a variável valor
(F=166,50, p<0,001) já não possui grande poder de diferenciação como na técnica de cluster.
E, contraditoriamente, a variável freqüência (F=543,64, p<0,001) apresentou maior
capacidade de diferenciação.
O teste de Scheffe não pode ser aplicado em razão do grupo 132 apresentar um único
caso.
Ao categorizar as variáveis, a técnica de RFV torna os grupos maiores e,
conseqüentemente, mais heterogêneos dentro e entre si. Para a presente aplicação, os grupos
extremos sofreram um grande incremento de casos prejudicando a compreensão de suas
características. Uma possível explicação para a variável “valor” na Categorização de RFV não
ter apresentado a mesma capacidade discriminante que em cluster reside no fato desta última
tratar os valores de forma métrica, potencializando o efeito dos valores extremos observados.
CHAID
A técnica CHAID formou igualmente 27 grupos tomando como ponto de partida os 27
clusters. A cada nível a técnica separava os clusters em outros com características
semelhantes. Surgiram 27 novos grupos cuja variável com maior poder de discriminação foi o
valor. Por meio da Análise de Variância (ANOVA), percebe-se que, como na técnica de
Cluster, a recência não exerce influência na formação de segmentos. E, o montante é capaz de
diferenciar os grupos entre si.
O teste de Scheffe reagrupou os 27 grupos em 2, levando em consideração a variável
recência. Já quando a variável testada foi freqüência, o número de grupos formados foi 8. E, o
“valor” originou 24 grupos. Coincidentemente à técnica de Cluster, o CHAID apresentou
como variável de diferenciação mais forte, “valor”. A recência, por sua vez, apresentou maior
dispersão que na técnica de Cluster, formando mais dois novos grupos.
Para formulação de estratégias de marketing, a técnica CHAID permite visualizar os
clientes de forma genérica e, de acordo com o negócio, agrupa-los diante de características
semelhantes. A técnica de CHAID, considerando a distribuição das três variáveis, induz a
criação de alguns poucos grupos com muitos casos, por exemplo, os grupos 24,25 e 26 que
representam 50% da amostra, aproximadamente, dada a forte dispersão existente na variável
que tem o maior poder discriminante, isto é, “valor”.
13
Conclusão
A filosofia de marketing de relacionamento aponta a retenção de clientes como fator
essencial para manutenção da posição competitiva de algumas empresas em setores
concorrenciais e orientados à fidelização. O marketing de relacionamento tem o papel de
conhecer os clientes e trata-los individualmente. Conhecer significa obter o maior número de
informações a respeito do cliente. A partir daí, é preciso agrupa-los de acordo com as
características semelhantes entre eles, a partir de modelos e técnicas de segmentação de
clientes.
Modelos RFV são relativamente simples de serem implementados e permitem
conhecer o cliente em termos de comportamento de consumo, naquelas variáveis que são mais
consideradas como determinantes de repetição de compra.
A presente pesquisa buscou comparar a aplicação de três técnicas de segmentação –
CHAID, Cluster e Análise Categórica em um modelo de segmentação baseado em RFV, no
intuito de evidenciar diferentes formas de se implementar um modelo RFV. Também buscou-
se apresentar a capacidade distinta de discriminação de variáveis utilizadas no modelo, dado o
seu nível de dispersão.
Como direcionamentos para futuros trabalhos podem ser sugeridos: a) a aplicação de
modelos RFV longitudinais, onde o efeito da rentabilidade se dá ao longo do tempo, e não
simultaneamente, com a recência e a freqüência; b) a aplicação em mercados de produtos, ao
invés de serviços, uma vez que há maior clareza no conceito de recência nesse tipo de
negócio; c) a avaliação a posteriori dos efeitos trazidos pelo uso de estratégias baseadas em
variáveis de recência, freqüência e valor.
Como limitações do trabalho, deve-se salientar que os resultados obtidos referem-se ao
caso específico utilizado, não podendo ser generalizado para outras instituições financeiras e
setores. Também é necessário realçar a limitação metodológica de utilizar como variável
categórica, na técnica CHAID, o grupo criado pelo cluster, e o uso de tercis, ao invés de
quartis, na técnica de análise categórica de RFV.
Referências Bibliográficas
AAKER, David A.; KUMAR, V.;DAY, George S. Pesquisa de Marketing. São Paulo: Atlas,
2001.
BRETZKE, Miriam. Marketing de Relacionamento e Competição em Tempo Real (Com
CRM). São Paulo: Atlas, 2000.
BRETZKE, Miriam. O Customer Relationship Management (CRM) na era da competição em
tempo real. Disponível em http://www.itcom.com.br. Acesso em 14.11.2002.
BROWN, Stanley A. CRM – Costumer Relationship Management: uma ferramenta
estratégica para o mundo e-business. São Paulo: Makron Books, 2001.
DUFFY, Dennis L. Do something! Guia prático para fidelização de clientes. São Paulo:
Fábrica Comunicação Dirigida, 2002.
EISENFELD, Beth. The Economics Justification of IT: Exploiting Technology for Business
Advantage – CRM 101: The basics. The Gartner´s Group Summit. In 6º Annual CRM User
Fórum. Setembro/2002.
ENGEL, James F.; BLACKWELL, Roger D.; MINIARD, Paul W. Consumer Behavior.
Orlando: The Dryden Press, 1995.
FREITAS, Ana Augusta Ferreira; HEINECK, Luiz Fernando Mahlmann. Metodologia de
segmentação de mercado pela associação direta entre produtos e clientes. In: ENCONTRO
ANUAL DA ASSOCIAÇÃO NACIONAL DOS PROGRAMAS DE PÓS-GRADUAÇÃO
14
EM ADMINISTRAÇÃO. 25o, 2001, Campinas. Anais... Rio de Janeiro: ANPAD, Set/2001.

CD-ROM.
GIL, Antonio Carlos. Como elaborar projetos de pesquisa. São Paulo: Atlas, 2002.
GORDON, Ian. Marketing de Relacionamento: estratégias, técnicas e tecnologias para
conquistar clientes e mantê-los para sempre. São Paulo: Futura, 2001.
HAIR, Joseph F. et al. Multivariate data analysis. 5a. ed. New Jersey: Prentice-Hall, 1998.
HUGHES, Arthur M. Database Marketing estratégico. São Paulo: Makron Books, 1998.
INMON, W. H., WELCH, J. D., GLASSEY, Katherine L. Gerenciando Data Warehouse. São
Paulo: Makron Books, 1999.
KALAKOTA, Ravi; ROBINSON, Márcia. E-business: estratégias para alcançar o sucesso
no mundo digital (2 ed.). Porto Alegre: Bookman, 2002.
KOTLER, Philip. Administração de marketing: a edição do novo milênio. São Paulo: Prentice
Hall, 2000.
LAUDON, K.; LAUDON, J. P. Gerenciamento de Sistemas de Informação. Rio de Janeiro,
LTC, 2002.
MALHOTRA, Naresh K. Pesquisa de marketing: uma orientação aplicada. 3a.ed. Porto
Alegre: Bookman, 2001.
McKENNA, Regis. Marketing de Relacionamento. São Paulo: Campus, 1992.
MIGLAUTSCH, John. Application of RFM principles: what to do with 1-1-1 costumers?
Journal of Database Marketing. v.9, n.4, p.319-324, 2002.
PEPPERS, Don. One to One – B2B. São Paulo: Campus, 2001.
RAPP, Stan; COLLINS, Thomas L. The New Maximarketing. Nova York: McGraw-Hill,
1996.
SCOTT, Nelson. Gartner’s CRM Vision: a road for a customer – centric transformation. The
Gartner´s Group Summit. In 6º Annual CRM User Fórum. Out/2002.
SERRA, Laércio. A essência do Business Intelligence. São Paulo: Berkeley Brasil, 2002.
SINGH, Harry. Data Warehouse: conceitos, tecnologias, implementação e gerenciamento.
São Paulo: Makron Books, 2001.
TAM, Nguyen; BORGES, Adilson. A segmentação de mercado a partir do método fuzzy
logic: uma alternativa metodológica para o problema de superposição dos segmentos na
classificação. In: ENCONTRO ANUAL DA ASSOCIAÇÃO NACIONAL DOS
PROGRAMAS DE PÓS-GRADUAÇÃO EM ADMINISTRAÇÃO. 25o, 2001, Campinas.
Anais... Rio de Janeiro: ANPAD, Set/2001. CD-ROM.
VAVRA, Terry G. Marketing de relacionamento (After Marketing): Como manter a
fidelidade de clientes através do marketing de relacionamento. São Paulo: Atlas, 1993.
i
Conhecido assim por formar o desenho semelhante a uma árvore
ii
Chi-Square Automatic Interaction Detection

Utilização e Análise de Técnicas Alternativas para A Elaboração de Segmentos RFV

Enviado por

Dados do documento

Descrição original:

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Utilização e Análise de Técnicas Alternativas para A Elaboração de Segmentos RFV

Enviado por

Direitos autorais:

Formatos disponíveis

Utilização e Análise de Técnicas Alternativas para a Elaboração de Segmentos RFV

Autoria: Maria Carolina Barbosa Dantas, Fernando de Rosa

Para a implantação de CRM, o primeiro passo a ser considerado é a segmentação de

Conhecer os clientes a partir da segmentação

Em tempos de grande transformação no mundo empresarial, conhecer o cliente

Técnicas para segmentação

Em geral as técnicas são aplicadas segundo um modelo conceitual de segmentação que

CHAID (Árvore de decisão)

Análise Categórica de Recência, Freqüência e Valor (RFV)

ser mensurada de duas maneiras: a média de transações em um determinado período ou o

Pesquisa, população e amostra

Operacionalização das variáveis

A segunda unidade da abordagem RFV, freqüência, é o número de vezes que um

FREQUÊNCIA = QTMOV / SENIOR (1.2)

O valor a ser utilizado na técnica de segmentação é o mesmo levantado pelo banco de

VALOR = VLMOV (1.3)

segmentação baseada em recência, freqüência e valor por oferecer a possibilidade de

Tabela 1 – Análise Descritiva

Aplicação de Análise Categórica de RFV

Aplicação de Análise de Cluster

Tabela 2 – Quantidade de casos nos 27 clusters formados

Análise dos Resultados

Tabela 3 – Análise de Correlação

Recência Freqüência Valor

Discussão sobre a criação dos grupos

Categorização por RFV

Tabela 4 – Distribuição de freqüência de grupos RFV

Como a técnica RFV exige categorizar as variáveis, houve um estreitamento na

EM ADMINISTRAÇÃO. 25o, 2001, Campinas. Anais... Rio de Janeiro: ANPAD, Set/2001.

Você também pode gostar