Escolar Documentos
Profissional Documentos
Cultura Documentos
1. Introduo
As organizaes contemporneas vm exigindo cada vez mais recursos tecnolgicos
para anlise das informaes nas tomadas de decises. Premidos pela necessidade de
tomar decises em um tempo cada vez mais curto, os executivos precisam dispor de
informaes rpidas e precisas que lhes sirvam de suporte. Com essa necessidade surgiu
o conceito de Business Intelligence (CARVALHO, 2001).
Os sistemas de Bussiness Intelligence (BI) tm como caracterstica procurar
relaes de causa e efeito, extrair e explorar informaes contidas em grandes bancos de
dados. A inteligncia do negcio est associada a proporcionar vantagem competitiva s
organizaes com informaes que assumem papel fundamental no sucesso dos
investimentos (CARVALHO, 2001).
Um sistema de BI envolve ferramentas que realizem anlises preditivas, como,
por exemplo, Data Mining que alm de buscar interpretao dos dados existentes visa
fundamentalmente inferir e generalizar possveis fatos e correlaes no percebidas nem
facilmente deduzidas por analistas (PASSARI, 2003).
Data Mining o processo de selecionar informao de grandes bancos de dados
em busca de padres escondidos e informao preditiva utilizando algoritmos de
aprendizagem ou classificao baseados em redes neurais, anlise estatstica,
modelagem e mquinas de aprendizagem (ELMASRI; NAVATHE, 2002). Os mtodos
de data mining podem, a partir de um conjunto de dados, identificar ocorrncias e
similaridades, associar eventos ou prever o comportamento de uma determinada
varivel (CARVALHO, 2001). Dentre as reas estratgicas que mais tm explorado o
uso de data mining encontramos o marketing, as vendas, finanas a manufatura e sade
(GOLDSCHMIDT; PASSOS, 2005).
A partir da definio dos objetivos e da avaliao dos dados, possvel escolher
o mtodo de data mining que ser utilizado. Quando objetiva-se, por exemplo, analisar
questes relativas ao comportamento de certas variveis, pode-se utilizar redes neurais.
Trata-se de uma estrutura formada por unidades de processamento, ou neurnios,
funcionalmente muito simples, mas que por serem altamente interconectados, formam
um sistema de processamento maciamente paralelo que pode ser utilizado para tarefas
como reconhecimento de padres e aproximao de funes (PASSARI, 2003). As RN
so tcnicas que fornecem mtodos de aprendizagem, pois so conduzidas a partir de
amostragens de testes. Com esses mtodos de aprendizagem, respostas a novas entradas,
inditas, podem ser interpoladas a partir das amostras conhecidas (PASSARI, 2003).
Nas ltimas dcadas, com a alta competio empresarial, clientes mudam de
empresas com mais frequncia. O data mining pode ser utilizado para verificar por que
os clientes trocam uma empresa por outra; pode-se localizar ofertas e oferecer vantagens
para evitar a fuga de clientes; ou mesmo localizar clientes que podem sair da empresa
sem representar prejuzo (CARVALHO, 2001).
No mercado de bebidas, por exemplo, o surgimento de novas marcas e
fabricantes abalam a garantia de manter o cliente fiel, exigindo das organizaes um
estudo ttico e estratgico do mercado. No ramo de distribuio de bebidas, um sistema
de BI pode avaliar a viabilidade mercadolgica e gerir todas as informaes ao nvel
gerencial, adquirindo vantagem competitiva para adquirir mercado e consumidores.
Essa anlise envolve o estudo de informaes que, se devidamente tratadas, podem
gerar resultados de significativa relevncia para a proposio, elaborao e/ou avaliao
dos mais diversos processos.
Este trabalho prope um sistema baseado em data mining para solucionar o
problema de inatividade dos clientes em uma distribuidora de bebidas, que normalmente
desconhece a inatividade dos seus clientes, pois os relatrios de positivao apontam
que apenas 50% dos clientes cadastrados so atendidos por ms. Assim, a empresa no
consegue avaliar o motivo que a leva a no conseguir atender todos os clientes.
Ao analisar os dados histricos da empresa, pode-se identificar o cliente que
deixou de ser tornar ativo. A avaliao dos resultados deve indicar a origem do
problema, podendo ser relacionado ao vendedor responsvel ao giro do produto
comercializado, ou at mesmo logstica comercial que interfere no tempo de entrega
do produto.
O restante deste artigo est estruturado como segue. Na Seo 2, apresentado o
mecanismo e operao comercial da empresa. A Seo 3 contempla o modelo proposto,
com o critrio e caractersticas de classificao e polticas comerciais da distribuidora de
bebidas. A anlise detalhada deste trabalho ocorre na Seo 4, no estudo experimental
com os testes, resultados, interpretaes e definies. Por fim, as consideraes finais
deste trabalho so apresentadas na Seo 5.
4. Estudo Experimental
Para o desenvolvimento do modelo de anlise de comportamento de clientes foi
utilizada uma rede neural feedforward multicamadas com apenas uma camada oculta e o
algoritmo backpropagation (RUMELHART; HINTON; WILLIAMS, 1986) para seu
treinamento. A base de dados da empresa possui 325.470 registros de venda de todo o
ano de 2010. Foram utilizados 2.195 registros como exemplos de comportamento dos
clientes para composio da base de treinamento da rede neural, divididos como segue:
1.141 exemplos para treinamento;
541 exemplos para validao; e
513 exemplos para teste.
Para encontrar a melhor configurao da rede neural, foram executados quatro
treinamentos com topologias de 10, 20, 30 e 50 neurnios na camada oculta. Para cada
treinamento, foram executadas 1.000 pocas. A taxa de aprendizagem foi fixada em 0,5
e o fator de momento em 0,01. No treinamento, a configurao de pesos sinpticos
escolhida foi aquela que produziu o menor erro quadrtico mdio (EQM) da base de
validao durante o treinamento, i.e., a configurao que se supe ter a melhor
capacidade de generalizao. Em seguida, calculou-se o erro quadrtico mdio (EQM)
da base de teste. Se esse erro de teste fosse menor que 0,1 (10%), a rede neural estaria
aprovada no treinamento; caso contrrio, repetir-se-ia o treinamento com novos
parmetros, e.g., diferentes pesos iniciais e/ou taxa de aprendizagem.
A Figura 2 mostra os erros de treinamento e validao das quatro topologias das
redes neurais treinadas. Em quase todos os casos, os erros de treinamento, em azul,
declinaram rapidamente e se mantiveram em valores baixos durante todo o treinamento.
Apenas no treinamento da rede neural com topologia de 50 neurnios ocultos, Figura
2(d), houve oscilao do erro de treinamento. Os erros de validao, em verde, das redes
neurais com topologias de 10 e 20 neurnios ocultos, Figuras 2(a) e 2(b), foram os mais
estveis, sendo que a ltima topologia teve um EQM significativamente menor que as
demais. Conclui-se que, considerando estabilidade e magnitude do EQM, a rede neural
com topologia de 20 neurnios ocultos, Figura 2(b), obteve o melhor desempenho no
treinamento.
Figura 2(a). Topologia com 10 neurnios ocultos Figura 2(b). Topologia com 20 neurnios ocultos
Figura 2(c). Topologia com 30 neurnios ocultos Figura 2(d). Topologia com 50 neurnios ocultos
Figura 2. Erros de treinamento e validao das quatro topologias das redes neurais
A Figura 3 mostra os grficos de barras dos erros absolutos da base de teste das
quatro redes neurais treinadas. Esses erros simulam a rede neural operando uma
situao real, onde as entradas representam padres no apresentados no treinamento.
Na Figura 3(b), observa-se que com a rede neural com topologia de 20 neurnios
ocultos o maior erro de teste absoluto no atinge 0,4, e que a maioria dos erros
concentra-se entre 0 e 0,05. Nas topologias com 10 e 30 neurnios na camada oculta,
Figuras 3(a) e 3(c), os erros absolutos tambm concentram-se em uma faixa de valores
baixos, entre 0 e 0,3, mas tiveram erros prximos ou iguais a 1. A topologia com 50
neurnios na camada oculta, Figura 3(d), teve o pior desempenho com a base de teste,
com muitos erros absolutos variando entre 0 e 0,45.
Figura 3(a). Topologia com 10 neurnios ocultos Figura 3(b). Topologia com 20 neurnios ocultos
ocultos
Figura 3(c). Topologia com 30 neurnios ocultos Figura 3(d). Topologia com 50 neurnios ocultos
Para todas as redes neurais treinadas, foram produzidos histogramas para avaliar
a frequncia dos erros absolutos na base de teste, como mostra a Figura 4. Observa-se
que todas as topologias tiveram a maioria das ocorrncias abaixo de 0,05. A topologia
com 20 neurnios ocultos, Figura 4(b), foi a que teve a maior distribuio dos erros
absolutos; entretanto, a maior densidade, 219 exemplos da base de teste ou 42,7% do
total, foi de erros absolutos muito prximos de 0. Essa mesma topologia teve cerca de
90% dos erros de teste menores que 0,05.
Figura 4(a). Topologia com 10 neurnios ocultos Figura 4(b). Topologia com 20 neurnios ocultos
Figura 4(c). Topologia com 30 neurnios ocultos Figura 4(d). Topologia com 50 neurnios ocultos
Figura 4. Histograma dos erros de teste das quatro topologias das redes neurais
Neurnios Desvio
Teste EQM Menor Erro Maior Erro
Ocultos Padro
5. Concluses
Este trabalho desenvolveu um mtodo para automatizar a anlise de comportamento de
clientes de uma distribuidora de bebidas. A metodologia, que utilizou conceitos de
Business Intelligence, foi baseada em redes neurais.
A partir de uma metodologia de treinamento e teste de redes neurais, foram
realizados alguns experimentos com uma base de pedidos de todo o ano de 2010. Foram
testadas quatro topologias de redes neurais com 10, 20, 30 e 50 neurnios na camada
oculta. A topologia escolhida foi aquela com 20 neurnios ocultos, pois apresentou o
melhor desempenho de treinamento e os melhores resultados estatsticos com a base de
teste caracterizando melhor capacidade de generalizao. A topologia com 20
neurnios ocultos obteve a curva do erro de treinamento mais estvel e os menores erros
de validao. As demais topologias, em especial aquelas com 30 e 50 neurnios ocultos,
apresentaram curvas do erro de validao mais instveis.
Utilizando a metodologia proposta, a distribuidora de bebidas conhecer melhor
o perfil de seus clientes e estar apta a operar no mercado de maneira eficiente,
buscando a fidelidade dos seus clientes. Alm de aumentar o faturamento da empresa, a
anlise de pedidos se tornar mais confivel e otimizada. As rotas dos vendedores
podero ser avaliadas de acordo com sua rentabilidade, proporcionando distribuidora
um melhor conhecimento da sua participao no mercado.
Referncias Bibliogrficas
CARVALHO, Lus Alfredo Vidal. Data Mining, a minerao de dados no
marketing; medicina, economia, engenharia e administrao. 1a. ed. So Paulo,
2001.
ELMASRI, R.; Navathe, S.B. Sistemas de banco de dados: fundamentos e
aplicaes. 3. ed. Rio de Janeiro:LTC, 2002.
FREIMAN, J. P.; PAMPLONA, E. de O. Redes neurais artificiais na previso do
valor de commodity do agronegcio. In: Encuentro Internacional de Finanzas, 5,
Santiago, Chile, 2005.
GOLDSCHMIDT, Ronaldo; PASSOS, Emmanuel Lopes. Data mining: um guia
prtico: conceitos, tcnicas, ferramentas, orientaes e aplicaes. Rio de
Janeiro:Elsevier, 2005.
HAYKIN, Simon. Redes Neurais: princpios e prtica. Porto Alegre:Bookman, 2001.