Escolar Documentos
Profissional Documentos
Cultura Documentos
ANLISE DE
LOGSTICA
FIDELIZAO
DE
CLIENTES
UTILIZANDO
REGRESSO
Resumo
A fidelizao de clientes tem sido usada como estratgia competitiva para aumentar a lucratividade
de uma companhia. A temtica desta pesquisa analisar o relacionamento dos clientes de uma
empresa, tendo por objetivo identificar pontos que auxiliem uma maior reteno de seus
consumidores. Este estudo prope a construo de um modelo matemtico que preveja a
probabilidade de algumas variveis importantes na fidelizao de clientes baseada em outras
variveis conhecidas. A ferramenta escolhida para esse fim foi a regresso logstica. Primeiramente
esse estudo oferece uma reviso terica sobre o setor no qual a empresa em questo est inserida,
sobre marketing de relacionamento, fidelizao, segmentao de clientes e regresso logstica. A
anlise descritiva dos dados foi feita com o auxlio do programa Minitab. Foram realizados alguns
testes de independncia entre pares de variveis pertinentes, bem como propostos dois modelos de
regresso logstica que tiveram como resposta duas variveis importantes que influenciam uma
possvel fidelizao. Uma delas foi a indicao positiva da empresa por parte dos clientes e a outra foi
a excelncia no desempenho de seu produto. No primeiro modelo, percebeu-se que a indicao
positiva est relacionada com a satisfao na instalao e desempenho, enquanto no segundo, a
varivel excelncia no desempenho apresentou forte ligao com a excelncia na assistncia tcnica,
localizao (capital ou interior), regio do Brasil e excelncia na instalao. O primeiro modelo
apresentou pequena melhora no poder preditivo da varivel enquanto no segundo modelo a melhora
foi significativa.
Palavras-chave: fidelizao de clientes, regresso logstica, segmentao de clientes
Abstract
The customer loyalty has been used as a competitive strategy to increase company profitability. The
theme of this research is to analyze the relationship of a company's customers, aiming to identify
points that help having a greater retention of their customers. This study proposes the construction of
a mathematical model that will provide the probability some important variables in customer loyalty
based on other known variables. The tool chosen for this purpose was logistic regression. Firstly this
study provides a theoretical review about the sector which the company in question is placed, about
relationship marketing, loyalty, customer segmentation and logistic regression. The descriptive
analysis was done with the using the program Minitab. It was done some independence tests
between pairs of relevant variables as well as proposed two logistic regression models that had
resulted two important variables that can influence a customer loyalty One was a positive indication of
the company by customers and the other was the excellence of the performance of their product. In
the first model, it was noted that the positive indication is related to satisfaction with installation and
performance, while in the second, the variable performance excellence had a strong connection with
excellence in service, location (capital or countryside) region of Brazil and excellence in installation.
The first model showed little improvement in predictive power of the variable while the second model
the improvement was significant.
Key-words: customer loyalty, logistic regression, segmentation of customers
INTRODUO
1.1
PROBLEMA DE PESQUISA
1.2
OBJETIVOS
Com o intuito analisar o relacionamento entre a referida empresa com seus consumidores e
obter maior lealdade por parte destes, o objetivo desse trabalho construir um modelo de
regresso logstica a partir do qual se possa identificar variveis importantes para a
fidelizao de clientes baseado em outras variveis conhecidas. Desta forma a empresa
poder melhorar seu dimensionamento de esforos de marketing, bem como seus
processos de venda e ps-venda. A partir da segmentao de clientes e entendimento de
suas necessidades individuais poder ser obtida uma maior reteno de clientes, levando
assim a uma provvel reduo de despesas e maximizao de lucros.
REVISO DA LITERATURA
Para a realizao desta pesquisa alguns tpicos foram especialmente estudados. Estes
esto apresentados com mais detalhes a seguir:
2.1
EQUIPAMENTOS
MDICOS,
ODONTOLGICOS,
HOSPITALARES
DE
LABORATRIOS, 2011b).
Dentro da indstria de equipamentos e materiais mdicos, hospitalares e odontolgicos, no
Brasil, o setor de odontologia o mais competitivo. Por haver uma procura elevada por
servios dessa rea, ocorreu um aumento da oferta por parte dos profissionais do
segmento, favorecendo assim o seu desenvolvimento. Por exemplo, em 2009, existiam no
pas aproximadamente 200 mil dentistas, o que conferiu ao setor de equipamentos e
insumos odontolgicos o segundo lugar do mundo, perdendo apenas para os Estados
Unidos (PIERONI; REIS; SOUZA, 2010).
No Brasil, segundo Manfredini (2006), tal indstria possui algumas caractersticas que as
diferenciam das demais, dentre elas se sobressaem: a macia participao das exportaes
sobre as importaes, o volume considervel de pases para onde os produtos so
exportados e a produo autossuficiente no pas.
Nas regies Sul e Sudeste est presente a maior concentrao das indstrias do setor no
pas. Na regio Sul, principalmente no Rio Grande do Sul e Paran, localiza-se 16,7% das
empresas do setor. S em So Paulo, na regio Sudeste, h 67% das empresas, sendo
45% na Grande So Paulo (ASSOCIAO BRASILEIRA DA INDSTRIA DE ARTIGOS E
EQUIPAMENTOS
MDICOS,
ODONTOLGICOS,
HOSPITALARES
DE
LABORATRIOS, 2011a).
No Brasil, de acordo com dados de 2009, sabe-se que mais de 90% do capital de origem
nacional. Dentre os compradores desses produtos, 68,6% so do setor privado, 21,5% do
pblico, 8,8% provm de exportaes, enquanto 1% do total se distribui entre leasing,
contratos exclusivos de fornecimento de insumos e servios, etc. ASSOCIAO
BRASILEIRA
DA
INDSTRIA
DE
ARTIGOS
EQUIPAMENTOS
MDICOS,
2.2
De acordo com Shepard (1993) segmentar clientes significa alocar em pequenos grupos ou
conglomerados
indivduos
que
tenham
caractersticas,
necessidades
atitudes
semelhantes. Essa tarefa crucial para se criar modelos de previso, isso porque
esperado que clientes pertencentes ao mesmo conglomerado tenham comportamentos
semelhantes. Alm disso, ao conhecer o segmento ao qual determinado cliente pertence, a
empresa poder trat-lo de forma diferenciada de acordo com as caractersticas desse
segmento em relao ao produto ou servio oferecido.
A segmentao de mercado tambm tem a funo de auxiliar o entendimento, a composio
e as necessidades dos segmentos individuais de mercado.
Porm antes de se coletar informaes dos clientes necessrio estabelecer os objetivos
que se pretende alcanar, para que seja possvel desenvolver instrumentos de pesquisa
adequados s respostas desejadas.
Mowen e Minor (2006) definem a segmentao de mercado como um mercado dividido em
subconjuntos de clientes com equivalentes necessidades e vontades individuais, no qual
cada um deles pode ser atingido com o auxlio de um mix de marketing diferente, ou seja,
esses segmentos devem permitir ao consumidor acesso ao preo, praa (local de venda),
ao produto e promoo (comunicao, publicidade e propaganda). Segundo os mesmos
autores esses segmentos devem ser capazes de efetuar medidas demogrficas, de anlise
psicogrfica, de atitudes e personalidade, a partir das quais se possam analisar as
caractersticas e vontades do segmento. Alm disso, eles devem ser substanciais em
tamanho e receita a fim de que sejam capazes de obter vendas satisfatrias.
Apesar da grande vantagem de se utilizar a segmentao na coleta de dados, algumas
empresas encontram dificuldades ao aplicar esse conceito na prtica, principalmente no que
se trata de escolher as variveis mais adequadas para a separao e caracterizao dos
segmentos e escolha de qual tcnica utilizar para definir os grupos (FREITAS; HEINECK,
2008).
Um sistema de coleta de dados pode ser classificado basicamente de duas formas: dados
de fonte primria e secundria. So considerados dados primrios aqueles que so obtidos
diretamente da fonte, ou seja, por meio de interaes diretas com as pessoas ou objetos de
pesquisa (SHEPARD,1993). De acordo com Malhotra (2004) os dados primrios tm por
objetivo solucionar problemas imediatos e que ajudem diretamente na tomada de deciso.
Por exigir levantamentos, experimentos, dentre outros, sua grande desvantagem se tratar
de uma pesquisa longa, dispendiosa e cara. Em muitos casos decide-se usar dados de
fontes secundrias, que so dados obtidos de outras maneiras que no por meio do prprio
indivduo. Eles podem ser conseguidos rapidamente e com custo muito baixo porque se
costuma usar dados j coletados em outra pesquisa que tinha outra finalidade. Contudo,
esse tipo de coleta envolve uma srie de riscos.
Segundo Aaker, Kumar e Day (2004), para evitar imprecises ao utilizar esses dados devese levar em considerao a origem e reputao da fonte, se h interesse de determinado
grupo que deseja ser favorecido pela pesquisa, se a metodologia para coleta era adequada,
se os dados so obsoletos e se a fonte pode ser usada como base de comparao para a
pesquisa atual, ou seja, verificar se h pretenso de chegar ao mesmo resultado utilizando
mtodos diferentes. Alm disso, alguns dados so difceis de utilizar, pois podem ter sido
agrupados de maneira pouco compreensvel.
Nesta pesquisa foram utilizados dados primrios obtidos a partir do banco de dados da
empresa estudada.
2.3
A REGRESSO LOGSTICA
Em situaes nas quais se deseja separar dois grupos distintos ou alocar um novo elemento
em quaisquer desses grupos, duas tcnicas estatsticas so recomendadas, a Anlise
Discriminante e a Regresso Logstica. Ambas podem ser descritas como mtodos que
verificam a existncia de dependncia estatstica de uma varivel denominada dependente
(prevista ou explicada), em relao a uma ou mais variveis independentes (explanatrias
ou preditoras) (HAIR et al., 2009; RODRIGUES; PAULO, 2007). A aplicao da anlise
discriminante envolve muitas suposies s variveis independentes, dentre elas ter
normalidade e matrizes de varincia e covarincia iguais entre ambos os grupos de
classificao. O modelo logstico costuma ser mais utilizado, pois alm de no exigir todas
estas suposies, permite uma interpretao direta de seus coeficientes e, assim como na
regresso mltipla, consegue introduzir efeitos no lineares (HAIR et al., 2009). Outro
aspecto ressaltado pelos mesmos autores indica que o uso da anlise discriminante pode
no ser to favorvel, pois ela possui um score (dispositivo discriminatrio) classificado em
ordem crescente, o que no indica nenhum mtodo probabilstico.
A regresso logstica um caso particular de regresso na qual a varivel resposta Y
dicotmica, ou seja, pode assumir apenas dois resultados mutuamente excludentes, como
por exemplo, bom ou mal, sucesso ou fracasso, aceitar ou rejeitar, dentre outros (HAIR et
al., 2009).
Na regresso logstica, em geral, atribui-se o cdigo um ao resultado de interesse,
denominado sucesso, que representaria a presena de uma particular caracterstica e zero
ao evento complementar, denominado fracasso. A regresso logstica utilizada quando o
objetivo estabelecer uma relao entre uma varivel resposta dicotmica e uma ou mais
variveis explicativas as quais podem ser tanto qualitativas como quantitativas. Quando de
interesse de uma aplicao, a regresso logstica pode ser utilizada mesmo quando a
resposta no for originalmente binria, bastando para isto dicotomizar a varivel resposta
(FARHAT, 2003). A representao matemtica de uma regresso linear mltipla dada por:
Y = 0 + 1x1 + 2x2 + ... + nxn +
(1)
, sendo Y a varivel dependente; X1, X2, ..., Xn, as variveis independentes; 0, 1, 2, ... , n,
os coeficientes das variveis independentes e o erro ou resduo da regresso.
Segundo Hosmer e Lemeshow (2000), os mtodos empregados na regresso logstica
seguem os mesmos princpios gerais usados na regresso linear, apesar de apresentar
respostas e suposies de modelo diferentes. De maneira mais ampla, a regresso logstica
atribui varivel resposta um intervalo compreendido entre zero e um, que pode ser
interpretado como a probabilidade de ocorrncia de determinado evento. Baseado na regra
de deciso, resultados superiores a 0,5 so assumidos como possvel sucesso e inferiores
como possvel fracasso. (DIAS FILHO; CORRAR, 2007).
e 0 + 1xi
( xi ) = P(Y = 1 | xi ) =
1 + e 0 + 1xi
(3)
No modelo de regresso logstica simples ajusta-se uma funo da varivel resposta, g(x).
As estimaes dos parmetros 0 e 1 so realizadas utilizando-se a funo de mxima
verossimilhana.
Utiliza-se o modelo de regresso logstica mltipla quando houver mais de uma varivel
explicativa (qualitativas ou quantitativas). Neste caso tem-se:
g(xi)
1xi1
2xi2
...
pxip
(4)
As estimativas dos parmetros so obtidas por mtodos iterativos (ROSA, 2000).
conveniente o uso de pacotes estatsticos, como software Minitab, para a realizao do
clculo destas estimativas.
Na regresso logstica os resultados inferenciais so assintticos, enquanto na regresso
normal linear tais resultados so exatos. Tem-se tambm que devido varivel resposta ser
dicotmica, os resduos no tm distribuio Normal, nem varincia constante (FARHAT,
2003).
Uma vez estabelecido o modelo de regresso logstica necessrio o teste da significncia
dos parmetros bem como do ajuste do modelo. Dentre alguns possveis modelos deve-se
escolher o modelo mais simples possvel dado que tenha um bom ajuste (princpio da
parcimnia).
Aps a determinao do modelo de regresso logstica faz-se necessrio realizar alguns
testes que assegurem sua validade. Estes testes permitem reconhecer tanto as variveis
que influenciam diretamente a estimao dos parmetros da regresso quanto quelas que
no se ajustam bem e, portanto, devem ser descartadas do modelo final.
METODOLOGIA
i =1
j =1
(o
eij )
ij
eij
i =1
j =1
oij2
eij
(5)
, com o valor esperado eij definido como o produto das marginais da observao oij, dividido
pelo tamanho da amostra n. As variveis so apresentadas em uma tabela de contingncia
de modo que uma varivel est disposta nas linhas e outra nas colunas. Obtm-se ento
uma tabela de dupla entrada (SIEGEL; CASTELLAN, 2008).
10
RESULTADOS E DISCUSSO
Regio
Norte
Nordeste
Centro-Oeste
Sudeste
Sul
Frequncia
18
260
60
434
154
Percentual
1,94
28,08
6,48
46,87
16,63
11
Ms
Janeiro
Fevereiro
Maro
Abril
Frequncia
311
260
212
143
Percentual
33,59
28,08
22,89
15,44
Localizao
Interior
Capital
Frequncia
560
366
Percentual
60,48
39,52
Instalao
Pssimo
Ruim
Razovel
Bom
Muito Bom
Excelente
Frequncia
0
6
17
213
153
537
Percentual
0,00
0,65
1,84
23,00
16,52
57,99
Desempenho
Pssimo
Ruim
Razovel
Bom
Muito Bom
Excelente
Frequncia
2
7
27
230
187
473
Percentual
0,22
0,76
2,92
24,84
20,19
51,08
Assistncia
Pssimo
Ruim
Razovel
Bom
Muito Bom
Excelente
Frequncia
0
4
24
242
150
506
Percentual
0,00
0,43
2,59
26,13
16,20
54,64
12
Indicao
Pssimo
Ruim
Razovel
Bom
Muito Bom
Excelente
Frequncia
19
0
0
0
1
906
Percentual
2,05
0,00
0,00
0,00
0,11
97,84
Algumas variveis binrias auxiliares foram criadas com o intuito de se obter mais opes
para testar modelos de regresso logstica para variveis que auxiliem na previso de
fidelizao de clientes. No caso das variveis de satisfao foram criados dois grupos, o de
Excelncia e o de Positividade. No grupo de Excelncia, as variveis Instalao,
Desempenho e Assistncia foram dicotomizadas de modo que os elementos que obtiveram
nota excelente assumiram o valor um e os demais o valor zero. J para a Positividade foram
dicotomizadas as mesmas variveis considerando como um os elementos que obtiveram
notas positivas (excelente, muito bom e bom), ou seja, as notas cinco (5), quatro (4) e trs
(3), enquanto s demais notas foi atribudo o valor zero. A varivel Regio tambm foi
transformada em binria. Assim as regies Sul e Sudeste adotaram o valor um e as regies
Norte, Nordeste e Centro-Oeste o valor zero. A Tabela 8 apresenta estas variveis auxiliares
com suas respectivas freqncias e porcentagens de ocorrncia do valor um.
Tabela 8: Variveis auxiliares, percentual dos valores 1 e frequncias dos valores 1 e 0.
VARIVEIS
Excelncia na Instalao
Excelncia no Desempenho
Excelncia na Assistncia
Excelncia na Indicao
Instalao positiva
Desempenho positivo
Assistncia positiva
Indicao positiva
Regio Agrupada
Percentual de 1
57,99
51,08
54,64
97,84
97,52
96,11
96,98
97,95
63,50
Frequncia de 1
537
473
506
906
903
890
898
907
588
Frequncia de 0
389
453
420
20
23
36
28
19
338
O teste Quiquadrado foi aplicado aos pares de variveis pertinentes ao estudo. A tabela 9
apresenta os resultados e concluses obtidas.
Ao nvel de significncia de 5%, pode-se verificar que houve independncia entre todos os
pares de variveis aleatrias analisados, com exceo das variveis localizao e instalao
positiva. Neste caso h indicao de que clientes de cidades que so capitais de seus
estados se mostraram proporcionalmente mais satisfeitos com relao instalao dos
13
Valo r P
0,009
Co ncluso
Rejeita-se H 0
0,979
No se rejeita H 0
0,809
No se rejeita H 0
0,937
No se rejeita H 0
0,862
No se rejeita H 0
0,627
No se rejeita H 0
0,320
No se rejeita H 0
0,086
No se rejeita H 0
0,433
No se rejeita H 0
0,590
No se rejeita H 0
0,676
No se rejeita H 0
0,783
No se rejeita H 0
0,129
No se rejeita H 0
0,255
No se rejeita H 0
0,205
No se rejeita H 0
0,158
No se rejeita H 0
Para que o modelo de regresso logstica seja aceito, exige-se pelo menos um dos
coeficientes seja diferente de zero, que testes de ajuste de modelo tenham seu nvel
descritivo, ou valor P, maior que o nvel de significncia de 0,05, indicando seu ajuste. Deve
haver tambm um alto ndice de concordncia interna do modelo e uma boa capacidade de
previso.
Dois modelos de regresso logstica foram construdos, o primeiro para prever a indicao
positiva da empresa e o segundo para prever a excelncia no desempenho. Vrios
possveis modelos foram testados e a seguir so descritos os modelos que apresentaram
melhores resultados.
O primeiro modelo encontrado foi:
Yindicao positiva = 5,44133 + 0,630572 Xinstalao + 2,43750 Xdesempenho
14
Coeficiente
Erro padro do
coeficiente
constante
-5,44133
1,32174
-4,12
0,000
Instalao
0,630572
0,344982
1,83
0,068
1,88
0,96
3,69
2,4375
0,433805
5,62
0,000
11,44
4,89
26,78
Preditor
Desempenho
Razo de
chances
Limite inferior
Limite
superior
Valores longe de um para a razo de chances indicam maior associao entre a ocorrncia
do fator e a ocorrncia da varivel resposta. Para a varivel satisfao com a instalao,
uma razo de chances igual a 1,88 indica que h um aumento de 88% na chance de
sucesso da varivel resposta (indicao positiva) quando a varivel regressora, satisfao
com a instalao, se acrescer em uma unidade (melhora em um nvel na satisfao). J
para a varivel satisfao com o desempenho, uma razo de chances igual a 11,44 indica
que h um aumento de 1044% na chance de sucesso da varivel resposta (indicao
positiva) quando a varivel regressora, satisfao com o desempenho, se acrescer em uma
unidade (melhora em um nvel na satisfao).
A probabilidade de um cliente indicar positivamente a empresa dada por:
P(indicao positiva ) =
eY
1 + eY
(6)
Se esta probabilidade for superior a 0,50, o indivduo ser classificado como cliente que
provavelmente ir indicar positivamente a empresa. Por exemplo, para um indivduo com
satisfao boa na instalao e satisfao muito boa no desempenho:
Yindicao
positiva
P(indicao positiva) = 0,9980 > 0,5, logo este cliente ser classificado como um cliente que
indicar positivamente a empresa.
A estatstica G testa a hiptese de que todos os coeficientes so iguais a zero contra a
hiptese de que ao menos um deles diferente de zero. O software forneceu valor G =
100,246, como seu respectivo nvel descritivo P igual a 0,000, portanto pode-se afirmar que
h evidncias de que pelo menos um dos coeficientes diferente de zero.
15
O modelo foi submetido aos trs diferentes testes de adequao. O mtodo de Pearson
apresentou valor-P = 0,320, o mtodo de Deviance, um valor-P = 0,425 e o mtodo de
Hosmer-Lemeshow, um valor-P = 0,581. Portanto, como todos os indicadores foram maiores
que 0,05, concluindo-se, ao nvel de significncia de 5%, que o modelo foi bem ajustado.
Foram calculadas vrias medidas de associao entre a varivel resposta e as
probabilidades de previso.
Para os dados da amostra usada na escolha do modelo h 907 indivduos que indicam
positivamente a marca contra 19 indivduos que indicam de forma regular ou negativa.
Podem-se formar assim 907 x 19 = 17233 pares com valores de respostas diferentes. Com
base no modelo, um par considerado concordante se o indivduo que indica a marca de
maneira positiva tem probabilidade maior de ser classificado como tal do que o indivduo
que indica a marca de maneira regular ou negativa. A porcentagem de concordncia do
modelo foi de 95,5%.
Tambm foram feitos os clculos das estatsticas de Somers' D, com valor igual a 0,93, de
Goodman-Kruskal, com valor igual a 0,96 e de Kendall's Tau-a, com valor 0,04. Estas
estatsticas resumem as tabelas de concordncia e discordncia dos pares de observaes
e devem estar compreendidas entre 0 e 1. Valores altos indicam que o modelo tem uma boa
capacidade de previso. Como somente o teste de Kendalls Tau-a apresentou ndice baixo
contra outros dois ndices muito altos, o modelo foi considerado bom.
A amostra de teste foi utilizada para calcular a probabilidade de indicao positiva nos 566
indivduos restantes. Como era conhecida a verdadeira situao quanto indicao positiva,
pode-se calcular a porcentagem de acerto que foi igual a 98,23%. Sem realizar nenhuma
estatstica a probabilidade de indicao positiva era de 97,95%, faltando 2,05% para
completar os 100%. O novo modelo explicou a mais 0,28%, o que corresponde a 13,66% do
que faltava explicar.
O segundo modelo encontrado foi:
Yexcelncia no desempenho = 5,04820 + 3,39812 Xexcelncia na instalao + 4,65198 Xexcelncia na assistencia +
0,300791 Xlocalizao - 0,158439 Xregio agrupada
Tanto a varivel Xexcelncia na instalao como a varivel Xexcelncia na assistencia valem 1 se a satisfao
foi classificada como excelente e zero caso contrrio. A varivel Xlocalizao vale 1 se o cliente
se localiza na capital e zero se este se localiza no interior. J a varivel Xregio agrupada vale um
se o cliente estiver na regio Sul ou Sudeste e zero se tiver na regio Norte, Nordeste ou
Centro-Oeste.
A Tabela 11 apresenta os resultados do modelo desta regresso logstica binria:
16
Coeficiente
Erro padro do
coeficiente
constante
-5,048200
0,472911
-10,67
0,000
Exc na Instal.
3,398120
0,336708
10,09
Exc na Assist.
4,651980
0,342700
Localizao
0,300791
0,316863
Regio agrup.
-0,158439
0,315336
Preditor
Razo de
chances
Limite inferior
Limite
superior
0,000
29,91
15,46
57,86
13,57
0,000
104,79
53,53
205,13
0,95
0,342
1,35
0,73
2,51
-0,50
0,615
0,85
0,46
1,58
Para a varivel excelncia na instalao, uma razo de chances igual a 29,91 indica que h
um aumento de 2891% na chance de sucesso da varivel resposta (excelncia no
desempenho) quando a varivel regressora, a satisfao com a instalao for classificada
como excelente. De forma anloga a razo de chances igual a 104,79 indica que h um
aumento de 10379% na chance de sucesso da varivel resposta (excelncia no
desempenho) quando a varivel regressora, a satisfao com a assistncia for classificada
como excelente. J a varivel localizao apresenta uma razo de chances igual a 1,35
indicando que h um aumento de 35% na chance de sucesso da varivel resposta
(excelncia no desempenho) quando a varivel regressora, localizao, for uma capital. Por
ltimo, a varivel regio agrupada tem uma razo de chances igual a 0,85 que indica que h
uma diminuio de 15% na chance de sucesso da varivel resposta (excelncia no
desempenho) quando a varivel regressora, regio agrupada for a regio Sul ou Sudeste.
Conforme a equao 6, se por exemplo, o cliente tiver satisfao excelente na instalao,
muito boa na assistncia e se localizar no interior da regio Sul, tem-se:
Yexcelncia no desempenho = 5,04820 + 3,39812 x 1 + 4,65198 x 0 + 0,300791 x 0 - 0,158439 x 1 =
1,8085. Tem-se ento que P(excelncia no desempenho) = 0,1408 < 0,5, logo este cliente
ser classificado como um cliente que no classificar como excelente o desempenho.
A estatstica G foi igual a 954,322, com valor-P igual a 0,000, ou seja, pode-se afirmar, ao
nvel de significncia de 5%, de que h evidncias de que pelo menos um dos coeficientes
diferente de zero.
Assim como no modelo anterior, esse modelo foi submetido aos testes de adequao. O
mtodo de Pearson apresentou valor-P igual a 0,001, no mtodo de Deviance o valor-P foi
igual a p = 0,004 e no de Hosmer-Lemeshow, o valor-P foi igual a 0,117. Este resultado no
o ideal, mas como pelo menos sob um dos critrios (teste de Hosmer-Lemeshow) o
modelo foi adequado, prosseguiu-se a anlise.
Para os dados da amostra usada na escolha do modelo h 473 indivduos que consideram
excelente o desempenho contra 453 indivduos que consideraram o desempenho muito
17
bom, bom, regular, ruim ou pssimo. Podem-se formar assim 473 x 453 = 214269 pares
com valores de respostas diferentes. Um par considerado concordante se o indivduo que
considera o desempenho excelente tem probabilidade maior de ser classificado como tal do
que o indivduo que atribuiu nota diferente de 5 ao desempenho. A porcentagem de
concordncia do modelo foi de 96,1%.
Tambm foram feitos os clculos das estatsticas de Somers' D, com valor igual a 0,94, de
Goodman-Kruskal, com valor igual a 0,96 e de Kendall's Tau-a, com valor 0,47. Todos estes
valores foram favorveis, atestando a boa condio de previso do modelo.
A amostra de teste foi utilizada para calcular a probabilidade de indicao positiva nos 566
indivduos restantes. Sendo assim, a porcentagem de acerto que foi igual a 92,23%. Sem
realizar nenhuma estatstica a probabilidade de desempenho excelente era de 51,08%,
faltando 48,92% para completar os 100%. O novo modelo explicou a mais 41,15%, o que
corresponde a 84,12% do que faltava explicar.
CONCLUSO
18
REFERNCIAS
AAKER, D. A.; KUMAR V.; DAY, G. S. Pesquisa de Marketing. 2.ed. So Paulo : Atlas,
2004.
ASSOCIAO BRASILEIRA DA INDSTRIA DE ARTIGOS E EQUIPAMENTOS MDICOS,
ODONTOLGICOS, HOSPITALARES E DE LABORATRIOS - ABIMO, Dados
econmicos, So Paulo, 2011a. Disponvel em:
<http://www.abimo.org.br/content.php?page=DADOS_ECONOMICOS_PT>. Acesso em: 27
jun. 2011.
ASSOCIAO BRASILEIRA DA INDSTRIA DE ARTIGOS E EQUIPAMENTOS MDICOS,
ODONTOLGICOS, HOSPITALARES E DE LABORATRIOS - ABIMO, Histrico, So
Paulo, 2011b. Disponvel em:
<http://www.abimo.org.br/content.php?page=HISTORICO_PT>. Acesso em: 27 jun. 2011.
19
20
21