Você está na página 1de 43

Análise de

conglomerados e
MDS
Lígia Cássia M. C. Santos, NUSP: 9564580
Técnicas de Levantamento e Análise de Dados em Marketing

1 Sem/2020
Análise de Conglomerados

Análise de agrupamentos é um grupo de técnicas multivariadas cuja finalidade principal é


agregar objetos de acordo com as suas caracteristicas. Ela classifica objetos, respondentes,
produtos ou outras entidades, de modo que cada objeto é semelhante aos outros no
agrupamento com base em um conjunto de características escolhidas. (Hair et al., 2009)

2
Análise de Conglomerados
Os agrupamentos resultantes de objetos devem ser homogêneos internamente e
heterogêneos externamente. Assim, se a classificação for bem sucedida, os objetos dentro
dos agrupamentos estarão próximos quando representados graficamente, e diferentes
agrupamentos estarão distantes. (hair et al., 2009)

3
Análise de Conglomerados
Os papéis mais comuns que a análise de agrupamentos pode desempenhar em desen-
volvimento conceitual incluem os seguintes:

✘ Redução de dados: A análise de agrupamentos pode realizar esse procedimento de redução


de dados objetivamente pela redução da informação de uma população inteira ou de uma
amostra para a informação sobre subgrupos específicos e menores.
✘ Geração de hipóteses: A análise de agrupamentos também é útil quando um pesquisador
deseja desenvolver hipóteses relativas à natureza dos dados ou examinar hipóteses
previamente estabelecidas.

4
Principais medidas de distância
As medidas de distância são, na verdade, uma medida de dissimilaridade, com valores
maiores denotando menor similaridade.

✘ Distância euclidiana é a medida mais comumente reconhecida, muitas vezes chamada de


distância em linha reta.
✘ Distância city-block (de Manhattan) não é baseada na dis- tância euclidiana. No lugar
disso, ela emprega a soma das diferenças absolutas das variáveis.
✘ Distância de Mahalanobis (D2) é uma medida generalizada de distância que explica as
correlações entre variáveis de uma maneira que pondera igualmente cada uma delas.
(Hair et al, 2009) 5
Padronização das variáveis

A forma mais comum de padronização é a conversão de cada variável em escores


padrão (também conhecidos como escores Z) pela subtração da média e divisão pelo
desvio-padrão para cada variável. Essa é a forma geral de uma função de distância
normalizada, a qual utiliza uma medida de distância euclidiana tratável para uma
transformação de normalização dos dados brutos.

(Hair et al, 2009) 6


Variáveis utilizadas
-Loja

-Regional

-Atendimento

-Sortimento

-Organização

7
8
9
10
11
12
13
14
15
16
Resultado da Análise

São apresentados os valores quadrados


das distâncias Euclidianas entre cada
uma das variáveis. 17
São apresentadas as distâncias
dos coeficientes. Nota-se que o
estágio 14, 15, 16 e 17 possuem
uma distância muito grande se
comparada aos demais.

18
O Gráfico Dendograma apresenta as
ligações entre as variáveis/ objetos.
Além disso, é possível verificar
clusters.

19
A Tabela de associação de cluster
mostra quais clusters as variáveis
fazem parte.

20
A tabela cluster final mostra quanto
uma variável esta contida no
cluster.

21
22
MDS

A análise fatorial pode ser utilizada para examinar os padrões ou relações


latentes para um grande número de variáveis e determinar se a informação
pode ser condensada ou resumida a um conjunto menor de fatores ou
componentes (Hair et al, 2009).

23
Escalonamento Multidimensional
O escalonamento multidimensional (MDS) se refere a uma série de técnicas que ajudam o
pesquisador a identificar dimensões-chave inerentes a avaliações feitas por respondentes
quanto a objetos e então posicionar tais objetos neste espaço dimensional. (Hair et al.,
2009)

24
Escalonamento Multidimensional
Escalonamento multidimensional (MDS), também conhecido como mapeamento perceptual,
é um procedimento que permite a um pesquisador determinar a imagem relativa percebida de
um conjunto de objetos (empresas, produtos, idéias ou outros itens associados a percepções
comumente consideradas).

(Hair et al, 2009) 25


Escalonamento Multidimensional
O 𝑀𝐷𝑆 envolve uma representação de cada objeto ou evento como um ponto num espaço
multidimensional. Os pontos são dispostos dentro desse espaço, de modo que as distâncias
entre os pares de pontos tem a mais forte possível relação de semelhanças entre os pares de
objetos. Em outras palavras, os pontos que estão juntos representam objetos semelhantes,
enquanto os objetos diferentes são representadas por pontos que estão distantes. O
escalonamento multidimensional (𝑀𝐷𝑆) pode ser considerado como sendo uma alternativa a
Análise Fatorial Exploratória.

(Hair et al, 2009) 26


Objetivo da Técnica
O objetivo do MDS é transformar julgamentos de consumidores quanto à similaridade ou
preferência (p.ex., preferência por lojas ou marcas) em distâncias representadas em espaço
multidimensional. (Hair et al. 2009)

27
Etapas
O MDS difere de outros métodos multivariados no sentido de usar apenas
uma medida geral de similaridade ou preferência. Para executar uma análise
de escalonamento multidimensional, o pesquisador realiza três pas- sos
básicos:
1. Reunir medidas de similaridade ou de preferência no conjunto inteiro de
objetos a serem analisados.
2. Usar técnicas MDS para estimar a posição relativa de cada objeto em
espaço multidimensional.
3. Identificar e interpretar os eixos do espaço dimensional em termos de
atributos perceptuais e/ou objetivos.
(Hair et al, 2009) 28
Diferenças no SPSS
O SPSS apresenta 3 algoritmos de resolução do 𝑀𝐷𝑆 que aceitam entradas métricas e não métricas
de matrizes de proximidade: ALSCAL, PROXSCAL e PREFSCAL.

● ALSCAL (Alternating Least-Squares Scaling) - Minimiza o 𝑆 − 𝑆𝑡𝑟𝑒𝑠𝑠 (basicamente a


mesma medida que o 𝑆𝑡𝑟𝑒𝑠𝑠) é o mais indicado quando as entradas do 𝑀𝐷𝑆 são de matrizes de
diferenças ou de distâncias. Porém é um algoritmo lento e instável.
● PROXSCAL (Proximity Scaling) - Minimiza o 𝑆𝑡𝑟𝑒𝑠𝑠 é mais indicado quando as entradas do
𝑀𝐷𝑆 são de matrizes similaridades. É o algoritmo mais utilizado por ser mais rápido e
confiável, mesmo quando as matrizes de entrada são de diferenças ou de distâncias.
● PREFSCAL (Preference Scaling) - É um tipo de Desdobramento Multidimensional
(Multidimensional Unfolding) utilizado para se comparar dois conjuntos de objetos onde uma
escala de preferência deve ser utilizada.

(Hair et al, 2009) 29


O PROXSCAL é geralmente o algoritmo
preferido por causa da sua velocidade, da
possibilidade de sua aplicação em dados não
transformados e por causa também da sua
capacidade em lidar com diferentes métodos de
convergência.

30
31
32
33
O 𝑆𝑡𝑟𝑒𝑠𝑠 (Standardized Residual Sum of Squares) é uma medida de ajuste adimensional e
quanto menor for o seu valor melhor

34
São apresentados os dados básicos referentes ao processamento.
Missing values são apresentados.

35
São apresentados os dados básicos referentes ao processamento.
Missing values são apresentados.

36
37
38
39
40
Quanto mais próximo de uma reta com um
ângulo de 45º melhor foi o ajuste do algoritmo.

41
Quanto mais próximo de uma reta
com um ângulo de 45º melhor foi o
ajuste do algoritmo.

42
REFERÊNCIAS
HAIR, J. F.; BLACK, W. C.; BABIN, B. J.; ANDERSON, R. E.; TATHAM, R. L. Análise
Multivariada de Dados. BOOKMAN, 2009.

PEREIRA, VALDECY. (2015). Estatística Multivariada (SPSS) - 04 - Escalonamento


Multidimensional. 10.13140/RG.2.1.1443.5929.

43

Você também pode gostar