Escolar Documentos
Profissional Documentos
Cultura Documentos
CONCEITOS E DISTINES
um grupo de tcnicas de anlise multivariada cujo
propsito primrio reunir objetos baseado nas
caractersticas dos mesmos.
Alta homogeneidade interna (within-cluster) e alta
heterogeneidade externa (between-cluster).
Outras
denominaes: Q analysis, typology,
classification analysis, numerical taxonomy; anlise
de agrupamento, anlise de conglomerados.
OBJETIVOS, UTILIDADES E
APLICAES
PRESSUPOSTOS E LIMITAES
O PROCESSO DE DECISO NA
ANLISE CLUSTER
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 1: objetivos da anlise cluster
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (I)
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (II)
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (III)
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (IV)
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (V)
mudada.
Distncia Mahalanobis (D 2) utiliza escala
desvios-padres e soma a varincia-covarincia
com ajustes das intercorrelaes entre
(recomendvel quando h multicolinearidade
detectar outliers).
em termos de
total do grupo,
as variveis
e til para
12
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (VI)
13
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (VII)
Padronizando os dados:
atravs das variveis: mdia igual a zero e
desvio-padro igual a 1 (escore Z).
atravs das observaes: padroniza no para a
mdia da amostra, mas para o escore mdio de
cada respondente.
14
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 2: delineamento da pesquisa (VIII)
Ponderando
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 3: pressupostos
Representatividade
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (I)
Envolve:
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (II)
Procedimentos
hierrquicos
de
agrupamento:
envolvem a construo de uma hierarquia semelhante
a uma rvore. So de dois tipos: aglomerativos e
divisivos.
Algoritmos mais populares: (1) single linkage; (2)
complete linkage; (3) avarage linkage; (4) Wards
method; e (5) centroid method.
18
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (III)
1)
2)
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (IV)
3)
4)
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (V)
5)
21
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (VI)
Mtodos
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (VII)
O
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (VII)
Parallel
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (VIII)
Seleo
25
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (IX)
Vantagens e desvantagens dos mtodos no- hierrquicos:
(v) podem realocar combinaes anteriores;
(v) so menos sensveis a outliers, medida de distncia e a
26
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (X)
Uma combinao de ambos os mtodos:
primeiro, uma tcnica hierrquica estabelece o
nmero de grupos, traa o perfil dos ncleos
centrais e identifica outliers;
Depois de eliminar eventuais outliers, aplica-se um
mtodo no-hierrquico, tendo como grupos
sementes os ncleos centrais definidos atravs do
mtodo hierrquico.
27
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (XI)
Quantos
28
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 4: determinao e avaliao dos grupos (X)
A anlise cluster deve ser estruturada novamente?
Analisar se existe um disparate acentuado entre o tamanho dos
29
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 5: interpretao dos grupos
Envolve o exame de cada grupo, tendo em vista o conjunto
de variveis, para denominar ou atribuir uma identificao
que descreva adequadamente a natureza dos mesmos.
Para esse processo, podem ser utilizados escores, de modo
a identificar alguma hierarquia dentre os mesmos.
Nessa fase, o pesquisador deve comparar os resultados com
aqueles propostos anteriormente pela teoria ou pela
experincia prtica.
30
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 6: validao e definio dos perfis dos grupos (I)
Alguns procedimentos de validao da soluo:
1) dividir a amostra em dois grupos;
2) usar outras variveis conhecidas por discriminar
entre os grupos, ou refazer a anlise excluindo
algumas variveis;
3) refazer a anlise utilizando outros mtodos de
agrupamento e outras medidas de similaridade.
31
O PROCESSO DE DECISO NA
ANLISE CLUSTER
Estgio 6: validao e definio dos perfis dos grupos (II)
Definindo
32