Escolar Documentos
Profissional Documentos
Cultura Documentos
Distância Euclidiana
Onde:
Medida de distância
• Informação de peso e altura de cinco pessoas. Objetivo é identificar as
pessoas mais parecidas e o par de pessoas menos parecidas.
1 2 3 4 5
1 0
2 1,63 0
3 0,73 1,36 0
4 1,00 2,60 1,40 0
5 2,57 0,93 2,25 3,54 0
Outras Medidas de Distância
• Distância entre populações e amostras
Penrose (1953)
8,6
8,4
8,2
Linkage Distance
8,0
7,8
7,6
7,4
7,2
7,0
q_4 q_3 q_9 q_10 q_2 q_8 q_7 q_5 q_6 q_1
Dendograma
Processo de aglomeração
Obj. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No. Obj. No.
No.
8,717798 q_1 q_6 q_5 q_7 q_8 q_2 q_10 q_9 q_3 q_4
Distâncias Euclidiana
q_1 q_2 q_3 q_4 q_5 q_6 q_7 q_8 q_9 q_10
q_1 0,0 9,3 9,5 11,0 8,4 8,2 9,2 8,8 10,4 8,72
q_2 9,3 0,0 8,3 8,4 10,3 9,8 9,7 9,7 9,6 7,21
q_3 9,5 8,3 0,0 9,4 9,6 9,2 8,7 9,5 10,3 8,66
q_4 11,0 8,4 9,4 0,0 10,3 10,9 11,2 9,8 10,9 9,00
q_5 8,4 10,3 9,6 10,3 0,0 8,5 9,1 9,2 9,3 9,06
q_6 8,2 9,8 9,2 10,9 8,5 0,0 8,5 9,2 9,4 8,83
q_7 9,2 9,7 8,7 11,2 9,1 8,5 0,0 7,8 9,8 9,85
q_8 8,8 9,7 9,5 9,8 9,2 9,2 7,8 0,0 10,0 9,27
q_9 10,4 9,6 10,3 10,9 9,3 9,4 9,8 10,0 0,0 7,28
q_10 8,7 7,2 8,7 9,0 9,1 8,8 9,8 9,3 7,3 0,00
Comparação entre Estratégias
10,5 8,6
10,0 8,4
9,5 8,2
Linkage Distance
Linkage Distance
9,0
8,0
8,5
7,8
8,0
7,6
7,5
7,0 7,4
6,5 7,2
q_4 q_3 q_10 q_2 q_9 q_8 q_7 q_5 q_6 q_1
7,0
q_4 q_3 q_9 q_10 q_2 q_8 q_7 q_5 q_6 q_1
Comparação entre Estratégias
Tree Diagram for 10 Variables
Single Linkage Tree Diagram for 10 Variables
City-block (Manhattan) distances Complete Linkage
54 Euclidean distances
11,5
52 11,0
10,5
50
10,0
48
9,5
Linkage Distance
Linkage Distance
46 9,0
8,5
44
8,0
42
7,5
40 7,0
6,5
38 q_4 q_3 q_10 q_2 q_9 q_8 q_7 q_5 q_6 q_1
q_6 q_4 q_8 q_7 q_3 q_10 q_9 q_2 q_5 q_1
Análise K-means
K-means
Plot of Means for Each Cluster
5,5
5,0
3,0
2,5
2,0
1,5
q_1 q_2 q_3 q_4 q_5 q_6 q_7 q_8 q_9 q_10
Cluster 1
Variables Cluster 2
Análise K-means
Between df Within df F signif.
q_1 51,47783 1 59,81106 88 75,7393 0,000000
q_2 74,94933 1 58,20622 88 113,3133 0,000000
q_3 79,12350 1 59,77650 88 116,4817 0,000000
q_4 54,12483 1 68,86406 88 69,1650 0,000000
q_5 62,70417 1 58,85138 88 93,7611 0,000000
q_6 64,15486 1 55,80069 88 101,1749 0,000000
q_7 78,13643 1 60,31913 88 113,9938 0,000000
q_8 54,34841 1 57,60714 88 83,0220 0,000000
q_9 48,19212 1 65,59677 88 64,6512 0,000000
q_10 39,68318 1 42,31682 88 82,5232 0,000000
Teste de Significância
Média Atual Média Três t-value df p
anos
q_1 4,422222 3,400000 4,854960 88 0,000005
q_2 4,244444 3,400000 3,472199 88 0,000803
q_3 4,422222 3,511111 3,697529 88 0,000378
q_4 4,377778 3,644444 3,098775 88 0,002609
q_5 4,355556 3,200000 5,375100 88 0,000001
q_6 4,111111 3,044444 4,886271 88 0,000005
q_7 4,600000 3,244444 6,120902 88 0,000000
q_8 4,488889 3,466667 4,836627 88 0,000006
q_9 4,088889 3,088889 4,657187 88 0,000011
q_10 4,022222 3,311111 3,765298 88 0,000300