Você está na página 1de 22

ANLISIS DE COMPONENTES PRINCIPALES

Qu es el Anlisis de componentes principales (ACP)?


Es una tcnica estadstica multivariada cuyo objetivo es el anlisis de la informacin contenida en una tabla
del tipo Xn, k, donde:
n: son las filas (individuos).
k: son las columnas (variables de tipo cuantitativo).
xi, j: valor para el individuo i de la variable j.
Las variables de tipo cuantitativo son aquellas que se miden, tal como el peso, la talla, el nmero de
individuos, etc.
Individuo
1
2
3
.
.
.

V1
X11
X21
X31
.
.
.

V2
X12
X22
X32
.
.
.

.
.
.

Vk
X1k
X2k
X3k
.
.
.

Xn1

Xn2

Xnk

Media

x.1

x.2

x.k

DesvEst

s.1

s.2

s.k

Qu se busca con un anlisis de componentes principales (ACP)?


1.

2.

Evaluar la semejanza de los individuos a travs de las variables consideradas.


Existen tipos de individuos semejantes?
Se observa una tipologa de individuos?
Evaluar la relacin existente entre las variables
Existen grupos de variables correlacionadas?
Se observa una tipologa de variables?

Introduccin al ACP.
Inicialmente se pretende entender el concepto de anlisis multivariado, para ello se plantea el siguiente
ejercicio:
Ejercicio 1.
a)

Se desea conocer qu individuos son ms semejantes entre ellos, de acuerdo a la variable Edad. Para lo
que se dispone de la tabla 1:

Tabla 1. Edad (aos)


Individuo Pedro Juan Mara Gonzalo Luca Gloria Ins lvaro Eduardo Hernando Anita Mariana David Pablo

Edad
(aos)

20

15

18

17

29

58

59

55

15

53

23

24

28

29

Se observa que Eduardo y Pedro son ms parecidos en cuanto a la edad, que Pedro y Luca (figura 1).

15

17 18

20

23 24

28 29

53

Edad (aos)
Eduardo

Pedro

Hernando

Luca

Figura 1. Edad
En este caso la relacin entre los individuos se determin a travs de una lnea recta (espacio R 1).
b) Si desea conocer qu individuos son ms semejantes entre ellos, de acuerdo a las variables Edad (aos) y
Estatura (cm): tabla 2.

Tabla 2. Edad (aos) y Estatura (cm)


Individ Pedro Juan Mara Gonzalo Luca Gloria Ins lvaro Eduard Hernand Anita Marian David Pablo
Edad
Estatura

20
170

15
160

18
181

17
145

29
160

58
156

59
172

55
186

15
175

53
178

23
157

24
160

28
169

29
170

Es claro que Mara y Eduardo son ms parecidos en cuanto a la edad y a la estatura, que Mara e Ins
(figura 2).

200
190

Mara
180

Eduardo

Ins

Estatura (cm)

170
160
150
140
130
120
110
100
0

10

20

30

40

Edad (aos)

50

60

70

Figura 2. Edad (aos) vs. Estatura (cm)


La relacin entre los individuos se determin a travs de un plano (espacio R 2).
c)

Se desea conocer qu individuos son ms semejantes entre ellos, de acuerdo a las variables Edad (aos),
Peso (kg) y Estatura (cm): Tabla 3.

Tabla 3. Edad (aos), Estatura (cm) y Peso (kg)


Individ Pedro Juan Mara Gonzalo Luca Gloria Ins lvaro Eduard Hernand Anita Marian David Pablo
20
15
18
17
29
58
59
55
15
53
23
24
28
29
Edad
145
160
156 172 186
175
178
157
160
169
170
Estatura 170 160 181
63
65
71
51
55
54
71
81
78
90
61
64
75
68
Peso
NOMBRE
Anita
David
Eduardo
Gloria
Gonzalo

65

Hernando

EDAD

55

Ins

45

Juan

35

Luca

25
15
51

61

71
PESO

81

91

190
180
170
160
150
140 ESTAT

Mariana
Mara
Pablo
Pedro
lvaro

Figura 3. Edad, Peso y Estatura


La relacin entre los individuos se determina a travs de un espacio en R 3, y se observa por ejemplo que Anita
y Luca son ms parecidos en cuanto a la edad, peso y estatura, que Juan e Ins (figura 3).
d) Qu ocurre cuando se desea conocer la cercana entre individuos o la correlacin entre variables y se tiene
k de estas ltimas, k > 3?
Note en la figura 3 que si tomsemos una fotografa del plano edad vs estatura, Ins, lvaro y Hernando
apareceran muy cercanos, pero si tal fotografa fuera del plano peso vs. edad, se hace evidente que Ins y
lvaro no son tan similares en estas variables, como Hernando y lvaro.
Se recomienda entonces, acudir al ACP, para encontrar la mejor fotografa o fotografas en R 2, que
permitan analizar en la prctica tales cercanas o correlaciones.
Despus de tener la matriz de individuos y variables cuantitativas, Qu sigue?
Se obtienen los valores y vectores propios de la matriz de correlaciones; posteriormente, al graficar los
vectores propios, se llega al grafico de sedimentacin o al histograma de valores propios (figuras 4 y 5), los

que permiten seleccionar aquellos valores propios mayores a la unidad, en este caso nicamente el primero
(pero dejaremos los dos primeros para al menos tener un plano xy).
Tales valores propios explican el 94.97% de la variacin total de los datos y generan dos vectores propios
(factores) que producen un plano xy.
En el histograma de valores propios se analiza la tendencia de tal histograma para seleccionar el nmero de
valores propios a retener.

Scree Plot

Eigenvalue

2.4
2
1.6
1.2
0.8
0.4
0
0

0.5

1.5

2.5

Component
Figura 4. Grfico de sedimentacin
VALEURS PROPRES
APERCU DE LA PRECISION DES CALCULS : TRACE AVANT DIAGONALISATION ..
3.0000
SOMME DES VALEURS PROPRES ....
3.0000
HISTOGRAMME DES 3 PREMIERES VALEURS PROPRES
+--------+------------+----------+----------+---------------------------------------------------------------------------------| NUMERO |
VALEUR
| POURCENT.| POURCENT.|
|
|
PROPRE
|
| CUMULE |
+--------+------------+----------+----------+---------------------------------------------------------------------------------|
1
|
2.0295
|
67.65 |
67.65 | ********************************************************************************
|
2
|
0.8196
|
27.32 |
94.97 | *********************************
|
3
|
0.1509
|
5.03 | 100.00 | ******
+--------+------------+----------+----------+----------------------------------------------------------------------------------

Figura 5. Histograma de valores propios

Los 3 valores propios se asocian a 3 vectores propios, los que generan el nuevo sistema (xyz) donde se ubican
los puntos individuos y variables (figura 6).

COORDONNEES DES VARIABLES SUR LES AXES 1 A 3


VARIABLES ACTIVES
----------------------------+------------------------------------+-------------------------------+----------------------------VARIABLES
|
COORDONNEES
| CORRELATIONS VARIABLE-FACTEUR |
ANCIENS AXES UNITAIRES
----------------------------+------------------------------------+-------------------------------+----------------------------IDEN - LIBELLE COURT
|
1
2
3
0
0
|
1
2
3
0
0 |
1
2
3
0
----------------------------+------------------------------------+-------------------------------+----------------------------EDAD - edad

- 0.55

0.84

PESO - peso

-0.93

- 0.25

ESTA - estat

-0.93

-0.25

0.00

0.00

0.00 | -0.55

0.84

0.00

0.00

0.00 | -0.39

0.92

0.00

0.00

0.27

0.00

0.00 | -0.93 -0.25

0.27

0.00

0.00 | -0.65 -0.27

0.71

0.00

- 0.27

0.00

0.00 | -0.93 -0.25 -0.27

0.00

0.00 | -0.65 -0.27 -0.71

0.00

----------------------------+------------------------------------+-------------------------------+-----------------------------

Vectores propios
Figura 6. Coordenadas de las variables en el nuevo sistema coordenado

La figura 6 permite:
a) Definir los 3 componentes principales (factores) que son:
C1 =

0.38614*EDAD +

0.652431*PESO+

0.652096*TALLA

C2 =

-0.92244*EDAD+

0.271918*PESO+

0.274166*TALLA

C3 =

0.001558*EDAD

-0.70739*PESO+

0.706826*TALLA

La media de los componentes es cero, sus varianzas son los autovalores y no son correlacionados.
b) Establecer las coordenadas de los individuos en el nuevo sistema coordenado:
Al reemplazar Edad (X), Peso (Y) y Talla (Z), por los valores de las variables en la matriz centrada y
estandarizada, obtenemos las coordenadas de cada individuo en el nuevo sistema de ejes (figuras 7, 8 y 9 y
tabla 4).

Tabla 4. Coordenadas de los individuos en el nuevo sistema de coordenadas


Individuo

Pedro

Juan

Mara Gonzal Luca

Gloria

Ins

Coordenad
Compon 1

-0,37

-0,95

0,70

-2,60

Coordenad
Compon 2

0,59

0,67

1,17

Coordenad
Compon 3

0,48

-0,28

0,66

lvaro Eduard Hernan Anita Marian David

Pablo

-1,22

-0,85

1,11

2,43

0,69

2,45

-1,18

-0,80

0,47

0,13

-0,15

-0,34

-2,05

-1,29

-0,49

1,36

-0,35

0,06

0,16

0,43

0,22

-0,32

0,37

0,18

0,10

0,33

-0,17

-0,75

-0,21

-0,21

-0,35

0,16

PCOMP_3

NOMBRE
Anita
Plot of PCOMP_3 vs PCOMP_1 and PCOMP_2
David
Eduardo
Gloria
Gonzalo
0.7
Hernando
0.4
Ins
0.1
Juan
Luca
-0.2
Mariana
-0.5
1.9
Mara
0.9
-0.8
-0.1
Pablo
-1.1
-2.7 -1.7 -0.7
0.3 1.3 2.3 3.3 -2.1 PCOMP_2
Pedro
PCOMP_1
lvaro

Figura 7. Representacin de los puntos individuos en el espacio de componentes

Plot of PCOMP_2 vs PCOMP_1

PCOMP_2

1.9

Eduardo

Mara

0.9

Juan

Pedro
David

Gonzalo
Anita

-0.1

Mariana

Pablo
Hernando

Luca

Alvaro

-1.1
Ins
Gloria

-2.1
-2.7

-1.7

-0.7

0.3

1.3

PCOMP_1

2.3

3.3

NOMBRE
Anita
David
Eduardo
Gloria
Gonzalo
Hernando
Ins
Juan
Luca
Mariana
Mara
Pablo
Pedro
lvaro

Figura 8. Representacin de los puntos individuos en el espacio de los dos primeros componentes

Figura 9. Representacin de los puntos individuos en el espacio de los dos primeros componentes

d) Con las coordenadas de los individuos se encuentra la calidad de representacin de los mismos y su
contribucin al nuevo sistema coordenado (figura 10).
COORDONNEES, CONTRIBUTIONS ET COSINUS CARRES DES INDIVIDUS
AXES 1 A 3
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
|
INDIVIDUS
|
COORDONNEES
|
CONTRIBUTIONS
|
COSINUS CARRES
|
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFICATEUR
P.REL DISTO |
1
2
3
0
0
|
1
2
3
0
0 |
1
2
3
0
0 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| Pedro
7.14
0.78 | 0.39 -0.62 -0.50 0.00 0.00 | 0.5 3.3 11.8 0.0 0.0 | 0.19 0.49 0.32 0.00 0.00 |
| Juan
7.14
1.54 | 0.98 -0.70 0.29 0.00 0.00 | 3.4 4.2 3.9 0.0 0.0 | 0.63 0.32 0.05 0.00 0.00 |
| Mara
7.14
2.46 | -0.72 -1.21 -0.68 0.00 0.00 | 1.8 12.8 22.1 0.0 0.0 | 0.21 0.60 0.19 0.00 0.00 |
| Gonzalo
7.14
7.44 | 2.70 0.15 0.33 0.00 0.00 | 25.7 0.2 5.2 0.0 0.0 | 0.98 0.00 0.01 0.00 0.00 |
| Luca
7.14
1.88 | 1.27 0.35 -0.38 0.00 0.00 | 5.7 1.1 6.9 0.0 0.0 | 0.86 0.07 0.08 0.00 0.00 |
| Gloria
7.14
5.34 | 0.88 2.13 -0.19 0.00 0.00 | 2.7 39.4 1.7 0.0 0.0 | 0.15 0.85 0.01 0.00 0.00 |
| Ins
7.14
3.14 | -1.15 1.34 -0.10 0.00 0.00 | 4.7 15.7 0.5 0.0 0.0 | 0.42 0.57 0.00 0.00 0.00 |
| lvaro
7.14
6.71 | -2.52 0.50 -0.35 0.00 0.00 | 22.3 2.2 5.7 0.0 0.0 | 0.94 0.04 0.02 0.00 0.00 |
| Eduardo
7.14
2.54 | -0.72 -1.41 0.18 0.00 0.00 | 1.8 17.4 1.5 0.0 0.0 | 0.20 0.78 0.01 0.00 0.00 |
| Hernando
7.14
7.20 | -2.54 0.36 0.78 0.00 0.00 | 22.8 1.1 28.6 0.0 0.0 | 0.90 0.02 0.08 0.00 0.00 |
| Anita
7.14
1.54 | 1.22 -0.07 0.21 0.00 0.00 | 5.2 0.0 2.2 0.0 0.0 | 0.97 0.00 0.03 0.00 0.00 |
| Mariana
7.14
0.77 | 0.83 -0.16 0.22 0.00 0.00 | 2.4 0.2 2.3 0.0 0.0 | 0.90 0.03 0.06 0.00 0.00 |
| David
7.14
0.56 | -0.48 -0.44 0.37 0.00 0.00 | 0.8 1.7 6.3 0.0 0.0 | 0.41 0.35 0.24 0.00 0.00 |
| Pablo
7.14
0.10 | -0.14 -0.23 -0.17 0.00 0.00 | 0.1 0.5 1.3 0.0 0.0 | 0.18 0.54 0.28 0.00 0.00 |
+--------------------------------------+-------------------------------+--------------------------+--------------------------+

Figura 10. Coordenadas, contribuciones y calidad de la representacin (coseno cuadrado) de los puntos
individuos al nuevo sistema coordenado
La calidad de la representacin (coseno cuadrado) de los individuos en cada eje factorial, estar dada
por:
Para Pedro en el eje1 = (coordenada en el factor 1)2 = 0,19
((-0,37)2+(0,59)2+(0,48)2)
Para Pedro en el eje 2 = (coordenada en el factor 2)2 = 0,49
((-0,37)2+(0,59)2+(0,48)2)

Para Pedro en el eje 3 = (coordenada en el factor 3)2 = 0,32


((-0,37)2+(0,59)2+(0,48)2)

Lo que indica que Pedro est mejor representado en el plano YZ que en el plano XY.
Note que la suma del coseno cuadrado en los tres ejes debe ser la unidad.
La contribucin de cada individuo al nuevo sistema coordenado, estar dado por la norma de cada
vector individuo (coordenada del individuo en cada factor), con relacin a la norma total (suma de
normas para todos los individuos).
e) Las coordenadas de las variables peso, estatura y talla en el nuevo sistema, estarn dadas por la
correlacin de cada una de ellas con cada uno de los componentes:
n

( peso, componente1)

( z peso x )( ycomponente1 y )

i 1

( z peso x )
i 1

( ycomponente1 y )
i 1

(z
i 1

peso

* ycomponente1 )
n

( z peso ) ( ycomponente1 )
2

i 1

Entonces, se obtiene:
Coordenada 1 Coordenada 2 Coordenada 3
Edad

-0,550093867

0,8351

-0,000605

Peso

-0,929450873

-0,246173

0,27481

Talla

-0,928973477

-0,248208

-0,274592

i 1

Figura 11. Variables activas e individuos en el Primer plano factorial

La calidad de la representacin de las variables se observa de acuerdo a la proximidad de la norma del vector
a la unidad (figura 11), donde la Edad est mejor representada en el plano que las variables peso y estatura.
Se observa que las coordenadas de las variables Edad, Peso y Talla (figura 6), son iguales a las correlaciones,
pues se trabaj con la matriz centrada y estandarizada.

Conclusiones.
1.
2.
3.
4.
5.
6.
7.

La variable Peso y estatura se encuentran correlacionadas de manera directa, la Edad es independiente de


ellas.
Ins es de las mayores y tiene un peso alto y estatura alta.
Cecilia es de las mayores y tiene un peso alto y estatura baja.
lvaro y Hernando son de los mayores y tiene un peso alto y estatura muy altos.
Gonzalo es el que menos pesa y el ms pequeo.
Luca tiene una edad promedio, pero un peso y una estatura por debajo de la media.
Mara y Eduardo son jvenes, pero tienen peso y estatura por encima de la media.

EDAD

z1

65
55
45
35
25
15

c1

z3

c2
z2

51

61

c3

71
PESO

81

91

NOMBRE
Anita
David
Eduardo
Gloria
Gonzalo
Hernando
Ins
Juan
Luca
Mariana
190 Mara
180
170
160
Pablo
150
140 ESTAT
Pedro
lvaro

Ejercicio 2
Variables nominales: si a una modalidad de una variable categrica le corresponde un valor test superior en
valor absoluto 1.98, sobre un factor s, se debe rechazar la hiptesis nula (o sea que la modalidad est bien
representada sobre ese eje).
La Federacin de Cafeteros realiz un estudio comparativo de 35 marcas de caf que actualmente se venden
en Europa, a fin de seleccionar aquellos que presentan la relacin calidad/precio ms favorable.
La calidad del caf vara fundamentalmente en funcin del % de orgnicos utilizados en su proceso de cultivo
y el tiempo de fermentacin. Es por ello que estos elementos son argumentos de publicidad de las marcas de
categora superior. Pero, dos marcas de caf con esas variables similares, pueden sinembargo, ser de calidad
muy diferente en razn de sus procesos de recoleccin, molienda, tostado, etc.
Por ello, se decidi medir la calidad del caf mediante tres descriptores: el % de orgnicos, el tiempo de
fermentacin y una nota de calidad global atribuida por un panel de expertos catadores.

El objetivo de este estudio es seleccionar las marcas de caf que presentan en Europa, la relacin
calidad/precio ms favorable para el consumidor final.
La Categora, figura obligatoriamente en la etiqueta del caf y juega un papel muy importante en las
campaas publicitarias de las marcas, puede ser excelso (3), de lujo (2) y estndar (1).

Caf No.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35

Precio de la libra (centavos


de euro)
70
60
65
74
70
73
70
55
77
93
82
73
62
87
78
73
87
80
85
87
80
83
90
110
87
113
96
82
127
160
90
86
100
100
95

% Orgnicos
utilizados
20
20
20
25
25
30
30
30
30
30
30
33
33
33
35
40
40
40
40
40
40
40
40
40
40
45
45
45
100
100
100
100
100
100
100

Categor
a
1
1
1
1
1
1
1
1
1
1
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
3
3
3
3
3
3
3

Tiempo de fermentacin
(horas)
5
5
7.5
12
12
5
8
5
5.5
12
12
6.5
8
12
10
10.5
8.5
8.5
9.5
8.5
9.5
9.5
12.5
12
5.5
12
12
12
8.5
12
12
12
10
11
12

Calific por
expertos
3
2
2
2
3
0
0
2
0
0
2
1
3
3
2
4
2
2
2
4
2
1
2
3
2
4
3
3
4
3
4
2
3
3
0

a) Cules son las 3 marcas de caf ms caras? Y las ms baratas?


b) Cul es el valor medio, mediano y el coeficiente de variacin del tiempo de fermentacin de las marcas
estudiadas?
c) Cul es la distribucin de las marcas de caf segn las categoras de las mismas?
d) La variable Categora es una variable continua? Por qu debe ser definida como variable
suplementaria?

e)

f)
g)
h)
i)
j)
k)
l)
m)
n)
o)
p)
q)
r)
s)

Qu tipo de anlisis de componentes principales sugiere usted en este caso, el de descomposicin


factorial de la matriz de correlaciones o el de descomposicin factorial de la matriz de
varianzas/covarianzas?
Cuntos ejes factoriales deben ser conservados en la interpretacin del anlisis?
Cules son las marcas de caf que son poco contributivas a la inercia proyectada sobre el primer plano y
que estn mal representadas en dicho plano?
Cules son las caractersticas comunes de las marcas 16, 20 y 26?
Cules son las caractersticas comunes de las marcas 30, 33 y 34?
Cules son las caractersticas comunes de las marcas 2, 3 y 8?
Cules son las caractersticas comunes de las marcas 6, 7 y 9?
Por qu el primer plano factorial permite ver que las variables Precio, % de orgnicos y Tiempo de
fermentacin, presentan correlaciones positivas y relativamente altas entre ellas?
Por qu el primer plano factorial permite ver que la variable Calificacin presenta correlaciones
positiva, pero no muy alta con las variables Precio, % de orgnicos y Tiempo de fermentacin?
Podemos considerar que el primer eje es una buena combinacin lineal de las cuatro variables activas?
Cules son las variables mejor correlacionadas con el segundo eje factorial?
Cules son las marcas de caf que presentan una relacin calidad/precio ms interesante para el
consumidor?
Cules son las marcas de caf que presentan una relacin calidad/precio menos interesante para el
consumidor?
Comprara usted el caf No. 32?
Qu relacin observa entre la calidad del caf y la categora anunciada en el empaque?

Ejercicio 3. SITUACION SOCIO-ECONMICA EN LATINO AMRICA


1. OBJETIVOS
Determinar si el ndice de desarrollo Humano (IDH), es un ndice adecuado para representar la situacin socio
econmica de un pas.

2. DATOS
Se dispone de un conjunto de indicadores generales en el sector de la salud y de la economa para 10 pases de
Amrica Latina a 1990. Tambin se tiene informacin demogrfica. Las variables disponibles son las siguientes:

Variabl
1e
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16

Descripcin de la variable
No
EV
Esperanza de vida (aos)
mb
TM
Tiempo medio de escolarizacin (aos)
re
PIB
Producto interior bruto, per capita (US$)
E
Var
ID
ndice de Desarrollo Humano
PN
Producto nacional bruto, per capita (US$)
iabl
H
GPI
Gasto pbl. En la instruccin (en % del PNB)
Be
AC
Aporte calrico cotidiano (%de las necesidades normalizadas)
T_
Tasa de mortalidad en menores de 15 aos (por 1000 nacidos vivos)
C
T_
MO Tasa de alfabetizacin de las mujeres (%poblacin femenina mayor de 15
PR
Poblacin rural (% aos)
del total de la poblacin)
AL
RT
HM
Cantidad de habitantes por mdico
F
CT
Cantidad de telfonos por 1000 habitantes
TF
Tasa de fertilidad
DE
Monto de la deuda total (% del PNB)
CA
UD Importancia de la carga de la deuda (% de las exportaciones y bienes de
ESS
Empleados del sectorservicios)
servicios (%Poblacin activa)
RG
A

Los datos se muestran adelante.


a) Cules son los 3 pases con mayor tasa de mortalidad infantil?
b) Cul es el valor medio, mediano y el coeficiente de variacin de la esperanza de vida?
c) Cul es la distribucin del IDH?
d) Qu tipo de anlisis de componentes principales sugiere usted en este caso, el de descomposicin
factorial de la matriz de correlaciones o el de descomposicin factorial de la matriz de
varianzas/covarianzas?
e) Cuntos ejes factoriales deben ser conservados en la interpretacin del anlisis?
f) Cules son los pases que son poco contributivas a la inercia proyectada sobre el primer plano y que
estn mal representadas en dicho plano?
g) Cules son las caractersticas comunes de Ecuador y Paragay?
h) Cules son las caractersticas comunes de Bolivia y Per?
i) Cules son las caractersticas comunes de Venezuela, Colombia y Urugay?
j) Cules son las caractersticas comunes de Argentina y Chile?
k) Qu variables estn correlacionadas en el primer plano factorial?
l) Cul es la variable que presenta menor correlacin con las dems en el primer plano factorial?
m) Podemos considerar que el primer eje es una buena combinacin lineal de las variables activas?
n) Cmo definira a Colombia de acuerdo al primer plano factorial?
o) Cmo define a Bolivia de acuerdo con el primer plano factorial?
p) El IDH es un ndice adecuado para representar la situacin socio econmica de un pas?
Pas

EV TME PIB

IDH

PNB GPI ACC T_MORT T_ALF PR

HM

CT TF DEUD CARGA ESS

URU 72,2

7,8

5916 0,881 2620

3,3

101

21

96

14

510

163 2,4

47

41

67

CHI 71,8

7,5

5099 0,864 1950

2,9

102

17

93

14

1230

68

2,7

74

26

52

ARG

71

8,7

4295 0,832 2380

1,5

131

30

95

14

370

115 2,8

62

34

53

VEN

70

6,3

6169 0,824 2560

4,1

99

34

90

700

92

3,2

71

21

56

COL 68,8

7,1

4237

0,77

1260

2,9

106

38

86

30

1230

81

2,7

45

39

68

BRA 65,6

3,9

4718

0,73

2680

3,9

114

59

80

25

1080

96

2,9

25

21

47

5,6

3074 0,646

960

2,7

105

59

84

44

820

36

3,8

121

33

46

4,9

2790 0,641 1090

116

48

88

52

1460

27

4,4

41

11

31

6,4

2622 0,592 1100

3,5

87

80

79

30

1040

31

3,7

59

11

53

1572 0,398

2,4

84

89

71

49

1530

29

4,7

101

40

34

EQU

66

PAR 67,1
PER

63

BOL 54,5

630

Ejercicio 4. En un estudio sobre sobrevivencia del ms fuerte, se trabaj con 49 gorriones hembras que
fueron encontradas despus de una tormenta. Entre otras variables se les midi la longitud total, extensin de las
alas, longitud pico-cabeza, longitud del hmero y la longitud de la quilla (esternn o pecho); todas en milmetros. Adems
se observ si el animal sobrevivi o no (tomado de Multivariate Statistical Methods A Primer, Third Edition - Bryan F.J.
Manly, 2005).
No

Longitud Extensin alas Long pico-cabeza Long hmero Long quilla

Estado

156

245

31,6

18,5

20,5

Sobreviv

154

240

30,4

17,9

19,6

Sobreviv

153

240

31

18,4

20,6

Sobreviv

153

236

30,9

17,7

20,2

Sobreviv

155

243

31,5

18,6

20,3

Sobreviv

163

247

32

19

20,9

Sobreviv

157

238

30,9

18,4

20,2

Sobreviv

155

239

32,8

18,6

21,2

Sobreviv

164

248

32,7

19,1

21,1

Sobreviv

10

158

238

31

18,8

22

Sobreviv

11

158

240

31,3

18,6

22

Sobreviv

12

160

244

31,1

18,6

20,5

Sobreviv

13

161

246

32,3

19,3

21,8

Sobreviv

14

157

245

32

19,1

20

Sobreviv

15

157

235

31,5

18,1

19,8

Sobreviv

16

156

237

30,9

18

20,3

Sobreviv

17

158

244

31,4

18,5

21,6

Sobreviv

18

153

238

30,5

18,2

20,9

Sobreviv

19

155

236

30,3

18,5

20,1

Sobreviv

20

163

246

32,5

18,6

21,9

Sobreviv

21

159

236

31,5

18

21,5

Sobreviv

22

155

240

31,4

18

20,7

Muri

23

156

240

31,5

18,2

20,6

Muri

24

160

242

32,6

18,8

21,7

Muri

25

152

232

30,3

17,2

19,8

Muri

26

160

250

31,7

18,8

22,5

Muri

27

155

237

31

18,5

20

Muri

28

157

245

32,2

19,5

21,4

Muri

29

165

245

33,1

19,8

22,7

Muri

30

153

231

30,1

17,3

19,8

Muri

31

162

239

30,3

18

23,1

Muri

32

162

243

31,6

18,8

21,3

Muri

33

159

245

31,8

18,5

21,7

Muri

34

159

247

30,9

18,1

19

Muri

35

155

243

30,9

18,5

21,3

Muri

36

162

252

30,9

19,1

22,2

Muri

a)
b)
c)
d)
e)
f)
g)
h)
i)
j)
k)

37

152

230

30,4

17,3

18,6

Muri

38

159

242

30,8

18,2

20,5

Muri

39

155

238

31,2

17,9

19,3

Muri

40

163

249

33,4

19,5

22,8

Muri

41

163

242

31

18,1

20,7

Muri

42

156

237

31,7

18,2

20,3

Muri

43

159

238

31,5

18,4

20,3

Muri

44

161

245

32,1

19,1

20,8

Muri

45

155

235

30,7

17,7

19,6

Muri

46

162

247

30,9

19,1

20,4

Muri

47

153

237

30,6

18,6

20,4

Muri

48

162

245

32,5

18,5

21,1

Muri

49

164

248

32,3

18,8

20,9

Muri

Determine el nmero de ejes a retener.


Qu concluye de la matriz de correlaciones?
Qu variables constituyen el eje 1?
Qu variables constituyen el eje 2?
Qu aves estn bien representadas en el eje1?
Considera usted que todos los individuos estn bien representados en el primer plano factorial?
Considera usted que todas las variables estn bien representadas en el primer plano factorial?
Qu caractersticas comunes presentan las aves 10 y 11?
Qu caractersticas comunes presentan las aves 39 y 34?
Qu variables se muestran independientes?
Influye las mediciones realizadas en la sobrevivencia del animal?

PRINCIPAL COMPONENTS ANALYSIS


SUMMARY STATISTICS OF CONTINUOUS VARIABLES
TOTAL COUNT
:
49
TOTAL WEIGHT
:
49.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LABEL
COUNT
WEIGHT |
MEAN STD.DEV. |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . Long - Longitud
49
49.00 |
157.98
3.62 |
152.00
165.00 |
|
2 . Exte - Extensin alas
49
49.00 |
241.33
5.02 |
230.00
252.00 |
|
3 . Long - Long pico-cabeza
49
49.00 |
31.42
0.79 |
30.10
33.40 |
|
4 . Long - Long hmero
49
49.00 |
18.47
0.56 |
17.20
19.80 |
|
5 . Long - Long quilla
49
49.00 |
20.83
0.98 |
18.60
23.10 |
+-------------------------------------------------------+----------------------+----------------------+
CORRELATION MATRIX
|
Long
Exte
Long
Long
Long
-----+----------------------------------Long |
1.00
Exte |
0.73
1.00
Long |
0.60
0.59
1.00
Long |
0.65
0.77
0.70
1.00
Long |
0.61
0.53
0.50
0.61
1.00
-----+----------------------------------|
Long
Exte
Long
Long
Long
TEST-VALUES MATRIX
|
Long
Exte
Long
Long
Long
-----+----------------------------------Long | 99.99
Exte |
6.58 99.99
Long |
4.88
4.72 99.99
Long |
5.37
7.12
6.11 99.99
Long |
4.91
4.12
3.84
4.93 99.99
-----+----------------------------------|
Long
Exte
Long
Long
Long
EIGENVALUES
COMPUTATIONS PRECISION SUMMARY : TRACE BEFORE DIAGONALISATION..
5.0000
SUM OF EIGENVALUES............
5.0000
HISTOGRAM OF THE FIRST
5 EIGENVALUES
+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+
| NUMBER | EIGENVALUE | PERCENTAGE | CUMULATED |
|
|
|
|
| PERCENTAGE |
|
+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+
|
1
|
3.5227
|
70.45
|
70.45
| ******************************************************************************** |
|
2
|
0.5255
|
10.51
|
80.96
| ************
|
|
3
|
0.4480
|
8.96
|
89.92
| ***********
|
|
4
|
0.3355
|
6.71
|
96.63
| ********
|
|
5
|
0.1683
|
3.37
|
100.00
| ****
|
+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+
COORDINATES OF VARIABLES ON AXES 1 TO 5
ACTIVE VARIABLES
----------------------------+------------------------------------+-------------------------------+-------------------------------

VARIABLES
|
COORDINATES
| VARIABLE-FACTOR CORRELATIONS |
NORMED EIGENVECTORS
----------------------------+------------------------------------+-------------------------------+------------------------------IDEN - SHORT LABEL
|
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5
----------------------------+------------------------------------+-------------------------------+------------------------------Long - Longitud
|
0.86 -0.07
0.29 -0.39 -0.15 | 0.86 -0.07 0.29 -0.39 -0.15 | 0.46 -0.09 0.43 -0.67 -0.37
Exte - Extensin alas
|
0.87
0.16
0.36
0.17
0.25 | 0.87 0.16 0.36 0.17 0.25 | 0.46 0.22 0.53 0.29 0.61
Long - Long pico-cabeza
|
0.81
0.31 -0.45 -0.20
0.11 | 0.81 0.31 -0.45 -0.20 0.11 | 0.43 0.43 -0.67 -0.34 0.26
Long - Long hmero
|
0.89
0.14 -0.07
0.34 -0.26 | 0.89 0.14 -0.07 0.34 -0.26 | 0.48 0.20 -0.10 0.58 -0.62
Long - Long quilla
|
0.76 -0.61 -0.18
0.07
0.08 | 0.76 -0.61 -0.18 0.07 0.08 | 0.41 -0.84 -0.27 0.11 0.19
----------------------------+------------------------------------+-------------------------------+------------------------------FACTOR SCORES, CONTRIBUTIONS AND SQUARED COSINES OF CASES
AXES 1 TO 5
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
|
CASES
|
FACTOR SCORES
|
CONTRIBUTIONS
|
SQUARED COSINES
|
|---------------------------------------+-------------------------------+--------------------------+--------------------------|
| IDENTIFIER
REL.WT. DISTO |
1
2
3
4
5
|
1
2
3
4
5 |
1
2
3
4
5 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
| 1
2.04
1.00 | 0.08 0.61 0.08 0.50 0.61 | 0.0 1.4 0.0 1.5 4.6 | 0.01 0.37 0.01 0.25 0.37 |
| 2
2.04
5.55 | -2.17 0.34 0.69 0.37 0.32 | 2.7 0.4 2.1 0.8 1.3 | 0.85 0.02 0.08 0.03 0.02 |
| 3
2.04
2.32 | -1.13 0.01 -0.31 0.94 0.25 | 0.7 0.0 0.4 5.3 0.8 | 0.55 0.00 0.04 0.38 0.03 |
| 4
2.04
5.76 | -2.32 -0.13 -0.41 -0.02 0.44 | 3.1 0.1 0.8 0.0 2.4 | 0.93 0.00 0.03 0.00 0.03 |
| 5
2.04
1.14 | -0.28 0.70 -0.13 0.69 0.29 | 0.0 1.9 0.1 2.9 1.0 | 0.07 0.42 0.01 0.42 0.07 |
| 6
2.04
4.66 | 1.96 0.57 0.60 -0.30 -0.22 | 2.2 1.3 1.6 0.6 0.6 | 0.82 0.07 0.08 0.02 0.01 |
| 7
2.04
1.37 | -1.03 0.11 0.15 0.07 -0.51 | 0.6 0.0 0.1 0.0 3.2 | 0.78 0.01 0.02 0.00 0.19 |
| 8
2.04
4.16 | 0.43 0.45 -1.90 0.01 0.40 | 0.1 0.8 16.4 0.0 2.0 | 0.04 0.05 0.87 0.00 0.04 |
| 9
2.04
8.53 | 2.73 0.84 0.16 -0.61 -0.05 | 4.3 2.7 0.1 2.2 0.0 | 0.87 0.08 0.00 0.04 0.00 |
| 10
2.04
2.50 | 0.23 -1.27 -0.38 0.46 -0.69 | 0.0 6.3 0.7 1.3 5.7 | 0.02 0.65 0.06 0.09 0.19 |
| 11
2.04
1.58 | 0.41 -1.09 -0.39 0.24 -0.12 | 0.1 4.6 0.7 0.4 0.2 | 0.11 0.75 0.09 0.04 0.01 |
| 12
2.04
0.92 | 0.30 0.22 0.86 0.01 -0.20 | 0.1 0.2 3.4 0.0 0.5 | 0.10 0.05 0.80 0.00 0.04 |
| 13
2.04
6.01 | 2.40 0.08 -0.30 0.30 -0.20 | 3.4 0.0 0.4 0.5 0.5 | 0.96 0.00 0.02 0.01 0.01 |
| 14
2.04
3.14 | 0.73 1.45 -0.10 0.70 -0.13 | 0.3 8.1 0.0 3.0 0.2 | 0.17 0.67 0.00 0.16 0.01 |
| 15
2.04
3.21 | -1.40 0.54 -0.51 -0.71 -0.42 | 1.1 1.1 1.2 3.1 2.1 | 0.61 0.09 0.08 0.16 0.06 |
| 16
2.04
2.47 | -1.55 -0.14 -0.03 -0.20 -0.06 | 1.4 0.1 0.0 0.2 0.0 | 0.97 0.01 0.00 0.02 0.00 |
| 17
2.04
0.91 | 0.59 -0.55 0.08 0.28 0.43 | 0.2 1.2 0.0 0.5 2.2 | 0.38 0.33 0.01 0.08 0.20 |
| 18
2.04
3.93 | -1.64 -0.69 -0.14 0.86 0.13 | 1.6 1.8 0.1 4.5 0.2 | 0.68 0.12 0.01 0.19 0.00 |
| 19
2.04
4.37 | -1.75 -0.14 0.22 0.68 -0.87 | 1.8 0.1 0.2 2.8 9.3 | 0.70 0.00 0.01 0.11 0.17 |
| 20
2.04
5.93 | 2.21 -0.20 -0.14 -0.88 0.46 | 2.8 0.2 0.1 4.7 2.5 | 0.83 0.01 0.00 0.13 0.04 |
| 21
2.04
2.40 | -0.44 -0.97 -0.62 -0.94 -0.07 | 0.1 3.6 1.7 5.4 0.1 | 0.08 0.39 0.16 0.37 0.00 |
| 22
2.04
1.47 | -0.96 -0.05 -0.36 -0.01 0.64 | 0.5 0.0 0.6 0.0 5.0 | 0.63 0.00 0.09 0.00 0.28 |
| 23
2.04
0.67 | -0.65 0.13 -0.34 -0.05 0.33 | 0.2 0.1 0.5 0.0 1.3 | 0.64 0.03 0.17 0.00 0.16 |
| 24
2.04
3.72 | 1.61 -0.01 -0.99 -0.40 0.06 | 1.5 0.0 4.4 1.0 0.0 | 0.69 0.00 0.26 0.04 0.00 |
| 25
2.04 14.46 | -3.73 -0.45 -0.25 -0.37 0.35 | 8.1 0.8 0.3 0.8 1.5 | 0.96 0.01 0.00 0.01 0.01 |
| 26
2.04
6.69 | 2.18 -0.83 0.40 0.53 0.88 | 2.8 2.7 0.7 1.7 9.4 | 0.71 0.10 0.02 0.04 0.12 |
| 27
2.04
2.42 | -1.32 0.37 -0.24 0.42 -0.54 | 1.0 0.5 0.3 1.1 3.6 | 0.72 0.06 0.02 0.07 0.12 |
| 28
2.04
5.34 | 1.76 0.49 -0.73 1.19 -0.24 | 1.8 0.9 2.4 8.6 0.7 | 0.58 0.05 0.10 0.27 0.01 |
| 29
2.04 18.17 | 4.05 -0.23 -0.95 -0.23 -0.86 | 9.5 0.2 4.1 0.3 9.0 | 0.90 0.00 0.05 0.00 0.04 |
| 30
2.04 14.41 | -3.72 -0.59 -0.09 -0.43 -0.05 | 8.0 1.4 0.0 1.1 0.0 | 0.96 0.02 0.00 0.01 0.00 |
| 31
2.04
9.54 | 0.22 -2.95 0.64 -0.63 -0.11 | 0.0 33.7 1.8 2.4 0.1 | 0.01 0.91 0.04 0.04 0.00 |
| 32
2.04
1.98 | 1.24 -0.22 0.32 -0.34 -0.43 | 0.9 0.2 0.5 0.7 2.3 | 0.77 0.02 0.05 0.06 0.10 |
| 33
2.04
1.65 | 1.06 -0.39 -0.06 -0.01 0.60 | 0.7 0.6 0.0 0.0 4.3 | 0.69 0.09 0.00 0.00 0.22 |
| 34
2.04
5.69 | -0.70 1.38 1.73 -0.24 0.48 | 0.3 7.4 13.7 0.3 2.7 | 0.09 0.34 0.53 0.01 0.04 |
| 35
2.04
1.46 | -0.28 -0.53 0.12 0.96 0.40 | 0.0 1.1 0.1 5.6 1.9 | 0.05 0.19 0.01 0.63 0.11 |
| 36
2.04
9.43 | 2.32 -0.87 1.56 0.89 0.26 | 3.1 2.9 11.1 4.9 0.8 | 0.57 0.08 0.26 0.08 0.01 |
| 37
2.04 19.03 | -4.28 0.58 -0.23 -0.56 -0.20 | 10.6 1.3 0.2 1.9 0.5 | 0.96 0.02 0.00 0.02 0.00 |
| 38
2.04
1.06 | -0.51 -0.15 0.86 -0.20 0.01 | 0.2 0.1 3.3 0.3 0.0 | 0.25 0.02 0.69 0.04 0.00 |
| 39
2.04
4.65 | -1.92 0.92 0.00 -0.31 0.18 | 2.1 3.3 0.0 0.6 0.4 | 0.79 0.18 0.00 0.02 0.01 |
| 40
2.04 18.03 | 4.12 -0.03 -0.99 -0.05 0.28 | 9.8 0.0 4.5 0.0 1.0 | 0.94 0.00 0.05 0.00 0.00 |
| 41
2.04
2.68 | 0.10 -0.35 1.13 -1.12 -0.19 | 0.0 0.5 5.8 7.6 0.4 | 0.00 0.05 0.47 0.46 0.01 |
| 42
2.04
1.69 | -0.94 0.37 -0.74 -0.34 -0.03 | 0.5 0.5 2.5 0.7 0.0 | 0.53 0.08 0.33 0.07 0.00 |
| 43
2.04
0.83 | -0.41 0.30 -0.14 -0.55 -0.50 | 0.1 0.3 0.1 1.8 3.1 | 0.20 0.11 0.02 0.36 0.31 |
| 44
2.04
3.26 | 1.62 0.71 0.07 0.00 -0.36 | 1.5 2.0 0.0 0.0 1.5 | 0.80 0.15 0.00 0.00 0.04 |
| 45
2.04
6.56 | -2.52 0.18 0.05 -0.44 -0.07 | 3.7 0.1 0.0 1.2 0.1 | 0.97 0.00 0.00 0.03 0.00 |
| 46
2.04
4.41 | 1.11 0.46 1.53 0.40 -0.69 | 0.7 0.8 10.6 1.0 5.7 | 0.28 0.05 0.53 0.04 0.11 |
| 47
2.04
3.96 | -1.54 -0.10 -0.27 1.12 -0.50 | 1.4 0.0 0.3 7.6 3.1 | 0.60 0.00 0.02 0.32 0.06 |
| 48
2.04
3.73 | 1.58 0.43 -0.13 -0.94 0.40 | 1.4 0.7 0.1 5.4 1.9 | 0.67 0.05 0.00 0.24 0.04 |
| 49
2.04
6.15 | 2.17 0.69 0.60 -0.77 0.12 | 2.7 1.8 1.7 3.6 0.2 | 0.77 0.08 0.06 0.10 0.00 |
+---------------------------------------+-------------------------------+--------------------------+--------------------------+
COORDINATES AND TEST-VALUES OF CATEGORIES
AXES 1 TO 5
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CATEGORIES
|
TEST-VALUES
|
COORDINATES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LABEL
COUNT
ABS.WT |
1
2
3
4
5
|
1
2
3
4
5
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
6 . Estado
|
| m1
- Muri
28
28.00 |
0.3 -0.3
1.1 -1.2
0.1 |
0.06 -0.03
0.09 -0.09
0.01 |
0.02 |
| m2
- Sobreviv
21
21.00 | -0.3
0.3 -1.1
1.2 -0.1 | -0.08
0.03 -0.12
0.12 -0.01 |
0.04 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+

Anlisis de clasificacin jerrquica

Hier ar chi cal Cluster Anal ysis ( on factors)

35

14

34

46

12

38

41

17

33

11

10

21

31

26

36

28

13

44

32

49

24

48

20

40

29

23

22

43

42

15

16

27

18

47

19

39

45

DESCRIPTION AND CHARACTERISATION OF PARTITIONS


DESCRIPTION OF: CUT "a" OF THE TREE INTO
2 CLUSTER
CLUSTERS CHARACTERISATION BY CATEGORIES
CLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLES
CHARACTERISATION BY CATEGORIES OF CLUSTERS OR CATEGORIES
OF CUT "a" OF THE TREE INTO
2 CLUSTERS
Cluster 1 / 2
---------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC
IDEN WEIGHT
GRP/CAT CAT/GRP GLOBAL CATEGORIES
OF VARIABLES
---------------------------------------------------------------------------------------------------------------------------------Cluster 2 / 2
---------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC
IDEN WEIGHT
GRP/CAT CAT/GRP GLOBAL CATEGORIES
OF VARIABLES
---------------------------------------------------------------------------------------------------------------------------------CHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIES
OF CUT "a" OF THE TREE INTO
2 CLUSTERS
Cluster 1 / 2
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 1 / 2
( WEIGHT =
25.00
COUNT =
25 )
aa1a |
|
|
|
5.12 | 0.000 |
160.60
157.98 |
2.67
3.62 |
1.Longitud
Long |
|
4.84 | 0.000 |
244.76
241.33 |
3.39
5.02 |
2.Extensin alas
Exte |
|
4.74 | 0.000 |
18.84
18.47 |
0.42
0.56 |
4.Long hmero
Long |
|
4.65 | 0.000 |
21.47
20.83 |
0.79
0.98 |
5.Long quilla
Long |
|
4.18 | 0.000 |
31.88
31.42 |
0.76
0.79 |
3.Long pico-cabeza
Long |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
Cluster 2 / 2
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 2 / 2
( WEIGHT =
24.00
COUNT =
24 )
aa2a |

37

25

30

|
|
|
|
|
|
|
|
| -4.18 | 0.000 |
30.93
31.42 |
0.45
0.79 |
3.Long pico-cabeza
Long |
| -4.65 | 0.000 |
20.15
20.83 |
0.65
0.98 |
5.Long quilla
Long |
| -4.74 | 0.000 |
18.08
18.47 |
0.40
0.56 |
4.Long hmero
Long |
| -4.84 | 0.000 |
237.75
241.33 |
3.79
5.02 |
2.Extensin alas
Exte |
| -5.12 | 0.000 |
155.25
157.98 |
2.17
3.62 |
1.Longitud
Long |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
DESCRIPTION OF: CUT "b" OF THE TREE INTO
3 CLUSTER
CLUSTERS CHARACTERISATION BY CATEGORIES
CLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLES
CHARACTERISATION BY CATEGORIES OF CLUSTERS OR CATEGORIES
OF CUT "b" OF THE TREE INTO
3 CLUSTERS
Cluster 1 / 3
---------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC
IDEN WEIGHT
GRP/CAT CAT/GRP GLOBAL CATEGORIES
OF VARIABLES
---------------------------------------------------------------------------------------------------------------------------------Cluster 2 / 3
---------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC
IDEN WEIGHT
GRP/CAT CAT/GRP GLOBAL CATEGORIES
OF VARIABLES
---------------------------------------------------------------------------------------------------------------------------------Cluster 3 / 3
---------------------------------------------------------------------------------------------------------------------------------T.VALUE PROB. ---- PERCENTAGES ---- CHARACTERISTIC
IDEN WEIGHT
GRP/CAT CAT/GRP GLOBAL CATEGORIES
OF VARIABLES
---------------------------------------------------------------------------------------------------------------------------------CHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIES
OF CUT "b" OF THE TREE INTO
3 CLUSTERS
Cluster 1 / 3
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
Cluster 2 / 3
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 2 / 3
( WEIGHT =
13.00
COUNT =
13 )
bb2b |
|
|
|
4.82 | 0.000 |
32.33
31.42 |
0.60
0.79 |
3.Long pico-cabeza
Long |
|
4.54 | 0.000 |
161.92
157.98 |
2.06
3.62 |
1.Longitud
Long |
|
4.52 | 0.000 |
246.77
241.33 |
2.52
5.02 |
2.Extensin alas
Exte |
|
4.47 | 0.000 |
19.07
18.47 |
0.36
0.56 |
4.Long hmero
Long |
|
3.61 | 0.000 |
21.68
20.83 |
0.68
0.98 |
5.Long quilla
Long |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
Cluster 3 / 3
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 3 / 3
( WEIGHT =
17.00
COUNT =
17 )
bb3b |
|
|
|
|
|
|
|
|
| -3.88 | 0.000 |
30.81
31.42 |
0.45
0.79 |
3.Long pico-cabeza
Long |
| -4.19 | 0.000 |
20.01
20.83 |
0.54
0.98 |
5.Long quilla
Long |
| -4.30 | 0.000 |
17.99
18.47 |
0.43
0.56 |
4.Long hmero
Long |
| -5.06 | 0.000 |
154.35
157.98 |
1.57
3.62 |
1.Longitud
Long |
| -5.07 | 0.000 |
236.29
241.33 |
2.89
5.02 |
2.Extensin alas
Exte |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+

Ejercicio 5. Los siguientes datos (Manly, 1986, pg 165) corresponden a mediciones


hechas sobre 16 colonias de mariposas Euphydryaus edita (Porc gen mov: porcentaje de
genes con movilidad 0,4; 0,6; 0,8; 1,0; 1,16 y 1,30). Se pretende explorar la posible
asociacin entre los factores ambientales y las caractersticas genticas presentes en estos
insectos.

Altitud
Colonia (pies)

Temp
mx
anual
(F)

Precip
anual
(pulg)

Temp
mn
anual
(F)

Porc gen
mov 0,4

Porc gen
mov 0,6

Porc gen
mov 0,8

Porc gen
mov 1,0

Porc gen Porc gen


mov 1,16 mov 1,30

SS

500

43

98

17

22

57

17

SB

800

20

92

32

16

20

38

13

13

WSB

570

28

98

26

28

46

17

JRC

550

28

98

26

19

47

27

JRH

550

28

98

26

50

35

SJ

380

15

99

28

19

44

32

CR

930

21

99

28

15

50

27

UO

650

10

101

27

10

21

40

25

LO

600

10

101

27

14

26

32

28

DP

1500

19

99

23

80

12

PZ

1750

22

101

27

34

33

22

MC

2000

58

100

18

14

66

13

IF

2500

34

102

16

15

47

21

AF

2000

21

105

20

17

32

27

14

GH

7850

42

84

84

GL

10500

50

81

-12

92

PRINCIPAL COMPONENTS ANALYSIS


SUMMARY STATISTICS OF CONTINUOUS VARIABLES
TOTAL COUNT
:
16
TOTAL WEIGHT
:
16.00
+-------------------------------------------------------+----------------------+----------------------+
| NUM . IDEN - LABEL
COUNT
WEIGHT |
MEAN STD.DEV. |
MINIMUM
MAXIMUM |
+-------------------------------------------------------+----------------------+----------------------+
|
1 . Alti - Altitud (pies)
16
16.00 |
2101.88
2787.93 |
380.00 10500.00 |
|
2 . Prec - Precip anual (pulg)
16
16.00 |
28.06
13.55 |
10.00
58.00 |
|
3 . Temp - Temp mx anual (F)
16
16.00 |
97.25
6.18 |
81.00
105.00 |
|
4 . Temp - Temp mn anual (F)
16
16.00 |
20.88
10.61 |
-12.00
32.00 |
|-------------------------------------------------------|----------------------|----------------------|
5 . Porc - Porc gen mov 0,4
16
16.00 |
1.75
4.01 |
0.00
14.00 |
|
6 . Porc - Porc gen mov 0,6
16
16.00 |
7.19
7.26 |
0.00
26.00 |
|
7 . Porc - Porc gen mov 0,8
16
16.00 |
18.56
10.43 |
1.00
40.00 |
|
8 . Porc - Porc gen mov 1,0
16
16.00 |
51.19
19.43 |
25.00
92.00 |
|
9 . Porc - Porc gen mov 1,16
16
16.00 |
17.19
10.44 |
0.00
35.00 |
| 10 . Porc - Porc gen mov 1,30
16
16.00 |
4.13
4.48 |
0.00
14.00 |
+-------------------------------------------------------+----------------------+----------------------+
CORRELATION MATRIX
|
Alti
Prec
Temp
Temp
-----+---------------------------Alti |
1.00
Prec |
0.57
1.00
Temp | -0.83 -0.48
1.00
Temp | -0.94 -0.70
0.72
1.00
-----+---------------------------|
Alti
Prec
Temp
Temp
TEST-VALUES MATRIX
|
Alti
Prec
Temp
Temp
-----+---------------------------Alti | 99.99
Prec |
2.58 99.99
Temp | -4.72 -2.09 99.99
Temp | -6.82 -3.51
3.62 99.99
-----+---------------------------|
Alti
Prec
Temp
Temp
EIGENVALUES
COMPUTATIONS PRECISION SUMMARY : TRACE BEFORE DIAGONALISATION..
4.0000
SUM OF EIGENVALUES............
4.0000
HISTOGRAM OF THE FIRST
4 EIGENVALUES
+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+
| NUMBER | EIGENVALUE | PERCENTAGE | CUMULATED |
|
|
|
|
| PERCENTAGE |
|
+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+
|
1
|
3.1394
|
78.49
|
78.49
| ******************************************************************************** |
|
2
|
0.5752
|
14.38
|
92.87
| ***************
|
|
3
|
0.2533
|
6.33
|
99.20
| *******
|
|
4
|
0.0321
|
0.80
|
100.00
| *
|
+--------+------------+-------------+-------------+----------------------------------------------------------------------------------+
ANDERSON'S LAPLACE INTERVALS
WITH 0.95 THRESHOLD
+--------+--------------------------------------------------------+
| NUMBER |
LOWER LIMIT
EIGENVALUE
UPPER LIMIT
|
+--------+--------------------------------------------------------+
|
1
|
0.8926
3.1394
5.3863
|
|
2
|
0.1635
0.5752
0.9868
|
|
3
|
0.0720
0.2533
0.4346
|
|
4
|
0.0091
0.0321
0.0551
|
+--------+--------------------------------------------------------+
LENGTH AND RELATIVE POSITION OF INTERVALS
1 . . . . . . . . . . .*----------------------------------------------------+-----------------------------------------------------*
2 . .*---------+---------*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
3 .*---+----* . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
4 +*. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
COORDINATES OF VARIABLES ON AXES 1 TO 4
ACTIVE VARIABLES
----------------------------+------------------------------------+-------------------------------+------------------------------VARIABLES
|
COORDINATES
| VARIABLE-FACTOR CORRELATIONS |
NORMED EIGENVECTORS
----------------------------+------------------------------------+-------------------------------+------------------------------IDEN - SHORT LABEL
|
1
2
3
4
0
|
1
2
3
4
0 |
1
2
3
4
0
----------------------------+------------------------------------+-------------------------------+------------------------------Alti - Altitud (pies)
| -0.95 -0.21
0.18
0.13
0.00 | -0.95 -0.21 0.18 0.13 0.00 | -0.54 -0.27 0.36 0.71 0.00
Prec - Precip anual (pulg) | -0.76
0.63 -0.16
0.03
0.00 | -0.76 0.63 -0.16 0.03 0.00 | -0.43 0.83 -0.32 0.16 0.00
Temp - Temp mx anual (F) |
0.86
0.37
0.35
0.04
0.00 | 0.86 0.37 0.35 0.04 0.00 | 0.49 0.48 0.70 0.20 0.00
Temp - Temp mn anual (F) |
0.96 -0.04 -0.27
0.12
0.00 | 0.96 -0.04 -0.27 0.12 0.00 | 0.54 -0.05 -0.53 0.65 0.00
----------------------------+------------------------------------+-------------------------------+------------------------------SUPPLEMENTARY VARIABLES
----------------------------+------------------------------------+-------------------------------+------------------------------VARIABLES
|
COORDINATES
| VARIABLE-FACTOR CORRELATIONS |
NORMED EIGENVECTORS
----------------------------+------------------------------------+-------------------------------+------------------------------IDEN - SHORT LABEL
|
1
2
3
4
0
|
1
2
3
4
0 |
1
2
3
4
0
----------------------------+------------------------------------+-------------------------------+------------------------------Porc - Porc gen mov 0,4
|
0.34 -0.33
0.37 -0.13
0.00 | 0.34 -0.33 0.37 -0.13 0.00 |
Porc - Porc gen mov 0,6
|
0.28 -0.28
0.11 -0.02
0.00 | 0.28 -0.28 0.11 -0.02 0.00 |
Porc - Porc gen mov 0,8
|
0.63 -0.09
0.07
0.01
0.00 | 0.63 -0.09 0.07 0.01 0.00 |
Porc - Porc gen mov 1,0
| -0.82
0.09 -0.13 -0.07
0.00 | -0.82 0.09 -0.13 -0.07 0.00 |
Porc - Porc gen mov 1,16
|
0.42
0.27 -0.06
0.06
0.00 | 0.42 0.27 -0.06 0.06 0.00 |
Porc - Porc gen mov 1,30
|
0.34 -0.06
0.04
0.32
0.00 | 0.34 -0.06 0.04 0.32 0.00 |
----------------------------+------------------------------------+-------------------------------+-------------------------------

Hier ar chi cal Cluster Anal ysis ( on factors)


GL
GH
UO
LO
SJ
SB
JRC
JRH
WSB
CR
PZ
DP
AF
IF
MC
SS

DESCRIPTION AND CHARACTERISATION OF PARTITIONS


DESCRIPTION OF: CUT "a" OF THE TREE INTO
2 CLUSTER
CLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLES
CHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIES
OF CUT "a" OF THE TREE INTO
2 CLUSTERS
Cluster 1 / 2
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 1 / 2
( WEIGHT =
14.00
COUNT =
14 )
aa1a |
|
|
|
3.49 | 0.000 |
99.36
97.25 |
2.79
6.18 |
3.Temp mx anual (F)
Temp |

|
3.36 | 0.000 |
24.36
20.88 |
4.62
10.61 |
4.Temp mn anual (F)
Temp |
|
2.04 | 0.021 |
20.64
18.56 |
9.41
10.43 |
7.Porc gen mov 0,8
Porc |
|
|
|
|
|
|
| -2.77 | 0.003 |
45.93
51.19 |
14.41
19.43 |
8.Porc gen mov 1,0
Porc |
| -3.71 | 0.000 | 1091.43 2101.88 |
681.24 2787.93 |
1.Altitud (pies)
Alti |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
Cluster 2 / 2
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 2 / 2
( WEIGHT =
2.00
COUNT =
2 )
aa2a |
|
|
|
3.71 | 0.000 | 9175.00 2101.88 | 1325.00 2787.93 |
1.Altitud (pies)
Alti |
|
2.77 | 0.003 |
88.00
51.19 |
4.00
19.43 |
8.Porc gen mov 1,0
Porc |
|
|
|
|
|
|
| -2.04 | 0.021 |
4.00
18.56 |
3.00
10.43 |
7.Porc gen mov 0,8
Porc |
| -3.36 | 0.000 |
-3.50
20.88 |
8.50
10.61 |
4.Temp mn anual (F)
Temp |
| -3.49 | 0.000 |
82.50
97.25 |
1.50
6.18 |
3.Temp mx anual (F)
Temp |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
DESCRIPTION OF: CUT "b" OF THE TREE INTO
3 CLUSTER
CLUSTERS CHARACTERISATION BY CONTINUOUS VARIABLES
CHARACTERISATION BY CONTINUOUS VARIABLES OF CLUSTERS OR CATEGORIES
OF CUT "b" OF THE TREE INTO
3 CLUSTERS
Cluster 1 / 3
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 1 / 3
( WEIGHT =
3.00
COUNT =
3 )
bb1b |
|
|
|
2.33 | 0.010 |
45.00
28.06 |
9.90
13.55 |
2.Precip anual (pulg)
Prec |
|
|
|
|
|
|
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
Cluster 2 / 3
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 2 / 3
( WEIGHT =
11.00
COUNT =
11 )
bb2b |
|
|
|
2.97 | 0.001 |
26.36
20.88 |
2.87
10.61 |
4.Temp mn anual (F)
Temp |
|
|
|
|
|
|
| -2.41 | 0.008 |
934.55 2101.88 |
528.04 2787.93 |
1.Altitud (pies)
Alti |
| -2.42 | 0.008 |
43.00
51.19 |
14.42
19.43 |
8.Porc gen mov 1,0
Porc |
| -3.34 | 0.000 |
20.18
28.06 |
6.21
13.55 |
2.Precip anual (pulg)
Prec |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
Cluster 3 / 3
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
| T.VALUE| PROB. |
MEANS
|
STD. DEVIATION |
CHARACTERISTIC VARIABLES
|
|
|
|
GROUP
OVERALL |
GROUP OVERALL | NUM.LABEL
IDEN |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
|
Cluster 3 / 3
( WEIGHT =
2.00
COUNT =
2 )
bb3b |
|
|
|
3.71 | 0.000 | 9175.00 2101.88 | 1325.00 2787.93 |
1.Altitud (pies)
Alti |
|
2.77 | 0.003 |
88.00
51.19 |
4.00
19.43 |
8.Porc gen mov 1,0
Porc |
|
|
|
|
|
|
| -2.04 | 0.021 |
4.00
18.56 |
3.00
10.43 |
7.Porc gen mov 0,8
Porc |
| -3.36 | 0.000 |
-3.50
20.88 |
8.50
10.61 |
4.Temp mn anual (F)
Temp |
| -3.49 | 0.000 |
82.50
97.25 |
1.50
6.18 |
3.Temp mx anual (F)
Temp |
+--------+-------+-------------------+-------------------+-----------------------------------------------------------------------+
BUILDING UP PARTITIONS
CUT "a" OF THE TREE INTO
2 CLUSTERS
CLUSTERS FORMATION (ON ACTIVE CASES)
SUMMARY DESCRIPTION
+---------+----------+------------+------------+
| CLUSTER | COUNT
|
WEIGHT
|
CONTENT |
+---------+----------+------------+------------+
|
aa1a |
14
|
14.00
|
1 TO 14 |
|
aa2a |
2
|
2.00
| 15 TO 16 |
+---------+----------+------------+------------+
COORDINATES AND TEST-VALUES BEFORE CONSOLIDATION
AXES 1 A 4
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CLUSTERS
|
TEST-VALUES
|
COORDINATES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LABEL
COUNT ABS.WT. |
1
2
3
4
0
|
1
2
3
4
0
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CUT "a" OF THE TREE INTO
2 CLUSTERS
|
|
|
| aa1a - Cluster 1 / 2
14
14.00 |
3.6
1.2 -0.1 -0.3
0.0 |
0.62
0.09
0.00
0.00
0.00 |
0.39 |
| aa2a - Cluster 2 / 2
2
2.00 | -3.6 -1.2
0.1
0.3
0.0 | -4.33 -0.64
0.03
0.03
0.00 |
19.16 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
CLUSTERING CONSOLIDATION
AROUND CENTERS OF THE
2 CLUSTERS ACHIEVED BY 10 ITERATIONS WITH MOVING CENTERS
INTER-CLUSTER INERTIA INCREASE
+-----------+---------------+---------------+---------------+
| ITERATION | TOTAL INERTIA | INTER-CLUSTER |
RATIO
|
|
|
|
INERTIA
|
|
+-----------+---------------+---------------+---------------+
|
0
|
4.00000 |
2.73755 |
0.68439 |
|
1
|
4.00000 |
2.73755 |
0.68439 |
|
2
|
4.00000 |
2.73755 |
0.68439 |
+-----------+---------------+---------------+---------------+
STOP AFTER ITERATION 2. RELATIVE INCREASE OF INTER-CLUSTER INERTIA
WITH RESPECT TO THE PREVIOUS ITERATION IS ONLY 0.000 %.
INERTIA DECOMPOSITION
COMPUTED ON
4 AXES.
+------------------+-----------------+-------------+-------------------+-----------------+
|
|
INERTIAS
|
COUNTS
|
WEIGHTS
|
DISTANCES
|
| INERTIAS
| BEFORE
AFTER |BEFORE AFTER | BEFORE
AFTER | BEFORE
AFTER |
+------------------+-----------------+-------------+-------------------+-----------------+
|
|
|
|
|
|
| INTER-CLUSTER
| 2.7376
2.7376 |
|
|
|
|
|
|
|
|
|
| INTRA-CLUSTER
|
|
|
|
|
|
|
|
|
|
|
| CLUSTER
1 / 2 | 1.1358
1.1358 |
14
14 |
14.00
14.00 | 0.3911
0.3911 |
| CLUSTER
2 / 2 | 0.1267
0.1267 |
2
2 |
2.00
2.00 |19.1629 19.1629 |
|
|
|
|
|
|
| TOTAL INERTIA
| 4.0000
4.0000 |
|
|
|
+------------------+-----------------+-------------+-------------------+-----------------+
RATIO INTER INERTIA / TOTAL INERTIA) : BEFORE .. 0.6844

AFTER .. 0.6844
COORDINATES AND TEST-VALUES AFTER CONSOLIDATION
AXES 1 A 4
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CLUSTERS
|
TEST-VALUES
|
COORDINATES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LABEL
COUNT ABS.WT. |
1
2
3
4
0
|
1
2
3
4
0
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CUT "a" OF THE TREE INTO
2 CLUSTERS
|
|
|
| aa1a - Cluster 1 / 2
14
14.00 |
3.6
1.2 -0.1 -0.3
0.0 |
0.62
0.09
0.00
0.00
0.00 |
0.39 |
| aa2a - Cluster 2 / 2
2
2.00 | -3.6 -1.2
0.1
0.3
0.0 | -4.33 -0.64
0.03
0.03
0.00 |
19.16 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
COMPOSITION OF: CUT "a" OF THE TREE INTO
2 CLUSTERS
Cluster 1 / 2
SS
SB
WSB
JRC
JRH
SJ
CR
UO
LO
DP
PZ
MC
IF
AF
Cluster 2 / 2
GH
GL
BUILDING UP PARTITIONS
CUT "a" OF THE TREE INTO
3 CLUSTERS
CLUSTERS FORMATION (ON ACTIVE CASES)
SUMMARY DESCRIPTION
+---------+----------+------------+------------+
| CLUSTER | COUNT
|
WEIGHT
|
CONTENT |
+---------+----------+------------+------------+
|
aa1a |
2
|
2.00
|
1 TO
2 |
|
aa2a |
12
|
12.00
|
3 TO 14 |
|
aa3a |
2
|
2.00
| 15 TO 16 |
+---------+----------+------------+------------+
COORDINATES AND TEST-VALUES BEFORE CONSOLIDATION
AXES 1 A 4
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CLUSTERS
|
TEST-VALUES
|
COORDINATES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LABEL
COUNT ABS.WT. |
1
2
3
4
0
|
1
2
3
4
0
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CUT "a" OF THE TREE INTO
3 CLUSTERS
|
|
|
| aa1a - Cluster 1 / 3
2
2.00 | -0.5
3.1 -0.8 -0.9
0.0 | -0.58
1.61 -0.28 -0.11
0.00 |
3.02 |
| aa2a - Cluster 2 / 3
12
12.00 |
3.1 -1.4
0.6
0.5
0.0 |
0.82 -0.16
0.04
0.01
0.00 |
0.70 |
| aa3a - Cluster 3 / 3
2
2.00 | -3.6 -1.2
0.1
0.3
0.0 | -4.33 -0.64
0.03
0.03
0.00 |
19.16 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
CLUSTERING CONSOLIDATION
AROUND CENTERS OF THE
3 CLUSTERS ACHIEVED BY 10 ITERATIONS WITH MOVING CENTERS
INTER-CLUSTER INERTIA INCREASE
+-----------+---------------+---------------+---------------+
| ITERATION | TOTAL INERTIA | INTER-CLUSTER |
RATIO
|
|
|
|
INERTIA
|
|
+-----------+---------------+---------------+---------------+
|
0
|
4.00000 |
3.29595 |
0.82399 |
|
1
|
4.00000 |
3.35934 |
0.83984 |
|
2
|
4.00000 |
3.35934 |
0.83984 |
|
3
|
4.00000 |
3.35934 |
0.83984 |
+-----------+---------------+---------------+---------------+
STOP AFTER ITERATION 3. RELATIVE INCREASE OF INTER-CLUSTER INERTIA
WITH RESPECT TO THE PREVIOUS ITERATION IS ONLY 0.000 %.
INERTIA DECOMPOSITION
COMPUTED ON
4 AXES.
+------------------+-----------------+-------------+-------------------+-----------------+
|
|
INERTIAS
|
COUNTS
|
WEIGHTS
|
DISTANCES
|
| INERTIAS
| BEFORE
AFTER |BEFORE AFTER | BEFORE
AFTER | BEFORE
AFTER |
+------------------+-----------------+-------------+-------------------+-----------------+
|
|
|
|
|
|
| INTER-CLUSTER
| 3.2960
3.3593 |
|
|
|
|
|
|
|
|
|
| INTRA-CLUSTER
|
|
|
|
|
|
|
|
|
|
|
| CLUSTER
1 / 3 | 0.0509
0.1317 |
2
3 |
2.00
3.00 | 3.0174
1.9186 |
| CLUSTER
2 / 3 | 0.5265
0.3822 |
12
11 |
12.00
11.00 | 0.6979
0.8789 |
| CLUSTER
3 / 3 | 0.1267
0.1267 |
2
2 |
2.00
2.00 |19.1629 19.1629 |
|
|
|
|
|
|
| TOTAL INERTIA
| 4.0000
4.0000 |
|
|
|
+------------------+-----------------+-------------+-------------------+-----------------+
RATIO INTER INERTIA / TOTAL INERTIA) : BEFORE .. 0.8240
AFTER .. 0.8398
COORDINATES AND TEST-VALUES AFTER CONSOLIDATION
AXES 1 A 4
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CLUSTERS
|
TEST-VALUES
|
COORDINATES
|
|
|---------------------------------------------|-------------------------------|------------------------------------|----------|
| IDEN - LABEL
COUNT ABS.WT. |
1
2
3
4
0
|
1
2
3
4
0
| DISTO. |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
|
CUT "a" OF THE TREE INTO
3 CLUSTERS
|
|
|
| aa1a - Cluster 1 / 3
3
3.00 | -0.5
3.2
0.2 -0.7
0.0 | -0.43
1.31
0.05 -0.06
0.00 |
1.92 |
| aa2a - Cluster 2 / 3
11
11.00 |
2.9 -1.8 -0.2
0.4
0.0 |
0.91 -0.24 -0.02
0.01
0.00 |
0.88 |
| aa3a - Cluster 3 / 3
2
2.00 | -3.6 -1.2
0.1
0.3
0.0 | -4.33 -0.64
0.03
0.03
0.00 |
19.16 |
+---------------------------------------------+-------------------------------+------------------------------------+----------+
COMPOSITION OF: CUT "a" OF THE TREE INTO
3 CLUSTERS
Cluster 1 / 3
SS
MC
IF
Cluster 2 / 3
SB
WSB
JRC
JRH
SJ
CR
UO
LO
DP
PZ
AF
Cluster 3 / 3
GH
GL
MEMBERSHIP OF EACH CASE TO : CUT "a" OF THE TREE INTO
3 CLUSTERS
SS
: 1 SB
: 2 WSB : 2 JRC : 2 JRH : 2 SJ
: 2
CR
: 2 UO
: 2 LO
: 2 DP
: 2 PZ
: 2 MC
: 1
IF
: 1 AF
: 2 GH
: 3 GL
: 3
CLUSTERS REPRESENTATIVES
CLUSTER
1/ 3
COUNT:
3
-----------------------------------------------------------------------------|RK | DISTANCE | IDENT.
|
+---+-----------+------------------------------------------------------------+
| 1|
0.30166|SS
|
| 2|
0.86216|IF
|
| 3|
0.94386|MC
|
+---+-----------+------------------------------------------------------------+
CLUSTER
2/ 3
COUNT:
11
------------------------------------------------------------------------------

|RK | DISTANCE | IDENT.


|
+---+-----------+------------------------------------------------------------+
| 1|
0.02829|CR
|
| 2|
0.15008|DP
|
| 3|
0.19373|PZ
|
| 4|
0.21049|SJ
|
| 5|
0.38784|WSB
|
| 6|
0.38977|JRC
|
| 7|
0.38977|JRH
|
| 8|
0.66536|UO
|
| 9|
0.66934|LO
|
| 10|
1.39576|AF
|
+---+-----------+------------------------------------------------------------+
CLUSTER
3/ 3
COUNT:
2
-----------------------------------------------------------------------------|RK | DISTANCE | IDENT.
|
+---+-----------+------------------------------------------------------------+
| 1|
1.01356|GH
|
| 2|
1.01356|GL
|
+---+-----------+------------------------------------------------------------+
DISTANCE'S MATRIX BETWEEN CLUSTERS
|
1
2
3
-----+--------------------------1 |
0.000
2 |
2.054
0.000
3 |
4.360
5.251
0.000
-----+--------------------------|
1
2
3

Você também pode gostar