Você está na página 1de 19

Betsab Prez e Isabel Molina

Ejemplo:
j p ANLISIS DE COMPONENTES PRINCIPALES

Una empresa especializada en el diseo de automviles de turismo


d
desea estudiar
t di cules
l son los
l d
deseos d l pblico
del bli que compra
automviles. Para ello, disea una encuesta con 10 preguntas donde
se le pide a cada uno de los 20 encuestados que valore de 1 a 5 si
una caracterstica es o no muy importante (5=muy importante,
4=importante, 3=regular importancia, 2=poco importante, 1=no es
nada importante).
p ) Las 10 caractersticas a valorar son: p precio,
financiacin, consumo, combustible, seguridad, confort, capacidad,
prestaciones, modernidad y aerodinmica. Se desea realizar un
Anlisis de Componentes Principales para extraer unos factores
adecuados de los datos que resuman correctamente la informacin
de stos y que permitan extraer conclusiones interesantes.
Componentes
p Principales:
p

Nos permite transformar las variables originales


(X), en general correladas, en nuevas variables
incorreladas (Z), facilitando su interpretacin.

De modo ideal, se busca un nmero menor de


variables que sean combinacin lineal de las
originales y que estn incorreladas, recogiendo la
mayor
y p parte de la informacin o variabilidad
de los datos.
Abrir los datos en SPSS.. (paso 1 al 3)

EJEMPLO AUTOMOVILES DE TURISMO (texto)

Datos originales:
g X=
Los datos originales tienen escala ordinal
ordinal ,
los nmeros del 1 al 5 representan una
graduacin de menos
menos inters
inters a mayor
mayor inters
inters
(las trataremos como numricas)

Ejecutar todas las salidas en SPSS

Men Inicio->Programas->SPSS Inc->PASW Statistics


18

Analizar -> Reduccin de dimensionalidad -> Factor


Media Desviacin anlisis
tpica
Val.Preci 3.70 1.342 20
Val.Fina 3.40 1.635 20
Estadsticos Val.Cons 3.50 1.192 20
descriptivos: Val.Comb 2.80 1.576 20
Val.Segu 3.70 .923 20
Val.Conf 3.70 1.174 20
Val.Capa 3.65 1.268 20
Val.Prest 2.85 1.387 20
Val.Mode 2.80 1.473 20
Val.Aero 2.65 1.348 20

Para los encuestados, las valoraciones del precio, la


seguridad el confort y la capacidad son mayores
seguridad,
que las del resto.
Matriz de correlaciones
V l P i Val.Fina
Val.Preci V l Fi Val.Cons
V lC V l C b Val.Segu
Val.Comb V lS V l C f Val.Capa
Val.Conf V lC V l P t Val.Mode
Val.Prest V l M d Val.Aero
V lA
Val.Preci 1.000 .873 .823 .816 -.501 -.194 .213 -.648 -.645 -.497
Val.Fina .873 1.000 .729 .829 -.439 -.071 .249 -.784 -.752 -.697
Val Cons
Val.Cons .823
823 .729
729 1 000 .812
1.000 812 -.478
478 -.226
226 .192
192 -.557
557 -.630
630 -.540
540
Val.Comb .816 .829 .812 1.000 -.550 -.262 .174 -.737 -.789 -.654
Val.Segu -.501 -.439 -.478 -.550 1.000 .738 .175 .292 .341 .123
Val Conf
Val.Conf -.194
194 -.071
071 -.226
226 -.262
262 .738
738 11.000
000 .421
421 .132
132 .055
055 -.236
236
Val.Capa .213 .249 .192 .174 .175 .421 1.000 -.301 -.180 -.414
Val.Prest -.648 -.784 -.557 -.737 .292 .132 -.301 1.000 .886 .730
Val Mode
Val.Mode -.645
645 -.752
752 -.630
630 -.789
789 .341
341 .055
055 -.180
180 .886
886 11.000
000 .785
785
Val.Aero -.497 -.697 -.540 -.654 .123 -.236 -.414 .730 .785 1.000

El precio,
precio la financiacin,
financiacin el consumo y el tipo de
combustible estn bastante correladas.
Tambin las prestaciones, la modernidad
y la aerodinmica.

Tiene sentido Comp. Principales


(correlaciones en valor absoluto)
Prueba de Bartlett
El test nos sirve para comprobar que las correlaciones
entre las variables son distintas de cero de modo
significativo.
i ifi ti

En general,
general el determinante de la matriz nos da una
idea de la correlacin generalizada entre todas las
variables.
Var. Correladas determinante es menor que uno
Var. Incorreladas determinante es uno

Quisiramos rechazar..
En SPSS
SPSS, tenemos:
tenemos

KMO y prueba
b dde B
Bartlett
tl tt
Medida de adecuacin muestral de
.700
Kaiser Meyer Olkin
Kaiser-Meyer-Olkin.
Chi-cuadrado
Prueba de esfericidad de Bartlett 163.466
aproximado
gl 45
Sig. .000

Si el p-valor (llamado Sig


Sig. en la tabla) es
menor que 0.05, se rechaza al 95% de
confianza la hiptesis
p de qque las variables
son incorreladas, es decir, se considera que
las variables son correladas.
Varianza total explicada (parte 1)
1
1 3 4
Autovalores de la
matriz de covarianzas
= varianza de las c.p.
2
2
En este ejemplo:
n i=18.126
3
% varianza i =
(i/ n i) X 100
4
% acumulado =
i-1 (% varianza i )
Varianza total explicada (parte 2)

Con dos
componentes se
explica el 79%
de la variabilidad
total
Seleccin de las componentes

Tres criterios:

a) Seleccionar un nmero de componentes tales que


en conjunto
j recojan
j un p
porcentaje
j de variabilidad de
al menos un 75% .

En nuestro ejemplo tenemos el 79% tomando las


dos primeras componentes.

b) Seleccionar las componentes con i (varianzas de


las componentes)
p ) mayores
y que el p
q promedio.

promedio(i) = 1/p * p i
b) Grfico de Sedimentacin

El tercero ya aporta poco,


nos qquedamos con dos
Magnitud componentes
del autovalor

Nmero del componente (o valor propio)


Comunalidades
Comunalidades
Bruta Reescalada
1 2 3 1 Elementos de la
Inicial Extraccin Inicial Extraccin
diagonal SY
Val.Preci 1,800 1,414 1,000 ,786
V l Fi
Val.Fina 2 674
2,674 2 328
2,328 1 000
1,000 ,871
871
((varianzas)
a a as)
Val.Cons 1,421 1,002 1,000 ,705
Val.Comb 2,484 2,218 1,000 ,893
2 Cantidad de varianza
Val.Segu ,853 ,606 1,000 ,711 de las variables
Val.Conf 1,379 1,103 1,000 ,800 originales que
Val.Capa 1,608 ,926 1,000 ,576 preservan las k=2
p
Val.Prest 1,924 1,503 1,000 ,781
componentes
Val.Mode 2,168 1,740 1,000 ,803
Val.Aero 1,818
, 1,467
, 1,000
, ,,807
seleccionadas.
3 P
Proporcin
i explicada:
li d
Mtodo de extraccin: Anlisis de Componentes principales.
(3) = (2) / (1)
La comunalidad asociada a una variable original
es la proporcin de variabilidad de dicha variable
explicada por las k componentes seleccionadas.
k-componentes seleccionadas
Matriz de componentesa
1 Bruta 2 Reescalada
1 La componente bruta
Componente Componente
1 2 1 2
corresponde con la
Val.Preci 1,167 -,230 ,870 -,171 operacin:
Val.Fina 1,526 ,005 ,933 ,003
Val.Cons ,977 -,217 ,820 -,182 aij = (j)^(1/2) * aij
Val Comb
Val.Comb 1 464
1,464 -,271
271 ,929
929 -,172
172
Val.Segu -,443 ,640 -,480 ,693
Val.Conf -,168 1,037 -,143 ,883 2
Val Capa
Val.Capa ,369
369 ,889
889 ,291
291 ,701
701
Val.Prest -1,215 -,164 -,876 -,118
La componente reescalada
Val.Mode -1,312 -,137 -,891 -,093 corresponde con la
Val.Aero -1,061 -,584 -,787 -,433 operacin:
Mtodo de extraccin: Anlisis de componentes
principales.
a. 2 componentes t d
t extrados aij = componente bruta / SYi
Grfico de componentes: Es un grfico de las
componentes reescaladas del cuadro anterior

La componente
p 1:

Separa a los individuos


que valoran
l ms
lla
financiacin, combustible,
precio y consumo,
consumo

de los q
que valoran ms la
modernidad, prestaciones
y aerodinmica.
La componente
p 2:

Separa los individuos


preocupados por el
confort, capacidad y
seguridad de los que no
seguridad,
estn preocupados por
esto.
Grfico de individuos en el espacio de las componentes: Se
representa a los individuos en los ejes de las componentes
componentes.

2 Individuos ppreocupados
p
por la financiacin,
5

1 11 13
17
20
1216
combustible, precio y
1

14
15 9
19
consumo.
REGR fact or score 2 for analysis

0 4 76
2

8
Valoran ms la
-1 1
10 modernidad, prestaciones
3

-2
18
y aerodinmica.

-3 Preocupados por el
-2.0
20 -1.5
15 -1.0
10 -.5
5 00
0.0 .5
5 10
1.0 15
1.5
f t capacidad
confort, id d y
REGR factor score 1 for analysis 1
seguridad.

Fin

Você também pode gostar