Você está na página 1de 15

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Anlise Factorial
O propsito essencial da anlise factorial descrever, se possvel, a estrutura
de covarincias entre as variveis em termos de um n menor de variveis (no
observveis) chamadas factores. Por outras palavras, a anlise factorial estuda
os inter-relacionamentos entre as variveis, num esforo para encontrar um
conjunto de factores (em menor n que o conjunto de variveis originais) que
exprima o que as variveis originais partilham em comum.

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Basicamente o modelo de anlise factorial motivado pelo seguinte:

Suponhamos que as variveis podem ser agrupadas tendo em conta as


correlaes entre elas. Isto , todas as variveis de um dado grupo esto
fortemente correlacionadas entre si, mas tm correlaes relativamente
pequenas com variveis de outro grupo. concebvel que cada grupo de
variveis represente um factor, factor esse que responsvel pelas
correlaes observadas.

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Em geral o primeiro passo a dar neste tipo de anlise, consiste no exame das
relaes entre as variveis utilizando o coeficiente de correlao como medida
de associao entre cada par de variveis. A matriz de correlaes poder
permitir identificar subconjuntos de variveis que esto muito correlacionadas
entre si no interior de cada subconjunto, mas pouco associados a variveis de
outros subconjuntos. Neste caso a aplicao da anlise factorial permitir-nos-
concluir se possvel explicar este padro de correlaes atravs de um menor
n de variveis - os factores.

De forma resumida, podemos dizer que a anlise factorial uma tcnica


estatstica usada para identificar um nmero relativamente pequeno de factores
que podem ser usados para identificar relacionamentos entre um conjunto de
muitas variveis inter-relacionadas entre si.
3

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

EXEMPLO:
Suponha que um director de uma fbrica de automveis pretende entender o
que leva um consumidor a escolher um modelo especfico de automvel, isto ,
quais os factores que levam os consumidores a escolher um modelo especfico
de automvel. Para isso foram consideradas as opinies de um conjunto de
consumidores acerca da importncia das seguintes variveis para a escolha de
um automvel:
CRB - custos de reparao baixos VC - variedade de cores disposio
EIA - espao interior amplo

BC - bom consumo

FM - fcil de manejar

DM - design moderno

BM - bom motor

PRA - preo de revenda alto

C - confortvel

AS - aparncia suave

FC - fcil de conduzir

MA - modelo atraente

MG - mala grande

FE - fcil de estacionar
4

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

difcil avaliar 14 variveis separadamente ou desenvolver planos de aco


tendo em conta tantas variveis.
Em vez disso seria ideal saber como pensam os consumidores em termos de
dimenses (factores) mais gerais.
Para identificar estas dimenses foi aplicada a anlise factorial, cujos resultados
sugerem que as 14 variveis podem ser caracterizadas por
4 factores (I, II, III e IV) relacionados com
I

l conforto

II

l custo/eficincia

III l estilo
IV l facilidade de manipulao

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL


CRB

VC
FM

DM

MA

AS

FC
FE

MG

EIA
CRB
PRA

II

MG

BM
BC

PRA

BM

EIA

BC

I
C

III
VC

FM

IV

FE

FC

DM

AS
MA
6

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

MODELO FACTORIAL (ORTOGONAL)


T

Seja X =(X1, X2,...,Xp) um vector aleatrio de mdia PT=(P1, P2,..., Pp) e matriz de
covarincias 6.
Modelo de anlise factorial:
X1-P1= l11F1+ l12F2 +...+ l1mFm +H1
X2-P2= l21F1+ l22F2 +...+ l2mFm +H2


Xp-Pp= lp1F1+ lp2F2 +...+ lpmFm +Hp


em notao matricial:

X-P = LF + H
(px1)

(pxm)

(px1)
7

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

onde:
x lij - loading (ou peso) da varivel Xi no factor Fj
l11  l1m

x L= 
 - matriz de loadings
l p1  l pm
T

x F = >F1 F2  Fm @ - vector de variveis aleatrias no observveis


chamadas factores comuns
T

x H = >H1 H 2  H m @ - vector de variveis aleatrias no observveis


chamadas factores especficos ou factores nicos

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Note que:
i) o factor especfico Hi est associado apenas com a varivel Xi;
ii) os p desvios X1-P1, X2-P2,..., Xp-Pp so expressos em termos de p+m

variveis no observveis: F1, F2,...,Fm, H1, H2,..., Hp.


Pressupostos:

E(F1 ) 0
E(F )
2
= 0
E(F) =
 
E(F ) 0
m

1 0  0
0 1  0
T

Cov(F) = E(FF ) = I =
   

0 0  1

os
factores
independentes entre si

so

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

E( 1 ) 0
E( )
2
= 0
E(H) =
 
E( ) 0
p

\1 0
0 \
2
T
Cov(H) = E(HH ) = < =



0
0

F e H so independentes

 0
 0
m matriz diagonal
 

 \p

logo
Cov(Hi, Fj) = E(Hi Fj) - E(Hi) E(Fj) = 0,
e
Cov( 1,F1 ) Cov( 1,F2 )
Cov( ,F ) Cov( ,F )
2
1
2
2
Cov(H, F) = E(H FT) =



Cov( ,F ) Cov( ,F )
p
1
p
2

i=1,2,...p

j=1,2,...m

 Cov( 1,Fm )
 Cov( 2 ,Fm )
=0



 Cov( p ,Fm )
10

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Estrutura de covarincias para o modelo:


1.

= Cov(X) = LLT + <

i.e.

2
Var(Xi) = l i12  l i22    l im
 <i
,


h i2

varincia
especfica

comunalidade

Cov(Xi,Xk) = li1 lk1 + li2 lk2 +}+ lim lkm


2.

Cov(X,F) = L

i.e.

Cov(Xi,Fj) = lij

11

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Em que:

h i2 comunalidade

p
poro da Var(Xi)

que pode ser atribuda aos factores comuns


explicada pelos factores comuns
que partilhada com todas as outras variveis

<i varincia especifica


p
poro da Var(Xi) que especfica de Xi e que no est associada com
outras variveis
indica at que ponto os factores comuns falham na explicao da

varincia total da varivel

l ij2 contribuio do factor Fj para a varincia de Xi


12

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Ambiguidade associada ao modelo:


A matriz L de loadings determinada a menos de uma transformao
ortogonal.

Se L a matriz de loadings associada a um modelo factorial e T uma matriz


ortogonal (i.e., tal que TTT=I), ento a matriz L* = LT tambm uma matriz
admissvel para o modelo factorial:
* *
T
X - P = LF + H = LT
T
F
+
H
=
L
F +H
,

com
F* e H independentes
E(F*) = 0
E(H) = 0

e
e

Cov(F*) = I
Cov(H) = <

As comunalidades dadas na diagonal de LLT e de L*(L*)T no so afectadas


pela escolha de T.
13

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Mtodos de Estimao:

Dadas n observaes das p variveis correlacionadas X1, X2,...,Xp, a anlise


factorial procura responder questo:
Ser que o modelo factorial ortogonal com um pequeno n de factores
representa adequadamente os dados?

Para tal, que tentar verificar a estrutura de covarincias do modelo.

Quando os elementos fora da diagonal principal da matriz amostral de


covarincias S forem muito pequenos, ou no caso da matriz amostral de
correlaes R forem prximos de zero, as variveis no esto relacionadas ou
esto pouco relacionadas e a anlise factorial no ser til.
14

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Nestas circunstncias os factores especficos tm um papel dominante e o


objectivo principal da anlise factorial determinar alguns factores comuns.

Por isso, uma vez calculada a matriz amostral de correlaes, se existirem


variveis no correlacionadas em nmero elevado dever ser testada a validade
de aplicao deste tipo de anlise.

15

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Existem vrios mtodos de estimao (ou de extraco de factores), de entre os


quais:
mtodo das componentes principais - principal components;
mtodo da mxima verosimilhana - maximum likelihood;
mtodo dos mnimos quadrados - unweighted least squares (ULS) e

generalized least squares (GLS);


principal-axes factoring;
mtodo alfa.

16

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Mtodo das componentes principais:

um mtodo para estimar L, que se baseia no seguinte:


1

T
2
2 T
PD
,D

P CC
C

onde:
P

>a

CT

a2  ap @

matriz ortogonal cujas colunas so os vectores


prprios de

1
0

0

0
2

0






Oi

m i-simo maior valor prprio da matriz

ai

m vector prprio normalizado associada a Oi

0
2

0




1
0

0
0

 

 p

1
2

0


17

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

As varincias especficas so nulas se so considerados tantos factores como


variveis. Mas desejvel ter m<p factores.
Um procedimento possvel quando os ltimos p-m valores prprios so
pequenos negligenciar a contribuio de O m 1a m 1a mT 1    O p a p a pT para .
Desprezando as ltimas colunas da matriz C, tem-se a matriz L:

>

C= O 1 a1 

Op ap

o L= > O 1 a1 

Om am @ ,

com m < p

= CCT = O 1a 1a 1T    O m a m a mT  O m 1a m 1a mT 1    O p a p a pT


# LLT + <
onde i

Var(X i )  O i a ij2
j 1

2
O i a ij

j m 1

18

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Soluo das componentes principais do modelo factorial:

~
L

>

O1 a 1

O2a2

Omam @

i.e.

~
lij

O j a ij

~
1 0  0
~

m ~
elementos da
~ 0 2  0
~
~~ T
onde i s ii  lij 2 m diagonal de S - L

L

j 1
  

~
0  p
0
~
~
~
~
hi2 li12  li22    lim2
m soma dos quadrados da linha i de L
m

O j a ij

m exactamente a comunalidade do modelo 1 da ACP

j 1

~
poro da Var(Xi) explicada pelos factores comuns onde lij 2

O j a ij2 a

contribuio do j-simo factor comum para a Var(Xi)


Nota: Usamos S estimativa de , mas tambm se pode fazer para R estimativa de U.
19

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Escolha do n de factores:

Dado que o objectivo identificar m factores que expliquem a estrutura de


covarincias, devemos escolher m tal que, o que se despreza na matriz de
covarincias estimadas seja quase nulo, i.e.,

~~
~
S - L L T  < # 0 m matriz residual

Os elementos diagonais so nulos, mas se o que est fora da diagonal tambm


for prximo de zero, ento o valor de m considerado apropriado:
soma dos quadrados das
~~
~ d
entradas de S - L L T  <

O2m1    O2p

um valor baixo para a soma dos quadrados dos valores


prprios rejeitados implica um valor baixo para a soma
dos quadrados dos erros cometidos na aproximao
20

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Outra maneira de determinar m:


Oj

Oj

para uma anlise


factorial de S

s11  s22    spp

Oi
i 1

Oj

para uma anlise


factorial de R

proporo da varincia total amostral


explicada pelo j-simo factor

Escolhemos m, de modo a que uma proporo suficiente da varincia total amostral


seja explicada.

Outras regras:
valor prprio maior que 1 (anlise a partir de R)
scree-test

21

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Resumindo, a soluo apresentada por este mtodo escolhe para os m

factores as primeiras m componentes principais divididas pela raiz quadrada da


sua varincia
Fj

Yj
Oj

Yj

j=1,,m

Var(Yj )

Estimando os loadings da seguinte maneira:

lij =

O j a ij

estamos a considerar o modelo


Xi

O 1 a i1F1    O m a imFm    O P a iPFP





estimativa dos
factores especficos H i

e portanto o modelo factorial estimado :


m

Xi

l ijFj  i , i = 1,,p
j 1

com

lij =

O j a ij
22

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Neste modelo estimado, cada factor comum tem varincia unitria, e os factores
so no correlacionados.

Mais, os factores comuns so no correlacionados com os factores especficos.

No entanto, note-se que a covarincia entre Hi e Hk


p

Cov( i , k )

a ij a kj j

izk

j m 1

Como estas covarincias no so necessariamente nulas, isto constitui uma


violao dos pressupostos originais do modelo.

23

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

TABELA DE RESULTADOS

Anlise feita a partir da matriz de covarincias amostral S.


Loadings

O j aij

lij =

Y1
X1

O1 a11


Xp

Soma dos quadrados por


coluna = Oj

Yn

m a1m

O1 a p1

Soma dos quadrados por linha


Comunalidades hi

ja1j2
j 1


}

m a pm

h12


m

japj2

hp2

j 1

total em linha = total em coluna


O1

Om

O1+}+ Om =

j 1

j 1

ja1j2 + }+ japj2

proporo da varincia total


explicada pelos m factores
proporo da varincia
total amostral explicada
pelo j-simo factor

1
p

i
i 1

i
i 1

j
j 1
p

i
i 1

24

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Este quadro de resultados, resume o essencial de uma aplicao da ACP ou da


Anlise Factorial (AF) pelo mtodo das componentes principais.

Apesar de ACP e AF se tratarem de duas tcnicas conceptualmente diferentes,


na prtica os resultados da ACP e da AF pelo mtodo das componentes
principais, podem ser resumidos na tabela anterior, sendo vlidas as
respectivas interpretaes.

Se a anlise feita a partir da matriz de correlaes R, o quadro o mesmo,


mas Oj e aj so extrados da matriz R.

25

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

EXEMPLO

Consideremos novamente o exemplo (exerccio 6).


15 alunos de uma determinada escola foram classificados a 6 disciplinas
Na ACP identificaram-se 2 componentes principais, a reter:
1 Factor: Factor Geral de Inteligncia
2 Factor: Factor Matemtica / no Matemtica

Se aplicarmos a AF pelo mtodo das componentes principais, os factores


comuns podem ser obtidos dividindo as 2 componentes principais pela raiz
quadrada dos valores prprios:

F1

F2

Y1
O1
Y2
O2

0.33 u X 1 0.41u X 2  0.44 u X 3  0.44 u X 4  0.39 u X 5  0.42 u X 6


3.87
0.53 uX 1 0.42 u X 2  0.3 u X 3  0.31u X 4  0.45 u X 5  0.39 u X 6
1.55
26

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

As variveis podem-se escrever em funo dos factores da seguinte maneira:


X1

0.33
0.53
3.87


u

u F1  1.55


u

u F2  1
0.65

X2

0.66

0.41
0.42
3.87


u

u F1  1.55


u

u F2  2
0.81

X6

0.52


0.42
1.55
3.87


u

u F1 


u
0.39
u F2  1
 0.49

0.83

com i

3 a i3 F3    6 a i6 F6
,
,
Y3

Y6

O quadro de resultados do slide 4 da seco anterior resume o essencial da AF


pelo mtodo das componentes principais.
Este exemplo ilustra bem o motivo pelo qual existe dificuldade na distino das
duas tcnicas.
27

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

ESTIMAO DOS VALORES DOS FACTORES (FACTOR SCORES)

Ao contrrio do que se passa com a ACP, onde os scores das componentes


principais so determinados, os scores dos factores na AF tm de ser
estimados, isto resulta do facto de no modelo da AF existirem mais parmetros
a estimar do que valores observados.
Existem diversos mtodos para estimao dos scores dos factores, sendo os
mais usados:
Mtodo de Bartlet ou mtodo dos mnimos quadrados ponderados;
Mtodo de Thompson ou mtodo de regresso.

28

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FACTORIAL

Concluso:
a ACP procura resumir a informao presente num conjunto de variveis

correlacionadas atravs de um modelo matemtico concreto, bem definido


e conduz geralmente a uma nica soluo;
a AF procura encontrar a explicao, sobre a forma de um ou mais

factores latentes, para as relaes existentes entre as variveis e


passvel de vrias solues igualmente aceitveis.

29

Você também pode gostar