Você está na página 1de 7

ANLISE DE COMPONENTES PRINCIPAIS E ANLISE FATORIAL

Introduo
Considere o seguinte cenrio:
- Um analista financeiro est interessado em determinar a
sade financeira de uma determinada indstria. Foi feita
uma pesquisa, a qual permitiu identificar 120 variveis
financeiras que poderiam ser usadas para levar a cabo tal
propsito. Obviamente, seria intratvel interpretar 120
indicadores financeiros para ter acesso sade financeira
de uma firma. O trabalho do analista ser simplificado se
estas 120 variveis puderem ser reduzidas a um nmero
inferior de novas variveis.

Tal como no exemplo anterior, em muitos estudos, o


nmero de variveis consideradas demasiado grande
para
ser
tratvel,
tornando-se,
muitas
vezes,
absolutamente necessrio reduzir a dimenso da anlise
para que a situao se torne compreensvel, isto , torna-se
necessrio usar uma tcnica de reduo de dados.
A ANLISE FATORIAL (ou Anlise de Fatores Comuns) e
a ANLISE DECOMPONENTES PRINCIPAIS so tcnicas
estatsticas cujo objetivo representar ou descrever um
nmero de variveis iniciais a partir de um menor nmero
de variveis hipotticas (os fatores / componentes
principais). Isto , permite identificar novas variveis (os
fatores / componentes principais), em menor nmero que o
conjunto inicial, mas sem perda significativa da informao
contida neste conjunto.

O propsito geral destas tcnicas encontrar uma maneira


de condensar a informao contida num conjunto de
variveis originais, num conjunto menor de variveis
perdendo o mnimo possvel de informao.
Tratam-se, portanto, de tcnicas de reduo de dados que
investigam as correlaes entre as variveis e os

descrevem, se possvel, em termos de um menor nmero


de variveis chamadas fatores/componentes principais.
A Anlise de Componentes Principais considerada por
muitos autores um dos muitos tipos de Anlise Fatorial. de
salientar, no entanto, que apesar das vrias tentativas para
esclarecer o assunto, ainda existe muita confuso no que
diz respeito distino entre Anlise Fatorial e Anlise de
Componentes Principais. Uma das razes que poder
contribuir para tal o fato de que em muitos pacotes
estatsticos (como, por exemplo, o SPSS) , a Anlise de
Componentes Principais pode ser considerada como um
procedimento de Anlise Fatorial.
De fato, embora ambos os tipos de anlise permitam uma
reduo de dados, a Anlise Fatorial est mais preocupada
em explicar a estrutura de covarincias entre as variveis.
Contrariamente, o objetivo da Anlise de Componentes
Principais, no explicar as correlaes entre as variveis,
mas apenas encontrar combinaes lineares das variveis
iniciais que expliquem o mximo possvel da variao
existente nos dados e os permitam descrever e reduzir.
A ANLISE DE COMPONENTES PRINCIPAIS (ACP)
constitui um mtodo estatstico multivariado que permite
transformar
um
conjunto
de
variveis
iniciais
correlacionadas entre si, num outro conjunto de variveis
no correlacionadas (independentes / ortogonais), as
chamadas componentes principais, que resultam de
combinaes lineares do conjunto inicial.
O propsito desta anlise determinar as componentes
principais de forma a explicar o mais possvel da variao
total dos dados com o menor nmero possvel de
componentes.
As componentes principais so calculadas por ordem
decrescente de importncia, isto , a primeira explica o
mximo possvel da varincia dos dados originais, a
segunda explica o mximo possvel da varincia ainda no
explicada, e assim por diante. A ltima componente
principal ser a que menor contribuio d para a
explicao da varincia total dos dados originais. Porque
cada combinao linear explica o mximo possvel da

varincia no explicada e ter de ser ortogonal a qualquer


outra combinao j definida, o conjunto de todas as
combinaes encontradas constitui uma soluo nica.

Exemplo 1:
Este exemplo uma aplicao de um estudo desenvolvido
por P.
Doyle e J. Saunders (1985) a uma empresa industrial - a
Boliet - cuja atividade principal era o processamento de
pasta a partir de resina de pinheiro, que era posteriormente
vendida como matria prima a fabricantes de papel e
resinas sintticas. A especializao da Boliet visava
fundamentalmente o processamento de produtos derivados
de resina que lhes abriria um importante mercado
especializado consumidor de colas industriais.
A pesquisa feita envolveu a coleta de informao dos
consumidores e das empresas concorrentes, e permitiu
identificar 6 variveis especficas que afetavam a escolha
do produto por parte do consumidor e 4 variveis afetas s
empresas:
123456-

suavidade
viscosidade
estabilidade na cor
cor inicial
aderncia
preo

1- distncia ao fornecedor
2- servio de apoio
3- reputao
4- cobertura geogrfica

Foi sobre este conjunto de 10 variveis que se aplicou a


ACP, tendo-se extrado 4 fatores explicando 78% da
varincia inicial e interpretados do seguinte modo:
FATOR I: Descreve o poder do fornecedor;
FATOR II: Campo de aplicao do produto;
FATORES III e IV: Caractersticas tcnicas que definam o
uso do produto.

(Reis, E. (1993). Anlise fatorial das componentes principais: um mtodo de


reduzir sem perder informao, Temas em Mtodos Quantitativos para
Gesto n2, Giesta ISCTE)

Exemplo 2: Como que os consumidores avaliam os


bancos?
Foi pedido aos consumidores inquiridos que classificassem
a importncia de 15 atributos bancrios. Foi usada uma
escala de 1 a 5 pontos, onde 1 significa no importante e 5
significa muito importante. Os dados foram analisados
atravs da anlise de componentes principais.
A soluo resultou em quatro fatores, que foram designados
por servios tradicionais, convenincia, visibilidade e
competncia.
Os servios tradicionais incluem taxas interessantes em
emprstimos, reputao na comunidade, preos baixos nos
servios bancrios, atendimento personalizado, extratos
mensais de leitura fcil e facilidade na obteno de
emprstimos.
Convenincia inclui localizao dos caixas e localizao de
caixas terminais, rapidez do servio e horrio conveniente
do banco.
O fator visibilidade inclui recomendaes dos amigos e
familiares,
estrutura
fsica
atraente,
comunidade
envolvente e facilidade na obteno de emprstimos.
Competncia consiste na competncia dos empregados e
as capacidades demonstradas nos servios auxiliares do
banco.
Conclui-se que os consumidores avaliam os bancos usando
os 4 fatores bsicos acima referidos e os bancos devem ser
excelentes nestes fatores para projetarem uma boa
imagem.
Apostando nestes fatores o banco JPMorgan Chase & Co.
tornou-se o segundo maior banco Americano com lucro de
2,26 bilhes de dlares no 1 trimestre de 2005, valor esse
17% superior aos 1,93 bilhes de dlares obtidos no mesmo
perodo em 2004.
(Malhotra, N.K. (2006). Marketing Research: An Applied Orientation, 5
Edition, Person Prentice
Hall, New Jersey)

Exemplo 3: O ndice PSI20 um exemplo de uma


combinao linear das cotaes na bolsa de valores das 20
empresas com maior volume de negcios.
As vantagens de tal ndice so bvias: claramente mais
fcil para o analista de mercados avaliar a evoluo do
mesmo atravs de um ndice do que com 20 variveis que
registam a cotao de 20 empresas.
(Maroco, J. (2003). Anlise Estatstica Com utilizao do SPSS, Edies
Slabo, Lisboa)

OBSERVAES SOBRE A ANLISE FATORIAL


Utilizada para analisar as relaes latentes para um grande nmero de variveis
e verificar se essas relaes podem ser resumidas em um conjunto de dimenses
latentes comuns, chamados de fatores.
Contribuio (carga) de cada varivel ao fator.
Planejamento da Anlise Fatorial
a) Clculo da matriz de correlao.
b) Determinao do nmero de variveis.
c) Tamanho da amostra como funo do nmero de variveis.
Seleo de variveis e medidas.
1) As variveis, geralmente so consideradas como mtricas. Em alguns
casos podem ser consideradas como dicotmicas (0,1).
2) Minimizar o nmero de variveis includas, mas manter um nmero
razovel de variveis por fator.
Tamanho da amostra desejvel > 100 observaes.
Regra: Deve haver 10 vezes mais observaes que o nmero de variveis.
Suposies da Anlise Fatorial
1) Deve haver correlaes suficientes para justificar a Anlise Fatorial.
2) As correlaes parciais entre as variveis devem ser pequenas para haver
fatores latentes.
Verificao da aplicao da Anlise Fatorial
1) A matriz de correlao anti-imagem que o valor negativo da correlao
parcial deve ter valores pequenos.

2) Aplicar o teste de Bartlett de esfericidade que uma medida da


probabilidade de que a matriz de correlao tenha correlaes
significantes em pelo menos algumas variveis.
3) Medida de adequao da amostra (MSA). Varia entre 0 e 1.
MSA>= 0,80 admirvel
MSA>=0,70 e <0,80 mediano
MSA>=0,60 e <0,70 medocre
MSA>=0,50 e <0,60 ruim
MSA<0,50 inaceitvel
O pesquisador deve excluir as variveis inaceitveis.
Critrios de extrao do nmero de fatores
1) Devem explicar o maior montante de varincia.
2) Critrio da Raiz Latente. Cada varivel contribui com um valor 1 do
autovalor (Eigenvalue) total . So considerados apenas os fatores que tem
razes latentes (latent roots) ou autovalores maiores que 1.
3) Critrio a priori. O pesquisador determina o nmero de fatores a extrair e
informa a mquina quando esse nmero j foi extrado. um mtodo til
quando se testa uma teoria de hipteses sobre o nmero de fatores a
serem extrados.
4) Critrio da porcentagem da varincia. Baseada em um critrio de
percentual acumulado da varincia total extrada por fatores sucessivos.
Em Cincias Sociais pode-se considerar a explicao de 60% dos casos.
5) Critrio do Teste Scree. So considerados todos os pontos antes da curva
ficar horizontal.
Cargas Fatoriais (Factor Loading): Correlao de cada varivel com o fator.
Varimax: Maximiza a soma das varincias das cargas da matriz fatorial.
Critrios para a significncia de Cargas Fatoriais (Factor Loadings)
Obs.: depende do tamanho da amostra.
Exemplos:
Carga Fatorial significante
0,30
0,55
0,75

Tamanho necessrio da amostra


350
100
50

Obs.: Um exemplo completo de Anlise Fatorial pode ser obtido no livro:


Anlise Multivariada de Luiz J. Corrar (pg 91), disponvel na biblioteca da
USJT.

Você também pode gostar