Você está na página 1de 4

Resumo de Anlise Fatorial

Gaspar Giacomini gaspargiacomini@gmail.com


Fernanda Romano nandamromano@gmail.com

1) O que Anlise Fatorial?


A Anlise Fatorial uma tcnica de interdependncia que examina as relaes entre as variveis e permite verificar se
elas se agrupam em fatores/dimenses. O objetivo principal da Anlise Fatorial conhecer a estrutura subjacente entre
as variveis da anlise.
Lembre-se de que as tcnicas de interdependncia so aquelas em que NO se classifica uma varivel como a
dependente e as outras como independentes e/ou prognosticadoras, mas que considera todo o conjunto de
relacionamentos das variveis. Frequentemente se fala da Anlise Fatorial como uma tcnica de reduo de variveis.
Contudo, cuidado: no se reduz o nmero de variveis, mas apenas o nmero de dimenses e/ou fatores.
2) Para que serve a Anlise Fatorial?
Existem diversas razes pela qual pode ser adequado utilizar a Anlise Fatorial:

para compreender a estrutura subjacente dos dados (saber como as variveis se comportam com relao aos
construtos).
para ter uma melhor visualizao dos dados e maior facilidade de interpretao dos resultados.
para preparar os dados para o uso de outras tcnicas estatsticas multivariadas subseqentes.
para suportar empiricamente hipteses ou teorias sobre a quantidade de dimenses de um fenmeno e a
maneira como as variveis se agrupam.

3) As 2 grandes famlias de Anlise Fatorial


Existem 2 grandes grupos de Anlise Fatorial: a Anlise Fatorial Exploratria (Exploratory Factor Analysis, ou EFA)
e a Anlise Fatorial Confirmatria (Confirmatory Factor Analysism ou CFA). A principal diferena que, na primeira,
as variveis so testadas todas contra todas para a montagem dos fatores/dimenses; na segunda, o pesquisador tem
interesse em testar empiricamente um conhecimento a priori sobre como as dimenses do fenmeno estudado se
comportam (o que feito com tcnicas mais avanadas como Equaes Estruturais). Como o objeto de estudo da
disciplina de Pesquisa em Marketing a Anlise Fatorial Exploratria, a ela que nos referimos neste resumo.
4) Conceitos importantes para Anlise Fatorial
Vale a pena relembrar alguns conceitos relevantes utilizados na Anlise Fatorial:

Fator: uma dimenso latente que explica as


correlaes entre um conjunto de variveis.
Exemplo: F1 composto por 3 variveis: X1, X2 e X3
Comunalidade: quantidade de varincia que uma
varivel compartilha com todas as demais, ou seja,
quanto da varincia de um item est sendo utilizada na
soluo fatorial. Buscamos uma alta comunalidade alta
(acima de 0,50). No quadro ao lado, verificam-se
comunalidades boas (coluna extraction).
Multicolinearidade: a medida em que uma varivel
pode ser explicada por outras variveis. medida que a
multicolinearidade aumenta, a interpretao dos dados
fica mais complicada, pois fica mais difcil averiguar e
efeito de uma nica varivel.

X1
X2

F1

X3

Communalities
s1 - localizao
s2 - Bandeira/Marca BR
s3 - Aparncia / Visual
s4 - Facilidade de Acesso
s5 - Preo do combustvel
s6 - Espao interno para
manobra

Initial
1,000
1,000
1,000
1,000
1,000

Extraction
,503
,670
,548
,598
,687

1,000

,582

Extraction Method: Principal Component Analysis.

Teste de Esfericidade de Barlett: permite examinar


a hiptese nula de que as variveis no estejam
correlacionadas na populao. Para haver
adequacidade da Anlise Fatorial, preciso rejeitar a
hiptese nula. Logo, queremos um escore alto neste
teste, alm de baixa significncia. No quadro ao
lado, o valor do teste foi de 1050, significativo a
0,000!

KMO and Bartlett's Testa


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Bartlett's Test of
Sphericity

,813

Approx. Chi-Square
df
Sig.

1050,502
210
,000

a. Based on correlations

KMO (Kaiser-Meyer-Olkin): outro ndice para avaliar a adequacidade da Anlise Fatorial. Valores altos
(entre 0,50 e 1,00) indicam que a anlise fatorial adequada; valores baixos (abaixo de 0,50) indicam que a
anlise fatorial no apropriada. No quadro acima, o KMO foi de 0,81 um bom nmero!

Autovalor (Eigenvalue): a varincia total explicada por cada fator. Como os dados so padronizados em Z
(mdia zero e desvio-padro 1), normalmente utiliza-se como critrio de corte autovalores maiores que 1, pois
se espera que um fator responda, no mnimo, pela varincia de 1 item.
Veja na tabela abaixo que a coluna total da esquerda (initial eigenvalues), o componente 1 apresenta um
autovalor de 3,56, o componente 2 de 2,9, o componente 3 de 1,73 etc. Perceba que a linha de corte foi o fator
5, pois, aps ele, os autovalores so menores do que 1. Esses 5 componentes explicam 81,5% da variabilidade
dos dados.
Total Variance Explained

Component
1
2
3
4
5
6
7
8
9
10
11
12
13

Total
3,567
2,998
1,738
1,287
1,005
,619
,551
,447
,281
,201
,166
,131
,009

Initial Eigenvalues
% of Variance Cumulative %
27,439
27,439
23,059
50,498
13,370
63,868
9,902
73,769
7,733
81,502
4,759
86,261
4,242
90,502
3,438
93,941
2,160
96,100
1,544
97,644
1,278
98,923
1,008
99,931
,069
100,000

Extraction Sums of Squared Loadings


Total
% of Variance Cumulative %
3,567
27,439
27,439
2,998
23,059
50,498
1,738
13,370
63,868
1,287
9,902
73,769
1,005
7,733
81,502

Extraction Method: Principal Component Analysis.


a. When components are correlated, sums of squared loadings cannot be added to obtain a total variance.

Carga dos Fatores: a correlao simples entre as


variveis e os fatores. Queremos cargas altas!

Resduos: a diferena entre as correlaes


observadas (que vem dos dados) e as correlaes
reproduzidas (estimadas pela tcnica).

Scree Plot: o grfico dos autovalores x n de


fatores que mostra o momento um fator adicional
passa a ter pouca contribuio incremental.

Confiabilidade: o grau em que uma varivel ou conjunto


de variveis consistente em medir aquilo que se prope a
medir. Em Anlise Fatorial, utilizam-se pelo menos 3
medidas de confiabilidade: (1) o Alpha de Cronbach (para
medir a confiabilidade (consistncia) da escala, (2) a
correlao item-com-itens e (3) a correlao item-com-total.

Reliability Statistics
Cronbach's
Alpha
,897

N of Items
3

Rotation
Sums
Totalof
3,315
2,524
2,054
2,597
1,097

Correlao Parcial: a correlao que permanece inexplicada depois que os efeitos das outras variveis so
considerados. Se houver fatores verdadeiros nos dados, a correlao parcial dever ser pequena. Uma alta
correlao parcial significa que a varivel no est correlacionada com um grande nmero de outras variveis
na anlise (e ns gostaramos que estivesse!). O SPSS prov a matriz de correlao de anti-imagem, que
justamente o valor negativo da correlao parcial.

Validade: o grau em que uma varivel ou conjunto


de variveis representa corretamente o conceito sendo
estudado. Existem pelo menos 3 tipos importantes de
validade:
o Validade Nomolgica, tambm chamada de
validade de face, que representa o grau em
que o uso de uma medida ou conceito est
respaldado pela reviso de literatura ou pela
experincia emprica;
o Validade Convergente, que representa o grau
em que os itens que pertencem a um
determinado construto ou fator esto
correlacionados entre si ( X1, X2 e X3
altamente correlacionadas entre si);
o Validade Discriminante, que representa o
grau que os itens que pertencem a um
construto (ou fator) no esto correlacionados
com os itens de outros construtos (a varivel
X4, ao lado, fere a validade discriminante por
estar correlacionada tanto a F1 quanto a F2).

5) Os 2 mtodos principais para a Anlise Fatorial


Existem dois mtodos principais de Anlise Fatorial: (1) Anlise Fatorial Comum e (2) Anlise de Componentes
Principais. A tabela comparativa abaixo resume as diferenas.
(1) Anlise Fatorial Comum
(2) Anlise de Componentes Principais
(Fatoramento dos Eixos Principais)
Objetiva conhecer a estrutura subjacente pelo Objetiva direcionar a maior parte da varincia
processo tradicional.
para o menor nmero possvel de fatores.
Tem como premissa a normalidade dos dados.
No tem como premissa normalidade dos dados.
o menos utilizado.
o mtodo mais utilizado.
Considera a varincia comum.
Considera a varincia total.

6) A rotao de matrizes na Anlise Fatorial


Quando analisamos a matriz de correlao entre as variveis e os fatores, muitas vezes nos deparamos com um
problema: algumas variveis apresentam um alto fator de carga para mais de um fator. Isso ruim para ns, pois causa
dificuldades para interpretar os dados. Na verdade, gostaramos que o fator de carga fosse alto para um nico fator!
Para minimizar esse problema, utilizam-se tcnicas de rotao dos fatores. Atravs da rotao, a matriz de fatores
transformada em uma matriz mais simples e fcil de interpretar (pois a maior parte das situaes de variveis com
cargas altas em mais de um fator so eliminadas). Por isso, aconselhvel utilizar a Anlise Fatorial rotacionada! E
existem 2 tipos de rotao: (1) Rotao Ortogonal e (2) Rotao oblqua.

A Rotao Ortogonal, que usa o processo de rotao VariMax, uma tcnica que deve ser utilizada quando se
sabe de antemo ou se especula que os fatores/dimenses NO estejam relacionados entre si. Essa expectativa
pode estar ancorada na Reviso Terica ou em conhecimentos empricos.
J a Rotao Oblqua, que usa o processo de rotao Oblimin, uma tcnica que deve ser utilizada quando se
sabe ou se espera que haja correlao entre os fatores/dimenses.

7) Correlao x Covarincia na Anlise Fatorial


Sabe-se que a Anlise Fatorial calculada com base no relacionamento entre as variveis. Normalmente esse
relacionamento apresentado atravs da Matriz de Correlao. A Matriz de Correlao (CORR) utiliza dados
padronizados (mdia 0 e desvio-padro 1). Contudo, tambm se pode utilizar a Matriz de Covarincia (COV), que
considera os dados na sua escala original.
Historicamente, a Matriz de Correlao se disseminou mais que a de Covarincia principalmente em virtude de a
padronizao ser necessria quando se est medindo variveis em escalas diferentes. A ampla utilizao da CORR na
rea de Economia, em que as variveis esto em escalas diferentes (ex: PIB, Populao, taxa de juros, etc),
considerada um dos principais motivos para sua popularidade. Talvez por isso, tambm na rea de Marketing, seu uso
se tornou comum. Contudo, como muitas vezes trabalhamos com uma nica escala em Marketing (como a de Likert
de 5 pontos), poder-se-ia utilizar a Matriz de Covarincia, a qual, embora incomum, tem propriedade de manter o
peso das variaes das variveis (que perdido quando se padroniza os dados). Nosso objetivo manter a variao
sempre que possvel!
8) Quantas dimenses extrair na Anlise Fatorial
Uma deciso importante em anlise fatorial a quantidade de fatores que devem ser extrados. Existem diversos
critrios para determinar a quantidade de fatores:

Autovalores > 1,00. Espera-se que um fator represente, no mnimo, a varincia de uma varivel padronizada
(que 1,00).
Scree Test (grfico). Atravs do Scree Test pode-se tomar uma deciso com base na informao visual
fornecida pelo grfico (quando a inclinao em relao ao eixo X tem seu ngulo reduzido).
Conhecimento a priori. Pode-se determinar o nmero de fatores a ser extrado com base em conhecimento
prvio (respaldado na reviso de literatura ou experincia emprica), embora seja pouco comum fazer isso na
Anlise Fatorial Exploratria.
Percentual acumulado de varincia extrada. Nesse critrio, determina-se um % acumulado desejado de
varincia extrada, e esse passa a ser o ponto de corte. Ex: parar extrao quando se chegar a 90%

9) As premissas da Anlise Fatorial


A Anlise Fatorial possui algumas premissas que devem ser de conhecimento do pesquisador. Essas premissas so
mais conceituais do que de clculo:

Existe uma estrutura subjacente (correlao) entre as variveis escolhidas. A simples existncia de
correlao entre as variveis no garantem que haja relevncia, mesmo que se cumpram as exigncias do
clculo estatstico. uma responsabilidade do pesquisador garantir que os padres observados so
conceitualmente vlidos e apropriados para a anlise fatorial.
Homogeneidade da amostra. Por exemplo: inapropriado aplicar Anlise Fatorial para uma amostra com
homens e mulheres, quando se sabe que o gnero um elemento diferenciador do comportamento/atitudes em
relao ao fenmeno estudado. Nesse caso, deveriam ser realizadas Anlises Fatoriais separadamente para
cada subamostra.
Normalidade, homocedasticidade e linearidade so premissas relativas, pois impactam negativamente a
Anlise Fatorial apenas na medida em que elas prejudicam as correlaes observadas. Essa correlao pode
ser analisada pela perspectiva global do modelo e pela perspectiva das variveis individuais. Deve-se
inspecionar visualmente da Matriz de Correlao para verificar se a maior parte das variveis possui uma
correlao maior que 0,30 (condio para que a Anlise Fatorial seja apropriada).

Você também pode gostar