Você está na página 1de 6

22/06/2015

Objetivo
 Explicar a correlação ou covariância, entre um

Análise Fatorial conjunto de variáveis, em termos de um número


limitado de variáveis não-observáveis, também
chamadas de fatores ou variáveis latentes.
Ludmilla Viana Jacobson
 Ou seja, a partir da análise fatorial, em casos nos
quais se tem um número grande de variáveis medidas e
ludmilla@est.uff.br
correlacionadas entre si, seria possível identificar-se
um número menor de variáveis alternativas, não
correlacionadas e que de algum modo sumarizassem as
informações principais das variáveis originais.

Objetivo Objetivo
 A partir do momento em que os fatores são
identificados, seus valores numéricos, chamados de
 Procura identificar fatores que não são escores, podem ser obtidos para cada elemento
diretamente observáveis, com base em um amostral. Conseqüentemente, estes escores podem
ser utilizados em outras análises que envolvam outras
conjunto de variáveis observáveis.
técnicas estatísticas, como análise de regressão ou
análise de variância, por exemplo.
Var 1 Fator 1
Var 4
Var 2

Fator 2 Var 5
Var 3

Aplicações Aplicações
 Muito recomendada para a análise de fenômenos ou
processos sociais, econômicos, psicológicos e
 Variáveis como pontos atribuídos a produtos
educacionais.
em uma pesquisa com consumidores podem ser
 Também é usada em áreas como química, biologia,
expressas em função de fatores como
mineralogia, geologia, marketing, entre outras.
qualidade e utilidade do produto.

Profª Ludmilla - Análise


Multivariada I 1
22/06/2015

Padronização das variáveis Etapas da Análise Fatorial


 Embora a análise fatorial possa ser aplicada às 1. Computação da matriz de correlação para as variáveis
variáveis originais, para facilitar o entendimento originais;
preferimos introduzir os conceitos principais desta
2. Extração dos fatores;
técnica utilizando as variáveis originais, padronizadas
pela respectiva média e desvio padrão. 3. Rotação dos fatores para tornar a interpretação mais
fácil;
X i  i
Zi 
i 4. Cálculo dos escores dos fatores.

Matriz de Correlação Matriz de Correlação


 As variáveis que não parecem ser relacionadas às Para verificar se é apropriado usar a análise fatorial:
demais variáveis podem ser identificadas através da
i. Teste KMO (Kaiser-Meyer-Olkin) – avalia a adequação do tamanho
matriz de correlação e testes estatísticos amostral, utilizando cálculos com a correlação entre variáveis. Varia

associados. entre 0 e 1: zero indica inadequado para análise fatorial; aceitável


quando maior que 0,5; recomendado acima de 0,8.
 Nessa etapa também se verifica se o modelo fatorial
ii. Teste de Bartlett – a hipótese nula da matriz de correlação ser uma
é apropriado para a análise. matriz identidade, isto é, avalia se os componentes fora da diagonal
principal são zero. O resultado significativo indica que existem algumas
relações entre as variáveis.

Extração de fatores Estimação do número de fatores m

 Nessa etapa é determinado o número de fatores  Para a estimação de m, bastará extrair-se os


necessários para representar os dados. autovalores da matriz de correlação amostral.

 Também é determinado o método que será utilizado  Observa-se quais autovalores são os mais importantes
para determiná-los. Um método muito utilizado é a em termos de grandeza numérica.
análise de componentes principais.

Profª Ludmilla - Análise


Multivariada I 2
22/06/2015

Estimação do número de fatores m Estimação do número de fatores m


Critérios para a definição do número de fatores: Scree Plot
i. A análise da proporção da variância total relacionada com cada 4,00

autovalor (i). Permanecem aqueles autovalores que 3,50


representam maiores proporções da variância total e, portanto,
o valor de m será igual ao número de autovalores retidos; 3,00

2,50

ii. A comparação do valor numérico de i com o valor 1. O valor de

Autovalor
2,00
m será igual ao número de autovalores maiores ou iguais a 1.
1,50

iii. Observação do gráfico scree-plot, que dispõe os valores de i


1,00
ordenados em ordem decrescente. Por este critério, procura-se
no gráfico um “ponto de salto”, que estaria representando um 0,50

decréscimo de importância em relação à variância total. O valor 0,00

de m seria então igual ao número de autovalores anteriores ao 1 2 3 4


Ordem do fator
5 6 7

“ponto de salto”.

Análise de Componentes Principais Rotação


 Algumas variáveis são mais correlacionadas com alguns fatores
 São formadas combinações lineares das variáveis observadas.
do que outras.
 O primeiro componente principal consiste na combinação que  Em alguns casos, a interpretação dos fatores originais pode não
responde pela maior quantidade de variância na amostra. ser tarefa muito fácil devido à aparição de coeficientes de

 O segundo componente responde pela segunda maior variância grandeza numérica similar, e não desprezível, em vários fatores

na amostra e não é correlacionado com o primeiro componente. diferentes.

 O propósito da rotação é obter uma estrutura simples.


 Sucessivos componentes explicam progressivamente menores
porções de variância total da amostra e todos são não  Em uma estrutura simples, cada fator tem carga alta somente
correlacionados uns aos outros. para algumas variáveis, tornando mais fácil a sua identificação.

Estimação dos escores dos Fatores


Rotação para cada elemento amostral

 Após identificar e interpretar os fatores relacionados

Métodos de Rotação com as variáveis originais é necessário calcular os


Ortogonal

escores (valores numéricos) para cada elemento

Varimax Quartimax Equamax amostral, de modo a utilizar esses valores para outras

análises de interesse.

Profª Ludmilla - Análise


Multivariada I 3
22/06/2015

Exemplo Exemplo
 Para avaliar um certo produto, cada indivíduo da amostra foi convidado a Tabela 2 – Autovalores da matriz de correlação
dar uma nota de 1 a 5 aos seguintes atributos do produto: sabor, aroma, Porcentagem
Porcentagem de
Acumulada de
cor, textura, utilidade, locais de compra (facilidade de encontrá-lo para Ordem (i) i Variância Explicada
Variância
(%)
a compra) e embalagem. Explicada (%)
Teste KMO (Kaiser-Meyer-Olkin) = 0,723
1 3,689 52,70 52,701
Tabela 1 – Correlações amostrais Teste de Bartlett: p-valor = 0,000
2 2,350 33,56 86,265
Sabor Aroma Cor Textura Utilidade Locais Embal.
3 0,488 6,98 93,241
Sabor 1
4 0,299 4,28 97,516
Aroma 0,966 1
5 0,132 1,89 99,406
Cor 0,856 0,769 1,000
6 0,0282 ,402 99,809
Textura 0,951 0,984 0,746 1,000
7 0,0134 ,191 100,000
Utilidade 0,054 0,027 0,143 0,012 1,000

Locais 0,090 0,076 0,106 0,073 0,823 1,000


3,689
Embal. 0,049 0,044 0,157 0,035 0,710 0,536 1,000  100  52,7%
7

Exemplo Exemplo
Tabela 3 – Estimação de Fatores (m=2) =1 – comunalid.

Fatores
Comunalidade Erro
1 2
Juntos os Fatores 1 e 2
Sabor 0,990 -0,030 0,980 0,020
explicam 86,2% da
Aroma 0,978 -0,008 0,957 0,0423
variância total das Cor 0,969 -0,002 0,939 0,061
respostas obtidas para as Textura 0,8738 -0,126 0,777 0,222
variáveis. Utilidade 0,020 0,953 0,909 0,091
Locais de compra 0,056 0,883 0,782 0,218
Embalagem 0,038 0,832 0,693 0,307

Comunalidade = (Fator 1)2 + (Fator 2)2

Exemplo
Os dois fatores encontrados podem ser interpretados da
Comunalidade seguinte forma:
Tabela 3 – Estimação de Fatores (m=2)
 Designa-se por comunalidade (h2i) a proporção da variância de Fatores
Comunalidade Erro
1 2
cada variável explicada pelos fatores comuns. Sabor 0,990 -0,030 0,980 0,020
Aroma 0,978 -0,008 0,957 0,0423
 As comunalidades variam entre 0 e 1, sendo 0 quando os fatores Cor 0,969 -0,002 0,939 0,061
comuns não explicam nenhuma variância da variável e 1 quando Textura 0,8738 -0,126 0,777 0,222
Utilidade 0,020 0,953 0,909 0,091
explicam toda a sua variância.
Locais de compra 0,056 0,883 0,782 0,218
Embalagem 0,038 0,832 0,693 0,307
 Quando o valor das comunalidades é menor que 0,6 deve-se
pensar em: i. O fator 1 é um índice de opinião do consumidor, em termos dos atributos mais
representativos da parte artificial do produto, ou seja, aroma, sabor, cor,
1. Aumentar a amostra. textura.
2. Eliminar as variáveis. ii. O fator 2 é um índice de opinião do consumidor em termos dos atributos que
estão mais relacionados com a parte econômica do produto, ou seja, utilidade,
locais de compra e embalagem

Profª Ludmilla - Análise


Multivariada I 4
22/06/2015

SPSS

Profª Ludmilla - Análise


Multivariada I 5
22/06/2015

Referências Bibliográficas
 Sueli Aparecida Mingoti . Análise de Dados Através
de Métodos de Estatística Multivariada. Uma
Abordagem Aplicada. Belo Horizonte: Editora UFMG,
2005.

 Hair JF, Anderson RE, Tatham RL, Black WC.


Multivariate Data Analysis, 5th edition, Prentice-Hall,
1998.

 Kline P. An easy guide to factor analysis. London:


Routledge, 1996

Profª Ludmilla - Análise


Multivariada I 6

Você também pode gostar