Escolar Documentos
Profissional Documentos
Cultura Documentos
Livro Análise Fatorial
Livro Análise Fatorial
COLEÇÃO
Metodologias
de Pesquisa
Análise fatorial
Enap Escola Nacional de Administração Pública
Presidente
Diogo Godinho Ramos Costa
Brasília – DF
Enap
2019
© 2019 Enap
Inclui bibliografia.
ISBN: 978-85-256-0118-6
CDU 519.237.7
Bibliotecária: Tatiane de Oliveira Dias – CRB1/2230
Introdução: pontos
principais do livro................................................................ 7
Análise fatorial.................................................................... 9
Escores fatoriais........................................................................................22
Método da regressão...............................................................................24
Extração de fatores...................................................................................32
Exemplos de pesquisa..............................................................................46
5
Passo 1 – Tamanho da amostra................................................................48
Referências bibliográficas.................................................. 72
Introdução: pontos
principais do livro
Este livro é uma introdução ao método estatístico conhecido como
análise fatorial exploratória (AFE).
Com relação ao conteúdo a ser abordado, os principais tópicos são:
Noções básicas da análise fatorial.
Análise de componentes principais e análise fatorial.
Diferença entre análise fatorial exploratória e confirmatória.
Tipos de correlação e estimação de parâmetros.
Rotação de fatores: rotação ortogonal e oblíqua.
Autovalor, cargas fatoriais e escores fatoriais.
Análise multivariada de dados: técnicas de dependência e de
interdependência.
Principais aplicações da análise fatorial e combinação com
outras técnicas multivariadas.
Principais limitações da análise fatorial.
Uso do pacote estatístico R.
Nesse sentido, os principais objetivos deste livro são:
Possibilitar uma maior compreensão sobre o uso da análise
fatorial, tendo como foco sua aplicação na área de Ciências Humanas e
Sociais.
Orientar quanto aos conceitos e aos mecanismos de aplicação
da análise fatorial.
Permitir uma leitura crítica e aplicada dos principais aspectos
relacionados à análise fatorial, estabelecendo relações com outras
técnicas multivariadas.
São ainda os resultados esperados após a leitura deste livro:
Diferenciar a análise fatorial de outras técnicas multivariadas.
Planejar e implementar a análise fatorial.
Distinguir entre o uso exploratório e confirmatório da análise
fatorial.
7
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
8
Análise fatorial
No campo das Ciências Humanas e Sociais, frequentemente
tentamos mensurar fenômenos que não são diretamente observáveis, que
chamamos de variáveis latentes ou construtos. Inteligência, personalidade,
motivação, nível socioeconômico, democracia e vulnerabilidade social são
alguns exemplos de variáveis latentes. Essas variáveis são inferidas, por
meio de um modelo matemático, de outras variáveis que são observáveis
(medidas diretamente). É muito comum serem necessárias muitas variáveis
para medir um único construto latente. Tomemos o nível socioeconômico
(NSE) como exemplo. Para mensurá-lo, fazemos perguntas sobre questões
como ocupação e escolaridade dos pais, bens domésticos, bens culturais
e recursos educacionais da casa. A partir dessas variáveis diretamente
observáveis estimamos o construto nível socioeconômico. Ou seja: o NSE
é uma síntese feita a partir da combinação de vários elementos e por
isso são necessários instrumentos como testes ou questionários que se
associem a essa variável latente (Soares, 2005). Dessa forma, o “NSE visa
mensurar empiricamente um construto teórico que situa os indivíduos
em classes ou estratos sociais, nos quais eles compartilham algumas
características semelhantes tais como ocupação, renda ou educação”
(Alves et al., 2013, p. 16).
Entretanto, operacionalizar conceitos em indicadores empíricos
é algo bastante complexo. Continuando no nosso exemplo sobre o
NSE, existem métodos diferentes de mensurar o nível socioeconômico
e discordâncias na literatura sobre os elementos que precisam ser
considerados para estimar esse construto. Um exemplo é o Programa
Internacional de Avaliação de estudantes (PISA), que estima o NSE por
meio de um índice chamado International Socio-Economic Index of
Occupational Status (ISEI) (Ganzeboom et al., 1992). Nesse sentido, um
mesmo conceito pode ser operacionalizado empiricamente de muitas
maneiras, sendo a análise fatorial uma delas.
9
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
10
Análise fatorial
11
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
12
Análise fatorial
Qualitativa
(Categórica) Quantitativa
Ordinal: cada
Nominal: cada Discreta: Contínua:
categoria
categoria é números números
mantém uma
independente, inteiros, sem podem assumir
relação de
sem relação frações valores
ordem com as
com as outras fracionados
outras
Fonte: Matos (2010).
13
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
14
Análise fatorial
Fator 1
Item1 Item2 Item3 Item4 Item5 Item6 Item7
Item1 1 0,626 0,574 0,16 0,213 0,176 0,145
Item2 0,626 1 0,542 0,222 0,269 0,32 0,058
Item3 0,574 0,542 1 0,247 0,272 0,302 0,14
Item4 0,16 0,222 0,247 1 0,754 0,593 0,063
Item5 0,213 0,269 0,272 0,754 1 0,62 -0,034
Item6 0,176 0,32 0,302 0,593 0,62 1 0,014
Item7 0,145 0,058 0,14 0,063 -0,034 0,014 1
Fator 2
Fonte: elaboração própria.
15
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
16
Análise fatorial
Fator 1
Fator 2
17
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
1
Essa é uma definição simplificada de carga fatorial. Por ora, ela é suficiente, mas será
mais detalhada no decorrer do livro.
18
Análise fatorial
= 1 + 2 + 3 +
4 + 5 + 6 +
Fica evidente que as duas equações são iguais, pois ambas incluem
todas as variáveis medidas (itens 1 ao 6). Porém, os valores de b nas
equações serão diferentes, pois a importância de cada variável para
os fatores varia. Nesse sentido, podemos substituir os valores de b nas
equações pelas cargas fatoriais (as coordenadas das variáveis na Figura 2
(Equação 3).
Equação 3
=0 ,84 1 +0 ,73 2 +0 ,68 3 +
0,03 4 +0 ,00 5 +0 ,09 6 +
= 0,07 1 +0 ,06 2 +0 ,08 3 +
0,85 4 +0 ,88 5 +0 ,67 6 +
No gráfico anterior, usamos o banco de dados com sete variáveis. A intenção era
2
didática: mostrar como uma variável (item 7) não parecia estar associada a nenhum
fator. No entanto, para a representação matemática do fator, optamos por não incluir o
item 7.
19
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
A partir das duas equações, fica claro que, para o fator 1, os valores de
b são altos para item1, item 2 e item 3. Já nas outras variáveis (item 4, item
5 e item 6), os valores de b são baixos. Isso já foi mostrado anteriormente
na representação gráfica. Nesse sentido, o gráfico e as equações estão
representando a mesma coisa. Ou seja, as cargas fatoriais no gráfico são
os valores de b nas equações. Para o fator 2, temos a situação oposta: os
valores de b são altos para item 4, item 5 e item 6 e baixos para item 1,
item 2 e item 3. Portanto, isso significa que, em cada um dos fatores, três
variáveis são muito importantes (aquelas com valores altos de b) e outras
três são pouco importantes (aquelas com valores baixos de b). Em uma
situação considerada ideal, as variáveis precisam ter valores de b altos
para um fator e valores de b baixos para os outros fatores.
As cargas fatoriais podem ser inseridas em uma matriz onde as
colunas representam cada fator e as linhas representam as cargas fatoriais
de cada uma das variáveis nos fatores. Essa matriz é denominada matriz
fatorial (factor matrix) ou matriz de componentes (component matrix),
no caso da análise de componentes principais3 (Field, 2009). Nos nossos
dados, essa matriz tem duas colunas (representando dois fatores) e seis
linhas (representando as seis variáveis).
0,07 0,84
0,06 0,73
0,08 0,68
=
0,85 0,03
0,88 0,00
0,67 0,09
3
A diferença entre análise fatorial e análise de componentes principais será abordada no
decorrer deste livro.
20
Análise fatorial
Ver seção Rotação de fatores. Veremos dois tipos de rotação de fatores: ortogonal
4
(os fatores são independentes, não correlacionados) e oblíqua (os fatores são
correlacionados entre si).
21
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Escores fatoriais
22
Análise fatorial
23
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Método da regressão
24
Análise fatorial
0,22 0,55
0,06 0,32
0,05 0,28
=
0,40 0,12
0,56 0,19
0,17 0,00
25
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
26
Análise fatorial
27
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
28
Análise fatorial
29
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
30
Análise fatorial
31
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Extração de fatores
32
Análise fatorial
33
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Rotação de fatores
34
Análise fatorial
35
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
36
Análise fatorial
37
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
38
Análise fatorial
Após toda essa primeira parte teórica do livro, podemos fazer uma
síntese, um planejamento sobre a análise fatorial exploratória, que possui
vários passos. É muito importante cumprir cada um deles adequadamente
para que o resultado da análise seja satisfatório. A seguir, dividimos o
planejamento em 2 etapas, que são discutidas detalhadamente.
Tamanho da amostra
39
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
40
Análise fatorial
41
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Correlação
42
Análise fatorial
43
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Hair et al. (2005) e Kaiser (1974) indicam 0,5 como valor mínimo
aceitável (valores abaixo disso sugerem a necessidade de coletar mais
dados ou repensar quais variáveis devem ser incluídas).
A Tabela 7 sintetiza a primeira etapa de planejamento da análise
fatorial exploratória.
Tabela 7 – Síntese da etapa 1: adequação da base de dados
Amostras grandes (maior do que 100) e pelo menos 5
Tamanho da
vezes mais observações do que o número de variáveis
amostra
(o ideal seria pelo menos 10 vezes mais observações).
Variáveis categóricas (ordinal e dicotômica) e
Nível de
quantitativas (discretas e contínuas). Definir o tipo de
mensuração das
correlação: Pearson, bisserial, policórica, polisserial e
variáveis
tetracórica.
Matriz de A maioria dos coeficientes de correlação deve ter
correlação valores maiores do que 0,3.
Teste de Bartlett
Deve ser estatisticamente significante: p<0,05.
(BTS)
Quanto mais próximo de 1 melhor. 0,5 como valor
Teste de Kaiser-
mínimo aceitável, mas o ideal seria um valor a partir de
Meyer-Olkim (KMO)
0,7.
Fonte: elaboração própria.
44
Análise fatorial
45
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Exemplos de pesquisa
46
Análise fatorial
Para maiores detalhes sobre esse instrumento, ver Matos (2010), Matos et. al. (2012) e
6
47
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
48
Análise fatorial
# Converte cada uma das variaveis para escala numerica e salva em uma nova
base
# de dados chama ‘respostas_instrumento_numerica’
respostas_instrumento_numerica<-respostas_instrumento
for(i in 1:ncol(respostas_instrumento)){
levels(respostas_instrumento_numerica[,i])<-1:6
respostas_instrumento_numerica[,i]<-as.numeric(respotas_instrumento_
numerica[,i])
}
# Carrega o pacote
require(psych)
# Calcula a correlacao
correlacao<-polychoric(respotas_instrumento_numerica)
# Imprime as correlacoes com 2 casas decimais
round(correlacao$rho,2)
corPlot(correlacao$rho,numbers=TRUE,upper=FALSE,diag=FALSE)
49
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
7
O gráfico apresentado no livro está cinza, mas o gráfico gerado pelo R apresenta
originalmente 2 cores: azul e vermelho. No gráfico colorido, quanto mais forte a cor,
tanto azul quanto vermelho, mais forte é a correlação. O azul representa correlação
positiva, enquanto o vermelho sinaliza correlação negativa.
50
Análise fatorial
# Teste bartlett
cortest.bartlett(correlacao$rho,n=nrow(respostas_instrumento))
$chisq
[1] 3834.734
$p.value
[1] 0
$df
[1] 66
51
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
aceitável, mas o ideal seria um valor a partir de 0,7. Como nosso KMO
global foi de 0,85, esse critério também foi atendido.
Portanto, todos os critérios de adequação da base de dados foram
atendidos e a Etapa 1 da análise fatorial (verificação da adequação da
base de dados) está concluída.
52
Análise fatorial
53
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Loadings:
ML1 ML2 ML3
Item 1 -0.480 0.333 0.432
Item 2 -0.402 0.368 0.357
Item 3 -0.413 0.386 0.526
Item 4 0.720 0.474
Item 5 0.748 0.459
54
Análise fatorial
55
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Rotação ortogonal
Loadings:
ML2 ML1 ML3
Item 1 -0.263 -0.128 0.666
Item 2 -0.277 0.588
Item 3 -0.206 0.743
Item 4 0.129 0.849
Item 5 0.170 0.858
Item 6 0.821
Item 7 0.656 -0.161
Item 8 0.626 0.139 -0.217
Item 9 0.780 0.103 -0.157
Item 10 0.724 0.202 -0.239
Item 11 0.713 0.116 -0.240
Item 12 0.177
ML2 ML1 ML3
SS loadings 2.735 2.243 1.574
Proportion Var 0.228 0.187 0.131
Cumulative Var 0.228 0.415 0.546
Rotação oblíqua
56
Análise fatorial
Loadings:
ML2 ML1 ML3
Item 1 0.690
Item 2 0.599
Item 3 0.803
Item 4 0.861
Item 5 0.865
Item 6 0.841
Item 7 0.699
Item 8 0.635
Item 9 0.844
Item 10 0.732
Item 11 0.731
Item 12 0.182
ML2 ML1 ML3
SS loadings 2.725 2.211 1.493
Proportion Var 0.227 0.184 0.124
Cumulative Var 0.227 0.411 0.536
57
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
58
Análise fatorial
59
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
The degrees of freedom for the null model are 55 and the objective function
was 5.06
The degrees of freedom for the model are 25 and the objective function was
0.13
60
Análise fatorial
61
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
62
Análise fatorial
O gráfico apresentado no livro está preto e branco, mas o gráfico gerado pelo R
9
63
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
64
Análise fatorial
65
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
66
Análise fatorial
Tanto a TRI quanto a análise fatorial são técnicas que lidam com traços latentes.
10
67
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
68
Análise fatorial
Loadings:
ML1
Item1 0.791
Item2 0.749
Item3 0.778
Item4 0.846
Item5 0.814
Item6 0.790
Item7 0.829
Item8 0.814
Item9 0.820
Item10 0.821
Item11 0.839
Item12 0.723
Item13 0.697
69
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
70
Análise fatorial
Fixed effects:
Estimate Std. Error t value
(Intercept) -0.949538 0.002296 -413.5
TX_RESP_Q001Feminino 0.188618 0.001083 174.2
NSE 0.005467 0.001023 5.3
71
Daniel Abud Seabra Matos e Erica Castilho Rodrigues
Referências bibliográficas
Alves, Maria Teresa Gonzaga; SOARES, José Francisco; XAVIER, Flavia Pereira. O nível
socioeconômico das escolas de educação básica brasileiras. In: Reunião da Associação
Brasileira de Avaliação Educacional - Abave, 2013, Brasília. p. 15-32.
Babbie, E. R. Métodos de pesquisas de survey. Belo Horizonte: Ed. UFMG, 1999. 519 p.
Brown, G. T. L. Secondary school students’ conceptions of assessment: a survey of four
schools. Conceptions of Assessment and Feedback Project Report #5. Auckland, NZ:
University of Auckland, 2006.
Brown, G. T. L. Students’ conceptions of assessment (SCoA) inventory (Versions 1-6).
Unpublished test. Auckland, NZ: University of Auckland, 2003.
Brown, G. T. L. et al. Use of interactive-informal assessment practices: New Zealand
secondary students’ conceptions of assessment. Learning & Instruction, v. 19, n. 2, p. 97-
111, 2009.
Bryant, F. b.; Yarnold, P. R. Principal-components analysis and exploratory and
confirmatory factor analysis. IN: Grimm, L. G.; Yarnold, P. R. (Eds.). Reading and
understanding multivariate statistics. Washington, DC: APA, 2000. cap. 4, p. 99-136.
Cattell, R. B. The scree test for the number of factors. Multivariate Behavioral Research.
v. 1, p. 245-76, 1966.
Costello, Anna B.; Osborne, Jason W. Best practices in exploratory factor analysis: four
recommendations for getting the most from your analysis. Practical Assessment, Research
& Evaluation, v. 10, n. 7, p. 1-9, 2005.
Dancey, C; Reidy, J. Estatística sem Matemática para Psicologia: usando SPSS para
Windows. Porto Alegre: Artmed, 2006.
Distefano, Christine; Zhu, Min; Mindrila, Diana. Understanding and using factor scores:
considerations for the applied researcher. Practical Assessment, Research & Evaluation, v.
14, n. 20, p. 1-11, 2009.
Farrar, Donald E.; Glauber, Robert R. Multicollinearity in regression analysis: the problem
revisited. The Review of Economic and Statistics, p. 92-107, 1967.
Field, A. Descobrindo a Estatística usando o SPSS. 2. ed. Porto Alegre: Bookman, 2009.
Field, A.; Miles, J.; Field, Z. Discovering statistics using R. Sage Publications, 2012.
Figueiredo, D. B.; Silva, J. A. Visão além do alcance: uma introdução à análise fatorial.
Opinião Pública, Campinas, v. 16, n. 1, p. 160-185, jun. 2010.
Ganzeboom, Harry B. G.; De Graaf, Paul M.; Treiman, Donald J. A standard international
socio-economic index of occupational status. Social Science Research, Amsterdam, v. 21,
n. 1, p. 1-56, 1992.
Garson, G. D. Statnotes: topics in multivariate analysis. 2009. [Online] Disponível em:
<http://faculty.chass.ncsu.edu/garson/PA765/statnote.htm> Acesso em: [22 jan. 2018].
Graham, J. M.; Guthrie, A. C.; Thompson, B. Consequences of not interpreting structure
coefficients in published CFA research: a reminder. Structural Equation Modeling, v. 10, n.
1, p. 142-153, 2003.
Guadagnoli, E.; Velicer, W. Relation of sample size to the stability of component patterns.
72
Psychological Bulletin. v. 103, p. 265-275, 1988.
Jöreskog, K. G. How large can a standardized coefficient be? 1999. Disponível em:
http://www.ssicentral.com/lisrel/techdocs/HowLargeCanaStandardizedCoefficientbe.pdf.
Acesso em: [22 jul. 2018].
Hair, J. F. et al. Análise multivariada de dados. 5. ed. Porto Alegre: Bookman, 2005. 593 p.
Hutcheson, G.; Sofroniou, N. The multivariate social scientist. London: Sage, 1999.
Kaiser, H. F. An index of factorial simplicity. Psychometrika, v. 39, p. 31-36, 1974.
Harris, L. R.; Brown, G. T. L.; Harnett, J. A. Assessment from students’ perspectives: using
pupil drawings to examine their conceptions of assessment. In: Mcinerney, D. M.; Brown,
G. T. L.; Liem, G. A. D. (Eds.). Student perspectives on assessment: what students can tell us
about improving school outcomes. Greenwich, CT: Information Age Press, 2009.
Kim, J; Mueller, C. W. Factor analysis: statistical methods and practical issues. Beverly
Hills, CA: Sage, 1978.
Klem, L. Structural equation modeling. In: Grimm, L. G.; Yarnold, P. R. (Eds.). Reading and
understanding more multivariate statistics. Washington, DC: APA, 2000. cap. 7, p. 227-260.
MacCallum, R. C. et al. Sample size in factor analysis. Psychological Methods. v. 4, n. 1, p.
84-99, 1999.
Matos, D. A. S. A avaliação no ensino superior: concepções múltiplas de estudantes
brasileiros, 2010. Tese (Doutorado em Educação) – Faculdade de Educação, Universidade
Federal de Minas Gerais, Belo Horizonte, 2010.
Matos, D. A. S.; Brown, G. T. L.; Cirino, S. D. Concepções de avaliação de alunos
universitários: uma revisão da literatura. Estudos em Avaliação Educacional, v. 23, p. 204-
231, 2012.
Matos, D. A. S. et al. Avaliação no ensino superior: concepções múltiplas de estudantes
brasileiros. Estudos em Avaliação Educacional, v. 24, p. 172-193, 2013.
Muthén, L. K.; Muthén, B. O. Mplus (Version 4.2). Los Angeles, CA: Muthén & Muthén,
2005.
Pallant, J. SPSS Survival Manual. Open University Press, 2007.
Pasquali, L. (Org.) Instrumentos Psicológicos: manual prático de elaboração. Brasília:
LabPAM, 1999.
Soares, Tufi Machado. Utilização da teoria da resposta ao item na produção de indicadores
sócio-econômicos. Pesquisa Operacional, Rio de Janeiro, v. 25, n. 1, p. 83-112, 2005.
Stevens, J. P. Applied multivariate statistics for the Social Sciences. 2. ed. Hillsdale (NJ):
Erlbaum, 1992.
Schawb, A.J. Eletronic classroom.[Online] Disponível em: <http://www.utexas.edu/ssw/
eclassroom/schwab.html> Acesso em: [22 jan. 2018].
Tabachnick, B.; Fidell, L. Using multivariate statistics. Needham Heights: Allyn & Bacon,
2007.
Urbina, S. Fundamentos da testagem Psicológica. Porto Alegre, RS: Artmed, 2007.
Yong, An Gie; Pearce, Sean. A beginner’s guide to factor analysis: focusing on exploratory
factor analysis. Tutorials in quantitative methods for psychology, v. 9, n. 2, p. 79-94, 2013.
73
74