Escolar Documentos
Profissional Documentos
Cultura Documentos
◦ Y é o escore fatorial de cada observação (valor atribuído à variável estatística resultante da análise
fatorial);
◦ B são os coeficientes dos escores fatoriais de cada variável X (importância da variável X para o fator Y);
◦ X são as variáveis originais incluídas no modelo de análise fatorial padronizadas.
Técnicas de análise fatorial
Existem várias técnicas de análise fatorial, das quais se destacam duas:
◦ Análise dos fatores comuns (FCA), recomendada quando o objetivo é de resumo dos dados, que
considera apenas a variância comum (compartilhada entre as variáveis);
◦ Análise de componentes principais (PCA), recomendada quando o objetivo é de redução de dados, que
considera a variância total das variáveis originais.
Os resultados da FCA da PCA não diferem muito, embora a FCA apresente alguns problemas
operacionais e pressupostos teóricos mais complexos. Na ementa da nossa disciplina consta
apenas a PCA, por isso vamos aprofundar esta técnica quando fizermos as atividades práticas.
Planejamento da análise fatorial
Objeto da análise fatorial
◦ Se o objetivo for analisar a correlação entre as variáveis, deve-se utilizar a análise fatorial R (que vamos
explorar adiante);
◦ Sde o objetivo for analisar a correlação entre observações, deve-se utilizar a análise fatorial Q, que não
será explorada aqui, pois não é muito utilizada e vamos ver na próxima aula uma técnica mais acessível
que faz análise similar (análise de agrupamentos).
Tamanho da amostra
◦ Deve-se buscar uma amostra de, no mínimo, 50 observações, e de preferência maior do que 100;
◦ Deve-se buscar maximizar a proporção observações por variável, sendo aceitável um limite de 5 para 1
(o ideal é 10 para 1).
Suposições da análise fatorial
A análise fatorial apresenta pressupostos que devem ser cumpridos para que seus resultados
sejam válidos:
◦ No campo conceitual, espera-se que haja amparo teórico que indique a existência de uma estrutura
subjacente no conjunto de variáveis escolhidas;
◦ No campo empírico (estatístico), espera-se que haja correlações fortes entre as variáveis escolhidas;
◦ Normalidade, homoscedasticidade e linearidade são desejáveis, mas apenas porque aumentam as
correlações entre as variáveis (não são obrigatório).
Para validar o pressuposto das interrelações fortes entre as variáveis podem ser realizados três
testes estatísticos:
◦ Análise de correlação entre as variáveis, sendo esperado que haja um número substancial de
correlações maiores do que 0,30;
◦ Análise conjunta das correlações entre as variáveis (teste de esfericidade de Bartlett), em que se espera
que a hipótese nula de ausência de correlação seja rejeitada (apresente significância);
◦ Análise da medida de adequação da amostra (MSA), índice que varia de 0 a 1 e que se espera seja de,
pelo menos, 0,5.
Número de fatores a serem extraídos
O principal objetivo da análise fatorial é identificar fatores que resumem ou reduzem os dados
originais. Logo, é esperado que o número de fatores seja menor do que o número de variáveis
originais.
Considerando as técnicas de análise fatorial mais comuns (PCA e FCA), podem ser extraídos
tantos fatores quanto são as variáveis originais, sendo que cada fator adicional explica uma
parcela menor da variância dos dados.
Por exemplo, eu uma análise fatorial realizada a partir de 5 variáveis:
◦ Fator 1 explica 40% da variância;
◦ Fator 2 explica 25% da variância;
◦ Fator 3 explica 20% da variância;
◦ Fator 4 explica 10% da variância;
◦ Fator 5 explica 5% da variância.
Número de fatores a serem extraídos
Não existe um critério correto para determinar o número de fatores a serem extraídos, mas a
literatura tem destacado quatro:
◦ Critério a priori, quando o pesquisador define previamente o número de fatores (não recomendo, a não
ser que haja um bom embasamento teórico);
◦ Critério da raiz latente, em que são extraídos fatores que expliquem pelo menos a variância de uma
variável original (denominado de autovalor)
◦ Critério do gráfico de declive (scree plot), em que, através da análise de um gráfico, são extraídos os
fatores que expliquem maior parcela da variância;
◦ Critério da variância total explicada, em que se define o número de fatores que explique o percentual
mínimo de variância das variáveis originais.
Interpretação dos fatores
Além de identificar os fatores, o pesquisador deve interpretá-los, principalmente se o objetivo
da análise fatorial for de resumo dos dados.
Não existe uma metodologia inequívoca para interpretação dos fatores. Entretanto, podem ser
utilizados três processos que ajudam nesta tarefa:
◦ Estimativa da matriz fatorial, que identifica a carga fatorial de cada variável sobre cada fator. A carga
fatorial representa a correlação entre a variável original e o fator.
◦ Rotação dos fatores, que consiste em um procedimento matemático que simplifica a estrutura fatorial,
que normalmente reduz algumas das ambiguidades da solução não rotacionada. Dentre as diversas
formas de rotação dos fatores, o método VARIMAX é o mais utilizado, por gerar fatores não
correlacionados que maximizam as cargas fatoriais.
◦ Interpretação dos fatores, em que o pesquisador avalia as cargas fatoriais rotacionadas para cada
variável a fim de determinar o seu papel na determinação da estrutura fatorial.
Interpretação dos fatores
Para interpretar os fatores, é preciso observar as cargas fatoriais das variáveis na solução
rotacionada. Embora não haja consenso, a literatura tem apontado parâmetros para julgar a
significância prática e estatística de uma variável.
A partir da identificação das variáveis com maior significância em cada fator, o pesquisador pode (e deve)
rotular os fatores.
Usos adicionais dos resultados da análise
fatorial
Se o pesquisador tiver como objetivo resumir os dados, a análise fatorial se encerra com a
identificação e rotulação dos fatores.
Entretanto, caso o objetivo seja de reduzir o número de variáveis para análises posteriores, é
preciso definir critérios para mensurar estas novas variáveis. Existem basicamente três critérios:
◦ Calcular o escore fatorial, que utiliza todas as variáveis originais (o SPSS faz isso);
◦ Escolher uma variável (com maior escore fatorial) para representar o fator;
◦ Criar escalas múltiplas a partir da média das variáveis originais com significância prática e estatística de
cada fator.