Você está na página 1de 14

Análise fatorial

PESQUISA TECNOLÓGICA QUALITATIVA E QUANTITATIVA


Técnicas multivariadas de
interdependência
Na aula passada vimos a análise de regressão, principal técnica multivariada de dependência.
Entretanto, muitas vezes o objetivo da pesquisa não é de explicar ou prever um fenômeno, mas
de descrevê-lo.
Existem técnicas multivariadas mais apropriadas para descrever as associações existentes entre
um conjunto de variáveis, denominadas de técnicas multivariadas de interdependência.
Dentre as (diversas) técnicas de interdependência, vamos discutir em nossa disciplina duas:
análise fatorial (nesta aula) e análise de conglomerados (na próxima aula).
Análise fatorial
Vimos na aula passada que existem situações em que temos mais de uma variável para medir
um mesmo construto, o que gera problemas de colinearidade se estas variáveis são altamente
correlacionadas.
Imagine, por exemplo, fazer um questionário com 20 perguntas para medir o grau de inovação
de uma empresa. Como saber se as perguntas não se “sobrepõe” umas às outras, ou se são
dimensões diferentes da inovação?
A análise fatorial compreende um conjunto de técnicas de interdependência que visam analisar
a estrutura de relações entre variáveis métricas, no intuito de identificar um grupo menor de
variáveis que formam dimensões latentes dos dados originais (denominadas de fatores).
No exemplo do questionário de inovação, a partir de respostas de 100 empresas poderíamos
identificar, a partir das respostas das 20 questões originais, quais as dimensões (fatores) que
representam a inovação das 100 empresas amostradas.
Análise fatorial
O propósito principal das técnicas de análise fatorial é resumir a informação contida em diversas
variáveis originais em um conjunto menor de novas dimensões compostas de variáveis
estatísticas (fatores) com uma perda mínima de informação.
Embora existam técnicas de análise fatorial para agrupar observações (análise fatorial Q), o tipo
mais comum de análise fatorial objetiva reduzir o número de variáveis (análise fatorial R).
A análise fatorial pode ser utilizada, na prática, para dois objetivos:
◦ Resumo de dados, quando o objetivo é identificar as dimensões latentes (não observáveis diretamente)
que explicam a variância dos dados originais. Por exemplo: identificar por meio do questionário de 20
perguntas sobre inovação quais as principais dimensões da inovação das empresas amostradas;
◦ Redução de dados, quando o objetivo é identificar um conjunto menor de variáveis que podem
substituir o conjunto original de variáveis. Por exemplo: identificar um conjunto de variáveis que possa
ser utilizado como métrica para inovação, a partir das 20 questões do questionário de inovação.
Fatores
O princípio fundamental da análise fatorial é agrupar variáveis a partir de sua variância comum
(correlação e covariância), de modo que os fatores resultantes expliquem o máximo da variância
das variáveis originais.
Um fator é uma variável estatística resultante da combinação linear das variáveis originais,
podendo ser descrito em termos das variáveis mensuradas e da importância relativa delas para
aquele fator:
𝐹𝑎𝑡𝑜𝑟 𝑌 = 𝐵1 ∗ 𝑋1 + 𝐵2 ∗ 𝑋2 … + 𝐵𝑛 ∗ 𝑋𝑛

◦ Y é o escore fatorial de cada observação (valor atribuído à variável estatística resultante da análise
fatorial);
◦ B são os coeficientes dos escores fatoriais de cada variável X (importância da variável X para o fator Y);
◦ X são as variáveis originais incluídas no modelo de análise fatorial padronizadas.
Técnicas de análise fatorial
Existem várias técnicas de análise fatorial, das quais se destacam duas:
◦ Análise dos fatores comuns (FCA), recomendada quando o objetivo é de resumo dos dados, que
considera apenas a variância comum (compartilhada entre as variáveis);
◦ Análise de componentes principais (PCA), recomendada quando o objetivo é de redução de dados, que
considera a variância total das variáveis originais.

Os resultados da FCA da PCA não diferem muito, embora a FCA apresente alguns problemas
operacionais e pressupostos teóricos mais complexos. Na ementa da nossa disciplina consta
apenas a PCA, por isso vamos aprofundar esta técnica quando fizermos as atividades práticas.
Planejamento da análise fatorial
Objeto da análise fatorial
◦ Se o objetivo for analisar a correlação entre as variáveis, deve-se utilizar a análise fatorial R (que vamos
explorar adiante);
◦ Sde o objetivo for analisar a correlação entre observações, deve-se utilizar a análise fatorial Q, que não
será explorada aqui, pois não é muito utilizada e vamos ver na próxima aula uma técnica mais acessível
que faz análise similar (análise de agrupamentos).

Objetivo da análise fatorial


◦ Quando se busca resumir os dados (encontrar fatores latentes), a análise dos fatores comuns é mais
adequada, e o pesquisador deve ter maior embasamento teórica sobre os construtos subjacentes às
variáveis originais;
◦ Quando se busca reduzir os dados (reduzir o número de variáveis), a análise de componentes principais
é mais adequada, e o pesquisador pode nominar os fatores (componentes principais) a partir das
variáveis originais mais representativas.
Planejamento da análise fatorial
Tipos de variáveis
◦ A escolha das variáveis, primeiramente, deve ser pautada por argumentos teóricos que preveem a
correlação entre as variáveis (não se pode “jogar” variáveis indiscriminadamente no modelo);
◦ Por utilizar a matriz de correlações entre as variáveis para calcular os fatores, a análise fatorial
pressupõe que as variáveis originais são métricas (intervalares ou de razão);
◦ Variáveis nominais podem ser inseridas se forem dicotômicas (1 ou 0);
◦ Existe no SPSS uma opção para realizar análise fatorial a partir de variáveis nominais múltiplas
(CATPCA), que transforma estas variáveis em intervalares.

Tamanho da amostra
◦ Deve-se buscar uma amostra de, no mínimo, 50 observações, e de preferência maior do que 100;
◦ Deve-se buscar maximizar a proporção observações por variável, sendo aceitável um limite de 5 para 1
(o ideal é 10 para 1).
Suposições da análise fatorial
A análise fatorial apresenta pressupostos que devem ser cumpridos para que seus resultados
sejam válidos:
◦ No campo conceitual, espera-se que haja amparo teórico que indique a existência de uma estrutura
subjacente no conjunto de variáveis escolhidas;
◦ No campo empírico (estatístico), espera-se que haja correlações fortes entre as variáveis escolhidas;
◦ Normalidade, homoscedasticidade e linearidade são desejáveis, mas apenas porque aumentam as
correlações entre as variáveis (não são obrigatório).

Para validar o pressuposto das interrelações fortes entre as variáveis podem ser realizados três
testes estatísticos:
◦ Análise de correlação entre as variáveis, sendo esperado que haja um número substancial de
correlações maiores do que 0,30;
◦ Análise conjunta das correlações entre as variáveis (teste de esfericidade de Bartlett), em que se espera
que a hipótese nula de ausência de correlação seja rejeitada (apresente significância);
◦ Análise da medida de adequação da amostra (MSA), índice que varia de 0 a 1 e que se espera seja de,
pelo menos, 0,5.
Número de fatores a serem extraídos
O principal objetivo da análise fatorial é identificar fatores que resumem ou reduzem os dados
originais. Logo, é esperado que o número de fatores seja menor do que o número de variáveis
originais.
Considerando as técnicas de análise fatorial mais comuns (PCA e FCA), podem ser extraídos
tantos fatores quanto são as variáveis originais, sendo que cada fator adicional explica uma
parcela menor da variância dos dados.
Por exemplo, eu uma análise fatorial realizada a partir de 5 variáveis:
◦ Fator 1 explica 40% da variância;
◦ Fator 2 explica 25% da variância;
◦ Fator 3 explica 20% da variância;
◦ Fator 4 explica 10% da variância;
◦ Fator 5 explica 5% da variância.
Número de fatores a serem extraídos
Não existe um critério correto para determinar o número de fatores a serem extraídos, mas a
literatura tem destacado quatro:
◦ Critério a priori, quando o pesquisador define previamente o número de fatores (não recomendo, a não
ser que haja um bom embasamento teórico);
◦ Critério da raiz latente, em que são extraídos fatores que expliquem pelo menos a variância de uma
variável original (denominado de autovalor)
◦ Critério do gráfico de declive (scree plot), em que, através da análise de um gráfico, são extraídos os
fatores que expliquem maior parcela da variância;
◦ Critério da variância total explicada, em que se define o número de fatores que explique o percentual
mínimo de variância das variáveis originais.
Interpretação dos fatores
Além de identificar os fatores, o pesquisador deve interpretá-los, principalmente se o objetivo
da análise fatorial for de resumo dos dados.
Não existe uma metodologia inequívoca para interpretação dos fatores. Entretanto, podem ser
utilizados três processos que ajudam nesta tarefa:
◦ Estimativa da matriz fatorial, que identifica a carga fatorial de cada variável sobre cada fator. A carga
fatorial representa a correlação entre a variável original e o fator.
◦ Rotação dos fatores, que consiste em um procedimento matemático que simplifica a estrutura fatorial,
que normalmente reduz algumas das ambiguidades da solução não rotacionada. Dentre as diversas
formas de rotação dos fatores, o método VARIMAX é o mais utilizado, por gerar fatores não
correlacionados que maximizam as cargas fatoriais.
◦ Interpretação dos fatores, em que o pesquisador avalia as cargas fatoriais rotacionadas para cada
variável a fim de determinar o seu papel na determinação da estrutura fatorial.
Interpretação dos fatores
Para interpretar os fatores, é preciso observar as cargas fatoriais das variáveis na solução
rotacionada. Embora não haja consenso, a literatura tem apontado parâmetros para julgar a
significância prática e estatística de uma variável.

Carga fatorial Significância prática Tamanho da Carga fatorial com


Abaixo de 0,30 Irrelevante amostra significância estatística

Entre 0,30 e 0,50 Minimamente relevante 60 0,70

Entre 0,50 e 0,70 Relevante 85 0,60

Acima de 0,70 Muito relevante (ideal) 120 0,50


200 0,40
350 0,30

A partir da identificação das variáveis com maior significância em cada fator, o pesquisador pode (e deve)
rotular os fatores.
Usos adicionais dos resultados da análise
fatorial
Se o pesquisador tiver como objetivo resumir os dados, a análise fatorial se encerra com a
identificação e rotulação dos fatores.
Entretanto, caso o objetivo seja de reduzir o número de variáveis para análises posteriores, é
preciso definir critérios para mensurar estas novas variáveis. Existem basicamente três critérios:
◦ Calcular o escore fatorial, que utiliza todas as variáveis originais (o SPSS faz isso);
◦ Escolher uma variável (com maior escore fatorial) para representar o fator;
◦ Criar escalas múltiplas a partir da média das variáveis originais com significância prática e estatística de
cada fator.

Você também pode gostar