Escolar Documentos
Profissional Documentos
Cultura Documentos
Análise Fatorial
Aldina Correia
aic@estg.ipp.pt
Mestrado em Gestão de Projetos
Redução da dimensão
o As principais razões para usar estes métodos:
o Muitos algoritmos não funcionam bem com uma grande
quantidade de atributos, dessa forma, a seleção de
atributos pode melhorar o seu desempenho
o Com um número menor de atributos o conhecimento
induzido por algoritmos de análise de dados é,
frequentemente, mais compreensível
o Alguns domínios possuem um alto custo de recolha de
dados, nesses casos, os métodos de seleção de atributos
podem diminuir o custo da aplicação.
1
I. Estatística Descritiva 11/30/2021
Redução da dimensão
o Em estatística , machine learning e sistemas de informação
redução de dimensionalidade ou redução de dimensão
(dimensionality reduction ou dimension reduction) é o
processo de redução do número de variáveis aleatórias em
consideração, obtendo-se um conjunto de variáveis
principais.
o As abordagens podem ser divididas em seleção e extração
(feature selection e extraction).
Análise fatorial
• O objetivo é representar ou descrever um número de
variáveis iniciais a partir de um menor número de variáveis
hipotéticas (variáveis latentes ou constructos)
Reduzir os dados,
Resumir os dados
mantendo o máximo
possível da informação
original
• Utilizado em estudos exploratórios ou confirmatórios (para
confirmar a teoria)
2
I. Estatística Descritiva 11/30/2021
Análise fatorial
• Resumir dados:
• fator R – analisa um conjunto de variáveis para
identificar um fator latente (não observável)
• fator Q – condensa indivíduos, em grande número, em
grupos distintos (semelhante à análise de “clusters”)
• Reduzir dados:
• Identifica as variáveis representativas
• Cria um conjunto novo de variáveis que substituem as
variáveis iniciais, retendo as suas características
Análise fatorial
Explica a estrutura de correlações (covariâncias) entre as
variáveis
• Técnica que analisa, numa grande quantidade de variáveis, a
estrutura de inter-relações (correlações) entre elas e define
um conjunto de dimensões implícitas comuns designadas de
fatores
• Os fatores expressam o que há de comum entre as variáveis
iniciais
• Os fatores resultam da imposição de um modelo causal
hipotético e de pressupostos acerca das distribuições de
probabilidade das variáveis
3
I. Estatística Descritiva 11/30/2021
Variância total
4
I. Estatística Descritiva 11/30/2021
5
I. Estatística Descritiva 11/30/2021
Análise fatorial
A análise fatorial é uma técnica que pode ser aplicada apenas a
variáveis quantitativas, porém a maioria dos estudos as variáveis são
qualitativas (medidas numa escala nominal ou ordinal).
Assim, para resolver a impossibilidade de usar variáveis qualitativas
em estudos deste tipo o SPSS tem implementado um método
designado por optimal scaling que atribui quantificações numéricas às
categorias de cada uma das variáveis qualitativas.
Se todas as variáveis fossem nominais, a análise aconselhada
seria a técnica de Análise de Correspondências Múltiplas (ACM),
também conhecido por Análise de Homogeneidade (HOMALS) –
particularmente apropriado ao tratamento de variáveis
qualitativas (extensível a variáveis quantitativas,
privilegiadamente categorizadas).
Helena Carvalho, ANÁLISE MULTIVARIADA DE DADOS QUALITATIVOS – Utilização da Análise de
Correspondências Múltiplas com o SPSS, 2ª Edição, ISBN: 978-972-618-486-7
Análise fatorial
Pressupostos
6
I. Estatística Descritiva 11/30/2021
7
I. Estatística Descritiva 11/30/2021
Técnica a usar:
◦ Análise de componentes principais (ACP) - Principal Component
Analysis (PCA) - faz uma transformação linear dos dados retendo o máximo da
sua variabilidade
(exemplos de outras técnicas: método da fatorização do eixo principal ou método da
máxima verosimilhança)
8
I. Estatística Descritiva 11/30/2021
Análise fatorial
3. Rotação (continuação)
Se representarmos num espaço de 2 ou 3 dimensões soluções (fatores) com e
sem rotação, verificamos que as coordenadas variam dependendo do sistema
de eixos
Os eixos (os fatores servem de eixos) são rodados para que se possa
interpretar melhor a variável de agrupamento
A rotação serve para maximizar as correlações elevadas e minimizar as
correlações baixas
Ortogonal: os eixos são mantidos com um ângulo de 90º e o peso de cada
variável em cada fator é independente do seu peso noutro fator
Oblíqua: os eixos não são mantidos em ângulos pré-definidos e a
independência dos pesos não é mantida (mais difícil de interpretar, descrever
ou retirar conclusões)
9
I. Estatística Descritiva 11/30/2021
10
I. Estatística Descritiva 11/30/2021
11
I. Estatística Descritiva 11/30/2021
12
I. Estatística Descritiva 11/30/2021
13
I. Estatística Descritiva 11/30/2021
14
I. Estatística Descritiva 11/30/2021
15
I. Estatística Descritiva 11/30/2021
Obriga a observar os
Dado que é inferior a 0.5, a valores para cada variável
KMO é inaceitável
16
I. Estatística Descritiva 11/30/2021
17
I. Estatística Descritiva 11/30/2021
18
I. Estatística Descritiva 11/30/2021
fator 1:
serviço/produto
fator 2:
imagem
fator 1: serviço/produto
19
I. Estatística Descritiva 11/30/2021
20
I. Estatística Descritiva 11/30/2021
Fiabilidade da Medida
Fiabilidade da Medida
Fiabilidade do fator 1:
serviço/produto
Fiabilidade do fator 2:
imagem
21
I. Estatística Descritiva 11/30/2021
Fiabilidade da Medida
O valor do alpha deve ser positivo, variando entre 0 e 1, tendo as seguintes
leituras:
Superior a 0,9 – consistência muito boa
Entre 0,8 e 0,9 – boa
Entre 0,7 e 0,8 – razoável
Entre 0,6 e 0,7 – fraca
Inferior a 0,6 – inadmissível
Pestana, Maria Helena & Gageiro, João Nunes (2008). Análise de Dados para Ciências Sociais. A
complementaridade do SPSS, 5ª edição revista e corrigida. Lisboa, Edições Sílabo, pp. 527-528.
Assim, no exemplo anterior temos uma consistência inadmissível e outra
boa para ambos os fatores.
Bibliografia
Hair, J.F., Black, W., Babin, B., Anderson, R.E. (2010). Multivariate
Data Analysis (7 ed.). New Jersey: Pearson.
44
22
I. Estatística Descritiva 11/30/2021
23