Você está na página 1de 23

I.

Estatística Descritiva 11/30/2021

Métodos e Técnicas de Investigação

Análise Fatorial
Aldina Correia
aic@estg.ipp.pt
Mestrado em Gestão de Projetos

Redução da dimensão
o As principais razões para usar estes métodos:
o Muitos algoritmos não funcionam bem com uma grande
quantidade de atributos, dessa forma, a seleção de
atributos pode melhorar o seu desempenho
o Com um número menor de atributos o conhecimento
induzido por algoritmos de análise de dados é,
frequentemente, mais compreensível
o Alguns domínios possuem um alto custo de recolha de
dados, nesses casos, os métodos de seleção de atributos
podem diminuir o custo da aplicação.

1
I. Estatística Descritiva 11/30/2021

Redução da dimensão
o Em estatística , machine learning e sistemas de informação
redução de dimensionalidade ou redução de dimensão
(dimensionality reduction ou dimension reduction) é o
processo de redução do número de variáveis aleatórias em
consideração, obtendo-se um conjunto de variáveis
principais.
o As abordagens podem ser divididas em seleção e extração
(feature selection e extraction).

Análise fatorial
• O objetivo é representar ou descrever um número de
variáveis iniciais a partir de um menor número de variáveis
hipotéticas (variáveis latentes ou constructos)

Reduzir os dados,
Resumir os dados
mantendo o máximo
possível da informação
original
• Utilizado em estudos exploratórios ou confirmatórios (para
confirmar a teoria)

2
I. Estatística Descritiva 11/30/2021

Análise fatorial
• Resumir dados:
• fator R – analisa um conjunto de variáveis para
identificar um fator latente (não observável)
• fator Q – condensa indivíduos, em grande número, em
grupos distintos (semelhante à análise de “clusters”)

• Reduzir dados:
• Identifica as variáveis representativas
• Cria um conjunto novo de variáveis que substituem as
variáveis iniciais, retendo as suas características

Análise fatorial
Explica a estrutura de correlações (covariâncias) entre as
variáveis
• Técnica que analisa, numa grande quantidade de variáveis, a
estrutura de inter-relações (correlações) entre elas e define
um conjunto de dimensões implícitas comuns designadas de
fatores
• Os fatores expressam o que há de comum entre as variáveis
iniciais
• Os fatores resultam da imposição de um modelo causal
hipotético e de pressupostos acerca das distribuições de
probabilidade das variáveis

3
I. Estatística Descritiva 11/30/2021

Análise fatorial – Principais conceitos


•“Communality”: quantidade da variância total da variável
original explicada pelos fatores comuns (comunalidades
elevadas indicam que a variância das variáveis que foi retida
pelos fatores é grande)

Variância total

Variância comum Variância única


especifica erros

•Valor próprio (“eigen value”): representa a quantidade da


variância contida pelo fator

Análise fatorial – Principais conceitos


•Teste de Esfericidade de Bartlett: indica-nos se as correlações
entre as variáveis são suficientemente elevadas para que a AF
tenha utilidade na estimação de fatores comuns (nesses casos
rejeita-se H0 = a matriz de correlação é igual à matriz identidade)
NOTA: Teste pouco usado porque é muito sensível à dimensão da amostra. Em amostras de
grande dimensão, rejeita-se Ho mesmo com correlações reduzidas)

•Medida de adequabilidade da amostra de KMO: medida da


homogeneidade das variáveis que compara as correlações
simples com as correlações parciais observadas entre as
variáveis

4
I. Estatística Descritiva 11/30/2021

Análise fatorial – Principais conceitos


•Medida de adequabilidade da amostra de KMO

Valor de KMO Recomendação relativamente à AF


]0,9 – 1,0] Excelente
]0,8 – 0,9] Boa
]0,7 – 0,8] Média
]0,6 – 0,7] Medíocre
]0,5 – 0,6] Mau mas ainda aceitável
]0,0 – 0,5] Inaceitável
Fonte: Maroco (2010:368)

Análise fatorial – Principais conceitos


• Matriz de correlações anti-imagem:
 Serve para avaliar a adequabilidade da análise fatorial às
variáveis em estudo
 Matriz de correlações parciais entre as variáveis após a
análise de fatores
 A diagonal contém medidas de adequabilidade da
amostra (MSA) para cada variável; os restantes valores
são as correlações parciais entre variáveis

5
I. Estatística Descritiva 11/30/2021

Análise fatorial
A análise fatorial é uma técnica que pode ser aplicada apenas a
variáveis quantitativas, porém a maioria dos estudos as variáveis são
qualitativas (medidas numa escala nominal ou ordinal).
Assim, para resolver a impossibilidade de usar variáveis qualitativas
em estudos deste tipo o SPSS tem implementado um método
designado por optimal scaling que atribui quantificações numéricas às
categorias de cada uma das variáveis qualitativas.
Se todas as variáveis fossem nominais, a análise aconselhada
seria a técnica de Análise de Correspondências Múltiplas (ACM),
também conhecido por Análise de Homogeneidade (HOMALS) –
particularmente apropriado ao tratamento de variáveis
qualitativas (extensível a variáveis quantitativas,
privilegiadamente categorizadas).
Helena Carvalho, ANÁLISE MULTIVARIADA DE DADOS QUALITATIVOS – Utilização da Análise de
Correspondências Múltiplas com o SPSS, 2ª Edição, ISBN: 978-972-618-486-7

Análise fatorial
Pressupostos

Normalidade – Testes KS e SW ou TLC ou Assimetria e Curtose


Linearidade – As variáveis estão correlacionadas (o coeficiente de
correlação linear, de Pearson, é significativo)
Homocedasticidade – A variância é homogénea para as variáveis

6
I. Estatística Descritiva 11/30/2021

Análise de componentes principais - Etapas


1. Validação dos Pressupostos
Normalidade
◦ Testes de Kolmogorov-Smirnov e/ou Shapiro-Wilk
◦ Teorema do Limite Central
◦ Assimetria e Curtose

Análise de componentes principais - Etapas


Linearidade
Examinar a matriz de correlações
◦ Avaliar o fator em termos da correlação das variáveis
◦ As variáveis devem estar correlacionadas, ou seja, os coeficientes de
correlação linear, de Pearson, devem ser significativos
◦ O nº de correlações significativas deve ser no mínimo de 30% para que
o fator seja considerado apropriado

Teste de esfericidade de Bartlett


◦ H0 = a matriz de correlação é igual à matriz identidade
◦ Se a estatística de teste for grande e o nível de significância pequeno 
rejeitar H0
◦ indica se a matriz de correlações tem correlações entre as variáveis
significativas

7
I. Estatística Descritiva 11/30/2021

Análise de componentes principais - Etapas


Homocedasticidade
◦ A variância é homogénea para as variáveis
◦ Análise descritiva das variáveis

Análise de componentes principais


2. Extrair fatores
◦ Determinar o nº de fatores necessários para representar os dados
◦ Averiguar se os fatores se adequam aos dados
(valor próprio abaixo de 1  fator não deve ser considerado)

Técnica a usar:
◦ Análise de componentes principais (ACP) - Principal Component
Analysis (PCA) - faz uma transformação linear dos dados retendo o máximo da
sua variabilidade
(exemplos de outras técnicas: método da fatorização do eixo principal ou método da
máxima verosimilhança)

8
I. Estatística Descritiva 11/30/2021

Análise de componentes principais


3. Rotação
◦ Transforma os componentes em fatores por forma a serem interpretados
Fatores não correlacionados Fatores correlacionados

métodos ortogonais métodos oblíquos


(Varimax, equimax, (oblimin, promax,
quartimax) ortobliquo)
Análise de
componentes Rotação Análise Fatorial
principais

Análise fatorial
3. Rotação (continuação)
Se representarmos num espaço de 2 ou 3 dimensões soluções (fatores) com e
sem rotação, verificamos que as coordenadas variam dependendo do sistema
de eixos
Os eixos (os fatores servem de eixos) são rodados para que se possa
interpretar melhor a variável de agrupamento
A rotação serve para maximizar as correlações elevadas e minimizar as
correlações baixas
Ortogonal: os eixos são mantidos com um ângulo de 90º e o peso de cada
variável em cada fator é independente do seu peso noutro fator
Oblíqua: os eixos não são mantidos em ângulos pré-definidos e a
independência dos pesos não é mantida (mais difícil de interpretar, descrever
ou retirar conclusões)

9
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático no SPSS


Exemplo HATCO.sav

A Base de Dados HATCO contém informação sobre um serviço,


contendo 14 variáveis:
1. Rapidez na entrega (x1) 8. Dimensão da empresa (x8)
2. Preço (x2) 9. Nível de uso (x9)
3. Flexibilidade do preço (x3) 10. Nível de satisfação (x10)
4. Imagem (x4) 11. Compra por especificações (x11)
5. Serviço prestado (x5) 12. Estrutura da procura (x12)
6. Imagem da força de vendas (x6) 13. Tipo de indústria (x13)
7. Qualidade do produto (x7) 14. Tipo de situação de compra (x14)

Aplique análise fatorial às variáveis x1 a x7.

Validação dos pressupostos


1. Normalidade

Analyze → Explore→ Plots… Normality plots with tests

10
I. Estatística Descritiva 11/30/2021

Validação dos pressupostos


1. Normalidade

Rejeita-se a normalidade para a maioria das variáveis, no entanto como a amostra é


grande (N=100), pode assumir-se a aproximação à normalidade pelo TLC.

Analyze → Explore→ fator

Validação dos pressupostos


1. Normalidade - Analisar antecipadamente
2. Linearidade - Análise das correlações entre as
variáveis – no output na AF
3. Homocedasticidade – Análise descritiva das variáveis
– no output na AF

11
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático no SPSS

Analyze → Dimension Reduction → fator

Análise fatorial – caso prático no SPSS

12
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático no SPSS

Análise fatorial – caso prático no SPSS

13
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático no SPSS

Análise fatorial – caso prático no SPSS

14
I. Estatística Descritiva 11/30/2021

Validação dos pressupostos


1. Homocedasticidade – Análise descritiva das variáveis
– no output na AF

As variâncias/ desvios-padrão estão na mesma área de


grandeza podendo assumir-se a Homocedasticidade.

Análise fatorial – caso prático no SPSS

Nível de significância = 0.05


15 das 21 correlações (71%) são significativas para este nível,
justificando o uso da AF

15
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático no SPSS


Examina as correlações no
seu todo
H0: matriz de correlação igual à
matriz identidade
p=0.00 logo H0 rejeitada

Obriga a observar os
Dado que é inferior a 0.5, a valores para cada variável
KMO é inaceitável

Análise fatorial – caso prático no SPSS


Para
obter um
valor
acima de
0.5, a
variável
x5 é
retirada
do
estudo

•A medida da adequabilidade da amostra (diagonal) compara a magnitude dos coeficientes das


correlações observadas com a magnitude dos coeficientes da correlação parcial
•Fora da diagonal temos as correlações parciais negativas

16
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático


•57% das correlações são significantes
Podemos
•H0 é rejeitada extrair
•KMO é aceitável (superior a 0,5) fatores

Todas acima de 0.5,


logo não é retirada mais
nenhuma variável do
estudo

Análise fatorial – caso prático

O “cotovelo” verifica-se no 3º fator, pelo que o scree plot


Valor próprio > 1 indica que sejam extraídos 2 fatores.

17
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático

Foram extraídos 2 fatores (valores


próprios superiores a 1, tal como ilustrado no
scree plot).

Esses 2 fatores explicam 70,88% da


Valor próprio > 1 variância total.

Análise fatorial – caso prático


“communalities” - quantidade da
variância total da variável original
explicada pelos fatores comuns
Repara-se que a percentagem da
variância de cada variável
explicada pelos fatores comuns
extraídos é superior a 50% para
todas as variâncias.
x2 (preço) é a variável que tem
menos em comum com as outras
variáveis. No outro extremo,
aparece x4 (imagem).

18
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático

fator 1:
serviço/produto

fator 2:
imagem

Peso de cada variável


para o fator

Análise fatorial – caso prático


fator 2: imagem

fator 1: serviço/produto

19
I. Estatística Descritiva 11/30/2021

Fiabilidade da Medida ou Consistência Interna


Fiabilidade de uma medida refere a capacidade desta ser
consistente. Se um instrumento de medida dá sempre os
mesmos resultados quando aplicado a alvos estruturalmente
iguais, podemos confiar no significado da medida e dizer que a
medida é fiável.
João Maroco e Teresa Garcia-Marques (2006). Qual a fiabilidade do alfa de Cronbach?
Questões antigas e soluções modernas? Instituto Superior de Psicologia Aplicada, Portugal.
http://publicacoes.ispa.pt/index.php/lp/article/viewFile/763/706

Calcular o valor do Alpha de Cronbach permite analisar a consistência


interna dos fatores.
O teste do Alpha de Cronbach – ou Alfa de Cronbach – permite determinar o
limite inferior da consistência interna de um grupo de variáveis ou itens.

Fiabilidade da Medida ou Consistência Interna


A consistência interna traduz o grau de uniformidade ou
coerência entre as respostas dos sujeitos aos itens que
compõem o instrumento (Oliveira & Costa, 2012)
e pode ser calculada através do Alfa de Cronbach
que é uma das medidas mais usadas para a verificação da
consistência interna de um grupo de variáveis,
podendo definir-se como a correlação que se espera obter
entre a escala usada e outras escalas hipotéticas do mesmo
universo, com igual número de itens, que meçam a mesma
característica
Oliveira, P. & Costa, E. (2012). Validade e fiabilidade da versão portuguesa do Pain Coping
Inventory. Acta Reumatológica Portuguesa, 37, 126-133.

20
I. Estatística Descritiva 11/30/2021

Fiabilidade da Medida

Fiabilidade da Medida
Fiabilidade do fator 1:
serviço/produto

Fiabilidade do fator 2:
imagem

21
I. Estatística Descritiva 11/30/2021

Fiabilidade da Medida
O valor do alpha deve ser positivo, variando entre 0 e 1, tendo as seguintes
leituras:
Superior a 0,9 – consistência muito boa
Entre 0,8 e 0,9 – boa
Entre 0,7 e 0,8 – razoável
Entre 0,6 e 0,7 – fraca
Inferior a 0,6 – inadmissível

Pestana, Maria Helena & Gageiro, João Nunes (2008). Análise de Dados para Ciências Sociais. A
complementaridade do SPSS, 5ª edição revista e corrigida. Lisboa, Edições Sílabo, pp. 527-528.
Assim, no exemplo anterior temos uma consistência inadmissível e outra
boa para ambos os fatores.

Bibliografia
Hair, J.F., Black, W., Babin, B., Anderson, R.E. (2010). Multivariate
Data Analysis (7 ed.). New Jersey: Pearson.

Maroco, J. (2010). Análise Estatística - Com a Utilização do


SPSS (3 ed.). Lisboa: Edições Sílabo.

44

22
I. Estatística Descritiva 11/30/2021

Análise fatorial – caso prático no SPSS


Exemplo
A base de dados GEM 2015 NES Global Individual Level Data
disponível em
https://www.gemconsortium.org/data/sets?id=nes contém
as respostas ao inquérito National Expert Survey (NES) do
Projeto Global Entrepreneurship Monitor (GEM). Este inquérito
analisa o contexto nacional em que os indivíduos iniciam
negócios (Entrepreneurial Framework Conditions - EFC).

Fazer AF das EFC’s

23

Você também pode gostar