Você está na página 1de 15

Faculdade de Ciências

Departamento de Matemática e Informática


Licenciatura em Estatı́stica

Trabalho Prático 2 de Estatı́stica Multivariada - Grupo [4]

Tema: Aplicação da análise factorial exploratória na identificação de possı́veis dimensões


ou factores relactivos as questões feitas aos clientes numa cadeia de supermercados.

Nome dos elementos: Nome dos professores:


Abel Jorge Zandamela Osvaldo Francisco André Loquiha
Agostinho Zeinadine Carlos Rafica Abdulrazaque
Jorge Patrı́cio Sidumo
José Vidal Isaias
Yura Francisco Matsinhe

Maputo, aos 5 de outubro de 2022


Conteúdo
1 Intordução 2
1.1 Contextualização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.2 Questões de pesquisa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3 Objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.1 Objectivo Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.3.2 Objectivos Especı́ficos . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4 Revisão Bibliográfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.4.1 Definição de conceitos . . . . . . . . . . . . . . . . . . . . . . . . . . 4

2 Materiais e Métodos 4
2.1 Material e fontes de dados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
2.2 Métodos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5

3 Aplicação aos dados 6


3.1 Teste de Adequação da Amostra (KMO) . . . . . . . . . . . . . . . . . . . . 6
3.2 Análise Factorial com Componentes Principais . . . . . . . . . . . . . . . . . 7
3.2.1 Aplicação da análise factorial sem o emprego da rotação varimax . . . 7
3.3 Comparação dos resultados obtidos nos dois modelos (Componentes principais
e maxima verossimilhança) . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
3.3.1 Gráfico de dispersão dos escores fatoriais obtidos usando componentes
principais vs. escores fatoriais usando máxima verossimilhança . . . . 10
3.4 Divisão da base de dados em duas amostras e condução da análise facorial
pelo método das componentes principais . . . . . . . . . . . . . . . . . . . . 11

4 Discussão de resultados 12

5 Conclusão 12

6 Referências Bibliográficas 13

7 Anexos 14
7.0.1 Aplicação da análise factorial com o emprego da rotação varimax . . 14

1
1 Intordução
1.1 Contextualização
Em uma pesquisa, quanto mais variáveis são utilizadas, mais elas tendem a estar correla-
cionadas entre si. Nesses casos o pesquisador precisa ir em busca de meios para gerenciar
essas variáveis, agrupando-as ou criando uma nova medida que seja capaz de representar um
conjunto dessas variáveis.
A análise fatorial é uma técnica estatı́stica exploratória que permite procurar definir, em um
estudo com muitas variáveis, conjuntos de variáveis altamente correlacionadas, conhecidos
como fatores. Os fatores têm o objetivo de resumir as diversas variáveis em um conjunto
menor de dimensões com uma perda mı́nima de informação.(OLIVEIRA, 2019)
A análise fatorial foi desenvolvida em 1904 por Charles Spearman ao avaliar correlações en-
tre notas de várias disciplinas cursadas por estudantes. Spearman testou o desempenho das
pessoas em várias tarefas relacionadas à inteligência, incluindo percepção de peso e cores,
direções e matemática. Ao analisar os dados que coletou, ele observou que aqueles que se
saı́ram bem em uma área também pontuaram melhor em outras. Isso levou à conclusão
de que deve haver um fator central que influencia nossas habilidades cognitivas, uma “inte-
ligência geral”, que Spearman decidiu chamar de g.
A análise factorial pode ser observada sob duas vertentes: exploratória ou confirmatória.
Diz-se que é exploratória quando aplicado em estudos que exigem a redução de variáveis
para fornecer a analise exploratória, ou quando utiliza os factores para a criação de medidas
compostas, por outro lado, diz-se confirmatória quando envolve uma base conceitual que
permite compreender a relação entre as variáveis, então um factor pode assumir determi-
nado significado, podendo representar um conceito, medido pelo conjunto de variáveis que o
compõe, que não seria possı́vel verificar individualmente. Os factores resultantes, devem ter
baixa correlação entre si. Estabelece correlação das variáveis observáveis e as organiza em
factores, que por si só são variáveis não observáveis (OLIVEIRA, 2019).
O principal objectivo da AFE é o de tentar estabelecer uma estrutura inerente entre as
variáveis que estão sendo analisadas por meio de estruturas de correlação subjacentes, ou
seja, pretende-se definir factores que estão altamente inter-relacionados. É usado para redu-
zir a complexidade de um grande número de variáveis em um arranjo menor, e, portanto,
objectiva explicar o fenómeno de maneira minuciosa (MENDEZ & RONDON, 2012).
O nosso estudo, visa exactamente fazer uma análise factorial de dados secundários, recolhi-
dos por uma cadeia de supermercados, numa amostra de 500 dos seus clientes, com intuı́do
de obter sua percepção sobre o ato de fazer compras. Perspectiva-nos, na aplicação de AFE,
encontrar relações entre as variáveis que possam permitir seu agrupamento em um grupo
menor que facilite sua análise e interpretação.

2
1.2 Questões de pesquisa
Como foi destacado de antemão, uma cadeia de de supermercados aplicou um questionário
a 500 dos seus clientes com o objectivo obter a sua perceção sobre o acto de fazer compra,
face a esta preocupação destas empresas e aos tipos de dados que representam as respostas
dos clientes, levou - se a uma análise factorial exploratória com a perspectiva de responder
as seguintes questões de pesquisa:

1. Os modelos a usar são adequadamente ajustados aos dados (teste de KMO)?

2. Quais são os factores relevantes usando os métodos de máxima verosimilhança e com-


ponentes principais?

3. Existe alguma influência da rotação varimax nos agrupamentos dos escores factoriais?

4. Os dois métodos supracitados possuem os mesmos agrupamentos?

5. Dividindo a amostra em duas partes iguais, os agrupamentos diferem entre as amostras?


Diferem com a amostra geral?

6. Os graficos de dispersão plotados possuem algum tipo de padrão?

1.3 Objectivos
1.3.1 Objectivo Geral

Aplicar Análise Factorial Exploratória na identificação de possı́veis dimensões ou factores


relativos aos dados em estudo e sua caracterização.

1.3.2 Objectivos Especı́ficos

• Verificar os pressupostos para a realização de uma Analise Factorial Exploratória;

• Extrair factores que melhor explicam a variação dos dados, formando novas dimensões
de dados;

• Verificar a coerência das novas dimensões com os dados originais;

• Atribuir nome às novas dimensões;

• Verificar a validade dos factores encontrados.

1.4 Revisão Bibliográfica


Segundo (HONGYU, 2016) “A analise Multivariada de uma forma bem geral, refere-se aos
métodos estatı́sticos que analisam simultaneamente múltiplas medidas em cada individuo ou
objecto sob investigação. . . ”. Como foi referido antes, neste estudo iremos fazer uma análise
factorial exploratória de dados, que, segundo (JACOB) “Neste caso, analise factorial é levada

3
a efeito, a fim de identificar as dimensões subjacentes que representam os constructos teóricos
do instrumento. Este procedimento é exploratório porque, presumivelmente, o investigador
não tem qualquer espectativa firme a priori baseado em teoria ou pesquisa anterior acerca da
composição de subescalas. Assim, a análise factorial é utilizada para descobrir as variáveis
latentes que estão subjacentes à escala. Para alcançar este fim, a análise factorial usa a
matriz de correlações ou a de covariâncias entre as variáveis mensuradas”.

1.4.1 Definição de conceitos

Carga factorial: A carga factorial pode ser definida como a correlação da variável com o
factor. Se essa carga assume um valor positivo, significa que a variável está positivamente
correlacionada com o factor, e, se assume valor negativo, essa correlação é negativa. Nesse
segundo caso, a variável apresenta um sentido de variação oposto ao do constructo (MATOS
& RODRIGUES, 2019).
Constructos: Também chamados de variáveis latentes são variáveis que fazem mensuração
de fenómenos que não são directamente observados (MATOS & RODRIGUES, 2019).
Correlação: Em estatı́stica, correlação é uma medida que mostra a dependência ou asso-
ciação entre duas variáveis. Diz-se que duas variáveis têm uma correlação quando a mudança
de uma variável resulta na mudança de outra variável.
Variância: A variância de uma variável aleatória ou processo estocástico é uma medida de
sua dispersão estatı́stica, indicando “o quão longe” em geral os seus valores se encontram do
valor esperado.
Variável: Em estatı́stica, variável é a caracterı́stica dos elementos da amostra que nos in-
teressa para averiguar estatisticamente.
Variáveis correlacionadas: normalmente expressa pelo coeficiente de correlação, duas
variáveis dizem-se correlacionadas quando o módulo do seu coeficiente de correlação é di-
ferente de zero, e diz-se que são fortemente correlacionados quando seus coeficientes estão
próximos de 1.
Comunalidades: é definida como “a quantia total da variância que uma variável original
compartilha com todas outras variáveis incluı́das na análise” (HAIR JR., WILLIAM, BA-
BIN, & ANDERSON, 2009)

2 Materiais e Métodos
2.1 Material e fontes de dados
Foi analisada uma amostra de 500 indivı́duos, provenientes de dados secundários de uma
base de dados disponibilizada pelo docente, de um conjunto de dados colhidos, para poste-
rior análise, de forma a aplicar a análise factorial exploratória e identificação de possı́veis

4
novas dimensões dos mesmos. O processamento de dados foi feito no software R de análise
de dados, e a digitação do presente relatório feito no editor de texto LaTeX.
Os dados resultam de um questionário com 12 questões (variáveis), aplicado por uma cadeia
de supermercados a 500 dos seus clientes com objectivo de obter sua percepção sobre o ato
de fazer compras. As respostas a essas questoes foram classificadas em uma escala com 7
pontos, nomeadamente: 1. Discordo totalmente; 2. Discordo; 3. Discordo pouco; 4. Não
concordo nem discordo; 5. Concordo pouco; 6. Concordo e 7. Concordo totalmente.

Tabela 1: Descrição dos dados


Variável Descrição
a É muito importante que a loja esteja bem organizada
b Quando saio às compras, sei exatamente o que vou fazer
c Fazendo compras cumpro com o meu dever e minha responsabilidade
d Gosto de fazer compras
e Faço compras no lugar de lazer
f Gosto da atmosfera durante as compras
g Fazer compras é uma chatice
h Tento reduzir ao mı́nimo o tempo que gasto em compras
i Gosto de ver rostos familiares no supermercado
j Em geral quando vou as compras levo comigo uma lista
k Gosto de ir às compras com toda a famı́lia
l Gosto de ter uma reserva dos principais produtos de consumo em casa

2.2 Métodos
Segundo (MARCONI & LAKATOS, 2007) “a utilização de métodos cientı́ficos não é da
alçada exclusiva da ciência, mas não há ciência sem o emprego de métodos cientı́ficos”.
Neste estudo foi aplicada uma abordagem quantitativa, que, segundo (ZANELA, 2009) “A
pesquisa quantitaiva se preocupa com a representatividade numérica, utiliza-se medição ob-
jetiva e quantificação, verifica-se nela a presença de emprego de dados estatı́sticos, a coleta
de dados tem por finalidade medir as relações entre as variáveis. Além disso, quando retrata
os resultados quantifica-os, transformando-os em dados estatı́sticos. Muito utilizado em
pesquisas que medem opiniões, atitudes e preferências como comportamentos”. Aplicou-se
também o método exploratorio.
A amostra foi constituida por 500 clientes da cadeia de supermercados, considerando que os
dados são secundários, e supondo que a cadeia dos supermercados têm localização distinta,
acreditamos que tenha se aplicado uma amostragem aleatória estratificada proporcional, sa-
tisfazendo assim o requisito da representatividade.
Verificação de pressupostos para aplicação de AFE
Os pressupostos da AFE é verificar se a aplicação da análise factorial tem validade para as
variáveis escolhidas, sendo justificado pela pouca quantidade de respondentes da pesquisa.
Para isso, dois métodos de avaliação são mais comumente utilizados, o critério de Kaiser
Meyer-Olkin (KMO) e o Teste de Esfericidade de Bartlett (DZIUBAN & SHIRKEY, 1974).

5
O ı́ndice de KMO, também conhecido como ı́ndice de adequação da amostra, é um teste
estatı́stico que sugere a proporção de variância dos itens que pode estar sendo explicada
por uma variável latente, tal ı́ndice indica o quão adequado é a aplicação da AFE para o
conjunto de dados (HAIR JR., WILLIAM, BABIN, & ANDERSON, 2009).
Como regra para interpretação dos ı́ndices de KMO, valores menores que 0,5 são considera-
dos inadequados, valores entre 0,5 e 0,7 são considerados medı́ocres; valores entre 0,7 e 0,8
são considerados bons; valores maiores que 0,8 e 0,9 são considerados óptimos e excelentes,
respectivamente (HUTCHESON & SOFRONIOU, 1999).
Os valores do teste de esfericidade de Bartlett com nı́veis de significância (p ¡0,05) indicam
que a matriz é favorável, rejeitando a hipótese nula de que a matriz de dados é similar a
uma matriz identidade (TABACHNICK; FIDELL, 2007).
Nesta análise, começou – se por verificar a adequação das amostras contidas na base de dados
compras, onde para todas as variáveis procurou –se verificar se possuı́am uma medida de
adequação maior ou igual a 0.5. De seguida fez –se a analise factorial com as componentes
principais com o intento de obter os factores relevantes para análise, onde seguiu – se com a
aplicação da rotação varimax na análise factorial pelo método da máxima verossimilhança,
realizou – se a comparação das amostras repartidas em duas partes e verificou –se o agru-
pamento e por fim nomeou-se as variáveis obtidas pelo método da máxima verossimilhança
julgado o melhor modelo para a extração dos factores relevantes.

3 Aplicação aos dados


Depois da inspensão dos dados, foi possı́vel verificar 16 omissos, tendo sido removidos da
base para permitir a aplicação da análise fatorial exploratória, reduzindo desta forma o ta-
manho da amostra para 484 elementos.
Depois da verificação de pressupostos, notou-se que as variáveis apresentam correlação mo-
derada, excepto as variáveis i) e l), que tem uma correlação menor que 0,30 com as demais
variáveis, como se pode ver na tabela 2 das matriz das correlações.

3.1 Teste de Adequação da Amostra (KMO)


Ainda no diagnóstico dos dados o valor de Qui-Quadrado do teste de significância de Bartlett
é χ2 = 2155.8 e com p-value= 0, este valor é suficientemente menor que 0.05, o que nos leva
a rejeitar a hipótese nula de que a AFE não é adequado para esses dados. O teste de
KMO= 0.82 mostra que os dados são adequados para aplicação de Analise Factorial.

6
Tabela 2: Matriz de correlações
a b c d e f g h i j k l
a 1.00 0.54 0.35 0.00 -0.07 0.03 0.08 0.15 0.09 0.44 0.06 0.23
b 0.54 1.00 0.27 0.00 0.01 0.06 0.03 0.23 0.06 0.36 0.15 0.11
c 0.35 0.27 1.00 0.20 0.12 0.16 -0.04 0.02 0.17 0.12 0.09 0.13
d 0.00 0.00 0.20 1.00 0.58 0.73 -0.80 -0.59 0.22 -0.06 0.38 0.08
e -0.07 0.01 0.12 0.58 1.00 0.62 -0.61 -0.49 0.17 -0.08 0.28 0.05
f 0.03 0.06 0.16 0.73 0.62 1.00 -0.72 -0.54 0.30 -0.03 0.36 0.10
g 0.08 0.03 -0.04 -0.80 -0.61 -0.72 1.00 0.64 -0.18 0.11 -0.31 0.01
h 0.15 0.23 0.02 -0.59 -0.49 -0.54 0.64 1.00 -0.04 0.08 -0.20 -0.02
i 0.09 0.06 0.17 0.22 0.17 0.30 -0.18 -0.04 1.00 0.04 0.20 0.16
j 0.44 0.36 0.12 -0.06 -0.08 -0.03 0.11 0.08 0.04 1.00 0.13 0.21
k 0.06 0.15 0.09 0.38 0.28 0.36 -0.31 -0.20 0.20 0.13 1.00 0.20
l 0.23 0.11 0.13 0.08 0.05 0.10 0.01 -0.02 0.16 0.21 0.20 1.00

Tabela 3: Medidas de adequação da amostra

Kaiser-Meyer-Olkin factor adequacy

Overall MAS = 0.82


MAS para cada item =
a b c d e f g h i j k l
0.68 0.66 0.67 0.83 0.92 0.89 0.82 0.87 0.78 0.73 0.86 0.70

3.2 Análise Factorial com Componentes Principais


3.2.1 Aplicação da análise factorial sem o emprego da rotação varimax

A matriz abaixo, mostra as cargas fatoriais dos fatores relevantes, comunalidades e a variância
especifica de cada variável, como pode se notar, as variáveis (d), (e), (f), (g), (h) e (k) estão
fortemente correlacionadas com o primeiro fator, as variáveis (a), (b), (c) e (j) estão forte-
mente correlacionados com o segundo fator, as variáveis (i) e (l) estão fortemente correlaci-
onadas com o terceiro factor.
A matriz de autovalores abaixo, mostra três fatores com raiz latente maior que 1, e proporção
da variância explicada de 60% nos três primeiros fatores. O gráfico Scree plot, da análise,
também mostra três fatores cujos seus autovalores estão acima de 1. Estes dados sugerem
que as 12 variáveis em análise podem ser reduzidas em três novas variáveis (factores) de
forma a facilitar sua compreensão e interpretação.

7
Tabela 4: Escores factoriais sem a rotação varimax
PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 h2 u2 com
a -0.03 0.81 -0.22 -0.01 -0.11 -0.14 0.11 -0.28 0.39 0.13 -0.01 0.00 1 -2.9e-15 2.2
b 0.00 0.74 -0.32 0.02 0.29 0.10 0.36 0.04 -0.21 -0.28 -0.02 0.03 1 1.4e-15 2.9
c 0.19 0.53 -0.14 0.56 -0.38 0.28 -0.35 0.07 -0.07 -0.05 0.01 -0.06 1 0.0e+00 4.6
d 0.89 0.00 -0.09 0.03 -0.04 0.02 -0.02 -0.16 -0.17 0.18 -0.18 0.28 1 -8.9e-16 1.6
e 0.77 -0.06 -0.10 0.03 -0.03 0.03 0.17 0.53 0.27 0.02 -0.08 0.03 1 -1.1e-15 2.3
f 0.87 0.06 -0.03 0.05 0.04 -0.07 0.09 -0.01 -0.09 0.14 0.44 -0.01 1 1.1e-16 1.6
g -0.88 0.13 0.16 0.05 -0.04 0.08 -0.08 0.13 0.12 -0.09 0.19 0.30 1 -4.4e-16 1.6
h -0.72 0.27 0.11 0.24 0.24 0.16 0.17 0.15 -0.12 0.43 -0.04 -0.03 1 5.6e-16 3.1
i 0.32 0.25 0.57 0.48 0.28 -0.42 -0.04 -0.01 0.03 -0.10 -0.06 0.01 1 -2.2e-16 4.7
j -0.06 0.65 -0.08 -0.46 0.05 -0.35 -0.39 0.23 -0.14 0.07 -0.01 -0.01 1 7.8e-16 3.8
k 0.49 0.26 0.31 -0.25 0.43 0.51 -0.24 -0.08 0.14 -0.02 0.00 -0.02 1 -1.1e-15 5.5
l 0.13 0.43 0.61 -0.29 -0.49 0.10 0.27 0.02 -0.10 -0.01 -0.02 -0.02 1 -6.7e-16 4.1

PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12
SS loadings 3.83 2.32 1.03 0.97 0.81 0.72 0.61 0.50 0.39 0.36 0.28 0.18
Proportion Var 0.32 0.19 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.03 0.02 0.01
Cumulative Var 0.32 0.51 0.60 0.68 0.75 0.81 0.86 0.90 0.93 0.96 0.99 1.00
Proportion Explained 0.32 0.19 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.03 0.02 0.01
Cumulative Proportion 0.32 0.51 0.60 0.68 0.75 0.81 0.86 0.90 0.93 0.96 0.99 1.00

d
g 0.9
−0.9
f 0.9 PC1
0.8
3

e −0.7
0.5
Autovalores

k
2

0.8 PC2
a
0.7
0.6
b 0.5
1

c PC3
0.6
l 0.6
2 4 6 8 10 12
i
Componentes principais

Figura 1: Sree plot e Diagrama com os factores relevantes

8
0.0 0.2 0.4 0.6 0.8

4 6 46
5 5

0.5
11 11
9 9
12 3 3 12
PC1

0.0
10 2 1 2 1 10

−0.5
8 8
7 7
0.0 0.2 0.4 0.6 0.8

1 1
2 2
10 10
3 3
12 12
8
PC2 8
9 11 11 9
7 7
6 6
4 4
5 5

0.6
12 9 9 12

11 11

0.2
7 8 7 8 PC3
10 6 6 10
3 5 4 5 4 3

−0.2
1 1
2 2

−0.5 0.0 0.5 −0.2 0.0 0.2 0.4 0.6

Figura 2: Diagrama de dispersão com os escores factoriais relevantes

Os gráficos de dispersão com os escores relevantes mostra que existe uma relação linear
entre o componente principal 1 e componente principal 2, o mesmo acontece com o compo-
nente principal 1 e componente principal 3 assim como existe relação entre o componente 2
e componente 3.

Tabela 5: Análise fatorial com máxima verossimilhança, incluindo uma rotação varimax
item ML1 ML2 ML4 ML3 ML5 ML6 ML8 ML10 ML9 ML11 ML12 ML7 h2 u2
a 1 -0.06 0.67 0.10 0.25 -0.01 -0.01 0 0 0 0 0 0 0.52 0.48
b 2 -0.03 0.62 0.07 0.21 0.21 0.01 0 0 0 0 0 0 0.47 0.53
c 3 0.09 0.28 0.16 0.43 0.01 0.00 0 0 0 0 0 0 0.30 0.70
d 4 0.85 0.00 0.15 0.13 0.02 -0.07 0 0 0 0 0 0 0.77 0.23
e 5 0.68 -0.05 0.13 0.07 0.06 0.09 0 0 0 0 0 0 0.50 0.50
f 6 0.79 0.03 0.22 0.12 0.07 0.02 0 0 0 0 0 0 0.70 0.30
g 7 -0.88 0.06 -0.04 -0.03 -0.04 0.04 0 0 0 0 0 0 0.78 0.22
h 8 -0.71 0.14 0.00 0.11 0.20 0.01 0 0 0 0 0 0 0.57 0.43
i 9 0.17 0.03 0.38 0.17 0.10 0.01 0 0 0 0 0 0 0.21 0.79
j 10 -0.07 0.63 0.15 -0.11 -0.14 0.00 0 0 0 0 0 0 0.45 0.55
k 11 0.35 0.14 0.36 -0.04 0.10 -0.04 0 0 0 0 0 0 0.29 0.71
l 12 0.02 0.22 0.38 0.04 -0.14 0.00 0 0 0 0 0 0 0.21 0.79

ML1 ML2 ML4 ML3 ML5 ML6 ML8 ML10 ML9 ML11 ML12 ML7
SS loadings 3.26 1.40 0.57 0.38 0.15 0.02 0.00 0.00 0.00 0.00 0.00 0.00
Proportion Var 0.27 0.12 0.05 0.03 0.01 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Cumulative Var 0.27 0.39 0.43 0.47 0.48 0.48 0.48 0.48 0.48 0.48 0.48 0.48
Cum. factor var 0.56 0.81 0.90 0.97 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00

9
3.3 Comparação dos resultados obtidos nos dois modelos (Com-
ponentes principais e maxima verossimilhança)
Como vimos nos resultados acima (matriz de autovalores e Scree plot), a análise feita com
método componentes principais, foi possı́vel reter três fatores (constructos) que explicam
variância acumulativa 60% da variância total das variáveis, ao passo que, na análise feita
com método máxima verossimilhança incluindo rotação varimax, usando o mesmo critério
(matriz de autovalores) podemos verificar que apenas dois fatores apresentam raiz latente
(variância) maior que 1 e os dois primeiros componentes explicam 81% da variância total,
ou seja, as 12 variáveis em análise podem ser reduzidas em duas variáveis (fatores) quando
usamos o método de máxima verossimilhança.

3.3.1 Gráfico de dispersão dos escores fatoriais obtidos usando componentes


principais vs. escores fatoriais usando máxima verossimilhança
Escores fatoriais usando máxima verossimilhança

1.5
1.0
0.5
−0.5
−1.5

−0.5 0.0 0.5

Escores fatoriais usando ACP

Figura 3: Grafico de dispersão dos escores factoriais obtidos usando componentes principais
vs. escores fatoriais usando máxima verossimilhança

O gráfico de dispersão, mostra que existe uma relação linear positiva ou correlação signifi-
cativa entre escores fatoriais obtidos usando o método componentes principais vs. Escores
fatoriais usando método máxima verossimilhança

10
3.4 Divisão da base de dados em duas amostras e condução da
análise facorial pelo método das componentes principais

Amostra 1 Amostra 2 Base de dados

3
3

3
Autovalores

Autovalores

Autovalores

2
2

2
1

1
1

2 4 6 8 10 12 2 4 6 8 10 12 2 4 6 8 10 12

Componentes principais Componentes principais Componentes principais

Estrutura da Amostra 1 Estrutura da Amostra 2 Estrutura da Base de dados

g d d

d −0.9 f 0.9 g 0.9


0.9 0.9 −0.9
f 0.8 g −0.9 f 0.9
PC1 PC1 PC1
0.8 0.7 0.8
e −0.7 e −0.7 e −0.7
0.5 0.5 0.5
h h h

k k k
PC2 PC2 PC2
a 0.8 a 0.8 a 0.8
0.7 0.7 0.7
0.6 0.6 0.6
b b b
0.5 0.5 0.5
j j 0.4 j

c PC3 c PC3 c PC3


0.7 0.6
l 0.4 l 0.7 l 0.6

i i i

Apos feita a divisão da base de dados em dois grupos (grupo1 e grupo2) verificamos que,
as cargas factoriais divergem no agrupamento, tal como podemos ver no diagrama acima,
usando a matriz de autovalores e Scree plot é possı́vel obter três fatores relevantes para
ambos os grupos, importa referir que o grupo1 explica 62% da variância total das variáveis
ao passo que o grupo2 explica 60% da variância total das variáveis. O mesmo acontece
com os resultados obtidos do conjunto de dados completo e a amostra 1, apresentam mesmo
agrupamento das cargas fatorias nos três fatores.

11
4 Discussão de resultados
Nas análise elaboradas acreditava-se que o método das componentes principais utilizando a
rotação varimax e e nenhum tipo de rotação possuı́ssem o mesmo resultado. Porém notou-se
uma diferença enorme quando se notou que as os fatores relevantes eram sem a rotação va-
rimax agrupava por meio do método sree plot três variáveis em detrimento do método com
varimax que agrupava 7 variáveis, o que leva a acreditar que para o método das componetes
principais vale mais conduzir uma análise factorial sem a rotação varimax pois é que me-
lhor caminha para um dos objectivos da análise factorial. Julgava-se também que as duas
amostras repartidas do mesmo conjunto fossem possuir mesmo tipo de agrupamento, onde
notou - se uma divergência nos agrupamentos entre eles e apenas a amostra um possuı́a um
agrupamento convergente ao agrupamento feito a análise do conjunto principal.

5 Conclusão
Este trabalho teve como objectivo aplicar a AFE na identificação de possiveis dimensões ou
factores relativos aos dados em estudo e sua caracterização contudo foram feitas algumas
análises para responder as questões de pesquisa propostas.
Com os casos relatados acima, o grupo concluiu que há necessidade de usar a análise fatorial
usando o método máxima verossimilhança com rotação varimax pois apresenta melhores
resultados tem poucos fatores (2) e explicam maior variância (81%), contra (3) factores que
explicam (60%) obtidos na analise usando componentes principais. As 12 variaveis em estudo
podem ser reduzidas para duas variáveis latentes (construtos) e podem ser nomeadas como:
ML1- Satisfacao com compra e ML2- Satisfacao com a organização.

12
6 Referências Bibliográficas
DIANA, J. (2020). Pesquisa Descritiva, Exploratoria e Explicativa. Londrina.
DZIUBAN, C. D., & SHIRKEY, E. S. (1974). When is a correlation matrix appropriate dor
factor analysis? Some decision rules. Bull.
FIELD, A. (2005). Discovering statistics Using SPSS (2 ed.). London: Sage.
HAIR JR., J. F., WILLIAM, B., BABIN, B., & ANDERSON, R. E. (2009). Análise Multi-
variada de dados (6 ed.). Porto Alegre: Bookman.
HONGYU, K. S. (2016). Análise de Componentes Principais: resumo teórico, aplicação e
interpretação. (5 ed., Vol. 1). E&S - Engineering and Science.
HUTCHESON, G. D., & SOFRONIOU, N. (1999). The multivariate social scientist: Intro-
ductory statistics using generalized linear models. London: Sage Publications.
JACOB, A. L. (s.d.). O Uso da Análise Factorial: Algumas Directrizes para Pesquisadores .
MARCONI, M. d.,& LAKATOS, E. M. (2007). Metodologia cientifica: ciência e conheci-
mento cientı́fico, métodos cientı́ficos, teoria, hipóteses e variáveis (5 ed.). São Paulo: Atlas.
MATOS, D. A., & RODRIGUES, E. C. (2019). ANÁLISE FACTORIAL. Brasil - DF: Enap.
MENDEZ, M. C., & RONDON, S. M. (2012). Introducción al análisis factorial exploratorio.
Bogotá, v. 41, n. 1, p.197-207, ene: Revista Colombiana de Psiquiatria.
OLIVEIRA, B. (2019). Analise Factorial: Uma importante Técnica Multivariada. DATA
SCIENCE, PRODUÇÃO CIENTÍFICA.
PASQUALI, L. (1999). Análise Fatorial: um manual teórico-práctico . Brası́lia: Edito-
raUnB.
ZANELA, C. (2009). Metodologia de estudo de pesquisa em administração. (UFSC/ MEC/
CAPES/ PNAP, Ed.) Florianópolis: Fascı́culo de Metodologia Cientı́fica.

13
7 Anexos
7.0.1 Aplicação da análise factorial com o emprego da rotação varimax

Tabela 6: Escores factoriais com rotação varimax


RC1 RC4 RC6 RC3 RC7 RC2 RC5 RC8 RC9 RC10 RC11 RC12 h2 u2 com
a -0.02 0.17 0.01 0.04 0.22 0.26 0.11 -0.04 0.91 0.05 0.01 0.00 1 -2.9e-15 1.4
b 0.00 0.12 0.07 0.02 0.16 0.94 0.03 0.01 0.24 0.11 0.02 0.00 1 1.4e-15 1.3
c 0.06 0.97 0.03 0.08 0.04 0.11 0.05 0.04 0.15 0.02 0.03 0.01 1 0.0e+00 1.1
d 0.88 0.12 0.17 0.09 -0.03 -0.01 0.04 0.19 0.00 -0.19 0.12 0.29 1 -8.9e-16 1.6
e 0.38 0.06 0.11 0.06 -0.04 0.01 0.02 0.89 -0.04 -0.17 0.14 0.00 1 -1.1e-15 1.6
f 0.57 0.07 0.16 0.16 -0.01 0.04 0.04 0.27 0.02 -0.20 0.71 0.00 1 1.1e-16 2.7
g -0.87 0.03 -0.11 -0.07 0.05 0.00 0.03 -0.23 0.03 0.24 -0.12 0.31 1 -4.4e-16 1.7
h -0.42 0.02 -0.07 0.01 0.01 0.13 -0.01 -0.18 0.06 0.87 -0.11 0.00 1 5.6e-16 1.7
i 0.10 0.07 0.08 0.98 0.01 0.02 0.07 0.05 0.03 0.01 0.07 0.00 1 -2.2e-16 1.1
j -0.05 0.04 0.06 0.01 0.96 0.15 0.09 -0.03 0.19 0.01 -0.01 0.00 1 7.8e-16 1.2
k 0.19 0.03 0.96 0.09 0.06 0.07 0.10 0.09 0.01 -0.05 0.07 0.00 1 -1.1e-15 1.2
l 0.01 0.05 0.09 0.07 0.09 0.03 0.98 0.02 0.09 -0.01 0.02 0.00 1 -6.7e-16 1.1

RC1 RC4 RC6 RC3 RC7 RC2 RC5 RC8 RC9 RC10 RC11 RC12
SS loadings 2.23 1.03 1.03 1.03 1.02 1.01 1.01 0.99 0.96 0.93 0.57 0.18
Proportion Var 0.19 0.09 0.09 0.09 0.08 0.08 0.08 0.08 0.08 0.08 0.05 0.02
Cumulative Var 0.19 0.27 0.36 0.44 0.53 0.61 0.70 0.78 0.86 0.94 0.98 1.00
Proportion Explained 0.19 0.09 0.09 0.09 0.08 0.08 0.08 0.08 0.08 0.08 0.05 0.02
Cumulative Proportion 0.19 0.27 0.36 0.44 0.53 0.61 0.70 0.78 0.86 0.94 0.98 1.00

g
d −0.9
0.9
f
3

0.8
e 0.7 ML1
Autovalores

h −0.7
2

0.4
k
i
1

a 0.8
0.7 ML2
b
0

j 0.5
0.4
2 4 6 8 10 12 c
l
factores

Figura 4: Diagrama dos factores relevantes e suas respectivas variáveis relacionadas usando
o metodo da máxima verossimilhança

14

Você também pode gostar