Você está na página 1de 18

Universidade Eduardo Mondlane

Faculdade de Ciências
Departamento de Matemática e Informática
Curso de Licenciatura em Estatística
Estatística Multivarida

3o ano Semestre II

Análise da percepção sobre o acto de fazer compras nos supermercados,


aplicando análise factorial

Discentes
Anísio Osias Inguane
Carlos Alberto
Écio Langa
Emelita Noé
Ivone Pedro Ussivane

Docente:
Osvaldo Loquiha

Maputo, Outubro de 2022


Conteúdo
1 Introdução 1
1.1 Revisão bibliográfica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Análise factorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Análise de componentes principais . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2.1 Suposições para aplicação da análise factorial . . . . . . . . . . . . . 1
1.2.2 Método de Obtenção de Factores . . . . . . . . . . . . . . . . . . . . . 2
1.2.3 Rotação dos factores . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3 Objectivos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.1 Objectivo geral: . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.3.2 Objectivos específicos: . . . . . . . . . . . . . . . . . . . . . . . . . 2

2 Metodologia 2

3 Dados e Material 3
3.1 Material . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.1.1 População e Amostra . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.1.2 Instrumento de Recolha de Dados . . . . . . . . . . . . . . . . . . . . 3
3.2 Descrição das variáveis . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3
3.3 Pacotes usados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4

4 Resultados 5
4.1 Verificação dos pressupostos para a aplicação da análise factorial . . . . . . . . 5
4.2 Extracção dos factores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 5
4.3 Divisão da amostra em duas partes . . . . . . . . . . . . . . . . . . . . . . . . 9
4.3.1 Verificação dos pressupostos para a aplicação da análise factorial nas
duas amostras . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 9
4.4 Análise da composição dos fatores . . . . . . . . . . . . . . . . . . . . . . . . 10

5 Discussão 11

6 Conclusão 12

7 Referências bibliográficas 13

8 Anexos 14
8.1 procedimento no R . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1 Introdução
O processo de escolha de um determinado produto envolve a combinação das características do
consumidor e da compra com as características do produto. Os indivíduos adotam diferentes cri-
térios de avaliação para tomar a sua decisão, comparando as diversas opções existentes de acordo
com a sua percepção de performance desempenhada por cada um destes critérios (Blackwellet
al., 2005). As vezes, por se tomar uma decisão usando a intuição, não se idêntifica, de maneira
sistemática, esses fatores, ou essas variáveis, ou seja, não são idêntificadas quais as variáveis
que afetaram a tomada de decisão (Vicini,2005).
A estatística dispõe de diversas técnicas para a análise de um conjunto de características de pes-
soas ou objetos, que podem auxiliar na tomada de decisão com um certo grau de confiança.
Neste contexto, segundo Viali(2012), técnicas analíticas multivariadas estão sendo largamente
aplicadas hoje na indústria para a tomada de decisão. Hoje já não faz mais sentido seguir o
que a pouco tempo ainda era comum, considerar os consumidores como um grupo homogêneo
e caracterizado por um pequeno grupo de variáveis demográficas. Ao contrário, é necessário
desenvolver estratégias que atinjam grupos variados de consumidores com características de-
mográficas e psicográficas em um mercado com múltiplas restrições.

No presente estudo, pretende-se explorar duas técnicas da estatística multivariada nomeada-


mente: Análise fatorial usando método das componentes principais e da máxima verossimi-
lhança para identificar os possíveis fatores relativos a percepção dos clientes de uma cadeia de
supermercados sobre o ato de fazer compras.

1.1 Revisão bibliográfica


1.1.1 Análise factorial
Segundo de Reis (2001), a análise factorial de componentes principais é um método estatístico
multivariado que permite transformar um conjunto de variáveis iniciais correlacionadas entre si,
num outro conjunto de variáveis não correlacionadas (ortogonais), as chamadas componentes
principais, que resultam de combinações lineares do conjunto inicial de dados. As componentes
principais são calculadas por ordem decrescente de importância, isto é, a primeira componente
explica o máximo possível da variância dos dados originais, a segunda o máximo possível da
variância ainda não explicada, e assim por diante.

1.2 Análise de componentes principais


A análise de componentes principais é uma técnica que se precupa com a extração da informação
a partir de uma matriz de covariância ou correlação tal que um grupo de p variáveis aleatórias
possa ser representado por menos de p componentes de variáveis.

1.2.1 Suposições para aplicação da análise factorial


Kaiser-Meyer-Olkin (KMO) é uma estatística que varia entre zero a um, e compara as correla-
ções de ordem zero com as correlações parcias observadas entre as variáveis. Os valores obtidos
através deste teste variam entre 0 e 1, onde 0,80 ou acima é admirável; 0,70 ou acima, mediano;
0,60 ou acima, medíocre; 0,50 ou acima, mau; e abaixo de 0,50, inaceitável.

Teste de Esfericidade de Bartlett: estatística de teste usada para examinar a hipótese de que as
variáveis não sejam correlacionadas na população, ou seja, a matriz de correlação da população
é uma matriz identidade, onde cada variável se correlaciona perfeitamente com ela própria (r =

1
1), mas não apresenta correlação com as outras variáveis (r = 0). A significância para o teste
não deve ultrapassar 0,05.

1.2.2 Método de Obtenção de Factores


Existem vários critérios para determinar o número de factores a reter, no entanto existem 4
(quatro) métodos de estimação de parâmetros do modelo de factores mais usados, dos quais:
• O critério do Scree plot: é determinado fazendo-se o gráfico das raízes latentes em
relação ao número de factores em sua ordem de extracção, e a forma da curva resultante
é usada para avaliar o ponto de corte. O ponto no qual a curva começa a ser horizontal é
considerado o indicativo do número máximo de factores a serem retidos.
• Critério da raiz latente: este método consiste em reter apenas factores que representam
raiz latente ou que têm autovalores maiores que um (1) e todos os factores com raízes
latentes menores do que um (1) são considerados insignificantes.
• Critério de Variância explicada: pressupõe que devem ser incluídos ou retidos factores
que explicam mais que 60% da variância total.
• Critério de retenção a priori: neste método a determinação do número de factores é feita
pelo investigador tendo em conta o conhecimento dos extractos nos dados em análise.

1.2.3 Rotação dos factores


Segundo Faria (2006), rotação factorial é uma técnica para girar os eixos de referência dos
factores, até alcançar uma posição ideal. O objectivo é facilitar a leitura dos factores, pois a
rotação deixa as cargas factoriais (loadings) mais altas num factor e as mais baixas em outros,
definindo mais claramente os grupos de variáveis que fazem parte de cada factor estudado. Os
métodos de rotação podem ser ortogonais, caso de Varimax, Quartimax e Equamax, ou oblíquos,
caso de Direct, Oblimin e Proma

1.3 Objectivos
1.3.1 Objectivo geral:
Analisar os fatores determinantes relativos ao ato de fazer compras dos clientes de uma
cadeia de supermercado.

1.3.2 Objectivos específicos:


• Identificar as estruturas fatoriais subjacentes nas variáveis
• Aplicar a análise fatorial com o método de componentes e principais e de máxima veros-
similhaça.

2 Metodologia
Para alcancar os objectivos inicialmente tracados comecou-se por construir a matriz de correla-
coes, onde observou-se que grande parte das variaveies possui correlacao acima de 0,3.

Para testar se os dados estão suficientemente ligados e proceder à análise foi utilizado o mé-
todo de Kaiser-Meyer-Olkin Measure of Sampling Adequacy (KMO), que mede a adequação

2
dos dados, onde valores iguais ou menores do que 0,5 indicam que a realização da análise fato-
rial é insatisfatória devido a correlação fraca entre as variáveis. outro teste que precede a Análise
Fatorial com vistas a verificação de suas premissas, é o Bartlett Test of Sphericity (BTS), que
testa a hipótese de que a matriz de correlação é uma matriz identidade ou seja, que não há cor-
relação entre as variáveis para enconcontrar os autovalores usou-se a analise de componentes
principais pois garante obter fatores únicos e não-correlacionados.

Em siguida Para a extração dos fatores foi usado o critério de Kaiser (autovalor maior do que 1),
De acordo com o critério da variância acumulada (manter um número de fatores que capte pelo
menos 60% da variância acumulada), Finalmente, pelo diagrama de declividade (Scree test), são
retidos os fatores com variancia maior do que 1.
Com vista a melhorar a interpretação dos fatores foi feita a rotação varimax e foi usado o método
de máxima verossimilhança com rotação varimax.
E posteriormente a amostra foi dividida em duas partes para verificar se os factores continuam
os mesmos .

3 Dados e Material
3.1 Material
3.1.1 População e Amostra
A população designada para esta pesquisa são todos os clientes dos supermecados. Para unidades
amostrais foram inquiridos 500 dos seus clientes do universo definido como população.

3.1.2 Instrumento de Recolha de Dados


Usou-se um questionário para a colecta de dados, no qual apresenta-se as sugestões ao clientes
para dar a sua apreciação sobre como encara a actividade de “fazer compras”.

3.2 Descrição das variáveis


No presente trabalho usou-se variáveis nominais categóricas, em que tem-se como atribuição
para as categorias:

1. Discordo totalmente 2. Discordo 3. Discordo pouco


4. Não concordo nem discordo 5. Concordo pouco 6. Concordo
7. Concordo Totalmente

Onde foram definidas 12 variáveis para as 7 categorias.

3
Tabela 1: Apresentação das variáveis e sua descrição

Como encara a actividade de “fazer compras?” 1 2 3 4 5 6 7


a. É muito importante que a loja esteja bem organizada
b. Quando saio às compras, sei exatamente o que vou fazer
c. Fazendo compras cumpro com o meu dever e minha responsabilidade
d. Gosto de fazer compras
e. Faço compras no lugar de lazer
f. Gosto da atmosfera durante as compras
g. Fazer compras é uma chatice
h. Tento reduzir ao mínimo o tempo que gasto em compras
i. Gosto de ver rostos familiares no supermercado
j. Em geral quando vou as compras levo comigo uma lista
k. Gosto de ir às compras com toda a família
l. Gosto de ter uma reserva dos principais produtos de consumo em casa

3.3 Pacotes usados


Para a análise de dados foi usado o pacote R Studio. Para digitação do relatório foi usado o
programa de edição de textos TeXstudio.

4
4 Resultados
4.1 Verificação dos pressupostos para a aplicação da análise factorial
O coeficiente de correlação de Pearson (1925) é um indicador da força de uma relação linear
entre duas variáveis intervalares, sendo definido o intervalo de -1 a 1. Na tabela 2 são apresen-
tadas as correlações entre as variáveis analisadas no presente trabalho.
De acordo com o coeficiente de correlação de Pearson, observamos que as variáveis d e f, g e
d e f e g são altamente correlacionadas. Já as variáveis a-b, d-e, h-d, e-f, g-e , h-f e g-h são
moderadamente correlacionadas.

Tabela 2: Matriz das correlações

Variáveis a b c d e f g h i j k l
a 1 0.53 0.35 0.01 -0.07 0.04 0.07 0.15 0.09 0.44 0.07 0.23
b 0.53 1 0.27 -0.003 -0.01 0.06 0.04 0.23 0.07 0.35 0.14 0.10
c 0.35 0.27 1 0.20 0.13 0.17 -0.04 0.02 0.16 0.12 0.10 0.14
d 0.01 -0.003 0.20 1 0.59 0.73 -0.80 -0.59 0.21 -0.05 0.38 0.07
e -0.07 -0.01 0.13 0.59 1 0.63 -0.63 -0.50 0.15 -0.08 0.30 0.04
f 0.04 0.06 0.17 0.73 0.63 1 -0.73 -0.54 0.28 -0.02 0.38 0.09
g 0.07 0.04 -0.04 -0.80 -0.63 -0.73 1 0.64 -0.16 0.10 -0.32 0.02
h 0.15 0.23 0.02 -0.59 -0.50 -0.54 0.64 1 -0.03 0.07 -0.21 -0.01
i 0.09 0.07 0.16 0.21 0.15 0.28 -0.16 -0.03 1 0.04 0.20 0.15
j 0.44 0.35 0.12 -0.05 -0.08 -0.02 0.10 0.07 0.04 1 0.12 0.20
k 0.07 0.14 0.10 0.38 0.30 0.38 -0.32 -0.21 0.20 0.12 1 0.20
l 0.23 0.10 0.14 0.07 0.04 0.09 0.02 -0.01 0.15 0.20 0.20 1

Para se poder aplicar a análise factorial deve haver correlação entre as variáveis. O teste
de KMO que identifica o grau de inter-correlações entre as variáveis, apresentou um resultado
satisfatório de 0.8223571, o que mostra que existe uma correlação média entre as variáveis. O
teste de esfericidade de Bartlett tem associado um nível de significância de 2.22e-16, o que leva
a concluir que existe correlação entre algumas variáveis a um nível de significância de 0.05 (ver
Tabela3), pois com este nível de significância rejeita-se a hipótese da matriz das correlações na
população ser a identidade.
Ambos os testes permitem o procedimento da análise factorial.

Tabela 3: Teste de Esfericidade de Bartlett e a estatística KMO


Kaiser-Meyer-Olkin factor adequacy 0.8223571
Bartlett’s Test of Sphericity Approx. Chi-Square 2240.615
degres of fredom 66
p-value < 2.22e-16

4.2 Extracção dos factores


De acordo com Zwick e Vlier (1986), a determinação do número de componentes ou factores a
extrair é provavelmente a decisão mais importante que um investigador.
Na tabela4 são apresentados os autovalores. Neste caso, já podemos ter um indício da quantidade
de fatores a serem extraidos na análise. Utilizando o critério de Kaisar (critério da raiz latente),

5
todos os autovalores maiores que um (1) devem ser incluídos na análise fatorial, ou seja, neste
caso resiam três (3)

Tabela 4: Análise fatorial exploratória usando o Métodos de componentes principais

PC1 PC2 PC3 PC4 PC5 PC6 PC7 PC8 PC9 PC10 PC11 PC12 h2 u2 com
a -0.02 0.81 -0.22 0.00 -0.08 -0.15 0.12 -0.29 0.40 0.12 -0.01 0.00 1 0 2.2
b -0.01 0.74 -0.32 0.06 0.27 0.16 0.35 0.07 -0.21 -0.27 -0.02 0.02 1 0 3.0
c 0.19 0.53 -0.07 0.55 -0.44 0.20 -0.36 0.06 -0.08 -0.05 0.01 -0.06 1 0 4.4
d 0.89 0.01 -0.08 0.04 -0.05 0 -0.01 -0.16 -0.19 0.18 -0.19 0.27 1 0 1.6
e 0.78 -0.06 -0.09 0.03 -0.03 0.04 0.12 0.52 0.29 0.01 -0.09 0.03 1 0 2.2
f 0.87 0.06 -0.03 0.05 0.04 -0.05 0.10 0 -0.07 0.14 0.44 0.00 1 0 1.6
g -0.88 0.13 0.16 0.03 -0.04 0.07 -0.10 0.11 0.12 -0.10 0.18 0.30 1 0 1.6
h -0.73 0.27 0.12 0.23 0.19 0.21 0.15 0.16 -0.09 0.44 -0.03 -0.03 1 0 3.1
i 0.30 0.25 0.60 0.44 0.37 -0.38 -0.02 -0.01 0.03 -0.09 -0.05 0.00 1 0 4.6
j -0.06 0.65 -0.13 -0.46 0.12 -0.35 -0.38 0.21 -0.14 0.08 -0.01 -0.01 1 0 3.9
k 0.50 0.26 0.29 -0.27 0.34 0.56 -0.25 -0.10 0.12 -0.03 0.00 -0.02 1 0 5.0
l 0.11 0.43 0.60 -0.35 -0.48 0.03 0.28 0.04 -0.09 -0.02 -0.02 -0.02 1 0 4.2
SS 3.85 2.31 1.04 0.96 0.82 0.73 0.61 0.49 0.40 0.36 0.27 0.17
P Var 0.32 0.19 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.03 0.02 0.01
C Var 0.32 0.51 0.60 0.68 0.75 0.81 0.86 0.90 0.93 0.96 0.99 1

Com o grafico Scree plot (figura 1), é posivel identificar o ”cotovelo”no terceiro compo-
nente. Então a partir dos dois métodos foi decidido a extracção de três fatores, pois o três (3) é
um valor comum utilizando os dois métodos (critério de Kaisar e gráfico Scree plot)

Figura 1: Scree plot

Observando-se na figura 2, pode-se verificar que os escores estão dispersos, não havendo
nenhuma observação atípica, para os três fatores.

6
Figura 2: gráficos de dispersão com os escores fatoriais relevantes

Como verificamos na Tabela 5 agumas variáveis não ficaram alocadas num único fator.
No modelo fatorial ortoginal, as cargas fatorias não podem ter grandezas numéricas relevantes
próximos em mais de um fator e isso ocorreu com mais de uma variáveis.

Tabela 5: AFE sem rotação

PC1 PC2 PC3 h2 u2 com


a -0.02 0.81 -0.22 0.70 0.30 1.2
b -0.01 0.74 -0.32 0.65 0.35 1.4
c 0.19 0.53 -0.07 0.32 0.68 1.3
d 0.89 0.01 -0.08 0.79 0.21 1.0
e 0.78 -0.06 -0.09 0.62 0.38 1.0
f 0.87 0.06 -0.03 0.76 0.24 1.0
g -0.88 0.13 0.16 0.82 0.18 1.1
h -0.73 0.27 0.12 0.61 0.39 1.3
i 0.30 0.25 0.60 0.51 0.49 1.9
j -0.06 0.65 -0.13 0.44 0.56 1.1
k 0.50 0.26 0.29 0.40 0.60 2.2
l 0.11 0.43 0.60 0.55 0.45 1.9
SS loadings 3.85 2.31 1.04
Proportion Var 0.32 0.19 0.09
Cumulative Var 0.32 0.51 0.60
Proportion Explained 0.54 0.32 0.14
Cumulative Proportion 0.54 0.86 1

Na solução rotacionada o problem a de uma variável aparecer em mais de um fator ocorreu,


onde verificou-se que a variável k é relevante para primeiro e terceiro fator, portanto ela foi
alocada no compontente com maior carga fatorial.

7
Tabela 6: AFE com rotação varimax

RC1 RC2 RC3 h3 u3 com


a -0.06 0.83 0.08 0.70 0.30 1.0
b -0.02 0.81 -0.03 0.65 0.35 1.0
c 0.14 0.52 0.17 0.32 0.68 1.4
d 0.88 0.06 0.14 0.79 0.21 1.1
e 0.78 0.00 0.08 0.62 0.38 1.0
f 0.85 0.09 0.20 0.76 0.24 1.1
g -0.90 0.04 -0.02 0.82 0.18 1.0
h -0.76 0.19 0.03 0.61 0.39 1.1
i 0.14 0.02 0.70 0.51 0.49 1.1
j -0.10 0.65 0.11 0.44 0.56 1.1
k 0.40 0.14 0.47 0.40 0.60 2.1
l -0.06 0.17 0.72 0.55 0.45 1.1
SS loadings 3.71 2.13 1.35
Proportion Var 0.31 0.18 0.11
Cumulative Var 0.31 0.49 0.60
Proportion Explained 0.52 0.30 0.19
Cumulative Proportion 0.52 0.81 1

Tabela 7: AFE usando Máxima verossimilhança com rotação varimax

ML1 ML2 ML3 h2 u2 com


a -0, 04 0.81 0.13 0.67 0.33 1.1
b -0.02 0.65 0.11 0.44 0.56 1.1
c 0.09 0.35 0.33 0.24 0.76 2.1
d 0,86 0, 02 0.19 0.77 0.23 1.1
e 0.68 -0.07 0.21 0.51 0.49 1.2
f 0.79 0.03 0.31 0.72 0.28 1.3
g -0.94 0.03 0.05 0.89 0.11 1.0
h -0.68 0.18 -0.01 0.50 0.50 1.1
i 0.18 0.07 0.36 0.17 0.83 1.5
j -0.08 0.51 0.11 0.28 0.72 1.1
k 0,36 0.10 0.33 0.24 0.76 2.1
l 0.00 0.20 0.33 0.15 0.85 1.7
SS loadings 3.34 1.55 0.68
Proportion Var 0.28 0.13 0.06
Cumulative Var 0.28 0.41 0.46
Proportion Explained 0.60 0.28 0.12
Cumulative Proportion 0.60 0.88 1

De acordo com a figura 3, observa-se uma tendência linear positiva entre os escores fatorias
obtidos usando componentes principais vs máxima verossimilhança.

8
Figura 3: gráfico de dispersão dos escores fatoriais obtidos usando componentes principais vs.
escores fatoriais usando máxima verossimilhança.

4.3 Divisão da amostra em duas partes


4.3.1 Verificação dos pressupostos para a aplicação da análise factorial nas duas amos-
tras

Tabela 8: Teste de Esfericidade de Bartlett e a estatística KMO para as duas amostras

Primeira metade Segunda metade

Kaiser-Meyer-Olkin 0.8025336 0.8208546


Bartlett’s Test Approx. Chi-Square 1179.036 1121.899
degres of fredom 66 66
p-value < 2.22e-16 2.22e-16

Figura 4: Scree plot

9
Dividindo a amostra em duas partes pode-se observar que as cargas fatorias significativas estão
agrupados da mesma forma excepto na variável l, na primeira metade ela pertence a terceiro
fator e na segunda metade ela está alocado no segundo fator.

Tabela 9: AFE da primeira metade vs segunda metade sem rotação

Primeira metade Segunda metade

PC1 PC2 PC3 h2 u2 com PC1 PC2 PC3 h2 u2 com


a -0.17 0.80 -0.17 0.70 0.30 1.2 0.11 0.79 -0.15 0.65 0.35 1.1
b -0.13 0.73 -0.40 0.71 0.29 1.6 0.10 0.73 -0.14 0.57 0.43 1.1
c 0.13 0.54 -0.36 0.44 0.56 1.9 0.24 0.51 0.39 0.47 0.53 2.3
d 0.89 0.04 -0.08 0.80 0.20 1.0 0.89 -0.01 -0.04 0.79 0.21 1.0
e 0.78 0.11 -0.16 0.65 0.35 1.1 0.75 -0.22 0.00 0.62 0.38 1.2
f 0.84 0.19 -0.03 0.74 0.26 1.1 0.89 -0.06 0.02 0.79 0.21 1.0
g -0.89 0.05 0.09 0.80 0.20 1.0 -0.87 0.19 0.11 0.81 0.19 1.1
h -0.75 0.22 0.06 0.61 0.39 1.2 -0.71 0.30 0.21 0.64 0.36 1.5
i 0.29 0.26 0.50 0.41 0.59 2.2 0.30 0.26 0.70 0.65 0.35 1.7
j -0.20 0.65 0.12 0.48 0.52 1.3 0.07 0.61 -0.49 0.62 0.38 1.9
k 0.48 0.28 0.39 0.47 0.53 2.6 0.51 0.26 -0.02 0.33 0.67 1.5
l 0.00 0.47 0.66 0.65 0.35 1.8 0.21 0.36 0.17 0.20 0.80 2.1
SS loadings 3.88 2.36 1.22 3.90 2.24 1.01
Proportion Var 0.32 0.20 0.10 0.32 0.19 0.08
Cumulative Var 0.32 0.52 0.62 0.32 0.51 0.60
Proportion Explained 0.52 0.32 0.16 0.55 0.31 0.14
Cumulative Proportion 0.52 0.84 1 0.55 0.86 1

4.4 Análise da composição dos fatores


Descreve-se a composição dos fatores e como esses podem ser interpretado.
A solução considerada é com rotação varimax
−Fator 1 é composto pelas as variávies d, e, f, g, h, k. Este fator represeta 31% da variância
total dos dados e basicamente envolve variáveis que representa o nível de afeção do clientes
pelo ato de fazer compras. A variável g ”fazer compras é uma chatice”é a variável com maior
correlação com factor 1, notavelmente varia no sentido contrário.

−Fator 2 é composto pelas as variávies a,b,c,j. Este fator represeta 18% da variância total
dos dados, nesse fator tem se alocado as variáveis que caracterizam os requisitos para a realiza-
ção das compras. A variável a ”é muito importante que a loja esteja bem organizada”é a variável
com maior correlação com factor 2, notavelmente varia no sentido contrário.

−Fator 3 é composto pelas as variávies i, k, l. As três variáveis são positivamente correlacio-


nado com o fator e tem valores de correlação semelhante. Tais variáveis nesse fator caracterizam
a preferência de produtos e companhia para as compras
Este fator represeta 11% da variância total dos dados.

10
5 Discussão
Na análise fatorial feita para obter a percepção sobre o ato de fazer compras dos clientes em uma
cadeia de supermercados, esperava-se uma equivalência entre a análise feita usando método das
componentes principais e máxima verossimilhança, mas observa-se uma diferença entre o pri-
meiro fator da análise feita com componentes principais e o primeiro da análise feita usando o
método da máxima verosimilhança (adição da variável k), também nota-se uma diferença entre
o terceiro fator utilizando método dos componentes principais (adição da variáve k) e o terceiro
componente da análise feita usando o método da máxima verosimilhança.

Dividindo a nossa amostra em duas partes nota-se que o modelo da análise fatorial se adequa
co alguma perfeição pois, apresentam resultados similares tanto na primeira como na segunda
repartição da amostra

11
6 Conclusão
Através do trabalho desenvolvido nesse relatório conclui-se que, por meio da análise factorial,
identifou-se três grupos de variáveis subjacentes. O primeiro grupo é formado pelas variáveis
que evideciam o nível de afeção dos clientes pelo ato fazer compras. Esse primeiro grupo pode
fornecer a rede de supermercados o quão os clientes gostam ou não de fazer as compras.

O segundo grupo é constituido pelas variáveis retratam os requisitos para a realização das com-
pras. Esse grupo pode axiliar a rede de supermercados a identificar os aspectos determinantes
que fazem com que alguns clientes frequentem os supermercados.

O terceiro grupo é composto por variáveis que caracterizam a preferência de produtos e compa-
nhia para as campras. Esse terceiro e o último grupo trás a percepção para rede de supermercados
os produtos preferencias dos seus clientes

O modelo de análise fatorial teve sucesso de atender o objectivo desse trabalho, pois com sua
utilização foi possível definir os fatores determinantes relativos ao ato de fazer compras.

12
7 Referências bibliográficas
• Blackwell,R.D.,Miniard,P.W.,Engel,J.F.São Paulo:Pioneira Thomson Learning,2005

• Hair,Joseph F.et al.(2005). Análise Multivariada de Dados. 5.ed. Porto Alegre: Book-
man;

• Reis,E.(2005). Estatística Multivariada. 2.ed.Lisboa;

• Viali,L.(2012). Estatística multivariada aplicada,São Paulo.

• Vicini,L.(2005). Análise Multivariada da Teoria à Prática,Santa Maria,RS,Brasil.

13
8 Anexos
8.1 procedimento no R

library ( carData )
library ( car )
library ( dplyr )
library ( psych )
library ( stargazer )
library ( REdaS )

rm ( l i s t = l s ( ) )
s e t w d ( ”D : \ \ Documentos \ \ C u r s o de E s t a t i s t i c a \ \ 3 º Ano \ \ 2
s e m e s t r e \ \ E s t a t í s t i c a M u l t i v a r i a d a \ \ 2 0 2 2 \ \ TP2 ” )

l i b r a r y ( haven )
CAF <− r e a d _ s a v ( ” compras_AF . s a v ” )
CAF$Respondente =NULL
dim (CAF)
## E s t a t i s t i c a s d e s c r i t i v a s ##
d e s c r i b e ( CAF , skew = F , r a n g e s = F )
# Adequação p a r a u s a r a A n á l i s e F a c t o r i a l
KMO(CAF)
b a r t _ s p h e r ( CAF , u s e = ” p a i r w i s e . c o m p l e t e . o b s ” )

# Matriz das c o r r e l a ç õ e s
mcor= c o r ( CAF , u s e =” p a i r w i s e . c o m p l e t e . o b s ” )
s t a r g a z e r ( mcor , t y p e =” t e x t ” , t i t l e = ” M a t r i z d a s
c o r r e l a ç õ e s ” , d i g i t s = 2 , column . s e p . w i d t h = ” −2 p t ” )

# Método de Componentes p r i n c i p a i s
n r f a c <− f a . p a r a l l e l ( CAF , fm=” m i n r e s ” , f a =” f a ” , p l o t = T )
MAFE <− p r i n c i p a l ( mcor , n f a c t o r s = 3 , r e s i d u a l s = T ,
r o t a t e =” none ” , s c o r e s =T , c o v a r = T )
VMAFE <− p r i n c i p a l ( mcor , n f a c t o r s = 2 , r e s i d u a l s = T ,
r o t a t e =” v a r i m a x ” , s c o r e s =F , c o v a r = T )

v=MAFE$Vaccounted
s t a r g a z e r ( v , t y p e =” l a t e x ” , t i t l e = ” A n a l i s e f a t o r i a l
e x p l o r a t ó r i a u s a n d o o Métodos de c o m p o n e n t e s p r i n c i p a i s ” , d i g i t s = 2 )
a=VMAFE$Vaccounted
s t a r g a z e r ( a , t y p e =” l a t e x ” , summary = F , t i t l e = ”AFE com
r o t a ç ã o v a r i m a x ” , d i g i t s = 2 , column . s e p . w i d t h = ” −6 p t ” )

p l o t ( MAFE$values , t y p e =” b ” , y l a b =” A u t o v a l o r e s ” , x l a b =” Componentes P r i n c
a b l i n e ( a =1 , b = 0 )

p a r ( mfrow=c ( 1 , 3 ) )
a a =MAFE$weights
x= d a t a . f r a m e ( a a )
View ( x )

14
p l o t ( x$PC1 , y l a b = ” e s c o r e s f a t o r i a s ” , pch =15 , c o l =” r e d ” ,
main = ” P r i m e i r o f a t o r ” )
p l o t ( x$PC2 , y l a b = ” e s c o r e s f a t o r i a s ” , pch =15 , c o l =” b l a c k ” ,
main = ” Segundo f a t o r ” )
p l o t ( x$PC3 , y l a b = ” e s c o r e s f a t o r i a s ” , pch =15 , c o l = ’ b l u e ’ ,
main = ” T e r c e i r o f a t o r ” )

# Método da Maxima V e r o s s i m i l h a n ç a
ML <− f a ( mcor , n f a c t o r s =2 , n . o b s = NA, r o t a t e =” v a r i m a x ” ,
r e s i d u a l s = TRUE , c o v a r = TRUE , s y m m e t r i c =FALSE , fm=” ml ” )
s t a r g a z e r ( rm , t y p e =” l a t e x ” , summary = F , t i t l e = ”AFE u s a n d o
Máxima v e r o s s i m i l h a n ç a com r o t a ç ã o v a r i m a x ” , d i g i t s = 2 )
ML$weights
y= d a t a . f r a m e ( ML$weights , VMAFE$weights )
p l o t ( VMAFE$weights , ML$weights , pch =16 , c o l =” b l a c k ”
, x l a b =” e s c o r e s f a t o r i a i s u s a n d o máxima v e r o s s i m i l h a n ç a ” , y l a b = ” e s c

p l o t ( ML$weights , VMAFE$weights , pch =15 , c o l =” b l a c k ” , )

# D i v i s ã o da a m o s t r a
# p r i m e i r a metade
CAF1 <− f i l t e r ( CAF , R e s p o n d e n t e <=250)
CAF1$Respondente =NULL
mcor1= c o r ( CAF1 , u s e =” p a i r w i s e ” )
KMO( CAF1 )
b a r t _ s p h e r ( CAF1 , u s e = ” p a i r w i s e ” )
MAFE1 <− p r i n c i p a l ( mcor1 , n f a c t o r s = 1 2 , r e s i d u a l s =
T , r o t a t e =” none ” , s c o r e s =T , c o v a r = T )
a=MAFE1$Vaccounted
s t a r g a z e r ( a , t y p e =” l a t e x ” , summary = F , t i t l e = ”AFE sem
r o t a ç ã o v s com r o t a ç ã o v a r i m a x p a r a p r i m e i r a m e t a d e ” , d i g i t s = 2 , colu
VMAFE1 <− p r i n c i p a l ( mcor1 , n f a c t o r s = 3 , r e s i d u a l s = T ,
r o t a t e =” v a r i m a x ” , s c o r e s =T , c o v a r = T )
p l o t ( MAFE1$values , t y p e =” b ” , y l a b =” A u t o v a l o r e s ” ,
x l a b =” Componentes P r i n c i p a i s ” , l a b =c ( 5 , 5 , 5 ) , main =” P r i m e i r a m e t a d e da
a b l i n e ( a =1 , b = 0 )

# segunda metade
CAF2 <− f i l t e r ( CAF , R e s p o n d e n t e > 2 5 0 )
CAF2$Respondente =NULL
mcor2= c o r ( CAF2 , u s e =” p a i r w i s e ” )
KMO( CAF2 )
b a r t _ s p h e r ( CAF2 , u s e = ” p a i r w i s e ” )
c o r t e s t . b a r t l e t t ( CAF2 )
MAFE2 <− p r i n c i p a l ( mcor2 , n f a c t o r s = 3 , r e s i d u a l s = T ,
r o t a t e =” none ” , s c o r e s =T , c o v a r = T )
b=MAFE2$Vaccounted
s t a r g a z e r ( b , t y p e =” l a t e x ” , summary = F , t i t l e = ”AFE sem
r o t a ç ã o v s com r o t a ç ã o v a r i m a x p a r a p r i m e i r a m e t a d e ” , d i g i t s = 2 , colu

VMAFE2 <− p r i n c i p a l ( mcor2 , n f a c t o r s = 2 , r e s i d u a l s =


T , r o t a t e =” v a r i m a x ” , s c o r e s =T , c o v a r = T )
p l o t ( MAFE2$values , t y p e =” b ” , y l a b =” A u t o v a l o r e s ” , x l a b =” Componentes P r i n

15
a b l i n e ( a =1 , b = 0 )

16

Você também pode gostar