Você está na página 1de 5

Correcção do Exame Normal de Estatística Multivariada- 2021

1. Leia atentamente as seguintes afirmações sobre Distribuição Normal, Análise de


Componentes Principais (ACP) e Análise Factorial Exploratória (AFE) e escrever na sua folha
de exercício a opção que julgar VERDADEIRA, sem precisar justificar.

Resposta:

(c) A suposição de normalidade é necessária para os dados ao aplicar a análise de componentes


principal.

(d) Tanto a ACP como a AFE têm como objectivo a redução da dimensionalidade dos dados.

(g) Em AFE, um factor é uma dimensão subjacente que aplica as correlações entre um conjunto
de variáveis.

2. Os tempos alcançados por homens e mulheres que atingiram os recordos nacionais (nos jogos
Olímpicos de Los Angeles 1984) em corridas em distâncias de 100 metros até 5000 metros para
54 países diferentes foram analisados. Essas distâncias foram, em metros, 100, 200, 400, 800 e
1500 (tanto para os homens e mulheres), 3000 (apenas mulheres), 5000 (apenas homens). Os
tempos para distâncias de 100 ate 400 metros foram registados em segundos e de 800 até 5000
em minutos. Uma análise multivariada destes dados é apresentada no ANEXO 1, onde estas
várias corridas são referidas como, por exemplo f400m para corrida feminina de 400 metros e
m5000m para a corrida masculina de 5000 metros.

(a) Análises de Componentes Principais tanto para as mulheres como para os homens foram
realizados sobre a matriz da correlação. Haveria fortes razões em ambos os casos, para em vez
disso, usar-se as matrizes de covariância?

Resposta: Sim há fortes razões de se usar a matriz de correlação ao invés da matriz das
covariâncias, pois só usamos a matriz das covariâncias quando as variáveis são medidas com a
mesma escala, diferentemente da matriz das correlações, uma vez que os tempos para distâncias
de 100 ate 400 metros foram registados em segundos e de 800 até 5000 em minutos, escalas
diferentes.
(b) Calcule os valores em falta nas tabelas 2.a e 2.b.

Resolução:

Para Homens

% 𝑜𝑓 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 ∗ 𝑝 84.056 ∗ 6
𝑎= = = 5.04
100 100

% 𝑜𝑓 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 ∗ 𝑝 7.637 ∗ 6
𝑏= = = 0.46
100 100

Para Mulheres

% 𝑜𝑓 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 ∗ 𝑝 85.236 ∗ 6
𝑐= = = 5.11
100 100

% 𝑜𝑓 𝑉𝑎𝑟𝑖𝑎𝑛𝑐𝑒 ∗ 𝑝 9.378 ∗ 6
𝑑= = = 0.56
100 100

(c) Para análise dos dados das mulheres, que características dos tempos records os dois primeiros
componentes principais refletem (ou seja, qual é a interpretação pode ser dada a estes dois
primeiros componentes)?

Resposta: Os resultados das mulheres mostram que o primeiro componente principal explica
cerca de 85.236% da proporção da variância explicada e o segundo componente principal explica
cerca de 9.378%, os dois componentes explicam cerca 94.615% da proporção da variância
explicada acumulada.

(d) São as interpretações dos dois primeiros componentes para os dados dos homens o mesmo
que para as mulheres? Se não, quais as interpretações podem ser dadas?

Resposta: A interpretação para os homens não vai mudar, excepto os valores da proporção
variância explicada, pois para o primeiro componente principal será de 84.056% e o segundo
componente principal será de 7.637% e a variância acumulada é de 91.692%.
3. Aplicou-se uma AFE a dados indicando a classificação do desempenho de 16 indivíduos em
testes de Matemática, Física, Português, Inglês, Educação Musical e Educação Visual, com
objectivo de identificar variáveis latentes subjacentes ás disciplinas descritas. Classificar-se e
10 lugar era indicado pelo número 1 e em último 16. Os resultados relevantes encontram-se
no ANEXO II.

(a) Qual a sua escolha para m, o número de factores, usando cada um dos seguintes critérios
scree, raiz latente, e percentagem da variância explicada (acima de 80%).

Resposta: Os três critérios de extracção de factores, sugerem que extraiamos dois factores.

(b) Qual deve ser o valor de m para uma solução parcimoniosa?

Resolução

𝑃(𝑃 + 1) 6(6 + 1) 42 15
𝑃(𝑚 + 1) ≪ ⟹ 6(𝑚 + 1) ≪ ⟹ 6𝑚 + 6 ≪ ⟹𝑚≪ ⟹ 𝑚 ≪ 2.5 ≅ 3
2 2 2 6

(c) Retém 3 factores pelo método de componentes principais e produza uma rotação Varimax. O
ajuste do modelo é bom? Interprete os resultados.

Resposta: De acordo com as cargas factoriais com rotação varimax, constatou-se que o Factor 1
esta associados com as variáveis Português e Inglês, o Factor 2 esta associado as variáveis Musical
e Visual, e o Factor 3 esta associado as variáveis Matemática e Física. Em relação proporção da
variância explicada, verificou-se que o Factor 1 explica cerca de 60.26%, o Factor 2 explica cerca
27.55% e o Factor 3 explica cerca de 6.36%.

O modelo composto pelos três factores retidos mostrou um bom ajuste aos dados, os três factores
explicam cerca de 94.76% da variância explicada.

(d) Retém 3 factores pelo método de máxima verossimilhança e produza uma rotação Varimax. O
ajuste do modelo é bom? Interprete os resultados.

Resposta: Com as cargas factoriais com rotação varimax, constatou-se que o Factor 1 esta
associados com as variáveis Física, Português e Inglês, o Factor 2 esta associado as variáveis
Musical e Visual, e o Factor 3 esta associado a variável Matemática. O teste de ajuste do modelo
aos dados, mostrou que o modelo não tem um bom ajuste, pois foi rejeitada a hipótese nula de o
modelo tem um bom aos dados.
(e) Compare os resultados das alíneas (c) e (d). Alguma diferença?

Resposta:

Existem diferenças nos resultados das duas alíneas, porque os resultados obtidos pelo método
das componentes principais o Factor 1 esta associados com as variáveis Física, Português e Inglês,
o Factor 2 esta associado as variáveis Musical e Visual, e o Factor 3 esta associado a variável
Matemática e apresentou um modelo que se ajusta bem aos dados, enquanto que nos resultados
obtidos pelo método da máxima verossimilhança o Factor 1 esta associados com as variáveis
Física, Português e Inglês, o Factor 2 esta associado as variáveis Musical e Visual, e o Factor 3 esta
associado a variável Matemática e não apresentou um modelo que se ajusta aos dados.

4. Desde que foi identificado o vírus do HIV muito trabalho tem sido feito no sentido de
divulgar as diferentes formas de contaminação do vírus. Contudo, verifica-se uma má
perceção sobre a contaminação por HIV. Os ANEXOS III apresentam parte dos resultados
desenvolvidos sobre o nível de percepção sobre a contaminação por HIV. Dez (10) variáveis
sobre “risco” que avaliam o nível de percepção foram reduzidas em 2 factores, usando AFE:
Prevenção e Estigmatização. Verifique se existirão diferenças entre grupos etários ou entre os
géneros em relação as Prevenção e Estigmatização sobre HIV.

(a) Enuncie as hipóteses relativas à questão.

Resposta:

Hipóteses para o Sexo (Género)

H0: Não existem diferenças entre os géneros em relação as Prevenção e Estigmatização sobre HIV.

H1: Existem diferenças entre os géneros em relação as Prevenção e Estigmatização sobre HIV.

Hipóteses para os Grupos Etários

H0: Não existem diferenças entre os grupos etários em relação as Prevenção e Estigmatização
sobre HIV.

H1: Existem diferenças entre os grupos etários em relação as Prevenção e Estigmatização sobre
HIV.
(b) Verifique se o pressuposto de homogeneidade foi satisfeito.

Resposta:

Hipóteses para o Sexo (Género)

H0: O pressuposto da homogeneidade não foi violado pelos dados do sexo (género).

H1: O pressuposto da homogeneidade foi violado pelos dados do sexo (género).

Os resultados mostram que não foi rejeitada a hipótese nula, ou seja, os dados do género
satisfazem o pressuposto da homogeneidade.

Hipóteses para os Grupos Etários

H0: O pressuposto da homogeneidade não foi violado pelos dados dos grupos etários.

H1: O pressuposto da homogeneidade foi violado pelos dados dos grupos etários.

Os resultados mostram que não foi rejeitada a hipótese nula, ou seja, os dados dos grupos etários
satisfazem o pressuposto da homogeneidade.

(c) Qual a sua conclusão, com nível de significância de 5%.

Resposta:

O teste de Will’s Lambda, mostrou que existem diferenças entre os géneros em relação as
Prevenção e Estigmatização sobre HIV, pois o p-value foi de 0.0418 menor que o nível de
significância de 0.05, rejeitando deste modo a hipótese nula.

Quanto aos grupos etários, o teste Pillai’s Trace, apresentou um p-value foi de 0.4558 maior que
o nível de significância de 0.05, não rejeitando deste modo a hipótese nula, ou seja, não existem
diferenças entre os grupos etários em relação as Prevenção e Estigmatização sobre HIV.

Você também pode gostar