Escolar Documentos
Profissional Documentos
Cultura Documentos
UNIVERSIDADE LICUNGO
Faham Saranque
Quelimane
2022
2
Faham Saranque
Quelimane
2022
3
Índice
Lista de tabelas.................................................................................................................................4
Lista de quadros................................................................................................................................4
1.Introdução......................................................................................................................................5
1.1.Objectivos...................................................................................................................................5
1.1.1.Objectivo Geral.......................................................................................................................5
1.1.2.Objectivos Específicos............................................................................................................5
1.2.Metodologia................................................................................................................................5
3.Conclusão....................................................................................................................................17
4.Bibliografia..................................................................................................................................18
4
Lista de tabelas
Tabela 1: Resumo de processamento do caso..................................................................................6
Tabela 2:Descritivos.........................................................................................................................7
Tabela 3:Testes de Normalidade....................................................................................................10
Tabela 4: Testes de Normalidade dos dados padronizados............................................................11
Tabela 5: Correlações.....................................................................................................................11
Tabela 6: Teste de KMO e Bartlett.................................................................................................12
Lista de quadros
Quadro 1: Box-plot das disciplinas..................................................................................................8
5
1. Introdução
O presente trabalho é uma aplicação da cadeira analise de dados I, que tem como o
principal objectivo de verificar a relação das notas nas disciplinas dos estudantes da 8ª classe e
agrupa-los, para isso, foi feita uma analise exploratória das notas, em que foi possível extrair os
descritivos, o teste de normalidade, os box-plots, de seguida, foi feita a analise de correlação
linear de pearson, e por fim foi feita a analise factorial.
De acordo com Favero, et all (2011, p.236), a analise factorial (AF) é uma técnica
multivariada que busca identificar um numero relativamente pequeno de factores comum que
podem ser utilizados para representar relações entre um grande numero de variáveis inter-
relacionadas.
1.1. Objectivos
1.1.1. Objectivo Geral
Aplicar as técnicas estudadas na Analise Factorial da Disciplina de Análise de Dados I
para descrever e analisar a distribuição de notas dos estudantes da 8ª classe da ESG-
Coalane.
1.1.2. Objectivos Específicos
1.2. Metodologia
Para a análise de dados proveniente da distribuição de notas dos estudantes dos alunos da
8ª classe, baseou-se com ajuda do pacote SPSS, as saídas foram copiadas para o Microsoft Word
para a devida interpretação.
6
7
Casos
A tabela 2 abaixo mostra os descritivos dos alunos, onde, para a disciplina de português,
inglês, francês, geografia, física e matemática apresenta a media 11, as disciplinas de biologia,
química e educação visual, apresentam nota media de todos os estudantes igual a 10 valores.
O desvio-padrão das disciplinas de português e educação visual é igual a 2, sendo assim,
indica que cada nota dessas disciplinas distanciam-se da media em 2 valores, as restantes
disciplinas apresentam o desvio-padrão igual a 1, assim cada nota dessas disciplinas distanciam-
se da media em 1 valor.
As disciplinas de francês e matemática apresentam uma assimetria acima de 0, sendo
assim, as notas apresentam uma distribuição assimétrica positiva, já as restantes disciplinas
apresentam uma assimetria igual a 0, sendo assim, os dados estão distribuídos de uma forma
simétrica, isso quer dizer que a media é igual a mediana e igual a moda.
8
Tabela 2:Descritivos
Estatística
Média 11,0000 11,0000 11,0000 11,0000 10,0000 11,0000 11,0333 10,0000 10,0000
95% Intervalo de Confiança para Limite inferior 10,0000 10,0000 10,0000 10,0000 10,0000 10,0000 10,0000 10,0000 9,0000
Média Limite superior 12,0683 11,0000 11,0000 11,0000 11,0000 11,0000 11,0000 11,0000 11,0000
5% da média aparada 11,0000 11,0000 11,0000 11,0926 10,0000 11,0556 11,0370 10,0000 10,0000
Mediana 11,0000 11,0000 11,0000 11,0000 10,0000 10,0000 11,0000 10,0000 10,0000
Variância 5,000 3,000 3,000 2,000 1,000 3,000 3,000 3,000 4,000
Desvio Padrão 2,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 1,00000 2,00000
Mínimo 7,00 7,00 8,00 9,00 9,00 9,00 7,00 8,00 7,00
Máximo 15,00 15,00 14,00 14,00 14,00 14,00 15,00 14,00 15,00
Intervalo 8,00 8,00 6,00 5,00 5,00 5,00 8,00 6,00 8,00
Intervalo interquartile 4,00 3,00 3,00 3,00 2,00 3,00 3,00 4,00 3,00
Assimetria ,000 ,000 ,073 ,000 ,000 ,000 ,095 ,000 ,000
Curtose -1,000 ,000 -1,000 -1,000 ,000 -1,000 ,000 -1,000 ,000
O quadro 1, apresenta os box-plot das disciplinas dos alunos da 8a classe, sendo assim, nota-se que nao houve nenhum estudante com
nota atipica ou mesmo, for a do desvio inter-quartilico.
9
Portugues
Ingles Frances
Geografia
Biologia Fisica
10
Saabe-se que a analise factorial é sensível a normalidade, sedo assim, devemos testar a
normalidade das notas, para isso, levantamos as seguintes hipóteses:
Ho: As disciplinas da pauta dos estudantes da 8ª classe seguem uma distribuição normal;
H1: Pelo menos uma disciplina da pauta dos estudantes da 8ª classe, não segue uma
distribuição normal.
Testes de Normalidade
Kolmogorov-Smirnova Shapiro-Wilk
x−μ
Apos padronizrmos os dados a partir da formula z= , obtemos novamente a tabela de
σ
normalidade, apresentados na tabela 4, notamos que não houve diferença com os dados não
padronizados, logo, como AF é sensível a normalidade, sera difícil prosseguir com a AF. Mas o
teste que confirma é o teste de Bartlet e de KMO.
12
Testes de Normalidade
Kolmogorov-Smirnova Shapiro-Wilk
Olhando para a tabela 5, notamos que existem fortes relações ou dependência entre as
disciplinas, isto porque esxitem correlações de pearson com pelo menos igual a 0,3, para algumas
variáveis, visto que valor mínimo que deve apresentar em pelo menos duas variáveis tem que ser
de 0,300. Logo não confirma o que foi dito no teste de normalidade acima, há indícios de ser
possível prosseguir com a analise factorial, para o caso confirmativo, faremos o teste de Bartlet e
de KMO.
Tabela 5: Correlações
Matriz de correlaçõesa
Correlação Portugues 1.000 .778 .609 .630 -.546 -.577 -.633 -.622 -.524
Ingles .778 1.000 .528 .712 -.433 -.666 -.618 -.795 -.604
Frances .609 .528 1.000 .704 -.328 -.445 -.333 -.528 -.284
Geografia .630 .712 .704 1.000 -.301 -.453 -.293 -.541 -.187
Biologia -.546 -.433 -.328 -.301 1.000 .646 .678 .545 .625
Fisica -.577 -.666 -.445 -.453 .646 1.000 .830 .861 .812
Matematica -.633 -.618 -.333 -.293 .678 .830 1.000 .770 .794
Quimica -.622 -.795 -.528 -.541 .545 .861 .770 1.000 .774
13
Ed_V -.524 -.604 -.284 -.187 .625 .812 .794 .774 1.000
Olhando para a tebela 6, notamos que a medida de Kaiser_Meyer-Olkin de adequaao de
amostragem é superior a 0,5, logo será possível prosseguir com a AF.
Sig. .000
A tabela 7 abaixo é utilizada para explicitar a adequação da utilização da AF, sendo assim,
a matriz anti-imagem de mostra que nenhuma variável será eliminada do modelo, isto porque na
diagonal da matriz anti-imagem das correlações apresenta valores acima de 0,5.
Matrizes anti-imagem
Covariância Portugues .247 -.096 -.113 -.016 .074 -.025 .077 -.048 .008
anti-imagem Ingles -.096 .155 .082 -.097 -.061 -.025 -.002 .064 .050
Frances -.113 .082 .393 -.134 -.019 -.006 -.033 .062 .020
Geografia -.016 -.097 -.134 .218 .054 .057 -.048 .005 -.105
Biologia .074 -.061 -.019 .054 .447 -.030 -.067 .020 -.068
Fisica -.025 -.025 -.006 .057 -.030 .150 -.065 -.055 -.062
Matematic
.077 -.002 -.033 -.048 -.067 -.065 .199 -.033 -.014
a
Quimica -.048 .064 .062 .005 .020 -.055 -.033 .142 -.034
Ed_V .008 .050 .020 -.105 -.068 -.062 -.014 -.034 .194
Correlação anti- Portugues .829 a
-.488 -.364 -.071 .223 -.130 .349 -.256 .036
imagem Ingles -.488 .778 a
.333 -.525 -.231 -.164 -.009 .431 .286
Frances -.364 .333 .779a -.459 -.046 -.025 -.119 .263 .071
Biologia .223 -.231 -.046 .173 .897a -.115 -.225 .080 -.232
Fisica -.130 -.164 -.025 .312 -.115 .867a -.377 -.374 -.361
Matematic
.349 -.009 -.119 -.230 -.225 -.377 .887a -.198 -.072
a
Quimica -.256 .431 .263 .031 .080 -.374 -.198 .874a -.207
Ed_V .036 .286 .071 -.509 -.232 -.361 -.072 -.207 .840a
Na tabela 8, notamos que todas as variáveis possuem fortes extrações. Assim, a decisão de não
excluirmos as variáveis, fica mais elevadas. Se existisses alguma disciplina com extração muito
próxima a zero, teríamos que excluir do modelo.
Tabela 8: Comunalidades
Comunalidades
Inicial Extracao
Portugues 1.000 0.738741
Ingles 1.000 0.792915
Frances 1.000 0.733652
Geografia 1.000 0.87468
Biologia 1.000 0.600207
Fisica 1.000 0.855999
Matematica
1.000
0.861471
Quimica 1.000 0.834441
Ed_V 1.000 0.863301
Método de Extração: Análise de
Componente Principal.
Com base na regra de retenção de valores superiores a 1, conforme apresenta tabela 9, notamos
que foram retidos dois factores que conseguem explicar 79,505% da variância dos dados
originais. A tabela ainda apresenta o percentual da variância explicada por factor antes e depois
da rotação.
15
A figura 1 abaixo, corrobora com a retenção de apenas dois factores, conforme a tabela 9.
Componente
1 2
Olhando para a figura 2 abaixo, notamos que corrobora com o que foi dito na tabela acima.
17
3. Conclusão
Contudo, o grupo chegou as conclusões que a analise factorial é uma técnica estatística
multivariada de interdependência que visa a resolução dos dados e à criação de indicadores que
representam variáveis originais. Neste caso se pressupõe que as variáveis originais sejam
correlacionas e compartilhem uma ou mais componentes, para o nosso estudo, mostrou que
existiram correlações entre as disciplinas. Uma outra forma que se usou para verificar se essa
premissa por meio da analise da matriz de correlações é confiável, fez-se o teste de esfericidade
de Bartlett e da estatística de KMO, que mostrou-se adequado para prosseguir com a analise
factorial. Concluímos que as disciplinas de ciências tem uma relação em comum, quem entende
uma disciplina de ciência, possivelmente entendera as outras disciplinas de ciências e assim
acontecera com as disciplinas de letras.
19
4. Bibliografia
FAVERO, L. P., BELFIORE, P., SILVA, f. L., & CHAN, B. L. (2011). Analise de dados:
Modelagem multivariada para tomada de decisoes . Sao Paulo: Camps.
20
Apêndice
21