Escolar Documentos
Profissional Documentos
Cultura Documentos
2. Introduo
Esta cadeira de Introduo Anlise de Dados permitiu a todos os elementos do grupo adquirir uma melhor percepo relativamente aos mtodos de anlise de dados de estatstica descritiva com o programa SPSS. Aplicando conhecimentos adquiridos nas aulas e em pesquisas de modo a cumprir com os objectivos estabelecidos pelo professor Pedro Correia e pelo grupo; Deste modo, com este projecto de grupo, pretendemos, analisar e descrever variveis qualitativas e quantitativas atravs da observao de grficos e tabelas de contingncia. Atravs dessa anlise iremos tirar concluses da amostra populacional.
Pgina 1
3. Anlise inicial dos dados O nosso trabalho baseia-se num inqurito realizado a 840 estudantes do ensino superior em portugal, distribudos por 57 faculdades e um total de 108 licenciaturas. Dos 840 alunos verificou-se que 413 so estudantes do Instituto Superior de Cincias Sociais e Polticas e 174 esto a licenciar-se em Administrao Pblica, ou seja do total de inqueridos, 49,2% estudam no Instituto Superior de Cincias Sociais e Polticas e 20,7% esto a tirar licenciatura em Administrao Pblica. O que torna o nosso inquerito nao viavel para concluses sobre o ensino superior em geral. Anlise geral da base de dados: Dos inquiridos 50,1% so do sexo masculino e 49,6% do sexo feminino; 52,3% So estudantes do 1 ano, 31,1% do 2 ano e 15,4 do 3 ano; 61,5% Conseguiu a 1 opo de curso; A mdia das idades 20,01, e a mais observada 18; A mdia das alturas 1,71 cm e a mais observada 1,60 cm; A mdia do peso 66,47 e o mais observado 70; Do sexo Feminino a mdia das idades 19,66, do peso 58,94 e da altura 164,96; Do sexo Masculino a mdia das idades 20,36, do peso 73,91 e da altura 176,56; 72,6 % Vive com os pais; Apenas 6,7% fizeram um emprstimo para financiar os estudos; 21,5 % Dos alunos estuda e trabalha; 47,3% Escolheu o curso por realizao pessoal e 28,9% pela oportunidade de trabalho na respectiva rea; 81,1% Acha que as licenciaturas deveriam ser mais prticas; 59% Dos alunos est optimista ou muito optimista em relao ao seu futuro, 25% no sabe e 16% no est optimista; 90% Acha que ter um curso superior um factor preferencial na entrada no mercado de trabalho; 77,9% Concorda que importante uma ps-graduao;
Pgina 2
Rendimento mensal medio 74,97; Estimam gastar em mdia149,8 em propinas; Estimam gastar em mdio 50,3 em transportes; Estimam gastar em mdio 42,3 em alimentao fora de casa; Estimam gastar em mdio 66,4 em alojamento; Estimam gastar em mdio 30,7 em material escolar; Estimam gastar em mdio 10 em sade; Estimam gastar em mdia 35,9 em divertimento Estimam poupar em mdio 32,4; 53,8% Estuda entre 1h-3h, 28,9% menos de 1h e 17% mais de 3h; 50% Dorme entre 6h-8h e 34% de 4h-6h; 89,8 Acha que os media tm um papel preponderante na sociedade actual e 46,2% classificam a sua influncia como negativa; 41,3% Acha que os mdios so muito influenciados pelos governos, grupos econmicos, etc. 42,1% Considera a RTP como a mais credvel e 60,7% consideram a TVI a mais sensacionalista; 63,6% Considera que a qualidade dos jornais online tem um nvel adequado; 66,8% Tem interesse na poltica nacional; 72,7% Acha que votar importante; Apenas 27,5% so filiados a um partido poltico; 42,4% No conhece o papel dos polticos da UE ao nivel dos conflitos internacionais; 47,1% Acha que Portugal tem um papel relevante no seio da EU; 49,2% Concorda com a implementao de uma constituio europeia; 53,8% Acha que as juventudes partidrias no tm peso na vida poltica portuguesa; ndice de massa corporal medio 22,79. No sexo feminino a media 21,62, no masculino 24.
Pgina 3
Ao analisarmos os dados finais da base de dados das universidades de Portugal, que foram fornecidos pelo professor Pedro Correia a primeira coisa que notamos foi que os dados qualitativos das primeiras variveis (X01 e X02) no estavam com a mesma procedncia. Ento, o nosso primeiro passo neste trabalho foi organizar a base de dados de modo que possmos iniciar a anlise geral e especfica da mesma. O mtodo que utilizamos para melhor organizao foi antes de adicionar base de dados em uma folha numerarmos as diferentes universidades e cursos e s aps organizarmos isso que passvamos para a base de dados atravs da Variable Viewadicionando os respectivos valores na unidade estatstica Values que no caso das variveis qualitativas, permite associar etiquetas aos cdigos numricos utilizados. De seguida organizamos a nossa base de dados por faculdades, atravs de Data Sort Cases.
O quadro referente a ordem atribuda para as etiquetas das universidades e cursos esto no Anexo 1.
Pgina 4
4. Missing Values A omisso de valores uma problemtica nas anlises pois a no existncia de valores alm de dificultar a anlise das variveis torna impossvel o somatrio das mesmas. Antes de procedermos com a anlise dos variveis, temos que indentificar os valores omissos. Isso possvel atravs do procedimento: Analyze Missing Values Analysis
Variveis X15 b: Montante? X16 : Qual o seu rendimento mensal ()? X17 a: Vive fora de casa da famlia para frequentar a universidade? X17 b: Valor mensal dispendido em Alojamento ()? X18 a: Quanto estima gastar mensalmente em propinas()? X18 b: Quanto estima gastar mensalmente em trasportes ()? X18 c: Quanto estima gastar mensalmentre com comida fora de casa()? X18 d: Quanto estima gastar mensalmente em Alojamento ()? X18 e: Quanto estima gastar mensalmente em material escolar ()? X18 f: Quanto estima gastar mensalmente em sade()? X18 g: Quanto estima gastar mensalmente em sadas ()? X19: Quanto estima poupar mensalmente ()? X24 c: Ordem de preferncia da televiso X24 e: Ordem de preferncia de outras Fontes ? X28: Das estaes de Tv generalistas, qual a mais credvel? X32: filiado em algum partido poltico? X33: Conhece o papel dos polticos da EU a nvel dos conflitos? X36: Acha que as juventudes partidrias tm peso na vida poltica?
Pgina 5
Concluses ao analisar os valores omissos dessa amostra: Os valores omissos so identificados pelo SPSS por terem uma cdula em branco ou por valores atribudos acima/abaixo daqueles que foram definidos na etiqueta das variveis qualitativas (ex: X28 o valor da etiqueta era de 1 a 4 e foi identificado um valor omisso na observao 505 pois atriburam o valor 11 em vez dos que foram definidos.); A varivel X15b a que possui mais Valores omissos e est directamente relacionada com a resposta da X15a; A 17b a segunda varivel com mais valores omissos e tambm est relacionada com a 17a; Existem 10 variveis com o nmero reduzido de valores omissos (1 a 3) maioritariamente em respostas de ordenar ou qualitativas; Existem 6 variveis com o nmero maior de valores omissos (10 a 66) em comparao com a anterior; Existem 2 variveis com um valor extremamente grande de valores omissos (496 e 625). Recomendaes para valores omissos: Os valores omissos em variveis qualitativas ou ordenativas no podem ser substitudos e encontram-se em menor quantidade nesta amostra nomeadamente: X17a ,X24c, X24e, X28, X32, X33 e X36. Recomenda-se que a observao que contm esses valores seja eliminada pois no iro interferir no estudo desta amostra; Os valores quantitativos com menor quantidade de valores omissos nomeadamente : X16, X18a, X18b, X18c, X18g e X19. Recomenda-se que essas observaes sejam eliminadas pois pela quantidade reduzida de valores omissos e pelo facto de no serem as varives que estamos a analisar no ir interferir no estudo da amostra; A X17b tem 496 dados omissos, pois uma questo dependente da X17a, que pergunta se os estudantes vivem fora de casa da famlia, para frequentar a faculdade, uma pergunta de sim ou no, se a resposta for sim, ento responde-se a questo X17b que pergunta o valor despendido em alojamento. 229 inquiridos responderam sim, logo os restantes ficam como omissos, a mesma relao acontece para as varveis X15a e X15b;
Pgina 6
A varivel X16 tem muitas observaoes mal preenchidas, logo deve ser eliminada, assim como a X24, que tambm tem dados omissos; A varivel X18d, que pergunta quanto os estudantes estimam gastar mensalmente em alojamento, verificamos que mais de 60% dos inqueridos respondeu 0,00, ou seja parte-se do princpio que os estudantes que no preencheram, tambm no tm gastos em alojamento, logo no se deve eliminar esta varivel.
Pgina 7
5. Tratamento descritivo das variveis atribudas Foram atribudas as seguintes variveis ao nosso grupo: X14, X18g, X25,X33 e a Nova varivel. Sendo apenas a X18g e a Nova varivel quantitativas.
5.1. Varivel 14
Statistics X14: Considera que ter um curso superior factor preferencial na entrada no mercado de trabalho? N Valid 840 Missing 0 Mode 2
X14: Considera que ter um curso superior factor preferencial na entrada no mercado de trabalho? Cumulative Frequency Percent Valid Percent Percent Valid No 83 9.9 9.9 9.9 Sim 756 90.0 90.0 99.9 3 1 .1 .1 100.0 Total 840 100.0 100.0
Concluso: A maioria dos estudantes (90%) considera que ter um curso superior preferencial na entrada no mercado de trabalho.
Pgina 8
5.2.Varivel 25
Statistics X25: Considera que o tempo mdio razovel dos jornais televisivos seria N Valid 840 Missing 0 Mode 2
X25: Considera que o tempo mdio razovel dos jornais televisivos seria Frequenc Valid Cumulative y Percent Percent Percent Valid Menor que 30 203 24.2 24.2 24.2 minutos Entre 30 e 60 minutos Mais de 60 minutos 5 Total 524 112 1 840 62.4 13.3 .1 100.0 62.4 13.3 .1 100.0 86.5 99.9 100.0
Concluso: 62,4% considera que o tempo medio dos jornais deve ser entre 30-60 minutos.
Pgina 9
5.3.Varivel 33
Statistics X33: Conhece o papel dos polticos da Unio Europeia, ao nvel dos conflitos internacionais? N Valid 839 Missing 1 Mode 2
X33: Conhece o papel dos polticos da Unio Europeia, ao nvel dos conflitos internacionais? Cumulative Frequency Percent Valid Percent Percent Valid No 356 42.4 42.4 42.4 Sim Total System 483 839 1 840 57.5 99.9 .1 100.0 57.6 100.0 100.0
Missing Total
Concluso: 57,5% dos alunos conhecem o papel dos polticos da Unio Europeia, ao nvel dos conflitos internacionais.
Pgina 10
5.4.Varivel 18g
Statistics X18g: Quanto Estima Gastar Mensalmente em Sadas (divertimento / lazer) () N Valid 828 Missing 12
Com a atribuio do valor da mdia aos dados omissos, a varivel passou a ser X18g_1.
Result Variables N of Replaced Case Number of Non-Missing Values Missing Values First Last 12 1 840
Ento:
Descriptives SMEAN (X18g) Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic Std. Error 35.9046 1.25878 33.4339 38.3753 31.7789 30.0000 1331.003 36.48291 .00 500.00 500.00 30.00 4.180 35.806
.084 .169
Pgina 11
Outliers:
Extreme Values Case Number SMEAN(X18g) Highest 1 2 3 4 5 1 2 3 4 5 147 235 19 29 148 817 813 812 811 781 Value 500.00 250.00 200.00 200.00 200.00a .00 .00 .00 .00 .00b
Lowest
a. Only a partial list of cases with the value 200.00 are shown in the table of upper extremes. b. Only a partial list of cases with the value .00 are shown in the table of lower extremes.
Pgina 12
Concluses ao analisar a varivel 18g: A mdia de gasto mensal em sadas de 35,90; A mdia aparada a 5 % de 31,78 (sem os outliers); A assimetria positiva, sendo a curtose, por consequncia, leptocrtica.
Pgina 13
5.5.Nova Varivel Esta nova varivel foi criada pelo grupo de acordo com os parmetros prestabelecidos pelo professor. Foi pedido o clculo do ndice de massa corporal das observaes. A nova varivel X08/ (X09*X09) Esta varivel foi criada por ns, atravs do procedimento: Transform Compute Variable
Descriptives Statistic Indice de Massa Corporal Kg/m2 Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Lower Bound Upper Bound 22.7988 22.1289 23.4687 22.2097 22.0385 97.852 9.89201 14.01 234.27 220.26 3.44 18.110 360.609 .084 .169 Std. Error .34131
Pgina 14
Outliers
Extreme Values Indice de Massa Corporal Highest Kg/m2 1 2 3 4 5 1 2 3 4 5 Case Number 813 212 418 271 118 733 160 17 602 648 Value 234.27 196.00 44.00 39.67 39.26 14.01 15.78 16.07 16.10 16.11
Lowest
Pgina 15
Pgina 16
Masculino
Skewness 13.612 Kurtosis 195.268 a. ndice de Massa Corporal Kg/m2 is constant when X05: Gnero = 3. It has been omitted. b. ndice de Massa Corporal Kg/m2 is constant when X05: Gnero = 18. It has been omitted.
Pgina 17
INTRODUO ANLISE DE DADOS - GRUPO A Extreme Valuesb,c X05: Gnero Indice de Massa Corporal Feminino Highest 1 Kg/m2 2 3 4 5 Lowest 1 2 3 4 5 1 2 3 4 5 1 2
Case Number 53 312 301 295 679 733 17 648 597 481 813 212 418 271 118 160 602
Value 31.64 31.24 30.86 30.25 29.30a 14.01 16.07 16.11 16.33 16.53 234.27 196.00 44.00 39.67 39.26 15.78 16.10
Masculino
Highest
Lowest
3 99 16.30 4 783 16.33 5 314 16.73 a. Only a partial list of cases with the value 29.30 are shown in the table of upper extremes. b. ndice de Massa Corporal Kg/m2 is constant when X05: Gnero = 3. It has been omitted. c. ndice de Massa Corporal Kg/m2 is constant when X05: Gnero = 18. It has been omitted.
Pgina 18
Pgina 19
Procedimento: Pode-se eliminar os outliers ou ento corrigi-los, nos decidimos corrigir, pois os dados foram mal preenchidos e o erro facilmente identificado e percebe-se que valor devia estar l; Indice de massa corporal sem os outliers (peso e altura corrigidos) Varivel: NV_A1; Na observao 212 corrigiu-se a altura de 50cm para 150cm; Na observao 813 corrigiu-se o peso de 828kg para 82kg;
Continuaremos a ter outliers, mas as observaes 212 e 813 tinham valores extremos, portanto, procedemos a correco desses mesmos valores.
Descriptives Statistic NV_A1 Mean 95% Confidence Interval for Mean Lower Bound Upper Bound 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis 22.3401 22.1417 22.5386 22.1969 22.0351 8.586 2.93025 14.01 44.00 30.00 3.43 1.406 6.328 .084 .169 Std. Error .10110
Pgina 20
Extreme Values Case Number NV_A1 Highest 1 2 3 4 5 Lowest 1 2 3 4 5 418 271 118 778 233 733 160 17 602 648 Value 44.00 39.67 39.26 34.29 32.65 14.01 15.78 16.07 16.10 16.11
Sig. .000
Pgina 21
Pgina 22
Nesta varivel foram detectados alguns valores extremos que dificultaram a anlise da varivel em questo. Desta forma, o grupo optou por fazer a mdia aparada a 5% que elimina os 5 maiores e menores valores extremos.
Pgina 23
Por gneros:
Descriptivesa,b X05: Gnero NV_A1 Feminino Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis a. NV_A1 is constant when X05: Gnero = 3. It has been omitted. b. NV_A1 is constant when X05: Gnero = 18. It has been omitted. Lower Bound Upper Bound Statistic Std. Error 21.6166 .12994 21.3611 21.8720 21.4884 21.3039 7.041 2.65341 14.01 31.64 17.64 3.00 .856 1.281 23.0500 22.7604 23.3397 22.8876 22.7583 9.142 3.02351 15.78 44.00 28.22 2.95 1.833 9.234 .119 .237
Masculino
Pgina 24
Pgina 25
Resultado Abaixo de 17 Entre 17 e 18,49 Entre 18,5 e 24,99 Entre 25 e 29,99 Entre 30 e 34,99 Entre 35 e 39,99 Acima de 40
Situao Muito abaixo do peso Abaixo do peso Peso normal Acima do peso Obesidade I Obesidade II (severa) Obesidade III (mrbida)
Concluses: Verificmos que a maioria dos estudantes do ensino superior saudvel, pois o ndice de Massa Corporal mdio de 22,34; No sexo feminino a mdia 21,6, tendo como valor mximo 31,64 e mnimo 14,01; No masculino a mdia 23,05, com valor mximo 44 e mnimo 15,78.
Pgina 26
Concluso:
Em X14 e X25 temos um total de 840 observaes e 0 dados omissos. A moda de respostas 2 que corresponde resposta sim.
N Mode
Valid Missing
X14: Considera que ter um curso superior factor preferencial na entrada no mercado de trabalho? Frequency Percent Valid Percent 83 9.9 9.9 756 90.0 90.0 1 .1 .1 840 100.0 100.0 Cumulative Percent 9.9 99.9 100.0
Valid
No Sim 3 Total
X25: Considera que o tempo mdio razovel dos jornais televisivos seria Cumulative Frequency Percent Valid Percent Percent Valid Menor que 30 minutos Entre 30 e 60 minutos Mais de 60 minutos 5 Total 203 524 112 1 840 24.2 62.4 13.3 .1 100.0 24.2 62.4 13.3 .1 100.0 24.2 86.5 99.9 100.0
Pgina 27
Pgina 28
Pgina 29
39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57
Universidade de Aveiro Universidade do Porto Instituto Superior de Administrao e Lnguas Instituto Superior de Educao e Cincias Universidade Fernando Pessoa Universidade do Minho Escola Superior de Artes e Design Instituto Politcnico de Santarm Escola Superior de Hotelaria e Turismo do Estoril Escola Superior de Gesto de Santarm Faculdade de Psicologia Escola Superior de Educao Almeida Garret Escola Superior de Tecnologia e Gesto de Leiria Instituto Politcnico de Castelo Branco Faculdade de Farmcia Universidade da Beira Interior Universidade de vora Escola Superior de Tecnologia e Sade Instituto Piaget
Pgina 31
Valor/Value 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45
Etiqueta/Label Administrao Pblica Enfermagem Publicidade e Marketing Arquitetura Direito Cincias Polticas e Relaes Internacionais Sociologia Desporto Cincias da Comunicao Gesto de Recursos Humanos Relaes Internacionais Servio Social Antropologia Gesto Psicologia Gesto de Informao Engenharia Civil Engenharia Informtica Engenharia Mecnica Gesto de Empresas Gesto Horteleira Engenharia de Informtica e de Computadores Economia Cienematografia Engenharia e Gesto Insdutrial Medicina Educao Bsica Biologia Literatura Portuguesa Anatomia Cincia Poltica Fisioterapia Administrao Pblica e Polticas de Territrio Animao Turstica MIAGUPUT Filosofia Histria Medicina Veterinria Ensino Primrio Marketing Agronomia Contabilidade Administrativa Engenharia do Ambiente Engenharia Agronmica Design
Pgina 32
46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79 80 81 82 83 84 85 86 87 88 89 90
Marketing e Comunicao Turismo Finanas e Contabilidade Finanas Ergonomia Mestrado Politica Social Agricultura e Pesca Gesto Desportiva Gesto Bancria Cincias Aeronuticas Cenografia Comunicao Social Reabilitao Psicomotora Lnguas Literaturas e Culturas Medicina Dentria Gesto Porturia Engenharia Qumica e Bioqumica Marketing, Publicidade e Relaes Pblicas Engenharia e Gesto Industrial Biologia Celular e Molecular Animao Socio-cultural Engenharia de Telecomunicaes e Informtica Engenharia Eletrnica Educao Fsica e Desporto Comunicao Organizacional Comunicao Social e Cultural Ciclo Bsico de Medicina Gesto Aeronutica Comunicao, Cultural e Organizao Criminologia Biologia e Geologia Design Industrial Anlises Clnicas Engenharia Geogrfica Engenharia Aeroespacial Gesto e Engenharia Industrial Infornao e Gesto de Empresas Terapia Ocupacional Gesto Turstica Estudos Europeus Design de Moda Audiovisual e Multimdia Engenharia Biolgica Lnguas, Cultura e Letras Matemtica
Pgina 33
Cincias da Linguagem Relaes Pblicas e Comunicao Empresarial Direito Internacional e Relaes Internacionais Finanas Empresariais Secretariado Geografia e Planeamento Regional Comunicao Social e Marketing Cincias da Educao Meteorologia Cardiopeneumunologia Prtese Dentria Higiene e Segurana do Trabalho Engenharia Eletrnica e de Computadores Farmcia Radiologia Radioterapia Medicina Nuclear
Pgina 34
7. Concluso
Podemos concluir com a elaborao deste projecto que o programa SPSS facilita a anlise de dados qualitativos e quantitativos na medida que permitiu ter uma percepo mais eficaz em termos estatsticos das observaes referidas anteriormente. O grupo ficou com uma melhor percepo da importncia de valores extremos da amostra populacional que em termos prticos se aplicam no quotidiano. Em suma, no podemos generalizar a anlise dos dados recolhidos relativamente a todas as universidades do pas, uma vez que aproximadamente 49% dos inquiridos estuda no Instituto Superior de Cincias Sociais e Polticas.
Pgina 35
8. Bibliografia Livro: Pinto, Ricardo Ramos, Introduo Anlise de Dados, Edies Slabo, Lisboa 2009. Internet:
http://pascal.iseg.utl.pt/~vescaria/mqa/aula05.pdf http://www.estv.ipv.pt/PaginasPessoais/psarabando/CET%20%20Ambiente%2020082009/Slides/8.%20Outliers.pdf http://www.mat.ufrgs.br/~camey/SPSS/Introdu%E7%E3o%20%E0%20An%E1lise%20Estat%ED stica%20utilizando%20o%20SPSS%2013_0.pdf
Pgina 36