Você está na página 1de 19

Trabalho Prtico de Anlise de Dados 1.

Case Processing Summary


Cases Valid N Nivel de Escolaridade * Categoria de Empresa 474 Percent 97.7% N 11 Missing Percent 2.3% N 485 Total Percent 100.0%

Nesta tabela ns temos 474 casos vlidos que correspondem a 97,7% e 11 casos omissos em 2,3% do total de 485 casos observados correspondentes a 100%.

Trabalho Prtico de Anlise de Dados Nvel de Escolaridade * Categoria de Empresa Crosstabulation


Categoria de Empresa Formal Informal Nivel de Escolaridade .0 Count % within Nivel de Escolaridade % within Categoria de Empresa % of Total Primrio Count % within Nivel de Escolaridade % within Categoria de Empresa % of Total Secundrio geral Count % within Nivel de Escolaridade % within Categoria de Empresa % of Total Licenciatura Count % within Nivel de Escolaridade % within Categoria de Empresa % of Total Mestrado Count % within Nivel de Escolaridade % within Categoria de Empresa % of Total Doutoramento Count % within Nivel de Escolaridade % within Categoria de Empresa 17.6% 14.8% 16.7% 17.3% 16.9% 64 78.0% 1.3% 4 4.9% 3.4% 14 17.1% 21.5% 82 100.0% 22.0% 22.2% 19.0% 21.5% 16.7% 80 78.4% .6% 6 5.9% 1.3% 16 15.7% 18.6% 102 100.0% 21.8% 11.1% 7.1% 18.6% 14.1% 79 89.8% 1.5% 3 3.4% 5.1% 6 6.8% 20.7% 88 100.0% 18.5% 25.9% 28.6% 20.7% 11.6% 67 68.4% 1.1% 7 7.1% 3.8% 24 24.5% 16.5% 98 100.0% 15.2% 18.5% 21.4% 16.5% 3.4% 55 70.5% .4% 5 6.4% 1.3% 18 23.1% 5.1% 78 100.0% 4.4% 7.4% 7.1% 5.1% 16 66.7% 2 8.3% Outras 6 25.0% Total 24 100.0%

Trabalho Prtico de Anlise de Dados Neste entretanto, o nvel educacional mais predominante na empresa formal Mestrado com 80 casos observados que correspondem a 78,4% de um total de 102 casos vlidos que correspondem a 100%. Contudo, existe um nvel 6.0 de educao que est categorizado, mas no tipificado na tabela depois do Doutoramento. Este nvel o que menos predominante na empresa com apenas 2 casos observados na empresa formal sem casos omissos e corresponde a 100%.
N Tempo de Servio Formal Informal Outras 359 27 81 Percent 98.9% 100.0% 96.4% N 4 0 3 Percent 1.1% .0% 3.6% N 363 27 84 Percent 100.0% 100.0% 100.0%

Na tabela temos variveis como categoria de empresa e tempo de servio dos trabalhadores. O tempo de servio dos trabalhadores mais antigos na empresa de 98 anos e os mais novos na empresa tem de 63 anos, conforme nos indicam os valores extremos. Quanto empresa informal, o tempo de servio dos trabalhadores mais antigos de 95 anos, enquanto que para os trabalhadores mais novos de 65 anos. Enquanto que para os trabalhadores de outras formas de empresas o tempo de servio dos trabalhadores mais antigos de 98 anos e para os mais novos na empresa o seu tempo de servio de 64 anos conforme nos indicam os valores extremos.

d) Case Processing Summary


Cases Valid N Tempo de Servio * Categoria de Empresa 467 Percent 96.3% N 18 Missing Percent 3.7% N 485 Total Percent 100.0%

Nesta questo vamos analisar o tempo de servio da maior parte dos trabalhadores da empresa formal, informal e outros tipos de empresas que no pertencem a estas categorias. No presente sumrio de casos processados temos 467 casos vlidos correspondentes a 93,3% e 18 casos omissos de 3,7% num total de 485 casos observados de 100%. importante referir que categorizamos as empresas porque faltavam dados na base de dados de que tivemos que completar, categorizamos os tempos de servio, mas no saram conforme o previsto, por isso a tabela longa e exaustiva abaixo. 3

Trabalho Prtico de Anlise de Dados Tempo de Servio * Categoria de Empresa Crosstabulation


Categoria de Empresa Formal Tempo de Servio 63.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 64.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 65.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 66.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 67.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 68.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 69.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 70.0 Count % within Tempo de Servio % within Categoria de Empresa % of Total 71.0 Count % within Tempo de Servio 3 100.0% .8% .6% 6 75.0% 1.7% 1.3% 8 53.3% 2.2% 1.7% 16 88.9% 4.5% 3.4% 12 80.0% 3.3% 2.6% 6 60.0% 1.7% 1.3% 17 81.0% 4.7% 3.6% 12 92.3% 3.3% 2.6% 2 66.7% Informal 0 .0% .0% .0% 0 .0% .0% .0% 0 .0% .0% .0% 0 .0% .0% .0% 1 6.7% 3.7% .2% 1 10.0% 3.7% .2% 2 9.5% 7.4% .4% 0 .0% .0% .0% 0 .0% Outras 0 .0% .0% .0% 2 25.0% 2.5% .4% 7 46.7% 8.6% 1.5% 2 11.1% 2.5% .4% 2 13.3% 2.5% .4% 3 30.0% 3.7% .6% 2 9.5% 2.5% .4% 1 7.7% 1.2% .2% 1 33.3% Total 3 100.0% .6% .6% 8 100.0% 1.7% 1.7% 15 100.0% 3.2% 3.2% 18 100.0% 3.9% 3.9% 15 100.0% 3.2% 3.2% 10 100.0% 2.1% 2.1% 21 100.0% 4.5% 4.5% 13 100.0% 2.8% 2.8% 3 100.0%

Trabalho Prtico de Anlise de Dados Portanto, o tempo de servio da maior parte dos trabalhadores que se encontram essencialmente na empresa formal de 81 anos, sendo que neste sector 19 trabalhadores da empresa formal correspondentes a 82,6%, 0 (zero) do sector informal e 4 em 17,4% de outras formas de empresas, num total de 23 trabalhadores observados que correspondem a 100%.
Salario_actual Formal Informal Outras 363 27 84 100.0% 100.0% 100.0% 0 0 0 .0% .0% .0% 363 27 84 100.0% 100.0% 100.0%

Neste sumrio dos casos processados temos duas variveis da Categoria de empresa e salrio actual. Na empresa formal h 363 casos validos e que correspondem a 100%, no sector informal temos 27 casos que tambm correspondem a 100% e 84 casos no sector das outras categorias de empresas que no se enquadram nas duas mencionadas que tambm correspondem a 100% e constatamos que no h nenhum caso omisso.

Trabalho Prtico de Anlise de Dados

Descriptives

Categoria de Empresa Salario_actual Formal Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Informal Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Outras Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Lower Bound Upper Bound Lower Bound Upper Bound Lower Bound Upper Bound

Statistic 27838.540 27057.398 28619.682 27290.496 26550.000 5.727E7 7567.9950 15750.0 80000.0 64250.0 8400.0 1.905 7.977 30938.889 30102.374 31775.403 31007.716 30750.000 4471602.564 2114.6164 24300.0 35250.0 10950.0 1200.0 -.368 3.652 63977.798 60018.439 67937.157 62728.307 60500.000 3.329E8 18244.7760 34410.0 135000.0

Std. Error 397.2167

.128 .255 406.9581

.448 .872 1990.6683

Trabalho Prtico de Anlise de Dados

Neste exerccio a varivel salrio actual (salrio_act) apresenta outliers. As concluses a serem tiradas destes dados so, extrair os salrios mximos e mnimos de cada categoria de empresa, os valores mdios, medianos, varincias, desvios, entre outros. O salrio mdio actual na categoria de empresa formal de 27.838.540, o salrio mediano de 26.550.000, e ainda na empresa formal, o ndice de confiana de 95% com uma margem de erro de 5% para todas as categorias de empresas e seus respectivos salriosactuais. O desvio padro na empresa formal de 7567.9950 e o salrio actual mximo de 80000.0

e o mnimo de 15750.0 com uma margem de erro padro de 397.2167. Enquanto, na empresa informal o salrio mdio actual de 30938.889, o salrio mediano de 30750.000, o desvio padro de 2114.6164, a varincia de 4471602.564, o Salrio actual mximo de 35250.0 e o mnimo de 24300.0 com uma margem de erro padro de 406.9581. Por outro lado, na categoria de outras formas de empresa, o salrio mdio de 63977.798, o
mediano de 60500.000, a varincia de 3.329E8, o desvio padro de 18244.7760, o salrio

actual mximo de 135000.0 e o mnimo de 34410.0 com uma margem de erro padro de 1990.6683. Ao avaliar-se os salrios de uma empresa no se pode tirar concluses a partir do salrio mdio, mas tendo em conta a todas medidas de tendncia central de que aqui analisamos.

Trabalho Prtico de Anlise de Dados Extreme Values


Categoria de Empresa Salario_actual Formal Highest 1 2 3 4 5 Lowest 1 2 3 4 5 Informal Highest 1 2 3 4 5 Lowest 1 2 3 4 5 Outras Highest 1 2 3 4 5 Lowest 1 2 3 4 5 Case Number 218 272 72 161 80 378 338 411 224 90 291 303 281 206 174 126 386 326 429 385 29 32 18 343 446 462 120 288 286 231 Value 80000.0 66875.0 54000.0 52650.0 51000.0 15750.0 15900.0 16200.0 16200.0 16200.0 35250.0 35250.0 34500.0 33750.0 31950.0a 24300.0 28500.0 29550.0 30000.0 30000.0b 135000.0 110625.0 103750.0 103500.0 100000.0 34410.0 37800.0 38700.0 40050.0 40200.0

a. Only a partial list of cases with the value 31950.0 are shown in the table of upper extremes. b. Only a partial list of cases with the value 30000.0 are shown in the table of lower extremes. 8

Trabalho Prtico de Anlise de Dados O grfico acima representa a distribuio dos salrios actuais na empresa formal. O salrio mdio de 27838.54, o nmero de trabalhadores observados de 363 e o desvio padro de 7567995. Os salrios variam entre 20000.0 a 80000.0. o salrio mediano se situa entre o salrio 20000.0 e 30000.0 cuja frequncia varia entre 0 e 60-65%.

Criada a nova varivel idadegru cuja etiqueta Grupos de Idades, obtivemos a tabela acima e a outra abaixo. Na tabela acima h 1500 casos vlidos que correspondem a 100% dos casos observados. 315 casos so de indivduos que tem idade menor ou igual a 30 anos e representam 21%, h tambm 515 casos com idades compreendidas entre 31 e 45 anos e correspondem a 34,3%, outros constituem-se em 320 casos observados que possuem idades que variam entre 46 e 60 anos cuja percentagem de 21,3% , mas tambm h aqueles que tm idade maior ou igual a 70 anos cuja percentagem 13,9% de um total de 208 casos observados. E por ltimo h 142 casos de outras idades que no se encaixaram nas categorias acima. Estes correspondem a 9,5%. a)
N Valid Missing Mean Median Mode Std. Deviation Variance Minimum Maximum Sum Valid Idade menor ou igual a 30 Idade compreendida entre 31 e 45 Idade compreendida entre 46 e 60 Idade maior ou igual a 70 Outras idades Total 208 142 1500 13.9 9.5 100.0 13.9 9.5 100.0 90.5 100.0 320 21.3 21.3 76.7 1500 0 2.5647 2.0000 2.00 1.22970 1.512

Criadas as etiquetas de valor na base de dados Trabalho Prtico_Gss93 subset para as categorias (grupos de idade) da varivel idadegru constatamos que, conforme a tabela acima, que h 1500 casos vlidos e 0 casos omissos.

Grupos de Idades 5.00


3847.00 Frequency 315 515 Percent 21.0 34.3 Valid Percent 21.0 34.3 Cumulative Percent 21.0 55.3

1.00

Trabalho Prtico de Anlise de Dados

b) Contudo, as estatsticas da varivel idadegru mostra nos que: - O nmero total de ocorrncias de 1500 casos correspondentes a 100%, como no exerccio anterior; - O nmero total de ocorrncias por categoria de 315 correspondentes a 21%, para os que tm idade menor ou igual a 30 anos; - 515, correspondentes a 34,3%, para os que tm idade compreendida entre 31 e 45; - 320, correspondentes a 21,3%, para os que tm a idade compreendida entre 46 e 60; - 208, correspondentes a 13,9%, para os que tm idade maior ou igual a 70 anos de idade; - E por ltimo, 142, correspondentes a 9,5%, para os que tm idades que no se enquadram nestas categorias acima apresentadas; - A idade mdia de 2.5647 (aproximadamente igual a 26 anos, visto que na base de dados o intervalo de uma casa decimal); - A idade mediana de 2.0000 (aproximadamente igual a 20 anos, visto que na base de dados o intervalo de uma casa decimal); - A varincia de 1.512; - Idade modal ou mais frequente de 2.00 c) Fazendo anlise dos resultados obtidos na alnea anterior teremos as seguintes observaes: - A mdia igual a 2.5647; - a moda igual a 2.00 e; a mediana igual a 2.0000, conclumos que no existe uma diferena significativa. Quanto ao nvel de desvio padro de 1.22970 anos, em relao a idade mdia, tambm consideramos que no uma grande diferena, por isso que os dados espelham as idades reais dos casos observados.

10

Trabalho Prtico de Anlise de Dados

d)

e)

Case Processing Summary Grupos de Idades * Respondent's Sex Crosstabulation


Count Valid N Grupos de Idades * 1500 Grupos de Idades Idade menor ou igual a 30 Respondent's Sex Idade compreendida entre 31 e 45 Idade compreendida entre 46 e 60 Idade maior ou igual a 70 Outras idades Total 79 52 641 129 90 859 208 142 1500 137 183 320 Cases Missing Total Respondent's Sex Total Percent N Percent N Percent Male Female 100.0% 0 .0% 1500 100.0% 135 180 315 238 277 515

f) Portanto, no sumrio dos casos processados temos a varivel Grupos de Idades indexada a varivel Sex of respondent. Ainda nessa tabela, verificamos 1500 casos vlidos correspondentes a 100% e nenhum caso omisso. Na segunda tabela observamos que no

11

Trabalho Prtico de Anlise de Dados grupo de idades menor ou igual a 30 anos, 135 casos observados so homens e 180 so mulheres num total de 315 casos observados. A seguir temos idades compreendidas entre 31 e 45 anos, donde 238 casos so do gnero masculino e 277 casos so do gnero feminino, num total de 515. 320 casos observados tm idades compreendidas entre 46 e 60 anos, donde 137 so homens e 183 so mulheres. 79 casos so do gnero masculino e 129 do sexo feminino, num total de 208 casos observados que constituem idades de indivduos maiores ou iguais a 70 anos. Mas tambm, temos casos de idades que no se enquadram nas categorias iniciais, sendo que 52 destes casos so homens e 90 so mulheres num total de 142 casos observados.

3. Case Processing Summary


Cases Political Party Affliation Rap Music Strong Democrat Not Str Democrat Ind, Near Dem Independent Ind, Near Rep Not Srt Republican Strong Republican Other Party N 207 287 174 169 145 265 161 17 Valid Percent 97.2% 96.3% 96.7% 90.4% 98.0% 94.6% 95.8% 100.0% N 6 11 6 18 3 15 7 0 Missing Percent 2.8% 3.7% 3.3% 9.6% 2.0% 5.4% 4.2% .0% N 213 298 180 187 148 280 168 17 Total Percent 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0% 100.0%

No presente exerccio pretendemos avaliar quantos msicos da varivel Rap_Rap Music independentes da filiao poltica cuja famlia tem um rendimento acima de $4000 USD. No sumrio dos casos processados constatamos que os casos cujos msicos de Rap so Strong Democrat quanto a filiao partidria so 207 casos vlidos em 97,2% e 6 omissos em 2,8% num total de 213 em 100%; Not Strong Democrat em 287 que correspondem 96,3% e 11 omissos em 3,7% de um total de 298 em 100%; quanto aos Ind, Near Dem temos 174 em 96,7% e 6 omissos em 3,3% num total de 180 casos observados em 100%. Rap Music Independent tem 169 casos que correspondem a 90,4%, 18 omissos em 9,6% do total de 187 em 100%; Ind, Near Rep com 145 casos equivalentes a 98% e 3 omissos em 2% do total 12

Trabalho Prtico de Anlise de Dados de 148 de 100%; Not Srt Republican com 265 casos vlidos em 94,6% e 15 omissos em 5,4% do total de 280 em 100%; Strong Republican com 161 casos correspondentes a 95,8% e 7 omissos correspondentes a 4,2% do total de 168 em 100%. Quanto a Other party, 17 casos foram registados, correspondendo a 100% e sem casos omissos.

13

Trabalho Prtico de Anlise de Dados Descriptives


Political Party Affliation Rap Music Strong Democrat Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Not Str Democrat Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Ind, Near Dem Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Lower Bound Upper Bound Lower Bound Upper Bound Lower Bound Upper Bound Statistic 3.81 3.65 3.97 3.88 4.00 1.341 1.158 1 5 4 2 -.639 -.595 3.97 3.83 4.10 4.06 4.00 1.272 1.128 1 5 4 2 -.963 .137 3.83 3.67 4.00 3.90 4.00 1.215 1.102 1 5 4 .144 .287 .084 .169 .337 .067 Std. Error .080

14

Trabalho Prtico de Anlise de Dados

15

Trabalho Prtico de Anlise de Dados


Extreme Values Total Family Political Party Affliation Rap Music Strong Democrat Highest 1 2 3 4 5 Lowest 1 2 3 4 5 Not Str Democrat Highest 1 2 3 4 5 Lowest 1 2 3 4 5 Ind, Near Dem Highest 1 2 3 4 5 Lowest 1 2 3 4 5 Independent Highest 1 2 3 4 5 Case Number 7 30 34 35 51 1413 847 778 487 367 13 14 20 22 37 1460 1420 1228 1042 791 49 84 Income $50000-59999 $50000-59999 $75000+ $40000-49999 $50000-59999 $25000-29999 $15000-17499 $50000-59999 $50000-59999 $40000-49999 $22500-24999 $5000-5999 $75000+ $75000+ $10000-12499 $7000-7999 $4000-4999 $22500-24999 $3000-3999 $35000-39999 $50000-59999 $35000-39999 Value 5 5 5 5 5a 1 1 1 1 1b 5 5 5 5 5a 1 1 1 1 1b 5 5 5 5 5a $1000-2999 $5000-5999 $7000-7999 $10000-12499 1 1 1 1 2c $8000-9999 $75000+ $7000-7999 $60000-74999 $12500-14999 5 5 5 5 5a

108 Refused 138 149 DK 1433 1083 983 973 1471 DK 121 127 128 140 161 $10000-12499

16

Trabalho Prtico de Anlise de Dados

Portanto, a partir da tabela conclumos que todos os msicos independentes quanto a filiao poltico-partidria tm rendimentos acima de $4000 USD. O valor mdio de 3.91, o mediano de 4.00, a varincia de 1.248, o desvio padro de 1.117, os valores extremos so: mximo igual a 5 o que corresponde a $12500-14999 e mnimo igual a 1 e corresponde a $8000-9999. 4.
Case Processing Summary Cases Valid N Total Family Income 1434 Percent 95.6% N 66 Missing Percent 4.4% N 1500 Total Percent 100.0%

Neste exerccio vamos fazer a anlise de Outliers da varivel income91. No presente sumrio dos casos processados temos 1434 casos vlidos que correspondem a 95,6% e 66 casos omissos (no foi possvel omit-los porque o SPSS no deu opo excluso desses casos), que correspondem a 4,4% de um total de 1500 casos observados de 100%.
Descriptives

Statistic Total Family Income Mean 95% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Lower Bound Upper Bound 14.68 14.39 14.96 14.95 16.00 29.828 5.462 1 22 21 8 -.659 -.494

Std. Error .144

.065 .129

Nas estatsticas descritivas, a mdia do rendimento total de 14,68 com uma margem de erro de 0,144 e com um interval de confiana de 95% e uma margem de 5% para 100%. A mediana de 16.00, a varincia de 29.828, o desvio padro de 5.462, o valor extremo mximo de 22 e 1 o mnimo. 17

Trabalho Prtico de Anlise de Dados

Extreme Values Case Number Total Family Income Highest 1 2 3 4 5 Lowest 1 2 3 4 5 4 18 91 108 123 1455 1434 1423 1357 1348 Value 22 22 22 22 22a 1 1 1 1 1b

a. Only a partial list of cases with the value 22 are shown in the table of upper extremes. b. Only a partial list of cases with the value 1 are shown in the table of lower extremes.

Total Family Income Stem-and-Leaf Plot Frequency Each leaf: do Stem & Leaf 2 case(s) Este o plot caule e folha, onde temos a coluna das frequncias, dos caules e das folhas. O comprimento caule de 1 de cada folha de 2 casos.

do e

18

Trabalho Prtico de Anlise de Dados

5. Trabalho_Prtico_Gss93_ren4000

19