Você está na página 1de 11

Índice

Prefácio 17

Introdução

1. Iniciação ao IBM-SPSS 22
1.1. Ficheiro de dados 22
1.2. Definição de variáveis e casos 22
1.3. Análise estatística 27
1.4. Gráficos 28
1.5. Ajudas 29
1.6. Junção de informação de dois ficheiros 30
1.6.1. Junção de variáveis 30
1.6.2. Junção de casos 33

1.7. Edição de Informação 34


1.8. Definição e organização de dados 36
1.9. Transformação de dados 38
1.9.1. Criação de novas variáveis 39
1.9.2. Agregação de categorias 40
1.9.3. Inversão da ordem das categorias 42
1.9.4. Transformação de uma variável métrica em qualitativa 42
1.9.5. Conversão de uma variável string em numérica 43
1.9.6. Contagem de casos 44
1.9.7. Substituição de respostas omissas 44

1.10. Utilidades 44

2. Exercícios – Enunciados 45
3. Exercícios – Resolução 46
Capítulo 1
Estatística descritiva e indutiva

1. Introdução 53
1.1. Escalas de medida e tratamento estatístico 53

2. Estatística descritiva versus indutiva 57


3. Análise das respostas omissas 58
3.1. Exclude cases listwise 59
3.2. Exclude cases pairwise 60
3.3. Replace with mean 61
3.4. Análise univariada das respostas omissas 62
3.5. Padrão das respostas omissas 65
3.6. Aleatoriedade das respostas omissas 67
3.7. Não aleatoriedade das respostas omissas 68

4. Variáveis nominais 69
4.1. Quadro de distribuição de frequências 69
4.2. Moda 70
4.3. Gráficos de barras e circular 70

5. Variáveis ordinais 75
5.1. Quantis 75
5.2. Quadro de distribuição de frequências 76
5.3. Introdução de dados 77
5.4. Moda e conclusão 79

6. Variáveis métricas 81
6.1. Quadro de distribuição de frequências, moda e quantis 81
6.2. Outliers, Amplitude total e inter-quartil 83
6.3. Histograma, diagrama de caule e folhas e caixa de bigodes 85
6.4. Média e suas propriedades 90
6.5. Variância, desvio padrão, desvio absoluto médio e desigualdade de Tchebycheff 95
6.6. Erro padrão e intervalo de confiança para a média 97
6.7. Média aparada 99
6.8. Simetria e achatamento 103
6.9. Média ponderada, geométrica e harmónica 108
6.10. Coeficiente de variação e MAD 111
6.11. Distribuição normal e testes à normal 116
6.12. Transformações e estandardização 120
6.13. Categorização pelo método dos grupos extremos revisto 131
6.14. Criação de índices pela uniformização de escalas 134

7. Medida concentração: índice de Gini 139


8. Exercícios – Enunciados 141
9. Exercícios – Resolução 152
10. Fundamentos para a inferência 239
10.1. Testes paramétricos e não paramétricos 239
10.2. Estimadores e distribuições amostrais 240
10.2.1. Distribuições do Qui-Quadrado, t de Student e F de Snedecor 242

10.3. Estimação: pontual, por intervalos e ensaio de hipóteses 244


10.4. Regra de decisão 248
10.5. Aplicações 249
10.5.1. Desigualdade de Chebychev 250
10.5.2. Distribuição uniforme 250
10.5.2. Distribuição normal 251
10.5.4. Distribuição do Qui-Quadrado 256
10.5.5. Distribuição t de Student 258
10.5.6. Distribuição F de Snedecor 260

Capítulo 2
Contingência, associação e correlação

1. Introdução 269
2. Tabelas de contingência e teorema de Bayes 270
1.1. Construção de tabelas 270
1.2. Probabilidade conjunta, marginal e condicionada 271
1.3. Teorema de Bayes 273

3. Análise das tabelas de contingência 276


3.1. Testes de independência do Qui-Quadrado 277
3.1.1. Teste do Qui-Quadrado de Pearson 278
3.1.2. Teste do rácio da verosimilhança 286
3.1.3. Teste do Qui-Quadrado da correção de continuidade de Yates 292
3.1.4. Teste do Qui-Quadrado de Fisher 292
3.1.5. Teste Linear-by-Linear Association 299
3.1.6. Teste de McNemar 300
3.2. Odds e odds racio 301
3.2.1. Odds 301
3.2.2. Odds rácio 301
3.2.3. Propriedades 302
3.2.4. Intervalo de confiança para o odds rácio 303
3.3. Risco relativo, rácio de prevalência, diferença de proporções
e intervalos de confiança 303
3.3.1. Risco relativo e rácio de prevalência 303
3.3.2. Intervalo de confiança para RR ou RP 304
3.3.3. Teste de homogeneidade e intervalo de confiança 304
3.3.4. Discrepância entre o odds rácio e o RP 306

3.4. Relação entre o odds rácio e RR ou RP 306


3.5. Associações marginais e condicionadas 307
3.5.1. Totais das k subtabelas são semelhantes 309
3.5.2. Totais das k subtabelas são diferentes 315

3.6. Concordância: Kappa de Cohen 319


3.6.1. Vulnerabilidade do Kappa de Coehen 321

3.7. Outras medidas de associação para variáveis nominais 323


3.7.1. Phi, V de Cramer, coeficiente de contingência 323
3.7.2. Lambda, Goodman e Kruskal’s tau e coeficiente de incerteza 324
3.7.3. Síntese 324

3.8. Outras medidas de associação para variáveis ordinais 330


3.8.1. Gamma, Kendall’s tau b, Kendall’s tau c, Somer’s d 330
3.8.2. Síntese 332
3.9. Sensibilidade, especificidade, valor preditivo, prevalência,
rácio da verosimilhança 335
3.9.1. Síntese 337

3.10. Curva ROC 340


3.10.1. Síntese 342
3.11. Correlações simples e parciais: variáveis estandardizadas Z,
Ró de Spearman e R de Pearson 345
3.11.1. Síntese 348

3.12. Eta e correlações biserial e point biserial 361


3.12.1. Síntese 362

4. Exercícios – Enunciados 367


5. Exercícios – Resolução 381
6. Fundamentos das tabelas de contingência 461
Capítulo 3
Anacor, MCA e MDS

1. Introdução 467
2. Anacor 468
3. MCA 471
4. MDS 473
5. Exercícios – Enunciados 478
6. Exercícios – Resolução 482

Capítulo 4
Análise das componentes principais e análise fatorial

1. Introdução 516
2. Análise das Componentes Principais (ACP) 518
3. Análise Fatorial (AF) 519
3.1. Existência de correlação e a adequação aos dados 520
3.2. Número de fatores a reter 521
3.3. Percentagem de variância explicada pelos fatores retidos 522
3.4. Percentagem de variância explicada por cada fator retido 522
3.5. Variáveis pertencentes a cada fator 523
3.6. Variáveis a reter 524
3.7. Indicadores da qualidade do modelo: GFI, AGFI e RMSR 525
3.7.1. Goodness of Fit Index (GFI): 526
3.7.2. AGFI 527
3.7.3. A Root Mean Square Residual (RMSR) é dada por: 527

3.8. Representação gráfica e interpretação dos fatores retidos 528


3.9. Exploração dos dados, outliers e respostas omissas 529

4. Análise fatorial em escalas 530


5. Análise da Consistência Interna 531
5.1. Alpha de Cronbach 531
5.2. Coeficiente de Bipartição 532
5.3. Modelos Paralelo e Estritamente Paralelo 532
5.4. Guttman 533
5.5. Coeficiente de Correlação Intra Classes 533
6. Exercícios – Enunciados 534
7. Exercícios – Resolução 538

Capítulo 5
Análise de clusters

1. Análise de Clusters 575


2. Exercícios – Enunciados 578
3. Exercícios – Resolução 579

Capítulo 6
Análise discriminante

1. Análise discriminante 604


1.1. Pressupostos 604
1.2. Seleção das variáveis explicativas 606
1.3. Número de funções discriminantes 608
1.4. Variáveis explicadas por cada função discriminante retida 609
1.5. Classificar casos e validar os resultados 610
1.6. Analisar as respostas omissas 611

2. Exercícios – Enunciados 611


3. Exercícios – Resolução 612

Capítulo 7
Regressão

1. Modelos de regressão 643


2. Modelo de Regressão Linear Simples − MRLS 644
2.1. Pressupostos 645
2.2. Exploração dos dados 647
2.3. Estimação 650
2.4. Previsão pontual e por intervalos 651
2.5. Medidas absolutas e relativas da qualidade do ajustamento 656
2.6. Teste t de Student 659
2.7. Teste F de Snedecor 661
2.8. Verificação das Hipóteses do MRLS 662
2.8.1. Linearidade e transformações 663
2.8.2. Normalidade 668
2.8.3. Homocedasticidade 669
2.8.4. Autocorrelação 673

2.9. Observações outliers e influentes 676


2.9.1. Outliers 676
2.9.2. Observações influentes 679

3. Escolha entre funções polinomiais 682


4. Relações não lineares 688
4.1. Função potência: elasticidade constante 688
4.2. Função logarítmica 694
4.3. Função exponencial: crescimento constante 696
4.4. Função inversa ou hiperbólica 702
4.5. Função exponencial inversa 709

5. Permanência de estrutura-MRLS 714


6. Variáveis artificiais ou dummies 721
6.1. Determinação do número de variáveis artificiais 721
6.2. Codificação das variáveis artificiais 722
6.2.1. Categoria de referência com o código zero 722
6.2.2. Contrastes 722

6.3. Interações 723

7. Multicolinearidade 737
7.1. Origens da multicolinearidade 738
7.2. Efeitos da elevada multicolinearidade 738
7.3. Oscilações nas estimativas dos coeficientes 739
7.4. Medidas de multicolinearidade 740
7.5. Sugestões para suprir a elevada multicolinearidade 742
7.6. Interpretação dos coeficientes da reta estimada no MRLM 743

8. Coeficiente de determinação ajustado Ra2 743


9. Covariância, R de Pearson, Ró de Spearman, correlações parciais
e semiparciais 745
9.1. Covariância 745
9.2. R de Pearson 747
9.3. Ró de Spearman 748
9.4. Correlações parciais e semiparciais 749
10. Interpretação do teste F da Anova 751
11. Interpretação dos testes t e Fchange 752

12. Métodos de entrada de variáveis na regressão 754


12.1. Regressão múltipla standard (Method Enter): 755
12.2. Regressão hierárquica ou sequencial 755
12.3. Stepwise 756

13. Validação cruzada 757


13.1. R ao quadrado ajustado de Stein 757
13.2. Partição dos dados 758

14. Modelo de Regressão Linear Múltipla – MRLM 772


14.1. MRLM sem violação dos pressupostos 773
14.1.1. Exploração dos dados 776
14.1.2. Estimação e previsão 778
14.1.3. Hipóteses do MRLM 786
14.1.4. Observações Outliers e Influentes 790

14.2. 2SLS 794


14.3. WLS 798
14.3.1. Exploração da heterocedasticidade 801
14.3.2. Encontrar a fonte principal da heterocedasticidade 803
14.3.3. Escolha da potência ótima 804
14.3.5. Verificação da correção da heterocedasticidade 807

15. Permanência de estrutura – MRLM 808


15.1. MRLM com uma observação adicional 809
15.2. MRLM com m < k observações adicionais: teste de Gregory Chow 812

16. Path analysis 816


17. Exercícios – Enunciados 826
18. Exercícios – Resolução 830

Capítulo 8
Testes t e intervalos de confiança para médias

1. Introdução 867
2. Teste t de Student, intervalos de confiança para uma média
e cálculo do nível de significância 869
3. Testes t de Student e intervalos de confiança para a diferença de médias
em amostras independentes. Cálculo do nível de significância 877
3.1. Teste t de Student e intervalos de confiança para a mesma variável métrica 877
3.2. Testes t de Student simultâneos vs. regressão logística binária 889

4. Teste t e intervalos de confiança em amostras emparelhadas 898


4.1. Vantagem das amostras emparelhadas vs. amostras independentes 899

5. Exercícios – Enunciados 903


6. Exercícios – Resolução 905

Capítulo 9
Testes não paramétricos

1. Introdução 923
2. Testes não paramétricos para amostras independentes 924
2.1. Teste da Binomial 924
2.1.1. Região crítica unilateral 924
2.1.2. Região crítica bilateral 927

2.2. Teste de aderência do Qui-Quadrado 929


2.3. Teste de ajustamento de Kolmogorov-Smirnov 933
2.4. Teste de Wilcoxon para uma mediana 938
2.5. Teste de Mann-Whitney 941
2.5.1. Com empates 943
2.5.2. Sem empates 948

2.6. Teste de Kruskal-Wallis 952


2.7. Teste de independência de Kolmogorov-Smirnov 959

3. Testes não paramétricos para amostras emparelhadas 964


3.1. Teste de McNemar 964
3.1.1. Diagonal secundária (b + c) > 20 966
3.1.2. Diagonal secundária (b + c) ≤ 20 969

3.2. Teste Q de Cochran 971


3.3. Teste do sinal 977
3.4. Teste de Wilcoxon 981
3.5. Teste de Friedman 985

4. Exercícios – Enunciados 990


5. Exercícios – Resolução 991
Capítulo 10
Anova, Ancova e Manova

1. Introdução 1007
2. One-Way Anova 1008
2.1. Pressupostos 1009
2.2. Análise de variância 1010
2.2.1. Dedução dos testes F 1012

2.3. Identificação das diferenças entre os grupos 1015


2.3.1. Tendência 1015
2.3.2. Testes a posteriori ou Post-hoc 1025
2.3.3. Testes a priori ou contrastes planeados 1028
2.3.4. One-Way Anova em escalas de avaliação 1039

3. Anova fatorial 1046


3.1. Anova a dois ou mais fatores 1047
3.1.1. Decomposição do teste F 1048
3.1.2. Dimensões semelhantes versus diferentes 1050
3.1.3. Vantagem da Anova versus One-Way Anova 1051

3.2. Testes a posteriori ou Post-hoc 1052


3.3. Testes a priori ou contrastes planeados 1052
3.3.1. Efeitos principais 1053
3.3.2. Efeitos interativos 1054
3.3.3. Exploração dos dados 1057
3.3.4. Comparação de dispersões 1062
3.3.5. Comparação de médias 1063
3.3.6. Qualidade do modelo 1064
3.3.7. Testes a priori ou constrastes planeados 1065
3.3.8. Testes a posteriori ou Post-hoc 1072

4. Ancova 1074
4.1. Pressupostos da Ancova 1074
4.2. Modelo estimado 1075
4.2.1. Normalidade e homocedasticidade 1078
4.2.2. Associação linear 1081
4.2.3. Médias da concomitante por categoria do fator 1083
4.2.4. Homogeneidade dos declives 1084
4.2.5. Resultados do modelo estimado 1085
4.2.6. Heterogeneidade dos declives 1094
5. Manova 1098
5.1. Pressupostos da Manova 1099
5.2. Testes multivariados 1100
5.2.1. Exploração dos dados 1104
5.2.2. Testes multivariados 1106
5.2.3. Um fator e quatro endógenas: avaliação dos pressupostos 1109
5.2.4. Paralelismo dos perfis 1112
5.2.5. Níveis dos perfis 1114
5.2.6. Achatamento dos perfis 1114

6. Exercícios – Enunciados 1118


7. Exercícios – Resolução 1125

Capítulo 11
Medidas repetidas

1. Análise de variância de medidas repetidas: hipóteses 1184


2. Pressupostos 1186
3. Efeitos e consistência interna 1187
3.1. Exploração dos dados 1189
3.1.1. Normalidade 1192
3.1.2. Covariâncias 1192
3.1.3. Esfericidade 1193
3.1.4. Consistência interna 1193

3.2. Comparação de médias 1195


3.3. Testes Post-hoc: comparação dos efeitos interativos 1198
3.4. Testes Post-hoc: Comparação dos efeitos principais 1200
3.5. Testes a priori 1204

4. Exercícios – Enunciados 1206


5. Exercícios – Resolução 1209

Bibliografia 1233